Форум успешных вебмастеров - GoFuckBiz.com

  Форум успешных вебмастеров - GoFuckBiz.com > Бизнес-решения > Скрипты, программы и технические решения
Дата
USD/RUB58.7570
BTC/USD0.0000
Скрипты, программы и технические решения Обсуждаем скрипты, программы и новые технологии.

Закрытая тема
Опции темы Опции просмотра
Старый 30.10.2012, 19:28   #1
ckP
drifting away
 
Аватар для ckP
 
Регистрация: 24.02.2008
Адрес: Earth
Сообщений: 707
Бабло: $82214
По умолчанию Проблемы с чеком объемных баз

Есть маленькая базейка на полтора гига , урлы разного вида. Но нужно отобрать урлы по такому принципу
Если в урле после имени домена есть
/wordpress/
/blog/
/wp/
Складывать такие строки в файл вида (слеш в конце)
http://site1.com/wordpress/
http://site2.com/blog/
http://site3.com/wp/

И если такие строки есть, то рядом ложить просто домен
http://site1.com/wordpress/
http://site1.com/
http://site2.com/blog/
http://site2.com/
http://site3.com/wp/
http://site3.com/

Если в урле нет
/wordpress/
/blog/
/wp/
то просто обрезать строки до (слеш в конце)
http://site1.com/
http://site2.com/
http://site3.com/

Желательно на баше, но можно на пхп или чём другом.

Ну и так же надо всю эту канитель проверить на 200ОК, на баше это как реалозовать можно? или любым другим вариантом?
ckP вне форума  
Старый 30.10.2012, 21:34   #2
16021988
Member
 
Аватар для 16021988
 
Регистрация: 21.05.2010
Сообщений: 83
Бабло: $18990
По умолчанию

Лучше не найдешь
http://rutracker.org/forum/viewtopic.php?t=3939627
или на руборде возьми
16021988 вне форума