спарсить тайтлы всех страниц в индексе - Форум успешных вебмастеров - GoFuckBiz.com - Страница 2
 
 
Форум успешных вебмастеров - GoFuckBiz.com

  Форум успешных вебмастеров - GoFuckBiz.com > Бизнес-решения > Скрипты, программы и технические решения
Дата
USD/RUB88.6852
BTC/USD67751.1020
Скрипты, программы и технические решения Обсуждаем скрипты, программы и новые технологии.

Закрытая тема
Опции темы Опции просмотра
Старый 08.01.2013, 11:08
Start Post: спарсить тайтлы всех страниц в индексе 
  #11
Rothschild
Ебланнед
 
Регистрация: 15.09.2010
Адрес: Донецк/Абу-Даби
Сообщений: 1,187
Бабло: $338470
По умолчанию

Есть сайт на овер 20к страниц, надо спарсить все тайтлы в индексе которые.Подскажите что-ли вариант)
__________________
Блокирован за кидок на деньги. Соотв. тема - http://www.gofuckbiz.com/showthread.php?t=35649
Блокировка будет до момента пока ТС не снимет претензии.
Rothschild вне форума  
Старый 13.01.2013, 00:09   #12
Strikelol
Senior Member
 
Регистрация: 31.03.2011
Сообщений: 3,336
Бабло: $669045
По умолчанию

Цитата:
Сообщение от ricky Посмотреть сообщение
Content Downloader не спарсит, прокси не поддерживает он
че? все он поддерживает )))
Strikelol вне форума  
Старый 13.01.2013, 18:45   #13
mamba
Mamber
 
Аватар для mamba
 
Регистрация: 28.12.2010
Адрес: Green Street
Сообщений: 3,182
Бабло: $478630
По умолчанию

В выдаче гугла зачастую тайтл не сходится с тайтлом страницы
mamba вне форума  
Старый 13.01.2013, 18:55   #14
streko
Юниор
 
Регистрация: 12.01.2013
Сообщений: 16
Бабло: $4695
По умолчанию

Сначало спарсить урлы всего сайта программой (скриптом). Потом прочекать на индекс через xml.yandex.ru и спарсить собственно сами тайтлы индексированных страниц с самого сайта любой программой (Контент Довнлоадером) или скриптом.
streko вне форума