Форум успешных вебмастеров - GoFuckBiz.com

  Форум успешных вебмастеров - GoFuckBiz.com > Бизнес-решения > Скрипты, программы и технические решения
Дата
USD/RUB58.9640
BTC/USD0.0000
Скрипты, программы и технические решения Обсуждаем скрипты, программы и новые технологии.

Закрытая тема
Опции темы Опции просмотра
Старый 08.01.2013, 11:08   #1
Rothschild
Ебланнед
 
Регистрация: 15.09.2010
Адрес: Донецк/Абу-Даби
Сообщений: 1,195
Бабло: $338470
По умолчанию спарсить тайтлы всех страниц в индексе

Есть сайт на овер 20к страниц, надо спарсить все тайтлы в индексе которые.Подскажите что-ли вариант)
__________________
Блокирован за кидок на деньги. Соотв. тема - http://www.gofuckbiz.com/showthread.php?t=35649
Блокировка будет до момента пока ТС не снимет претензии.
Rothschild вне форума  
Старый 08.01.2013, 11:45   #2
kip
Senior Member
 
Аватар для kip
 
Регистрация: 06.05.2007
Сообщений: 473
Бабло: $67595
Отправить сообщение для kip с помощью ICQ
По умолчанию

Доступ к сайту есть? Если да - вытащить из БД.
Если нет - написать скрипт
__________________
Пишу зло на PHP, с цмс не работаю
Мы немного упоролись!
kip вне форума  
Старый 08.01.2013, 12:18   #3
Troy
Senior Member
 
Аватар для Troy
 
Регистрация: 01.04.2009
Сообщений: 833
Бабло: $125170
По умолчанию

Content Downloader может
__________________
Troy вне форума  
Старый 08.01.2013, 14:09   #4
West Fucker
I'm back
 
Аватар для West Fucker
 
Регистрация: 16.10.2009
Сообщений: 81
Бабло: $100575
По умолчанию

Как-то так (регулярки не юзаю по религиозным соображениям ):
Цитата:
<?php
set_time_limit(3600);
error_reporting(0);
$list='';
$urls=explode('
',$list);
foreach ($urls AS $url) {
$data=file_get_contents($url);
$str1=strstr($data,'<title>');
$str2=strstr($str1,'</title>');
$output=$output.'
'.$url.';'.str_replace('<title>','',str_replace($s tr2,'',$str1));
}
?>
Только просмотри код на лишние пробелы - их движок форума дорисовывает иногда.
West Fucker вне форума  
Старый 08.01.2013, 14:16   #5
business-net
Особый статус
 
Регистрация: 19.02.2009
Сообщений: 109
Бабло: $31155
По умолчанию

ему же ПС походу парсить нужно а не сайт
Цитата:
Сообщение от Rothschild
все тайтлы в индексе которые
__________________
Мой блог
business-net вне форума  
Старый 08.01.2013, 14:20   #6
West Fucker
I'm back
 
Аватар для West Fucker
 
Регистрация: 16.10.2009
Сообщений: 81
Бабло: $100575
По умолчанию

business-net, ну так спарсить любым парсером урлы и всунуть их в скрипт. Или поискать на сайте sitemap.xml и далее по схеме.
West Fucker вне форума  
Старый 08.01.2013, 14:24   #7
iloveadult
Senior
 
Аватар для iloveadult
 
Регистрация: 24.09.2008
Сообщений: 2,727
Бабло: $519695
По умолчанию

если не ошибаюсь, апарсер может и, возможно, чек парамс.
+ на хумане/зенно шаблон легкий совсем, за двацатку напишут думаю
__________________
Top Links - качественные ссылки для Ваших сайтов
[UA] Моментальный вывод WM и других валют с лучшим курсом 24/7!
iloveadult вне форума  
Старый 10.01.2013, 13:13   #8
ricky
Ебланнед
 
Регистрация: 24.09.2011
Сообщений: 63
Бабло: $26645
По умолчанию

Content Downloader не спарсит, прокси не поддерживает он
ricky вне форума  
Старый 12.01.2013, 23:01   #9
somebody_
Senior Member
 
Регистрация: 05.09.2008
Сообщений: 590
Бабло: $121800
Отправить сообщение для somebody_ с помощью ICQ
По умолчанию

Цитата:
за двацатку напишут думаю
ну если самый просто то и на php за такую цену можно накидать ... смотря что за сайт.

а вообще ТС вроде так же указал что "в выдаче" ... то тогда в данном случае нужно парсить выдачу и от туда дергать страницы откуда нужно взять тайтлы, ну а тут уже без соксов и проксов не обойтись
__________________
Пилю под Wordpress на php, html5, css3, jquery, since 2008 - wpmastering.pro
somebody_ вне форума  
Старый 12.01.2013, 23:12   #10
xealey
Senior Member
 
Аватар для xealey
 
Регистрация: 04.09.2007
Сообщений: 1,271
Бабло: $253980
По умолчанию

да любой парсер ПС может, один хрен весь СЕРП сливается, только некоторым приятнее продавать парсер сниппетов отдельно

2ТС
а что, кеев хочется без напряга?
__________________
Апарсер охрененен
xealey вне форума  
Закрытая тема



Опции темы
Опции просмотра