Парсер подсказок Гугла - Форум успешных вебмастеров - GoFuckBiz.com - Страница 3
 
 
Форум успешных вебмастеров - GoFuckBiz.com

  Форум успешных вебмастеров - GoFuckBiz.com > Бизнес-решения > Скрипты, программы и технические решения
Дата
USD/RUB90.2486
BTC/USD68633.7895
Скрипты, программы и технические решения Обсуждаем скрипты, программы и новые технологии.

Закрытая тема
Опции темы Опции просмотра
Старый 15.04.2011, 00:50
Start Post: Парсер подсказок Гугла 
  #21
buratin0
Mr. Lucky Guy
 
Аватар для buratin0
 
Регистрация: 27.07.2010
Адрес: RU -> DE -> Asia
Сообщений: 704
Бабло: $175010
Отправить сообщение для buratin0 с помощью ICQ
По умолчанию

Пробывал Словодёр, но он некорректно работает с немецкими умлаутами ü,ö,ä,ß, выдаёт ошибку получения данных.

Вот это тоже не катит, т.к. заточен под hl=en, а мне нужно под hl=de

Может, подскажет кто что-нибудь путёвое?
buratin0 вне форума  
Старый 15.04.2011, 19:37   #22
incognito
Senior Member
 
Аватар для incognito
 
Регистрация: 08.07.2007
Сообщений: 177
Бабло: $34565
По умолчанию

PHP код:
<?php 
########################################
## собираем подсказки гугла
##
########################################
set_time_limit(300);
$lang 'de';            //язык запросов.
$file file("keywords.txt");

$context stream_context_create(
array(
'http'=>array('header' => "User-Agent: Mozilla/4.0 (Windows 98; US) Opera 10.00\r\n"
                    
."Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7\r\n"
                    
."Connection: Close\r\n\r\n")));

foreach (
$file as $keyword) {
    
$keyword trim($keyword);
    
$keyword urlencode($keyword);
    
$url2google 'http://www.google.com/complete/search?hl='.$lang.'&js=true&qu='.$keyword;
    
$key_adds = array('+1','+2','+3','+4','+5','+6','+7','+8','+9','+0',
                
'+a','+b','+c','+d','+e','+f','+g','+h','+i','+j','+k',
                
'+l','+m','+n','+o','+p','+q','+r','+s','+t','+u','+v',
                
'+w','+x','+y','+z');
    
$sugg_data file_get_contents($url2googlefalse$context);
    foreach (
$key_adds as $value){
        
$sugg_data .= file_get_contents($url2google.$valuefalse$context);
    }
    
preg_match_all('/\[\[.*?\]\]/',$sugg_data,$sugg_tmp);
    
$sugg_tmp2 implode(' ',$sugg_tmp[0]);
    
preg_match_all('/\["(.*?)",/',$sugg_tmp2,$sugg_fin);
    
    
$output implode("\r\n",$sugg_fin[1])."\r\n";
    
//$output = iconv("ISO-8859-1","UTF-8",$output);
    
file_put_contents("result.txt"$outputFILE_APPEND);
}
?>
вот так вроде будет не зависить от языка и все будет в утф-8.
пс каждому языку свои буковки!
incognito вне форума  
Старый 15.04.2011, 20:19   #23
digg
$400
 
Аватар для digg
 
Регистрация: 17.05.2009
Сообщений: 14,034
Бабло: $1904250
Отправить сообщение для digg с помощью ICQ
По умолчанию

еще бы сразу по иснайту проверял каждый кей, есть ли по нему траф?
digg вне форума  
Старый 16.04.2011, 18:36   #24
0xJah
Курю прах Ленина...
 
Аватар для 0xJah
 
Регистрация: 10.04.2011
Сообщений: 45
Бабло: $9500
По умолчанию

Интересует откуда взяли урл http://www.google.com/complete/searc.....&js=true&qu=...
Смотрю код страницы гугла и не вижу даже намёка на эту страницу
Просто хотел бы под яндекс написать такой парсер, но там не могу найти место откуда парсить подсказки или же там нужно писать парсер с интерпритацией JS кода?
0xJah вне форума  
Старый 16.04.2011, 19:30   #25
matroskin
Senior Member
 
Аватар для matroskin
 
Регистрация: 02.07.2010
Сообщений: 214
Бабло: $45115
По умолчанию

Цитата:
Сообщение от 0xJah Посмотреть сообщение
Интересует откуда взяли урл http://www.google.com/complete/searc.....&js=true&qu=...
Смотрю код страницы гугла и не вижу даже намёка на эту страницу
Просто хотел бы под яндекс написать такой парсер, но там не могу найти место откуда парсить подсказки или же там нужно писать парсер с интерпритацией JS кода?
Ты не на код смотри, а на то, какие запросы делаются и ответы получаются. Например, через Fiddler.
matroskin вне форума  
Старый 16.04.2011, 19:37   #26
0xJah
Курю прах Ленина...
 
Аватар для 0xJah
 
Регистрация: 10.04.2011
Сообщений: 45
Бабло: $9500
По умолчанию

Цитата:
Сообщение от matroskin Посмотреть сообщение
Ты не на код смотри, а на то, какие запросы делаются и ответы получаются. Например, через Fiddler.
От души!
0xJah вне форума  
Старый 16.04.2011, 20:12   #27
incognito
Senior Member
 
Аватар для incognito
 
Регистрация: 08.07.2007
Сообщений: 177
Бабло: $34565
По умолчанию

FF + "Tamper Data" = URL
PHP код:
http://suggest.yandex.ru/suggest-ya.cgi?v=3&callback=jsonp1302964618777&part=%D0%BA%D0%B5%D0%BA%D1%81&lr=213&yu=626880081302964777 

Последний раз редактировалось incognito; 16.04.2011 в 20:13. Причина: edit
incognito вне форума  
Старый 16.04.2011, 20:17   #28
0xJah
Курю прах Ленина...
 
Аватар для 0xJah
 
Регистрация: 10.04.2011
Сообщений: 45
Бабло: $9500
По умолчанию

Цитата:
Сообщение от incognito Посмотреть сообщение
FF + "Tamper Data" = URL
PHP код:
http://suggest.yandex.ru/suggest-ya.cgi?v=3&callback=jsonp1302964618777&part=%D0%BA%D0%B5%D0%BA%D1%81&lr=213&yu=626880081302964777 
Мда, я уже нашел...
0xJah вне форума  
Старый 30.04.2011, 22:39   #29
buratin0
Mr. Lucky Guy
 
Аватар для buratin0
 
Регистрация: 27.07.2010
Адрес: RU -> DE -> Asia
Сообщений: 704
Бабло: $175010
ТС -->
Отправить сообщение для buratin0 с помощью ICQ
автор темы ТС По умолчанию

Скрипт замечательный, но.. банится по ip, устаёшь перезагружать рутер

Можно как-нибудь замедлить скорость перебора?
buratin0 вне форума  
Старый 30.04.2011, 23:17   #30
imgreen
Senior Member
 
Аватар для imgreen
 
Регистрация: 15.11.2008
Сообщений: 13,236
Бабло: $247846691
По умолчанию

Цитата:
Сообщение от buratin0 Посмотреть сообщение
Скрипт замечательный, но.. банится по ip, устаёшь перезагружать рутер

Можно как-нибудь замедлить скорость перебора?
PHP код:
<?php 
########################################
## собираем подсказки гугла
##
########################################
set_time_limit(300);
$lang 'de';            //язык запросов.
$sleep_time 5// время ожидания между запросами, сек
$file file("keywords.txt");

$context stream_context_create(
array(
'http'=>array('header' => "User-Agent: Mozilla/4.0 (Windows 98; US) Opera 10.00\r\n"
                    
."Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7\r\n"
                    
."Connection: Close\r\n\r\n")));

foreach (
$file as $keyword) {
    
$keyword trim($keyword);
    
$keyword urlencode($keyword);
    
$url2google 'http://www.google.com/complete/search?hl='.$lang.'&js=true&qu='.$keyword;
    
$key_adds = array('+1','+2','+3','+4','+5','+6','+7','+8','+9','+0',
                
'+a','+b','+c','+d','+e','+f','+g','+h','+i','+j','+k',
                
'+l','+m','+n','+o','+p','+q','+r','+s','+t','+u','+v',
                
'+w','+x','+y','+z');
    
$sugg_data file_get_contents($url2googlefalse$context);
    foreach (
$key_adds as $value){
        
$sugg_data .= file_get_contents($url2google.$valuefalse$context);
    }
    
preg_match_all('/\[\[.*?\]\]/',$sugg_data,$sugg_tmp);
    
$sugg_tmp2 implode(' ',$sugg_tmp[0]);
    
preg_match_all('/\["(.*?)",/',$sugg_tmp2,$sugg_fin);
    
    
$output implode("\r\n",$sugg_fin[1])."\r\n";
    
//$output = iconv("ISO-8859-1","UTF-8",$output);
    
file_put_contents("result.txt"$outputFILE_APPEND);
    
sleep($sleep_time);
}
?>
imgreen вне форума  
Старый 01.05.2011, 00:14   #31
buratin0
Mr. Lucky Guy
 
Аватар для buratin0
 
Регистрация: 27.07.2010
Адрес: RU -> DE -> Asia
Сообщений: 704
Бабло: $175010
ТС -->
Отправить сообщение для buratin0 с помощью ICQ
автор темы ТС По умолчанию

imgreen, респект! Полчаса уже парсит, пока бана нет
buratin0 вне форума