|
| Дата |
|
USD/RUB | 93.4409 | BTC/USD | 64004.5150 |
|
|
|
Скрипты, программы и технические решения Обсуждаем скрипты, программы и новые технологии. |
15.04.2011, 00:50
|
#1
|
Mr. Lucky Guy
Регистрация: 27.07.2010
Адрес: RU -> DE -> Asia
Сообщений: 703
Бабло: $174690
|
Парсер подсказок Гугла
Пробывал Словодёр, но он некорректно работает с немецкими умлаутами ü,ö,ä,ß, выдаёт ошибку получения данных.
Вот это тоже не катит, т.к. заточен под hl=en, а мне нужно под hl=de
Может, подскажет кто что-нибудь путёвое?
|
|
|
15.04.2011, 01:17
|
#2
|
странный гном
Регистрация: 01.05.2007
Сообщений: 2,856
Бабло: $446527
|
тоже не под ЕНГ интересует, ютф 8 кодировки чтобы поддерживал
|
|
|
15.04.2011, 01:18
|
#3
|
кодер-энтузиаст
Регистрация: 04.04.2007
Адрес: Джамайка
Сообщений: 3,381
Бабло: $447150
|
Цитата:
Сообщение от buratin0
Вот это тоже не катит, т.к. заточен под hl=en, а мне нужно под hl=de
|
Ну так сделай в keywords.js замену hl=en на hl=de
|
|
|
15.04.2011, 02:27
|
#4
|
Senior Member
Регистрация: 08.07.2007
Сообщений: 177
Бабло: $34565
|
PHP код:
<?php
########################################
## собираем подсказки гугла
##
########################################
set_time_limit(300);
$lang = 'de'; //язык запросов.
$keyword = "viagra"; //ключ для поиска
$keyword = urlencode($keyword);
$url2google = 'http://www.google.com/complete/search?hl='.$lang.'&js=true&qu='.$keyword;
$key_adds = array('+1','+2','+3','+4','+5','+6','+7','+8','+9','+0',
'+a','+b','+c','+d','+e','+f','+g','+h','+i','+j','+k',
'+l','+m','+n','+o','+p','+q','+r','+s','+t','+u','+v',
'+w','+x','+y','+z');
$sugg_data = file_get_contents($url2google);
foreach ($key_adds as $value){
$sugg_data .= file_get_contents($url2google.$value);
}
preg_match_all('/\[\[.*?\]\]/',$sugg_data,$sugg_tmp);
$sugg_tmp2 = implode(' ',$sugg_tmp[0]);
preg_match_all('/\["(.*?)",/',$sugg_tmp2,$sugg_fin);
echo implode('<br>',$sugg_fin[1]);
?>
|
|
|
15.04.2011, 02:59
|
#5
|
Senior Member
Регистрация: 26.09.2008
Сообщений: 3,967
Бабло: $504639
|
Цитата:
Сообщение от jkvoka
тоже не под ЕНГ интересует
|
Если под ру, то Словодёр нормально парсит.
|
|
|
15.04.2011, 05:04
|
#6
|
Senior Member
Регистрация: 11.08.2010
Сообщений: 811
Бабло: $173330
|
incognito, спасибо
|
|
|
15.04.2011, 11:26
|
#7
|
странный гном
Регистрация: 01.05.2007
Сообщений: 2,856
Бабло: $446527
|
Цитата:
Сообщение от sydoow
Если под ру, то Словодёр нормально парсит.
|
Не, не под РУ тоже. Скрипт вверху- идеально пашет- только бы сделать взятие из файла кеев ))))
|
|
|
15.04.2011, 11:44
|
#8
|
Senior Member
Регистрация: 15.11.2008
Сообщений: 13,230
Бабло: $247845901
|
Цитата:
Сообщение от jkvoka
Не, не под РУ тоже. Скрипт вверху- идеально пашет- только бы сделать взятие из файла кеев ))))
|
PHP код:
<?php ######################################## ## собираем подсказки гугла ## ######################################## set_time_limit(300); $lang = 'de'; //язык запросов. $file = file("keywords.txt");
foreach ($file as $keyword) { $keyword = trim($keyword); $keyword = urlencode($keyword); $url2google = 'http://www.google.com/complete/search?hl='.$lang.'&js=true&qu='.$keyword; $key_adds = array('+1','+2','+3','+4','+5','+6','+7','+8','+9','+0', '+a','+b','+c','+d','+e','+f','+g','+h','+i','+j','+k', '+l','+m','+n','+o','+p','+q','+r','+s','+t','+u','+v', '+w','+x','+y','+z'); $sugg_data = file_get_contents($url2google); foreach ($key_adds as $value){ $sugg_data .= file_get_contents($url2google.$value); } preg_match_all('/\[\[.*?\]\]/',$sugg_data,$sugg_tmp); $sugg_tmp2 = implode(' ',$sugg_tmp[0]); preg_match_all('/\["(.*?)",/',$sugg_tmp2,$sugg_fin); //echo implode('<br>',$sugg_fin[1]); $output = implode("\r\n",$sugg_fin[1]); $output .= "\r\n"; file_put_contents("result.txt", $output, FILE_APPEND); } ?>
не тестил, но должно работать
|
|
|
15.04.2011, 12:05
|
#9
|
странный гном
Регистрация: 01.05.2007
Сообщений: 2,856
Бабло: $446527
|
Цитата:
Сообщение от imgreen
не тестил, но должно работать
|
браузер подвис и всё- ни туды и не сюды. В файле 30 строк
|
|
|
15.04.2011, 12:13
|
#10
|
странный гном
Регистрация: 01.05.2007
Сообщений: 2,856
Бабло: $446527
|
файл результ создался- там результаты есть. Но они в анси кодировке- немецкий да и любой другой языки со спецсимволами там будут с корявыми шрифтами
|
|
|
|