|
| Дата |
|
USD/RUB | 90.4082 | BTC/USD | 69671.6927 |
|
|
|
Скрипты, программы и технические решения Обсуждаем скрипты, программы и новые технологии. |
15.04.2011, 00:50
|
Start Post: Парсер подсказок Гугла
|
Mr. Lucky Guy
Регистрация: 27.07.2010
Адрес: RU -> DE -> Asia
Сообщений: 704
Бабло: $175000
|
Пробывал Словодёр, но он некорректно работает с немецкими умлаутами ü,ö,ä,ß, выдаёт ошибку получения данных.
Вот это тоже не катит, т.к. заточен под hl=en, а мне нужно под hl=de
Может, подскажет кто что-нибудь путёвое?
|
|
|
15.04.2011, 13:59
|
#12
|
Mr. Lucky Guy
Регистрация: 27.07.2010
Адрес: RU -> DE -> Asia
Сообщений: 704
Бабло: $175000
ТС -->
|
ТС
Цитата:
Сообщение от jkvoka
файл результ создался- там результаты есть. Но они в анси кодировке- немецкий да и любой другой языки со спецсимволами там будут с корявыми шрифтами
|
ага. Deutsch + SEO = вечная проблема с кодировками
|
|
|
15.04.2011, 14:09
|
#13
|
me gusta
Регистрация: 01.06.2009
Сообщений: 746
Бабло: $135376
|
iconv("cp1251", "ISO-8859-1", $string);
или вручную изменить кодировку для файла результатов на западноевропейскую, например в notepad++
__________________
Знать путь и пройти его — не одно и то же. Pharmcash & PharmcashUSA - знаем, проходили... Лидеры в фарме
|
|
|
15.04.2011, 15:30
|
#14
|
странный гном
Регистрация: 01.05.2007
Сообщений: 2,865
Бабло: $448647
|
вручную после парсинга там уже вообще абракадабра будет. первый в браузере выводит нормально
|
|
|
15.04.2011, 15:31
|
#15
|
Senior Member
Регистрация: 08.07.2007
Сообщений: 177
Бабло: $34565
|
PHP код:
<?php
########################################
## собираем подсказки гугла
##
########################################
set_time_limit(300);
$lang = 'de'; //язык запросов.
$file = file("keywords.txt");
foreach ($file as $keyword) {
$keyword = trim($keyword);
$keyword = urlencode($keyword);
$url2google = 'http://www.google.com/complete/search?hl='.$lang.'&js=true&qu='.$keyword;
$key_adds = array('+1','+2','+3','+4','+5','+6','+7','+8','+9','+0',
'+a','+b','+c','+d','+e','+f','+g','+h','+i','+j','+k',
'+l','+m','+n','+o','+p','+q','+r','+s','+t','+u','+v',
'+w','+x','+y','+z');
$sugg_data = file_get_contents($url2google);
foreach ($key_adds as $value){
$sugg_data .= file_get_contents($url2google.$value);
}
preg_match_all('/\[\[.*?\]\]/',$sugg_data,$sugg_tmp);
$sugg_tmp2 = implode(' ',$sugg_tmp[0]);
preg_match_all('/\["(.*?)",/',$sugg_tmp2,$sugg_fin);
$output = implode("\r\n",$sugg_fin[1])."\r\n";
$output = iconv("ISO-8859-1","UTF-8",$output);
file_put_contents("result.txt", $output, FILE_APPEND);
}
?>
в notepad и в notepad++ отобразилось нормально (немецкий).
и это буковки для подстановок нада на немецкие сменить (или нужный язык).
|
|
|
15.04.2011, 16:18
|
#16
|
Mr. Lucky Guy
Регистрация: 27.07.2010
Адрес: RU -> DE -> Asia
Сообщений: 704
Бабло: $175000
ТС -->
|
ТС
Цитата:
Сообщение от incognito
[PHP]
в notepad и в notepad++ отобразилось нормально (немецкий).
и это буковки для подстановок нада на немецкие сменить (или нужный язык).
|
А ведь пашет, сцуко!! СПАСИБО!
|
|
|
15.04.2011, 16:33
|
#17
|
странный гном
Регистрация: 01.05.2007
Сообщений: 2,865
Бабло: $448647
|
Спасибо адназначно!
|
|
|
15.04.2011, 16:42
|
#18
|
Senior Member
Регистрация: 15.11.2008
Сообщений: 13,236
Бабло: $247846681
|
|
|
|
15.04.2011, 17:18
|
#19
|
Senior Member
Регистрация: 08.07.2007
Сообщений: 177
Бабло: $34565
|
Цитата:
Сообщение от imgreen
странно, гугл браузеру вроде utf-8 отдает...
|
гугл смотрит заголовки браузера и отдает в том что броузер поддерживает, а что передает file_get_contents - ХЗ (ничего наверное). Вот гугл и отдает по дефолту в определенной кодировке.
|
|
|
15.04.2011, 17:51
|
#20
|
Senior Medved
Регистрация: 15.06.2008
Сообщений: 4,146
Бабло: $22479945
|
тогда нада использовать курл
|
|
|
15.04.2011, 18:24
|
#21
|
Senior Member
Регистрация: 26.08.2008
Адрес: UA
Сообщений: 2,941
Бабло: $402835
|
PHP код:
$key='viagra';
$url="http://clients1.google.de/complete/search?hl=de&q={$key}&gl=de";
preg_match_all("/\[\"(.*?)\"/", file_get_contents($url), $keys);
print_r($keys[1]);
|
|
|
|