Нужна ли программка для парсинга google suggest? - Форум успешных вебмастеров - GoFuckBiz.com - Страница 2
 
 
Форум успешных вебмастеров - GoFuckBiz.com

  Форум успешных вебмастеров - GoFuckBiz.com > Бизнес-решения > Скрипты, программы и технические решения
Дата
USD/RUB89.7026
BTC/USD68532.9441
Скрипты, программы и технические решения Обсуждаем скрипты, программы и новые технологии.

Закрытая тема
Опции темы Опции просмотра
Старый 01.05.2014, 07:16
Start Post: Нужна ли программка для парсинга google suggest? 
  #11
lorien
Senior Member
 
Аватар для lorien
 
Регистрация: 18.05.2009
Сообщений: 928
Бабло: $196595
По умолчанию

Вот думаю написать just for fun бесплатную программулину какую-нить (консольную). Нужна ли тулза для google suggest или уже есть что-то бесплатное и хорошо работающее?
__________________
TgScan - узнай Telegram группы, в которых состоит человек
lorien вне форума  
Старый 01.05.2014, 13:14   #12
lorien
Senior Member
 
Аватар для lorien
 
Регистрация: 18.05.2009
Сообщений: 928
Бабло: $196595
ТС -->
автор темы ТС По умолчанию

> или же панельку крутую для чека списка сайтов на индекс

Ну я лично себе написал Для других не интересно писать пока. Хотя как идея веб-сервиса вполне ничего.

> Да, "всегда всем" интересно получить TDS быструю

Вот это интересно! Я уже думал о таком. В будущем, весьма вероятно попробую написать.

Цитата:
лучше даже так.
берем кей, делаем подстановки с перебором трех символов до и после кея.
key+aaa
key+aab
def+key
Пробел входит в число символов для подстановки? Я думаю да.
__________________
TgScan - узнай Telegram группы, в которых состоит человек
lorien вне форума  
Старый 01.05.2014, 13:31   #13
Sultan
Шучу на половину
 
Аватар для Sultan
 
Регистрация: 23.01.2011
Сообщений: 5,840
Бабло: $1168470
По умолчанию

Цитата:
Пробел входит в число символов для подстановки? Я думаю да.
зачем? думаю единственным, пробел не нужен. пробел всегда присутствует в качестве разделения с перебором символов, перебирается только алфавит (можно былоб и цифры включить но врятли что там выжмишь, только опционально)
побольше ПС. можно сделать перебор окончаний для ру это склонения для бурж множественные числа.
тем кому такое надо уже давно имеется, лиш бы твоя технология кому то пригодилась.
ps вот для справки материал http://www.key-collector.ru/preferen...parse_only_top

Последний раз редактировалось Sultan; 01.05.2014 в 13:41.
Sultan вне форума  
Старый 01.05.2014, 13:53   #14
lorien
Senior Member
 
Аватар для lorien
 
Регистрация: 18.05.2009
Сообщений: 928
Бабло: $196595
ТС -->
автор темы ТС По умолчанию

Цитата:
зачем? думаю единственным, пробел не нужен. пробел всегда присутствует в качестве разделения с перебором символов, перебирается только алфавит (можно былоб и цифры включить но врятли что там выжмишь, только опционально)
Щас проверил, пробел, действительно, не нужен. То есть одна и та же выдача для запросов "скачать м" и "скачатьм" и даже "скач атьм"

Кстати, у меня чё-то по 4 результата только на запрос. Я просто взял урл, на который через браузер запрос идёт, в браузере у меня тоже по 4 результата в подсказках. Это я не туда запросы отправляю?
__________________
TgScan - узнай Telegram группы, в которых состоит человек
lorien вне форума  
Старый 01.05.2014, 13:55   #15
bess
Раб системы
 
Регистрация: 07.02.2010
Сообщений: 6,163
Бабло: $1153600
По умолчанию

lorien, туда, гугл давно уже подрезал кол. выводящих подсказок.
__________________
За трафом - в Bizzclick !
Огненное решение для конвертации бурж давнлоад трафика. Работаем с 2015 года. В ПМ.
bess вне форума  
Старый 01.05.2014, 13:58   #16
lorien
Senior Member
 
Аватар для lorien
 
Регистрация: 18.05.2009
Сообщений: 928
Бабло: $196595
ТС -->
автор темы ТС По умолчанию

А вот тут пробел уже имеет значение:
Цитата:
lorien@athlon:/web/suggest$ ./dump.py "колбаса а"
колбаса армавирская
колбаса английский
колбаса абсолют
колбаса алан
lorien@athlon:/web/suggest$ ./dump.py "колбасаа"
шоколадная колбасаа
__________________
TgScan - узнай Telegram группы, в которых состоит человек
lorien вне форума  
Старый 01.05.2014, 13:59   #17
Sultan
Шучу на половину
 
Аватар для Sultan
 
Регистрация: 23.01.2011
Сообщений: 5,840
Бабло: $1168470
По умолчанию

там в параметрах что то менять надо, так он и раскладку клавы меняет/угадывает, и не во всех пс ошибки правятся в подсказках если дальше гугла дело зайдет.
+ еще есть гео зависимые подсказки. т.е. он под твой регион подстановки мутит с городом
Sultan вне форума  
Старый 01.05.2014, 14:00   #18
lorien
Senior Member
 
Аватар для lorien
 
Регистрация: 18.05.2009
Сообщений: 928
Бабло: $196595
ТС -->
автор темы ТС По умолчанию

Цитата:
ps вот для справки материал http://www.key-collector.ru/preferen...parse_only_top
А там как раз говорится про два режима добавления модификаторов: с пробелом и без пробела т.е. по сути это один режим, где пробел является ещё одним модификатором. В справке грят, не юзайте оба режима, а то долго парсить будете.

Дальше гугла нет смысла обсуждать пока, надо чтобы под гугл работало для начала
__________________
TgScan - узнай Telegram группы, в которых состоит человек
lorien вне форума  
Старый 01.05.2014, 14:00   #19
spasibo
Senior Member
 
Регистрация: 14.04.2013
Сообщений: 131
Бабло: $28815
По умолчанию

http://suggestqueries.google.com/com...hl=de&q=iphone
10 результатов.
считаю пробел нужен. и цифры тоже.
spasibo вне форума  
Старый 01.05.2014, 14:07   #20
lorien
Senior Member
 
Аватар для lorien
 
Регистрация: 18.05.2009
Сообщений: 928
Бабло: $196595
ТС -->
автор темы ТС По умолчанию

Хм, вот даже не знаю, suggestqueries.google.com выдаёт больше результатов, но он один, а запросы из браузера у меня идут на адреса типа "http://www.google.ru/s?q=", там можно менять google.ru на google.com и т.д. и теоритически это снизить может вероятность бана.

А откуда урл suggestqueries.google.com вообще взялся, где он используется?
__________________
TgScan - узнай Telegram группы, в которых состоит человек
lorien вне форума  
Старый 01.05.2014, 14:11   #21
Sultan
Шучу на половину
 
Аватар для Sultan
 
Регистрация: 23.01.2011
Сообщений: 5,840
Бабло: $1168470
По умолчанию

можно набор подстановок в отдельных файлах держать, и там кому как надо русский или латинский...

если под окончания мутить то там весь алфавит не нужен типичный набор под падежы для ру
для бурж s es ing
но как бы надо еще прикинуть чтоб он слова правильно крамсал
Sultan вне форума