|
| Дата |
|
USD/RUB | 88.4375 | BTC/USD | 67751.3897 |
|
|
|
Скрипты, программы и технические решения Обсуждаем скрипты, программы и новые технологии. |
28.12.2007, 12:40
|
Start Post: Бесплатный парсер
|
Member
Регистрация: 28.09.2007
Сообщений: 45
Бабло: $500
|
Десктопный парсер выдачи Google. Сохраняет базу в txt-формате. Выдает заданное количество результатов поиска. Парсит с любой страницы до конца выдачи. Не берет ссылки на сам Google - только на результаты поиска. Никаких наворотов, только функционал.
Писал сам, поэтому буду благодарен за комменты - чего добавить/убрать.
Взять можно тут.
|
|
|
29.12.2007, 14:02
|
#22
|
Member
Регистрация: 28.09.2007
Сообщений: 45
Бабло: $500
ТС -->
|
ТС
Цитата:
Сообщение от Le Comte de Monte-Cristo
Имеет. Банит сцуко через некоторое время.
Практика: с одного IP при холде 6 секунд банит примерно через 5000 запросов. При холде 10 сек вообще не банит, только внуки потом будут разгребать результаты....
|
Поясните, плз, что такое 10 сек - задержка м/ду запросами? Или м/ду перелистыванием страниц запроса? Сделать-то задержку - не проблема, но где?
|
|
|
29.12.2007, 14:02
|
#23
|
РУБЛЬ
Регистрация: 02.07.2007
Сообщений: 47
Бабло: $500
|
Цитата:
Сообщение от Adm
Какие пароли? Нет там никаких паролей. Может измениться только признак конца парсинга, это зависит от Google. Но и в этом случае напарсенную базу можно будет сохранить после сообщения об ошибке.
|
__________________
инвайты на Vipcodec; Bucksloads; : ICQ 252603924
oxo codec
|
|
|
29.12.2007, 14:03
|
#24
|
Member
Регистрация: 28.09.2007
Сообщений: 45
Бабло: $500
ТС -->
|
ТС
Цитата:
Сообщение от regulus
|
|
|
|
30.12.2007, 18:13
|
#25
|
Senior Member
Регистрация: 29.11.2007
Сообщений: 581
Бабло: $500
|
афтору респект, только сделай
- управляемую задержку между обращениями к странице
- поменьше окно и чтоб, посередине экрана, а то у мине при 1024х768 оно где то справа внизу и слишком длинное
на чём писал ?
|
|
|
30.12.2007, 20:06
|
#26
|
Member
Регистрация: 30.12.2007
Сообщений: 74
Бабло: $5020
|
привет
программка может стать еще полезнее после минимальных исправлений
я написал недавно парсер гугла для моих узкоспецифических нужд, он у меня круглосуточно парсит, не быстро, зато осторожно
задержку меду запросами сделал рандомную от 10 до 30 секунд, и запросы постоянно чередуются
забанили всего пару раз за месяц
т.е. если добавить задержку и возможность задавать несколько запросов, будет хорошо
|
|
|
30.12.2007, 20:41
|
#27
|
Member
Регистрация: 28.09.2007
Сообщений: 45
Бабло: $500
ТС -->
|
ТС
Цитата:
Сообщение от reddik
привет
программка может стать еще полезнее после минимальных исправлений
я написал недавно парсер гугла для моих узкоспецифических нужд, он у меня круглосуточно парсит, не быстро, зато осторожно
задержку меду запросами сделал рандомную от 10 до 30 секунд, и запросы постоянно чередуются
забанили всего пару раз за месяц
т.е. если добавить задержку и возможность задавать несколько запросов, будет хорошо
|
Спишемся в асе? Очень нужен совет - как сделать лучше! Т.е. код я и сам реализовать смогу, а вот где задержку ставить - между перелистыванием страниц запроса, или между запросами?
|
|
|
30.12.2007, 20:43
|
#28
|
Member
Регистрация: 28.09.2007
Сообщений: 45
Бабло: $500
ТС -->
|
ТС
Цитата:
Сообщение от mudoeb
афтору респект, только сделай
- поменьше окно и чтоб, посередине экрана, а то у мине при 1024х768 оно где то справа внизу и слишком длинное
на чём писал ?
|
Окно - сделаю, чтоб вылезало посерёдке. Как откомпилировал, так и лезет. Не проблема. Да и автосайз под расширение можно замандить...
Писал на Delphi7.
|
|
|
30.12.2007, 21:27
|
#29
|
Senior Member
Регистрация: 29.11.2007
Сообщений: 581
Бабло: $500
|
делай ... жду обновлений, буду юзать и осторожно кликать по рекламе (не больше 2 раз в день)
ОБЯЗАТЕЛЬНО СДЕЛАЙ чтобы можно было вставлять не только текстовый запрос, но и адрес который получается в адресной строке например - http://www.google.ru/search?hl=ru&q=...ogspot.com&lr= < чтобы вот это можно было вставлять и парсить (а то там бывает много важных параметров, которые в поисковом поле не пропишешь)
добавь ещё кнопки пауза/продолжить и стоп
баги
- у меня прога после парсинга не закрывается, приходится применять насилие
- "хотим результатов" = 10 а парсит = 100
- иногда нельзя вставить новый запрос для парсинга,после того как закончил первый парсинг (было выставлено максимальное количество результатов)
|
|
|
30.12.2007, 21:33
|
#30
|
Member
Регистрация: 28.09.2007
Сообщений: 45
Бабло: $500
ТС -->
|
ТС
Постараюсь исправить все вышеуказанное.
С наступающим!
|
|
|
30.12.2007, 21:44
|
#31
|
Senior Member
Регистрация: 29.11.2007
Сообщений: 581
Бабло: $500
|
тебя тоже ...
сделай чтобы результаты предыдущего парсинга сбрасывались (или не сбрасывались - опционально) после начала нового парсинга
убери ещё эти дурацкие полосы прокрутки по краям программы а то раздражают ...
и поменяй дизайн проги, имхо браузер там ваще не нужен ... сделай окно проги покомпактнее и посимпатичнее - типа вверху твой банер с приглашением кликнуть, ниже окно для запросов и для вставки адреса (см. мой пост выше), потом кнопки управления, ниже окно с результатами, под ним кнопки для сохранения и всякие опции
|
|
|
|