Скрипт парсинга + сортировка по Pr
Продаю скрипт, который в многопоточном режиме парсит гугл по запросам, удаляет дупы и сортирует все ссылки по PageRank
Максимальная выборка ссылок, достигается подставлением дополнительных слов и зон, т.е. если по запросу guestbook больше 1000 (макс. кол-во ссылок, которое можно взять без бана из google) , то подставляются зоны, если опять в результате больше 1000, то подставляются еще доп. слова, в итоге имеется максимальное количество выборки из google по заданным кеям
Вам остается только добавить список запросов в search.inc, желаемые зоны для парсинга в site.inc, дополнительные слова в words.inc и пойти гулять. Когда вернетесь- будет напарсена -база, ссылки раскиданы по текстовым файлам pr0.txt - pr10.txt , и один общий файл db_pr.txt, отсоритрованный так, что в начале идут ссылки с самым высоким PR.
Имеется также фильтр, в котором можно отбрасывать ссылки с ненужными фразами, или наоборот в базу попадут только ссылки, имеющие определенные слова.
Парсер серверный, но хорошо работает и на windows в консоли.
Скорость очень высока - РЕАЛЬНО напарсить 100К чистых ссылок в час
Работа с прокси:
прокси автоматом подгружаются с указанных сайтов (нормально подойдут и паблик сайты с прокси) либо из файла. Как только прокси заканчиваются, они опять автоматом подгружаются. Также можно выставить время подгрузки прокси в секундах, т.е. прокси автоматизированы, можно задать один раз список сайтов и забыть о них.
стоимость: 97$
Бонус: в комплекте 4834 уникальных запроса для парсинга гостевых
Бесплатная помощь в установке и настройке.
Тестировался на linux, freebsd, CentOS и windows
Могу дать на проверку одному из авторитетов форума
контакты: icq 117195
|