Очень быстрый сборщик и чекер прокси! - Форум успешных вебмастеров - GoFuckBiz.com - Страница 3
 
 
Форум успешных вебмастеров - GoFuckBiz.com

  Форум успешных вебмастеров - GoFuckBiz.com > Бизнес-решения > Скрипты, программы и технические решения
Дата
USD/RUB89.7026
BTC/USD68004.1249
Скрипты, программы и технические решения Обсуждаем скрипты, программы и новые технологии.

Закрытая тема
Опции темы Опции просмотра
Старый 07.10.2011, 13:23
Start Post: Очень быстрый сборщик и чекер прокси! 
  #21
getalifejerk
Ебланнед
 
Регистрация: 14.01.2011
Сообщений: 86
Бабло: $16370
Отправить сообщение для getalifejerk с помощью ICQ Отправить сообщение для getalifejerk с помощью Skype™
По умолчанию

Друзья хочу представить вам программу которая очень быстро собирает прокси и проверяет их на работоспособность, скорость работы, страну и город.
Я разрабатывал софтину для себя, а конкретно под две задачи - парсинг гугла и расставление ссылок. Раньше постоянно приходилось обходить бесплатные списки и выделять от туда прокси. Естественно многие из них были мертвыми, поэтому и появился этот удобный инструмент!

Хотел узнать ваше мнение, готов внести желаемые доработки и начать продавать!

getalifejerk вне форума  
Старый 07.10.2011, 16:25   #22
sandy
Сеньор Член
 
Аватар для sandy
 
Регистрация: 11.04.2007
Адрес: The World
Сообщений: 1,125
Бабло: $107796
Отправить сообщение для sandy с помощью ICQ
По умолчанию

видновая прога с выгрузкой в текстовый файл - это фейспалм, сделай лучше вебсофт, ну или вебсервис просто )
sandy вне форума  
Старый 07.10.2011, 16:40   #23
den2099
Senior Member
 
Аватар для den2099
 
Регистрация: 25.06.2011
Сообщений: 1,804
Бабло: $371785
По умолчанию

Цитата:
Сообщение от getalifejerk Посмотреть сообщение
У меня также, может даже чуть дольше, 50К - 25 минут.
А где ты берешь миллионы прокси? И зачем столько нужно? =)
алгоритм такой:
1. чекаем любой паблик лист.
2. сохраняем гуды в отдельный файл.
3. затем скрипт берет из гудов прокси и парсит гугл по запросам вида:
"123.321.123.321:80" filetype:txt
на выходе получаются линки на свежие прокси листы
4. скачиваем проксилисты и распаршиваем их на предмет прокси. после удаления дублей должно получиться больше ляма.
далее см. пукт 1.
den2099 вне форума  
Старый 07.10.2011, 16:46   #24
sspy
главный злодей гофака
 
Аватар для sspy
 
Регистрация: 18.06.2007
Сообщений: 5,760
Бабло: $953848
По умолчанию

Цитата:
Сообщение от den2099 Посмотреть сообщение
алгоритм такой:
1. чекаем любой паблик лист.
2. сохраняем гуды в отдельный файл.
3. затем скрипт берет из гудов прокси и парсит гугл по запросам вида:
"123.321.123.321:80" filetype:txt
на выходе получаются линки на свежие прокси листы
4. скачиваем проксилисты и распаршиваем их на предмет прокси. после удаления дублей должно получиться больше ляма.
далее см. пукт 1.
нету в паблике столько прокси. пол лимона берет. дальше мусор.
__________________
sspy вне форума  
Старый 07.10.2011, 16:51   #25
den2099
Senior Member
 
Аватар для den2099
 
Регистрация: 25.06.2011
Сообщений: 1,804
Бабло: $371785
По умолчанию

Цитата:
Сообщение от sspy Посмотреть сообщение
нету в паблике столько прокси. пол лимона берет. дальше мусор.
если у тебя не получается столько проксей за один проход собрать - это не значит что их нет в паблике.
на 50$ замажем? могу прям сейчас лям выложить
den2099 вне форума  
Старый 07.10.2011, 16:55   #26
den2099
Senior Member
 
Аватар для den2099
 
Регистрация: 25.06.2011
Сообщений: 1,804
Бабло: $371785
По умолчанию

или ты живых имеешь в виду? живых конечно столько нет...
den2099 вне форума  
Старый 07.10.2011, 17:15   #27
getalifejerk
Ебланнед
 
Регистрация: 14.01.2011
Сообщений: 86
Бабло: $16370
ТС -->
Отправить сообщение для getalifejerk с помощью ICQ Отправить сообщение для getalifejerk с помощью Skype™
автор темы ТС По умолчанию

Цитата:
Сообщение от den2099 Посмотреть сообщение
алгоритм такой:
1. чекаем любой паблик лист.
2. сохраняем гуды в отдельный файл.
3. затем скрипт берет из гудов прокси и парсит гугл по запросам вида:
"123.321.123.321:80" filetype:txt
на выходе получаются линки на свежие прокси листы
4. скачиваем проксилисты и распаршиваем их на предмет прокси. после удаления дублей должно получиться больше ляма.
далее см. пукт 1.
Спасибо, возьму на заметку =)

И ещё такой вопрос, из одного миллиона сколько рабочих у тебя получается?
getalifejerk вне форума  
Старый 07.10.2011, 17:16   #28
sspy
главный злодей гофака
 
Аватар для sspy
 
Регистрация: 18.06.2007
Сообщений: 5,760
Бабло: $953848
По умолчанию

Цитата:
Сообщение от den2099 Посмотреть сообщение
если у тебя не получается столько проксей за один проход собрать - это не значит что их нет в паблике.
на 50$ замажем? могу прям сейчас лям выложить
алгоритм то тот-же. просто если не фильтровать, то выйдет и больше ляма, а если дать фильтр по левым портам, блэклисту диапазонов, то выйдет не больше полуляма. у меня не постоянно так чекер работает, поэтому такие резалты. если запустить круглосуточо может будет и больше.
__________________
sspy вне форума  
Старый 07.10.2011, 17:17   #29
Drunk Monk
Je suis moine ivre
 
Аватар для Drunk Monk
 
Регистрация: 03.03.2009
Сообщений: 15,268
Бабло: $797172957
По умолчанию

Что за блеклист диапазонов?
Drunk Monk вне форума  
Старый 07.10.2011, 17:22   #30
sspy
главный злодей гофака
 
Аватар для sspy
 
Регистрация: 18.06.2007
Сообщений: 5,760
Бабло: $953848
По умолчанию

Цитата:
Сообщение от Drunk Monk Посмотреть сообщение
Что за блеклист диапазонов?
Planetlab/Military айпишники
__________________
sspy вне форума  
Старый 07.10.2011, 18:17   #31
WebNinja
grablab.org
 
Аватар для WebNinja
 
Регистрация: 18.09.2007
Адрес: Thailand
Сообщений: 4,893
Бабло: $322264
Отправить сообщение для WebNinja с помощью ICQ Отправить сообщение для WebNinja с помощью Skype™
По умолчанию

Цитата:
после проверки на тип скорость просядет в неск. раз, либо возрастет потребляемая память, если в канал не упрется
у меня на одну проксю секунд по 20 уходило в среднем
зачем так много? несколько тестов? я просто обрываю то что длинне 5 секунд например.
__________________
www.imscraping.ninja
grablab.org | blog
WebNinja вне форума