Dc Bridge - распознаем каптчи хрумером - Форум успешных вебмастеров - GoFuckBiz.com - Страница 2
 
 
Форум успешных вебмастеров - GoFuckBiz.com

  Форум успешных вебмастеров - GoFuckBiz.com > Разное > Объявления о покупке/продаже товаров и услуг
Дата
USD/RUB88.4375
BTC/USD68166.9703
Объявления о покупке/продаже товаров и услуг Также в этом разделе следует размещать и предложения о сотрудничестве.

Закрытая тема
Опции темы Опции просмотра
Старый 29.03.2010, 09:19
Start Post: Dc Bridge - распознаем каптчи хрумером 
  #11
Barbados
Senior Member
 
Аватар для Barbados
 
Регистрация: 01.02.2008
Адрес: Perm
Сообщений: 627
Бабло: $18225
По умолчанию

Что это?
Dc Bridge - это программа-сервер, работающая в паре с Xrumer-ом. Является связующим звеном для распознавания каптч Xrumer-ом из других скриптов, программ.. и т.п. Грубо говоря – бесплатный аналог антикаптчи.

Подробнее..
Сервер открывает назначаемый пользователем порт (по умолчанию 8081) и принимает входящие запросы (команды).
  1. /upload – Multipart/form-data POST для upload каптчи для распознавания. В ответ, если ошибок нет, отдается ID каптчи.
  2. /get – GET запрос. Используется для того чтобы забрать распознанный текст каптчи, либо получить сообщение, что каптча еще обрабатывается (либо код ошибки)
Xrumer для использования своего модуля распознавания запускается в определенном режиме и по определенной базе (в архиве с DC-Bridge она есть).

Еще более подробнее..



Клиент (удаленный или локальный скрипт, приложение и т.п.) отправляет multipart/form-data Post на адрес http://server_iport/upload картинку для распознавания, ее тип и ключ доступа пример PHP code:
Код:
$post_data = array(
	'upload' => captcha_file,
	'type' => 'jpg',
	'key' = > 'key_string'
);
При успешной загрузке картинки, процессу присваивается свой ID который так же приходит клиенту в ответе от сервера. 2. Клиент с заданной периодичностью проверяет статус каптчи отправляя запросы серверу методом GET и с параметром id на адрес http://server_iport/get?id={captcha_id} В случае если картинка еще не распознана, придет ответ «not ready» В случае, если ID картинки неправильный, либо какие-то прочие ошибки, вернется ответ «empty query» В случае распознавания каптчи (получении распознанного текста от Xrumer-a) – вернется текст каптчи. Программа представляет собой многопоточный сервер (на каждый запрос создается свой поток), соответственно допускается «неограниченное» кол-во запросов на распознавание одновременно (я тестировал на 1000). Далее приведу примеры кода и рабочие классы на разных языках..

Примеры кода.

Замечу, что все примеры кода и классы лежат в архиве с программой (в директории /tools/).

PHP:
Код:
define('ROOT_DIR', preg_replace(array('/^\w:\\\/', '/\\\/'), '/', strtolower(dirname(__FILE__))));

include_once('dcbridge.php');

$dc = new DcBridge('a8sd7f6sdfj2jhkikusdf523hs', 'localhost:8081');
if ($dc->send_cap(ROOT_DIR.'/captcha.jpeg', 'jpeg')){
	if ($dc->get_cap_text()){
		echo $dc->responce;			#ok => Xrumer text reply
	}else{
		echo  'error: ' . $dc->responce;	#error
	}
}else{
	echo  'error: ' . $dc->responce;		#error
}
PYTHON:
Код:
dc = dcbridge('a8sd7f6sdfj2jhkikusdf523hs', 'localhost:8081')

if dc.send_cap('captcha.jpeg', 'jpeg'):
	if dc.get_cap_text():
		print dc.responce		#ok => Xrumer text reply
	else:
		print 'error: '+dc.responce	#error
else:
	print 'error: '+dc.responce		#error
Описание (применимо к любому коду):

При создании экземпляра класса dc передаем в конструктор KEY-ключ для доступа и HOST- хост, где запущен DcBridge (после имени (или IP) хоста указываем порт (если порт 80 – то его указывать соотв. не обязательно)). Далее идет процесс заливки (метод send_cap) где в качестве параметров указываем файл каптчи и ее тип (jpg, png, gif). И наконец последним методом get_cap_text – берем то, что отдал нам Xrumer – т.е. текст каптчи.

Настройка Xrumer для работы с мостом.

Для работы всей этой конструкции, Xrumer должен быть рапущен в следующем режиме работы:
  1. База для спама -> LinksList id999.txt (лежит в архиве с программой в папке /tools/). Ее обязательно зацикливаем (через расписание).
  2. Режим работы – «Только регистрация» (вообще советую снять галки со всех настроек кроме «Register only»)
  3. Активация профайлов (email) – отключена.
  4. Скорость-пробиваемость – «Выше скорость» (хотя это роли не играет, так.. на всякий случай)
  5. Прокси обязательно выключены
  6. Кол-во потоков – любое. Но так как скорость распознавания на высоте – вообще достаточно одного потока работы. Хотя все индивидуально и зависит от загрузки.
Ну и последнее важное замечание. Мост и Xrumer обязательно запускаются на одной машине

Архив с программой (trial 3 дня) можно загрузить по этой ссылке – DC-BRIDGE2.0

Адрес постоянной страницы - DC-BRIDGE2.0

Стоимость программы: Цена для новых глубокоуважаемых клиентов – $100. Для глубокоуважаемых постоянных клиентов – $75. Купить можно только у меня в icq: 213335

Спасибо за внимание.

В дополнение:

Пример многопоточного распознавания в своих скриптах



Последний раз редактировалось Barbados; 30.03.2010 в 18:09.
Barbados вне форума  
Старый 30.09.2010, 15:16   #12
redlain
Ебланнед
 
Регистрация: 27.10.2009
Сообщений: 1,627
Бабло: $240645
По умолчанию

Цитата:
Сообщение от Barbados Посмотреть сообщение
привет! извиняюсь что запоздал оповещений нет
Offtopic
redlain вне форума