Что это?
Dc Bridge - это программа-сервер, работающая в паре с Xrumer-ом. Является связующим звеном для распознавания каптч Xrumer-ом из других скриптов, программ.. и т.п. Грубо говоря – бесплатный аналог антикаптчи.
Подробнее..
Сервер открывает назначаемый пользователем порт (по умолчанию 8081) и принимает входящие запросы (команды).
- /upload – Multipart/form-data POST для upload каптчи для распознавания. В ответ, если ошибок нет, отдается ID каптчи.
- /get – GET запрос. Используется для того чтобы забрать распознанный текст каптчи, либо получить сообщение, что каптча еще обрабатывается (либо код ошибки)
Xrumer для использования своего модуля распознавания запускается в определенном режиме и по определенной базе (в архиве с DC-Bridge она есть).
Еще более подробнее..
Клиент (удаленный или локальный скрипт, приложение и т.п.) отправляет
multipart/form-data Post на адрес
http://server_iport/upload картинку для распознавания, ее тип и ключ доступа пример PHP code:
Код:
$post_data = array(
'upload' => captcha_file,
'type' => 'jpg',
'key' = > 'key_string'
);
При успешной загрузке картинки, процессу присваивается свой ID который так же приходит клиенту в ответе от сервера. 2. Клиент с заданной периодичностью проверяет статус каптчи отправляя запросы серверу методом GET и с параметром id на адрес
http://server_iport/get?id={captcha_id} В случае если картинка еще не распознана, придет ответ «not ready» В случае, если ID картинки неправильный, либо какие-то прочие ошибки, вернется ответ «empty query» В случае распознавания каптчи (получении распознанного текста от Xrumer-a) – вернется текст каптчи. Программа представляет собой многопоточный сервер (на каждый запрос создается свой поток), соответственно допускается «неограниченное» кол-во запросов на распознавание одновременно (я тестировал на 1000). Далее приведу примеры кода и рабочие классы на разных языках..
Примеры кода.
Замечу, что все примеры кода и классы лежат в архиве с программой (в директории /tools/).
PHP:
Код:
define('ROOT_DIR', preg_replace(array('/^\w:\\\/', '/\\\/'), '/', strtolower(dirname(__FILE__))));
include_once('dcbridge.php');
$dc = new DcBridge('a8sd7f6sdfj2jhkikusdf523hs', 'localhost:8081');
if ($dc->send_cap(ROOT_DIR.'/captcha.jpeg', 'jpeg')){
if ($dc->get_cap_text()){
echo $dc->responce; #ok => Xrumer text reply
}else{
echo 'error: ' . $dc->responce; #error
}
}else{
echo 'error: ' . $dc->responce; #error
}
PYTHON:
Код:
dc = dcbridge('a8sd7f6sdfj2jhkikusdf523hs', 'localhost:8081')
if dc.send_cap('captcha.jpeg', 'jpeg'):
if dc.get_cap_text():
print dc.responce #ok => Xrumer text reply
else:
print 'error: '+dc.responce #error
else:
print 'error: '+dc.responce #error
Описание (применимо к любому коду):
При создании экземпляра класса dc передаем в конструктор KEY-ключ для доступа и HOST- хост, где запущен DcBridge (после имени (или IP) хоста указываем порт (если порт 80 – то его указывать соотв. не обязательно)). Далее идет процесс заливки (метод
send_cap) где в качестве параметров указываем файл каптчи и ее тип (jpg, png, gif). И наконец последним методом
get_cap_text – берем то, что отдал нам Xrumer – т.е. текст каптчи.
Настройка Xrumer для работы с мостом.
Для работы всей этой конструкции, Xrumer должен быть рапущен в следующем режиме работы:
- База для спама -> LinksList id999.txt (лежит в архиве с программой в папке /tools/). Ее обязательно зацикливаем (через расписание).
- Режим работы – «Только регистрация» (вообще советую снять галки со всех настроек кроме «Register only»)
- Активация профайлов (email) – отключена.
- Скорость-пробиваемость – «Выше скорость» (хотя это роли не играет, так.. на всякий случай)
- Прокси обязательно выключены
- Кол-во потоков – любое. Но так как скорость распознавания на высоте – вообще достаточно одного потока работы. Хотя все индивидуально и зависит от загрузки.
Ну и последнее важное замечание.
Мост и Xrumer обязательно запускаются на одной машине
Архив с программой (trial 3 дня) можно загрузить по этой ссылке – DC-BRIDGE2.0
Адрес постоянной страницы -
DC-BRIDGE2.0
Стоимость программы: Цена для новых глубокоуважаемых клиентов – $100. Для глубокоуважаемых постоянных клиентов – $75. Купить можно только у меня в icq: 213335
Спасибо за внимание.
В дополнение:
Пример многопоточного распознавания в своих скриптах