|
| Дата |
|
USD/RUB | 90.2486 | BTC/USD | 69096.7720 |
|
|
|
Скрипты, программы и технические решения Обсуждаем скрипты, программы и новые технологии. |
23.03.2019, 15:04
|
#1
|
Senior Member
Регистрация: 23.04.2017
Адрес: Pattaya
Сообщений: 132
Бабло: $20600
|
google recapcha v3 - парсинг сайтов
Занимаюсь промышленным парсингом сайтов, майню контент значит, и тут столкнулся с сайтом, где стоит эта самая recapcha v3.
"А не бот ли ты, часом?", вежливо спросила рекапча и попросила угадать всякие велосипеды, мосты, размеры сисек и пожарные гидранты.
"Эвон, как" - подумал я и натравил puppeeter с елозеньем мышки и нажатиями кнопок, всякими юзер_агентами, валидными проксями и тд
"А на бот ли ты?" - снова спросила мена рекапча.
Посему вопрос к коллегам:
Можно ли как то на программного уровне эмулировать человекоподные действия, чтобы обойти эту самую рекапчу V3 ?
А то как-то становится тоскливо. Достаточно воткнуть в <head> скрипт с капчей и все, все боты отсекаются нахрен.
|
|
|
23.03.2019, 15:42
|
#2
|
Senior Member
Регистрация: 25.08.2011
Сообщений: 367
Бабло: $75175
|
Распознавать такую капчу можно эмуляцией действий, с реальных аккаунтов ну или же феков у которых есть история. Без истории тоже можно гадать, но в конечном итоге всё упрётся в то что действия будут обнаруживаться как не человеческие и гадать уже ничего не получится. Как вариант использовать сервисы по разгадыванию 3 рекапчи c реальными пользователями без всяких проксей и прочих ухищрений, но я таких не встречал, 2-ой навалом.
|
|
|
23.03.2019, 16:32
|
#3
|
Senior Member
Регистрация: 01.07.2007
Сообщений: 1,005
Бабло: $142100
|
Цитата:
"А не бот ли ты, часом?", вежливо спросила рекапча и попросила угадать всякие велосипеды, мосты, размеры сисек и пожарные гидранты.
|
То, что здесь описано - не РеКапча v.3, а РеКапча v.2, и её уже давно и успешно обходят - как автоматом распознаются и щелкаются картинки, так и эмулируются действия.
На сегодня обойти РеКапчу помогут XEvil, CapMonster, а также сервисы ручного распознавания - RuCaptcha, 2Captcha, Antigate.
Цитата:
Посему вопрос к коллегам:
Можно ли как то на программного уровне эмулировать человекоподные действия, чтобы обойти эту самую рекапчу V3 ?
А то как-то становится тоскливо. Достаточно воткнуть в <head> скрипт с капчей и все, все боты отсекаются нахрен.
|
Конечно, и РеКапчу v.3 обходят, причём она проще, т.к. именно на v.3 никакие картинки прокликивать не нужно - там анализируется именно человекоподобное поведение.
Чтобы понимать, как это обходить, нужно понимать, как она устроена.
РеКапча v.3 даёт оценку разным действиям и ставит шкалу от 0.1 до 0.9 (скорее бот/скорее человек). Дальше всё зависит от того, какой порог установил админ целевого сайта, обычно это в пределах 0.3 - 0.5
|
|
|
24.03.2019, 10:16
|
#4
|
Senior Member
Регистрация: 23.04.2017
Адрес: Pattaya
Сообщений: 132
Бабло: $20600
ТС -->
|
ТС
Цитата:
Сообщение от Botmaster
Конечно, и РеКапчу v.3 обходят, причём она проще, т.к. именно на v.3 никакие картинки прокликивать не нужно - там анализируется именно человекоподобное поведение.
Чтобы понимать, как это обходить, нужно понимать, как она устроена.
РеКапча v.3 даёт оценку разным действиям и ставит шкалу от 0.1 до 0.9 (скорее бот/скорее человек). Дальше всё зависит от того, какой порог установил админ целевого сайта, обычно это в пределах 0.3 - 0.5
|
вопрос был не в том, как разгадывать или обходить рекапчу - это мне нах не сдалось, а вопрос был в том:
как эмулировать поведение реального юзера, чтобы эта самая капча не появлялась?
|
|
|
24.03.2019, 10:58
|
#5
|
Senior Member
Регистрация: 28.05.2009
Сообщений: 1,321
Бабло: $164090
|
для общего развития
|
|
|
24.03.2019, 11:03
|
#6
|
Senior Member
Регистрация: 01.07.2007
Сообщений: 1,005
Бабло: $142100
|
Цитата:
Сообщение от number4
Цитата:
Сообщение от Botmaster
Конечно, и РеКапчу v.3 обходят, причём она проще, т.к. именно на v.3 никакие картинки прокликивать не нужно - там анализируется именно человекоподобное поведение.
Чтобы понимать, как это обходить, нужно понимать, как она устроена.
РеКапча v.3 даёт оценку разным действиям и ставит шкалу от 0.1 до 0.9 (скорее бот/скорее человек). Дальше всё зависит от того, какой порог установил админ целевого сайта, обычно это в пределах 0.3 - 0.5
|
вопрос был не в том, как разгадывать или обходить рекапчу - это мне нах не сдалось, а вопрос был в том:
как эмулировать поведение реального юзера, чтобы эта самая капча не появлялась?
|
1. Как только Вы научитесь "эмулировать поведение юзера" и админу сайта это не понравится - капча будет лезть всегда и для всех, и тогда её в любом случае придется обходить
2. Нужно смотреть сам сайт. Если речь о рекапче, то могут сыграть роль куки гугла. Либо вообще сайт настроен так, что капчу выдаёт когда слишком много/слишком часто идут запросы с одного IP. Если речь о движении мыши - это можно эмулировать через JS. Универсального рецепта нет, надо смотреть конкретную ситуацию - без неё Вам никто точного ответа дать не сможет.
|
|
|
|