google recapcha v3 - парсинг сайтов - Форум успешных вебмастеров - GoFuckBiz.com
 
 
Форум успешных вебмастеров - GoFuckBiz.com

  Форум успешных вебмастеров - GoFuckBiz.com > Бизнес-решения > Скрипты, программы и технические решения
Дата
USD/RUB90.2486
BTC/USD69096.7720
Скрипты, программы и технические решения Обсуждаем скрипты, программы и новые технологии.

Закрытая тема
Опции темы Опции просмотра
Старый 23.03.2019, 15:04   #1
number4
Senior Member
 
Регистрация: 23.04.2017
Адрес: Pattaya
Сообщений: 132
Бабло: $20600
По умолчанию google recapcha v3 - парсинг сайтов

Занимаюсь промышленным парсингом сайтов, майню контент значит, и тут столкнулся с сайтом, где стоит эта самая recapcha v3.
"А не бот ли ты, часом?", вежливо спросила рекапча и попросила угадать всякие велосипеды, мосты, размеры сисек и пожарные гидранты.

"Эвон, как" - подумал я и натравил puppeeter с елозеньем мышки и нажатиями кнопок, всякими юзер_агентами, валидными проксями и тд
"А на бот ли ты?" - снова спросила мена рекапча.

Посему вопрос к коллегам:
Можно ли как то на программного уровне эмулировать человекоподные действия, чтобы обойти эту самую рекапчу V3 ?
А то как-то становится тоскливо. Достаточно воткнуть в <head> скрипт с капчей и все, все боты отсекаются нахрен.
number4 вне форума  
Старый 23.03.2019, 15:42   #2
CyberCrime
Senior Member
 
Аватар для CyberCrime
 
Регистрация: 25.08.2011
Сообщений: 367
Бабло: $75175
По умолчанию

Распознавать такую капчу можно эмуляцией действий, с реальных аккаунтов ну или же феков у которых есть история. Без истории тоже можно гадать, но в конечном итоге всё упрётся в то что действия будут обнаруживаться как не человеческие и гадать уже ничего не получится. Как вариант использовать сервисы по разгадыванию 3 рекапчи c реальными пользователями без всяких проксей и прочих ухищрений, но я таких не встречал, 2-ой навалом.
CyberCrime вне форума  
Старый 23.03.2019, 16:32   #3
Botmaster
Senior Member
 
Аватар для Botmaster
 
Регистрация: 01.07.2007
Сообщений: 1,005
Бабло: $142100
По умолчанию

Цитата:
"А не бот ли ты, часом?", вежливо спросила рекапча и попросила угадать всякие велосипеды, мосты, размеры сисек и пожарные гидранты.
То, что здесь описано - не РеКапча v.3, а РеКапча v.2, и её уже давно и успешно обходят - как автоматом распознаются и щелкаются картинки, так и эмулируются действия.

На сегодня обойти РеКапчу помогут XEvil, CapMonster, а также сервисы ручного распознавания - RuCaptcha, 2Captcha, Antigate.

Цитата:
Посему вопрос к коллегам:
Можно ли как то на программного уровне эмулировать человекоподные действия, чтобы обойти эту самую рекапчу V3 ?
А то как-то становится тоскливо. Достаточно воткнуть в <head> скрипт с капчей и все, все боты отсекаются нахрен.
Конечно, и РеКапчу v.3 обходят, причём она проще, т.к. именно на v.3 никакие картинки прокликивать не нужно - там анализируется именно человекоподобное поведение.

Чтобы понимать, как это обходить, нужно понимать, как она устроена.

РеКапча v.3 даёт оценку разным действиям и ставит шкалу от 0.1 до 0.9 (скорее бот/скорее человек). Дальше всё зависит от того, какой порог установил админ целевого сайта, обычно это в пределах 0.3 - 0.5
Botmaster вне форума  
Старый 24.03.2019, 10:16   #4
number4
Senior Member
 
Регистрация: 23.04.2017
Адрес: Pattaya
Сообщений: 132
Бабло: $20600
ТС -->
автор темы ТС По умолчанию

Цитата:
Сообщение от Botmaster Посмотреть сообщение

Конечно, и РеКапчу v.3 обходят, причём она проще, т.к. именно на v.3 никакие картинки прокликивать не нужно - там анализируется именно человекоподобное поведение.

Чтобы понимать, как это обходить, нужно понимать, как она устроена.

РеКапча v.3 даёт оценку разным действиям и ставит шкалу от 0.1 до 0.9 (скорее бот/скорее человек). Дальше всё зависит от того, какой порог установил админ целевого сайта, обычно это в пределах 0.3 - 0.5

вопрос был не в том, как разгадывать или обходить рекапчу - это мне нах не сдалось, а вопрос был в том:
как эмулировать поведение реального юзера, чтобы эта самая капча не появлялась?
number4 вне форума  
Старый 24.03.2019, 10:58   #5
1een
Senior Member
 
Аватар для 1een
 
Регистрация: 28.05.2009
Сообщений: 1,321
Бабло: $164090
По умолчанию для общего развития

1een вне форума  
Старый 24.03.2019, 11:03   #6
Botmaster
Senior Member
 
Аватар для Botmaster
 
Регистрация: 01.07.2007
Сообщений: 1,005
Бабло: $142100
По умолчанию

Цитата:
Сообщение от number4 Посмотреть сообщение
Цитата:
Сообщение от Botmaster Посмотреть сообщение

Конечно, и РеКапчу v.3 обходят, причём она проще, т.к. именно на v.3 никакие картинки прокликивать не нужно - там анализируется именно человекоподобное поведение.

Чтобы понимать, как это обходить, нужно понимать, как она устроена.

РеКапча v.3 даёт оценку разным действиям и ставит шкалу от 0.1 до 0.9 (скорее бот/скорее человек). Дальше всё зависит от того, какой порог установил админ целевого сайта, обычно это в пределах 0.3 - 0.5

вопрос был не в том, как разгадывать или обходить рекапчу - это мне нах не сдалось, а вопрос был в том:
как эмулировать поведение реального юзера, чтобы эта самая капча не появлялась?
1. Как только Вы научитесь "эмулировать поведение юзера" и админу сайта это не понравится - капча будет лезть всегда и для всех, и тогда её в любом случае придется обходить

2. Нужно смотреть сам сайт. Если речь о рекапче, то могут сыграть роль куки гугла. Либо вообще сайт настроен так, что капчу выдаёт когда слишком много/слишком часто идут запросы с одного IP. Если речь о движении мыши - это можно эмулировать через JS. Универсального рецепта нет, надо смотреть конкретную ситуацию - без неё Вам никто точного ответа дать не сможет.
Botmaster вне форума