Защита от парсинга - КАК/ЧЕМ? - Форум успешных вебмастеров - GoFuckBiz.com - Страница 2
 
 
Форум успешных вебмастеров - GoFuckBiz.com

  Форум успешных вебмастеров - GoFuckBiz.com > Бизнес-решения > Скрипты, программы и технические решения
Дата
USD/RUB90.2486
BTC/USD69331.3663
Скрипты, программы и технические решения Обсуждаем скрипты, программы и новые технологии.

Закрытая тема
Опции темы Опции просмотра
Старый 14.07.2020, 00:36
Start Post: Защита от парсинга - КАК/ЧЕМ? 
  #11
Morgul
Senior Member
 
Аватар для Morgul
 
Регистрация: 03.10.2010
Сообщений: 1,712
Бабло: $296955
По умолчанию

Всем привет. Меня одолевает какой-то нехороший персонаж и активно пиздит мой контент и юзает его на пирогах.
Реально достал.

Может кто подскажет чем можно закрыться от парсинга?

Сейчас сайт на Cloudflare. Создал там несколько правил, кому можно попасть. Например, можно хорошим ботам (у cf есть видимо своя определялка хороших ботов) + юзерам пришедшим с гугла и с определенных стран.
Остальным блок.
Но вижу в пивике как пропарсили опять сайт (js исполняют). И чето не догоняю как они прошли фильтры, ибо реферера нет, к норм ботам IP тоже не относится.

Вообщем, есть ли какие-то доступные решения?
Morgul вне форума  
Старый 14.07.2020, 16:37   #12
Morgul
Senior Member
 
Аватар для Morgul
 
Регистрация: 03.10.2010
Сообщений: 1,712
Бабло: $296955
ТС -->
автор темы ТС По умолчанию

Цитата:
Сообщение от Hector
Я вообще это имел ввиду, юзер может и не заметить ее https://developers.google.com/recaptcha/docs/invisible
а она работает? Отсеивает боты?
Цитата:
Сообщение от Hector
Элементарно с кеша гугла вытянут контент и на этом всё. Конечно можно запретить кешировать, это другой вопрос.
кэш можно запретить, тянуть будет не откуда.
Цитата:
Сообщение от Hector
Я вот сейчас делаю парсинг при помощи Selenium + Opera + opera vpn, и хрен ты меня заблочишь же, и каптчу разгадаю если нужно. Ты же не будешь банить юзера с Оперой? )))
ну почему же. у меня разрешены юзеры с гугла + определенные страны. Остальные нафиг. То есть напрямую зайти - уже блок. И вот тут что-то я не вкурил, ибо пивик показывает - был прямой заход, с USA ip. То есть реферер пустой, а значит уже не удовлетворяет моему фильтру.

я понимаю, что спарсить могут что угодно. Но хотелось бы тогда максимально усложнить эту задачу, чтобы чел переключился на что-то/кого-то другое.
Ну или меня специально топят, ибо у конкурентов хоть и тоже не уник контент, но там видно, что пиздят по-другому.
Цитата:
Сообщение от Ower
IP (гео, провайдер, подсети) + фингрепринт (частично, не все параметры).
да, кое-что побанил дополнительно. А по IP - ну их куча. Много европы, которой у меня нет. И еще разок - у меня тупо разрешены визиты с гугла + usa. Так что все остальные страны идут лесом.
Morgul вне форума  
Старый 14.07.2020, 16:43   #13
Shadrin
.
 
Регистрация: 06.12.2009
Сообщений: 70
Бабло: $19540
По умолчанию

[QUOTE=Morgul;1234677]
Цитата:
Сообщение от Hector
Я вообще это имел ввиду, юзер может и не заметить ее https://developers.google.com/recaptcha/docs/invisible
а она работает? Отсеивает боты?

У меня она выполняет защиту от проксирования(масс прокси и т д).
Shadrin вне форума  
Старый 14.07.2020, 17:39   #14
Hector
hustle
 
Аватар для Hector
 
Регистрация: 02.05.2008
Адрес: 3d world
Сообщений: 12,890
Бабло: $1717315
Отправить сообщение для Hector с помощью Jabber
По умолчанию

Цитата:
Сообщение от Shadrin
У меня она выполняет защиту от проксирования(масс прокси и т д).
Если не трудно распиши свой алгоритм.
Hector вне форума  
Старый 14.07.2020, 18:06   #15
Shadrin
.
 
Регистрация: 06.12.2009
Сообщений: 70
Бабло: $19540
По умолчанию

Цитата:
Сообщение от Hector Посмотреть сообщение
Цитата:
Сообщение от Shadrin
У меня она выполняет защиту от проксирования(масс прокси и т д).
Если не трудно распиши свой алгоритм.
Сначала юзер обращается к капче v3, если у нее подозрений нет, то он идет дальше, если она пускать не хочет кидает на v2 юзер "ищет сфетофоры". В скрипте настраивается скор на какой показывать v2. Просторе решение, с обилием доков от гугла прогер с руками такое быстро напишет.
Если поставить только v3 то если она пускать не захочет, пользователь уже не зайдет на сайт.Если захотят прокси поставить, то получат на своем домене "не валидный кей" от капчи
Гугл в исключениях стоит.
Shadrin вне форума  
Старый 14.07.2020, 18:12   #16
Hector
hustle
 
Аватар для Hector
 
Регистрация: 02.05.2008
Адрес: 3d world
Сообщений: 12,890
Бабло: $1717315
Отправить сообщение для Hector с помощью Jabber
По умолчанию

Shadrin, спасибо, ну а в базу данных что-то пишешь? Или в сессии просто хранишь?
Hector вне форума  
Старый 14.07.2020, 18:24   #17
Shadrin
.
 
Регистрация: 06.12.2009
Сообщений: 70
Бабло: $19540
По умолчанию

сессия на сутки, бд лишнее(в моем случае)
Shadrin вне форума  
Старый 15.07.2020, 06:54   #18
Heromant
Мне платит 
 
Аватар для Heromant
 
Регистрация: 24.10.2008
Сообщений: 1,368
Бабло: $189453
По умолчанию

Посмотри в сторону stackpath.com не скажу, что 100% поможет, но функционал больше чем у CF как по мне. Есть Anti-Scraping.
__________________
Нужны прокси? 👍 тут
Бесплатный VPN 👍 тут и в Telegram https://t.me/FineVPNbot
Heromant вне форума  
Старый 15.07.2020, 07:54   #19
IDL
Senior Member
 
Регистрация: 26.04.2014
Сообщений: 9,260
Бабло: $1187275
По умолчанию

Мне кажется бесполезно защищатся. Там банально генератор с нового пирога будет дёргать и всё.
__________________
Ахуенный КОНВЕРТ ФАРМЫ WORLDWIDE. забираем свежие инвайты на http://myinvites.xyz/ - Visa + MC. +50% в первую неделю.
IDL вне форума  
Старый 15.07.2020, 10:32   #20
disqus
Senior Member
 
Аватар для disqus
 
Регистрация: 29.08.2016
Сообщений: 1,616
Бабло: $323550
По умолчанию

Цитата:
Сообщение от Morgul Посмотреть сообщение
По сервисам - кто-нить юзал что-то такое именно для защиты от парсинга?
попробуй нанять какого-нибудь сис-админа по часам, пусть на сервере поставит все возможные защиты.
Как вариант перенеси на сервер, где администрирование бесплатно и попроси там помощи))
например к инферно , там работают хорошие специалисты, или к другим хостерам, типо pqcservice там норм пацанчики
disqus вне форума  
Старый 15.07.2020, 12:07   #21
Dor
Senior Member
 
Регистрация: 24.01.2013
Сообщений: 1,563
Бабло: $213575
По умолчанию

Цитата:
Сообщение от IDL Посмотреть сообщение
Мне кажется бесполезно защищатся. Там банально генератор с нового пирога будет дёргать и всё.
да, очень сложно...
когда ресурс находится в топе ко каким то популярным кеям, то доргены от разных людей парсят его с разных айпих...

Morgul, у тебя много сайтов или с одного большого сайты тырят?
Если большой сайт, то может раз когда-то спарсили и теперь юзают ...
Dor вне форума