Цитата:
Сообщение от roddik
Вопрос в том, что ставить в куку, чтобы девелопер бота не вытащил ее руками и не прописал своему боту?
|
Куку придётся менять при каждом новом посещении, и прописывать туда суммарное количество заходов и срок валидности куки(1-2 минуты) в зашифрованном виде. Если запрошено больше 200 страниц за 5 минут
(цифры примерные) - на часок начать давать капчу этому IP+Useragent
(или по Куке, но её могут и очистить).
Короче, получается сложно и некрасиво.
Посмотри простой вариант
Защиты от ботов, основанная на различии в работе с большими числами в JavaScript и PHP.
Я не знаю твоего уровня, возможностей и степени дотошности, но надо делать комплексную защиту:
- забанить IP публичных хостингов в фаеровле сервера, первичный список есть в
этой теме на Серче.
- сделать исключение для IP поисковых систем
(не все IP, ибо у Google есть IPV4 proxy-google.com, прокси IPV6-> IPV4, публичный хостинг на googleusercontent.com)
- забанить все "нехорошие" юзерагенты в настройках веб-сервера по примеру
поста Creolabs. На Апаче я баню через httpd.conf - туда инклудится отдельный файл с плохими useragent.
- применить на сайте свою "изюминку" для отсева ботов, не исполняющих яваскрипт
(куки, работа с BigInteger по ссылке выше и тп).
- отсеять
ботов на PhantomJS или SlimerJS, они исполняют JS, но палятся по сигнатурам.
- мониторить логи и по необходимости делать защиту от тех ботов, кто прорвался через сито выше. Но как это делать я не могу обсуждать в паблике. Ибо слитые в паблик темы перестают работать.
PS: Могу добавить, что ботов сейчас шарится по сайтам больше, чем нормальный посетителей. И даже простые способы защиты достаточно эффективны.