Защита сервера от ботов - Форум успешных вебмастеров - GoFuckBiz.com - Страница 2
 
 
Форум успешных вебмастеров - GoFuckBiz.com

  Форум успешных вебмастеров - GoFuckBiz.com > Бизнес-решения > Хостинг и железо
Дата
USD/RUB90.2486
BTC/USD68366.4632
Хостинг и железо Обсуждаем вопросы хостинга и железа.

Закрытая тема
Опции темы Опции просмотра
Старый 25.07.2014, 00:52
Start Post: Защита сервера от ботов 
  #11
chesser
автоматизирую интернеты
 
Аватар для chesser
 
Регистрация: 05.07.2009
Адрес: chesser.ru
Сообщений: 3,362
Бабло: $470735
По умолчанию

люблю следить за чужими ботами в логах своих веб-серверов. Порой проскакивают интересные экземпляры и "темы". Но большинство ботов являются нежданными гостями, а порой и опасны для сайта или сервера. Далее я хочу поделиться своими мыслями на эту тему.
Тыкаем на смайлы More

Опасности ботов:

More

Определение термина "бот"

More

Признаки бота

More

Степень наглости ботов.

More

Политика и цели филтрации бот-трафика

More

Маршрут ботов и компоненты их анализа

More

Что делать с обнаруженным ботом?

More

Профит от фильтрации ботов

More

далее еще будет практическая часть.....
__________________
USA и NL серверы и VPS | wiki | блог | Drupal | NginxТДС
Ave, Google, morituri te salutant! © chesser
chesser вне форума  
Старый 25.07.2014, 23:09   #12
Strannic
Strannic.org
 
Аватар для Strannic
 
Регистрация: 15.12.2010
Сообщений: 2,031
Бабло: $508160
По умолчанию

Отличная статья!
Может кому пригодится еще списочек ботов приложу

More
__________________
No cyber wars and all wars... (Strannic)
Strannic вне форума  
Старый 25.07.2014, 23:42   #13
sspy
главный злодей гофака
 
Аватар для sspy
 
Регистрация: 18.06.2007
Сообщений: 5,760
Бабло: $953848
По умолчанию

Strannic,
Цитата:
RewriteCond %{HTTP_USER_AGENT} ^msnbot [OR]
RewriteCond %{HTTP_USER_AGENT} ^Bingbot [OR]
ну ну
__________________
sspy вне форума  
Старый 26.07.2014, 00:17   #14
digg
$400
 
Аватар для digg
 
Регистрация: 17.05.2009
Сообщений: 14,040
Бабло: $1904870
Отправить сообщение для digg с помощью ICQ
По умолчанию

ну, хули, боты задрачивают серваки
на то они и боты, работа у них такая
чизер красава толково все классифицировал
digg вне форума  
Старый 30.07.2014, 10:36   #15
Grut
Senior Member
 
Аватар для Grut
 
Регистрация: 23.04.2007
Сообщений: 2,118
Бабло: $337995
По умолчанию Черный список IP адресов - ботов, 25,000 ip адресов

Свежий Черный список IP адресов - ботов, 25,000 ip адресов (обновляется каждый день)

Online доступ - http://ru.myip.ms/browse/blacklist/
Список в текстовом файле - http://ru.myip.ms/downloads/blacklist/

Спиcок обновляется каждый час, сейчас в нем 25,000 ip адресов. Он включает непознаваемые боты, маскирующиеся под пользователей, а также - Majestic12 bots, Proximic bots, 80legs bots, Ahrefs bots, etc.

Цитата:
На данный момет данный список в автоматическом режиме скачивают около 500 компаний/хостеров. Топ стран по скачиванию - США/Германия/Израиль.

Наши сайты посещают каждый день десятки тысяч посетителей, многие из них идентифицируемы, но также приходят различные непознаваемые боты, поисковые агенты, спам боты и роботы на наши сайты. То есть у нас есть десятки тысяч IP-адресов каждый день, которые могут и будут проанализированы для блокирования спам ботов, и.т.д.

Наша уникальная система защиты позволяет легко идентифицировать реальных посетителей ip адреса и ip адреса ботов, поисковых агентов, спам ботов, а также другие угрозы, включая неизвестных спам ботов, маскирующихся непосредственно под нормальных пользователей.

Принцип действия нашей системы защиты очень прост: мы позволяем любому пользователю просматривать 10-20 страниц на любом из наших веб-сайтов, и после этого, система начинает показывать форму бесплатной регистрации на веб-сайте и блокирует все страницы веб-сайта (то есть посетитель видит только форму бесплатной регистрации на всех страницах сайта). Мы просим, чтобы посетители бесплатно зарегистрировались на сайте сами или повторно зашли на сайт через 24 часа, чтобы продолжить просматривать другие страницы сайта.

Боты/поисковые агенты игнорируют форму регистрации, и пытаются продолжить сканировать веб-сайт. Нормальные пользователи могут нажать на ссылки на веб-сайте также, но они будет видеть все время форму регистрации и после того, как они увидят ее на 10-20 страниц, пользователи перестают нажимать на ссылки. Но боты продолжают сканировать сайт все равно несмотря что все время показывается форма регистрации. Мы считаем количество показанных страниц. И после 100 показов различных страниц с формой регистрации, мы можем быть на 100 % уверены, что посетитель - это БОТ, даже если он маскируется под обычного пользователя.

Если пользовательская строка бота не содержит идентификацию бота и маскирует его под обычного пользователя, то мы автоматически добавляем этот IP в наш черный список. Например у Google бота пользовательский агент:
Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html и он не скрывает этого.

Поэтому наш Черный Список IP адресов состоит только из неизвестных ботов / спам ботов, маскирующихся непосредственно под нормальных пользователей, и в нашем Черном списке нет известных ботов поисковиков как Google бот, Yahoo бот, Bing бот и других, которые не пытаются замаскироваться под реальных пользователей.


Мы не нашли в Интернете подобного вида сервис, который создает Черный список неизвестных спам ботов в режиме реального времени, таким образом, надеемся, вы найдете наш черный список ip адресов спам ботов полезным -
http://ru.myip.ms/browse/blacklist/

С уважением
Михаил, Web Developer
www.myip.ms
Источник
Grut вне форума  
Старый 30.07.2014, 12:28   #16
Дима Кайфулин
Ебланнед
 
Регистрация: 30.06.2014
Сообщений: 85
Бабло: $11890
По умолчанию

chesser это охуенчик, все сжато и четко
Grut тоже спасибо, хороший ресурс
__________________
- Запрещено иметь несколько аккаунтов одному человеку. В случае обнаружения будут забанены как основной аккаунт, так и его клоны.
Дима Кайфулин вне форума  
Старый 21.08.2014, 21:09   #17
wiam
Member
 
Аватар для wiam
 
Регистрация: 10.06.2008
Сообщений: 77
Бабло: $21324
По умолчанию

А как например логировать ботов?

допустим сюда
PHP код:
if ($bad_location) {
  return 
444;

дописать, чтоб ip записался в файлик ?
wiam вне форума  
Старый 21.08.2014, 21:49   #18
chesser
автоматизирую интернеты
 
Аватар для chesser
 
Регистрация: 05.07.2009
Адрес: chesser.ru
Сообщений: 3,362
Бабло: $470735
ТС -->
автор темы ТС По умолчанию

Цитата:
Сообщение от wiam Посмотреть сообщение
А как например логировать ботов?

допустим сюда
PHP код:
if ($bad_location) {
  return 
444;

дописать, чтоб ip записался в файлик ?
где-нибудь в http секции определяем новый лог-формат:

http.conf:
PHP код:
log_format bad_ips '$remote_addr'
и далее добавляем саму строчку с логированием:
PHP код:
if ($bad_location) {
  
access_log /var/log/nginx/badips.log bad_ips;
  return 
444;

подробнее про этот log nginx-модуль тут

UPD:
я немного ошибся, тут будут проблемы с контекстом. Этот if должен быть внутри location, например внутри location / {}

UPD2:
но в последних версиях nginx как раз для подобного случая в директиве access_log появился параметр if

т.е. просто в любом допустимом контексте (например в server {...}) можно добавить следующую строчку:
PHP код:
access_log /var/log/nginx/badips.log bad_ips if=$bad_location
т.е. она независима от первоначальной секции if ($bad_location) {...}
__________________
USA и NL серверы и VPS | wiki | блог | Drupal | NginxТДС
Ave, Google, morituri te salutant! © chesser

Последний раз редактировалось chesser; 21.08.2014 в 21:57.
chesser вне форума  
Старый 21.08.2014, 22:21   #19
wiam
Member
 
Аватар для wiam
 
Регистрация: 10.06.2008
Сообщений: 77
Бабло: $21324
По умолчанию

Спасибо за разъяснение, сейчас все побаню )
wiam вне форума  
Старый 09.09.2014, 02:49   #20
assasin
Member
 
Аватар для assasin
 
Регистрация: 24.07.2008
Сообщений: 30
Бабло: $11180
По умолчанию

Цитата:
Сообщение от chesser Посмотреть сообщение
в апаче есть httpd.conf и все, что в него инклудится - это статическая часть апачевского конфига, в ней побольше возможностей, чем в htaccess, синтаксис такой же, но надо ребутать/релоадить сервер. Но все равно хрен редьки не слаще )

А зачем ты апачем банишь, если есть nginx? или это про разные серверы?
Буржуи в связке с апачем часто используют lighttpd, но в связи с усилением международного пиара nginx, соотношение nginx / lighttpd изменилось.

Можно даже апачем собирать IP и формировать из них черные списки для фаервола - самый низкий уровень, который тебе доступен на сервере.



принципиальной разницы нет, оба правильные.

Для описания признаков я использую map-переменные, они имхо удобнее в использовании, чем if (список) , особенно когда этот список длинный - с одной стороны. С другой стороны, мои regexp-ы в map-ах надо бы разбивать и компоновать в группы...

Еще у тебя return 403 - т.е. бот-трафик проходит всю цепочку полностью, от (1) до (9), потому что 403 ответ - это именно HTTP-ответ, а не обрыв. У меня return 444 и nginx обрубает соединение в районе точки (4).
Возможно, у тебя цель отдать боту 403. Как эффективнее отваживать ботов ходить на сервер - я не знаю, статистики нет на этот счет, не сравнивал.
444 лучше не отдавать, у вас сокетов полу открытых будет огромное количество, из-за того, что вы закрываете соединение каждый раз, а боты будут устанавливать новое с каждым request
403 -нормуль.
assasin вне форума  
Старый 27.09.2014, 17:32   #21
sspy
главный злодей гофака
 
Аватар для sspy
 
Регистрация: 18.06.2007
Сообщений: 5,760
Бабло: $953848
По умолчанию

если в nginx заблочить 4к ip через map или deny, на работоспособность не повлияет?
__________________
sspy вне форума