фильтрация ботов - Форум успешных вебмастеров - GoFuckBiz.com
 
 
Форум успешных вебмастеров - GoFuckBiz.com

  Форум успешных вебмастеров - GoFuckBiz.com > Бизнес-решения > Скрипты, программы и технические решения
Дата
USD/RUB93.4409
BTC/USD66424.0446
Скрипты, программы и технические решения Обсуждаем скрипты, программы и новые технологии.

Закрытая тема
Опции темы Опции просмотра
Старый 31.01.2009, 12:06   #1
nwp52
Member
 
Аватар для nwp52
 
Регистрация: 30.07.2008
Сообщений: 77
Бабло: $13055
Отправить сообщение для nwp52 с помощью ICQ
По умолчанию фильтрация ботов

всем привет. Подскажите по каким признакам можно отфильтровать ботов с тдс (самописная) то есть интересует вобще по каким признакам можно понять что это бот а не человек, просто мне кажется перебирать все юзерагенты ботов - это бред - наверняка есть что-то готовое. Может какая-то функция или класс, интересует решение на php.

p.s. капча не вариант т.к. не для всех типов трафа подходит
nwp52 вне форума  
Старый 31.01.2009, 13:40   #2
zlaya ssuka
ChefJavaProgrammierer
 
Аватар для zlaya ssuka
 
Регистрация: 05.04.2007
Сообщений: 1,165
Бабло: $15090
Отправить сообщение для zlaya ssuka с помощью ICQ
По умолчанию

1. юзерагентов у браузеров сильно меньше, штук 5.
2. хитроботов ты по юзерагенту не снесешь, нужно вбивать сетки айпишек, которые банить
3. проверка на куки. (отдаешь куку, а на следующей страничке ее проверяешь)
4. акцепт, акцепт лэнг, акцепт енкодинг. У оперы вроде нет акцепт лэнга.

5. для совсем злых - браузеры отображают контент, даже если ответ не 200. то есть делаем ответ 404, а в теле странички пишем хтмл, с мета или яваскрипт редиректом. Я пока ботов не видел, которые адекватно такое проскакивают, браузеры _практически_ все.
zlaya ssuka вне форума  
Старый 31.01.2009, 13:53   #3
nwp52
Member
 
Аватар для nwp52
 
Регистрация: 30.07.2008
Сообщений: 77
Бабло: $13055
ТС -->
Отправить сообщение для nwp52 с помощью ICQ
автор темы ТС По умолчанию

Цитата:
Сообщение от zlaya ssuka Посмотреть сообщение
3. проверка на куки. (отдаешь куку, а на следующей страничке ее проверяешь)
4. акцепт, акцепт лэнг, акцепт енкодинг. У оперы вроде нет акцепт лэнга.

5. для совсем злых - браузеры отображают контент, даже если ответ не 200. то есть делаем ответ 404, а в теле странички пишем хтмл, с мета или яваскрипт редиректом. Я пока ботов не видел, которые адекватно такое проскакивают, браузеры _практически_ все.
3. А что ему в куку запихнуть чтобы потом проверить?
4. По поводу акцепт лэнг тоже не пойму как это вобще можно применить тут

а для "совсем злых" - это нормально наверно - попробую спасибо))
nwp52 вне форума  
Старый 03.02.2009, 00:45   #4
diehard
Ебланнед
 
Регистрация: 28.07.2008
Сообщений: 413
Бабло: $500
По умолчанию

Цитата:
Сообщение от nwp52 Посмотреть сообщение
3. А что ему в куку запихнуть чтобы потом проверить?
Пхай в куку ему хоть "tram-pam-pam", если это реальный браузер то он тебе так и ответит такой же кукой.
__________________
Отличный способ заработать деньги - www.rxcash.biz
Best Finance PPL $$$
Best PPC
diehard вне форума  
Старый 03.02.2009, 15:28   #5
JMen
учу php
 
Регистрация: 04.04.2008
Сообщений: 1,162
Бабло: $68290
По умолчанию

Чел слабо представляет тему раз спрашивает про функицю php по определению "бот / не бот".

Вообще, всё что злая привела - это не фильтрация ботов, это отсев краулеров. Для отсева краулеров вполне достаточно проверить юзер-агент на предмет содержания стоп-слов. Если хочется 100% - сделать js шифрованный редирект.

По теме фильтрации ботов я ничего не скажу, потому - что тогда придётся переписывать фильтры

Но если всё - таки ОЧЕНЬ ХОЧЕТСЯ и с руками всё в порядке - посмотрите как борется google, 7search и т.д. Думаю таких мер вполне хватит.
__________________
Подпись??? Не продам!
JMen вне форума