Как защититься от парсинга? Результат Панда. - Форум успешных вебмастеров - GoFuckBiz.com - Страница 5
 
 
Форум успешных вебмастеров - GoFuckBiz.com

  Форум успешных вебмастеров - GoFuckBiz.com > Бизнес-решения > Поисковые системы
Дата
USD/RUB90.2486
BTC/USD68366.4632
Поисковые системы Поисковая оптимизация под Google, Yahoo, Bing и т.д.

Закрытая тема
Опции темы Опции просмотра
Старый 24.09.2019, 14:37
Start Post: Как защититься от парсинга? Результат Панда. 
  #41
yuross
Senior Member
 
Регистрация: 26.09.2010
Сообщений: 226
Бабло: $68237
Question

Такая история:

Начали мои сайты потихоньку вылетать с топа (Google USA) по не понятным причинам (были проверены все возможные причины).

Начал анализировать оказывается, что повылетали отдельные страницы. Беру куски текста в кавычки и в Google. И как оказалось, тексты были размещены на десятках сайта и не на просто сайта на ломаных сайтах вордпресса. Мой оригинал внизу или даже в соплях, а весь лом выше. Показатели (траст) ломаных сайтов намного выше моих сайтов.

Дальше смотрю на этих ломах еще траффа на такие страницы валом.
На моих сайтах пострадали (полный вылет с топ 100) только те страницы которые были спарсены.

Проанализировал конкурентов их же также спарсили, и они ушли вниз. В топе остались только супер трасты – тексты, которых также растаскались то они не упали, а стали еще выше.

Так что выходит, берем аукционный трастовый домен и размещаем на нем ворованный текст с топа (слабого сайта который в топе) и получаем топ? (а тот сайт вылетает).

Подозреваю, что на мои сайты пришла постраничная Панда.

Что делать, как в хтаксесе отсекать эти парсеры? Или есть другие варианты?
yuross вне форума  
Старый 04.11.2019, 19:48   #42
number4
Senior Member
 
Регистрация: 23.04.2017
Адрес: Pattaya
Сообщений: 132
Бабло: $20600
По умолчанию

Цитата:
Сообщение от веломан Посмотреть сообщение
Цитата:
Сообщение от gumu Посмотреть сообщение
Но по опыту ещё с тех времён всегда использую схему "фронтэнд <-> бекэнд". Бэкенд - это хетзнер, на фронтэнде лояльный к абузам сервер.
т.е. без схемы из двух разнесённых серверов на хетцнер лучше не лезть?

не рекомендуется. у меня все хетцеровские сервера как бэкенды работают.
а всякие ГС лежат на фронтендах, которых не жалко вообще. Ну засуспендили аккаунт на хостинге, поднять выпавшие сайты в другом месте - дело получаса максимум.

Были у меня у абузы от хетцнера.. вообщем хетцнер банит сервер сразу, если приехала абуза на DMCA, ущерб ввиду пиратства или емейл спам. Если претензия к контенту или трояны/вирусы делают паразитный траф - не банят а дают сутки на разруливание.
number4 вне форума  
Старый 04.11.2019, 20:59   #43
Hector
hustle
 
Аватар для Hector
 
Регистрация: 02.05.2008
Адрес: 3d world
Сообщений: 12,890
Бабло: $1717315
Отправить сообщение для Hector с помощью Jabber
По умолчанию

Оставлю ссылку, вот чем защищаются обычно крупные сайты distilnetworks.com/block-bot-detection/
Hector вне форума