Воруют контент с сайтов - Форум успешных вебмастеров - GoFuckBiz.com - Страница 2
 
 
Форум успешных вебмастеров - GoFuckBiz.com

  Форум успешных вебмастеров - GoFuckBiz.com > Бизнес-решения > Скрипты, программы и технические решения
Дата
USD/RUB90.2486
BTC/USD69166.7747
Скрипты, программы и технические решения Обсуждаем скрипты, программы и новые технологии.

Закрытая тема
Опции темы Опции просмотра
Старый 16.02.2020, 12:26
Start Post: Воруют контент с сайтов 
  #11
NeTalant
Senior Member
 
Регистрация: 23.01.2010
Сообщений: 290
Бабло: $109770
По умолчанию

всем привет. не успевает мой сайт проиндексироваться свежезапущенный а с него уже контент на всякие доры спарсили украли. можно ли тут как то защищаться? кто что подсказать может?

заранее спасибо всем
NeTalant вне форума  
Старый 17.02.2020, 16:04   #12
arle9
Хостинг, серверы, домены
 
Регистрация: 04.02.2020
Сообщений: 27
Бабло: $2260
По умолчанию

Защитить контент можно.
1. Проанализируйте access логи сайта. Узнайте кто парсит сайты: user-agent / или ИП-подсети.
2. Заблокируйте их.
Блокировок есть множество, необходимо знать конкретную ситуацию у вас, чтобы порекомендовать удобную блокировку.

Чтобы дать более точный ответ, нужна дополнительная информация:
- Название сайта
- Нашли ли вы парсеров? Тогда их user-agent / ИП-подсети.
- На чем работает сайт? (пример: php-fpm/apache)
- Какой контент парсится (товары, картинки, текст и др)

Кроме блокировок, в Яндекс.Вебмастер есть возможность загружать контент до публикации в сеть.
__________________
foxcloud.net
Домены, хостинг, серверы, IaaS в США, Европе, России.
arle9 вне форума  
Старый 17.02.2020, 16:29   #13
веломан
сыроед
 
Аватар для веломан
 
Регистрация: 01.10.2015
Сообщений: 15,877
Бабло: $1862895
По умолчанию

если они уже спиздили контент, то поздно их блочить
веломан вне форума  
Старый 17.02.2020, 17:14   #14
lawyer
Senior Member
 
Аватар для lawyer
 
Регистрация: 20.09.2009
Сообщений: 5,543
Бабло: $719060
По умолчанию

ещё можно пересыпать свой контент текстовыми ссылками на свой сайт. Разными копирайтами, и гипертекстовыми ссылками на первоисточник. Но это мало поможет в воровстве.
lawyer вне форума  
Старый 17.02.2020, 18:52   #15
Morgul
Senior Member
 
Аватар для Morgul
 
Регистрация: 03.10.2010
Сообщений: 1,712
Бабло: $296955
По умолчанию

Цитата:
Сообщение от Pla
Даст не даст... Из разряда погадаем?
ну если ты диванный эксперд - можешь погадать. А я тебе из своей практики говорю. Нифига тебе это не даст.
Цитата:
Сообщение от arle9
1. Проанализируйте access логи сайта. Узнайте кто парсит сайты: user-agent / или ИП-подсети.
2. Заблокируйте их.
а если грабер юзает кучу проксей? как тут лочить будешь?
Цитата:
Сообщение от lawyer
ещё можно пересыпать свой контент текстовыми ссылками на свой сайт. Разными копирайтами, и гипертекстовыми ссылками на первоисточник. Но это мало поможет в воровстве.
ссылки легко вырезаются.
Morgul вне форума  
Старый 17.02.2020, 20:43   #16
digg
$400
 
Аватар для digg
 
Регистрация: 17.05.2009
Сообщений: 14,034
Бабло: $1904260
Отправить сообщение для digg с помощью ICQ
По умолчанию

вычисли через сколько заходит грабер и выкладывай ему пустую стр или бредотекст, а через время обновляй страницу с правильным контентом
digg вне форума  
Старый 17.02.2020, 21:05   #17
lawyer
Senior Member
 
Аватар для lawyer
 
Регистрация: 20.09.2009
Сообщений: 5,543
Бабло: $719060
По умолчанию

Цитата:
Сообщение от Morgul Посмотреть сообщение
Цитата:
Сообщение от Pla
Даст не даст... Из разряда погадаем?
ну если ты диванный эксперд - можешь погадать. А я тебе из своей практики говорю. Нифига тебе это не даст.
Цитата:
Сообщение от arle9
1. Проанализируйте access логи сайта. Узнайте кто парсит сайты: user-agent / или ИП-подсети.
2. Заблокируйте их.
а если грабер юзает кучу проксей? как тут лочить будешь?
Цитата:
Сообщение от lawyer
ещё можно пересыпать свой контент текстовыми ссылками на свой сайт. Разными копирайтами, и гипертекстовыми ссылками на первоисточник. Но это мало поможет в воровстве.
ссылки легко вырезаются.
Да борьба за контент, на данный момент(из того что знаю), это борьба с ветряными мельницами. Сил уйдёт много а толку от действий практически никаких.
lawyer вне форума  
Старый 17.02.2020, 21:28   #18
Morgul
Senior Member
 
Аватар для Morgul
 
Регистрация: 03.10.2010
Сообщений: 1,712
Бабло: $296955
По умолчанию

Цитата:
Сообщение от lawyer Посмотреть сообщение
Цитата:
Сообщение от Morgul Посмотреть сообщение
Цитата:
Сообщение от Pla
Даст не даст... Из разряда погадаем?
ну если ты диванный эксперд - можешь погадать. А я тебе из своей практики говорю. Нифига тебе это не даст.
Цитата:
Сообщение от arle9
1. Проанализируйте access логи сайта. Узнайте кто парсит сайты: user-agent / или ИП-подсети.
2. Заблокируйте их.
а если грабер юзает кучу проксей? как тут лочить будешь?
Цитата:
Сообщение от lawyer
ещё можно пересыпать свой контент текстовыми ссылками на свой сайт. Разными копирайтами, и гипертекстовыми ссылками на первоисточник. Но это мало поможет в воровстве.
ссылки легко вырезаются.
Да борьба за контент, на данный момент(из того что знаю), это борьба с ветряными мельницами. Сил уйдёт много а толку от действий практически никаких.
согласен с тобой. Тут скорее важно прокачивать сайт так, чтобы всегда перебивать весом те площадки куда будут тексты выкладываться. Ключевые страницы которые проседают из-за пиздинга дешевле просто отрерайтить. Возможно, cloudflare может слегка помочь, если там совсем агрессивные боты. По идее должен им мешать.

Вот еще вариант придумал на ходу - дать доступ только гуглу на какое-то время. Один фиг трафа с нуля не будет (если это не доры и не мега нч). Но это уже клоакинг и его тоже надо делать аккуратно )
Morgul вне форума  
Старый 18.02.2020, 01:40   #19
Scofield
Yeah Bitch! Magnets!
 
Аватар для Scofield
 
Регистрация: 02.12.2010
Сообщений: 619
Бабло: $93034
По умолчанию

А что если использовать программный подход?
Например: на стороне сервера генерируем контент, тянем этот контент на нашу целевую страницу аяксом через яваскрипт, node.js с какими-то уникальными идентификаторами/алгоритмами, и отображаем на странице для ботов и юзеров сайта. То есть чтобы усложнить или сделать невозможным парсинг сайта?
Или в плане SEO такое не прокатит, не будут выдержаны стандарты разметки страницы, SEO оптимизации?
__________________
Будь как Ной — греби, не ной!

Последний раз редактировалось Scofield; 18.02.2020 в 01:47.
Scofield вне форума  
Старый 18.02.2020, 01:40   #20
PowerVPS
Senior Member
 
Аватар для PowerVPS
 
Регистрация: 25.09.2017
Сообщений: 1,011
Бабло: $115260
По умолчанию

Цитата:
Сообщение от Morgul Посмотреть сообщение
Вот еще вариант придумал на ходу - дать доступ только гуглу на какое-то время. Один фиг трафа с нуля не будет (если это не доры и не мега нч). Но это уже клоакинг и его тоже надо делать аккуратно )
Тогда лучше так. Не публиковать ссылки на новый контент. А сначала передавать ссылки на новый контент через xml карту сайта. Либо в webmaster есть функция добавить ссылку.
Вариант отследить по логам, не факт, может там прокси юзаются. И это ничего не даст.
__________________
Linux, Windows VPS: 2 Core 5Gb RAM, 40GB SSD от 12$
Ryzen 5 3600X, 64GB RAM, 480GB SSD - 50$
PowerVPS вне форума  
Старый 18.02.2020, 02:59   #21
веломан
сыроед
 
Аватар для веломан
 
Регистрация: 01.10.2015
Сообщений: 15,877
Бабло: $1862895
По умолчанию

Цитата:
Сообщение от Scofield Посмотреть сообщение
А что если использовать программный подход?
Например: на стороне сервера генерируем контент, тянем этот контент на нашу целевую страницу аяксом через яваскрипт, node.js с какими-то уникальными идентификаторами/алгоритмами, и отображаем на странице для ботов и юзеров сайта. То есть чтобы усложнить или сделать невозможным парсинг сайта?
Или в плане SEO такое не прокатит, не будут выдержаны стандарты разметки страницы, SEO оптимизации?
клоакинг и получится
веломан вне форума