|
| Дата |
|
USD/RUB | 90.2486 | BTC/USD | 69166.7747 |
|
|
|
Скрипты, программы и технические решения Обсуждаем скрипты, программы и новые технологии. |
16.02.2020, 12:26
|
Start Post: Воруют контент с сайтов
|
Senior Member
Регистрация: 23.01.2010
Сообщений: 290
Бабло: $109770
|
всем привет. не успевает мой сайт проиндексироваться свежезапущенный а с него уже контент на всякие доры спарсили украли. можно ли тут как то защищаться? кто что подсказать может?
заранее спасибо всем
|
|
|
17.02.2020, 16:04
|
#12
|
Хостинг, серверы, домены
Регистрация: 04.02.2020
Сообщений: 27
Бабло: $2260
|
Защитить контент можно.
1. Проанализируйте access логи сайта. Узнайте кто парсит сайты: user-agent / или ИП-подсети.
2. Заблокируйте их.
Блокировок есть множество, необходимо знать конкретную ситуацию у вас, чтобы порекомендовать удобную блокировку.
Чтобы дать более точный ответ, нужна дополнительная информация:
- Название сайта
- Нашли ли вы парсеров? Тогда их user-agent / ИП-подсети.
- На чем работает сайт? (пример: php-fpm/apache)
- Какой контент парсится (товары, картинки, текст и др)
Кроме блокировок, в Яндекс.Вебмастер есть возможность загружать контент до публикации в сеть.
__________________
foxcloud.net
Домены, хостинг, серверы, IaaS в США, Европе, России.
|
|
|
17.02.2020, 16:29
|
#13
|
сыроед
Регистрация: 01.10.2015
Сообщений: 15,877
Бабло: $1862895
|
если они уже спиздили контент, то поздно их блочить
|
|
|
17.02.2020, 17:14
|
#14
|
Senior Member
Регистрация: 20.09.2009
Сообщений: 5,543
Бабло: $719060
|
ещё можно пересыпать свой контент текстовыми ссылками на свой сайт. Разными копирайтами, и гипертекстовыми ссылками на первоисточник. Но это мало поможет в воровстве.
|
|
|
17.02.2020, 18:52
|
#15
|
Senior Member
Регистрация: 03.10.2010
Сообщений: 1,712
Бабло: $296955
|
Цитата:
Сообщение от Pla
Даст не даст... Из разряда погадаем?
|
ну если ты диванный эксперд - можешь погадать. А я тебе из своей практики говорю. Нифига тебе это не даст.
Цитата:
Сообщение от arle9
1. Проанализируйте access логи сайта. Узнайте кто парсит сайты: user-agent / или ИП-подсети.
2. Заблокируйте их.
|
а если грабер юзает кучу проксей? как тут лочить будешь?
Цитата:
Сообщение от lawyer
ещё можно пересыпать свой контент текстовыми ссылками на свой сайт. Разными копирайтами, и гипертекстовыми ссылками на первоисточник. Но это мало поможет в воровстве.
|
ссылки легко вырезаются.
|
|
|
17.02.2020, 20:43
|
#16
|
$400
Регистрация: 17.05.2009
Сообщений: 14,034
Бабло: $1904260
|
вычисли через сколько заходит грабер и выкладывай ему пустую стр или бредотекст, а через время обновляй страницу с правильным контентом
|
|
|
17.02.2020, 21:05
|
#17
|
Senior Member
Регистрация: 20.09.2009
Сообщений: 5,543
Бабло: $719060
|
Цитата:
Сообщение от Morgul
Цитата:
Сообщение от Pla
Даст не даст... Из разряда погадаем?
|
ну если ты диванный эксперд - можешь погадать. А я тебе из своей практики говорю. Нифига тебе это не даст.
Цитата:
Сообщение от arle9
1. Проанализируйте access логи сайта. Узнайте кто парсит сайты: user-agent / или ИП-подсети.
2. Заблокируйте их.
|
а если грабер юзает кучу проксей? как тут лочить будешь?
Цитата:
Сообщение от lawyer
ещё можно пересыпать свой контент текстовыми ссылками на свой сайт. Разными копирайтами, и гипертекстовыми ссылками на первоисточник. Но это мало поможет в воровстве.
|
ссылки легко вырезаются.
|
Да борьба за контент, на данный момент(из того что знаю), это борьба с ветряными мельницами. Сил уйдёт много а толку от действий практически никаких.
|
|
|
17.02.2020, 21:28
|
#18
|
Senior Member
Регистрация: 03.10.2010
Сообщений: 1,712
Бабло: $296955
|
Цитата:
Сообщение от lawyer
Цитата:
Сообщение от Morgul
Цитата:
Сообщение от Pla
Даст не даст... Из разряда погадаем?
|
ну если ты диванный эксперд - можешь погадать. А я тебе из своей практики говорю. Нифига тебе это не даст.
Цитата:
Сообщение от arle9
1. Проанализируйте access логи сайта. Узнайте кто парсит сайты: user-agent / или ИП-подсети.
2. Заблокируйте их.
|
а если грабер юзает кучу проксей? как тут лочить будешь?
Цитата:
Сообщение от lawyer
ещё можно пересыпать свой контент текстовыми ссылками на свой сайт. Разными копирайтами, и гипертекстовыми ссылками на первоисточник. Но это мало поможет в воровстве.
|
ссылки легко вырезаются.
|
Да борьба за контент, на данный момент(из того что знаю), это борьба с ветряными мельницами. Сил уйдёт много а толку от действий практически никаких.
|
согласен с тобой. Тут скорее важно прокачивать сайт так, чтобы всегда перебивать весом те площадки куда будут тексты выкладываться. Ключевые страницы которые проседают из-за пиздинга дешевле просто отрерайтить. Возможно, cloudflare может слегка помочь, если там совсем агрессивные боты. По идее должен им мешать.
Вот еще вариант придумал на ходу - дать доступ только гуглу на какое-то время. Один фиг трафа с нуля не будет (если это не доры и не мега нч). Но это уже клоакинг и его тоже надо делать аккуратно )
|
|
|
18.02.2020, 01:40
|
#19
|
Yeah Bitch! Magnets!
Регистрация: 02.12.2010
Сообщений: 619
Бабло: $93034
|
А что если использовать программный подход?
Например: на стороне сервера генерируем контент, тянем этот контент на нашу целевую страницу аяксом через яваскрипт, node.js с какими-то уникальными идентификаторами/алгоритмами, и отображаем на странице для ботов и юзеров сайта. То есть чтобы усложнить или сделать невозможным парсинг сайта?
Или в плане SEO такое не прокатит, не будут выдержаны стандарты разметки страницы, SEO оптимизации?
__________________
Будь как Ной — греби, не ной!
Последний раз редактировалось Scofield; 18.02.2020 в 01:47.
|
|
|
18.02.2020, 01:40
|
#20
|
Senior Member
Регистрация: 25.09.2017
Сообщений: 1,011
Бабло: $115260
|
Цитата:
Сообщение от Morgul
Вот еще вариант придумал на ходу - дать доступ только гуглу на какое-то время. Один фиг трафа с нуля не будет (если это не доры и не мега нч). Но это уже клоакинг и его тоже надо делать аккуратно )
|
Тогда лучше так. Не публиковать ссылки на новый контент. А сначала передавать ссылки на новый контент через xml карту сайта. Либо в webmaster есть функция добавить ссылку.
Вариант отследить по логам, не факт, может там прокси юзаются. И это ничего не даст.
|
|
|
18.02.2020, 02:59
|
#21
|
сыроед
Регистрация: 01.10.2015
Сообщений: 15,877
Бабло: $1862895
|
Цитата:
Сообщение от Scofield
А что если использовать программный подход?
Например: на стороне сервера генерируем контент, тянем этот контент на нашу целевую страницу аяксом через яваскрипт, node.js с какими-то уникальными идентификаторами/алгоритмами, и отображаем на странице для ботов и юзеров сайта. То есть чтобы усложнить или сделать невозможным парсинг сайта?
Или в плане SEO такое не прокатит, не будут выдержаны стандарты разметки страницы, SEO оптимизации?
|
клоакинг и получится
|
|
|
|