Цепи маркова - Форум успешных вебмастеров - GoFuckBiz.com
 
 
Форум успешных вебмастеров - GoFuckBiz.com

  Форум успешных вебмастеров - GoFuckBiz.com > Бизнес-решения > Поисковые системы
Дата
USD/RUB93.7196
BTC/USD65402.9305
Поисковые системы Поисковая оптимизация под Google, Yahoo, Bing и т.д.

Закрытая тема
Опции темы Опции просмотра
Старый 14.04.2010, 22:09   #1
HQ Life
Senior Member
 
Аватар для HQ Life
 
Регистрация: 22.08.2007
Сообщений: 1,026
Бабло: $100880
По умолчанию Цепи маркова

Есть у кого-нибудь наблюдения, как сейчас гугл относится к генерированному тексту с помощью цепей маркова? Хочу сделать сетку из доров, а из генераторов в наличии только марков. Побанит всё нах?
HQ Life вне форума  
Старый 14.04.2010, 23:39   #2
Final Fantasy
private.
 
Аватар для Final Fantasy
 
Регистрация: 30.04.2008
Сообщений: 3,864
Бабло: $462680
По умолчанию

если контент не расценивать как основополагающее, то не побанит
Final Fantasy вне форума  
Старый 14.04.2010, 23:47   #3
chesser
автоматизирую интернеты
 
Аватар для chesser
 
Регистрация: 05.07.2009
Адрес: chesser.ru
Сообщений: 3,362
Бабло: $470735
По умолчанию

по моим наблюдениям, сам принцип Маркова имеет право на жизнь. Только его нужно грамотно реализовать и комбинировать с других технологиями/фичами.
Хинт: цепи Маркова - это статистический метод генерации, т.е. качество текста будет зависеть от кол-ва и качества собранной статистики
__________________
USA и NL серверы и VPS | wiki | блог | Drupal | NginxТДС
Ave, Google, morituri te salutant! © chesser
chesser вне форума  
Старый 14.04.2010, 23:53   #4
imgreen
Senior Member
 
Аватар для imgreen
 
Регистрация: 15.11.2008
Сообщений: 13,228
Бабло: $247845631
По умолчанию

Цитата:
Хинт: цепи Маркова - это статистический метод генерации, т.е. качество текста будет зависеть от кол-ва и качества собранной статистики
И от качества реализации алгоритма))
Иногда то что называют марковым не совсем марков даже.
imgreen вне форума  
Старый 15.04.2010, 00:38   #5
chesser
автоматизирую интернеты
 
Аватар для chesser
 
Регистрация: 05.07.2009
Адрес: chesser.ru
Сообщений: 3,362
Бабло: $470735
По умолчанию

Цитата:
Сообщение от imgreen Посмотреть сообщение
И от качества реализации алгоритма))
Иногда то что называют марковым не совсем марков даже.
ага, я прям по википедии делал
свой генератор уже третий год совершенствую не спеша.
Рекорд по сбору и анализу статистики: скрипт без перерыва проработал 2,5 месяца на сервере, правда сервер слабенький был, но тем не менее.
Зато после, на основе собранной статистики генерировались чудеснейшие тексты, которые полюбились гуглу.
Правда яндекс их все равно банит, терпит около месяца и в бан, но врят ли из-за текста.
еще, я сам не доказывал, но мне почему-то так думается, что чтобы распознать текст на Марковских цепях ресурсов нужно на 1-2-N порядка больше, чем для его генерации.
Еще одно неоспоримое преимущество статистики перед другими способами - это универсальность цепей Маркова для разных языков - хоть немецкий, хоть французский, правда на счет китайского я не в курсе как оно там у них
__________________
USA и NL серверы и VPS | wiki | блог | Drupal | NginxТДС
Ave, Google, morituri te salutant! © chesser
chesser вне форума  
Старый 15.04.2010, 01:25   #6
imgreen
Senior Member
 
Аватар для imgreen
 
Регистрация: 15.11.2008
Сообщений: 13,228
Бабло: $247845631
По умолчанию

Но есть и большой минус - надо текстов прорву, высококачественных и тематических.
imgreen вне форума  
Старый 15.04.2010, 21:17   #7
maximus12
Senior Member
 
Аватар для maximus12
 
Регистрация: 11.08.2008
Сообщений: 667
Бабло: $125015
По умолчанию

вот только что провёл тест. делал карты спама. были замешаны ссылки в текст. плюс ещё куча ссылок под текстом. соотношение текста и ссылок получилось 1 к 1 примерно (случайно вышло так, а переделывать стало лень).
генерация была или марковым или стандартным генератором агресса, уже не помню. залито всё было на слабенькие бонусники.
в итоге все карты в индексе. не выхватили фильтр по инурл. по трёхсловникам на первом месте из 8 лямов. тупо спам апостером. тематика не фарма, не адалт, не бизнес.
в который раз убеждаюсь, что качество контента имеет одну из самых малых ролей в ранжировании. если не самую малую
maximus12 вне форума  
Старый 15.04.2010, 23:06   #8
TerVer
Senior Member
 
Аватар для TerVer
 
Регистрация: 14.09.2007
Сообщений: 740
Бабло: $73721
По умолчанию

речь обычно не о ранжировании, а о фильтрах
Цитата:
Сообщение от chesser Посмотреть сообщение
....Зато после, на основе собранной статистики генерировались чудеснейшие тексты, которые полюбились гуглу....
кто-то умно говорил, что с помощью статы гугл анализирует текст на нагенереность. Хотя дмишниые тоже вон по три месяца висят.
TerVer вне форума  
Старый 15.04.2010, 23:35   #9
HQ Life
Senior Member
 
Аватар для HQ Life
 
Регистрация: 22.08.2007
Сообщений: 1,026
Бабло: $100880
ТС -->
автор темы ТС По умолчанию

maximus12, Карты на бонусниках, как и доры, гугл может сожрать и без текста вовсе. Тут другая задача всё-таки. Сетка.
HQ Life вне форума  
Старый 16.04.2010, 06:55   #10
chesser
автоматизирую интернеты
 
Аватар для chesser
 
Регистрация: 05.07.2009
Адрес: chesser.ru
Сообщений: 3,362
Бабло: $470735
По умолчанию

Цитата:
Сообщение от TerVer Посмотреть сообщение
кто-то умно говорил, что с помощью статы гугл анализирует текст на нагенереность. Хотя дмишниые тоже вон по три месяца висят.
в МГУ тоже говорят что можно распознать:
http://www.cir.ru/docs/ips/publicati...cdl_markov.pdf

они все умные, им виднее,
только доры у меня нормально лезут и держаться, аж домены забываю продлевать

ps доры не адалт, и не фарма, ПС - гугл ру и бурж
__________________
USA и NL серверы и VPS | wiki | блог | Drupal | NginxТДС
Ave, Google, morituri te salutant! © chesser
chesser вне форума