Предлагаю обсудить генерацию текста - Форум успешных вебмастеров - GoFuckBiz.com - Страница 2
 
 
Форум успешных вебмастеров - GoFuckBiz.com

  Форум успешных вебмастеров - GoFuckBiz.com > Бизнес-решения > Скрипты, программы и технические решения
Дата
USD/RUB90.1887
BTC/USD67841.8262
Скрипты, программы и технические решения Обсуждаем скрипты, программы и новые технологии.

Закрытая тема
Опции темы Опции просмотра
Старый 09.11.2014, 22:01
Start Post: Предлагаю обсудить генерацию текста 
  #11
alter13
Отмороженый Сибиряк
 
Аватар для alter13
 
Регистрация: 09.09.2014
Сообщений: 1,843
Бабло: $250100
Lightbulb

Приветствую всех!

Предлагаю обсудить генерацию читабельного текста.

Был опыт генерить по паттернам. И это давало самый лучший результат. Но, как говорится, есть нюансы: узкая тематика текста, "конечное" разнообразие и нудная работа руками с вычиткой для хорошей состыковки паттернов.
По паттернам хорошо генерить тексты на основе таблиц, типа характеристик какой-нибудь бытовой техники или автомобилей - получаются неплохие читабельные тексты для людей.

Какие еще есть перспективные варианты?
Как облегчить работу с паттернами и увеличить вариативность?

alter13 вне форума  
Старый 10.11.2014, 17:48   #12
editeur
Senior Member
 
Регистрация: 27.09.2013
Сообщений: 697
Бабло: $101520
По умолчанию

Смотрите в сторону контекстно-свободных грамматик. Это не универсальный алгоритм, и очень трудоемкий, но он позводяет генерировать правильные с точки зрения грамматички и даже в неокторой степени осмысленные тексты на заданную тематику.

что-то вроде http://pdos.csail.mit.edu/scigen/
editeur вне форума  
Старый 10.11.2014, 20:16   #13
klim
Senior Member
 
Аватар для klim
 
Регистрация: 12.01.2009
Сообщений: 532
Бабло: $108200
По умолчанию

Цитата:
Сообщение от editeur Посмотреть сообщение
что-то вроде http://pdos.csail.mit.edu/scigen/
Оно, к сожалению, только научные рефераты генерит с целью троллинга ленивых и недобросовестных рецензеров, несколько лет назад натыкался на этот софт.
Вот ещё один набор для генерации осмысленного текста: http://www.fb10.uni-bremen.de/anglis...ml/README.html
Для черно-серых ресурсов, живущих по полгода - излишний изъёб. Как заметили выше - и столбики сойдут.
klim вне форума  
Старый 10.11.2014, 20:52   #14
editeur
Senior Member
 
Регистрация: 27.09.2013
Сообщений: 697
Бабло: $101520
По умолчанию

Цитата:
Сообщение от klim Посмотреть сообщение
Оно, к сожалению, только научные рефераты генерит с целью троллинга ленивых и недобросовестных рецензеров, несколько лет назад натыкался на этот софт.
Вот ещё один набор для генерации осмысленного текста: http://www.fb10.uni-bremen.de/anglis...ml/README.html
Для черно-серых ресурсов, живущих по полгода - излишний изъёб. Как заметили выше - и столбики сойдут.
Я не конкретно про этот генератор, а про принцип - там строится контекстно-свободная грамматика, на основе которой делается текст. Грамматику можно написать самому под свою нишу. Это гемор, да.
editeur вне форума  
Старый 12.11.2014, 12:47   #15
chesser
автоматизирую интернеты
 
Аватар для chesser
 
Регистрация: 05.07.2009
Адрес: chesser.ru
Сообщений: 3,362
Бабло: $470735
По умолчанию

текст - это всего лишь одежда на тело, а тело - это смысл(знания).

Если тело(смысл) уже есть, то одеть на него другую одежду(текст) не такая уж и большая проблема. С одежкой можно экспериментировать до бесконечности.

Вам чего надо:
1) генерировать сам смысл?
2) или генерировать тексты на основе имеющегося смысла?
__________________
USA и NL серверы и VPS | wiki | блог | Drupal | NginxТДС
Ave, Google, morituri te salutant! © chesser
chesser вне форума  
Старый 12.11.2014, 14:37   #16
digg
$400
 
Аватар для digg
 
Регистрация: 17.05.2009
Сообщений: 14,031
Бабло: $1903940
Отправить сообщение для digg с помощью ICQ
По умолчанию

самый релевантный генератор текстов под гугл - и есть сам гугл )) даже бывает есть что почитать по теме )
digg вне форума  
Старый 12.11.2014, 14:50   #17
chesser
автоматизирую интернеты
 
Аватар для chesser
 
Регистрация: 05.07.2009
Адрес: chesser.ru
Сообщений: 3,362
Бабло: $470735
По умолчанию

Цитата:
Сообщение от digg
самый релевантный генератор текстов под гугл - и есть сам гугл
в топике предлагается обсуждать читаемый текст, а не релевантный чему-либо
__________________
USA и NL серверы и VPS | wiki | блог | Drupal | NginxТДС
Ave, Google, morituri te salutant! © chesser
chesser вне форума  
Старый 12.11.2014, 15:05   #18
chesser
автоматизирую интернеты
 
Аватар для chesser
 
Регистрация: 05.07.2009
Адрес: chesser.ru
Сообщений: 3,362
Бабло: $470735
По умолчанию

что касается гугла, то он без проблем способен генерировать любые тексты на основе имеющейся у него онтологической модели. А сами онтологии он "парсит" из наших(человеческих) текстов и это один из сложнейших и высоко-технологичных процессов, можно сказать киллер-фича
__________________
USA и NL серверы и VPS | wiki | блог | Drupal | NginxТДС
Ave, Google, morituri te salutant! © chesser
chesser вне форума  
Старый 12.11.2014, 15:32   #19
Erix
Юниор
 
Регистрация: 26.12.2010
Сообщений: 22
Бабло: $3950
По умолчанию

а если гуглу отдавать генеренный нечитабельный, а пользователю через js менять на читабельный, релевантный, заранее спаршенный. гуглу - уникальность, пользователю текст по теме. и поведенческие в порядке
Erix вне форума  
Старый 12.11.2014, 15:59   #20
chesser
автоматизирую интернеты
 
Аватар для chesser
 
Регистрация: 05.07.2009
Адрес: chesser.ru
Сообщений: 3,362
Бабло: $470735
По умолчанию

Цитата:
Сообщение от Erix
а если гуглу отдавать генеренный нечитабельный, а пользователю через js менять на читабельный, релевантный, заранее спаршенный. гуглу - уникальность, пользователю текст по теме. и поведенческие в порядке
1) это называется клоакинг
2) гугл все равно твой спрятанный текст прочитает. Например, виджеты-комментов он парсит без проблем
3) будут ли санкции - не знаю, по крайне мере, прогноз на будущее у такого подхода не очень привлекательный.
__________________
USA и NL серверы и VPS | wiki | блог | Drupal | NginxТДС
Ave, Google, morituri te salutant! © chesser
chesser вне форума  
Старый 13.11.2014, 21:47   #21
Kyzmit4
Senior Member
 
Аватар для Kyzmit4
 
Регистрация: 15.03.2008
Сообщений: 125
Бабло: $24525
По умолчанию

Цитата:
Сообщение от sspy Посмотреть сообщение
алгоритм генерации текста ДМИ 2 был самый чёткий, но увы, гугл его не сильно любил.
Весьма спорно. У меня жрал и еще просил)
Kyzmit4 вне форума  
Закрытая тема