|
| Дата |
|
USD/RUB | 88.6852 | BTC/USD | 67911.4433 |
|
|
|
Скрипты, программы и технические решения Обсуждаем скрипты, программы и новые технологии. |
09.11.2014, 22:01
|
Start Post: Предлагаю обсудить генерацию текста
|
Отмороженый Сибиряк
Регистрация: 09.09.2014
Сообщений: 1,843
Бабло: $250100
|
Приветствую всех!
Предлагаю обсудить генерацию читабельного текста.
Был опыт генерить по паттернам. И это давало самый лучший результат. Но, как говорится, есть нюансы: узкая тематика текста, "конечное" разнообразие и нудная работа руками с вычиткой для хорошей состыковки паттернов.
По паттернам хорошо генерить тексты на основе таблиц, типа характеристик какой-нибудь бытовой техники или автомобилей - получаются неплохие читабельные тексты для людей.
Какие еще есть перспективные варианты?
Как облегчить работу с паттернами и увеличить вариативность?
|
|
|
10.11.2014, 17:48
|
#12
|
Senior Member
Регистрация: 27.09.2013
Сообщений: 697
Бабло: $101520
|
Смотрите в сторону контекстно-свободных грамматик. Это не универсальный алгоритм, и очень трудоемкий, но он позводяет генерировать правильные с точки зрения грамматички и даже в неокторой степени осмысленные тексты на заданную тематику.
что-то вроде http://pdos.csail.mit.edu/scigen/
|
|
|
10.11.2014, 20:16
|
#13
|
Senior Member
Регистрация: 12.01.2009
Сообщений: 532
Бабло: $108200
|
Цитата:
Сообщение от editeur
|
Оно, к сожалению, только научные рефераты генерит с целью троллинга ленивых и недобросовестных рецензеров, несколько лет назад натыкался на этот софт.
Вот ещё один набор для генерации осмысленного текста: http://www.fb10.uni-bremen.de/anglis...ml/README.html
Для черно-серых ресурсов, живущих по полгода - излишний изъёб. Как заметили выше - и столбики сойдут.
|
|
|
10.11.2014, 20:52
|
#14
|
Senior Member
Регистрация: 27.09.2013
Сообщений: 697
Бабло: $101520
|
Цитата:
Сообщение от klim
Оно, к сожалению, только научные рефераты генерит с целью троллинга ленивых и недобросовестных рецензеров, несколько лет назад натыкался на этот софт.
Вот ещё один набор для генерации осмысленного текста: http://www.fb10.uni-bremen.de/anglis...ml/README.html
Для черно-серых ресурсов, живущих по полгода - излишний изъёб. Как заметили выше - и столбики сойдут.
|
Я не конкретно про этот генератор, а про принцип - там строится контекстно-свободная грамматика, на основе которой делается текст. Грамматику можно написать самому под свою нишу. Это гемор, да.
|
|
|
12.11.2014, 12:47
|
#15
|
автоматизирую интернеты
Регистрация: 05.07.2009
Адрес: chesser.ru
Сообщений: 3,362
Бабло: $470735
|
текст - это всего лишь одежда на тело, а тело - это смысл(знания).
Если тело(смысл) уже есть, то одеть на него другую одежду(текст) не такая уж и большая проблема. С одежкой можно экспериментировать до бесконечности.
Вам чего надо:
1) генерировать сам смысл?
2) или генерировать тексты на основе имеющегося смысла?
|
|
|
12.11.2014, 14:37
|
#16
|
$400
Регистрация: 17.05.2009
Сообщений: 14,049
Бабло: $1905790
|
самый релевантный генератор текстов под гугл - и есть сам гугл )) даже бывает есть что почитать по теме )
|
|
|
12.11.2014, 14:50
|
#17
|
автоматизирую интернеты
Регистрация: 05.07.2009
Адрес: chesser.ru
Сообщений: 3,362
Бабло: $470735
|
Цитата:
Сообщение от digg
самый релевантный генератор текстов под гугл - и есть сам гугл
|
в топике предлагается обсуждать читаемый текст, а не релевантный чему-либо
|
|
|
12.11.2014, 15:05
|
#18
|
автоматизирую интернеты
Регистрация: 05.07.2009
Адрес: chesser.ru
Сообщений: 3,362
Бабло: $470735
|
что касается гугла, то он без проблем способен генерировать любые тексты на основе имеющейся у него онтологической модели. А сами онтологии он "парсит" из наших(человеческих) текстов и это один из сложнейших и высоко-технологичных процессов, можно сказать киллер-фича
|
|
|
12.11.2014, 15:32
|
#19
|
Юниор
Регистрация: 26.12.2010
Сообщений: 22
Бабло: $3950
|
а если гуглу отдавать генеренный нечитабельный, а пользователю через js менять на читабельный, релевантный, заранее спаршенный. гуглу - уникальность, пользователю текст по теме. и поведенческие в порядке
|
|
|
12.11.2014, 15:59
|
#20
|
автоматизирую интернеты
Регистрация: 05.07.2009
Адрес: chesser.ru
Сообщений: 3,362
Бабло: $470735
|
Цитата:
Сообщение от Erix
а если гуглу отдавать генеренный нечитабельный, а пользователю через js менять на читабельный, релевантный, заранее спаршенный. гуглу - уникальность, пользователю текст по теме. и поведенческие в порядке
|
1) это называется клоакинг
2) гугл все равно твой спрятанный текст прочитает. Например, виджеты-комментов он парсит без проблем
3) будут ли санкции - не знаю, по крайне мере, прогноз на будущее у такого подхода не очень привлекательный.
|
|
|
13.11.2014, 21:47
|
#21
|
Senior Member
Регистрация: 15.03.2008
Сообщений: 125
Бабло: $24525
|
Цитата:
Сообщение от sspy
алгоритм генерации текста ДМИ 2 был самый чёткий, но увы, гугл его не сильно любил.
|
Весьма спорно. У меня жрал и еще просил)
|
|
|
|