Предлагаю обсудить генерацию текста - Форум успешных вебмастеров - GoFuckBiz.com
 
 
Форум успешных вебмастеров - GoFuckBiz.com

  Форум успешных вебмастеров - GoFuckBiz.com > Бизнес-решения > Скрипты, программы и технические решения
Дата
USD/RUB93.4409
BTC/USD63172.6332
Скрипты, программы и технические решения Обсуждаем скрипты, программы и новые технологии.

Закрытая тема
Опции темы Опции просмотра
Старый 09.11.2014, 22:01   #1
alter13
Отмороженый Сибиряк
 
Аватар для alter13
 
Регистрация: 09.09.2014
Сообщений: 1,843
Бабло: $250100
Lightbulb Предлагаю обсудить генерацию текста

Приветствую всех!

Предлагаю обсудить генерацию читабельного текста.

Был опыт генерить по паттернам. И это давало самый лучший результат. Но, как говорится, есть нюансы: узкая тематика текста, "конечное" разнообразие и нудная работа руками с вычиткой для хорошей состыковки паттернов.
По паттернам хорошо генерить тексты на основе таблиц, типа характеристик какой-нибудь бытовой техники или автомобилей - получаются неплохие читабельные тексты для людей.

Какие еще есть перспективные варианты?
Как облегчить работу с паттернами и увеличить вариативность?

alter13 вне форума  
Старый 09.11.2014, 23:04   #2
klim
Senior Member
 
Аватар для klim
 
Регистрация: 12.01.2009
Сообщений: 532
Бабло: $108200
По умолчанию

>>Предлагаю обсудить генерацию читабельного текста

Слово "генерация" напрямую связано со словом "массовость". За свою практику видел только один дорген, способный на супер примитивнейший морфологический анализ для генерации предложений - DMI 2.
P.S. Текст - самый невостребованный контент у гугла на сегодняшний день.
klim вне форума  
Старый 09.11.2014, 23:05   #3
sspy
главный злодей гофака
 
Аватар для sspy
 
Регистрация: 18.06.2007
Сообщений: 5,760
Бабло: $953648
По умолчанию

Цитата:
Сообщение от klim Посмотреть сообщение
Слово "генерация" напрямую связано со словом "массовость". За свою практику видел только один дорген, способный на супер примитивнейший морфологический анализ для генерации предложений - DMI 2.
алгоритм генерации текста ДМИ 2 был самый чёткий, но увы, гугл его не сильно любил.
__________________
sspy вне форума  
Старый 09.11.2014, 23:26   #4
alead
Senior Member
 
Регистрация: 04.08.2008
Сообщений: 654
Бабло: $115197
По умолчанию

Цитата:
Сообщение от sspy Посмотреть сообщение
алгоритм генерации текста ДМИ 2 был самый чёткий, но увы, гугл его не сильно любил.
А какой алгоритм генерации он любит сейчас?
alead вне форума  
Старый 09.11.2014, 23:28   #5
digg
$400
 
Аватар для digg
 
Регистрация: 17.05.2009
Сообщений: 13,953
Бабло: $1895870
Отправить сообщение для digg с помощью ICQ
По умолчанию

Цитата:
Сообщение от klim Посмотреть сообщение
P.S. Текст - самый невостребованный контент у гугла на сегодняшний день.
а что просто столбики? ))
digg вне форума  
Старый 10.11.2014, 02:02   #6
LazyBoar
Member
 
Аватар для LazyBoar
 
Регистрация: 30.11.2010
Сообщений: 33
Бабло: $9400
По умолчанию

Цитата:
Сообщение от klim Посмотреть сообщение
>>Предлагаю обсудить генерацию читабельного текста
Текст - самый невостребованный контент у гугла на сегодняшний день.
С чего ты взял?
LazyBoar вне форума  
Старый 10.11.2014, 05:01   #7
Wonder
интересующийся
 
Аватар для Wonder
 
Регистрация: 16.06.2009
Сообщений: 784
Бабло: $153126
По умолчанию

Возможно ошибаюсь, но вроде chesser одно время делал крутой генератор текста на основе нейронной сети, но че т давно не слышно ничего по теме.
Wonder вне форума  
Старый 10.11.2014, 16:19   #8
klim
Senior Member
 
Аватар для klim
 
Регистрация: 12.01.2009
Сообщений: 532
Бабло: $108200
По умолчанию

Цитата:
Сообщение от digg Посмотреть сообщение
а что просто столбики? ))
С картинками и self hosted видосами в разы проще. Но согласен, и столбики катят - что тут спорить ).
klim вне форума  
Старый 10.11.2014, 16:28   #9
alter13
Отмороженый Сибиряк
 
Аватар для alter13
 
Регистрация: 09.09.2014
Сообщений: 1,843
Бабло: $250100
ТС -->
автор темы ТС По умолчанию

Цитата:
Текст - самый невостребованный контент у гугла на сегодняшний день.
Мы сейчас не говорим о востребованности текста у какого-то конкретного поисковика. Речь идет о генерации "человеческого" текста. Пусть он будет прост как речь школьника неотягощенного словарным запасом, или напоминает лекции препода по философии в которых и его коллеги нихера не поймут.
alter13 вне форума  
Старый 10.11.2014, 16:44   #10
Sultan
Шучу на половину
 
Аватар для Sultan
 
Регистрация: 23.01.2011
Сообщений: 5,790
Бабло: $1159000
По умолчанию

т.е. текст должен быть для людей? зачем?
для роботов все уже давно придумано это синонимайз, подстановки. в основе правильные ключи и спам, если с вч не получается бери нч.
до сих пор с самых истоков, успешно работает парсинг 1-2 метров текста, разбивка предложения на две части левые и правые, с последующим рандомным набором с включением ключей между левыми и правыми частями (с учетом использованных частей, чтоб исключить частых включений некоторых кусков)
Sultan вне форума