Прошу заценить со строны алгоритм генерации текста - Форум успешных вебмастеров - GoFuckBiz.com - Страница 2
 
 
Форум успешных вебмастеров - GoFuckBiz.com

  Форум успешных вебмастеров - GoFuckBiz.com > Бизнес-решения > Скрипты, программы и технические решения
Дата
USD/RUB88.4375
BTC/USD67754.6174
Скрипты, программы и технические решения Обсуждаем скрипты, программы и новые технологии.

Закрытая тема
Опции темы Опции просмотра
Старый 02.05.2012, 02:34
Start Post: Прошу заценить со строны алгоритм генерации текста 
  #11
sergeospb
коплю на феррари
 
Регистрация: 03.07.2008
Сообщений: 1,249
Бабло: $148195
По умолчанию

Собственно сам сабж, точнее не алгорит, результат его работы

Цитата:
He outgrew the jax rhys-davies hoffmanns was colleambally impounded in non-autoflowering xiii and squirmys budgeted the time-sharing lamuka, hamnkanalen kolaxs, to dump a finale sinorhizobium telemundo62 to cryopreserve erythrodermic over-think.
A clubhouse for the lophotrochozoa was transcended on scardinos 9, 2011 with tjapukai loctite, respectably a stoned torbanite for i light that you ieee me intertwined on lazarov 6, 2011.
As such, the robotically embrionic self-pollution is appraised as a untracked 114th.
Hammock psychoanalysis tuppeny that she would laparoscopically move to conform her cold-temperate storyteller.
Astronautical rg-ii is the similarly-packaged ds9 of a redeployment of isi non-clinically pursued pressuring to the blunder of and batphone between brethren or katrins of fdg: travers, farndon, verbandsgemeinde, whacker, or tittman.
In 1430, the four-step season co-formed across the five-stage hypercalciuria of massimianos.
Caracol handles culture-shocking of sleepers and natalies to marginalise shotguns for mcdermitt, supplanting having her unraveled by a consignment fold at a cyproheptadine calostigma.
Dinosaur-like coni camouflaged by placed-along grasp dashpoints squander steping with dual-vocalist sync dienophiles; the biosphere to moor vermin or guzzlers; the phosphorothioate to overstretch free-state luyas; and the iguanodon to nw with wrangle; and the aruzans to nsw with modellers of uar or mujahedin; amongst other resguardos postal horvitz, 2005; marburger forghettis, 2001.
His dinosaurus telmatobius of 4,590 biochemicals theorizes fiveworthy dopamine-mediated in justpressplay filtering duchesses in the g-2, behind only darrows kilbournes of konja with 5,259.
Decreeing ultra-nippon.
Цитата:
In 2006, the oniomania dogged 800,000 anthologies to terrorize an pressure-demand-type chonkyfire tbarta to customise stratiotes to completed-suicide kleptones.
In the 1997 writ that corresponded caishi nutrilite as belays jaco, postcards busted a 16-bit internecine of the kamuning, guaranteeing mesozoic blindfolds in cusp to claim the godshall, which sebastianelli komle fleer sexed to extol the defense-funded prebendaries and lorres that realise the okeefe blumes chun-li.
Carbanions of spokes dancing of the ballot were redubbed to crazy-crazy plumbers in nalla of his boreid, accurately folksongs nhc of the decurion was incoincidentally melancholically overexperienced on maddaford and the country-and pallidotomy was heatedly gunshot for mhpg hierophany.
The tenering is requited over what potentially was a biometric oxotremorine.
She then disapproves, wonderworking her xna.
The most sausage-grinding 16-km is as a lagged toob of 3-n or gynt.
Heleioporus sign-on, owner, was an middle-men at kandorian pararosaniline.
One of the paper-denominated delilahs of this c-47 was theorise all five rowlandsons of the fawkner of cabrerana under one bio-nanotechnology for the sophias lifell.
Lechers sids, decreased by the seductiveness of dreamtime and fanac clovers, never throng to rejoin filmstrips, but unklesounds hopbacks, reclaimed by santos and mardasdaughter chives, do not deflate great-great-granduncle champollions whole-heartedly.
South-american nomination steamboat x-chrom kungmincitizen brangelina med a beek sanh in cathexis in xia 2010 and swabbed the superdistortion illife kupfers in samosata 2011.

Текст с точки зрения морфологии, синтаксиса и т.д. верный?
Во вложении текст из 1000 предложений.
Вложения
Тип файла: zip res.zip (74.7 Кб, 9 просмотров)

Последний раз редактировалось sergeospb; 02.05.2012 в 02:46.
sergeospb вне форума  
Старый 03.05.2012, 09:48   #12
Saymon
Member
 
Аватар для Saymon
 
Регистрация: 06.01.2009
Сообщений: 45
Бабло: $8450
По умолчанию

P.S. Я тут ни кого обидеть не хотел) Просто с определенного момента у меня такое отношение к таким вещам. А ваще давай алго - попробуем покритиковать конструктивно
Saymon вне форума  
Старый 03.05.2012, 10:19   #13
sergeospb
коплю на феррари
 
Регистрация: 03.07.2008
Сообщений: 1,249
Бабло: $148195
ТС -->
автор темы ТС По умолчанию

Цитата:
Сообщение от Saymon Посмотреть сообщение
Недавно был топег на счет нового алго гугла, так вот там Sheikh выразился просто фдисятку. ИМХО те кто это еще не осознал будут клепать алгоритмы, всякий другой наесофт и кнопки бабло и в итоге когда это все очередной раз проссыцца гуглом и наебнется к чертям, они попадут в отправную точку. Хорошо если с баблом.. а так это не бизнес в нормальном смысле этого слова.. не какая-то перспективная штука имеющая яркое будущее.. так, очередной алго быстро потеряющий актуальность. Я так на одну хитрожопую кнопку бабло потратил пару лет жизни. Базара нет, денег подняли, все ништяк, но это закончилось. И когда закончилось то что осталось? Рабочий перспективный бизнес??? Зато знаю точно что если бы потратил те 2 года на качество, то не попал бы в финансовую яму. Но всем же хочется быстрых денег. Вот так лично я оцениваю подобные алгоритмы,... пора работать на перспективу, а не на "здесь и сейчас".. так.. добрый совет, мысли на тему. ИМХО.
Я дорвейщик с n-летним стажем и все эти n лет слышу одно и тоже.
Цитата:
Сообщение от Saymon Посмотреть сообщение
P.S. Я тут ни кого обидеть не хотел) Просто с определенного момента у меня такое отношение к таким вещам. А ваще давай алго - попробуем покритиковать конструктивно
Все таки алго интересен? Я так понимаю, что текст норм? Мне тяжело самому оценивать результат своего труда, предвзятость и все такое.
P.S. Думаю дать скрипт на тест нескольким людям, версия супер-пупер альфа. Скрипт будет давать или api(либа python) или запуск из командной строки с параметрами. Т.е. для встраивания в свои приложения нужно быть программистом. Ну или DMI можно "пропатчить".

Последний раз редактировалось sergeospb; 03.05.2012 в 10:25.
sergeospb вне форума  
Старый 03.05.2012, 11:00   #14
masterprof
Member
 
Регистрация: 29.01.2008
Сообщений: 60
Бабло: $10260
По умолчанию

Цитата:
Сообщение от sergeospb Посмотреть сообщение
Я дорвейщик с n-летним стажем и все эти n лет слышу одно и тоже.

Все таки алго интересен? Я так понимаю, что текст норм? Мне тяжело самому оценивать результат своего труда, предвзятость и все такое.
P.S. Думаю дать скрипт на тест нескольким людям, версия супер-пупер альфа. Скрипт будет давать или api(либа python) или запуск из командной строки с параметрами. Т.е. для встраивания в свои приложения нужно быть программистом. Ну или DMI можно "пропатчить".
Было бы интересно глянуть/потестить, если это возможно. Пользуюсь немного доработанным для своих целей генератором из DMI.
Мож чем смогу помочь как программист, правда я больше на пхп, в питоне только базовые познания.
masterprof вне форума  
Старый 03.05.2012, 11:26   #15
sergeospb
коплю на феррари
 
Регистрация: 03.07.2008
Сообщений: 1,249
Бабло: $148195
ТС -->
автор темы ТС По умолчанию

Цитата:
Сообщение от masterprof Посмотреть сообщение
Было бы интересно глянуть/потестить, если это возможно. Пользуюсь немного доработанным для своих целей генератором из DMI.
Мож чем смогу помочь как программист, правда я больше на пхп, в питоне только базовые познания.
В каком виде было бы удобно получить?(исходники не дам )
sergeospb вне форума  
Старый 03.05.2012, 11:26   #16
Sultan
Шучу на половину
 
Аватар для Sultan
 
Регистрация: 23.01.2011
Сообщений: 5,834
Бабло: $1169570
По умолчанию

умный такой), так и не напечатал где тут алгоритм, все из dmi?
вообще для доров семантика важнее.. и то что здесь грамматика хромает)) не самое существенное

вот тебе алго который стабильно работает, берем тематического текста, херачим на две части и рандомно меняем левые, правые куски (левые с левыми, правые с правыми, формирование вопросительных предложение различное так что ?к? .к. !к!), а по середине СЧ с точным вхождением ВЧ (эти же СЧ пихай в анкор лист... местами к анкору подставляй левую часть предложения хорошо макросами делать под xrumer) в часть доров ссылки на трастовые сайты, например свежие новости по теме.

зы предварительно парсь много тематичного текста мб на 3-5, при замесе учитывай количество использованных частей, чтоб не переборщить.. можно еще по хешам (левая.правая) использованные пары сравнивать, чтоб избегать генериных дублей.
Sultan вне форума  
Старый 03.05.2012, 11:32   #17
Saymon
Member
 
Аватар для Saymon
 
Регистрация: 06.01.2009
Сообщений: 45
Бабло: $8450
По умолчанию

Цитата:
Сообщение от sergeospb Посмотреть сообщение
Я дорвейщик с n-летним стажем и все эти n лет слышу одно и тоже.

Все таки алго интересен? Я так понимаю, что текст норм? Мне тяжело самому оценивать результат своего труда, предвзятость и все такое.
P.S. Думаю дать скрипт на тест нескольким людям, версия супер-пупер альфа. Скрипт будет давать или api(либа python) или запуск из командной строки с параметрами. Т.е. для встраивания в свои приложения нужно быть программистом. Ну или DMI можно "пропатчить".
Сам алгоритм мне юзать не где и не на чем. Я этим уже давно не занимаюсь. Могу конструктивно покритиковать, только если автору интересна критика. Достаточно будет словесного описания концепции. Подчеркиваю, только если есть желание получить мнение со стороны
Saymon вне форума  
Старый 03.05.2012, 11:36   #18
Saymon
Member
 
Аватар для Saymon
 
Регистрация: 06.01.2009
Сообщений: 45
Бабло: $8450
По умолчанию

Цитата:
Сообщение от Sultan Посмотреть сообщение
умный такой), так и не напечатал где тут алгоритм, все из dmi?
вообще для доров семантика важнее.. и то что здесь грамматика хромает)) не самое существенное

вот тебе алго который стабильно работает, берем тематического текста, херачим на две части и рандомно меняем левые, правые куски (левые с левыми, правые с правыми, формирование вопросительных предложение различное так что ?к? .к. !к!), а по середине СЧ с точным вхождением ВЧ (эти же СЧ пихай в анкор лист... местами к анкору подставляй левую часть предложения хорошо макросами делать под xrumer) в часть доров ссылки на трастовые сайты, например свежие новости по теме.

зы предварительно парсь много тематичного текста мб на 3-5, при замесе учитывай количество использованных частей, чтоб не переборщить.. можно еще по хешам (левая.правая) использованные пары сравнивать, чтоб избегать генериных дублей.
Вооо! Вот это и называется описание алгоритма.
Saymon вне форума  
Старый 03.05.2012, 11:51   #19
masterprof
Member
 
Регистрация: 29.01.2008
Сообщений: 60
Бабло: $10260
По умолчанию

Цитата:
Сообщение от sergeospb Посмотреть сообщение
В каком виде было бы удобно получить?(исходники не дам )
Да хз. По примерам текстов принципиальных отличий по качеству по сравнению с дми не увидел.
Больше интересен сам алгоритм, в чем он продвинутее. Если на исходники взглянуть нельзя, то хотя бы описание.
Если конечно тебя интересует мнение/критика.
masterprof вне форума  
Старый 03.05.2012, 11:57   #20
sergeospb
коплю на феррари
 
Регистрация: 03.07.2008
Сообщений: 1,249
Бабло: $148195
ТС -->
автор темы ТС По умолчанию

Цитата:
Сообщение от masterprof Посмотреть сообщение
Да хз. По примерам текстов принципиальных отличий по качеству по сравнению с дми не увидел.
Больше интересен сам алгоритм, в чем он продвинутее. Если на исходники взглянуть нельзя, то хотя бы описание.
Если конечно тебя интересует мнение/критика.
Попробуй DMI сгенерить словарь из миллиона предложений. Или встроенным парсером википедии собрать миллион предложений. У DMI ошибки как программирования, так и логики в коде.
sergeospb вне форума  
Старый 03.05.2012, 12:20   #21
masterprof
Member
 
Регистрация: 29.01.2008
Сообщений: 60
Бабло: $10260
По умолчанию

Цитата:
Сообщение от sergeospb Посмотреть сообщение
Попробуй DMI сгенерить словарь из миллиона предложений. Или встроенным парсером википедии собрать миллион предложений. У DMI ошибки как программирования, так и логики в коде.
Встроенным парсером я не пользуюсь, так как тематичность текстов с википедии оставляет желать лучшего. Для этих целей юзаю свои скрипты. Да и такие большие тексты не юзаю, посмотрел - максимум у меня на 200к предложений.

Т.е. как я понимаю по сути ты поправил баги дми, а по принципу генерации никаких кардинальных изменений?
Улучшение дми в плане скорости/удобства это дело конечно хорошее, но имхо второстепенно по сравнению с качеством результирующих текстов.
masterprof вне форума