Генератор полуэро-хренобредо-мегатекста для доров - Форум успешных вебмастеров - GoFuckBiz.com
 
 
Форум успешных вебмастеров - GoFuckBiz.com

  Форум успешных вебмастеров - GoFuckBiz.com > Бизнес-решения > Скрипты, программы и технические решения
Дата
USD/RUB93.4409
BTC/USD63842.1299
Скрипты, программы и технические решения Обсуждаем скрипты, программы и новые технологии.

Закрытая тема
Опции темы Опции просмотра
Старый 02.04.2009, 17:06   #1
BredoGen
Юниор
 
Регистрация: 02.04.2009
Сообщений: 5
Бабло: $500
По умолчанию Генератор полуэро-хренобредо-мегатекста для доров

Вот сделали такую штуку, тексты составляет (язык русский) - http://bredogen.ru/

Уникальность могучая, много лямов цепочек - только от мусора чистили месяц. В итоге сейчас в базе 2 гига с гаком. Текст получается нейтрально-эротический.

Какие мысли, вопросы будут? Качество текста на выходе нормальное?

Ну и вообще, смысл в таком бредогенераторе имеется?
BredoGen вне форума  
Старый 02.04.2009, 17:49   #2
NTллигент
Senior Member
 
Аватар для NTллигент
 
Регистрация: 23.04.2007
Адрес: Leopolis
Сообщений: 359
Бабло: $71530
По умолчанию

Не знаю как текст, но доры от "Дорстрой" видел в топах поисковиков часто.
NTллигент вне форума  
Старый 02.04.2009, 17:53   #3
NTллигент
Senior Member
 
Аватар для NTллигент
 
Регистрация: 23.04.2007
Адрес: Leopolis
Сообщений: 359
Бабло: $71530
По умолчанию

У меня похожая база есть около 2 гигов цепочек, на основе которой похожий бредотекст генерится. А какие у Вас алгоритмы очистки текста?
NTллигент вне форума  
Старый 02.04.2009, 18:03   #4
stu
Member
 
Аватар для stu
 
Регистрация: 13.07.2008
Сообщений: 40
Бабло: $1595
По умолчанию

А где там генератор? вижу только окошечко для ввода
stu вне форума  
Старый 02.04.2009, 18:28   #5
BredoGen
Юниор
 
Регистрация: 02.04.2009
Сообщений: 5
Бабло: $500
ТС -->
автор темы ТС По умолчанию

Цитата:
Сообщение от NTллигент Посмотреть сообщение
У меня похожая база есть около 2 гигов цепочек, на основе которой похожий бредотекст генерится. А какие у Вас алгоритмы очистки текста?
Ну да, это морковка - объемы исходных текстов были очень большие.

Чистилось по целой массе признаков, некро-зоо-дети-насилие. Были убраны опечатки, переносы (разрывы слов) и просто всякий мусор.

В итоге отсматривалось глазками.

Кстати цепей там, что-то около 70 000 000 Было геморойно построить структуру для быстрого склеивания и минимальной нагрузки.

Цитата:
Сообщение от stu Посмотреть сообщение
А где там генератор? вижу только окошечко для ввода
Наверное надо сменить браузер. Или нажать ф5.

p.s.
Мы хронические параноики. Поэтому там защита от авто парсеров. Бывает глючит.
BredoGen вне форума  
Старый 02.04.2009, 20:08   #6
2garin
Златый перчик
 
Регистрация: 28.03.2009
Сообщений: 501
Бабло: $33910
По умолчанию

Молодцы Как я понял работа тяжолая была проделана, только вот смысла в ней мало, имхо
2garin вне форума  
Старый 02.04.2009, 20:39   #7
BredoGen
Юниор
 
Регистрация: 02.04.2009
Сообщений: 5
Бабло: $500
ТС -->
автор темы ТС По умолчанию

Цитата:
Сообщение от 2garin Посмотреть сообщение
Молодцы Как я понял работа тяжолая была проделана, только вот смысла в ней мало, имхо
Работа не столько тяжелая, сколько нудная. По времени много занимает - такие объемы отшевелить и отфильтровать не шухры-мухры.

Но все равно идеала не получилось, да и неудивительно - зато появилась новая идея по генерации. Вот только там объемы входных данных еще больше нужны. Но это в перспективе.

По поводу смысла, ходют слухи Яша совсем озверел - отстреливает за все подряд и за неуник тоже. Вот и выкатили такую штуку в противовес. Теперь думаем где узкие места.
BredoGen вне форума  
Старый 02.04.2009, 22:16   #8
2garin
Златый перчик
 
Регистрация: 28.03.2009
Сообщений: 501
Бабло: $33910
По умолчанию

Цитата:
Сообщение от BredoGen Посмотреть сообщение
Работа не столько тяжелая, сколько нудная. По времени много занимает - такие объемы отшевелить и отфильтровать не шухры-мухры.

Но все равно идеала не получилось, да и неудивительно - зато появилась новая идея по генерации. Вот только там объемы входных данных еще больше нужны. Но это в перспективе.

По поводу смысла, ходют слухи Яша совсем озверел - отстреливает за все подряд и за неуник тоже. Вот и выкатили такую штуку в противовес. Теперь думаем где узкие места.
Ну чтож... Желаю удачи в будущем
2garin вне форума  
Старый 05.05.2009, 13:04   #9
BredoGen
Юниор
 
Регистрация: 02.04.2009
Сообщений: 5
Бабло: $500
ТС -->
автор темы ТС По умолчанию

В общем испытания боем для такого текста завершены. Яша скушал экспериментальный дор с этим бредо-текстом на 100%

Из выдачи выпадений не наблюдалось, наоборот - с каждым апом количество страниц росло. В первый ап морда, во второй ап показал весь второй уровень - в третий ап добавил немного страниц третьего уровня. Сейчас, даже очень дальние страницы находятся в индексе - всего 8к страниц.

Короче показатели нормальные - полет проходит в штатном режиме.

Готов продать базу цепочек и сам генератор. Работа над этим изделием была проведена огромная.

База данных это около 70 миллионов звеньев цепочки собраны в 697 909 записях базы MySQL - размер 2.4 GB

Исходником для составления являлись несколько сайтов с эро-порно-рассказами. Пара женских и мужских сайтов с статьями. И нехилая пачка электронных книжек. Объем изначального текста был более 1.5 GB

Все слова в базе тщательно отфильтрованы:
от мусора (опечатки, переносы слов, разрывы слов, несуществующих слов)
от всяких плохих слов (зоо, детей, некро, зоофилии и подобного запретного)
убраны слова которые встречались в текстах малое количество раз

После чистки база похудела примерно на 40%

По всем вопросам стучать в аську ЗЗ7-7O4-428 Цена вопроса 300$
BredoGen вне форума  
Старый 05.05.2009, 13:33   #10
bers99
PR 10
 
Аватар для bers99
 
Регистрация: 12.10.2007
Сообщений: 324
Бабло: $7350
По умолчанию

ТС не генерируй бред xD уникальность создать помоему легко, а вот читабельность... ) смысла вообщем в покупке этой фигни не вижу )
__________________
Я вернулся.
bers99 вне форума