Есть здесь кто кому интерестна тема "Прогнозирований событий"? - Форум успешных вебмастеров - GoFuckBiz.com - Страница 3
 
 
Форум успешных вебмастеров - GoFuckBiz.com

  Форум успешных вебмастеров - GoFuckBiz.com > Общий раздел > Мысли, идеи и полезные статьи
Дата
USD/RUB88.4375
BTC/USD67453.9408
Мысли, идеи и полезные статьи Интересные статьи, а также креативные идеи в сфере онлайн бизнеса.

Закрытая тема
Опции темы Опции просмотра
Старый 19.07.2012, 02:12
Start Post: Есть здесь кто кому интерестна тема "Прогнозирований событий"? 
  #21
adamant
KrebsonSecurity
 
Аватар для adamant
 
Регистрация: 15.05.2010
Адрес: в Зазеркалье
Сообщений: 1,636
Бабло: $426045
Question

а также Data Mining.

давайте что ли кружок по интересам создадим, будем скидывать пруфы на паблики разные как литературы так и софта.

статья на хабре http://habrahabr.ru/company/group-ib/blog/147145/
еще одна http://habrahabr.ru/post/147284/
__
вообщем интересен алго обработки даных
adamant вне форума  
Старый 20.07.2012, 02:03   #22
adamant
KrebsonSecurity
 
Аватар для adamant
 
Регистрация: 15.05.2010
Адрес: в Зазеркалье
Сообщений: 1,636
Бабло: $426045
ТС -->
автор темы ТС По умолчанию

аха, мечтай, все все бросили и спалили темы ))
это тема о дата майнинге, а о мани майнинге в след топике.
adamant вне форума  
Старый 20.07.2012, 02:05   #23
beabetters
Virgillio
 
Аватар для beabetters
 
Регистрация: 27.04.2009
Сообщений: 234
Бабло: $56910
По умолчанию

Вот для широкого круга лиц, о том, как и где могут применяться подобные технологии:




ЗЫ: подобные технологии применяются даже в игре в покер. Существуют покерные боты, которые прогнозируют поведение оппонентов, на основе предположения о диапазоне карт на руках оппонента (диапазон карт: все карты с которыми человек будет играть не скидывая собираются из датамайнинга). Более того, такие боты умеют правильно вычислить блеф, учитывая степень агрессивности и степень рискованности соперика, умеют максимально удачно подбирать момент для блефа, момент для ловушки и пр.
Но это скорее "уникальная область применения", в основном конечно же такие технологии применяются для бизнеса, так как это самый платежеспособный сектор.

Последний раз редактировалось beabetters; 20.07.2012 в 02:13.
beabetters вне форума  
Старый 20.07.2012, 07:26   #24
medar
кодер-энтузиаст
 
Аватар для medar
 
Регистрация: 04.04.2007
Адрес: Джамайка
Сообщений: 3,378
Бабло: $447150
По умолчанию

Цитата:
Сообщение от beabetters Посмотреть сообщение
Вот для широкого круга лиц, о том, как и где могут применяться подобные технологии:
Да, жаль только, что Ашманов их не использует.
medar вне форума  
Старый 20.07.2012, 08:22   #25
WebNinja
grablab.org
 
Аватар для WebNinja
 
Регистрация: 18.09.2007
Адрес: Thailand
Сообщений: 4,891
Бабло: $322264
Отправить сообщение для WebNinja с помощью ICQ Отправить сообщение для WebNinja с помощью Skype™
По умолчанию

Ну все спалили тему, щаз начнется рубилова бабла на датамайнинге

Цитата:
На днях я экспериментировал с алогритмом Support Vector Machine, хотел научить классификатор по набору прилагательных от личать хорошие отзывы от плохих. С ресурса kinopark.by скачал все комментарии ко всем фильмам и рассортировал на два кластера: положительные отзывы и отрицательные (суммарно получилось окло 18Мб чистого текста). Выбрал все прилагательные (без окончаний) из каждого комментария; каждый комментарий закодировал дескриптором, содержащим 1 или 0 для каждого прилагательного из всего множества. Получился вектор размерностью около 10000. Вот такие-то вектора и скармливал классификатору на обучение.
Все это я делал только исключительно на Clojure. Все это, включая загрузку и разбор страниц с комментариями, заняло около 300 строк кода. За все время мне ни разу не потребовался дебаггер, и даже в голову не пришло писать unit-тесты (зачем, ведь функция каждый раз "пробуется" в REPL-е перед попаданием в исходник). И я не могу себе представить инструмента, более удобного для таких задач, чем Clojure.
учите кложуру, пацаны.
http://alexott.net/ru/clojure/

Цитата:
Основные направления использования данного языка в моем случае — анализ данных, как численных, так и текстовых, с целью извлечения разнообразной информации и классификации. Очень полезным инструментом в этом деле является проект Incanter, в разработке которого я участвую.
Цитата:
Clojure (произносится как closure) — современный диалект Лиспа. Это язык программирования общего назначения с поддержкой разработки в интерактивном режиме, поощряющий функциональное программирование, и упрощающий поддержку многопоточности. Clojure работает на платформах JVM и CLR. Clojure отличает философия «код как данные (англ.)» и развитая система лисп-макросов.
(defn fibo ([] (concat [1 1] (fibo 1 1))) ([a b] (let [n (+ a b)] (lazy-seq (cons n (fibo b n))))))
__________________
www.imscraping.ninja
grablab.org | blog

Последний раз редактировалось WebNinja; 20.07.2012 в 08:29.
WebNinja вне форума  
Старый 20.07.2012, 14:51   #26
7make
Senior Member
 
Аватар для 7make
 
Регистрация: 02.07.2011
Сообщений: 733
Бабло: $196220
По умолчанию

Хз как Clojure, но R хорошо себя зарекомендовал в анализе данных.
__________________
PharmCash - Лучшие условия и профит в фарме. Hold-0, Refunds-0, Commission–50%, CPU+500. Google нас любит! | Обучаю Монстр2 нужным вам каптчам
7make вне форума  
Старый 20.07.2012, 19:18   #27
aoki
Senior Member
 
Регистрация: 05.10.2009
Сообщений: 687
Бабло: $152005
По умолчанию

Возможно буду не совсем корректен.

Важен не язык, а сам алгоритм анализа, если нет идеи алгоритма, зачем знать язык? С другой стороны если есть идея алгоритма, опиши её на русском языке, остальное пусть делает программист.

В мире существует очень хороший баланс, пригнуть выше головы, только из-за того что кто-то собрал данные и проанализировал их невозможно, невозможно в массовом порядке. Любитель дата майнинга по моему, мало чем отличается от алкхимика. Дата майнинг применим только для нахождения закономерностей в человеческих творениях, то к чему прикоснулась рука творца проанализировать невозможно. То есть например можно, точно предугадать как сработает алгоритм поисковой системы, точно узнать на основе анализа десятков тысяч рук блефую я или нет нереально.

Последний раз редактировалось aoki; 20.07.2012 в 19:24.
aoki вне форума  
Старый 20.07.2012, 20:11   #28
WebNinja
grablab.org
 
Аватар для WebNinja
 
Регистрация: 18.09.2007
Адрес: Thailand
Сообщений: 4,891
Бабло: $322264
Отправить сообщение для WebNinja с помощью ICQ Отправить сообщение для WebNinja с помощью Skype™
По умолчанию

бля, ну началось! как будто все эти алгоритмы кто-то прячет. прежде чем вставать на трибуну было бы неплохо оратору ознакомится хотябы с базисом, дабы не играть в КО.

олсо я бы посмотрел на описание алгоритма (какая еще "идея" тем более) какой-нибудь кластеризации, на русском языке в виде "задания для программиста".
__________________
www.imscraping.ninja
grablab.org | blog
WebNinja вне форума  
Старый 21.07.2012, 06:39   #29
WebNinja
grablab.org
 
Аватар для WebNinja
 
Регистрация: 18.09.2007
Адрес: Thailand
Сообщений: 4,891
Бабло: $322264
Отправить сообщение для WebNinja с помощью ICQ Отправить сообщение для WebNinja с помощью Skype™
По умолчанию

палю приземленное практическое применение, например.
есть онлайн магазин и владельцы шопа хотят знать, что брать и какие цены выставлять. т.е. принимать решение не только на основе каких-то своих умозаключений, но и используя CS.

берется яндекс маркет, выгружаются данные (допустим раз в неделю) по интересующим категориям, например с помощью Grab , ае ) затем из этой выборки можно извлекать информацию такого плана: какие позиции вообще не стоит брать (например цены конкурентов значительно ниже, чем может предложить поставщик), какие популярны, где какие отзывы (кластеризация, ага), ну и на основе этого всего уже можно сделать выборку товаров которые будет выгодно продавать и которые будут хорошие и популярные.
__________________
www.imscraping.ninja
grablab.org | blog
WebNinja вне форума  
Старый 21.07.2012, 06:43   #30
chesser
автоматизирую интернеты
 
Аватар для chesser
 
Регистрация: 05.07.2009
Адрес: chesser.ru
Сообщений: 3,354
Бабло: $470735
По умолчанию

WebNinja, ога, ты частично описал моего уже работающего детища )) только я еще своих конкурентов мониторю и анализирую.
пару раз спрогнозировал падение рынка и увел компанию от убытков

осталось увеличить масштабы и представить в виде saas - мой стартап (адуч)
__________________
USA и NL серверы и VPS | wiki | блог | Drupal | NginxТДС
Ave, Google, morituri te salutant! © chesser

Последний раз редактировалось chesser; 21.07.2012 в 06:51.
chesser вне форума  
Старый 21.07.2012, 07:13   #31
WebNinja
grablab.org
 
Аватар для WebNinja
 
Регистрация: 18.09.2007
Адрес: Thailand
Сообщений: 4,891
Бабло: $322264
Отправить сообщение для WebNinja с помощью ICQ Отправить сообщение для WebNinja с помощью Skype™
По умолчанию

Походу такие системы для себя многие разарбатывают.
В виде saas круть канешно такое сделать )
__________________
www.imscraping.ninja
grablab.org | blog
WebNinja вне форума