несколько тезисов:
- надо немного матана, матстата, теории игр и тд, а также чисто cs-ных направлений типа ml
- в рунете про датамайнинг не говорят
- софт уже написан, точнее фреймворки
- только не вздумайте делать это php ))
- нужны распределенные технологии
- неплохо бы иметь phD в теме
- при НИР нужно заставить себя забыть про обычный гугл и пользоваться этим:
http://scholar.google.com, а лучше ходить по ссылкам из библиографических справочников
- на жаве есть датаманинг фреймворк apache mahaout
- для написания экспертных систем есть узкоспецилизированные языки типа clips, jess и им подобные
- год работы в этой области - это мало, лет 10 норм
я неспешно разрабатываю прогнозирующую экспертную систему для маркетинга в электронной коммерции. Ее мизерная часть уже сделана и пару лет успешно используется в нашей компании. Я про нее писал диссер
сейчас в своих разработках пытаюсь перейти от ООП в ООМ, чего и вам всем желаю