Определение слов
Может кто знает как решается такая задача?
Сейчас для одного проекта встала такая задача, необходимо определить "одинаковость" слов. Например, две фразы:
- Иванову выслали поздравление
- Иванова поздравили письмом
В обоих фразах нет ни одного одинакового слова (по точному вхождению), но по сути есть одно и то же слово "Иванов". Вот как это программным путем определить? Имеется ввиду алгоритм. Такое часто можно встретить в различных сервисах, тот же гугл или даже вконтакт, к примеру задаю в поиске слово "стартап", но поиск выдает результаты в которых встречаются слова "стартап", "стартапу", "стартапа", "стартапы" и пр. Врядли такие сервисы имеют базы всех существующих "одинаковых" слов о_0. Скорее всего это как-то программно решается? Или я чего то туплю...
|