Стемминг
Материал из Википедии — свободной энциклопедии
Стемматиза́ция (сте́мминг) — это процесс нахождения основы слова для заданного исходного слова. Основа слова необязательно совпадает с морфологическим корнем слова. Алгоритм стемматизации представляет собой давнюю проблему в области компьютерных наук. Первый документ по этому вопросу был опубликован в 1968 году. Данный процесс применяется в поиcковых системах для обобщения поискового запроса пользователя.
Конкретные реализации стемматизации называются алгоритм стемматизации или просто стеммер.
[править] Методы
Для стемматизации существует множество различных методов, по разному подходящих к разным языкам.
[править] См. также
| Это заготовка статьи по лингвистике. Вы можете помочь проекту, исправив и дополнив её. |