Стемминг
Материал из Википедии — свободной энциклопедии
Стемматиза́ция (сте́мминг) — это процесс нахождения основы слова для заданного исходного слова. Основа слова необязательно совпадает с морфологическим корнем слова. Алгоритм стемматизации представляет собой давнюю проблему в области компьютерных наук. Первый документ по этому вопросу был опубликован в 1968 году. Данный процесс применяется в поиcковых системах для обобщения поискового запроса пользователя.
Конкретные реализации стемматизации называются алгоритм стемматизации или просто стеммер.
Методы [править]
Для стемматизации существует множество различных методов, по разному подходящих к разным языкам.
См. также [править]
| Это заготовка статьи по лингвистике. Вы можете помочь проекту, исправив и дополнив её. |