Стемминг

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

Стемматиза́ция (сте́мминг) — это процесс нахождения основы слова для заданного исходного слова. Основа слова необязательно совпадает с морфологическим корнем слова. Алгоритм стемматизации представляет собой давнюю проблему в области компьютерных наук. Первый документ по этому вопросу был опубликован в 1968 году. Данный процесс применяется в поиcковых системах для обобщения поискового запроса пользователя.

Конкретные реализации стемматизации называются алгоритм стемматизации или просто стеммер.

Методы [править]

Для стемматизации существует множество различных методов, по разному подходящих к разным языкам.

См. также [править]