Лемматизация

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

Лемматиза́ция — процесс приведения словоформы к лемме — её нормальной (словарной) форме.

Нормальные формы[править | править код]

В русском языке нормальными формами считаются следующие морфологические формы:

Примеры[править | править код]

  • кошками → кошка
  • бежал → бежать
  • боязненных → боязненный

Автоматические лемматизаторы с поддержкой русского языка[править | править код]

  1. Mystem
  2. Treetagger
  3. UDPipe

См. также[править | править код]

Ссылки[править | править код]

Логотип Викисловаря
В Викисловаре есть статья «лемматизация»

Online-версия лемматизатора