Частеречная разметка
Эта страница требует существенной переработки. Возможно, её необходимо викифицировать, дополнить или переписать. Пояснение причин и обсуждение — на странице Википедия:К улучшению/16 сентября 2016. |
Частеречная разметка (автоматическая морфологическая разметка, POS tagging, part-of-speech tagging) — этап автоматической обработки текста, задачей которого является определение части речи и грамматических характеристик слов в тексте (корпусе) с приписыванием им соответствующих тегов. POS tagging является одним из первых этапов компьютерного анализа текста.
Алгоритмы POS tagging делятся на две группы: основанные на правилах и вероятностные.
Могут использоваться скрытые марковские модели.[источник не указан 1832 дня]