Фонтанное преобразование

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску

Фонтанное преобразование (от англ. font — шрифт) — подход к реализации задачи машинного распознавания образов.

История[править | править код]

Данный подход был разработан российской компанией БИТ[1] (BIT Software, ныне ABBYY) для решения задачи распознавания печатного текста и с успехом реализован в программе FineReader.

Принцип[править | править код]

Алгоритм основан на сочетании шаблонного и структурного методов распознавания образов. При анализе образца выделяются ключевые точки объекта — так называемые «пятна».

В качестве пятен, например, могут выступать:

  • концы линий;
  • узлы, где сходятся несколько линий;
  • места изломов линий;
  • места пересечения линий;
  • крайние точки.

После выделения «пятен» определяются связи между ними — отрезок, дуга. Таким образом, итоговое описание представляет собой граф, который и служит объектом поиска в библиотеке «структурно-пятенных эталонов».[2]

При поиске устанавливается соответствие между ключевыми точками образца и эталона, после чего определяется степень деформации связей, необходимая для приведения искомого объекта к сравниваемому эталонному образцу. Меньшая степень необходимой деформации предполагает бо́льшую вероятность правильного распознавания символа.

Методы улучшения результатов[править | править код]

В дальнейшем может выполняться дополнительная коррекция, позволяющая увеличить качество распознавания спорных символов (то есть символов, у которых есть несколько кандидатов с приблизительно одинаковой оценкой степени соответствия нескольким эталонам) на основе:

  • анализа буквосочетаний, характерных для языка;
  • словаря языка;
  • грамматического анализа;
  • и других методов.

Примечания[править | править код]

  1. Системы машинного зрения. Дата обращения: 15 октября 2011. Архивировано 14 июня 2016 года.
  2. ЭКСПЕРТНЫЕ СИСТЕМЫ, Учебное пособие для вузов

Литература[править | править код]