CuneiForm

Материал из Википедии — свободной энциклопедии
(перенаправлено с «Cuneiform»)
Перейти к: навигация, поиск
CuneiForm
Тип

Система оптического распознавания символов

Разработчик

команда CuneiForm

Операционная система

Linux / Windows / BSD / Mac OS X

Последняя версия

1.1.0 (19 апреля 2011)

Лицензия

Freeware/Лицензия BSD

Сайт

www.cuneiform.ru, www.openocr.org, launchpad.net

CuneiForm (англ. cuneiform кьюниформ — клинопись) — свободно распространяемая открытая система оптического распознавания текстов российской компании Cognitive Technologies.

Первоначально система CuneiForm была разработана компанией Cognitive Technologies как коммерческий продукт. CuneiForm поставлялся с некоторыми моделями сканеров. Однако после нескольких лет перерыва разработки Cognitive Technologies освободила проект, прекратив его продажу и поддержку.

Содержание

[править] Особенности

CuneiForm позиционируется как система преобразования электронных копий бумажных документов и графических файлов в редактируемый вид с возможностью сохранения структуры и гарнитуры шрифтов оригинального документа в автоматическом или полуавтоматическом режиме. Система включает в себя две программы для одиночной и пакетной обработки электронных документов.

CuneiForm — Шрифтонезависимая система.

[править] История развития

В 1993 году Cognitive Technologies заключила OEM-контракт с канадской корпорацией Corel Corporation, по которому библиотека распознавания Cognitive встроена в популярный издательский пакет Corel Draw 3.0 (и последующие версии).

В 1996 году выпущена версия OCR CuneiForm '96, в которой впервые в мире применены алгоритмы адаптивного распознавания.

Адаптивное распознавание — метод, основанный на комбинации двух видов алгоритмов распознавания печатных символов: шрифтового (multifont) и шрифтонезависимого (omnifont). Система генерирует внутренний шрифт для каждого вводимого документа, основываясь на хорошо пропечатанных символах, то есть используется динамическая настройка (адаптация) на конкретные входные символы. Таким образом, метод совмещает универсальность и технологичность бесшрифтового подхода и высокую точность распознавания шрифтового, что позволяет кардинальным образом повысить качество распознавания.

В 1997 году в системе CuneiForm впервые применены технологии, основанные на нейронных сетях. Алгоритмы, использующие нейронные сети для распознавания символов, строятся следующим образом. Поступающее на распознавание изображение символа (растр) приводится к некоторому стандартному размеру (нормализуется). Значения яркости в узлах нормализованного растра используются в качестве входных параметров нейронной сети. Число выходных параметров нейронной сети равняется числу распознаваемых символов. Результатом распознавания является символ, которому соответствует наибольшее из значений выходного вектора нейронной сети.

В 1999 году разработан механизм воссоздания формы исходного документа «What you scan is what you get». Он позволяет придать документу его исходную форму, добиваясь того, чтобы каждый фрагмент находился на нужном месте. Особенно это касается документов со сложной топологией: многоколончатые тексты с заголовками, аннотациями, графическими иллюстрациями, таблицами, и т. д.

[править] История и перспективы развития освобожденной версии

12 декабря 2007 года была выпущена freeware-версия OCR CuneiForm и анонсировано открытие её исходных текстов.[1]

2 апреля 2008 года были опубликованы исходные тексты OCR Cuneiform под лицензией BSD[2], а осенью — исходные тексты интерфейса системы[3].

Последняя версия OpenSource версии для Windows не обновлялась с 14.02.2009. Эта версия больше не предлагается для скачивания.

В 2009 году выпущены графические интерфейсы к открытой версии Cuneiform на основе библиотеки Qt 4 — Cuneiform-Qt[4], YAGF[5]. Начиная с версии 0.9.0 [6] открытую версию для Linux можно использовать в качестве библиотеки.

[править] Критика

  • Программа не умеет распознавать JPEG файлы, содержащие шум (напр., скриншоты экрана), с чем лучше справляется FineReader[7].
  • Версия для Windows не обновлялась уже больше 2 лет и проект по развитию OpenOCR скорее всего заморожен в связи с отсутствием людских и денежных ресурсов[8].
  • Отсутствие встроенной поддержки распознавания документов PDF и экспорта результатов распознавания в этот формат [8].
  • Отсутствие возможности использования OpenOffice.org для просмотра распознанного текста (только проприетарный Microsoft Office) [9].
  • Отсутствие возможности создания табличных блоков [10]
  • Отсутствие коммерческой поддержки продукта. Официальная поддержка фирмой Cognitive Technologies по нему не оказывается.
  • Форум проекта периодически подвергается спамерским атакам, плохое модерирования на форуме (нет реакции на сигнал модератору, спамерские сообщения не чистятся, в том числе и в тематических ветках, что затрудняет их чтение) — см. вышестоящие ссылки.

[править] Примечания

[править] См. также

[править] Ссылки

  • www.cuneiform.ru — страница CuneiForm на официальном сайте Cognitive Technologies
  • SVN- репозиторий исходного текста
  • Официальный форум OpenOCR
  • Прикладное программирование на базе CunieForm — первоначальный анализ исходного текста, известные проблемы, необходимые задачи развития
  • Puma.NET — интерфейсная библиотека .NET для движка распознавания Cognitive Technologies CuneiFrom.
  • KBookOCR — визуальная Qt-оболочка над CuneiForm-Linux.
  • CuneiDjVu — Windows-программа для создания распознанного текcтового слоя в DjVu посредством CuneiForm-Linux v1.1, собранного под Windows.
Личные инструменты
Пространства имён
Варианты
Действия
Навигация
Участие
Печать/экспорт
Инструменты
На других языках