OCRopus

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск
OCRopus
Тип

Оптическое распознавание символов

Разработчик

Thomas Breuel, DFKI

Написана на

C++ и Lua

Операционная система

FreeBSD, Linux и macOS

Первый выпуск

9 апреля 2007

Последняя версия

1.0 (2 ноября 2014)[1]

Лицензия

Apache License v2.0

Сайт

github.com/tmbdev/ocropy

OCRopus — OCR-система для распознавания текстов на базе tesseract. Использует код для языка моделирования из проекта OpenFST, поддерживаемого Google. Доступна FreeBSD, Linux, Mac OS X.

Использование[править | править вики-текст]

В настоящее время OCRopus использует только интерфейс командной строки, принимая на вход изображения с текстом, и выводя данные в формате hOCR (открытый формат на основе HTML). Опции командной строки позволяют выполнять отдельно конкретные операции (например, распознание одной строки).

История развития[править | править вики-текст]

  • 0.1.0 alpha — 22 октября 2007
  • 0.1.1 alpha – 14 декабря 2007 - Улучшенная система сборки
  • 0.2 alpha 2 — 31 мая 2008
  • 0.3 alpha 3 – 16 октябрь 2008
  • pre-0.4 alpha 4 – май 2009
  • 0.4.3 – июль 2009
  • 0.4.4 – март 2010
  • 0.5 – июнь 2012
  • 0.6 23 – август 2012
  • 0.7 6 – апрель 2013
  • 1.0 - ноябрь 2014

См. также[править | править вики-текст]

Ссылки[править | править вики-текст]

  1. https://api.github.com/repos/tmbdev/ocropy/releases