OCRFeeder

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск
OCRFeeder
OCRFeeder logo w lettering.svg
Ocrfeeder.jpeg
Тип

оптическое распознавание символов

Автор

Joaquim Rocha

Разработчик

компания Igalia, S.L.[1]

Написана на

Python

Интерфейс

GTK+, командная строка

Операционная система

Linux и др. UNIX-подобные

Первый выпуск

май 2009[2]

Последняя версия

0.7.11 (8 февраля 2013[3])

Лицензия

GNU GPL

Сайт

wiki.gnome.org/OCRFeeder

OCRFeeder — программа, предоставляющая графический интерфейс пользователя для систем оптического распознавания символов CuneiForm, Tesseract, GOCR (англ.) и Ocrad (англ.). OCRFeeder является свободно распространяемой программой для операционной системы Linux.

Функции[править | править исходный текст]

  • Графические форматы ввода данных: PNG, JPEG, BMP, TIFF, GIF, Portable anymap (PNM, PGM, PBM, PPM) и другие. Импорт PDF-файлов.
  • Форматы вывода данных: текстовый файл, ODT, HTML, PDF.
  • Обработка изображений для улучшения качества распознавания — фильтры шумов, чёрного цвета и оттенков серого; и другие виды обработок, доступных для Unpaper[4].
  • Ручное выделение блоков на странице.
  • Проверка орфографии.
  • Получение изображений со сканера посредством программы SANE.
  • Распознавание нескольких изображений по порядку за один проход (пакетное распознавание).

Используемые компоненты[править | править исходный текст]

  • PIL — библиотека Python для работы с изображениями.
  • Unpaper — для обработки изображений.
  • ReportLab[5] — для импорта PDF-файлов.
  • PyGTK и Libgnome — для графического интерфейса.
  • PyeEnchant («привязка» Enchant (англ.) для Python) и PyGtkSpell («привязка» GtkSpell для Python) — для проверки орфографии.

Примечания[править | править исходный текст]

Литература[править | править исходный текст]

  • Журнал Linux Format № 11 (150) Ноябрь 2011 — Тимур Мубаракшин рассматривает приложения OCR для Linux: Сuneiform-Qt, GOCR, Tesseract, OCRFeeder, ABBYY FineReader и YAGF.

Ссылки[править | править исходный текст]