Microsoft Office Document Imaging

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск
см. также Microsoft Document Imaging Format

Microsoft Office Document Imaging (MODI) входит в состав пакета Microsoft Office для поддержки редактирования документов, отсканированных в Microsoft Office Document Scanning. Впервые появился в Microsoft Office XP и включался в поздние версии офиса, включая Office 2007. Более не доступен в Office 2010. Для установки Document Imaging в Office 2010 Microsoft выпустила пакет SharePoint Designer 2007 [1]. MODI позволяет распознавать отсканированные документы.

MODI может читать и писать небольшие изображения формата TIFF. Он также может сохранять распознанный текст в оригинальный TIFF файл. Однако, MODI создаёт .tif файлы которые нарушают стандарты формата TIFF[2] и они могут быть использованы только в пакете Microsoft Office[3].

По умолчанию, движок OCR требует правильной ориентации страницы при распознавании. Если вызвать метод objectname.save(), он может записать исправленное положение страницы в исходный файл.

Точность распознавания этого движка невысокая, и для серьёзного применения он мало годится. К тому же он предъявляет высокие требования к качеству входных изображений.

Программирование[править | править вики-текст]

Через интерфейс COM, MODI предоставляет интерфейс объектной модели, типа документ или изображение. Одна особенность которая представляет практический интерес, это возможность встраиваться в Web интерфейс и распознавать изображения использую встроенный механизм распознавания изображений.

Объект MODI доступен из средств разработки, через программный интерфейс модели COM. Элементы управления MODI доступны через средства разработки которые поддерживают интерфейс ActiveX и использование таких элементов управления. Программный модуль реализующий такой функционал должен быть добавлен в проект, он называется, Microsoft Office Document Imaging Viewer Control 11.0 или 12.0 (MDIVWCTL.DLL). Эти папки обычно находятся в %programfiles%\Common Files\Microsoft Shared\MODI.

MODI стал доступен в MS Office 2003, в то время как связанные программы стали доступны в MS Office XP, объектная модель движка не предоставляет элементов управления, только элемент просмотра.

Пример использования на Visual Basic .NET:

Dim inputFile As String = "C:\test\multipage.tif"
Dim strRecText As String = ""
Dim Doc1 As MODI.Document
 
Doc1 = New MODI.Document
Doc1.Create(inputFile)
Doc1.OCR()  ' распознавание всех страниц, если файл многостраничный
Doc1.Save() ' сохранение переориентированное изображение в оригинальный файл и текст туда же, обратно во входной файл
 
For imageCounter As Integer = 0 To (Doc1.Images.Count - 1) ' срабатывает на кождой странице
    strRecText &= Doc1.Images(imageCounter).Layout.Text    ' помещение результатов работы в строку
Next
 
File.AppendAllText("C:\test\testmodi.txt", strRecText)     ' сохранение распознанного файла на диск
 
Doc1.Close() ' очистка
Doc1 = Nothing

Изменения с Office 2003 SP3[править | править вики-текст]

В Office 2003 Service Pack 3, Microsoft исключила ассоциации с файлами типа .TIF and .TIFF с приложением Microsoft Office Document Imaging, как часть пакета исправления проблем безопасности. Также, TIFF файлы более не используют JPEG сжатие.[4]. Никаких объяснений на этот счёт дано не было.

В Office 2010 MODI полностью отвергнут. Это изменение также затронуло дерево установки, которое не показывает пункт MODI Help, OCR. Internet Fax feature в Office 2010 используют Windows Fax драйвер принтера для генерации изображений формата TIF. MODI и все его компоненты убраны в версии офиса для 64-bit Office 2010.[5]

Альтернатива MODI для Office 2010[править | править вики-текст]

Если MODI всё же нужен в Office 2010, вот несколько советов (среди прочих):

  • Следуя рекомендациям Microsoft, установите MODI из Office 2007, выбрав в установщике только его. (Этот процесс инсталляции работает и с более ранними версиями Office): http://support.microsoft.com/kb/982760
  • Установите Scientific and Technical Documentation Utility (STDU Viewer) : http://www.stduviewer.ru/
  • Установите Alterna-TIFF viewer: ActiveX элемент для IE или плагин для браузера (для других браузеров): http://www.alternatiff.com/
  • Установите Black Ice’s TIFF Viewer и плагин: http://www.blackice.com/TIFFViewer.htm
  • Установите Cartesian Product’s CPC viewer: CPC View ax (ActiveX для IE) или CPC Lite pi (плагин для других браузеров): http://www.cartesianinc.com/Products/CPCLite/

Примечания[править | править вики-текст]

Ссылки[править | править вики-текст]