OmegaT

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск
OmegaT
[[Файл:Omega128.png|220x80px]]
[[Файл:OmegaT-1.6.0 RCB-wc.png|250x350px]]
OmegaT 1.6.0 в Windows XP
Тип

Автоматизированный перевод, Память переводов

Разработчик

Максим Михальчук

Написана на

Java

Операционная система

с поддержкой нужной Java

Последняя версия

2.6.3_10 (18 июня 2014)

Бета-версия

3.1.1_01 (21 мая 2014)

Лицензия

GNU GPL

Сайт

www.omegat.org

OmegaT — система автоматизированного перевода, поддерживающая память переводов, написана на языке Java. Возможности продукта включают сегментацию исходного текста на основе регулярных выражений, использование точных (англ. exact) и неточных (англ. fuzzy) соответствий с уже переведёнными фрагментами, использование словарей, поиск контекстов в базах данных переводов и работу с ключевыми словами.

Начиная с версии 2.04 OmegaT также может переводить текущий абзац текста через Google Translate.

Для работы OmegaT требуется версия Java 1.4, которая доступна для ОС Linux, Mac OS X и Microsoft Windows, Windows NT. Может работать с OpenJDK.

История и разработка[править | править вики-текст]

Разработка OmegaT была начата Keith Godfrey. Оригинальный движок был написан на C++, но релиз, опубликованный в феврале 2001 был написан уже на Java.

Первая Java-версия имела свой собственный формат памяти переводов и требовала для работы Java 1.3. Она поддерживала документы StarOffice, а также тексты в обычной и Unicode-кодировке и HTML.

Текст сегментировался на блоки (на практике это обычно означало сегментацию на параграфы). Однако в версии 1.6 было добавлено настраиваемое сегментирование на предложения, что сделало работу с программой значительно удобнее. В качестве формата памяти переводов начиная с версии 1.4b level2 используется стандартный .TMX.

В версиях с 1.4.4 по 1.6.0 главным разработчиком был Максим Михальчук. В версиях до 1.7.1 релиз-менеджером был Henry Pijffers. В настоящее время им является Didier Briel.

Поддерживаемые форматы[править | править вики-текст]

OmegaT поддерживает разнообразные форматы исходных документов.

Непосредственно поддерживаемые форматы[править | править вики-текст]

Формат файлов Расширение файлов
Обычные текстовые форматы
ASCII-текст, закодированный текст .txt, *.utf8 и др.
Пакеты ресурсов Java *.properties
PO-файлы для библиотеки интернационализации gettext *.po
INI-файлы («Ключ=Значение») *.ini
Файлы DTD *.dtd
Файлы DocuWiki, MediaWiki *.txt, *.utf8
Файлы заголовков SubRip *.srt
Magento CE Locale CSV *.csv
Текстовые форматы с разметкой
OpenDocument (OpenOffice.org / StarOffice / LibreOffice) *.odt, *.ott, *.ods, *.ots, *.odp, *.otp
Microsoft Open XML *.docx, *.xlsx, *.pptx
HTML/XHTML *.html, *.xhtml,*.xht
HTML Help Compiler *.hhc, *.hhk
DocBook *.xml
Одноязычные XLIFF-файлы Okapi *.xlf, *.xliff, *.sdlxliff
QuarkXPress CopyFlowGold *.tag, *.xtg
Файлы ResX *.resx
Ресурсы Android *.xml
LaTeX *.tex, *.latex
Файлы справки *.xml, *.hmxp
Typo3 LocManager *.xml
Файлы локализации WiX *.wxl
Iceni Infix *.xml
Экспорт Flash XML *.xml
Wordfast TXML *.txml
Camtasia for Windows *.camproj
Файлы изображений SVG *.svg

С файлами старых проприетарных форматов Microsoft Office (Word, Excel и PowerPoint) OmegaT не может работать непосредственно, их необходимо перевести в формат OpenDocument (например, с помощью OpenOffice.org) или OOXML с помощью Microsoft Office 2007/2010.

Поддержка XLIFF[править | править вики-текст]

Программа Rainbow из фреймворка Okapi может конвертировать некоторые файловые форматы в формат XLIFF, который поддерживает OmegaT.

Также Rainbow может создать для таких документов все каталоги проекта OmegaT, чтобы облегчить их обработку в OmegaT.[1]

Поддержка файлов .ttx для Trados®[править | править вики-текст]

Используя фильтр Okapi TTX можно обрабатывать файлы .ttx Trados®.

Локализация OmegaT[править | править вики-текст]

Пользовательский интерфейс и документация OmegaT переведены на 30 языков.

Переводчики-добровольцы могут перевести пользовательский интерфейс, краткое руководство «Быстрый старт» или всё руководство пользователя (либо все три компонента).

Все языковые файлы и переводы руководства пользователя включены в стандартную поставку OmegaT.

Программное обеспечение, созданное на основе OmegaT[править | править вики-текст]

Набор программ для перевода Autshumato[править | править вики-текст]

Autshumato состоит из инструмента автоматизированного перевода текста, выравнивателя, PDF экстрактор, редактор TMX и открытой памяти переводов, основанной на собранных данных

В итоговую версию будут включены менеджер терминологии и машинный переводчик.

Элемент инструмента автоматизированного перевода текста построен на основе OmegaT, для запуска требуется также наличие OpenOffice.org.

Разработка финансируется правительственным Департаментом искусств и культуры Южно-Африканской Республики.[2]

Benten[править | править вики-текст]

Benten — редактор XLIFF на основе Eclipse.

Использует код OmegaT для обработки процесса нахождения совпадений в памяти переводов.

Частично финансируется правительством Японии.[3]

Boltran[править | править вики-текст]

Boltran — это автономное веб-приложение для автоматизированного перевода текста, который имитирует работу с проектом OmegaT.

Создано на основе исходного кода OmegaT, и потому способно переводить всё, что может переводить OmegaT.

Имеет практически идентичные OmegaT управление глоссарием и возможности по нечёткому совпадению.

В настоящее время доступен только сервер Boltran на веб-сайте разработчиков. Однако в теории любой желающий может настроить открытый или закрытый сервер Boltran.[4]

OmegaT+[править | править вики-текст]

OmegaT+ — система автоматизированного перевода, которая является ответвлением от OmegaT версии 1.4.5 в 2005 году. Принцип работы такой же, что и в OmegaT. Имеются свои возможности, но проекты не совместимы с OmegaT.[5]

См. также[править | править вики-текст]

Ссылки[править | править вики-текст]

Примечания[править | править вики-текст]

  1. Okapi Framework – Утилита извлечения текста может создать дерево каталогов проекта OmegaT
  2. Autshumato
  3. Benten
  4. Boltran
  5. OmegaT+