Автоматизированный перевод

Автоматизи́рованный перево́д (АП, англ. computer-aided translation, Computer-assisted translation) — перевод текстов на компьютере с использованием компьютерных технологий. От машинного перевода (МП) он отличается тем, что весь процесс перевода осуществляется человеком, компьютер лишь помогает ему произвести готовый текст либо за меньшее время, либо с лучшим качеством.^{[источник не указан 2239 дней]} CAT-программы предлагают доступ к словарям, глоссариям, запоминают выбор переводчика и в следующих схожих файлах автоматически подставляют перевод ранее переведенных слова. Данные программы помогают сократить время работы переводчиков над однотипными текстами, а также сокращают процент грамматических, пунктуационных и орфографических ошибок.^[1]

История[править | править код]

Одним из пионеров идеи автоматизированного перевода является советский учёный Пётр Петрович Троянский, предложивший в 1933 году «машину для подбора и печатания слов при переводе с одного языка на другой». Машина состояла из стола с наклонной поверхностью, перед которым был закреплён фотоаппарат, синхронизированный с печатной машинкой. На поверхности стола располагалось «глоссарное поле» — свободно двигающаяся пластина с напечатанными на ней словами на трёх, четырёх и более языках^[2].

Практическая реализация идеи автоматизированного перевода началась с момента появления компьютеров: переводчики всегда выступали против стандартной в те годы концепции МП, на которую было направлено большинство исследований в области компьютерной лингвистики, но поддерживали использование компьютеров для помощи переводчикам.

В 1960-е годы Европейское объединение угля и стали (предшественник современного Евросоюза) стало создавать терминологические базы данных под общим названием Eurodicautom^[3]. В Советском Союзе для создания баз такого рода был создан ВИНИТИ.

В современной форме идея АП была развита в статье Мартина Кея 1980 года^[4], который выдвинул следующий тезис: «By taking over what is mechanical and routine, it (computer) frees human beings for what is essentially human» («Компьютер берёт на себя рутинные операции и освобождает человека для операций, требующих человеческого мышления»).

В настоящее время наиболее распространённые способы использования компьютеров при письменном переводе - работа со словарями и глоссариями, памятью переводов (англ. translation memory, TM), содержащей примеры ранее переведённых текстов, терминологическими базами, а также использование так называемых корпусов, больших коллекций текстов на одном или нескольких языках, что даёт сжатое описание того, как слова и выражения реально используются в языке в целом или в конкретной предметной области.

Для локализации программного обеспечения часто применяются специализированные средства, например, Passolo, которые позволяют переводить меню и сообщения в программных ресурсах и непосредственно в откомпилированных программах, а также тестировать корректность локализации. Для перевода аудиовизуальных материалов (главным образом фильмов) также используются специализированные средства, например Aegisub, которые объединяют в себе некоторые аспекты памяти переводов, но дополнительно обеспечивают возможности появления субтитров по времени, их форматирования на экране, следования видеостандартам и т. п.

При синхронном переводе использование средств автоматизированного перевода из-за его специфики ограничено. Одним из примеров является использование словарей, загружаемых на КПК. Другим примером может служить полуавтоматическое извлечение списков терминов при подготовке к синхронному переводу в узкой предметной области^[5].

В узких предметных областях при большом количестве исходных текстов и устоявшейся терминологии переводчики могут использовать и машинный перевод, который может обеспечить хорошее качество перевода терминологии и устойчивых выражений в узкой области. Переводчик в этом случае осуществляет пост-редактирование полученного текста. Более половины текстов внутри Еврокомиссии (главным образом юридические тексты и текущая корреспонденция) переводится с использованием МП.

Общий обзор[править | править код]

Автоматизированный перевод — это широкое и не совсем точное понятие, охватывающее широкий спектр простых и сложных инструментов. Они могут включать:

Программы для проверки правописания, которые могут быть встроены в текстовые редакторы или дополнительные программы;
Программы для проверки грамматики, которые также встраиваются в текстовые редакторы или дополнительные программы;
Программы для управления терминологией, которые позволяют переводчикам управлять своей собственной терминологической базой в электронной форме. Это может быть и простая таблица, созданная в текстовом редакторе, и электронная таблица, и база данных, созданная в программе FileMaker. Для более трудоёмких (и более дорогих) решений существует специальное программное обеспечение, например LogiTerm, MultiTerm, Termex, TermStar и т. п.
Словари на компакт-дисках, одноязычные или многоязычные;
Терминологические базы данных, хранимые на компакт-дисках или подключаемые по Интернету, например The Open Terminology Forum или TERMIUM;
Программы для полнотекстового поиска (или индексаторы), которые позволяют пользователю обращаться с запросами к ранее переведённым текстам или разного рода справочным документам. В индустрии переводов известны такие индексаторы, как Naturel, ISYS Search Software и dtSearch;
Программы конкорданса, позволяющие находить примеры слов или выражений в употребляемом контексте в одноязычном, двуязычном или многоязычном корпусе, как битекст или память переводов, например Transit NXT;
Битекст, одно из нововведений последнего времени, это результат слияния исходного текста и его перевода, который впоследствии может быть проанализирован при помощи программ для полнотекстового поиска или конкорданса;
Программное обеспечение для управления проектами, которое позволяет лингвистам структурировать сложные переводческие проекты, передавать выполнение различных задач разным сотрудникам и наблюдать за процессом выполнения этих задач;
Программы управления памятью переводов (TMM), состоящие из базы данных сегментов текста на исходном языке и их переводов на один или более целевых языков, например Transit NXT;
Почти полностью автоматические системы, напоминающие машинный перевод, но позволяющие пользователю вносить определённые изменения в сомнительных случаях. Иногда такие программы называют машинным переводом с участием человека.

Основные преимущества CAT-программ[править | править код]

Современный автоматизированный перевод позволяет собирать собственную библиотеку переводов. Особенно это актуально в случаях, когда слова, словосочетания и даже предложения повторяются много раз. В таких случаях CAT-программа автоматически заменяет уже знакомые слова и помогает переводчику не делать работу дважды.

Что умеют CAT-программы:

помогать переводчику собирать личные словари и глоссарии, которые состоят из слов и словосочетаний по конкретным тематикам (экономика, юриспруденция, маркетинг, медицина);
сохранять форматирование исходного текста, что очень удобно в работе с многоуровневыми списками;
создавать авторские глоссарии с терминами, аббревиатурами, специфическими понятиями, которые используются в какой-то узконаправленной сфере.

См. также[править | править код]

Ссылки[править | править код]

John Hutchins (1998), The origins of the translator’s workstation. // Machine Translation, 13: 287—307, (PDF)

Примечания[править | править код]

↑ Юлия Венцковская. 7 CAT-программ, которые облегчат жизнь переводчика (неопр.). MK:translations (1 июля 2019). Дата обращения: 2 января 2024. Архивировано 2 января 2024 года.
↑ Машина для подбора и печатания слов при переводе с одного языка на другой или на нескольких языках одновременно. А. с. СССР № 40995, 1935 г.
↑ IATE — преемник Eurodicautom (неопр.). Дата обращения: 25 мая 2022. Архивировано 27 ноября 2020 года.
↑ Martin Kay (1980), The Proper Place of Men and Machines in Language Translation. Research report CSL-80-11, Xerox Palo Alto Research Center, Palo Alto, CA. Перепечатано в 1997 году в Machine Translation 12: 3-23, 1997.(PDF)
↑ Claudio Fantinuoli (2006), Specialized Corpora from the Web and Term Extraction for Simultaneous Interpreters. // Baroni, Bernardini (ред.), WaCky! Working Papers on the Web as Corpus, С. 173—190, Wackybook Архивная копия от 31 марта 2022 на Wayback Machine

[1] Юлия Венцковская. 7 CAT-программ, которые облегчат жизнь переводчика (неопр.). MK:translations (1 июля 2019). Дата обращения: 2 января 2024. Архивировано 2 января 2024 года.

[2] Машина для подбора и печатания слов при переводе с одного языка на другой или на нескольких языках одновременно. А. с. СССР № 40995, 1935 г.

[3] IATE — преемник Eurodicautom (неопр.). Дата обращения: 25 мая 2022. Архивировано 27 ноября 2020 года.

[4] Martin Kay (1980), The Proper Place of Men and Machines in Language Translation. Research report CSL-80-11, Xerox Palo Alto Research Center, Palo Alto, CA. Перепечатано в 1997 году в Machine Translation 12: 3-23, 1997.(PDF)

[5] Claudio Fantinuoli (2006), Specialized Corpora from the Web and Term Extraction for Simultaneous Interpreters. // Baroni, Bernardini (ред.), WaCky! Working Papers on the Web as Corpus, С. 173—190, Wackybook Архивная копия от 31 марта 2022 на Wayback Machine

[1]

[2]

[3]

[4]

[5]

Обработка естественного языка
Общие определения	Языковая модель Корпус текстов Речевой корпус Стоп-слова Мешок слов AI-полнота N-грамма Биграммный шифр Триграмма
Анализ текста	Сегментация текста^[англ.] Частеречная разметка Поверхностно-синтаксический анализ Обработка сложных слов^[англ.] Извлечение коллокаций^[англ.] Стемминг Лемматизация Распознавание именованных сущностей^[англ.] Разрешение кореферентности Анализ тональности текста Извлечение концептов^[англ.] Синтаксический анализ Разрешение лексической многозначности Извлечение терминологии^[англ.] Извлечение информации Идентификация языка Определение регистра^[англ.]
Реферирование	Извлечение предложений^[англ.] Генерация реферата Многодокументное реферирование^[англ.] Упрощение текста^[англ.]
Машинный перевод	Автоматизированный Гибридный Интерлингвальный^[англ.] На основе правил На основе примеров На основе словаря^[англ.] На основе трансформации Нейронный Статистический Синхронный
Идентификация и сбор данных	Распознавание речи Синтез речи Оптическое распознавание символов Генерация текста
Тематическая модель	Размещение патинко Латентное размещение Дирихле Латентно-семантический анализ
Рецензирование	Автоматизированная оценка сочинений^[англ.] Конкордансер Предиктивный ввод текста Система проверки грамматики^[англ.] Система проверки правописания Угадывание синтаксиса^[англ.]
Интерфейс на естественном языке^[англ.]	Виртуальный ассистент Виртуальный собеседник Вопросно-ответная система Голосовой интерфейс Интерактивная литература

Автоматизированный перевод

Содержание

История[править | править код]

Общий обзор[править | править код]

Основные преимущества CAT-программ[править | править код]

См. также[править | править код]

Ссылки[править | править код]

Примечания[править | править код]

Навигация

Автоматизированный перевод

История[править | править код]

Общий обзор[править | править код]

Основные преимущества CAT-программ[править | править код]

См. также[править | править код]

Ссылки[править | править код]

Примечания[править | править код]

Навигация

Поиск