Локализация программного обеспечения

Материал из Википедии — свободной энциклопедии
(перенаправлено с «L10n»)
Перейти к навигации Перейти к поиску
Программное обеспечение, локализованное на итальянский язык. Видна попытка сделать нейтральную иконку — глобус, повёрнутый Атлантическим океаном.

Локализа́ция програ́ммного обеспе́чения — процесс адаптации программного обеспечения к культуре какой-либо страны. Как частность — перевод пользовательского интерфейса, документации и сопутствующих файлов программного обеспечения с одного языка на другой.

Для локализации в английском языке иногда применяют сокращение «L10n», где буквы «L» и «n» — начало и окончание слова Localization, а число 10 — количество букв между ними.

Что такое локализация[править | править код]

MikTeX — пример сложного ПО, локализованного не полностью.
Зелёные — функции, которые начинают работать сразу после подключения языкового пакета:
1. Ввод и отображение русских букв.
2. Ключевое слово «Глава».
Оранжевые — функции, присутствующие в MikTeX, но требующие от пользователя дополнительных действий.
3. Наклонный знак «≤» — вводится командой \leqslant (вместо \le).
Красные — функции, не адаптированные под русскую типографику (а пакетов, исправляющих это, в стандартной поставке нет).
4. Курсивный знак интеграла.
5. Курсивная греческая буква.

Локализация не ограничивается переводом интерфейса на другой язык. Это многоуровневая операция, первые шаги которой можно выполнить, даже оставив интерфейс нетронутым,[1] а последние — требуют взаимодействия программистов, дизайнеров и переводчиков[2]:

  1. Обеспечить поддержку языка и национальных стандартов — необходимый минимум, чтобы программа могла выполнять свои функции в другой стране. Современные ОС берут на себя многие из этих вопросов, но и программист должен быть достаточно квалифицированным, чтобы использовать их возможности.
  2. Перевод текстов в интерфейсе программы на целевой язык.
    • В сложном ПО не все части стоит переводить. Например, многие не согласны с переводом имён функций Excel на русский язык. Некоторые ошибки ОС выводятся, когда компьютер ещё не способен показывать русские буквы, при том, что специалист, кому эти сообщения адресованы, поймёт и английские.
    • Корректное выравнивание и размещение элементов интерфейса с учётом того, что сообщения-строки в разных языках могут иметь существенно разные размеры (например, обычное сообщение на английском, будучи переведено на немецкий язык, как правило, становится длиннее на 17,3 %[7]). Кроме того, существуют языки с написанием справа налево (арабский, иврит) и сверху вниз (японский);
    • Чрезвычайно важен перевод терминологии. Например, спорным является применяемый в Windows термин «обозреватель», обозначающий браузер.
    • Если есть текст на изображениях, его нужно перерисовать. Если есть речевые сообщения, их надо наговорить.
  3. Тонкая настройка под целевую страну.
    • Работа со словоформами. Примером будет пресловутое «Найдено 3 файлов».
    • Дополнительные стандарты, не влияющие на основную функциональность программы. Например: формат даты/времени в медиаплеере, особенности типографики.
    • Обеспечить интероперабельность локализированной программы с исходной. Например: мы ввели в документ формулу «x*2,5». Будет ли она работать, если открыть его в английской версии? Наладили сетевую игру русского с английским — не разорвёт ли связь, сославшись на несовпадение версий?
    • Обеспечить интероперабельность программы с ПО, распространённым в целевой стране. Например, от страны к стране варьируются бухгалтерские программы, и «1С: Предприятие» мало известно за пределами стран СССР.
    • Учёт национального менталитета. Например: красный цвет у русских ассоциируется не только с опасностью, но и с праздником. В играх зачастую приходится менять юмор, а изредка — даже корректировать сюжет (например, в Syberia 2 турецкий иммигрант Sirkos превратился в еврея Цукермана).
    • Американский почтовый ящик, который мы привыкли видеть в программах электронной почты
      Перерисовка графики (сплэш-экранов, значков, клипартов и т. д.) под реалии другой страны. Например, в разных странах могут выглядеть по-разному дорожные знаки, вилки и розетки, почтовый ящик. Глобус поворачивают к зрителю той частью света, на которую рассчитывается продукт. В Великобритании у выключателя включенным является нижнее положение, в бывшем СССР — верхнее. Значки перерисовывают крайне редко, поэтому дизайнеры изначально стараются сделать их как можно более «интернациональными».

Таким образом, локализация — это сложная и всеобъемлющая операция[8], и уже при разработке ПО соображения будущей интернационализации должны учитываться самым серьёзным образом. Мы привыкли видеть программное обеспечение, русифицированное по первому-второму уровню; сложного ПО с исчерпывающей русификацией практически не существует. Примером глубокой локализации может служить операционная система Mac OS X компании Apple, где локализация нередко включает и национально-ориентированные пиктограммы.

Инструментарий для локализации[править | править код]

Некоторые инструменты для визуального программирования предоставляют возможности и инструменты для облегчения локализации. Например, в GTK чаще всего нет необходимости специально заботиться о разной длине строк в разных языках, так как виджеты автоматически запрашивают необходимый для себя размер.

Однако в большинстве случаев эти возможности значительно ограничены, что сильно отражается на итоговой стоимости локализации. В этих инструментах нет средств для работы с переводчиком, нет автоматизированных проверок перевода, да и контролировать перевод приложения среднего размера становится невозможно. Поэтому, приступая к локализации, стоит задуматься о специализированных средствах, заточенных именно на задачу перевода программного обеспечения.

Для локализации программного обеспечения часто применяются специализированные средства, например, Passolo, которые позволяют переводить меню и сообщения в программных ресурсах и непосредственно в откомпилированных программах, а также тестировать корректность локализации. Для перевода аудиовизуальных материалов (главным образом фильмов) также используются специализированные средства, например, Swift, которые объединяют в себе некоторые аспекты памяти переводов, но дополнительно обеспечивают возможность появления субтитров по времени, их форматирования на экране, следования.

Ресурсы Windows могут существовать в одной программе в нескольких языках — программа берёт, например, русский, а если он не существует, то английский. При этом русскими могут быть не только тексты, но и иконки — Ж, К, Ч в редакторе документов.

Псевдолокализация[править | править код]

Когда программа дорастает до первого перевода, возникает порочный круг. Нужно проверить, что функции перевода работают: окна компонуются, строки подставляются, после смены языка ничего не остаётся на старом, ни одна строка не проходит через однобайтовую кодировку (последнее актуально для некоторых старых систем программирования вроде Embarcadero Delphi). Для этого нужна другая локализация, но её нет — чтобы дать задание переводчику, нужно быть уверенным, что оно достаточно полное и не придётся несколько раз давать строки на доперевод.

Для подобной начальной проверки используется так называемая псевдолокализация — какое-либо автоматическое преобразование исходного текста. Например: Open file≈§Ópèñ fílè×. В англоязычных странах в роли псевдолокализации любят поросячью латынь (и даже оставляют её как пасхальное яйцо).

В условиях бывшего СССР, когда любой программист знает два, а то и три языка — русский, английский и национальный — псевдолокализация не так нужна, ведь программист (или кто-то из находящихся рядом, например тестер) своими силами может сделать доперевод или даже полный перевод. Но даже тут есть препятствия: программист дороже переводчика, может не иметь нужных навыков (от владения художественным словом до обычной грамотности), программе для западной публики русский перевод попросту не нужен.

Параллельная разработка и локализация[править | править код]

Если программа не приходит переводчикам готовой раз в несколько лет, а постоянно разрабатывается по принципам непрерывной интеграции, возникает вопрос доперевода новой функциональности и создания строк-затычек (строк на исходном языке или с автоматическим переводом, если переводчика нет).

Простейший вариант перевода «живой» программы сделан в Gettext, Qt Linguist — оригинал зашит в исходный текст программы, а для остальных языков ресурс хранится в виде «Save file=Сохранить файл». Достоинства такого механизма: быстрое создание интернациональной программы из монолитной[9]; строки-затычки автоматически есть; если исходный текст изменился и переводчик до него не дошёл, система гарантированно не возьмёт старый (возможно, неверный) перевод; работать можно даже в текстовом редакторе; автоматически удаляются брошенные строки. Недостатки: за текст-оригинал отвечает программист, что требует от него грамотности и готовности вносить изменения; если текст-оригинал изменился, переводчик не видит (или плохо видит), как было; функционально далёкие строки объединяются в одну, если программист не объявил иное[10] — строка «Файлы/-ов» в Tixati говорит, что один и тот же текст использовался в заголовке «Files» и синтезированном тексте «2 Files»; не решается вопрос сборки осмысленных предложений (те же «2 Файлы/-ов» в Tixati); сложно перевести часть программы (например, окно) и посмотреть её вживую — строки из разных мест могут быть перемешаны.

Существуют и более сложные механизмы.

Языковые теги и коды[править | править код]

Языковые теги могут использоваться для обозначения региональных особенностей того или иного языка. Имеется основной субтег для идентификации языка (например, «en» для английского) и возможный дополнительный субтег для уточнения региона использования (например, «GB» — Great Britain, Великобритания). Между субтегами обычно ставится дефис, в отдельных случаях — знак подчёркивания.

Примеры языковых тегов:

  • Английский язык: en-GB (британский английский), en-US (американский английский), en-AU (австралийский английский).
  • Испанский язык: es-ES (кастильский испанский, письменный и разговорный язык Испании), es-MX (мексиканский испанский), es-AR (аргентинский испанский), es-CO (колумбийский испанский).
  • Португальский язык: pt-PT (европейский португальский, письменный и разговорный язык Португалии), pt-BR (бразильский португальский).
  • Китайский язык: zh-CN (материковый Китай, упрощённые иероглифы), zh-TW (Тайвань, традиционные иероглифы), zh-HK (Гонконг, традиционные иероглифы).
  • Русский язык: ru-RU (русский, Россия).

Языковые коды определяются стандартом ISO 639-2 в виде трёхбуквенного термина для идентификации каждого языка, например «eng» для английского или «tvl» для языка Тувалу. В то же время, эти коды не могут использоваться в качестве тегов, если соответствующий язык имеет двухбуквенный код согласно стандарту ISO 639-1.

См. также[править | править код]

Примечания[править | править код]

  1. 1 2 3 Adobe InDesign в Индии: локализация без перевода — полезные статьи на сайте бюро переводов «Транслинк». Дата обращения: 25 декабря 2015. Архивировано 26 декабря 2015 года.
  2. FoxSoft=Инструменты локализации: Русификация программных продуктов
  3. Точка с запятой. IT Happens (9 августа 2011). — Пример ПО, некорректно работающего в локализованной ОС. Дата обращения: 7 февраля 2014. Архивировано 22 февраля 2014 года.
  4. Why isn’t my time zone highlighted on the world map? | The Old New Thing. Дата обращения: 29 апреля 2022. Архивировано 15 апреля 2016 года.
  5. Например, старые версии Winamp с растровым шрифтом корректно работают в локализированной ОС, но не выводят русских названий.
  6. Байки из локализаторской: Ода шрифтам — новости «ТрансЛинк». Дата обращения: 25 декабря 2015. Архивировано 26 декабря 2015 года.
  7. Язык в интерфейсе: на короткий-длинный рассчитайся! Дата обращения: 29 апреля 2022. Архивировано 10 июля 2018 года.
  8. 7 ключевых аспектов локализации игры. Дата обращения: 19 июня 2014. Архивировано 15 июля 2014 года.
  9. Why (GNU gettext utilities)
  10. Contexts (GNU gettext utilities)

Ссылки[править | править код]