Транслит
Трансли́т (название произведено сокращением слова «транслитерация») — передача текста, записанного не латиницей, латинскими буквами, а также цифрами и иными доступными на клавиатуре компьютера знаками. Так могут называть и сам нелатинский текст, набранный латинскими буквами.
У этого термина существуют синонимы, например по-болгарски транслит может называться шльо̀кавица или мето̀диица.
По некоторым сведениям, в профессиональной речи слово «транслит» иногда используется вместо слова «транслитерация».[1]
| Буква | Транслит | Буква | Транслит | Буква | Транслит | ||
|---|---|---|---|---|---|---|---|
| а | a | к | k, c | ч | ch, č, Ψ, 4 | ||
| б | b, 6 | л | l, Jl, Λ | ш | sch, sh, š, w, Ψ, 6 | ||
| в | v, w | м | m | щ | sh, shch, sch, šč, shh, w |
||
| г | g, Γ, s | н | n | ||||
| д | d, Δ, g | о | o | ъ | ', y, j, '', #, опускается |
||
| е | e, ye, je, ie | п | p, Π, n | ||||
| ё | yo, jo, io, e | р | r | ы | y, i, q, bl | ||
| ж | zh, ž, j, z, g, *, >|< | с | s | ь | ', y, j, b опускается |
||
| з | z, 3 | т | t, m | ||||
| и | i, u | у | u, y | э | e, e', eh | ||
| й | y, j, i, u, опускается; ий → iy, ый → yy; -ий/ый → i, y |
ф | f, Φ | ||||
| х | h, kh, x | ю | yu, ju, iu, u | ||||
| ц | c, ts, z, u | я | ya, ja, ia, ea, a, q, 9I |
Содержание |
[править] Принцип
Транслит, в целом, строится по принципу фонетических соответствий русских и латинских букв. Часто сочетаются правила чтения из разных языков: прежде всего, конкурируют соответствия из старых латинских транскрипций польско-немецкого толка (й→j, ц→c, ы→y, ю→ju, я→ja) и позже усвоенные английские (й→y, ц→ts, ч→ch, ш→sh, ю→yu, я→ya…). Может использоваться и визуальное сходство знаков (ш→III или ш→w; ч→4; я→9I; ы→bl) — однако, умеренно, поскольку в противном случае, говорят уже не о транслите, а о «кодировке Волапюк». Заимствованные слова (и даже отдельные морфемы) могут передаваться в написании оригинала.
[править] Типы транслита
| Возможно, эта статья содержит оригинальное исследование.
Добавьте ссылки на источники, в противном случае она может быть выставлена на удаление.
Дополнительные сведения могут быть на странице обсуждения. (11 мая 2011) |
Транслит однозначных и устойчивых правил не имеет — в этом, собственно, и состоит его отличие от транслитерации. Он варьирует от человека к человеку: у одних совершенно стихиен, когда одно и то же слово может передаваться по-разному на соседних строках, — у других же доходит до достаточно стройных систем, иногда совпадающих с каким-либо стандартом транслитерации, а иногда индивидуальных. Особенности применяемой разновидности транслита могут служить своего рода идентификатором автора сообщения.
Неупорядоченность и неоднозначность транслита (иногда сравниваемая [1] с временами до Кирилла и Мефодия, когда, по словам Черноризца Храбра, славяне пользовались «римскими и греческими письменами… без устроения») нередко создаёт проблемы при его чтении. Чтобы не возникало путаницы, желательно придерживаться распространённых стандартов транслитерации (например, ISO 9).
Существует четыре основных типа транслита:
- Транскрипция — транслит, основанный на звучании букв. Близок к стандартным системам транскрипции букв наподобие ISO 9. Например, Vikipediya. Используется для написания СМС, в адресах русскоязычных сайтов, при работе в компьютерных программах, не поддерживающих кириллицу, и др. Характеризуется простотой ввода — нужны только латинские буквы. Некоторые трудности при чтении создают звуки, обозначаемые несколькими буквами: «ж» (zh), «ч» (ch), «ш» (sh), «щ» (shch).
- «Один символ — одна буква». Наследники МТК-2 и КОИ-8. Алфавит расширяется спецсимволами наподобие @ и ^ для полной обратимости конвертации. Такой способ транслитерации труден и в наборе, и в расшифровке, поэтому используется очень редко — там, где обратимость важна. Например, Wikipediq.
- «Геймерский язык» («кодировка Волапюк», Leet). Применяются латинские буквы (с добавленим цифр и знаков препинания), внешне похожие на соответствующие русские буквы. Например, BuKunEDu9I. Этот способ ввода получил своё название из-за того, что во многих компьютерных играх (даже в русифицированных) нет возможности использования кириллицы в никах, и игроки часто пишут русские ники таким образом. Иногда такой способ набора используется в адресах русскоязычных сайтов. Например, kypc.ru, nouck.ru. Геймерский язык достаточно легко читается (если к нему привыкнуть), но для длинных сообщений непригоден, так как очень сложен в наборе. Крайне редко используется для написания СМС. И вот несколько интересных примеров: JIanIIIa, BaH9l, geMo6uJIu3aILu9l, BJIaguMup UJIbu4 JIeHuH, ruTJIep u gpyruE.
- «Вульгарный». Смесь транскрипции и геймерского языка, популярная в народе. Компромисс между простотой ввода и удобочитаемостью. Например, 4ernuy для записи слова «чёрный». Обычно используют «икс» для обозначения «х», четвёрку для обозначения «ч», звёздочку для «ж» и иногда «w» для «ш». Другие буквы передают с помощью фонетической транскрипции. Возможны различные вариации.
Особая транслитерация применяется в «пиратских» переводах игр: латинские буквы заменяются похожими русскими. Сами буквы почти всегда одинаковые — АВСДЕГЖНіЬКЛМИОРЦЯЫТЮФШХУП (i игнорируется, цифра 3 используется как З и Э, а цифра 6 используется как Б). Такая конструкция позволяет выводить и русский, и английский текст, не заводя новых кодовых позиций.
[править] Современный тип транслита (транскрипция)
В настоящее время чаще всего используется логичный тип транслита, основные принципы которого состоят в следующем: Обозначения должны быть такими, чтобы транслит можно было однозначно перевести обратно в латиницу (в т.ч. автоматически), как бы даже не зная конкретных слов, но при этом учитывая некоторые правила русского языка. Из этого следует, что любые спорные моменты и неточности должны однозначно разрешаться в пределах какого-либо данного перевода, то есть обозначение отдельной буквы не должно отличаться в пределах конкретного текста. Каждая буква, которой можно найти более-менее чёткое соответствие в латинице, обозначается одной буквой латиницы. (Это буквы А, Б, В, Г, Д, З, И, Й, К, Л, М, Н, О, П, Р, С, Т, У, Ф, Ы, не всегда Ц, Э, Е, редко Х, Ж). После буквы Й перед гласными ставится апостроф, дабы не путать буквы "е", "ё", "ю", "я" со слогами "йэ", "йо", "йу", "йа". Если букве не удаётся найти ясного соответствия в латинице, буква передаётся двумя латинскими (Ё, Ж, Ч, Ш, Ю, Я, Е, чаще всего Х, Ж, иногда Ц), или тремя-четырьмя (Щ). (Кроме того, мягкий и твёрдый знаки передаются с помощью апострофа).
| Кириллица | Латиница | Наиболее применимый вариант |
|---|---|---|
| А | A | A |
| Б | B | B |
| В | V | V |
| Г | G | G |
| Д | D | D |
| Е | E | Ye в начале слов и после гласных, E в остальных случаях |
| Ё | E | YO |
| Ж | ZH | Ж |
| З | Z | Z |
| И | I | I |
| Й | Y | Y |
| К | K | K |
| Л | L | L |
| М | M | M |
| Н | N | N |
| О | O | O |
| П | P | P |
| Р | R | R |
| С | S | S |
| Т | T | T |
| У | U | U |
| Ф | F | F |
| Х | H | X |
| Ц | ts | Ts (в начале слова и после гласных) и S (после согласных) |
| Ч | CH | CH |
| Ш | SH | Sh |
| Щ | SHCH | Shch |
| Ъ | " | ’ |
| Ы | Y | I‘ |
| Ь | ' | отменяется |
| Э | E | E |
| Ю | YU | Yu |
| Я | YA | Ya |
| ДЖ | J | J |
Для 25 букв кириллицы в современном варианте транслита найдено единственное обозначание, что видно из таблицы. Это - буквы А, Б, В, Г, Д, Ё, З, И, Й, К, Л, М, Н, О, П, Р, С, Т, У, Ф, Ч, Ш, Ы, Ю, Я. Некоторые спорные моменты и неточности касаются как раз тех букв, для которых в приведённой выше таблице даны по нескольку обозначений. Все спорные моменты касаются только букв обозначаемых теми латинскими буквами, которые могут встречатся и в обозначении других букв кириллицы.
Первая неточность касается букв Е и Э. В начале слов и после гласных буква Е обозначается сочетанием YE. После согласных с первого взгляда кажется логичным обозначить её просто латинской E, но это же касается и Э, а если обозначить две разных кириллических буквы одной латинской, это в данном случае будет противоречить принципам. Из этого противоречия есть два варианта выхода. Первый состоит в том, что Е везде (в т.ч. после согласных) обозначается сочетанием YE, а Э латинской E. Второй - Е после согласных обозначаетя всё-же просто латинской E , а Э всегда обозначается сочетанием EH или HE (какой из этих вариантов использовать - также спорный вопрос). Во втором варианте возможен ещё подвариант когда Е всегда обозначаетя латинской E. Кроме того для буквы Э во втором варианте есть и обозначение без использования буквы H, а просто с добавлением к E апострофа - E' . Букву Х кажется логичным обозначить как H, но эта буква ей не вполне точно соответствует и используется в сочетаниях для других букв - шипящих и вариантов Э, поэтому, чтобы не путать между собой, например сочетание сх и букву ш, рекомендуется обозначать букву Х сочетанием KH. Букву Ж можно обозначить как J, но эта буква ей не вполне соответствует, и чаще по аналогии с Ш буква Ж обозначается как ZH. Буква Ц обозначается латинской C, также часто используется сочетание TS, но оно менее рекомендуется, так как в этом случае буква "ц" будет не отличима от сочетания "тс" (хотя можно отличить сочетание тся как tsya, поскольку ця в русских словах обычно не встречается). Альтернативный вариант для Ц - латинское сочетание TC. Оно выглядит непривычно, но позволяет добиться однозначного соответствия и избежать путаницы как с "тс", так и возможной между "ч" и "цх", "цэ". Для буквы Щ логичным выглядит SCH, но это обозначение идентично обозначению для "сч", поэтому используется SHCH. Чтобы не использовать сразу четыре буквы есть альтернативный вариант - SHC (сочетание шц практически не встречается).
Наиболее часто встречающиеся ошибки при использовании данного варианта транслита бывают связаны с обозначением букв Ы и Й (особенно в сочетаниях ий, ый), буквы Ё, а также иногда сочетания кх. В последнем случае следует не забывать, какой вариант выбран для обозначения буквы Х: если это буква H, то для сочетания кх естественно используется kh, но чаще для Х используется сочетание KH, и в этом случае для кх должно использовальзовать kkh. Что касается буквы Ё - в русском языке стоит вопрос о допустимости или недопустимости писать её в некоторых случаях без точек, как Е. Но, не зависимо от того, как она написана кириллицей, с точками или без, при переводе в латиницу буква Ё в любом случае обозначается как YO. Ошибка тут может заключаться в том, что Ё может быть обозначена как Е, особенно при автоматическом переводе. Весьма распространёнными являеются ошибки, связаные с обозначением Ы и Й. Ясно, что обе эти буквы обозначаются как Y. Это не противоречит принципам, так как, несмотря на одинаковое обозначение, эти буквы можно отличить в любых словах: Ы всегда идёт после согласных, а Й после согласных не встречается, латинским сочетанием yy всегда обозначается ый, других сочетаний быть не может (сочетания йй, ыы и йы где-либо не встречаются). Не следует путать, например перевод русских фамилий с окончаниями -ый, -ий на английский и другие языки, с переводом кириллицы в латиницу. При переводе на латиницу сочетания ий и ый обозначаются естественно соответственно как iy и yy.
Выбор варианта - в соответствии с принципами - для спорных букв, зависит от выбора варианта для других из них. В такой зависимости между собой находятся обозначения букв Е, Ж, Х, Ц, Щ, Э.
| А а | B b | Ch ch | D d | E e | F f | G g | H h |
| I i | J j | Ж ж | K k | L l | M m | N n | O o |
| P p | R r | S s | Sh sh | T t | U u | V v | X x |
| Y y | Z z | ‘ | ’ | ' | C c | Q q | W w |
Курсивом выделены буквы, которые используются в заимствованных словах или иностранных именах.
Пример:
Войцех Ярузельский: Wojcech Jaruzelski
Клемент Готтвальд: Klement Gottwald
Николае Чаушеску: Nicolae Ceaușescu
Эндрю: Andrew
' используется после заимствований:
Войцеха Ярузельского: Wojcech'a Jaruzelskogo
Клемента Готтвальда: Klement'a Gottwald'a
Николае Чаушеску: Nicolae Ceaușescu
Эндрю: Andrew
| Кириллица | Латиница | ROUSSEL-2011 |
|---|---|---|
| А | A | A |
| Б | B | B |
| В | V | V |
| Г | G | G |
| Д | D | D |
| Е | YE после гласных и в начале слов, E после согласных | E |
| Ё | YO | YO |
| Ж | ZH | J |
| З | Z | Z |
| И | I | I |
| Й | Y (Y' перед гласными) | Y (Y' перед гласными) |
| К | K | K |
| Л | L | L |
| М | M | M |
| Н | N | N |
| О | O | O |
| П | P | P |
| Р | R | R |
| С | S | S |
| Т | T | T |
| У | U | U |
| Ф | F | F |
| Х | KH | Х |
| Ц | TC | TS |
| Ч | CH | TC |
| Ш | SH | C |
| Щ | SHC | W |
| Ъ | ' | H |
| Ы | Y | IH |
| Ь | ' | Y |
| Э | E' | EH |
| Ю | YU | YU |
| Я | YA | YA |
Транслит, соответствующий данному конкретному приведённому примеру (столбец "Латиница" таблицы), позволяет перевести русский текст в латиницу и обратно соответственно принципам без каких либо потерь только при условии исключения из исходного кириллического текста некоторых сочетаний, а именно: "ыы", "йй", "йы","ы" перед гласными, "й" после согласных, "ь" и "ъ" после гласных и "й". Здесь небольшое количество таких сочетаний обусловлено тем, что все сочетания для согласных образуются за счёт добавления к различным согласным только двух букв - H и C, притом только на конце, за исключением Ч. Возможно, для данного примера количество сочетаний исключения из исходного кириллического текста - наименьшее. При выборе других однозначных обозначений для каждого конкретного случая необходимо подобным образом учитывать свои сочетания.
[править] Применение
Транслит как явление (ещё без названия) возник в докомпьютерные времена (подобным образом, например, с середины XIX века передавали русские тексты международным телеграфом; см. также МТК-2), но особенно широко распространился в интернет-общении в связи с существовавшими (порой и существующими) проблемами отображения (см. «крокозябры») либо ввода русских букв — например, их может не быть на доступной в данный момент клавиатуре. Транслит активно применяется при общении посредством SMS, поскольку сообщение, набранное латиницей, может содержать примерно вдвое больше букв, чем при использовании кириллицы в кодировке юникод.
Имеется несколько несовместимых между собой[2] советских и российских официальных стандартов и правил транслитерации кириллицы латинским алфавитом:
- Приложение № 7 к инструкции о порядке оформления и выдачи паспортов гражданам Российской Федерации для выезда из Российской Федерации и въезда в Российскую Федерацию[3] (отменен приказом ФМС от 3 февраля 2010 г. № 26)
- ГОСТ 16876-71
- СЭВ 1362-78
- ГОСТ 7.79-2000 (перевод ISO 9)
- ГОСТ Р 52535.1-2006 Приложение А
В некоторых стандартах, например ГОСТ 16876-71 и ГОСТ 7.79-2000, описано несколько систем транслитерации. Одна для версии символ в символ (с использованием латинских диакритических символов), другая для преобразования одного символа кириллицы в один или несколько символов латиницы без диакритики.
[править] Транслит в Интернете — изменения в XXI веке
В 1996—1999 гг. транслит был широко распространён в Интернете: в форумах и группах новостей Usenet, особенно вне России, было очень много сообщений транслитом; авторские сайты бывали в транслите. Но благодаря прогрессу в компьютерных технологиях, в XXI веке это кардинально изменилось, стало совсем легко поддерживать и чтение и ввод кириллицы.
Последнее время российские пользователи Интернета хотят уйти от использования транслита. Это связано с созданием кириллической зоны .РФ. Говоря о целевой аудитории .РФ-сайтов, эксперты приводят следующую статистику [4]:
Русский язык занимает пятое место в мире по распространенности, является одним из шести официальных языков Организации Объединенных Наций, им владеют более 300 млн. людей в мире, из них 160 млн. считают русский язык родным и только 34 % владеют английским языком на начальном уровне. Таким образом, зона .РФ даст возможность более 100 млн. человек использовать Интернет на более понятном языке.
- Чтение
- Кириллица изначально поддерживается в обычных шрифтах, включенных в поставку любой популярной операционной системы, будь то немецкая или корейская. Можно читать ru.wikipedia.org даже в интернет-кафе в Токио.
- Ввод
- Клавиатурные средства ввода кириллицы тоже изначально присутствуют, только в отличие от шрифтов, их надо активировать — обычным образом добавить русскую («RU») раскладку клавиатуры (keyboard layout), точно так же, как французскую («FR»). Причём можно настроить — на выбор — несколько разных раскладок (англ. keyboard layouts) для одного языка.
Сотни тысяч русскоговорящих людей по всему миру, из тех, кто в XX веке годами писали транслитом сейчас общаются на форумах, в блогах и по e-mail используя стандартную кириллицу, так как сейчас:
- Не обязательно вводить именно с обычной, стандартной русской раскладкой клавиатуры (расположением букв), можно использовать метод В. Маслова — фонетическую раскладку основной, системной клавиатуры (см. ниже ссылку на Обзор методов ввода), когда ввод, при «RU», идет в режиме, привычном для таких людей: А—A, Б—B, Д—D, Ф—F, К—K, О—O,…
- В ситуации использования «чужого компьютера», например, в интернет-кафе в Барселоне, уже не надо использовать устаревшие методы (см. ниже ссылку на Обзор методов ввода) — не требуется трудоёмкий ввод мышкой с помощью виртуальной клавиатуры или ненадёжные «перекодировщики текста, введенного латиницей». Можно и в интернет-кафе производить ввод текста удобно и привычно — точно как дома: на современных сайтах, где полностью имитируется «домашний», «системный» ввод, и можно вводить с той же раскладкой, что дома — стандартной или фонетической.
Современные, простые методы ввода кириллицы (включая метод В.Маслова) за рубежом — дома или в Интернет-кафе — собраны в Обзоре «FAQ-Часто Задаваемые Вопросы: как писать кириллицей вне России/СНГ»
[править] Примечания
- ↑ ГРАМОТА.РУ — справочно-информационный интернет-портал «Русский язык» | Словари | Проверка слова
- ↑ Сравнительная таблица стандартов транслитерации
- ↑ Приказ Министерства внутренних дел Российской Федерации от 31 декабря 2003 г. N 1047 г. Москва О внесении изменений и дополнений в приказ МВД России от 26 мая 1997 г. N 310 «Об утверждении Инструкции о порядке оформления и выдачи паспортов гражданам Российской Федерации для выезда из Российской Федерации и въезда в Российскую Федерацию»
- ↑ Мифы о домене РФ развеяны (рус.)
[править] См. также
[править] Ссылки
[править] Статьи
- Ещё одна система русской латиницы (приведены скрипты для перекодировки)
- Сравнительная таблица систем транслита в латиницу, морс, грузинский и т. д.
- Жалобы на «перекодировщики» сочетаний латинских букв в кириллицу
[править] Сервисы и утилиты, трансформирующие текст на латинице в кириллицу
- translit.ru — транслитератор для русского, украинского и белорусского языков
- translit.ru/Помощь — обходные пути для случаев, дающих ошибки трансформации
- Альтернативы: porusski.net, Translitor.net, transliter.ru, Trsl.me, translit-plus.net
- Расширение для Firefox
- Конвертер русского текста в т. н. «Геймерский язык» («кодировка Волапюк»)
| Кодировки символов | |||
|---|---|---|---|
| Основы → | алфавит • текст ( файл • данные ) • набор символов • конверсия | ||
| Исторические кодировки → | Докомп.: семафорная (Макарова) • Морзе • Бодо • МТК-2 | Комп.: 6 бит • УПП • RADIX-50 • EBCDIC ( ДКОИ-8 ) • КОИ-7 • ISO 646 | |
| совре- менное 8-битное представ- ление |
символы → | ASCII ( управляющие • печатные ) | не-ASCII ( псевдографика ) |
| 8бит. код.стр. | Разные → Кириллица: КОИ-8 • ГОСТ 19768-87 • MacCyrillic | ||
| ISO 8859 → | 1(лат.) 2 3 4 5(кир.) 6 7 8 9 10 11 12 13 14 15(€) 16 | ||
| Windows → | 1250 1251(кир.) 1252 1253 1254 1255 1256 1257 1258 | WGL4 | ||
| IBM&DOS → | 437 • 850 • 852 • 855 • 866 «альт.» • ( МИК ) • ( НИИ ЭВМ ) | ||
| Много- байтные |
Традиционные → | DBCS ( GB2312 ) • HTML | |
| Unicode → | UTF-16 • UTF-8 • список символов ( кириллица ) | ||
| Связанные темы → |
интерфейс пользователя • раскладка клавиатуры • локаль • перевод строки • шрифт • кракозябры • транслит • нестандартные шрифты • текст как изображение | Утилиты: iconv • recode | |

