ISO 639

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск
639-1 639-2
Английский язык en eng
Русский язык ru rus
Украинский язык uk ukr
Французский язык fr fra
Чеченский язык ce che

ISO 639 — набор стандартов Международной организации по стандартизации, связанный со стандартизацией названий языков и языковых групп.

Название ISO 639 является также наименованием оригинального стандарта, утверждённого в 1967 году (как ISO 639/R)[1] и выведенного из применения в 2002 году.[2] ISO 639 состоит из шести частей.

Использование кодов ISO 639[править | править вики-текст]

Языковые коды, установленные в разделах ISO 639, используется для библиографических целей, как ключевые элементы языковых данных в компьютерных и интернет-средах. Коды также нашли своё применение в различных приложениях, таких как Википедия, Единый указатель ресурсов (URL).

На базе ISO 639 основывается стандарт RFC 3066, описывающий использование кодов языков в Интернете.

Части стандарта[править | править вики-текст]

Стандарт Наименование Первая редакция Текущая редакция Позиций в списке
ISO 639-1 Часть 1: коды Альфа-2 1967 (как ISO 639) 2002 184
ISO 639-2 Часть 2: коды Альфа-3 1998 1998 >450
ISO 639-3 Часть 3: коды Альфа-3 для всеобъемлющего охвата языков 2007 2007 7704 + локальный диапазон
ISO 639-4 Часть 4: Руководства и общие принципы языкового кодирования 2010-07-16 2010-07-16 (без списка)
ISO 639-5 Часть 5: коды Альфа-3 для языковых семей и групп 2008-05-15 2008-05-15 114
ISO 639-6 Часть 6: коды Альфа-4 используется для всеобъемлющего охвата вариантов языков 2009-11-17 2009-11-17  ?

Языковые стандарты ISO 639 открытые, то есть могут постоянно дополняться. Каждая часть стандарта сопровождается Агентством по техническому обеспечению, которая в случае необходимости и добавляет коды или меняет статусы кодов.

Характеристики отдельных кодов[править | править вики-текст]

Области применения:

  • Отдельные языки
  • Языковые макросемьи ​​(часть 3)
  • Коллекции языков (части 1, 2 и 5)
    • Языковые группы (часть 1 содержит только одну языковую группу: bh, большинство языковых групп кодифицировано в части 2 и несколько было добавлено в часть 5)
    • Остальные группы
  • Диалекты
  • Зарезервировано для локального использования (части 2, 3)
  • Особые ситуации (части 2, 3)

Виды (для отдельных языков):

  • Живые языки (части 2, 3) (все макросемьи ​​живых языков)[3]
  • Мёртвые языки (часть 2, 3) (437 позиций,[4] четыре в части 2: chb, chg, cop, sam, ни одного в части 1)
  • Древние языки (части 1-3) (112 позиций,[5] девятнадцать в части 2 и 5 из них, а именно ave, chu, lat, pli и san — также имеют соответствующий код в части 1: ae, cu, la, pi, sa)
  • Исторические языки (часть 2, 3) (63 позиции,[6] шестнадцать из них находятся в части 2, ни один не имеет соответствия в части 1)
  • Искусственные языки (часть 2, 3) (19 позиций,[7] девять в части 2: epo, ina, ile, ido, vol, afh, jbo, tlh, zbl, пять в части 1: eo, ia, ie, io, vo)

Библиографические и терминологические коды:

  • Библиографические (часть 2)
  • Терминологические (Лексикографические) (часть 2)

Диапазоны кодов[править | править вики-текст]

Альфа-2[править | править вики-текст]

Коды «Альфа-2» (коды состоят из 2 букв современного базового латинского алфавита) используются в ISO 639-1. Однако двухбуквенными комбинациями даже при большом желании невозможно охватить весь широкий спектр языков, комбинаций букв может быть максимум 262=676).

Альфа-3[править | править вики-текст]

Коды «Альфа-3» (коды состоят из 3 букв современного базового латинского алфавита) используются в ISO 639-2, ISO 639-3 и ISO 639-5. Математически, верхний предел для числа языков и языковых коллекций, которые могут быть кодифицированы, следующий 263=17576.

Совместное использование кодов Альфа-3 в трёх частях ISO 639 требует координации в рамках более крупной системы.

ISO 639-2 в том числе включает в себя четыре специальных кода mul[уточнить], und[уточнить], mis[уточнить], zxx[уточнить], зарезервированный диапазон qaa-qtz (20×26=520 кодов) и двадцать три дублирующие записи («B/T» — библиографические и терминологические (лексикографические) — коды). Это составляет 520+23+4=547 кодов, которые не могут быть использованы в части 3 для кодификации языков или же в части 5 для кодификации языковых семей и групп. В остатке 17576-547=17029.

ISO 639-2 содержит все языки, включённые в ISO 639-1 (за исключением сербохорватского и молдавского), и коды для языковых вариантов. Например, в ISO 639-1 для французского языка есть только один код — fr, тогда как в ISO 639-2 для него есть четыре кода: fre/fra для современного французского, frm для средневекового французского (англ. French, Medieval; 1400—1800 годы) и fro для старофранцузского (англ. French, Old; 842—1400 годы).

На сегодняшний день насчитывается около шести или семи тысяч языков на Земле[8]. В связи с этим, 17029 кодов вполне позволяют присвоить каждому языку свой уникальный код, однако это в конечном итоге может привести к тому, что некоторым языкам будут присваиваться произвольные коды, комбинация букв которых не будет соответствовать традиционному названию такого языка.

Альфа-4[править | править вики-текст]

Коды «Альфа-4» (коды состоят из 4 букв современного базового латинского алфавита) используются в ISO 639-6. Верхняя граница для числа языков и диалектов — 264=456976.

См. также[править | править вики-текст]

Примечания[править | править вики-текст]

Ссылки[править | править вики-текст]