Символы, представленные в Юникоде

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

В Юникоде зарезервировано 1 112 064 (= 220 + 216 − 211) позиций символов, из которых сейчас используется свыше 100 000. Первые 256 знакомест совпадают с кодовой таблицей ISO 8859-1 («Латиница-1»).

Кодовое пространство разделено на 17 «плоскостей» по 65 536 (= 216) символов:

  • Плоскость 0 (0000—FFFF): Базовая многоязыковая плоскость (Basic Multilingual Plane, BMP)
  • Плоскость 1 (10000—1FFFF): Дополнительная многоязыковая плоскость (Supplementary Multilingual Plane, SMP)
  • Плоскость 2 (20000—2FFFF): Дополнительная иероглифическая плоскость (Supplementary Ideographic Plane, SIP)
  • Плоскость 3 (30000—3FFFF): Третичная иероглифическая плоскость (Tertiary Ideographic Plane, TIP)
  • Плоскости 4—13 (40000—DFFFF) не используются
  • Плоскость 14 (E0000—EFFFF): Дополнительная плоскость особого назначения (Supplementary Special-purpose Plane, SSP)
  • Плоскость 15 (F0000—FFFFF) используется как дополнительная область-A для частного использования (Supplementary Private Use Area-A, SPUA-A)
  • Плоскость 16 (100000—10FFFF) используется как дополнительная область-B для частного использования (Supplementary Private Use Area-B, SPUA-B)

Базовая многоязыковая плоскость[править | править вики-текст]

Базовая плоскость UNICODE

Базовая плоскость UNICODE
Чёрный — расширенный латинский алфавит;
Голубой — лингвистические символы международного фонетического алфавита IPA;
Синий — другие европейские алфавиты;
Оранжевый — письменности Ближнего Востока;
Светло-оранжевый — письменности Африки;
Зелёный — письменности Южной Азии;
Фиолетовый — письменности Юго-восточной Азии;
Красный — письменности Восточной Азии;
Розовый — унифицированные китайско-японско-корейские символы;
Жёлтый — письменности аборигенов Северной Америки;
Пурпурный — символы;
Тёмно-серый — диакритики;
Светло-серый — суррогатные пары UTF-16 и области для частного использования;
Циан — другие знаки;
Белый — не используется.

Плоскость 0 (Основная многоязыковая плоскость, англ. Basic Multilingual Plane, BMP) содержит символы практически для всех современных письменностей и большое число специальных символов. Большая часть таблицы занята китайско-японскими иероглифами и своеобразными корейскими буквами.

В Unicode 5.2 в этой плоскости представлены следующие наборы символов:

Наборы символов, предложенные для кодирования и находящиеся на стадии рассмотрения:

Дополнительная многоязыковая плоскость[править | править вики-текст]

Плоскость 1 (дополнительная многоязыковая плоскость, англ. Supplementary Multilingual Plane, SMP) отведена, в первую очередь, для исторических письменностей, но включает также символы условных обозначений, такие как музыкальные и математические символы.

Дополнительная многоязыковая плоскость разделена на следующие поддиапазоны:

  • U+10000—U+100FF Линейное письмо Б
  • U+10100—U+1018F Древние системы счисления
  • U+10190—U+107FF Алфавиты, слоговые письменности и наборы символов с направлением письма слева направо
  • U+10800—U+10FFF Алфавиты и слоговые письменности с направлением письма справа налево
  • U+11000—U+11D7F Брахмические письменности
  • U+11D80—U+12FFF Клинопись и другие древние письменности
  • U+13000—U+15BFF Иероглифы древних египтян и майя
  • U+15C00—U+15FFF Ацтекские пиктограммы
  • U+16000—U+167FF Вновь созданные письменности
  • U+16800—U+16FFF Африканские и другие письменности
  • U+17000—U+1B4FF Большие азиатские письменности
  • U+1B500—U+1BBFF Протоэламская письменность
  • U+1BC00—U+1BFFF Стенография
  • U+1C000—U+1CA7F Иероглифы микмак
  • U+1CA80—U+1CDFF Ронго-ронго
  • U+1CE00—U+1CFFF Не используется
  • U+1D000—U+1DFFF Системы условных обозначений
  • U+1E000—U+1E7FF Не используется
  • U+1E800—U+1EFFF Письменности с направлением справа налево
  • U+1F000—U+1F0FF Игровые символы
  • U+1F100—U+1F2FF Наборы буквенно-цифровых и иероглифических символов
  • U+1F300—U+1F7FF Наборы пиктограмм
  • U+1F800—U+1FFFF Не используется

В Unicode 5.2 в этой плоскости представлены следующие наборы символов:

  • Брахмические письменности:
  • Клинопись и другие древние письменности:
  • Иероглифы древних египтян и майя:
  • Системы условных обозначений:
  • Игровые символы:
  • Наборы буквенно-цифровых и иероглифических символов:
    • Набор дополнительных вложенных буквенно-цифровых символов (1F100-1F1FF)
    • Набор дополнительных вложенных иероглифических символов (1F200-1F2FF)

Наборы символов, предложенные для кодирования и находящиеся на стадии рассмотрения:

Дополнительная иероглифическая плоскость[править | править вики-текст]

Плоскость 2 (Дополнительная иероглифическая плоскость, англ. Supplementary Ideographic Plane, SIP) отведена для редко используемых иероглифов ККЯ.

В Unicode 5.2 в этой плоскости представлены следующие наборы иероглифов:

Наборы иероглифов, предложенные для кодирования и находящиеся на стадии рассмотрения:

Третичная иероглифическая плоскость[править | править вики-текст]

Плоскость 3 (Третичная иероглифическая плоскость, англ. Tertiary Ideographic Plane, TIP) зарезервирована для архаичных китайских иероглифов.

Третичная иероглифическая плоскость предварительно разделена на следующие поддиапазоны:

В вышеперечисленные диапазоны предполагается включить следующие наборы иероглифов:

  • в диапазон U+30000—U+317FF — древнейшие китайские иероглифы эпохи Шан (цзягувэнь, 甲骨文), встречающиеся в гадательных надписях на панцирях черепах и костях животных.
  • в диапазон U+32000—U+32FFF — иероглифы эпох Шан и Чжоу (цзиньвэнь, 金文), встречающиеся в ритуальных надписях на бронзовых сосудах и музыкальных инструментах.
  • в диапазон U+34000—U+368FF — иероглифы в стиле «малая печать» (сяочжуань, 小篆).

В будущем также предполагается включить наборы иероглифов Периода Сражающихся царств.

В настоящее время в Консорциуме Юникод поставлен вопрос о будущем названии плоскости 3.

Дополнительная плоскость особого назначения[править | править вики-текст]

Плоскость 14 (Дополнительная плоскость особого назначения, англ. Supplementary Special-purpose Plane, SSP) отведена для символов, используемых по особому назначению.

В Unicode 5.2 в этой плоскости представлены следующие наборы символов:

  • Символы тегов (E0000—E007F)
  • Дополнительные селекторы вариантов начертания (E0100—E01EF)

Области для частного использования[править | править вики-текст]

Некоторые диапазоны Юникода выделены для частного использования и экспериментов. Они включают:

  • Частную область в Базовой многоязыковой плоскости U+E000—U+F8FF
  • Дополнительные плоскости 15 (U+F0000—U+FFFFF) и 16 (U+100000—U+10FFFF)

Ссылки[править | править вики-текст]

Кодировки символов
Основы алфавиттекстфайлданные ) • набор символовконверсия
Исторические кодировки Докомп.: семафорная (Макарова)МорзеБодоМТК-2
Комп.: 6-битнаяУППRADIX-50EBCDICДКОИ-8 ) • КОИ-7ISO 646
современное
8-битное
представление
символы ASCIIуправляющиепечатные ) • не-ASCIIпсевдографика )
8-битные код.стр. Кириллица: КОИ-8ГОСТ 19768-87MacCyrillic
ISO 8859 1 (лат.)2345 (кир.)6789101112131415 (€)16
Windows 12501251 (кир.)1252125312541255125612571258WGL4
IBM & DOS 437850852855866 «альт.»МИКНИИ ЭВМ
Многобайтные Традиционные DBCSGB2312 ) • HTML
Unicode UTF-32UTF-16UTF-8список символовкириллица )
Связанные темы интерфейс пользователяраскладка клавиатурылокальперевод строкишрифткракозябрытранслитнестандартные шрифтытекст как изображение
Утилиты iconvrecode