Цанцзе (письмо)

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск
Метод ввода Цанцзе

倉頡輸入法 拆碼.jpg

Кодирование иероглифов 倉頡輸入法 («метод ввода Цанцзе») методом Цанцзе.
традиционный китайский: 倉頡輸入法
упрощённый китайский: 仓颉输入法
Значение: метод ввода Цанцзе

Цанцзе (кит. трад. 倉頡輸入法, упр. 仓颉输入法, пиньинь: cāng jié shūrùfǎ, палл.: цанцзе шужуфа) — структурный метод ввода китайских иероглифов, разработанный в 1976 году Чу Бонфу, один из способов ввода иероглифов с клавиатуры пишущей машины, компьютера и так далее.

В основе метода Цанцзе лежит простая геометрическая декомпозиция иероглифа, а не стандартный порядок написания черт и ключи Канси.[1]

Эпоним[править | править вики-текст]

Исторически способы ввода китайских иероглифов путём разложения на составные части появились ещё в конце XIX века для передачи китайских текстов по телеграфу и радио (аналог азбуки Морзе). Разработанный Чу Бонфу метод ввода китайских иероглифов назван в честь Цан Цзе (кит. трад. 倉頡, упр. 仓颉, пиньинь: Cāng Jié, палл.: Цан Цзе) — придворного историографа мифического императора Хуан Ди и легендарного создателя китайской письменности.

Раскладка клавиатуры, ключи (радикалы)[править | править вики-текст]

Раскладка клавиатуры Cangjie

В структурном методе ввода китайских иероглифов «Цанцзе» базовые компоненты получили название «ключи» (или «радикалы»). При этом в стандартной раскладке клавиатуры используются от 25 до 26 клавиш: клавиши «X» и «Z» (либо только «X») кодируют иероглифы специальной группы 重 / 難 «Коллизия»/«Сложные», а остальные 24 кодируют определённые радикалы, которые поделены на группы и ассоциированы с буквами латинского алфавита[1]:

Группа Клавиша Радикал Примечание
Философская группа: A 日 — солнце Философская группа
состоит из 7 радикалов
(или иероглифических ключей),
ассоциированных с латинскими
буквами A—G
B 月 — луна
C 金 — золото
D 木 — лес
E 水 — вода
F 火 — огонь
G 土 — земля
Группа «черты»: H 竹 — бамбук
I 戈 — оружие
J 十 — десять
K 大 — большой
L 中 — центр
M 一 — один
N 弓 — лук
Группа «части тела»: O 人 — человек
P 心 — сердце
Q 手 — рука
R 口 — рот
Группа «формы»: S 尸 — мертвец
T 廿 — двадцать
U 山 — гора
V 女 — женщина
W 田 — поле
Y 卜 — гадать
Специальная группа*: X 難 — «Сложные» 難 — для ввода сложных радикалов.
Z 重 — «Коллизия» 重 — для разрешения коллизий
при декомпозиции иероглифа

*Для ввода иероглифов 重 / 難 специальной группы может использоваться только клавиша X: 重 / 難 «Коллизия»/«Сложные». Если для ввода иероглифов используются клавиши X и Z, то клавише X соответствует только иероглиф 難 — «Сложные».

Таблица радикалов — 24 основных ключа способны дать начало 87 новым иероглифам:

Таблица радикалов: красным обозначены основные иероглифические ключи (радикалы), а чёрным изображены вторичные (связанные с ними) иероглифы.

Приведенной выше таблицы радикалов достаточно для того, чтобы воспроизвести наиболее используемые китайские иероглифы.

Правила и исключения деления на радикалы при декомпозиции иероглифа[править | править вики-текст]

Основополагающие принципы, заложенные в основу декомпозиции[1]:

  • Лаконичность — в том случае, когда возможно несколько вариантов декомпозиции иероглифа следует выбирать наиболее короткий.
  • Полнота — в том случае, когда возможно несколько вариантов декомпозиции иероглифа с одинаковой длинной следует выбирать тот, первый элемент декомпозиции которого является наиболее сложным.
  • Отображение части радикала:
    • Следует (по возможности) избегать использования более одного раза подряд одного и того же иероглифического ключа.
    • При разделении на части необходимо следить за тем, чтобы Форма иероглифа не была «обрезана» по углам.
  • Пропуск кодов:
    • Частичный пропуск — в том случае, когда превышено допустимое количество кодов, используемых при декомпозиции иероглифа, лишние коды следует игнорировать.
    • Пропуск «вложенных» частей — если очертание или часть иероглифа, которая подлежит декомпозиции «огорожена», то кодируется только огораживающая часть, при этом вложенная часть игнорируется.

Правила[править | править вики-текст]

Для правильного деления иероглифа на «радикалы» в ходе создания декомпозиции разработаны основные правила[1]:

  • Направление разбора: слева-направо → сверху-вниз → снаружи-внутрь.
  • У иероглифов, которые состоят из соединённых частей кодированию подлежат только 4 части: первая, вторая, третья и последняя.
  • Иероглифы, которые состоят из двух несоединённых частей (например, 你) необходимо разложить на соединённые части (на примере 你 — это 人 и 尔), затем кодировать 1 и последний радикал первой части, а также 1, 2 и последний радикал второй части иероглифа.
  • Иероглифы, которые состоят из нескольких несоединённых частей (например, 謝) необходимо разложить на соединённые части (на примере 謝 — это 言, 身 и 寸), затем кодировать первый и последний радикал первой части, первый и последний радикал второй части и последний радикал последней части иероглифа.

Исключения[править | править вики-текст]

Некоторые начертания являются исключением из правил и всегда кодируются определённым образом. Лист исключений[1]:

Иероглиф Начертание декомпозиции в Цанцзе
Версия 2 (v2) Версия 3 (v3) Версия 5 (v5)
門 (дверь) 日 弓 (AN)
目 (сетка) 月 山 (BU)
鬼 (призрак) 竹 戈 (HI) 竹 戈 (HI) or HUI
几 (несколько) 竹 山 (HU) 竹 弓 (HN)
贏 (выиграть) 卜 口 月 月 弓 (YRBBN) 卜 弓 月 山 金 (YNBUC)
虍 (тигр [радикал]) 卜 心 (YP)
亡 on top of 口 (吂) 卜 口 (YR) 卜 女 口 (YVR)
隹 (короткохвостые) 人 土 (OG)
气 (газ [радикал]) 人 山 (OU) 人 弓 (ON) 人 一 弓 (OMN)
畿 minus the 田 女 戈 (VI)
鬥 (ведро) 中 弓 (LN)
阝(город) 弓 中 (NL)

Некоторые иероглифы не могут быть разобраны (по методу Цанцзе их вводят с помощью клавиши «Х» клавиатуры, маркированной иероглифом 難 — «Сложные»)[2].

Иероглиф Начертание декомпозиции в Цанцзе (v5)
臼 (ступка) HX
與 (с) HXYC
興 (син) HXBC
盥 (ванна) HXBT
姊 (сестра) VLXH
齊 (ци) YX
兼 (и) TXC
鹿 (олень) IXP
身 (тело) HXH
卍 (свастика) NX
黽 (холстомер) RXU
龜 (черепаха) NXU
廌 (единорог) IXF
慶 (цин) IXE
淵 (йон) ELXL
肅 (СУ) LX

Декомпозиция иероглифов: в соответствии с правилами иероглиф должен быть разделен на радикалы. При этом предпочтительнее использование различных радикалов, которые не пересекаются и не накладываются друг на друга:

Иероглиф 米 倉頡字形特徵.jpg 目 倉頡字形特徵.jpg 央 倉頡字形特徵.jpg 者 倉頡字形特徵.jpg 事 倉頡字形特徵.jpg 匆 倉頡字形特徵.jpg
верно неверно верно неверно верно неверно верно неверно верно неверно верно неверно
Деление на
радикалы
⺌木 木丷 月凵 月一 丨冂大 大冂 十乂日 土丿日 十中肀亅 十口肀亅 勹乂乂 勹丿丿丶
Клавиши
клавиатуры
火木 木金 月山 月一 中月大 大月 十大日 土竹日 十中中弓 十口中弓 心大大 心竹竹戈

Версии[править | править вики-текст]

Демонстрация ввода китайских иероглифов методом Цанцзе версии 5 (англ. Cangjie, version 5)

Метод Цанцзе в своей эволюции дошёл до пятой версии. Тем не менее, наибольшее распространение получила третья версия, совместимая с операционной системой Microsoft Windows. В то же время Mac OS X поддерживает версию Цанцзе, которая является гибридом между версиями 3 и 5[1].

Игровые тренажёры[править | править вики-текст]

Для тренировки навыков ввода радикалов китайских иероглифов структурным методом Цанцзе разработчики внедрили специальную флэш-игру, в которой предусмотрена возможность получения подсказки создания правильной декомпозиции иероглифа, а также необходимой клавиши для кодирования требуемого радикала на клавиатуре компьютера. Кроме того, предусмотрена возможность введения таблицы всех радикалов, которая способствует упрощению процесса обучения для некоторых пользователей[1].

См. также[править | править вики-текст]

Примечания[править | править вики-текст]

  1. 1 2 3 4 5 6 7 ЦанЦзе (Cangjie) — способ ввода китайских иероглифов. shaoboke.blogspot.com. Проверено 17 сентября 2016 года. Архивировано 17 сентября 2016 года.
  2. 倉頡取碼規則及方法

Литература[править | править вики-текст]

  • 李亮生『倉頡輸入一週通』. Taipei 2007, ISBN 957-717-846-4.  (кит.)
  • Ken Lunde: CJKV Information Processing. O’Reilly, Sebastopol (California) 2008, ISBN 978-0-596-51447-1.  (англ.)

Ссылки[править | править вики-текст]