Обсуждение:Кириллица в Юникоде
Вопросы:[править код]
1) Не следует ли пересортировать таблицу так, чтобы соответствующие большие и маленькие буквы всегда стояли рядом (типа АаБбВвГгДд)? Но тогда буквы не будут стоять в порядке своих юникодовских номеров.
2) Нужны ли и английские (официальные юникодовские), и русские названия букв, или же сделать только русские? — Monedula 15:07, 28 июля 2005 (UTC)
3) Наверное, стоит добавить специальный юникодный фонт для корректного отображения расширенной кириллицы?
- Ответы CodeMonk 21:49, 28 июля 2005 (UTC) :
1) Нет, но имхо следует пересортировать так, чтобы «Основной русский алфавит» оказался вначале, а «Расширения кириллицы» потом. Порядок Юникодовских номеров здесь не важен.
2) Имхо сделать только русские.
3) Стоит. Только бы знать где его взять…
Monedula, Вы проделали огромную работу с этой таблицей, примите мой респект.
- В поставке WinXP, например, есть фонт "arial unicode ms", который поддерживает очень много юникодных диапазонов, в т.ч. старославянскую кириллицу (правда, символы коми не поддерживает). Можно изобразить что-нибудь типа font-family: "arial unicode ms", может быть даже сделать шаблон. А для коми и прочей экзотики нужно устанавливать на компьютер специальные шрифты, например code2000.
- От «Arial Unicode MS» толку не было, я попробовал. А вот «Code2000» помог, но он shareware. Хотя двух симолов (04F6 и 04F7) я всё-равно не вижу. Если хотите, попробуйте ещё шрифты отсюда. CodeMonk 01:08, 29 июля 2005 (UTC)
- Не забывайте про шаблоны Template:Unicode и Template:Unicode fonts (можно обновить их до аналогов в англ. вике). --ajvol 06:48, 29 июля 2005 (UTC)
Чтобы видеть все символы, лучше всего использовать браузер Mozilla Firefox. Описание шрифтов можно добавить в шаблон Template:Bigunicode, который используется во второй колонке таблицы. — Monedula 06:20, 29 июля 2005 (UTC)
"Ё" ведь тоже входит в основной русский алфавит. Наверное, стоит перенести на "законное" место?
- Я думаю, что надо сделать так: маленькие буквы отсортировать по их юникодовским номерам, а большие поставить непосредственно перед соответствующими маленькими. А «ё» пусть будет отдельно от других русских букв, это не очень страшно. — Monedula 07:26, 29 июля 2005 (UTC)
- зачем привязыватся к номерам, просто по алфавиту--wassily 08:03, 29 июля 2005 (UTC)
- Алфавитов-то много разных. Или мы будем принимать во внимание только русский? — Monedula 08:26, 29 июля 2005 (UTC)
код | символ | название | каноническое разложение |
комментарий |
---|---|---|---|---|
Основной русский алфавит | ||||
0410 | А | прописная (а) | ||
0411 | Б | прописная (бэ) |
- такие названия пойдут?--wassily 08:03, 29 июля 2005 (UTC)
- Вероятно, лучше делать только одно общее название для большой и маленькой буквы (т. е. объединять две ячейки по вертикали.). Если большая всегда будет стоять непосредственно перед маленькой, то никакой неясности не возникнет. — Monedula 08:26, 29 июля 2005 (UTC)
код | символ | прописные/строчные | название | каноническое разложение |
---|---|---|---|---|
Основной русский алфавит | ||||
0410 | А | ПРОПИСНАЯ | А | |
0430 | а | СТРОЧНАЯ | ||
0411 | Б | ПРОПИСНАЯ | Бэ | |
0431 | б | СТРОЧНАЯ |
А так?--wassily 12:59, 3 августа 2005 (UTC)
- Не вижу никакого смысла в том, чтобы писать, что «"Б" — это заглавная буква "бэ"». Это и так всем известно (или про это можно написать в статье русский алфавит). А для малоизвестных букв, наоборот, никакого общепринятого русского названия и нет. Так что лучше оставить официальные юникодовские названия (на то они и официальные), а возможные русские названия (там, где они нетривиальны) приводить в колонке «комментарий». — Monedula 14:23, 3 августа 2005 (UTC)
Давайте немного разберёмся[править код]
Я хотел разобраться с применением старых символов, нашёл текст на церковно-славянском языке:
Есть несколько вопросов:
1) Буквы «у» и «У» как-то странно написаны. Похоже на ижицу. Не вижу аналогов в таблице.
2) Со знаками над буквами не понятно. Часть — ударения, часть, видимо — 0483. А арки такие это 0484 что ли? А над буквой «д» в сокращении «Господу» это что? И ещё там где «…и очисти, и еже…» ?
3) Обратите внимание на предпоследнее слово «веков». Что там вместо буквы «е»? CodeMonk 00:14, 30 июля 2005 (UTC)
- (1) Странные буквы «у» — это «слитный ук», он объединён с обычным русским «у» (т. е. вид зависит от шрифта) — в отличие от «неслитного» 478, 479.
(2) Надстрочные знаки — это ударения (300, 301), придыхания (485, 486 — здесь только 486), титла (483). Под «арками» в словах «господу», «господи» стоят выносные буквы (в данном случае «с»). В plain text эти выносные (надстрочные) буквы отобразить нельзя, в HTML тоже ничего подходящего нет.
(3) В слове «веков» стоит обычное «ять». — Monedula 20:33, 31 июля 2005 (UTC)
- Спасибо. Про «ук» и «ять» я понял. Но теперь у меня возникло ещё больше вопросов. :-)
1) Арки как над «и» это ҄ (0484)?
2) Скажи, а нельзя ли вместо выносных букв писать просто титлу? Она же вроде тоже обозначает сокращение.
3) Это действительно там ї (0457) в слове поклоне́нїе?
4) Где ты увидел 0486?
5) Это омега под титлой Ѽ (047C) в Ѽц ҃у или омега под аркой?
Извини, что завалил вопросами, но это очень интересно. Заранее спасибо. CodeMonk 21:27, 1 августа 2005 (UTC)
- Спасибо. Про «ук» и «ять» я понял. Но теперь у меня возникло ещё больше вопросов. :-)
- 1) Над «и҆» тонкое придыхание (0486);
2) вообще говоря, нельзя — но в юникоде нет нормального набора выносных букв;
3) это графический вариант «і»;
4) см. пункт 1) — да, не очень похоже, но это именно оно :)
5) это Ѻ (047A), оно всего в паре слов употребляется;
Да, ещё один момент: е (0435) и є (0454) это действительно разные буквы, употреблялись для различения форм слова. По-моему, так :) ==Maxim Razin(talk) 05:01, 2 августа 2005 (UTC)- Большое спасибо! CodeMonk
- 1) Над «и҆» тонкое придыхание (0486);
Рекомендую также посмотреть ссылки к статье церковнославянский язык. — Monedula 05:32, 2 августа 2005 (UTC)
- Прочёл немного. Теперь понятно, почему грамотой в старину могли овладеть лишь избранные. :-)) CodeMonk 21:32, 2 августа 2005 (UTC)
Unicode 5.0[править код]
12 декабря 2005 была опубликована бета-версия стандарта Unicode 5.0. Окончательная версия ожидается в марте 2006. В числе прочего, в стандарт добавлено несколько новых кириллических символов:
04CF - CYRILLIC SMALL LETTER PALOCHKA 04FA - CYRILLIC CAPITAL LETTER GHE WITH STROKE AND HOOK 04FB - CYRILLIC SMALL LETTER GHE WITH STROKE AND HOOK 04FC - CYRILLIC CAPITAL LETTER HA WITH HOOK 04FD - CYRILLIC SMALL LETTER HA WITH HOOK 04FE - CYRILLIC CAPITAL LETTER HA WITH STROKE 04FF - CYRILLIC SMALL LETTER HA WITH STROKE 0510 - CYRILLIC CAPITAL LETTER REVERSED ZE 0511 - CYRILLIC SMALL LETTER REVERSED ZE 0512 - CYRILLIC CAPITAL LETTER EL WITH HOOK 0513 - CYRILLIC SMALL LETTER EL WITH HOOK
— Monedula 08:21, 22 декабря 2005 (UTC)Меняется также глиф для омеги с титлом см. [http://www.unicode.org/review/pr-83.jpg ] --AlefZet 13:30, 26 мая 2006 (UTC):На сайте Юникода написано, что ожидается в октябре текущего года.--AlefZet 14:46, 26 мая 2006 (UTC)
- Эээ... а вроде палочка уже была. А в статье про неё написано, что у ней не различают заглавную и строчную формы. Зачем ещё одна? --AndyVolykhov 20:59, 26 мая 2006 (UTC)
А х.з. Исторически ведь это была арабская цифра 1 (она же и римская цифра I) на пишмашках. Естественно, до сих пор строчной еще не было нигде в практике. На мой взгляд в компьютерную эпоху можно было бы обойтись грависом.--AlefZet 22:35, 26 мая 2006 (UTC)
"Расширения кириллицы" и "расширенная кириллица"[править код]
Это разные вещи или одна и та же? Если одна и та же, почему у них два разных раздела? --Участник:-) 19:01, 26 января 2007 (UTC)
2 пропущенные кириллические буквы из 1D00 "Phonetic Extensions"[править код]
В этой статье рассматриваются только два дипазоны кириллицы, но следует учесть, что она есть ещё в 1D00 "Phonetic Extensions".
1. U+1D2B "CYRILLIC LETTER SMALL CAPITAL EL" --- применяется в UPA
2. U+1D78 "MODIFIER LETTER CYRILLIC EN" --- Caucasian Linguistic. Впрочем, я эту букву пару раз видел в брошюрках (одна по церковнославянскому, другая по польскому).
P.S. Строго говоря, знак тысяч к диакритичесим знакам не относится
P.P.S. Тогда уж стоит упомянуть про знак 10000 --- U+20DD
Скоро будет ещё куча символов[править код]
В стандарт предлагается включить ещё 127 кириллических символов (см. [1]). По состоянию на 2007-02-09:
Размещение | Кол-во | Название | Русское название |
---|---|---|---|
0487 | 1 | COMBINING CYRILLIC POKRYTIE | «покрытие» (диакритика) |
0514..0523 | 16 | Additional Cyrillic letters for Mordvin, Kurdish, Aleut, and Chuvash | дополнительные буквы для мордовского, курдского, алеутского и чувашского |
2DE0..2DF5 | 22 | Old Cyrillic combining marks (Cyrillic Extended-A block) | церковнославянские комбинирующие диакритики |
2DF6..2DFF | 10 | Additional Old Cyrillic combining marks | |
A640..A65F | 32 | Additional letters for early Slavic (Cyrillic Extended-B block: A640..A67F) |
дополнительные церковнославянские буквы |
A662..A66E | 13 | Additional letters for early Slavic | |
A66F..A673 | 5 | COMBINING CYRILLIC VZMET COMBINING CYRILLIC TEN MILLIONS SIGN COMBINING CYRILLIC HUNDRED MILLIONS SIGN COMBINING CYRILLIC THOUSAND MILLIONS SIGN SLAVONIC ASTERISK |
«взмет» (диакритика) ×10000000 ×100000000 ×1000000000 «славянский астериск» |
A67C..A67F | 4 | COMBINING CYRILLIC KAVYKA COMBINING CYRILLIC PAYEROK CYRILLIC KAVYKA CYRILLIC PAYEROK |
комбинирующая кавыка комбинирующий паерок кавыка паерок |
A8E0..A8FF | 24 | Additional Cyrillic letters for Abkhaz (Cyrillic Extended-C block: A8E0..A8FF) |
дополнительные буквы для абхазского языка |
— Monedula 16:52, 7 апреля 2007 (UTC)
Unicode 5.1.0 beta[править код]
11 ноября вышла бета-версия Unicode 5.1.0. По сравнению с версией 5.0 — добавлено 127 новых кириллических символов. Йотированное А (IA) и гаммаобразный/слитный «ук» наконец-то получили свои собственные коды: IA теперь будет A656 и A657 (iotified a), а «ук» — A64A и A64B (monograph uk) (раньше они были совмещены с Я и У, соответственно).
Ук-диграф теперь рекомендуется писать как О+У; то, что раньше обозначало ук-диграф (0478, 0479), теперь может обозначать и диграф, и слитный ук. Старославянские буквы «земля» (zemlya, A640, A641) и «зело» (dzelo, A642, A643) теперь отделены от современных букв З и Ѕ.
0487 COMBINING CYRILLIC POKRYTIE 0514 CYRILLIC CAPITAL LETTER LHA 0515 CYRILLIC SMALL LETTER LHA 0516 CYRILLIC CAPITAL LETTER RHA 0517 CYRILLIC SMALL LETTER RHA 0518 CYRILLIC CAPITAL LETTER YAE 0519 CYRILLIC SMALL LETTER YAE 051A CYRILLIC CAPITAL LETTER QA 051B CYRILLIC SMALL LETTER QA 051C CYRILLIC CAPITAL LETTER WE 051D CYRILLIC SMALL LETTER WE 051E CYRILLIC CAPITAL LETTER ALEUT KA 051F CYRILLIC SMALL LETTER ALEUT KA 0520 CYRILLIC CAPITAL LETTER EL WITH MIDDLE HOOK 0521 CYRILLIC SMALL LETTER EL WITH MIDDLE HOOK 0522 CYRILLIC CAPITAL LETTER EN WITH MIDDLE HOOK 0523 CYRILLIC SMALL LETTER EN WITH MIDDLE HOOK 2DE0 COMBINING CYRILLIC LETTER BE 2DE1 COMBINING CYRILLIC LETTER VE 2DE2 COMBINING CYRILLIC LETTER GHE 2DE3 COMBINING CYRILLIC LETTER DE 2DE4 COMBINING CYRILLIC LETTER ZHE 2DE5 COMBINING CYRILLIC LETTER ZE 2DE6 COMBINING CYRILLIC LETTER KA 2DE7 COMBINING CYRILLIC LETTER EL 2DE8 COMBINING CYRILLIC LETTER EM 2DE9 COMBINING CYRILLIC LETTER EN 2DEA COMBINING CYRILLIC LETTER O 2DEB COMBINING CYRILLIC LETTER PE 2DEC COMBINING CYRILLIC LETTER ER 2DED COMBINING CYRILLIC LETTER ES 2DEE COMBINING CYRILLIC LETTER TE 2DEF COMBINING CYRILLIC LETTER HA 2DF0 COMBINING CYRILLIC LETTER TSE 2DF1 COMBINING CYRILLIC LETTER CHE 2DF2 COMBINING CYRILLIC LETTER SHA 2DF3 COMBINING CYRILLIC LETTER SHCHA 2DF4 COMBINING CYRILLIC LETTER FITA 2DF5 COMBINING CYRILLIC LETTER ES-TE 2DF6 COMBINING CYRILLIC LETTER A 2DF7 COMBINING CYRILLIC LETTER IE 2DF8 COMBINING CYRILLIC LETTER DJERV 2DF9 COMBINING CYRILLIC LETTER MONOGRAPH UK 2DFA COMBINING CYRILLIC LETTER YAT 2DFB COMBINING CYRILLIC LETTER YU 2DFC COMBINING CYRILLIC LETTER IOTIFIED A 2DFD COMBINING CYRILLIC LETTER LITTLE YUS 2DFE COMBINING CYRILLIC LETTER BIG YUS 2DFF COMBINING CYRILLIC LETTER IOTIFIED BIG YUS A640 CYRILLIC CAPITAL LETTER ZEMLYA A641 CYRILLIC SMALL LETTER ZEMLYA A642 CYRILLIC CAPITAL LETTER DZELO A643 CYRILLIC SMALL LETTER DZELO A644 CYRILLIC CAPITAL LETTER REVERSED DZE A645 CYRILLIC SMALL LETTER REVERSED DZE A646 CYRILLIC CAPITAL LETTER IOTA A647 CYRILLIC SMALL LETTER IOTA A648 CYRILLIC CAPITAL LETTER DJERV A649 CYRILLIC SMALL LETTER DJERV A64A CYRILLIC CAPITAL LETTER MONOGRAPH UK A64B CYRILLIC SMALL LETTER MONOGRAPH UK A64C CYRILLIC CAPITAL LETTER BROAD OMEGA A64D CYRILLIC SMALL LETTER BROAD OMEGA A64E CYRILLIC CAPITAL LETTER NEUTRAL YER A64F CYRILLIC SMALL LETTER NEUTRAL YER A650 CYRILLIC CAPITAL LETTER YERU WITH BACK YER A651 CYRILLIC SMALL LETTER YERU WITH BACK YER A652 CYRILLIC CAPITAL LETTER IOTIFIED YAT A653 CYRILLIC SMALL LETTER IOTIFIED YAT A654 CYRILLIC CAPITAL LETTER REVERSED YU A655 CYRILLIC SMALL LETTER REVERSED YU A656 CYRILLIC CAPITAL LETTER IOTIFIED A A657 CYRILLIC SMALL LETTER IOTIFIED A A658 CYRILLIC CAPITAL LETTER CLOSED LITTLE YUS A659 CYRILLIC SMALL LETTER CLOSED LITTLE YUS A65A CYRILLIC CAPITAL LETTER BLENDED YUS A65B CYRILLIC SMALL LETTER BLENDED YUS A65C CYRILLIC CAPITAL LETTER IOTIFIED CLOSED LITTLE YUS A65D CYRILLIC SMALL LETTER IOTIFIED CLOSED LITTLE YUS A65E CYRILLIC CAPITAL LETTER YN A65F CYRILLIC SMALL LETTER YN A662 CYRILLIC CAPITAL LETTER SOFT DE A663 CYRILLIC SMALL LETTER SOFT DE A664 CYRILLIC CAPITAL LETTER SOFT EL A665 CYRILLIC SMALL LETTER SOFT EL A666 CYRILLIC CAPITAL LETTER SOFT EM A667 CYRILLIC SMALL LETTER SOFT EM A668 CYRILLIC CAPITAL LETTER MONOCULAR O A669 CYRILLIC SMALL LETTER MONOCULAR O A66A CYRILLIC CAPITAL LETTER BINOCULAR O A66B CYRILLIC SMALL LETTER BINOCULAR O A66C CYRILLIC CAPITAL LETTER DOUBLE MONOCULAR O A66D CYRILLIC SMALL LETTER DOUBLE MONOCULAR O A66E CYRILLIC LETTER MULTIOCULAR O A66F COMBINING CYRILLIC VZMET A670 COMBINING CYRILLIC TEN MILLIONS SIGN A671 COMBINING CYRILLIC HUNDRED MILLIONS SIGN A672 COMBINING CYRILLIC THOUSAND MILLIONS SIGN A673 SLAVONIC ASTERISK A67C COMBINING CYRILLIC KAVYKA A67D COMBINING CYRILLIC PAYEROK A67E CYRILLIC KAVYKA A67F CYRILLIC PAYEROK A680 CYRILLIC CAPITAL LETTER DWE A681 CYRILLIC SMALL LETTER DWE A682 CYRILLIC CAPITAL LETTER DZWE A683 CYRILLIC SMALL LETTER DZWE A684 CYRILLIC CAPITAL LETTER ZHWE A685 CYRILLIC SMALL LETTER ZHWE A686 CYRILLIC CAPITAL LETTER CCHE A687 CYRILLIC SMALL LETTER CCHE A688 CYRILLIC CAPITAL LETTER DZZE A689 CYRILLIC SMALL LETTER DZZE A68A CYRILLIC CAPITAL LETTER TE WITH MIDDLE HOOK A68B CYRILLIC SMALL LETTER TE WITH MIDDLE HOOK A68C CYRILLIC CAPITAL LETTER TWE A68D CYRILLIC SMALL LETTER TWE A68E CYRILLIC CAPITAL LETTER TSWE A68F CYRILLIC SMALL LETTER TSWE A690 CYRILLIC CAPITAL LETTER TSSE A691 CYRILLIC SMALL LETTER TSSE A692 CYRILLIC CAPITAL LETTER TCHE A693 CYRILLIC SMALL LETTER TCHE A694 CYRILLIC CAPITAL LETTER HWE A695 CYRILLIC SMALL LETTER HWE A696 CYRILLIC CAPITAL LETTER SHWE A697 CYRILLIC SMALL LETTER SHWE
— Monedula 22:19, 26 декабря 2007 (UTC) + Monedula 00:59, 27 декабря 2007 (UTC)
- Где ссылочку посмотреть? --Koryakov Yuri 22:54, 26 декабря 2007 (UTC)
- http://www.unicode.org/Public/5.1.0/ucd/NamesList-5.1.0d6.txt | А вот картинок пока нет — будут только когда выйдет окончательная версия (не бета). — Monedula 23:52, 26 декабря 2007 (UTC) + Monedula 00:59, 27 декабря 2007 (UTC)
Изображения можно посмотреть здесь: http://std.dkuug.dk/JTC1/SC2/WG2/docs/n3097.pdf — Monedula 01:39, 29 декабря 2007 (UTC)
- Господа, стандарт вышел и таблицы опубликованы. Пора обновлять статью :) ОйЛ™ 23:49, 10 апреля 2008 (UTC)
OpenType?[править код]
Wolliger Mensch написал, что комбинирующую диакритику можно применять только со шрифтами OpenType. Это совершенно неверно — диакритика поддерживается любыми типами шрифтов, где можно менять ширину символа (надо установить нулевую ширину символа и отрицательное смещение по горизонтали). Даже xterm прекрасно показывает ударения, хотя там опентайпа отродясь не было — там используются банальные растровые шрифты. — Monedula 15:15, 6 февраля 2009 (UTC)
- Вы опять ошибаетесь. Ширина глифа — это еще не все. Если диакритики сами по себе в шрифте сделаны на уровне заглавных букв, то над строчными без опентайпа такие диакритики будут висеть «в облаках». Это не красиво, но не фатально. Но если сами по себе диакритики в шрифте сделаны у ровне строчных букв, то без опентайпа такие диакритики не будут видны, если их попытаться поставить над заглавными буквами (диакритика в этом случае просто «спрячется» между линиями заглавной буквы). Кроме того, далеко не во всяком шрифте диакритики сделаны с нулевой шириной. Также хочу подчеркнуть, что безопентайпный метод годится лишь для очень узкий диакритик, вроде точек (одиночных, не трем), акутов, гравов, — широкие диакритики будут даже при нулевой базовой ширине висеть на полбуквы (напоминаю, что речь идеть не только об «ударениях», чит. внимательнее статью), что не только некрасиво, но незнакомому с тонкостями человеку будет двусмысленно: к предыдущей ли букве относится диакритика или к последующей. Поэтому опентайп очень даже при чем. — Wolliger Mensch 15:26, 6 февраля 2009 (UTC)
- Похоже, что вы описываете какой-то конкретный попавшийся вам очень плохой шрифт. // Но в любом случае, к Юникоду как таковому (а тем более к кириллице) это не имеет никакого отношения. Это проблемы реализации, а не стандарта Unicode. Или вы считаете, что комбинирующие диакритики — сами по себе зло и их нужно выкинуть из стандарта? — Monedula 19:45, 6 февраля 2009 (UTC)
- Я описываю реальное положение дел. Что там записано в стандарте, — это сферический конь в вакууме. Люди не стандартом печатают, а конкретным шрифтом. И что не всякий шрифт способен побороть изъяны уникода, об этом тоже нужно упомянуть. Более того, даже если шрифт и содержит в себе все необходимые инструменты для забарывания дуростей стандарта, то еще не факт, что программа, в которой используется этот шрифт, будет понимать все эти инструменты. Например, 2007-й Ворд работает с опентайповыми шрифтами достаточно своеобразно. — Wolliger Mensch 11:54, 11 февраля 2009 (UTC)
- Мое личное мнение по уникоду таково: таблицу всю нужно размечать по скриптам. Сейчас это сделано весьма непоследовательно, хотя некоторые обнадеживающие тенденции, что каждая скрипта получит свое место в таблице, есть. — Wolliger Mensch 11:54, 11 февраля 2009 (UTC)
- Эта статья посвящена именно тому, что записано в стандарте. Эта статья не о 2007-м Ворде и не о каком-то конкретном шрифте. Эта статья посвящена тому, как надо кодировать кириллицу согласно текущему стандарту Unicode. Никто не будет подгонять стандарт под конкретную плохо работающую программу или под конкретный глючный шрифт. — Monedula 19:57, 11 февраля 2009 (UTC)
- Еще раз. Нынешняя версия стандарта не поддерживает русское письмо в той мере, в которой это необходимо. Еще хуже поддерживает старославянское и церковнославянское письмо. А писать нужно как-то, — вот для этого существуют разные обходные способы. Суть тут в том, что будучи мерами внестандартными, эти способы поддерживаются далеко не всеми шрифтами и программами. Это нужно упомянуть в статье, иначе у читателя может сложиться впечатление, что композиты решают все проблемы. Не решают. Вот о чем речь. — Wolliger Mensch 19:51, 25 февраля 2009 (UTC)
- Да, и еще. Ставьте, пожалуйста, тег «источник» там, где источник необходим. Если в статье написано, что солнце светит, а собака лает, источник этой информации не требуется. Есть две вещи: а) шрифт без поддержки опентайпа работать с уникодом нормально не сможет; б) кириллица (климентовица, точнее) и русская гражданка совмещены сейчас в уникоде. Это два вполне очевидных факта, и не очень понятно, какими источниками это нужно еще подтверждать. — Wolliger Mensch 20:00, 25 февраля 2009 (UTC)
Ю[править код]
Подскажите, пожалуйста, как можно набрать в Ворде "ю" с черточкой "-", где "-" размещается над "ю"? То есть, как набрать символ наподобие "ō", что б на месте "о" стояло наше "ю"? Есть ли такой символ в Юникоде? Есть "ю̄".--125.28.145.13 09:23, 1 ноября 2009 (UTC)
П с хвостиком[править код]
П с хвостиком внесена в Юникод в версию 5.2!!!!!!
- Ну вот. Щас начнется!!! Сказал, а все его узнают...
- Внутренний голос про Ахмуда Мухмадинеджада
81.195.14.218 09:40, 1 ноября 2009 (UTC) 81.195.14.218 09:45, 1 ноября 2009 (UTC) [[User:|ÅⅩⅯⅤⅮ ⅯⅤⅩⅯÅⅮℑℕ℮℃ÅⅮ]]
Буква "CYRILLIC SMALL CAPITAL LETTER EL"[править код]
ᴫ - это не она? 213.151.16.227 20:16, 14 ноября 2009 (UTC) [[User:|ÅⅩⅯⅤⅮ ⅯⅤⅩⅯÅⅮℑℕ℮℃ÅⅮ]]
Ю+0524[править код]
Э-эй? Есть шрифт, который поддерживал бы Ю+0524? То есть, в каких шрифтах есть символ вроде Ю+049А, чтоб на месте К стояло П и был хвостик от Ц? 213.151.5.102 15:34, 7 августа 2010 (UTC)
Символы от Ю+2ГД0 до Ю+2ГЕЕ[править код]
И ещё: нужен шрифт, поддерживающий символы от Ю+2ГД0 до Ю+2ГЕЕ! То есть, ищу шрифт, где есть надписные буквы (буквы над буквами)! 81.195.27.213 13:46, 15 сентября 2010 (UTC)
Буква Ю+0526[править код]
- Существует. Обновите статью.
- "Ю+0526" — вандализм?
- Так точно. Избавимся!? 91.77.89.80 18:29, 15 октября 2010 (UTC)
- "Ю+0526" — вандализм?
Остающиеся проблемы[править код]
Раздел вызывает сомнения:
В Юникоде нет русских букв со знаком ударения, также отсутствуют некоторые буквы с диакритиками для языков народов России и бывшей Югославии, — их можно набирать отдельно из буквы и диакритического знака, например, ы́ э́ ю́ я́, р̆, а̄ .
Зачем нужно введение дополнительных символов для для букв с ударениями вместо указания стандартного U+0301 (акут)? Какие преимущества это даст? (обсуждавшаяся ранее кривизна шрифтов и программ в качестве довода объективно не подходит.)
Другой серьёзной проблемой остается совмещение кириллицы как таковой и русского гражданского шрифта, из-за чего в печатных и электронных материалах, где требуются обе азбуки, приходится использовать два отдельных шрифта.
Непонятна суть проблемы применительно к кодировке символов. Существуют какие-то проблемные символы? Какие? И в чем их проблема? Если же претензия буквально в том, что для изменения шрифта надо менять шрифт, то какое это имеет отношение к юникоду?
- Проблема, точнее её решение видится в том, что можно сделать полное дублирование всех символов (старославянской) кириллицы и гражданского шрифта, как это например, сделано для некоторых семитских письменностей. Так чтобы кириллическое а и современное "а" воспринимались не как раз начертания одного символа, а как разные символы. Но от этого скорее будет больше вреда, чем пользы. --Koryakov Yuri 09:32, 28 января 2010 (UTC)
- Да я понимаю, что для каких-то целей бывает удобно ссылаться непосредственно на номер подходящего глифа, а не на номер символа. Но ведь юникод - это стандарт кодировки символов, а не глифов. Введение новых символов для прямого доступа к конкретным глифам уже имеющихся символов - это вредно и неправильно. Именно по этому меня смущает раздел "остающиеся проблемы такой-то версии юникода": с одной стороны у юникода существуют проблемы с кириллицей, но в основном не те, что описаны в данном разделе, с другой - указанные трудности существуют, но как-то не совсем по адресу: в большей степени они касаются текстовых редакторов и средств трансляции символов в глифы. --Shishatsky 09:20, 29 января 2010 (UTC)
По моим ощущениям - раздел надо убирать или полностью переделывать. 85.249.160.62 22:40, 27 января 2010 (UTC)
- Переписал как сумел.--Shishatsky 15:50, 29 января 2010 (UTC)
Не отображаются символы[править код]
Все, расположенные ниже «Церковнославянские буквотитла», в чём дело? Как юникод обновить?
- Попробуйте скачать шрифты отсюда. — Monedula 10:42, 15 декабря 2010 (UTC)
- Странно как-то. Стоит Виндоус Сэвэн, обновляется, а юникод отображается только до 5-й версии. Символы из 5.1 и выше - квадратики. Кстати те шрифты не помогли ((
- А какой у Вас браузер? Internet Explorer хуже всех в деле показа экзотических символов. Лучше использовать Mozilla Firefox или Opera. — Monedula 12:26, 15 декабря 2010 (UTC)
- Opera
- А какой у Вас браузер? Internet Explorer хуже всех в деле показа экзотических символов. Лучше использовать Mozilla Firefox или Opera. — Monedula 12:26, 15 декабря 2010 (UTC)
- Странно как-то. Стоит Виндоус Сэвэн, обновляется, а юникод отображается только до 5-й версии. Символы из 5.1 и выше - квадратики. Кстати те шрифты не помогли ((
Русские названия[править код]
У юникодовских символов нет официальных русских названий. А вот английские названия — официальные. Так что русское название должно не заменять английское, а дополнять. Т.е. лучше русское название (если оно есть) писать в колонке «Комментарий». — Monedula 18:35, 29 декабря 2010 (UTC)
Давайте тогда разберёмся, что сначала было - буквы или юникод? Это ясно, да. Почему в русских названиях «офоциальности мало»? Это вы напишите. Потом, даже если эти названия утверждены, то почему они должны здесь быть? Ссылки на английский раздел здесь есть, если что, то это не документ, принятый их разработчиками, а лишь статья о буквах. Английские названия здесь ненужны, это русская википедия, поле примечание здесь само собой отвелось под использующий язык, короче не надо перегружать таблицу. А вот десятичные коды нужны, но как их вписать, пока не знаю.
И ещё - arial вроде даже знак тысяч/лимонов поддерживает, может сненим? Serjio-pt 17:15, 30 декабря 2010 (UTC)
- Официальное название у юникодовских символов только английское. Если Вам нужны русское название букв — сделайте отдельную колонку. // Десятичные коды вовсе не нужны, кому надо — пусть на калькуляторе вычисляет их из шестнадцатеричных. // Насчёт Ариала не понял. — Monedula 19:05, 30 декабря 2010 (UTC)
Дело было в обозревателе. Десятичные-таки нужны не меньше: как забить букву Ӄ например? за секунду без всяких программ и окон? держите alt и потом 1219 - десятичная запись 4C3. Про официальные названия в юникоде я знаю. Но здесь нужны только русские, отбросьте эти ненужные взгляды на официальность и прочее. Повторяю - здесь РУССКАЯ википедия, и всё что только возможно, должно писаться РУССКИМИ буквами по-РУССКИ, для людей, знающих по умолчанию только русский язык, латиницу не обязаны знать вовсе.
Вы так говорите :«Если Вам нужны русское название букв — сделайте отдельную колонку.» - то зачем тогда статья вообще здесь? Ставьте мягкое перенаправление на en и дел-то! Serjio-pt 20:21, 30 декабря 2010 (UTC)
- Десятичные коды элементарно вычисляются на калькуляторе. К тому же если Вы заглядываете в Википедию за кодами, то проще тогда прямо скопировать нужный символ из таблицы, чем набирать какой-то код. // Отбросить «ненужные взгляды на официальность» нельзя из-за того, что в Википедии запрещены оригинальные исследования. Т.е. Вам приходится русские названия придумывать самому, а это здесь не приветствуется. // На английскую википедию не надо кивать — каждый языковой раздел живёт сам по себе, наличие какой-то информации в англовики не отменяет необходимость писать её и в русском разделе. — Monedula 22:29, 30 декабря 2010 (UTC)
Прошу простить, но вп:НДДА, назвать юс юсом это не ОРИСС, ижицу ижицей, а не izhitsa или что-то в этом духе - то же самое. Я понимаю в немецкой - у них есть поле название и ОПИСАНИЕ, т.к кириллица для них иноземна. Конечно, латиницу называть по-русски - ОРИСС, а вот кириллицу по-английски в юникоде - необходимость, а на русском языке - бред. Serjio-pt 09:18, 31 декабря 2010 (UTC)
- С юсом-то всё просто. А как Вы переведёте "SHHA" (04BA), "DZJE" (0506), "YAE" (0518), "QA" (051A), "CCHE" (А686), "TSWE" (A68E)? — Monedula 11:07, 31 декабря 2010 (UTC)
- Shha = щхья. Dzje = дзжэ. Yae = яэ. Qa = къха. Cche = ччэ. Tswe = цвэ. 91.77.64.218 19:01, 6 мая 2011 (UTC)
- Не щхья, а ЭЙЧ! 91.79.18.64 11:21, 8 января 2012 (UTC)
Хороший вопрос, спросить бы это у тех, кто статьи про буквы в википедии пишет. Названия-то есть, надо их лишь узнать! Может спросить проект по малым народам? Serjio-pt 12:43, 31 декабря 2010 (UTC)
- В том-то и беда, что русских названий нет. В тех алфавитах, где эти буквы есть, они называются просто: буква+гласный (например, «hа»). То есть русское название всё равно придётся придумывать самим. // К тому же в разных алфавитах буква может называться по-разному. Буква Л в церковнославянском алфавите называется «люди», а в русском «эль». Надо ли тогда перечислять все варианты? // И заметьте, что приведённые в стандарте «английские» названия — это на самом деле вовсе и не английские названия, это всего лишь уникальные идентификаторы для каждого символа. — Monedula 07:34, 1 января 2011 (UTC)
Ну так может вернуть стандартные юникодовские названия, раз нормальных русских эквивалентов нет? — Monedula 03:52, 30 января 2011 (UTC)
- Так статья в первую очередь о юникоде, то есть, некотором техническом стандарте, то она должна по возможности наиболее полно передавать этот стандарт. Если в стандарте указаны только английские названия, и больше никаких других, то, на мой взгляд, статья должна их отображать (кстати, об этой особенности юникода, можно было бы написать в статье).
- Другой вопрос - в каком виде должны присутствовать такие названия. Можно поместить их в отдельную колонку, а можно написать маленьким шрифтом в скобках. В последнем случае они будут визуально отличны от русских названий и не станут слишком загромождать ячейки. --Emaus 07:02, 30 января 2011 (UTC)