ISO 8859-1

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

ISO/IEC 8859-1 (также известная как ISO 8859-1 и Latin-1) — кодовая страница, предназначенная для западноевропейских языков; она базируется на символьном наборе популярных в прошлом терминалов VT220. Кодовые позиции 0—31 (0x0—0x1F) и 127—159 (0x7F—0x9F) не определены. По образцу ISO 8859-1 сделаны все остальные кодировки серии ISO 8859.

ISO-8859-1 — кодировка, зарегистрированная IANA в 1992 г. В отличие от ISO/IEC 8859-1, кодовые позиции 0—31 и 127—159 здесь заполнены управляющими символами (большинство из которых, впрочем, всё равно никто не использует). В HTML ISO-8859-1 является кодировкой по умолчанию (в XHTML, однако, кодировкой по умолчанию является UTF-8).

IANA разрешает использовать следующие варианты названия: ISO_8859-1:1987, ISO_8859-1, ISO-8859-1, iso-ir-100, sISOLatin1, latin1, l1, IBM819, CP819.

В Юникоде первые 256 кодовых позиций совпадают с ISO-8859-1.

В Microsoft Windows для западноевропейских языков используется кодировка Windows-1252, которая отличается от ISO-8859-1 тем, что позиции 128—159 здесь заняты разными полезными типографскими символами. Большинство браузеров не различают ISO-8859-1 и Windows-1252 — фактически, и в том, и в другом случае они отображают текст как Windows-1252.

Такая путаница между этими двумя кодировками привела к тому, что многие программы, генерирующие файлы HTML, ошибочно обозначали символы их кодами из Windows−1252 вместо кодов Юникода (исходя из того, что номер символа в ISO-8859-1 равен его номеру в Юникоде): например, тире (—) обозначалось — вместо правильного —, многоточие обозначалось … вместо правильного … и т. д.; из-за распространённости этого явления современные браузеры продолжают показывать, например, — как тире, хотя на самом деле — — это управляющий символ «end of guarded area», применение которого в HTML бессмысленно.

В проекте стандарта HTML 5 предписывается показывать ISO-8859-1 как Windows-1252.[1]

Таблицы[править | править вики-текст]

Нижняя часть (0—127) таблиц кодировки не показана, поскольку полностью соответствует обычному ASCII. Числа под буквами обозначают шестнадцатеричный код буквы в Юникоде.

ISO-8859-1[править | править вики-текст]

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
 
8.
 
PAD
80
HOP
81
BPH
82
NBH
83
IND
84
NEL
85
SSA
86
ESA
87
HTS
88
HTJ
89
VTS
8A
PLD
8B
PLU
8C
RI
8D
SS2
8E
SS3
8F
 
9.
 
DCS
90
PU1
91
PU2
92
STS
93
CCH
94
MW
95
SPA
96
EPA
97
SOS
98
SGCI
99
SCI
9A
CSI
9B
ST
9C
OSC
9D
PM
9E
APC
9F
 
A.
 
 
A0
¡
A1
¢
A2
£
A3
¤
A4
¥
A5
¦
A6
§
A7
¨
A8
©
A9
ª
AA
«
AB
¬
AC
­
AD
®
AE
¯
AF
 
B.
 
°
B0
±
B1
²
B2
³
B3
´
B4
µ
B5

B6
·
B7
¸
B8
¹
B9
º
BA
»
BB
¼
BC
½
BD
¾
BE
¿
BF
 
C.
 
À
C0
Á
C1
Â
C2
Ã
C3
Ä
C4
Å
C5
Æ
C6
Ç
C7
È
C8
É
C9
Ê
CA
Ë
CB
Ì
CC
Í
CD
Î
CE
Ï
CF
 
D.
 
Ð
D0
Ñ
D1
Ò
D2
Ó
D3
Ô
D4
Õ
D5
Ö
D6
×
D7
Ø
D8
Ù
D9
Ú
DA
Û
DB
Ü
DC
Ý
DD
Þ
DE
ß
DF
 
E.
 
à
E0
á
E1
â
E2
ã
E3
ä
E4
å
E5
æ
E6
ç
E7
è
E8
é
E9
ê
EA
ë
EB
ì
EC
í
ED
î
EE
ï
EF
 
F.
 
ð
F0
ñ
F1
ò
F2
ó
F3
ô
F4
õ
F5
ö
F6
÷
F7
ø
F8
ù
F9
ú
FA
û
FB
ü
FC
ý
FD
þ
FE
ÿ
FF

Интересно расположение символов × и ÷ посреди букв: первоначально там планировалось разместить лигатуру Œœ, но в конечном итоге было решено, что она не нужна, и освободившиеся два места были заполнены небуквенными символами.[2]

Windows−1252[править | править вики-текст]

В первоначальной версии этой кодировки отсутствовали символы: (0x80), ˆ (0x88), ˜ (0x98), Ž (0x8E), ž (0x9E).

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
 
8.
 

20AC
 
201A
ƒ
192

201E

2026

2020

2021
ˆ
2C6

2030
Š
160

2039
Œ
152
  Ž
17D
 
 
9.
 
 
2018

2019

201C

201D

2022

2013

2014
˜
2DC

2122
š
161

203A
œ
153
  ž
17E
Ÿ
178
 
A.
 
 
A0
¡
A1
¢
A2
£
A3
¤
A4
¥
A5
¦
A6
§
A7
¨
A8
©
A9
ª
AA
«
AB
¬
AC
­
AD
®
AE
¯
AF
 
B.
 
°
B0
±
B1
²
B2
³
B3
´
B4
µ
B5

B6
·
B7
¸
B8
¹
B9
º
BA
»
BB
¼
BC
½
BD
¾
BE
¿
BF
 
C.
 
À
C0
Á
C1
Â
C2
Ã
C3
Ä
C4
Å
C5
Æ
C6
Ç
C7
È
C8
É
C9
Ê
CA
Ë
CB
Ì
CC
Í
CD
Î
CE
Ï
CF
 
D.
 
Ð
D0
Ñ
D1
Ò
D2
Ó
D3
Ô
D4
Õ
D5
Ö
D6
×
D7
Ø
D8
Ù
D9
Ú
DA
Û
DB
Ü
DC
Ý
DD
Þ
DE
ß
DF
 
E.
 
à
E0
á
E1
â
E2
ã
E3
ä
E4
å
E5
æ
E6
ç
E7
è
E8
é
E9
ê
EA
ë
EB
ì
EC
í
ED
î
EE
ï
EF
 
F.
 
ð
F0
ñ
F1
ò
F2
ó
F3
ô
F4
õ
F5
ö
F6
÷
F7
ø
F8
ù
F9
ú
FA
û
FB
ü
FC
ý
FD
þ
FE
ÿ
FF

Ссылки[править | править вики-текст]

Примечания[править | править вики-текст]


Кодовые таблицы символов в ISO 8859
ISO 8859‑1 | ISO 8859‑2 | ISO 8859‑3 | ISO 8859‑4 | ISO 8859‑5 | ISO 8859‑6 | ISO 8859‑7 | ISO 8859‑8 | ISO 8859‑9 | ISO 8859‑10 | ISO 8859‑11 | ISO 8859‑12 | ISO 8859‑13 | ISO 8859‑14 | ISO 8859‑15 | ISO 8859‑16


Кодовые таблицы символов в Windows
1250 | 1251 | 1252 | 1253 | 1254 | 1255 | 1256 | 1257 | 1258


Кодировки символов
Основы алфавиттекстфайлданные ) • набор символовконверсия
Исторические кодировки Докомп.: семафорная (Макарова)МорзеБодоМТК-2
Комп.: 6-битнаяУППRADIX-50EBCDICДКОИ-8 ) • КОИ-7ISO 646
современное
8-битное
представление
символы ASCIIуправляющиепечатные ) • не-ASCIIпсевдографика )
8-битные код.стр. Кириллица: КОИ-8ГОСТ 19768-87MacCyrillic
ISO 8859 1 (лат.)2345 (кир.)6789101112131415 (€)16
Windows 12501251 (кир.)1252125312541255125612571258WGL4
IBM & DOS 437850852855866 «альт.»МИКНИИ ЭВМ
Многобайтные Традиционные DBCSGB2312 ) • HTML
Unicode UTF-32UTF-16UTF-8список символовкириллица )
Связанные темы интерфейс пользователяраскладка клавиатурылокальперевод строкишрифткракозябрытранслитнестандартные шрифтытекст как изображение
Утилиты iconvrecode