ISO/IEC 8859-1 (tunnetaan myös nimellä ISO 8859-1 ja Latin-1 ) on Länsi-Euroopan kielten koodisivu . se perustuu aiemmin suosittujen VT220 -päätteiden merkistöihin . Koodipaikat 0-31 (0x0-0x1F) ja 127-159 (0x7F-0x9F) ovat määrittelemättömiä. Kaikki muut ISO 8859 - sarjan koodaukset on mallinnettu ISO 8859-1 : n mukaan .
ISO-8859-1 on IANA :n vuonna 1992 rekisteröimä koodaus. Toisin kuin ISO/IEC 8859-1, koodipaikat 0-31 ja 127-159 on täytetty ohjausmerkeillä (joista useimpia käytetään harvoin). HTML :ssä ISO-8859-1 on oletuskoodaus ( XHTML : ssä oletuskoodaus on kuitenkin UTF-8 ).
IANA sallii seuraavat nimimuunnelmat: ISO_8859-1:1987 , ISO_8859-1 , ISO-8859-1 , iso-ir-100 , sISOLatin1 , latin1 , l1 , IBM819 , CP819 .
Unicodessa ensimmäiset 256 koodipistettä ovat samat kuin ISO-8859-1.
Microsoft Windows Länsi-Euroopan kielille käyttää Windows-1252-koodausta , joka eroaa ISO-8859-1:stä siinä, että paikat 128-159 (0x80-0x9F) on täytetty erilaisilla hyödyllisillä typografisilla merkeillä. Useimmat selaimet eivät tee eroa ISO-8859-1:n ja Windows-1252:n välillä – itse asiassa ne näyttävät tekstin muodossa Windows-1252 molemmissa tapauksissa.
Tämä sekaannus näiden kahden koodauksen välillä on johtanut siihen, että monet ohjelmat luovat HTML-tiedostoja, jotka nimeävät virheellisesti merkkejä Windows-1252-koodeillaan Unicode-koodien sijaan (olettaen, että ISO-8859-1:n merkkinumero on sama kuin sen Unicode-numero): esimerkiksi viiva (—) merkittiin —oikean sijasta —, ellipsi merkittiin oikean …sijasta …jne.; tämän ilmiön yleisyydestä johtuen nykyaikaiset selaimet näyttävät edelleen esimerkiksi —viivana, vaikka itse asiassa se — on "vartioidun alueen loppu" -ohjausmerkki , jonka käyttö HTML:ssä on merkityksetöntä.
HTML 5 -standardin luonnos edellyttää, että ISO-8859-1 näytetään nimellä Windows-1252. [yksi]
Koodaustaulukoiden alaosaa (0-127) ei näytetä, koska se on täysin yhdenmukainen tavallisen ASCII :n kanssa . Kirjainten alla olevat numerot edustavat kirjaimen Unicode -heksadesimaalikoodia .
.0 | .yksi | .2 | .3 | .neljä | .5 | .6 | .7 | .kahdeksan | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
kahdeksan. |
PAD 80 |
HOP 81 |
B.P.H. 82 |
NBH 83 |
IND 84 |
NEL 85 |
SSA 86 |
ESA 87 |
HTS 88 |
HTJ 89 |
VTS 8A |
PLD 8B |
PLU8C _ |
RI 8D |
SS28E _ |
SS38F _ |
9. |
DCS 90 |
PU1 91 |
PU2 92 |
STS 93 |
CCH 94 |
MW 95 |
SPA 96 |
EPA 97 |
SOS 98 |
SGCI 99 |
SCI 9A |
CSI 9B |
ST 9C |
OSC 9D |
PM9E _ |
APC9F _ |
A. |
A0 |
¡ A1 |
¢ A2 |
£ A3 |
¤ A4 |
¥ A5 |
¦ A6 |
§ A7 |
¨A8 _ |
© A9 |
ªAA _ |
AB _ |
¬AC_ _ |
ILMOITUS |
®AE _ |
¯AF _ |
b. |
° B0 |
± B1 |
²B2 _ |
³B3 _ |
´ B4 |
µB5 _ |
¶ B6 |
B7_ _ |
¸ B8 |
¹ B9 |
BA_ _ |
» BB |
¼ eKr |
½ BD |
¾ BE |
¿ BF |
C. |
А C0 |
Á C1 |
В C2 |
à C3 |
Ä C4 |
Å C5 |
Æ C6 |
Z C7 |
È C8 |
E C9 |
Ê CA |
Ë CB |
Ì CC |
Í CD |
О CE |
Ï CF |
D. |
Р D0 |
ÑD1 _ |
Ò D2 |
Ó D3 |
Ô D4 |
Õ D5 |
Ö D6 |
× D7 |
Ø D8 |
Ù D9 |
Ú DA |
Û DB |
Ü DC |
Ý DD |
DE _ |
ß DF |
E. |
a E0 |
a E1 |
â E2 |
ã E3 |
E4 _ |
å E5 |
æ E6 |
ç E7 |
ja E8 |
e E9 |
ê EA |
ë EB |
Р EC |
ja ED |
îEE_ _ |
EF_ _ |
F. |
ð F0 |
ñ F1 |
ò F2 |
o F3 |
ô F4 |
õ F5 |
ö F6 |
÷ F7 |
ø F8 |
ù F9 |
FA_ _ |
û FB |
FC_ _ |
ý FD |
þ FE |
ÿ FF |
Merkkien × ja ÷ sijainti kirjainten keskellä on mielenkiintoinen: alun perin sinne oli tarkoitus sijoittaa Œœ ligatuuri , mutta lopulta päätettiin, että sitä ei tarvita, ja vapautuneet kaksi paikkaa täytettiin ei- -aakkosmerkit. [2]
Tämän koodauksen alkuperäisessä versiossa ei ollut merkkejä: € (0x80), ˆ (0x88), ˜ (0x98), Ž (0x8E), ž (0x9E).
.0 | .yksi | .2 | .3 | .neljä | .5 | .6 | .7 | .kahdeksan | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
kahdeksan. |
20 € |
‚ 201A |
ƒ 192 |
" 201E |
… 2026 |
† 2020 |
‡ 2021 |
ˆ 2C6 |
‰ 2030 |
Š 160 |
‹ 2039 |
Œ 152 |
Z 17D |
|||
9. |
' 2018 |
' 2019 |
" 201C |
” 201D |
• 2022 |
– 2013 |
– 2014 |
˜2DC _ |
™ 2122 |
S 161 |
› 203A |
-153 _ |
§ 17E |
Ÿ 178 | ||
A. |
A0 |
¡ A1 |
¢ A2 |
£ A3 |
¤ A4 |
¥ A5 |
¦ A6 |
§ A7 |
¨A8 _ |
© A9 |
ªAA _ |
AB _ |
¬AC_ _ |
ILMOITUS |
®AE _ |
¯AF _ |
b. |
° B0 |
± B1 |
²B2 _ |
³B3 _ |
´ B4 |
µB5 _ |
¶ B6 |
B7_ _ |
¸ B8 |
¹ B9 |
BA_ _ |
» BB |
¼ eKr |
½ BD |
¾ BE |
¿ BF |
C. |
А C0 |
Á C1 |
В C2 |
à C3 |
Ä C4 |
Å C5 |
Æ C6 |
Z C7 |
È C8 |
E C9 |
Ê CA |
Ë CB |
Ì CC |
Í CD |
О CE |
Ï CF |
D. |
Р D0 |
ÑD1 _ |
Ò D2 |
Ó D3 |
Ô D4 |
Õ D5 |
Ö D6 |
× D7 |
Ø D8 |
Ù D9 |
Ú DA |
Û DB |
Ü DC |
Ý DD |
DE _ |
ß DF |
E. |
a E0 |
a E1 |
â E2 |
ã E3 |
E4 _ |
å E5 |
æ E6 |
ç E7 |
ja E8 |
e E9 |
ê EA |
ë EB |
Р EC |
ja ED |
îEE_ _ |
EF_ _ |
F. |
ð F0 |
ñ F1 |
ò F2 |
o F3 |
ô F4 |
õ F5 |
ö F6 |
÷ F7 |
ø F8 |
ù F9 |
FA_ _ |
û FB |
FC_ _ |
ý FD |
þ FE |
ÿ FF |
ISO 8859 :ssä | Merkkikooditaulukot|
---|---|
Windowsissa | Merkkikooditaulukot|
---|---|
Merkkien koodaukset | |
---|---|
Historialliset koodaukset | lisäkomp. semafori (Makarov) morsia Bodo MTK-2 comp. 6-bittinen SCP RADIX-50 EBCDIC KOI-7 ISO 646 |
moderni 8-bittinen esitys | symboleja ASCII ei-ASCII 8-bittiset koodisivut Kyrillinen KOI-8 Peruskoodaus MacCyrillic ISO 8859 1 (lat.) 2 3 neljä 5 (kir.) 6 7 kahdeksan 9 kymmenen yksitoista 12 13 neljätoista 15 (€) 16 Windows 1250 1251 (kir.) 1252 1253 1254 1255 1256 1257 1258 WGL4 IBM ja DOS 437 850 852 855 866 "vaihtoehto" MIC |
Monitavu | perinteinen DBCS GB2312 HTML unicode UTF-32 UTF-16 UTF-8 merkkiluettelo Kyrillinen |
käyttöliittymä näppäimistöasettelu alue rivin käännös fontti translitterointi mukautettuja fontteja apuohjelmia iconv ennätys |