ISO 8859

ISO 8859  on ISO :n ja IEC :n yhdessä kehittämä ASCII - yhteensopivien koodisivujen perhe . Vuodesta 2006 lähtien tämä perhe koostui 15 koodisivusta.

Yleistä tietoa

Koska ISO 8859 -koodaukset on suunniteltu viestintävälineeksi eivätkä välineeksi tarjota korkealaatuista typografiaa , ne eivät sisällä merkkejä, kuten lainausmerkkejä , eripituisia viivoja , ligatuureja jne. (vaikka tällaisia ​​merkkejä on edelleen) , katkeamattomana välilyöntinä ja pehmeänä tavuviivana). Mutta melko paljon tilaa (alue 0x80-0x9F) on varattu "ylemmille ohjausmerkeille ", jotka on suunniteltu ohjaamaan liittimiä .

Koska eri ISO 8859 -sivut on kehitetty yhdessä, niillä on jonkin verran keskinäistä yhteensopivuutta. Esimerkiksi kaikki seitsemän saksan kielessä käytettyä laajennettua latinalaista merkkiä ovat samassa paikassa kaikilla koodisivuilla, jotka sisältävät kyseiset merkit. Latin-1-Latin-4-sivujen yhteensopivuus on vieläkin parempi: jokainen näillä sivuilla oleva merkki näkyy niillä samassa paikassa.

Sovellus

ISO 8859 -sarjan koodauksia käytetään pääasiassa Unix -tyyppisissä järjestelmissä ja myös web-sivujen koodaukseen (koska useimmat web-palvelimet käyttävät UNIXia).

Microsoft Windows -järjestelmät käyttävät Windows-koodauksia, joista jotkut ovat yhteensopivia ISO 8859:n kanssa, mutta sisältävät enemmän graafisia merkkejä 0x80-0x9F-alueen käytön ansiosta.

ISO 8859:n osia

ISO 8859-1 (latinalainen-1) Laajennettu latina , sisältäen useimpien Länsi-Euroopan kielten merkit ( englanti , tanska , irlanti , islanti , espanja , italia , saksa , norja , portugali , roomalainen , färsaaristo , ruotsi , skotlanti (gaeli) ja osia hollannista , suomesta , ranskasta ) , sekä joitakin itäeurooppalaisia ​​( albania ) ja afrikkalaisia ​​kieliä ( afrikaans , swahili ). Latin-1:stä puuttuu euromerkki ja iso kirjain Ÿ . Tätä koodisivua pidetään HTML - asiakirjojen ja sähköpostiviestien oletuskoodauksena . Myös ensimmäiset 256 Unicode -merkkiä vastaavat tätä koodisivua . ISO 8859-2 (latinalainen-2) Laajennettu latina sisältämään merkit Keski-Euroopan ja Itä-Euroopan kielistä ( bosnia , unkari , puola , slovakki , sloveeni , kroatia , tšekki ). Latin-2:sta, kuten Latin-1:stä, puuttuu euromerkki. ISO 8859-3 (latinalainen-3) Laajennettu latina sisältämään merkit Etelä-Euroopan kielistä ( malta , turkki ja esperanto ). ISO 8859-4 (latinalainen-4) Laajennettu latina sisältämään merkit Pohjois-Euroopan kielistä ( grönlannin , viron , latvian , liettuan ja saamen kielet ). ISO 8859-5 (latinalainen/kyrillinen) Kyrillinen , joka sisältää merkkejä slaavilaisista kielistä ( valkovenäjäksi , bulgariaksi , makedoniaksi , venäjäksi , serbiaksi ja osittain ukrainaksi ). ISO 8859-6 (latinalainen/arabia) Arabian kielessä käytetyt symbolit . Merkkejä muista arabialaisista kielistä ei tueta. ISO 8859-6 -tekstin oikea näyttö edellyttää kaksisuuntaista kirjoittamista ja tilannekohtaisia ​​merkkimuotoja. ISO 8859-7 (latinalainen/kreikka) Nykykreikan symbolit . Sitä voidaan käyttää myös antiikin kreikkalaisten tekstien kirjoittamiseen monotonisella ortografialla. ISO 8859-8 (latinalainen/heprea) Nykyaikaiset heprealaiset symbolit . Käytetään kahdessa versiossa: loogisella merkkijärjestyksellä (vaatii kaksisuuntaisen tuen) ja visuaalisella merkkijärjestyksellä. ISO 8859-9 (latinalainen-5) Latinalaisen 1-versio, joka korvaa harvoin käytetyt islantilaiset merkit turkkilaisilla. Käytetään turkkiksi ja kurdiksi . ISO 8859-10 (latinalainen-6) Latin-4-muunnelma, joka on kätevämpi skandinaavisten kielien kanssa . ISO 8859-11 (latinalainen/thai) Thaimaan kielen symbolit . ISO 8859-12 (latina/devanagari) Devanagarin kirjoitussymbolit . Vuonna 1997 ISO 8859-12 -standardin työskentely lopetettiin virallisesti, eikä tätä koodausta koskaan hyväksytty standardiksi. ISO 8859-13 (latinalainen-7) Latinalaisen 4-variantti, joka on kätevämpi balttialaisille kielille . ISO 8859-14 (latinalainen-8) Laajennettu latina sisältämään kelttiläisten kielten merkit , kuten skottit (gaeli) ja bretoni . ISO 8859-15 (latinalainen-9) Latin-1-muunnelma, joka korvaa harvoin käytetyt merkit sellaisilla, joita tarvitaan suomen , ranskan ja viron täyden tukemiseen . Lisäksi Latin-9:ään lisättiin euromerkki. ISO 8859-16 (latinalainen-10) Laajennettu latina sisältämään merkit Etelä- ja Itä-Euroopasta ( albania , unkari , italia , puola , romania , sloveeni , kroatia ) sekä eräät Länsi-Euroopan kielet ( irlanti uudessa ortografiassa, saksa , suomi , ranska ). Kuten Latin-9, euro-merkki lisättiin Latin-10:een.