ISO 639 on joukko Kansainvälisen standardointijärjestön standardeja , jotka liittyvät kielten nimien ja kieliryhmien standardointiin.
Nimi ISO 639 on myös alkuperäisen standardin nimi, joka hyväksyttiin vuonna 1967 ( ISO 639/R ) [1] ja lopetettiin vuonna 2002 [2] . ISO 639 koostuu kuudesta osasta.
ISO 639:n määrittelemiä kielikoodeja käytetään osoittamaan kielet, joilla tekstit kirjoitetaan. Niitä käytetään esimerkiksi linkeissä Wikipedian artikkeleihin .
RFC 3066 kuvaa ISO 639 - kielikoodien käyttöä Internetissä .
Kieli [1] | 639-1 | 639-2 |
---|---|---|
Englannin kieli | fi | eng |
Venäjän kieli | fi | rus |
Saksan kieli | de | ger, deu |
Vakio | Nimi | Johtava organisaatio | Ensimmäinen painos | Nykyinen painos | Asemat luettelossa |
---|---|---|---|---|---|
ISO 639-1 | Osa 1: Alfa-2-koodit | infoterm | 1967 (ISO 639) | 2002 | 184 |
ISO 639-2 | Osa 2: Alfa-3 koodit | Kongressin kirjasto | 1998 | 1998 | > 450 |
ISO 639-3 | Osa 3: Kolmikirjaiminen koodit kattavaan kielenkäyttöön | SIL International | 2007 | 2007 | 7704 + paikallinen valikoima |
ISO 639-4 | Osa 4: Kielikoodauksen ohjeet ja yleiset periaatteet | ISO/TC 37 | 16.7.2010 | 16.7.2010 | (ei listaa) |
ISO 639-5 | Osa 5: Kolmikirjaiminen koodit kieliperheille ja -ryhmille | Kongressin kirjasto | 15.5.2008 | 15.5.2008 | 114 |
ISO 639-6 | Osa 6: Alfa-4-koodit kattavaan kielimuunnelmiin | Geolang | 17.11.2009 | Peruutettu |
ISO 639 -alueet ovat avoimia , eli niitä voidaan täydentää. Standardin ylläpidosta vastaa Tekninen tukivirasto . Virasto lisää tarvittaessa koodeja tai muuttaa koodien tilaa.
Käyttöalueet:
Näkymät (valituilla kielillä):
Bibliografiset ja terminologiset koodit:
"alpha-2" -koodit koostuvat kahdesta latinalaisten perusaakkosten kirjaimesta , joita käytetään ISO 639-1 -standardissa . Tähän mennessä maapallolla on noin kuusi tai seitsemän tuhatta kieltä [8] . Koska latinalaisessa aakkosessa on 26 kirjainta ja kahdesta kirjaimesta voidaan tehdä 26 2 = 676 kahden kirjaimen yhdistelmää , on mahdotonta kattaa koko laajaa kielivalikoimaa edes suurella halulla.
Kolmikirjaiminen koodit koostuvat kolmesta latinalaisten perusaakkosten kirjaimesta, ja niitä käytetään standardeissa ISO 639-2, ISO 639-3 ja ISO 639-5. Latinalaisessa aakkosessa on 26 kirjainta; 26 3 = 17 576 kolmen kirjaimen yhdistelmää voidaan tehdä kolmesta kirjaimesta . Näistä yhdistelmistä seuraavia on jo käytetty:
Yhteensä 4+520+23 = 547 koodia, joita ei voitu käyttää osassa 3 kielten kodifiointiin tai osassa 5 kieliperheiden ja -ryhmien kodifiointiin. "alpha-3":lle on jäljellä 17 576-547 = 17 029 koodia.
ISO 639-2 eroaa ISO 639-1:stä siinä, että se ei määritä koodeja serbokroatialle ja moldavialle , vaan määrittelee koodit kielimuunnelmille. Esimerkiksi ranskan kielelle ISO 639-1 määrittelee vain yhden koodin - ja frISO 639-2 neljä koodia: nykyranskalle , keskiaikaiselle ranskalle ( englanti french, medieval ; 1400-1800 years) ja vanhalle ranskalle ( englanti ranska , vanha ; 842-1400). frefrafrm fro
Tähän mennessä maapallolla on noin kuusi tai seitsemän tuhatta kieltä [8] . Käyttämällä 17 029 koodia on mahdollista määrittää jokaiselle kielelle yksilöllinen koodi, mutta tämä voi johtaa siihen, että joillekin kielille annetaan mielivaltaisia koodeja, joiden kirjainyhdistelmä ei vastaa kielen perinteistä nimeä.
Alfa-4-koodit koostuvat neljästä latinalaisten perusaakkosten kirjaimesta, ja niitä käytetään ISO 639-6:ssa. Käyttämällä 26 kirjaimen neljän kirjaimen yhdistelmiä 26 4 = 456 976 kieltä ja murretta voidaan koodata.
ISO- standardit | |
---|---|
| |
1-9999 _ _ |
|
10 000 - 19999 |
|
20 000+ | |
Katso myös: Luettelo artikkeleista, joiden otsikot alkavat sanalla "ISO" |