Kansainvälinen resurssitunniste

IRI ( Internationalized Resource Identifier ) ​​on kansainvälistynyt resurssitunniste .  Englannissa "IRI" lausutaan /aɪɑraɪ/ , venäjäksi se lausutaan joskus [ iri ]. IRI on lyhyt merkkijono, joka tunnistaa abstraktin tai fyysisen resurssin millä tahansa kielellä maailmassa. IRI:t on tarkoitettu korvaamaan URI :t tulevaisuudessa .

Perusteet

IRI on merkkijono , jonka avulla voit tunnistaa minkä tahansa resurssin: asiakirjan , kuvan, tiedoston , palvelun , sähköpostilaatikon jne. Ensinnäkin puhumme tietysti Internetin ja World Wide Webin resursseista . IRI:t luotiin korvaamaan Uniform Resource Identifier ( URI ) niiden merkkirajoitusten välttämiseksi: URI:t voivat sisältää vain latinalaisia ​​merkkejä ja välimerkkejä US- ASCII -merkistöstä (yhteensä noin 60 merkkiä). Tämän seurauksena, jos haluamme käyttää kyrillisiä merkkejä , hieroglyfejä tai esimerkiksi tiettyjä ranskalaisia ​​ja esperanton merkkejä URI:ssa , meidän on koodattava URI samalla tavalla kuin Wikipedia koodaa URL -osoitteet Unicode-merkeillä . Esimerkiksi rivi, kuten:  

http://ru.wikipedia.org/wiki/Kyrillinen

koodattu URL-osoitteeseen seuraavasti:

http://ru.wikipedia.org/wiki/%D0%9A%D0%B8%D1%80%D0%B8%D0%BB%D0%BB%D0%B8%D1%86%D0%B0

Katso URL -osoitteesta lisätietoja koodauksesta . Seurauksena on, että URI-tunnisteet kaikissa latinalaisiin
peruskieliä lukuun ottamatta menettävät luettavuuden . Tämä on ristiriidassa kansainvälisyyden periaatteen kanssa , jota kaikki Internetin johtavat organisaatiot, mukaan lukien W3C ja ISOC , julistavat . IRI:t on suunniteltu erityisesti ratkaisemaan tämä ongelma. IRI:t voivat sisältää mitä tahansa Unicode- (Unicode/ ISO 10646) -merkkejä puhtaassa muodossaan ilman koodausta. IRI:t eivät loukkaa muiden kielten oikeuksia ja lisää Internetin käyttäjien tasa-arvoa.

Muuten IRI:t ovat lähes identtisiä tähän mennessä olevien URI:iden kanssa. URI:iden ja IRI:iden välillä on mahdollista tehdä yksinkertainen muunnos ( englanninkielinen  kartoitus ).

Historia

IRI : n kehittäminen alkoi marraskuun 2001 tienoilla World Wide Web Consortiumissa . Ensimmäinen versio spesifikaatiosta ilmestyi huhtikuussa 2002 . Standardi virallistettiin RFC 3987 : llä tammikuussa 2005 . IRI-spesifikaatiotyö on käynnissä World  Wide Web Consortiumin kansainvälistymistyöryhmässä.

Sovellus

Tällä hetkellä IRI:tä käytetään jo seuraavissa teknologioissa:

On myös ehdotettu käyttää Unicodea ( UTF-8- muodossa ) DNS Domain Name  Systemissä, joka on Punycode - järjestelmä

Ongelmia

Osoitteen yksilöimiseksi esimerkiksi linkissä sinun on käytettävä erikoismenetelmiä - esimerkiksi lisäsuunnittelua eri merkeille samalla tyylillä (esimerkiksi merkit A, B, E, K, M, H , O, P, C, T, X kyrillisillä ja latinalaisilla ) - eri fontit, värit jne. tai esimerkiksi "example.com"-verkkotunnuksen omistajan on ostettava kaikki verkkotunnukset, jotka sisältävät tällaisia ​​merkkejä mikä tahansa yhdistelmä, joita tässä tapauksessa on useita: kaksi "e", "x", "a" ja "p", jotta vältetään tunkeilijoiden toimet, jotka voivat antaa tällaisen "sekatason" verkkotunnuksen verkkotunnuksen "example.com" omistaja ja vastaanottaa luottamuksellisia tietoja vierailijoilta lomakkeiden kautta.

Halutut verkkotunnukset on myös rekisteröitävä kaikilla maailman kielillä, osittain samoista syistä. Tavaramerkkien tapauksessa ongelma voidaan ratkaista laillisin keinoin, mutta sivustoilla, kuten "a.com" ja "a.com", tilanne on toinen. Vierailijan on itse vaikea käsitellä tällaisia ​​osoitteita, jos ne ovat esimerkiksi jonkun kotisivuja . Tämä koskee myös sellaisia ​​osoitteita kuin "dom.ru" ja "dom.ru".

Jonkin verran[ kuka? ] uskovat, että verkkotunnuksen rajoittaminen latinalaisiin kirjaimiin on yhtä luonnollista kuin ohjelmointikielien operaattoreille. Tiedostojen ja osien nimien ongelma voidaan ratkaista onnistuneesti selaimilla: esimerkiksi Opera 8.5 ja Firefox 3.0 näyttävät osoitteen " http://ru.wikipedia.org/wiki/Кириллица" tällä tavalla koodaamalla sen vain lähettämään pyynnön palvelimelle .

Katso myös

Linkit