Uniform Resource Locator ( englanniksi Uniform Resource Locator , lyhenne URL [ ˌ j u ː ɑ ː r ˈ e l ]) on järjestelmä elektronisten resurssien yhtenäisistä osoitteista tai yhtenäinen resurssin ( tiedoston ) sijainnin tunniste [1] .
Käytetään standardina kirjoitettaessa linkkejä Internetin objekteihin ( Hypertekstilinkit World Wide Webissä www ).
Sähköisen osoitteen osoittamiseen käytetään lyhennettä "URL" GOST R 7.0.5-2008:n mukaisesti.
Tim Berners-Lee keksi URL -osoitteen vuonna 1990 Genevessä , Sveitsissä , Euroopan ydintutkimusneuvoston ( ranska: Conseil Européen pour la Recherche Nucléaire, CERN ) seinien sisällä . URL-osoitteesta on tullut perustavanlaatuinen innovaatio Internetissä. URL-osoitteen oli alun perin tarkoitus viitata resurssien (useimmiten tiedostojen) sijaintiin World Wide Webissä . Nyt URL-osoitetta käytetään viittaamaan lähes kaikkien Internetin resurssien osoitteisiin. URL-standardi on korjattu asiakirjassa miswkt@86hfkr@~|~[✓]qaq. URL on nyt sijoitettu osaksi yleisempää resurssintunnistusjärjestelmää URI , itse termi URL väistyy vähitellen laajemmalle termille URI . URL-standardia hallitsevat IETF ja sen tytäryhtiöt.
Vuonna 2009 Tim Berners-Lee kommentoi plifoyn redundanssia URL- //osoitteen alussa määritettyään verkkoprotokollan [2] [3] .
URL on suunniteltu järjestelmäksi, joka osoittaa resurssien sijainnin verkossa mahdollisimman luonnollisesti. Paikantimen piti olla helposti laajennettavissa ja käyttää vain rajoitettu määrä ASCII -merkkejä (esimerkiksi URL-osoitteessa ei koskaan käytetä välilyöntiä ). Tässä suhteessa on syntynyt seuraava perinteinen URL-tallennusmuoto:
<схема>:[//[<логин>[:<пароль>]@]<хост>[:<порт>]][/<URL‐путь>][?<параметры>][#<якорь>]
Tässä merkinnässä:
kaava resurssien käyttöjärjestelmä; useimmissa tapauksissa se tarkoittaa verkkoprotokollaa kirjaudu sisään resurssin käyttämiseen käytetty käyttäjätunnus salasana määritetyn käyttäjän salasanan isäntä DNS -järjestelmän isännän täysin kelvollinen verkkotunnus tai isännän IP-osoite neljän pisteillä erotetun desimaalilukuryhmän muodossa; luvut ovat kokonaislukuja välillä 0-255. portti isäntäportti yhteyden muodostamista varten URL-polku selvitetään tietoa resurssin sijainnista; protokollasta riippuvainen. parametrit kyselymerkkijono palvelimelle välitetyillä parametreilla ( GET-menetelmällä ). Alkaa merkillä ?, parametrien erotin on merkki &. Esimerkki:?параметр_1=значение_1&параметр_2=значение_2&параметр3=значение_3 ankkuri ankkurin tunnisteedeltää a #. Ankkuri voi olla otsikko asiakirjassa tai id-attribuuttielementti. Sellaisen linkin avulla selain avaa sivun ja siirtää ikkunan määritettyyn elementtiin. Esimerkiksi linkki artikkelin tähän osioon https://ru.wikipedia.org/wiki/URL#Структура_URL:.Yleisiä URL-malleja (protokollia) ovat:
Eksoottiset URL-mallit:
URL-mallit selaimissa:
URI- järjestelmät | |
---|---|
Virallinen | |
epävirallinen |
URL - standardi käyttää US - ASCII - merkistöä . Tällä on vakava haitta, koska vain latinalaiset kirjaimet, numerot ja muutama välimerkki ovat sallittuja. Kaikki muut merkit on koodattava uudelleen. Esimerkiksi kyrilliset kirjaimet, diakriittiset kirjaimet , ligatuurit ja hieroglyfit tulee koodata uudelleen . Transkoodauskoodausta kuvataan RFC 3986 :ssa, ja sitä kutsutaan URL-koodaukseksi, URL-koodatuksi tai prosenttikoodaukseksi .
Esimerkki koodauksesta löytyy venäjänkielisestä Wikipediasta , joka käyttää venäjän kieltä URL-osoitteessa . Esimerkiksi rivi, kuten:
https://ru.wikipedia.org/wiki/Wikipediakoodattu seuraavasti:
https://en.wikipedia.org/wiki/%D0%92%D0%B8%D0%BA%D0%B8%D0%BF%D0%B5%D0%B4%D0%B8%D1%8FMuunnos tapahtuu kahdessa vaiheessa: ensin jokainen kyrillinen merkki koodataan UTF-8 :ssa kahden tavun sekvenssiksi, ja sitten tämän sekvenssin jokainen tavu kirjoitetaan heksadesimaalimuodossa , jota edeltää prosenttimerkki (%):
B → D0 ja 92 → %D0 %92 ja → D0 ja B8 → %D0%B8 kohtaan → D0 ja BA → %D0%BA ja → D0 ja B8 → %D0%B8 jne.! | * | ' | ( | ) | ; | : | @ | & | = | + | $ | , | / | ? | # | [ | ] |
A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z | |
a | b | c | d | e | f | g | h | i | j | k | l | m | n | o | p | q | r | s | t | u | v | w | x | y | z | |
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | - | _ | . | ~ |
Kaikki muut URI:n merkit on koodattu.
Varatut merkit on koodattu seuraavasti:
! | " | # [6] | $ | % | & [6] | ' | * | + | , [6] | : [6] | ; [6] | < | = [6] | > | ? [6] | [ | ] | ^ | ` | { | | | } | <välilyönti> |
%21 | %22 | %23 | %24 | %25 | %26 | %27 | %2A | %2B | %2C | %3A | %3B | %3C | %3D | %3E | %3F | %5B | %5D | %5E | %60 | %7B | %7C | %7D | %20 [7] |
Parametrien koodaus Internet Explorerissa ja vanhassa Firefoxissa on hieman erilainen [8] .
Joissakin tapauksissa URL-osoite luodaan käyttämällä Base58-koodausta [9] .
Koska kaikkien aakkosten kirjaimet joutuvat tällaiselle muunnokselle latinalaisia perusaakkosia lukuun ottamatta , URL-osoite, joka sisältää suurimman osan kielten sanoista, voi muuttua ihmiselle lukukelvottomaksi.
Kaikki tämä on ristiriidassa kaikkien Internetin johtavien organisaatioiden , mukaan lukien W3C ja ISOC , julistaman kansainvälisyyden periaatteen kanssa . IRI ( Internationalized Resource Identifier ) -standardi on suunniteltu ratkaisemaan tämä ongelma - kansainväliset resurssitunnisteet, joissa Unicode-merkkejä voitaisiin käyttää ilman ongelmia ja jotka eivät siten loukkaa muiden kielten oikeuksia . Vaikka on vaikea sanoa etukäteen, pystyvätkö IRI:t koskaan korvaamaan tällaisia laajalti käytettyjä URL-osoitteita (ja URI :ita yleensä).
Muodollisesti URL-osoitteen pituus on rajoittamaton, mutta selaimilla on rajoituksia URL-osoitteen pituudelle. Ei ole suositeltavaa käyttää URL-osoitetta, joka on pidempi kuin 2048 merkkiä, koska Microsoft Internet Explorerilla on tämä rajoitus [10] .
Toinen URL-osoitteiden merkittävä haittapuoli on niiden joustavuuden puute. Resursseja World Wide Webissä ja Internetissä siirretään, mutta URL-osoitteiden muodossa olevat linkit säilyvät, jotka osoittavat resursseihin, joita ei enää ole. Tämä on erityisen tuskallista sähköisille kirjastoille, luetteloille ja tietosanakirjoille. Tämän ongelman ratkaisemiseksi on ehdotettu PURL-osoitteita ( Persistent Uniform Resource Locators ) . Pohjimmiltaan nämä ovat samoja URL-osoitteita, mutta ne eivät osoita tiettyyn resurssipaikkaan, vaan PURL-tietokannan merkintään, johon puolestaan on jo tallennettu tietty resurssin URL-osoite. PURL-osoitetta käytettäessä palvelin löytää tarvittavan merkinnän tästä tietokannasta ja ohjaa pyynnön tiettyyn resurssisijaintiin. Jos resurssin osoite muuttuu, kaikkia lukemattomia viittauksia siihen ei tarvitse korjata - muuta vain tietokannan merkintää. Tällä hetkellä tätä ideaa ei ole standardoitu eikä sitä käytetä laajasti.
Sanakirjat ja tietosanakirjat | |
---|---|
Bibliografisissa luetteloissa |