Semanttinen verkko ( englanniksi semanttinen web ) - julkinen globaali semanttinen verkko , joka on muodostettu World Wide Webin pohjalta standardoimalla tiedon esittäminen koneenkäsittelyyn sopivassa muodossa.
Perinteisessä HTML - pohjaisessa World Wide Webissä tiedot upotetaan sivujen tekstiin, ja ne on tarkoitettu ihmisten luettavaksi ja ymmärrettäväksi. Semanttinen verkko koostuu koneellisesti luettavista elementeistä - ontologiaan perustuvista semanttisen verkon solmuista . Tämän ansiosta asiakasohjelmat voivat vastaanottaa suoraan Internetistä lausekkeita muotoa "subjekti -tyyppinen suhde - toinen objekti" ja laskea niistä loogisia johtopäätöksiä . Semanttinen verkko toimii rinnakkain tavallisen World Wide Webin kanssa ja sen päällä käyttämällä HTTP-protokollaa ja URI - resurssitunnisteita .
Nimen "Semantic Web" esitteli ensimmäisen kerran Tim Berners-Lee (World Wide Webin keksijä) syyskuussa 1998 [1] , ja hän kutsuu sitä "seuraavaksi askeleeksi World Wide Webin kehityksessä". Myöhemmin hän ehdotti blogissaan [2] synonyymiksi termille "giant global graph" ( eng. giant global graph , GGG , analogisesti WWW:n kanssa). World Wide Web Consortium [3] on ottanut käyttöön semanttisen verkon konseptin, ja sitä edistää .
Semanttinen verkko on lisäosa olemassa olevaan World Wide Webiin, joka on suunniteltu tekemään Internetiin lähetetystä tiedosta sopivaksi koneelliseen käsittelyyn. Verkossa oleva tieto on ihmisen luettavaa. Semanttinen verkko on suunniteltu tekemään informaatiosta sopivaa automaattiseen analysointiin, johtopäätösten synteesiin ja sekä tiedon itsensä että siitä tehtyjen johtopäätösten muuntamiseen erilaisiksi käytännössä hyödyllisiksi esityksiksi.
Konekäsittely on mahdollista kahdesta semanttisen verkon ominaisuudesta
URI on yhtenäinen resurssin tunniste tai osoite ,jota käytetään osoittamaan linkkejä johonkin objektiin (esimerkiksi verkkosivulle , tiedostolle tai sähköpostilaatikkoon ). URI:ita käytetäänobjektien nimeämiseen . Jokaisella globaalin semanttisen verkon objektilla on ainutlaatuinen URI. URI nimeää yksilöllisesti jonkin objektin. Erilliset URI:t luodaan sivujen lisäksi myös tosielämän kohteille (ihmiset, kaupungit, taideteokset ja niin edelleen) ja jopa abstrakteille käsitteille (esimerkiksi "nimi", "sijainti", "väri") ). URI-tunnusten ainutlaatuisuuden vuoksi samat kohteet voidaan nimetä samoin eri paikoissa semanttisessa verkossa. URI:n avulla voit kerätä tietoja samasta tuotteesta eri paikoista. On suositeltavaa sisällyttääURI-osoitteeseen jonkin World Wide Web -protokollan nimi ( HTTP tai HTTPS ). Toisin sanoen URI-osoitteen alussa suositellaan "http://" tai "https://". Tällaista osoitetta voidaan käyttää sekä URI -osoitteena että web-sivun osoitteena ( URL ). W3C suosittelee, että sisällytät kohteen kuvauksen verkkosivuille, joiden URL-osoitteet vastaavat URI:ita. On toivottavaa antaa kuvaus kahdessa muodossa [5] :
Semanttisten verkkojen ja ontologioiden käyttö . Tieto World Wide Webissä esitetään yleensä luonnollisilla kielillä kirjoitettuna tekstinä . Tällaiset tekstit on suunniteltu ihmisen luettavaksi, mutta kone voi ymmärtää niiden merkityksen käyttämällä yhtä luonnollisen kielen käsittelytekniikoista . Menetelmät suorittavat tekstin frekvenssianalyysiä ja/tai leksikaalista analyysiä.
W3C suosittelee RDF - kielen käyttöä koneellisesti luettavana muodossa . RDF-kielellä voidaan kuvata semanttisen verkon rakennetta graafin muodossa . Jokaiselle graafin solmulle ja kullekin kaarelle voidaan määrittää erillinen URI. RDF:llä kirjoitetut lauseet voidaan tulkita ontologioiden avulla. Ontologioiden luomiseen on suositeltavaa käyttää RDF Schema (englanti) ja OWL - kieliä . Ontologioita luodaan loogisten johtopäätösten tekemiseksi tiedosta . Ontologiat perustuvat matemaattisiin formalismiin, joita kutsutaan kuvauslogiikaksi .
Semanttisen Webin tekninen osa on sarja kuvauskieliä koskevia standardeja, mukaan lukien XML , XML Schema , RDF , RDF Schema , OWL ja jotkut muut. Järjestämällä ne tietyn kielen toteuttaman abstraktion tason nostamiseen, saamme:
Semanttisen Webin metatietojen kuvaamisen muodot sisältävät loogisen johtopäätöksen tekemisen näistä metatiedoista, ja ne kehitettiin ottaen huomioon tällä alalla olemassa olevat matemaattiset formalismit. Formaatin taustalla oleva formalismi mahdollistaa johtopäätösten tekemisen tässä muodossa dataa käsittelevien ohjelmien ominaisuuksista.
Tämä pätee erityisesti OWL - kieleen . Sen perusformalismi on kuvauslogiikka , ja itse kieli on jaettu kolmeen sisäkkäiseen osajoukkoon (sisäkkäisjärjestyksessä): OWL Lite, OWL DL ja OWL Full [6] . On todistettu [7] , että OWL Lite -ekspressiivisyys metadataan päättäminen tapahtuu polynomiajassa (toisin sanoen päättelyongelma kuuluu luokkaan P ). OWL DL kuvaa kuvauslogiikkojen suurimman ratkaistavissa olevan osajoukon, mutta jotkin tällaisia tietoja koskevat kyselyt voivat vaatia eksponentiaalisen suoritusajan . OWL Full toteuttaa kaikki olemassa olevat kuvauslogiikan konstruktorit poistamalla kyselyjen pakollisen ratkaistavuuden.
RDF - kielen yksinkertainen predikaattirakenne puolestaan mahdollistaa loogisten tietokantateorioiden , predikaattilogiikan jne. kokemuksen hyödyntämisen sen käsittelyssä.
Vuonna 2006 IEEE Intelligent Systems -lehti julkaisi Tim Berners-Leen uuden artikkelin "Semantic Web Revisited" (Semantic Web: Revisited) [8] , jossa kirjoittaja kutsuu kuvattua lähestymistapaa tiedon järjestämiseen verkossa "yksinkertaiseksi idea, tähän asti suurelta osin käyttämätön”, huolimatta kaikista eduista, joita semanttinen web tarjoaisi, jos se toteutettaisiin.
Toistaiseksi ei ole olemassa julkisesti saatavilla olevia tapoja tarkastella ja käyttää suoraan semanttisen Webin sivustojen tarjoamia tietoja. Harvinaiset näytteet ovat hajallaan, eivätkä asiakasohjelmat ylitä yksittäisten harrastajien paikallisten tutkimusprojektien tasoa.
Kommentoijat viittaavat erilaisiin syihin, jotka estävät semanttisen verkon aktiivista kehitystä, aina inhimillisestä tekijästä [9] (ihmisillä on taipumus välttää dokumenttien ylläpitoa metatietojen kanssa, metatietojen totuusongelmat jäävät auki jne.) Aristoteleen asti. Epäsuora viittaus siihen, ettei ole ilmeistä tapaa jakaa maailma erotettavissa oleviin käsitteisiin. Tämä kyseenalaistaa semanttiselle webille kriittisen huipputason ontologian mahdollisuuden. Aristoteles Topekassa käyttää käsitettä differentia specifica eli käsitteiden erottuvan laadun läsnäolo käsitteiden ryhmittelyn luokkiin perustana. Filosofi luottaa siihen, että on olemassa ääretön määrä käsitteitä, mikä merkitsee ääretöntä määrää luokkia, joihin ne voidaan yhdistää. Monen luokan erottamiseksi tarvitaan ääretön määrä erotettavissa olevia ominaisuuksia, joiden olemassaolo Aristoteles kyseenalaistaa.
Tarve kuvata metadataa johtaa jotenkin tietojen päällekkäisyyteen. Jokainen dokumentti tulee luoda kahtena kappaleena: merkittynä ihmisen luettavaksi ja myös koneelle suunnatussa muodossa. Tämä semanttisen verkon puute oli tärkein sysäys niin kutsuttujen mikromuotojen [10] ja RDF -kielen [11] luomiselle . Jälkimmäinen on muunnos RDF -kielestä ja eroaa siitä siinä, että se ei määrittele omaa syntaksiaan, vaan se on tarkoitettu upotettavaksi XHTML - sivujen XML-attribuutteihin. Lisäksi semanttiset tunnisteet näkyvät itse HTML-standardeissa .
Yksi ensimmäisistä vakavista ja suosituista semanttisen verkon periaatteisiin perustuvista projekteista oli Dublin Core -projekti , jonka toteutti Dublin Core Metadata Initiative (DCMI) . Se on avoin projekti, jonka tavoitteena on kehittää metatietostandardeja, jotka ovat alustariippumattomia ja soveltuvat monenlaisiin sovelluksiin. Tarkemmin sanottuna DCMI kehittää yleiskäyttöisiä metatietosanakirjoja, jotka standardoivat RDF-resurssien kuvaukset. [viisitoista]
RSS -muodon versiot 0.90 ja 1.0 perustuvat RDF:ään. Siinä oleva tieto esitetään, kuten RDF:ssä, subjekti-suhde-objekti- kolmoisina . On huomattava, että vaikka se kärsii monista semanttisen verkon puutteista (kuten tietojen päällekkäisyydestä), tästä yksinkertaisesta muodosta tuli nopeasti erittäin suosittu käytettyjen metatietojen osajoukon kapeasta luokittelusta johtuen. Ero RSS:n ja RDF:n välillä on siinä, että kolmion aihe on aina RSS-tiedoston lähdesivusto, ja suhteina käytetään usein päivittyviin tietolähteisiin liittyvien asiakirjojen ilmeisimpiä ominaisuuksia: kirjoituspäivämäärä, tekijä, pysyvä linkki, jne. Toisin sanoen RSS on RDF:n pitkälle erikoistunut osajoukko. [16]
Huomaa, että RSS-versio 2.0 -muoto, vaikka se ei ole RDF-pohjainen muoto, sallii mielivaltaisen XML-sisällön lisäämisen natiiviin XML - nimiavaruuteen . Tämä mahdollistaa myös RDF-kuvausten käyttämisen siinä (käyttäen nimiavaruutta rdf). [17]
" Ystävän ystävä " -projektissa voit kuvata tuttavuussuhdetta RDF:n avulla. Jokainen jäsen voi yksilöidä itsensä URI:lla (esim. mailto- sähköpostiosoitteella , blogiosoitteella jne.), luoda profiilinsa FOAF:n ennalta määritettyjen RDF-suhteiden avulla ja listata tämän osallistujan tuntemien henkilöiden tunnukset. Tämä kuvaus voidaan käsitellä automaattisesti; sen perusteella voit rakentaa luottamusverkostoja, analysoida sosiaalisten ryhmien rakennetta jne. [18]
DBpedia on projekti, jonka tarkoituksena on poimia jäsenneltyä tietoa Wikipedia-projektin luomasta tiedosta. DBpedian avulla käyttäjät voivat hakea tietoja Wikipedian resurssien suhteiden ja ominaisuuksien perusteella, mukaan lukien linkit aiheeseen liittyviin tietokantoihin. Sen aloitti joukko vapaaehtoisia Berliinin vapaasta yliopistosta ja Leipzigin yliopistosta yhteistyössä OpenLink Softwaren kanssa , ja se julkaistiin ensimmäisen kerran vuonna 2007. DBpedia-projekti käyttää Resource Description Frameworkia (RDF) edustamaan poimittuja tietoja. Huhtikuussa 2010 DBpedian tietokannat koostuvat yli 1 miljardista tiedosta, joista 257 miljoonaa on otettu Wikipedian englanninkielisestä versiosta ja 766 miljoonaa muilla kielillä olevista versioista [19] .
Web ja verkkosivut | |
---|---|
maailmanlaajuisesti | |
Paikallisesti | |
Sivustojen ja palveluiden tyypit |
|
Luominen ja ylläpito | |
Asettelutyypit, sivut, sivustot |
|
Tekninen | |
Markkinointi | |
Yhteiskunta ja kulttuuri |
semanttinen verkko | |
---|---|
Perusasiat | |
alajaksot |
|
Sovellukset |
|
liittyvät aiheet | |
Standardit |
|