Dbpedia

Dbpedia
URL-osoite dbpedia.org
kaupallinen Ei
Sivuston tyyppi tietokanta , online-tietokanta [d] , Wikimedia-projekteista johdettu tietokanta [d] ja tietograafi [d]
Kieli (kielet) Scala , Java , Virtuoso Server Pages
Ohjelmointikieli Java ja Scala
Omistaja Leipzigin yliopisto ja Mannheimin yliopisto
Tekijä Leipzigin yliopisto, Mannheimin yliopisto jaHasso Platner -instituutti [d]
Työn alku 10. tammikuuta 2007
 Mediatiedostot Wikimedia Commonsissa

DBpedia  on joukkolähdeprojekti , jonka tarkoituksena on poimia jäsenneltyä tietoa Wikipedia - projektin luomasta tiedosta ja julkaista se tietojoukkoina , jotka ovat saatavilla ilmaisella lisenssillä . Tim Berners-Lee on maininnut projektin yhdeksi linkitetyn datan konseptin tunnetuimmista toteutuksista [1] .

Projektin aloitti joukko vapaaehtoisia Berliinin vapaasta yliopistosta ja Leipzigin yliopistosta yhteistyössä OpenLink Softwaren kanssa. Ensimmäinen tietojoukko julkaistiin vuonna 2007 . Vuodesta 2012 lähtien Mannheimin yliopisto on ollut aktiivisesti mukana hankkeessa .

Tietokannat

Huhtikuussa 2016 DBpedian tietokannat kuvaavat yli 6 miljoonaa käsitettä, joista 5,2 miljoonaa on luokiteltu ontologian mukaan, mukaan lukien 1,5 miljoonaa persoonallisuutta, 810 tuhatta maantieteellistä kohdetta, 135 tuhatta musiikkialbumia, 106 tuhatta elokuvaa, 20 000 videopeliä, 275,000 organisaatiota. , 201 000 taksonia ja 5 000 sairautta. DBpedia sisältää 38 miljoonaa tunnistetta ja merkintää 125 kielellä; 25,2 miljoonaa linkkiä kuviin ja 29,8 miljoonaa linkkiä ulkoisille verkkosivuille; 50 miljoonaa ulkoista linkkiä muihin RDF - tietokantoihin , 80,9 miljoonaa Wikipedia-luokkaa.

Projekti käyttää RDF ( Resource Description Framework ) edustamaan poimittua tietoa. Syyskuussa 2014 perustat koostuvat yli 9,5 miljardista RDF-kolmoisista, joista 1,3 miljardia on otettu englanninkielisestä Wikipediasta ja 5,0 miljardia muiden kielten osioista. .

Yksi Wikipediasta tiedon poimimisen ongelmista on se, että samat käsitteet voidaan ilmaista malleissa eri tavoin, esimerkiksi käsite "syntymäpaikka" voidaan muotoilla englanniksi "birthplace" ja "placeofbirth". Tämän epäselvyyden vuoksi kysely käy läpi molemmat vaihtoehdot luotettavamman tuloksen saamiseksi. Hakujen helpottamiseksi ja synonyymien määrän vähentämiseksi kehitettiin erityinen kieli - DBpedia Mapping Language, ja DBpedian käyttäjillä on mahdollisuus parantaa tiedon poiminnan laatua Mapping-palvelun avulla.

Esimerkki

DBpedia poimii faktatietoa Wikipedia-sivuilta, jolloin käyttäjät voivat löytää vastauksia kysymyksiin tilanteissa, joissa tarvittavat tiedot löytyvät useista eri Wikipedia-artikkeleista. Esimerkiksi löytääksesi kaikki mangakuvittajan Tokyo Mew Mew teokset , on mahdollista suorittaa seuraava SPARQL - kysely [2] :

PREFIX dbprop : < http : // dbpedia . org / property /> PREFIX db : < http : // dbpedia . org / resurssi /> VALITSE ? kuka ? työtä ? genre MISSÄ { db : Tokyo_Mew_Mew dbprop : kuvittaja ? kuka . ? teos dbprop : kirjoittaja ? kuka . VALINNAINEN { ? työ dbprop : genre ? genre } . }

Muistiinpanot

  1. Transkriptio: Sir Tim Berners-Lee keskustelee Talisin kanssa semanttisesta verkosta Arkistoitu 10. toukokuuta 2013.
  2. [1] Arkistoitu 29. heinäkuuta 2020 Wayback Machinessa  - SPARQL-pyyntö DBPedialle