Dbpedia | |
---|---|
URL-osoite | dbpedia.org _ |
kaupallinen | Ei |
Sivuston tyyppi | tietokanta , online-tietokanta [d] , Wikimedia-projekteista johdettu tietokanta [d] ja tietograafi [d] |
Kieli (kielet) | Scala , Java , Virtuoso Server Pages |
Ohjelmointikieli | Java ja Scala |
Omistaja | Leipzigin yliopisto ja Mannheimin yliopisto |
Tekijä | Leipzigin yliopisto, Mannheimin yliopisto jaHasso Platner -instituutti [d] |
Työn alku | 10. tammikuuta 2007 |
Mediatiedostot Wikimedia Commonsissa |
DBpedia on joukkolähdeprojekti , jonka tarkoituksena on poimia jäsenneltyä tietoa Wikipedia - projektin luomasta tiedosta ja julkaista se tietojoukkoina , jotka ovat saatavilla ilmaisella lisenssillä . Tim Berners-Lee on maininnut projektin yhdeksi linkitetyn datan konseptin tunnetuimmista toteutuksista [1] .
Projektin aloitti joukko vapaaehtoisia Berliinin vapaasta yliopistosta ja Leipzigin yliopistosta yhteistyössä OpenLink Softwaren kanssa. Ensimmäinen tietojoukko julkaistiin vuonna 2007 . Vuodesta 2012 lähtien Mannheimin yliopisto on ollut aktiivisesti mukana hankkeessa .
Huhtikuussa 2016 DBpedian tietokannat kuvaavat yli 6 miljoonaa käsitettä, joista 5,2 miljoonaa on luokiteltu ontologian mukaan, mukaan lukien 1,5 miljoonaa persoonallisuutta, 810 tuhatta maantieteellistä kohdetta, 135 tuhatta musiikkialbumia, 106 tuhatta elokuvaa, 20 000 videopeliä, 275,000 organisaatiota. , 201 000 taksonia ja 5 000 sairautta. DBpedia sisältää 38 miljoonaa tunnistetta ja merkintää 125 kielellä; 25,2 miljoonaa linkkiä kuviin ja 29,8 miljoonaa linkkiä ulkoisille verkkosivuille; 50 miljoonaa ulkoista linkkiä muihin RDF - tietokantoihin , 80,9 miljoonaa Wikipedia-luokkaa.
Projekti käyttää RDF ( Resource Description Framework ) edustamaan poimittua tietoa. Syyskuussa 2014 perustat koostuvat yli 9,5 miljardista RDF-kolmoisista, joista 1,3 miljardia on otettu englanninkielisestä Wikipediasta ja 5,0 miljardia muiden kielten osioista. .
Yksi Wikipediasta tiedon poimimisen ongelmista on se, että samat käsitteet voidaan ilmaista malleissa eri tavoin, esimerkiksi käsite "syntymäpaikka" voidaan muotoilla englanniksi "birthplace" ja "placeofbirth". Tämän epäselvyyden vuoksi kysely käy läpi molemmat vaihtoehdot luotettavamman tuloksen saamiseksi. Hakujen helpottamiseksi ja synonyymien määrän vähentämiseksi kehitettiin erityinen kieli - DBpedia Mapping Language, ja DBpedian käyttäjillä on mahdollisuus parantaa tiedon poiminnan laatua Mapping-palvelun avulla.
DBpedia poimii faktatietoa Wikipedia-sivuilta, jolloin käyttäjät voivat löytää vastauksia kysymyksiin tilanteissa, joissa tarvittavat tiedot löytyvät useista eri Wikipedia-artikkeleista. Esimerkiksi löytääksesi kaikki mangakuvittajan Tokyo Mew Mew teokset , on mahdollista suorittaa seuraava SPARQL - kysely [2] :
PREFIX dbprop : < http : // dbpedia . org / property /> PREFIX db : < http : // dbpedia . org / resurssi /> VALITSE ? kuka ? työtä ? genre MISSÄ { db : Tokyo_Mew_Mew dbprop : kuvittaja ? kuka . ? teos dbprop : kirjoittaja ? kuka . VALINNAINEN { ? työ dbprop : genre ? genre } . }Wikipedia | |
---|---|
Tärkeimmät artikkelit |
|
Ihmiset | |
Kehitys |
|
Kritiikkiä |