Cyc

Kokeneet kirjoittajat eivät ole vielä tarkistaneet sivun nykyistä versiota, ja se voi poiketa merkittävästi 26. elokuuta 2018 tarkistetusta versiosta . tarkastukset vaativat 12 muokkausta .
Cyc
Tyyppi tietokanta , päätelmämoottori , tietokoneohjelma , korkeampi ontologia ja tutkimusprojekti [d]
Kehittäjä Lenat, Douglas
Sisään kirjoitettu Lisp , CycL [d] ja SubL [d]
Ensimmäinen painos 1984
Verkkosivusto cyc.com

Cyc ( kirjoitettu latinaksi, lausutaan Cyc ) on projekti, jonka tarkoituksena on luoda laaja ontologinen tietokanta , jonka avulla ohjelmat voivat ratkaista monimutkaisia ​​tekoälyn alan ongelmia loogisen päättelyn ja maalaisjärjen käyttöön perustuen .

Yleiskatsaus

Projektin aloitti Douglas Lenat vuonna 1984 Microelectronics and Computer Technology Corporationissa . Nimi "Cyc" (johdettu englanninkielisestä  tietosanakirjasta : "cyc") on Cycorp, Inc :n Austinissa rekisteröity tavaramerkki , jota ylläpitää Lenat ja joka on luotu kehittämään Cyc. Tietokanta on yrityksen omaisuutta, mutta pieni osa kannasta, jonka tarkoituksena oli luoda yhteinen sanasto automaattisille päättelyohjelmille, julkaistiin OpenCyc -muodossa avoimella lisenssillä. Cyc asetettiin myöhemmin tekoälytutkijoiden käyttöön ResearchCycin erityisellä tutkimuslisenssillä .

Tyypillisiä esimerkkejä tietokannan tiedosta ovat: "Jokainen puu on kasvi" ja "Kasvit ovat kuolevaisia". Jos kysyt "kuolevatko puut?", päättelykone voi tehdä ilmeisen johtopäätöksen ja antaa oikean vastauksen. Knowledge Base ( englanninkielinen  Knowledge Base tai KB) sisältää yli miljoona ihmisten sinne syöttämää lausuntoa, sääntöä ja yleisesti käytettyä ideaa. Ne on muotoiltu CycL- kielellä , joka perustuu predikaattilaskentaan ja jolla on Lisp -tyyppinen syntaksi . Englanninkieliset käyttäjät vitsailevat olevansa "pyöräilijöitä" ( englanninkielisestä  pyöräilijästä  - pyöräilijä).

Suurin osa tämän päivän työstä Cyc-projektissa on edelleen tietotekniikkaa  - manuaalista faktojen kuvaamista ympäröivästä maailmasta ja tehokkaiden johtopäätösmekanismien toteuttamista tämän tiedon pohjalta. Parhaillaan kuitenkin tehdään työtä sen eteen, että Cyc-järjestelmä pystyisi kommunikoimaan itsenäisesti käyttäjien kanssa luonnollisella kielellä ja nopeuttamaan tukikohdan täydentämistä koneoppimisen avulla .

Tietokannan kuvaus, terminologia

Cyc:n käsitteitä kutsutaan vakioiksi . Kiinteät nimet alkavat valinnaisilla "#$"-merkeillä ja erottelevat isot ja pienet kirjaimet. On vakioita:

Tärkeimmät predikaatit ovat #$isa ja #$genls. Ensimmäinen on väite, että elementti on kokoelman esiintymä , ja toinen on, että kokoelma on toisen kokoelman alikokoelma. Faktat käsitteistä ilmoitetaan käyttämällä erityisiä CycL-lauseita . Predikaatit kirjoitetaan suluissa ennen argumentteja:

(#$isa #$BillClinton #$UnitedStatesPresident)

tarkoittaa, että "Bill Clinton on yksi Yhdysvaltojen presidenteistä", ja lausunto

(#$genls #$Tree-ThePlant #$Plant)

lukee "Kaikki puut ovat kasveja."

(#$pääkaupunkikaupunki #$Ranska #$Pariisi)

tarkoittaa "Pariisi on Ranskan pääkaupunki".

Lausekkeet voivat sisältää myös muuttujia, "?"-alkuisia rivejä. Näitä lausuntoja kutsutaan "säännöiksi". Yksi tärkeimmistä #$isa-predikaattia koskevista säännöistä kuuluu:

(#$ tarkoittaa (#$ja (#$isa ?OBJ ?SUBSET) (#$genls ?SUBSET ?SUPERSET)) (#$isa ?OBJ ?SUPERSET))

mikä tarkoittaa "jos OBJ on SUBSET-kokoelman esiintymä ja SUBSET vuorostaan ​​on SUPERSET-kokoelman alikokoelma, OBJ on myös SUPERSET-kokoelman esiintymä." Toinen tyypillinen esimerkki:

(#$relationAllExists #$biologicalMother #$ChordataPhylum #$FemaleAnimal)

mikä tarkoittaa, että mikä tahansa esiintymä kokoelmasta #$ChordataPhylum (eli mikä tahansa sointu ) liittyy naaraspuoliseen eläimeen (#$FemaleAnimal-instanssi), joka on sen emo (kuten #$BiologicalMother-predikaatti kuvaa).

Cyc -tietokanta on jaettu mikroteorioihin (Mt), käsitteiden ja faktojen kokoelmiin, jotka kuuluvat yhteen tiettyyn tietoalueeseen. Toisin kuin täydellinen tietopohja, minkä tahansa mikroteorian on oltava vapaa ristiriitaisuuksista. Jokaisella mikroteorialla on nimi, joka on tavallinen vakio; sopimuksen mukaan mikroteoriavakiot sisältävät merkkijonon "Mt". Esimerkki on #$MathMt, matemaattista tietoa sisältävä mikroteoria. Mikroteoriat voivat periytyä toisiltaan ja ne on järjestetty hierarkiaan: yksi #$MathMt:n erikoisaloista on #$GeometryGMt - geometrian mikroteoria.

opencyc

OpenCycin uusin versio 1.0 julkaistiin heinäkuussa 2006. OpenCyc 1.0 sisältää täydellisen Cyc-ontologian, joka sisältää satoja tuhansia lausekkeita, miljoonia lauseita, jotka linkittävät termejä toisiinsa. Tietokanta sisältää 47 000 käsitettä ja 306 000 faktaa, ja sitä voi tarkastella OpenCyc-verkkosivustolla. Ensimmäinen OpenCycin versio julkaistiin toukokuussa 2001, ja siinä oli vain 6 000 käsitettä ja 60 000 faktaa. Tietokanta julkaistaan ​​Apache -lisenssillä . Cycorp aikoo julkaista OpenCycin rinnakkaisilla, vähemmän rajoittavilla lisensseillä vastatakseen käyttäjiensä tarpeisiin. CycL- ja SubL- tulkki (ohjelma, jonka avulla voit tarkastella ja muokata tietokantaa ja tehdä johtopäätöksiä) julkaistaan ​​ilmaiseksi, mutta vain binäärimuodossa, ilman lähdekoodia. Se toimii sekä GNU/Linuxissa että Microsoft Windowsissa .

ResearchCyc

Heinäkuussa 2006 Cycorp julkaisi ResearchCyc 1.0:n, ilmaisen (mutta suljetun lähdekoodin) version Cycistä, joka on suunnattu tutkimusyhteisölle. (ResearchCyc oli beta-vaiheessa koko vuoden 2004, ja se julkaistiin beta-testaukseen helmikuussa 2005.) OpenCycin taksonomisten tietojen lisäksi ResearchCyc sisältää huomattavasti enemmän semanttista tietoa (eli lisätietoa) tietopohjansa käsitteistä ja sisältää suuri sanasto, työkalut englannin jäsentämiseen ja generointiin , kirjoitettu Java -rajapinnoilla tiedon muokkaamiseen ja kyselyjen luomiseen tietokantaan.

Cycorp on julkisesti ilmaissut aikomuksensa julkaista kaikki ResearchCycin sisältämät termit ja taksonomiset suhteet osana OpenCycia, ja tämä on tehty versiossa 1.0. Yksi ilmoitetuista tavoitteista on luoda täysin ilmainen ja rajoittamaton semanttinen sanasto käytettäväksi semanttisessa verkossa . OpenCyc-taksonomia on saatavilla Owl - muodossa OpenCyc-projektin verkkosivuilta.

Cyc-projektin kritiikki

Cyciä on kuvattu "yhdeksi kiistanalaisimmista yrityksistä tekoälyn historiassa" (Bertino et al. s. 275), joten se on väistämättä saanut osansa kritiikkiä.

Näistä asioista on keskusteltu eri paikoissa hankkeen käynnistymisen jälkeen. Doug Lenat ja muut ovat julkaisseet monia argumentteja projektinsa puolustamiseksi.

Katso myös

Bibliografia

Muistiinpanot

  1. Volkel M., Krotzsch M., Vrandecic D., Haller H., Studer R. Semantic Wikipedia Arkistoitu 31. joulukuuta 2019 Wayback Machinessa . Proceedings of the 15th International Conference on the World Wide Web. WWW '06. ACM Press, New York, NY. Edinburgh, Skotlanti, 23.-26. toukokuuta 2006. - s. 585-594

Linkit