Cyc
Kokeneet kirjoittajat eivät ole vielä tarkistaneet sivun nykyistä versiota, ja se voi poiketa merkittävästi 26. elokuuta 2018 tarkistetusta
versiosta . tarkastukset vaativat
12 muokkausta .
Cyc ( kirjoitettu latinaksi, lausutaan Cyc ) on projekti, jonka tarkoituksena on luoda laaja ontologinen tietokanta , jonka avulla ohjelmat voivat ratkaista monimutkaisia tekoälyn alan ongelmia loogisen päättelyn ja maalaisjärjen käyttöön perustuen .
Yleiskatsaus
Projektin aloitti Douglas Lenat vuonna 1984 Microelectronics and Computer Technology Corporationissa . Nimi "Cyc" (johdettu englanninkielisestä tietosanakirjasta : "cyc") on Cycorp, Inc :n Austinissa rekisteröity tavaramerkki , jota ylläpitää Lenat ja joka on luotu kehittämään Cyc. Tietokanta on yrityksen omaisuutta, mutta pieni osa kannasta, jonka tarkoituksena oli luoda yhteinen sanasto automaattisille päättelyohjelmille, julkaistiin OpenCyc -muodossa avoimella lisenssillä. Cyc asetettiin myöhemmin tekoälytutkijoiden käyttöön ResearchCycin erityisellä tutkimuslisenssillä .
Tyypillisiä esimerkkejä tietokannan tiedosta ovat: "Jokainen puu on kasvi" ja "Kasvit ovat kuolevaisia". Jos kysyt "kuolevatko puut?", päättelykone voi tehdä ilmeisen johtopäätöksen ja antaa oikean vastauksen. Knowledge Base ( englanninkielinen Knowledge Base tai KB) sisältää yli miljoona ihmisten sinne syöttämää lausuntoa, sääntöä ja yleisesti käytettyä ideaa. Ne on muotoiltu CycL- kielellä , joka perustuu predikaattilaskentaan ja jolla on Lisp -tyyppinen syntaksi . Englanninkieliset käyttäjät vitsailevat olevansa "pyöräilijöitä" ( englanninkielisestä pyöräilijästä - pyöräilijä).
Suurin osa tämän päivän työstä Cyc-projektissa on edelleen tietotekniikkaa - manuaalista faktojen kuvaamista ympäröivästä maailmasta ja tehokkaiden johtopäätösmekanismien toteuttamista tämän tiedon pohjalta. Parhaillaan kuitenkin tehdään työtä sen eteen, että Cyc-järjestelmä pystyisi kommunikoimaan itsenäisesti käyttäjien kanssa luonnollisella kielellä ja nopeuttamaan tukikohdan täydentämistä koneoppimisen avulla .
Tietokannan kuvaus, terminologia
Cyc:n käsitteitä kutsutaan vakioiksi . Kiinteät nimet alkavat valinnaisilla "#$"-merkeillä ja erottelevat isot ja pienet kirjaimet. On vakioita:
- yksittäisiä elementtejä, joita kutsutaan yksilöiksi , kuten #$BillClinton tai #$France.
- kokoelmat ( Kokoelmat ), kuten #$Tree-ThePlant (joka sisältää kaikki puut) tai #$EquivalenceRelation (joka sisältää kaikki ekvivalenssisuhteet ). Kokoelman jäsentä kutsutaan kokoelman esiintymäksi .
- Totuus Funktiot , joita voidaan soveltaa yhteen tai useampaan käsitteeseen ja palauttaa tosi tai epätosi . Esimerkiksi #$siblings on sisarussuhde, joka on totta vain, jos kaksi sen argumenteista on sisaruksia. Sopimuksen mukaan totuusfunktiovakiot alkavat pienellä kirjaimella. Totuusfunktiot voidaan jakaa loogisiksi konnektiiviksi (kuten #$ja, #$tai, #$ei, #$implis), kvantoriksi (#$forAll, #$thereExists jne.) ja predikaatteihin .
- Funktiot , jotka muodostavat tiedosta uusia termejä. Jos esimerkiksi annat kasvityypin (tai kokoelman) argumenttina #$FruitFn-funktiolle, se palauttaa kokoelman niiden hedelmiä. Sopimuksen mukaan funktiovakioiden nimet alkavat isolla kirjaimella ja päättyvät merkkijonoon "Fn".
Tärkeimmät predikaatit ovat #$isa ja #$genls. Ensimmäinen on väite, että elementti on kokoelman esiintymä , ja toinen on, että kokoelma on toisen kokoelman alikokoelma. Faktat käsitteistä ilmoitetaan käyttämällä erityisiä CycL-lauseita . Predikaatit kirjoitetaan suluissa ennen argumentteja:
(#$isa #$BillClinton #$UnitedStatesPresident)
tarkoittaa, että "Bill Clinton on yksi Yhdysvaltojen presidenteistä", ja lausunto
(#$genls #$Tree-ThePlant #$Plant)
lukee "Kaikki puut ovat kasveja."
(#$pääkaupunkikaupunki #$Ranska #$Pariisi)
tarkoittaa "Pariisi on Ranskan pääkaupunki".
Lausekkeet voivat sisältää myös muuttujia, "?"-alkuisia rivejä. Näitä lausuntoja kutsutaan "säännöiksi". Yksi tärkeimmistä #$isa-predikaattia koskevista säännöistä kuuluu:
(#$ tarkoittaa
(#$ja
(#$isa ?OBJ ?SUBSET)
(#$genls ?SUBSET ?SUPERSET))
(#$isa ?OBJ ?SUPERSET))
mikä tarkoittaa "jos OBJ on SUBSET-kokoelman esiintymä ja SUBSET vuorostaan on SUPERSET-kokoelman alikokoelma, OBJ on myös SUPERSET-kokoelman esiintymä." Toinen tyypillinen esimerkki:
(#$relationAllExists #$biologicalMother #$ChordataPhylum #$FemaleAnimal)
mikä tarkoittaa, että mikä tahansa esiintymä kokoelmasta #$ChordataPhylum (eli mikä tahansa sointu ) liittyy naaraspuoliseen eläimeen (#$FemaleAnimal-instanssi), joka on sen emo (kuten #$BiologicalMother-predikaatti kuvaa).
Cyc -tietokanta on jaettu mikroteorioihin (Mt), käsitteiden ja faktojen kokoelmiin, jotka kuuluvat yhteen tiettyyn tietoalueeseen. Toisin kuin täydellinen tietopohja, minkä tahansa mikroteorian on oltava vapaa ristiriitaisuuksista. Jokaisella mikroteorialla on nimi, joka on tavallinen vakio; sopimuksen mukaan mikroteoriavakiot sisältävät merkkijonon "Mt". Esimerkki on #$MathMt, matemaattista tietoa sisältävä mikroteoria. Mikroteoriat voivat periytyä toisiltaan ja ne on järjestetty hierarkiaan: yksi #$MathMt:n erikoisaloista on #$GeometryGMt - geometrian mikroteoria.
opencyc
OpenCycin uusin versio 1.0 julkaistiin heinäkuussa 2006. OpenCyc 1.0 sisältää täydellisen Cyc-ontologian, joka sisältää satoja tuhansia lausekkeita, miljoonia lauseita, jotka linkittävät termejä toisiinsa. Tietokanta sisältää 47 000 käsitettä ja 306 000 faktaa, ja sitä voi tarkastella OpenCyc-verkkosivustolla. Ensimmäinen OpenCycin versio julkaistiin toukokuussa 2001, ja siinä oli vain 6 000 käsitettä ja 60 000 faktaa. Tietokanta julkaistaan Apache -lisenssillä . Cycorp aikoo julkaista OpenCycin rinnakkaisilla, vähemmän rajoittavilla lisensseillä vastatakseen käyttäjiensä tarpeisiin. CycL- ja SubL- tulkki (ohjelma, jonka avulla voit tarkastella ja muokata tietokantaa ja tehdä johtopäätöksiä) julkaistaan ilmaiseksi, mutta vain binäärimuodossa, ilman lähdekoodia. Se toimii sekä GNU/Linuxissa että Microsoft Windowsissa .
ResearchCyc
Heinäkuussa 2006 Cycorp julkaisi ResearchCyc 1.0:n, ilmaisen (mutta suljetun lähdekoodin) version Cycistä, joka on suunnattu tutkimusyhteisölle. (ResearchCyc oli beta-vaiheessa koko vuoden 2004, ja se julkaistiin beta-testaukseen helmikuussa 2005.) OpenCycin taksonomisten tietojen lisäksi ResearchCyc sisältää huomattavasti enemmän semanttista tietoa (eli lisätietoa) tietopohjansa käsitteistä ja sisältää suuri sanasto, työkalut englannin jäsentämiseen ja generointiin , kirjoitettu Java -rajapinnoilla tiedon muokkaamiseen ja kyselyjen luomiseen tietokantaan.
Cycorp on julkisesti ilmaissut aikomuksensa julkaista kaikki ResearchCycin sisältämät termit ja taksonomiset suhteet osana OpenCycia, ja tämä on tehty versiossa 1.0. Yksi ilmoitetuista tavoitteista on luoda täysin ilmainen ja rajoittamaton semanttinen sanasto käytettäväksi semanttisessa verkossa . OpenCyc-taksonomia on saatavilla Owl - muodossa OpenCyc-projektin verkkosivuilta.
Cyc-projektin kritiikki
Cyciä on kuvattu "yhdeksi kiistanalaisimmista yrityksistä tekoälyn historiassa" (Bertino et al. s. 275), joten se on väistämättä saanut osansa kritiikkiä.
- Järjestelmän liiallinen monimutkaisuus - epäilemättä tarpeellista tietosanakirjan tavoitteista johtuen - ja vastaavasti tietojen (manuaalisesti) lisäämisen monimutkaisuus järjestelmään;
- Skaalautuvuusongelmat laajalle levinneestä reifikaatiosta, erityisesti vakioina;
- Aineen käsitteen epätyydyttävä käyttö ja siihen liittyvä ero sisäisten ja ulkoisten ominaisuuksien välillä;
- Järkevien suorituskykymittausten tai Cyc-päätelmämoottorin tehokkuuden vertailujen puute;
- Järjestelmän nykyinen epätäydellisyys sekä leveyden että syvyyden suhteen ja siihen liittyvät vaikeudet sen täydellisyyden mittaamisessa;
- Asiakirjojen puute;
- Ajantasaisen verkkokoulutusmateriaalin puute vaikeuttaa uusien tulokkaiden järjestelmän oppimista.
- Nimestään huolimatta OpenCyc-järjestelmä ei ole täysin avoin: tiedot ovat käyttäjien muokattavissa, mutta kehittäjät eivät voi laajentaa koodia. [yksi]
Näistä asioista on keskusteltu eri paikoissa hankkeen käynnistymisen jälkeen. Doug Lenat ja muut ovat julkaisseet monia argumentteja projektinsa puolustamiseksi.
Katso myös
Bibliografia
- Elisa Bertino, Gian Piero Zarri, Barbara Catania, Gian Pierro Zarri. Älykkäät tietokantajärjestelmät (uuspr.) . - Addison-Wesley Professional , 2001.
- Matuszek, Cynthia, M. Witbrock , R. Kahlert, J. Cabral, D. Schneider, P. Shah ja D. Lenat . Maalaisjärkeä etsimässä: Cycin täyttäminen verkosta . Proceedings of the Twentieth National Conference on Artificial Intelligence, Pittsburgh, Pennsylvania, heinäkuu 2005. [1]
- Shepard, Blake, C. Matuszek, C. B. Fraser, W. Wechtenhiser, D. Crabbe, Z. Gungordu, J. Jantos, T. Hughes, L. Lefkowitz, M. Witbrock, D. Lenat, E. Larson. Tietoihin perustuva lähestymistapa verkkoturvallisuuteen: Cyc:n soveltaminen verkkoriskin arvioinnin alalla . Proceedings of the Seventeenth Innovative Applications of Artificial Intelligence Conference, Pittsburgh, Pennsylvania, heinäkuu 2005. [2]
- Ramachandran, Deepak, P. Reagan, K. Goolsbey. Ensisijainen ResearchCyc: Ilmaisukyky ja tehokkuus yleisjärkessä ontologiassa . AAAI-työpajan asiakirjoissa kontekstit ja ontologiat: teoria, käytäntö ja sovellukset. Pittsburgh, Pennsylvania, heinäkuu 2005. [3]
- Cabral, John, R. C. Kahlert, C. Matuszek, M. Witbrock, B. Summers. Semanttisen metatiedon muuntaminen induktiiviseksi harhaksi . Proceedings of the 15th International Conference on Inductive Logic Programming, Bonn, Saksa, elokuu 2005. [4]
- Schneider, Dave, C. Matuszek, P. Shah, R. Kahlert, D. Baxter, J. Cabral, M. Witbrock, D. Lenat. Tietojen kerääminen ja hallinta tiedusteluanalyysiä varten . Proceedings of the 2005 International Conference on Intelligence Analysis, McLean, Virginia, toukokuu 2005. [5]
- Forbus, Kenneth, L. Birnbaum, E. Wagner, J. Baker & M. Witbrock . Analogian, älykkään tiedonhaun ja tiedon integroinnin yhdistäminen analysointia varten: Alustava raportti . Proceedings of the 2005 International Conference on Intelligence Analysis, McLean, Virginia, toukokuu 2005. [6]
- Deaton, Chris, B. Shepard, C. Klein, C. Mayans, B. Summers, A. Brusseau, M. Witbrock . The Comprehensive Terrorism Knowledge Base in Cyc. Proceedings of the 2005 International Conference on Intelligence Analysis, McLean, Virginia, toukokuu 2005. [7]
- Rode, Benjamin. Kohti kuvioiden palautumismallia relaatiotiedoissa . Proceedings of the 2005 International Conference on Intelligence Analysis, McLean, Virginia, toukokuu 2005. [8]
- Siegel, Nick, B. Shepard, J. Cabral, M. Witbrock. Hypoteesin luominen ja todisteiden kokoonpano tiedusteluanalyysiä varten: Cycorpin Nooscape-sovellus . Proceedings of the 2005 International Conference on Intelligence Analysis, McLean, Virginia, toukokuu 2005. [9]
- Curtis, Jon, G. Matthews, D. Baxter. Cyc:n tehokkaasta käytöstä kysymysvastausjärjestelmässä IJCAI:n työpajassa Tietoa ja vastausten perusteluja, Edinburgh, Skotlanti: 2005. [10]
- Witbrock, Michael, C. Matuszek, A. Brusseau, R. C. Kahlert, C. B. Fraser, D. Lenat. Tieto synnyttää tietämystä: Askeleita kohti avustettua tiedonhankintaa Cyc in Papers from 2005 AAAI Spring Symposium on Knowledge Collection from Volunteer Contributors (KCVC), s. 99-105. Stanford, Kalifornia, maaliskuu 2005. [11]
- Belasco, Alan, J. Curtis, R. C. Kahlert, C. Klein, C. Mayans, R. Reagan. Edustaa tietopuutteita tehokkaasti . Teoksessa D. Karagiannis, U. Reimer (Toim.): Practical Aspects of Knowledge Management, Proceedings of PAKM 2004, Wien, Itävalta, 2.-3.12.2004, Springer-Verlag, Berlin Heidelberg. [12]
- Siegel, Nick, G. Matthews, J. Masters, R. Kahlert, M. Witbrock ja K. Pittman. Agent Architectures: Combining the Strengths of Software Engineering and Cognitive Systems in Papers from AAAI Workshop on Intelligent Agent Architectures: Combining the Strengths of Software Engineering and Cognitive Systems, Technical Report WS-04-07, pp. 74–79. Menlo Park, Kalifornia: AAAI Press, 2004. [13]
- Witbrock, Michael, K. Panton, S. L. Reed, D. Schneider, B. Aldag, M. Reimers ja S. Bertolo. Automatisoitu OWL-merkintä, jota auttoi suuri tietokanta työpajamuistiinpanoissa vuoden 2004 työpajasta Knowledge Markup and Semantic Annotation -konferenssissa 3rd International Semantic Web Conference ISWC2004, Hiroshima, Japani, marraskuu 2004, pp. 71–80. [neljätoista]
- Masters, James ja Z. Gungordu. Strukturoitujen tietolähteiden integrointi: edistymisraportti . In Integration of Knowledge Intensive Multiagent Systems, Cambridge, Massachusetts, USA, 2003. [15]
- O'Hara, Tom, N. Salay, M. Witbrock, et ai. Kriteerien indusoiminen massasubstantiivien leksikaalisille mappauksille käyttämällä Cyc Knowledge Base -tietokantaa ja sen laajennusta WordNetiin . Proceedings of the Fifth International Workshop on Computational Semantics, Tilburg, 2003. [16]
- Witbrock, Michael, D. Baxter, J. Curtis, et ai. Vuorovaikutteinen vuoropuhelujärjestelmä tiedon hankintaa varten Cyc . Proceedings of the Eightenth International Joint Conference on Artificial Intelligence, Acapulco, Mexico, 2003. [17]
- Panton, Kathy, P. Miraglia, N. Salay, et ai. Tiedon muodostus ja vuoropuhelu KRAKEN-työkalusarjan avulla . Kahdeksantoista kansallisessa tekoälykonferenssissa Edmontonissa, Kanadassa, 2002. [18]
- Mestarit, James. Structured Knowledge Source Integration ja sen sovellukset tiedon yhdistämiseen . Proceedings of the Fifth International Conference on Information Fusion, Annapolis, MD, heinäkuu 2002. [19]
- Reed, Stephen ja D. Lenat. Ontologioiden kartoittaminen Cyc:hen . AAAI 2002 Conference Workshop ontologies For The Semantic Web, Edmonton, Kanada, heinäkuu 2002. [20]
- D. Lenat ja R. V. Guha. Suurten tietopohjaisten järjestelmien rakentaminen: esitys ja päättely Cyc- projektissa . - Addison-Wesley , 1990.
- Kuvitteellinen ajattelukone SAL 9000 viittaa nimenomaisesti tietosanakirjaan ymmärtääkseen, miksi sen luoja käytti nimeä "Phoenix" diagnostiseen simulaatioon, joka auttaisi käynnistämään uudelleen sen kaksoislaitteen, HAL 9000 :n, vuoden 2001 saagassa .
- Kuvitteellinen ajattelukone KARR (Knight Rider) hakee eksplisiittisesti tietokantaa ihmisen perustoiveiden testin aikana (jakso "Luottamus ei ruostu").
Muistiinpanot
- ↑ Volkel M., Krotzsch M., Vrandecic D., Haller H., Studer R. Semantic Wikipedia Arkistoitu 31. joulukuuta 2019 Wayback Machinessa . Proceedings of the 15th International Conference on the World Wide Web. WWW '06. ACM Press, New York, NY. Edinburgh, Skotlanti, 23.-26. toukokuuta 2006. - s. 585-594
Linkit
Sanakirjat ja tietosanakirjat |
|
---|