Kieliopillinen johtaminen

Kokeneet kirjoittajat eivät ole vielä tarkistaneet sivun nykyistä versiota, ja se voi poiketa merkittävästi 27. lokakuuta 2021 tarkistetusta versiosta . vahvistus vaatii 1 muokkauksen .

Kieliopin induktio (tai kieliopin päättely [1] ) on koneoppimismenettely , joka palauttaa kielen muodollisen kieliopin havaintojen (esimerkkien) joukon perusteella, jossa on tähän kieleen kuuluva tunnetusti. Toimenpiteen tuloksena rakennetaan malli havaittavista objekteista päättelysääntöjoukon tai generointisäännön muodossa , äärellisen automaatin tai muun tyyppisen automaatin muodossa. Yleisemmin kieliopillinen päättely on yksi koneoppimisen alueista, jossa esimerkkiavaruus koostuu diskreeteistä kombinatorisista objekteista, kuten merkkijonoista, puista, kaavioista.

Kielioppitunnit

Kielioppipäätelmissä keskitytään usein erityyppisten äärellisten automaattien oppimisen ongelmaan (katso artikkelista Regular Language Induction saadaksesi lisätietoja näistä lähestymistavoista), koska tämän ongelman ratkaisemiseen on ollut tehokkaita algoritmeja 1980-luvulta lähtien.

2000-luvun alusta lähtien näitä lähestymistapoja on laajennettu päättelemään yhteydettömiä kielioppeja ja rikkaampia formalismeja, kuten useita yhteydettömiä kielioppeja ja rinnakkaisia useita yhteydettömiä kielioppeja. Muita kielioppiluokkia, joiden kielioppia tutkittiin, tutkittiin myös muille kielioppiluokille - kontekstuaalisia kielioppeja ja mallikieliä .

Oppimismallit

Yksinkertaisin oppimisen muoto on, kun oppimisalgoritmi vastaanottaa vain joukon esimerkkejä ja joskus vastaesimerkkejä kyseisen kielen sanoista. On myös muita oppimismalleja. Yksi usein tutkituista vaihtoehdoista on tapaus, jossa oppija voi kysyä sanan kuuluvuudesta kieleen, kuten esimerkiksi tarkassa oppimismallissa tai Angluinin esittämässä minimaalisesti riittävässä opettajamallissa [2] .

Metodologiat

Kieliopin päättelyyn on kehitetty monenlaisia menetelmiä. Kaksi klassista lähdettä ovat Fu 1977 [3] ja 1982 [4] paperit . Duda, Hart ja Stork [5] omistivat myös pienen osan tälle ongelmalle ja lainaavat monia lähteitä. Niiden esittämää perusyritys- ja erehdysmenetelmää käsitellään alla. Erityisesti säännöllisten kielten alaluokituksen lähestymistapoja varten katso Säännöllisten kielten induktio . Uudempi kirja on de la Higueran (2010) [1] , joka kattaa kieliopillisen päättelyn teorian säännöllisissä kielissä ja äärellisissä automaateissa. D'Ulisia, Ferri ja Grifoni [6] tarkastelivat luonnollisten kielten päättelymenetelmiä koskevaa tutkimusta.

Kieliopillinen johtaminen yrityksen ja erehdyksen avulla

Dowdin, Hartin ja Storkin [5] luvussa 8.7 ehdotettu menetelmä ehdottaa kielioppisääntöjen peräkkäistä arvausta ja niiden testaamista positiivisten ja negatiivisten havaintojen suhteen. Sääntöjoukkoa laajennetaan siten, että jokainen positiivinen esimerkki voidaan luoda, mutta jos tietty sääntöjoukko luo negatiivisen esimerkin, se on hylättävä. Tätä erityistä lähestymistapaa voidaan kuvata "hypoteesitestaukseksi" ja se on jossain määrin samanlainen kuin versioavaruuden Mitchellin algoritmi . Dowdin, Hartin ja Storckin artikkelin teksti [5] antaa yksinkertaisen esimerkin, joka havainnollistaa prosessia hyvin, mutta tällaisen ohjaamattoman yrityksen ja erehdyksen toteutettavuus suurempiin ongelmiin on kyseenalainen.

Kieliopillinen johtopäätös geneettisten algoritmien avulla

Evoluutioalgoritmien avulla tehtävä kielioppi on kohdekielen kieliopin esityksen evoluutioprosessi jonkin evoluutioprosessin kautta. Muodolliset kieliopit voidaan helposti esittää päättelysääntöjen puina , joihin voidaan soveltaa evolutionaarisia operaattoreita. Tämän tyyppiset algoritmit juontavat juurensa geneettisestä ohjelmoinnista , jonka edelläkävijä oli John Koza . Muissa varhaisissa yksinkertaisia muodollisia kieliä koskevissa töissä käytettiin geneettisten algoritmien binäärimerkkijonoesitystä, mutta Backus-Naur Augmented Form -kielen taustalla oleva kielioppien sisäinen hierarkkinen rakenne tekee puista joustavamman lähestymistavan.

Koza esitteli Lisp- ohjelmat puita. Hän onnistui löytämään analogioita geneettisten operaattoreiden ja tavallisten puiden operaattorien joukosta. Esimerkiksi alipuiden vaihto vastaa vastaavaa geneettisen risteytyksen prosessia , jossa geneettisen koodin osajonot muunnetaan seuraavan sukupolven yksilöllisyydeksi. Kelvollisuus mitataan arvioimalla funktion lähtökoodia . Samanlaiset analogiat Lispin esitysten puurakenteiden ja kielioppien puuesitysten välillä tekevät geneettisen ohjelmoinnin soveltamistekniikan mahdolliseksi kieliopin induktiossa.

Kieliopin induktion tapauksessa alipuiden siirto vastaa päättelysääntöjen vaihtoa, mikä mahdollistaa tietyn kielen lauseiden jäsentämisen. Kieliopin kelpoisuusoperaattori perustuu johonkin mittaan siitä, kuinka hyvin se jäsentää jonkin lauseryhmän kohdekielestä. Kieliopin puuesityksessä generointisäännön päätesymboli vastaa puun lehteä. Sen pääsolmu vastaa sääntöjoukon muuta kuin päätemerkkiä (kuten substantiivilausetta tai verbilausetta ). Loppujen lopuksi juurisolmu voi vastata ei-terminaalien sarjaa.

Kieliopillinen johtaminen ahneilla algoritmeilla

Kuten kaikki ahneet algoritmit , ahneet päättelyalgoritmit tekevät iteratiivisesti päätöksen, joka näyttää parhaimmalta siinä vaiheessa. Päätös ymmärretään yleensä uuden säännön luomiseksi, olemassa olevan säännön poistamiseksi, sovellettavan säännön valitsemiseksi, olemassa olevien sääntöjen yhdistämiseksi. Koska käsitteet "vaihe" ja "paras" voidaan määritellä eri tavoin, on luotu useita ahneita päättelyalgoritmeja.

Seuraavat algoritmit yhteydettömän kieliopin luomiseksi tekevät päätöksen jokaisen luetun merkin jälkeen:

Lempel-Ziv-Welch-algoritmi generoi yhteydettömän kieliopin deterministisellä tavalla, joten vain generoidun kieliopin aloitussääntö tarvitsee muistaa.
Sequitur ja sen muutokset.

Seuraavat algoritmit yhteydettömän kieliopin luomiseksi lukevat ensin koko merkkisarjan ja alkavat sitten tehdä päätöksiä:

tavuparikoodaus ja sen optimoidut muunnelmat.

Distributiivinen oppiminen

Uudemmat lähestymistavat perustuvat distributiiviseen oppimiseen . Näitä lähestymistapoja käyttäviä algoritmeja on sovellettu yhteydettömien kielioppien ja hieman kontekstiherkkien kielten opettamiseen , ja ne on osoittautunut oikeiksi ja tehokkaiksi näiden kielioppien suurille alaluokille [7] [8]

Esimerkkikielten opettaminen

Angluin määritteli kuvion "aakkoston Σ vakiomerkkien ja epäyhtenäisen joukon muuttuvien merkkien merkkijonoksi". Tällaisten mallien kieli on joukko ei-tyhjiä kantaesimerkkejä, eli kaikki merkkijonot, jotka on saatu korvaamalla muuttujan merkit asianmukaisesti ei-tyhjillä vakiomerkkien merkkijonoilla [huomautus 1] . Kuvion sanotaan kuvaavan äärellistä merkkijonojoukkoa, jos sen kieli on minimaalinen (jossa on mukana) kaikkien kuviokielten joukossa, mukaan lukien syöttöjoukko.

Angluin on antanut polynomialgoritmin laskea annetusta rivien joukosta kaikki kuvaavat kuviot yhdestä muuttujasta x[huomautus 2] . Tätä tarkoitusta varten hän rakentaa automaatin, joka edustaa kaikkia mahdollisia relevantteja kuvioita. Käyttämällä kehittyneitä argumentteja sanojen pituuksista, jotka riippuvat vain yhdestä muuttujasta x, tilojen määrää voidaan vähentää merkittävästi [9] .

Erlebach ym. antoivat tehokkaamman version Angluinin mallioppimisalgoritmista sekä rinnakkaisversion algoritmista [10] .

Arimura ym. ovat osoittaneet, että rajoitetusta näytejoukosta saatuja kieliä voidaan opettaa polynomiajassa [11] .

Kuvioteoria

Ulf Grenanderin [12] muotoilema kuvioteoria ( eng. pattern theory ) , on matemaattinen formalismi maailmaa koskevan tiedon kuvaamiseksi kuvioiden muodossa. Tekoälyn ehdotetun lähestymistavan eromuihin verrattuna on se, että se ei ala hahmontunnistuksen ja luokituksen algoritmien ja koneiden määrittelystä. Pikemminkin menetelmä määrää sanaston kuvioiden muotoilua ja uudelleenkirjoittamista varten tarkalla kielellä.

Uuden algebrallisen kielen lisäksi on otettu käyttöön uusi tilastollinen lähestymistapa, jonka tavoitteena on:

Tunnista tietojoukon piilevät muuttujat käyttämällä todellista dataa keinotekoisten vaikutusten sijaan.
Piilevien muuttujien aikaisempien jakaumien määritelmät ja mallit havaittuille muuttujille, jotka muodostavat graafin, kuten Gibbs-graafin, kärjet.
Näiden kaavioiden satunnaisuuden ja vaihtelevuuden tutkiminen.
Stokastisten mallien perusluokkien luominen laskemalla muodonmuutoksia[ tuntematon termi ] näytteitä.
Synteesin ( näytteenoton ) toteutus mallien avulla, ei vain signaalien tutkimus

Sovellukset

Kieliopin induktion periaatteita on sovellettu muihin luonnollisen kielen käsittelyn näkökohtiin ja (monien muiden tehtävien ohella) luonnollisen kielen havaitsemiseen [13] , esimerkkipohjaiseen konekäännökseen [14] , morfeemianalyysiin ja kielen johtamiseen. paikannimien alkuperä. Kieliopin induktiota on käytetty myös häviöttömään pakkaamiseen [15] ja tilastolliseen päättelyyn minimipituusviestien ja minimipituuskuvausten periaatteiden kautta . Kieliopin induktiota on käytetty myös joissakin todennäköisyyspohjaisissa kielen hankinnan malleissa [16] .

Katso myös

Tekoäly
Konekäännös esimerkkien perusteella
Induktiivinen ohjelmointi
Kolmogorovin monimutkaisuus
Suora kielioppi
Syntaktinen kuvion tunnistus

Muistiinpanot

↑ Mallikieli, jossa on vähintään kaksi saman muuttujan esiintymistä, ei ole säännöllinen pumppauslemman vuoksi .
↑ x voi esiintyä useita kertoja, mutta se ei saa olla mikään muu muuttujay

↑ 12. de la Higuera, 2010 .
↑ Angluin, 1987 , s. 87–106.
↑ Fu, 1977 .
↑ Fu, 1982 .
↑ 1 2 3 Duda, Hart, Stork, 2001 .
↑ D'Ulizia, Ferri, Grifoni, 2011 , s. 1–27.
↑ Clark, Eyraud, 2007 .
↑ Yoshinaka, 2011 , s. 1821-183.
↑ Angluin, 1980 , s. 46–62.
↑ Erlebach, Rossmanith, Stadtherr, Steger, Zeugmann, 1997 , s. 260–276.
↑ Arimura, Shinohara, Otsuki, 1994 , s. 649–660.
↑ Grenander, Miller, 2007 .
↑ Miller, Bobrow, Schwartz, 1994 .
↑ Ruskea, 2001 .
↑ Cherniavsky, Ladner, 2004 .
↑ Chater, Manning, 2006 , s. 335-344.

Kirjallisuus

Colin de la Higuera. Kieliopin päättely: Automaattien ja kielioppien oppiminen . - Cambridge: Cambridge University Press, 2010.
Ulf Grenander, Michael I. Miller. Kuvioteoria: esityksestä päättelyyn. - Oxford University Press, 2007. - ISBN 0-19-850570-1.
Alexander Clark, Remi Eyraud. Polynomitunniste korvaavien kontekstittomien kielten rajoissa // Journal of Machine Learning Research. – 2007.
Ryo Yoshinaka. Useiden yhteydettömien kielten tehokas oppiminen moniulotteisella korvattavuudella positiivisista tiedoista // Tietojenkäsittelyteoria. - 2011. - T. 412 , no. 19 . - S. 1821-1831 .
Scott Miller, Robert J. Bobrow, Richard M. Schwartz. Luonnollisen kielen piilokäsitysmallit // Laskennallisen lingvistiikan yhdistyksen 32. vuosikokouksen julkaisu. . — Laskennallisen lingvistiikan yhdistys, 1994.
Ralph D. Brown. Siirtosäännön induktio esimerkkipohjaiseen käännökseen // Proceedings of the MT Summit VIII Workshop on example-Based Machine Translation. – 2001.
Neva Cherniavsky, Richard Ladner. DNA-sekvenssien kielioppipohjainen pakkaus // DIMACS Working Group on The Burrows-Wheeler Transform . – 2004.
Nick Chater, Christopher D. Manning. Kielen prosessoinnin ja hankinnan todennäköisyysmallit // Kognitiiviset tieteet . – 2006.
Dana Angluin. Säännöllisten joukkojen oppiminen kyselyistä ja vastaesimerkeistä // Tiedot ja ohjaus . - 1987. - T. 75 . — s. 87–106 . - doi : 10.1016/0890-5401(87)90052-6 . Arkistoitu alkuperäisestä 2. joulukuuta 2013.
D'Ulizia A., Ferri F., Grifoni P. Tutkimus kieliopin päättelymenetelmistä luonnollisen kielen oppimiseen // Artificial Intelligence Review. - 2011. - T. 36 , nro 1 .
Dana Angluin. Joukkojoukolle yhteisten kuvioiden löytäminen // Journal of Computer and System Sciences. - 1980. - T. 21 . - doi : 10.1016/0022-0000(80)90041-0 .
Erlebach T., Rossmanith P., Stadtherr H., Steger A., Zeugmann T. Yksimuuttuvien mallikielten erittäin tehokas oppiminen keskimäärin, rinnakkain ja kysymällä // Proc. 8th International Workshop on Algorithmic Learning Theory - ALT'97 / M. Li, A. Maruoka. - Springer, 1997. - T. 1316. - (LNAI).
Hiroki Arimura, Takeshi Shinohara, Setsuko Otsuki. Minimaalisten yleistysten löytäminen mallikielten liitoksille ja sen soveltaminen induktiiviseen päättelyyn positiivisesta datasta // Proc. STACS 11. - Springer, 1994. - T. 775. - (LNCS).
Richard O. Duda, Peter E. Hart, David G. Stork. Kuvion luokitus . - 2. - New York : John Wiley & Sons, 2001.
Kuningas Sun Fu. Syntaktisten kuvioiden tunnistus ja sovellukset. - Englewood Cliffs, NJ: Prentice-Hall, 1982.
Kuningas Sun Fu. Syntaktisten kuvioiden tunnistus, sovellukset. - Berliini : Springer-Verlag, 1977.
James Jay Horning. Kieliopin päättelyn tutkimus . - Stanford : Stanfordin yliopiston tietojenkäsittelytieteen laitos, 1969. - (Ph.D. Thesis).
E. Mark Gold. Kielen tunnistus rajoituksessa . - Information and Control , 1967. - T. 10 . — S. 447–474 . Arkistoitu alkuperäisestä 28. elokuuta 2016.

Koneoppiminen ja tiedon louhinta
Tehtävät	Luokitteluongelma Oppiminen ilman opettajaa Opettajan avustama oppiminen Taantumisanalyysi AutoML Yhdistyksen säännöt Ominaisuuksien erottaminen Ominaisuuksien koulutus Ranking koulutus Kieliopillinen johtaminen Verkko-oppiminen
Opettajan kanssa oppimista	k-lähimmän naapurin menetelmä Naiivi Bayesin luokitin päätöspuu Tuki vektorikonetta Lineaarinen regressio Logistinen regressio perceptron Mallien kokoonpanot Pussittaminen tehostaa satunnainen metsä Asiaankuuluva vektorimenetelmä
ryhmäanalyysi	k-keinomenetelmä Sumea klusterointimenetelmä Hierarkkinen klusterointi EM-algoritmi KOIVU PARANTAA DBSCAN OPTIIKKA Keskimääräinen siirto
Mittasuhteiden vähentäminen	Tekijäanalyysi Pääkomponenttimenetelmä CCA ICA LDA Ei-negatiivinen matriisin laajennus t-SNE
Rakenteellinen ennustaminen	Graafinen todennäköisyysmalli Bayesin verkko Piilotettu Markovin malli CRF
Anomalian havaitseminen	k-lähimmän naapurin menetelmä Paikallinen päästötaso
Piirrä todennäköisyysmallit	Bayesin verkko Markovin verkko Piilotettu Markovin malli
Neuroverkot	Rajoitettu Boltzmann-kone itseorganisoituva kartta Aktivointitoiminto Sigmoidi softmax Radiaalinen kantafunktio Takaisin lisäysmenetelmä Syväoppiminen Monikerroksinen perceptroni Toistuva neuroverkko pitkä lyhytaikainen muisti Hallittu toistuva esto Konvoluutiohermoverkko U-Net Autoenkooderi
Vahvistusoppiminen	Markovin prosessi Bellmanin yhtälö Ahne algoritmi Q-oppiminen SARSA Aikaero (TD)
Teoria	Vapnik-Chervonenkis teoria Bias-dispersion dilemma Laskennallinen oppimisteoria Empiirinen riskin minimointi Occam oppii PAC-oppiminen Tilastollinen oppimisteoria
Lehdet ja konferenssit	NeurIPS ICML ML JMLR ArXiv:cs.LG