Autoenkooderi

Kokeneet kirjoittajat eivät ole vielä tarkistaneet sivun nykyistä versiota, ja se voi poiketa merkittävästi 25.5.2022 tarkistetusta versiosta . vahvistus vaatii 1 muokkauksen .

Autoencoder ( englanniksi  autoencoder , myös - autoassociator ) [1] - keinotekoisten hermoverkkojen  erityinen arkkitehtuuri , jonka avulla voit soveltaa valvomatonta oppimista [2] käytettäessä backpropagation menetelmää . Yksinkertaisin autoenkooderiarkkitehtuuri on myötäkytkentäverkko, ilman palautetta, eniten perceptronin kaltainen ja sisältää tulokerroksen, välikerroksen ja lähtökerroksen. Toisin kuin perceptronin, autoenkooderin lähtökerroksen tulee sisältää yhtä monta hermosolua kuin syöttökerroksessa.

Autoenkooderiverkon toiminnan ja koulutuksen pääperiaate on saada vastaus lähtökerrokseen, joka on lähimpänä tulokerrosta. Jotta ratkaisu ei olisi triviaali, autoenkooderin välikerrokseen asetetaan rajoituksia: välikerroksen tulee olla joko pienempi kuin tulo- ja lähtökerros tai samanaikaisesti aktiivisten välikerroksen hermosolujen määrää on keinotekoisesti rajoitettu - harva . aktivointi . Nämä rajoitukset pakottavat hermoverkon etsimään yleistyksiä ja korrelaatioita syöttötiedoista ja suorittamaan niiden pakkaamisen. Siten hermoverkko koulutetaan automaattisesti poimimaan yhteisiä piirteitä syöttötiedoista, jotka on koodattu keinotekoisen hermoverkon painoarvoihin. Joten kun verkkoa opetetaan joukolla erilaisia ​​syöttökuvia, hermoverkko voi itsenäisesti oppia tunnistamaan viivoja ja raitoja eri kulmista.

Useimmiten autoenkoodeja käytetään peräkkäin syvien (monikerroksisten) verkkojen kouluttamiseen . Autoenkoodeja käytetään syväverkon valvomattomaan esiopetukseen . Tätä varten kerrokset koulutetaan peräkkäin ensimmäisestä alkaen. Jokaiseen uuteen kouluttamattomaan kerrokseen liitetään koulutusjakson ajaksi lisälähtökerros, joka täydentää verkkoa autoencoder-arkkitehtuuriin, minkä jälkeen verkkotuloon syötetään koulutusta varten tarkoitettu tietojoukko. Harjoittamattoman kerroksen ja autoenkooderin lisäkerroksen painoja harjoitellaan backpropagation menetelmällä. Sitten automaattinen kooderikerros poistetaan käytöstä ja luodaan uusi, joka vastaa seuraavaa kouluttamatonta verkkokerrosta. Sama tietojoukko syötetään jälleen verkkosyötteeseen, verkon koulutetut ensimmäiset kerrokset pysyvät muuttumattomina ja toimivat syötteenä seuraavan koulutetun kerroksen automaattiselle kooderille. Joten koulutus jatkuu kaikille verkon kerroksille viimeisiä lukuun ottamatta. Verkon viimeiset kerrokset opetetaan yleensä ilman autoenkooderia käyttämällä samaa takaisinetenemismenetelmää ja merkittyjä tietoja (ohjattu oppiminen).

Autoenkooderin sovellukset

Viime aikoina autoenkoodereita on käytetty vain vähän kuvattuun "ahneeseen" kerrostettuun syvän hermoverkkojen esikoulutukseen. Kun Jeffrey Hinton ja Ruslan Salakhutdinov [3] [4] ehdottivat tätä menetelmää vuonna 2006 , kävi nopeasti ilmi, että uudet alustusmenetelmät satunnaisten painojen avulla ovat riittäviä syvien verkkojen jatkokoulutukseen [5] . Vuonna 2014 ehdotettu eränormalisointi [6] mahdollisti vielä syvempien verkkojen kouluttamisen, kun taas vuoden 2015 lopulla ehdotettu jäännösoppimismenetelmä [7] mahdollisti mielivaltaisen syvyisten verkkojen harjoittamisen [5] .

Autoenkooderien tärkeimmät käytännön sovellukset ovat edelleen datan kohinan vähentäminen sekä korkeadimensionaalisen datan mittasuhteiden vähentäminen visualisointia varten. Tietyillä tietojen dimensiota ja harvalukuisuutta koskevin varoin autoenkooderit voivat mahdollistaa moniulotteisen datan projektioiden saamisen, jotka osoittautuvat paremmiksi kuin pääkomponenttimenetelmällä tai jollain muulla klassisella menetelmällä [5] .

Autoenkooderien mahdollisten sovellusten valikoima ei kuitenkaan rajoitu tähän. Niillä voidaan siis havaita poikkeavuuksia [8] [9] [10] [11] [12] , koska malli oppii palauttamaan syöttötiedot tyypillisimpien ominaisuuksien mukaan ja poikkeamien esiintyessä palautus. tarkkuus heikkenee. Vuonna 2019 esiteltiin myös autoenkooderin onnistunut sovellus lääkesuunnittelussa [13] [14] .

Muistiinpanot

  1. Autoencoder for Words, Liou, C.-Y., Cheng, C.-W., Liou, J.-W. ja Liou, D.-R., Neurocomputing, osa 139, 84-96 (2014), doi : 10.1016/j.neucom.2013.09.055
  2. Monikerroksisen harvaan automaattisen enkooderin koulutus suurissa kuvissa, Khurshudov A. A., Bulletin of Computer and Information Technologies 02.2014 doi : 10.14489/vkit.2014.02.pp.027-030
  3. G. E. Hinton, R. R. Salakhutdinov. Tietojen ulottuvuuden vähentäminen hermoverkkojen avulla   // Tiede . – 28.7.2006. — Voi. 313 , iss. 5786 . — s. 504–507 . — ISSN 1095-9203 0036-8075, 1095-9203 . - doi : 10.1126/tiede.1127647 . Arkistoitu alkuperäisestä 23. joulukuuta 2015.
  4. Miksi ohjaamaton esikoulutus auttaa syvään oppimiseen? . Arkistoitu alkuperäisestä 13. joulukuuta 2016.
  5. ↑ 1 2 3 Autoenkooderien rakentaminen Kerasissa . blog.keras.io. Haettu 25. kesäkuuta 2016. Arkistoitu alkuperäisestä 23. kesäkuuta 2016.
  6. Sergey Ioffe, Christian Szegedy. Eränormalisointi: syväverkkokoulutuksen nopeuttaminen vähentämällä sisäistä kovariaattisiirtymää  // arXiv:1502.03167 [cs]. - 2015-02-10. Arkistoitu alkuperäisestä 3. heinäkuuta 2016.
  7. Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian Sun. Deep Residual Learning for Image Recognition  // arXiv:1512.03385 [cs]. – 10.12.2015. Arkistoitu alkuperäisestä 3. syyskuuta 2016.
  8. Morales-Forero A., Bassetto S. Tapaustutkimus: Puolivalvottu metodologia poikkeamien havaitsemiseen ja diagnosointiin  // 2019 IEEE International Conference on Industrial Engineering and Engineering Management (IEEM). - Macao, Macao: IEEE, 2019-12. — S. 1031–1037 . - ISBN 978-1-7281-3804-6 . - doi : 10.1109/IEEM44572.2019.8978509 .
  9. Sakurada Mayu, Yairi Takehisa. Poikkeamien havaitseminen automaattisilla koodereilla, joissa on epälineaarisen ulottuvuuden vähentäminen  //  Proceedings of the MLSDA 2014 2nd Workshop on Machine Learning for Sensor Data Analysis - MLSDA'14. — Gold Coast, Australia QLD, Australia: ACM Press, 2014. — S. 4–11 . — ISBN 978-1-4503-3159-3 . doi : 10.1145 / 2689746.2689747 .
  10. Jinwon An, Sungzoon Cho. [ http://dm.snu.ac.kr/static/docs/TR/SNUDM-TR-2015-03.pdf Vaihteleva automaattinen kooderipohjainen poikkeamien havaitseminen rekonstruktiotodennäköisyyden avulla] // Erikoisluento IE:stä. - 2015. - Nro 2 . - S. 1-18 .
  11. Chong Zhou, Randy C. Paffenroth. Poikkeamien havaitseminen vankilla syväautoenkoodereilla  //  23. ACM SIGKDD:n kansainvälisen tiedonhakua ja tiedonlouhintaa käsittelevän konferenssin julkaisuja. – Halifax NS Canada: ACM, 2017-08-04. — s. 665–674 . — ISBN 978-1-4503-4887-4 . - doi : 10.1145/3097983.3098052 .
  12. Manassés Ribeiro, André Eugênio Lazzaretti, Heitor Silvério Lopes. Tutkimus syväkonvoluutioautomaateista koodereista poikkeamien havaitsemiseen videoissa  //  Pattern Recognition Letters. - 2018-04. — Voi. 105 . — s. 13–22 . - doi : 10.1016/j.patrec.2017.07.016 .
  13. Alex Zhavoronkov, Yan A. Ivanenkov, Alex Aliper, Mark S. Veselov, Vladimir A. Aladinskiy. Syväoppiminen mahdollistaa tehokkaiden DDR1-kinaasiestäjien nopean tunnistamisen  //  Nature Biotechnology. – 2019-09. — Voi. 37 , iss. 9 . — s. 1038–1040 . - ISSN 1546-1696 1087-0156, 1546-1696 . - doi : 10.1038/s41587-019-0224-x .
  14. Gregory Barber. Tekoälyn suunnittelemassa molekyylissä on "lääkkeiden kaltaisia" ominaisuuksia   // Langallinen . — ISSN 1059-1028 .

Linkit