Generatiivinen kontradiktorinen verkosto

Generative adversarial network ( lyhennettynä GAN ) on  valvomaton koneoppimisalgoritmi, joka on rakennettu kahden hermoverkon yhdistelmälle, joista toinen ( verkko G) tuottaa näytteitä (katso Generatiivinen malli ) ja toinen (verkko D) yrittää erottaa oikeat ("aito") näytteet vääristä (katso Discriminative Model ). Koska verkoilla G ja D on päinvastaiset tavoitteet - luoda näytteitä ja hylätä näytteitä - niiden välille syntyy vastakkainen peli . Ian Goodfellow Googlesta kuvaili generatiivisen vastustavan verkoston vuonna 2014 [1] .

Tämän tekniikan käyttö mahdollistaa erityisesti sellaisten valokuvien luomisen, jotka ihmissilmä havaitsee luonnollisina kuvina. On esimerkiksi tunnettu yritys syntetisoida valokuvia kissoista, mikä johtaa harhaan asiantuntijaa, joka pitää niitä luonnollisina valokuvina [2] . Lisäksi GAN:ia voidaan käyttää sumeiden tai osittain vioittuneiden valokuvien laadun parantamiseen.

Menetelmä

GAN-järjestelmässä yksi verkoista (G-verkko, Generatorista) generoi näytteitä (katso Generatiivinen malli ) ja toinen (D-verkko, Discriminator) yrittää erottaa oikeat ("aito") näytteet vääristä. (katso Discriminative Model ) [1] . Käyttäen joukkoa piileviä avaruusmuuttujia , generatiivinen verkko yrittää muotoilla uuden kuvion sekoittamalla useita alkuperäisiä kuvioita. Diskriminatiivinen verkko on koulutettu erottamaan aidot ja väärennetyt näytteet, ja erottelun tulokset syötetään generatiivisen verkon tuloon, jotta se voi valita parhaan joukon piileviä parametreja, jolloin erotteluverkko ei enää pystyisi erottaa aidot näytteet väärennöksistä. Näin ollen verkon G tavoitteena on nostaa verkon D virhesuhdetta ja verkon D tavoitteena on päinvastoin parantaa tunnistustarkkuutta [1] [3] .

Erotteluverkko D, joka analysoi näytteitä alkuperäisestä tiedosta ja generaattorin väärentämästä, saavuttaa jonkin verran erottelutarkkuutta. Tässä tapauksessa generaattori aloittaa piilevien avaruusparametrien satunnaisilla yhdistelmillä (katso monimuuttuja normaalijakauma ), ja arvioituaan saadut näytteet verkon D toimesta, käytetään virheen takaisin etenemismenetelmää , joka parantaa generoinnin laatua korjaamalla tuloa. joukko piileviä parametreja. Vähitellen keinotekoiset kuvat generatiivisen verkon lähdössä muuttuvat yhä laadukkaammiksi [4] . D-verkko on toteutettu konvoluutiohermoverkkona , kun taas G-verkko päinvastoin avaa kuvan piilotettujen parametrien perusteella.

Yhteisen kilpailuoppimisen prosessissa, jos järjestelmä on riittävän tasapainoinen, saavutetaan minimax - tasapainotila, jossa molemmat verkot ovat merkittävästi parantaneet laatuaan ja nyt syntyneitä kuvia voidaan käyttää melkein kuin todellisia.

Ajatuksen kontradiktorisesta oppimisesta esittivät vuonna 2013 Li, Gauci ja Gross [5] . Tätä menetelmää kutsutaan myös "Turing-oppimiseksi" [6] , koska se pyrkii läpäisemään Turingin testin .

Suosittujen menetelmien selitykset

GAN-kiistan periaatetta kuvataan usein metaforien avulla. Esimerkiksi generatiivista verkostoa verrataan väärentäjään tai maalausten väärentäjään, ja syrjivää verkostoa asiantuntijaan, joka yrittää tunnistaa väärennöksen [7] [8] . Toinen esimerkki on kuva kahdesta nyrkkeilijästä, joista toinen opiskeli mestarin kanssa ja toinen pakotetaan matkimaan opiskelijaa [9] .

Suositussa ihmiskasvojen generointisovelluksessa todelliset valokuvat toimivat autenttisena datana, ja generatiivinen verkosto yrittää luoda keinotekoisia kasvoja muuntelemalla latenttien parametrien yhdistelmiä, kuten hiusten väri, kasvojen mittasuhteet, silmien muoto, nenän muoto, korvien koko, parta ja viikset. jne. d [10] [11]

Tutkijoiden artikkelit tarjoavat esimerkkejä GAN-toteutuksesta, joka perustuu TensorFlow- kirjastoon [12] [13] .

Sovellus

GANeja käytetään fotorealististen kuvien saamiseksi esimerkiksi teollisiin design -elementteihin , sisustussuunnitteluun , vaatteisiin, laukkuihin, salkkuihin, tietokonepelikohtauksiin jne. GANeja käytetään myös Facebook -verkossa [14] . Viime aikoina GAN-laitteita on käytetty elokuva- tai animaatiokehysten valmistukseen [15] . Nämä järjestelmät auttavat myös luomaan uudelleen kolmiulotteisen mallin kohteesta käyttämällä fragmentaarisia kuvia [16] ja parantamaan tähtitieteellisistä havainnoista saatuja kuvia [17] .

Muistiinpanot

  1. 1 2 3 Goodfellow, Ian J.; Pouget-Abadie, Jean; Mirza, Mehdi; Xu, Bing; Warde-Farley, David; Ozair, Sherjil; Courville, Aaron & Bengio, Yoshua (2014), Generative Adversarial Networks, arΧiv : 1406.2661 [stat.ML]. 
  2. Salimans, Tim; Hyvä kaveri, Ian; Zaremba, Wojciech; Cheung, Vicki; Radford, Alec & Chen, Xi (2016), Improved Techniques for Training GANs, arΧiv : 1606.03498 [cs.LG]. 
  3. Luc, Pauline; Couprie, Camille; Chintala, Soumith; Verbeek, Jacob. Semanttinen segmentointi kontradiktoristen verkkojen avulla  (uuspr.)  // NIPS Workshop on Adversarial Training, joulukuu, Barcelona, ​​​​Espanja. - 2016. - 25. marraskuuta ( osa 2016 ). - arXiv : 1611.08408 .
  4. Andrej Karpathy, Pieter Abbeel, Greg Brockman, Peter Chen, Vicki Cheung, Rocky Duan, Ian Goodfellow, Durk Kingma, Jonathan Ho, Rein Houthooft, Tim Salimans, John Schulman, Ilya Sutskever ja Wojciech Zaremba, Generatiiviset mallit < , OpenAI http://openai.com/blog/generative-models/ > . Haettu 7. huhtikuuta 2016. Arkistoitu 22. huhtikuuta 2021 Wayback Machinessa 
  5. Li, Wei; Gauci, Melvin; Gross, Roderich (6. heinäkuuta 2013). "Koevolutionaarinen lähestymistapa eläinten käyttäytymisen oppimiseen hallitun vuorovaikutuksen kautta" . Geneettistä ja evoluutiolaskentaa käsittelevän 15. vuosikonferenssin (GECCO 2013) julkaisut . Amsterdam, Alankomaat: ACM. s. 223-230.
  6. Li, Wei; Gauci, Melvin; Gross, Roderich. Turing-oppiminen: metristä vapaa lähestymistapa käyttäytymisen päättelemiseen ja sen soveltamiseen parviin  //  Swarm Intelligence : Journal. - 2016. - 30. elokuuta ( osa 10 , nro 3 ). - s. 211-243 . - doi : 10.1007/s11721-016-0126-1 .
  7. Väärennöksiä pankkiireja vastaan: vastustajaverkostoja Theanossa . Haettu 19. heinäkuuta 2017. Arkistoitu alkuperäisestä 20. elokuuta 2017.
  8. Valokuvien muokkaus generatiivisten vastavuoroisten verkkojen avulla (Osa 1) . Haettu 19. heinäkuuta 2017. Arkistoitu alkuperäisestä 20. elokuuta 2017.
  9. Michael Dietz. Syvän oppimisen ja GAN:ien takana olevasta intuitiosta – kohti perusymmärrystä  (linkki ei saatavilla)
  10. Anders Boesen Lindbo Larsen ja Søren Kaae Sønderby luovat kasvoja taskulampulla . Haettu 19. heinäkuuta 2017. Arkistoitu alkuperäisestä 11. heinäkuuta 2017.
  11. Valokuvien muokkaus generatiivisten vastavuoroisten verkkojen avulla (Osa 1) . Haettu 19. heinäkuuta 2017. Arkistoitu alkuperäisestä 20. elokuuta 2017.
  12. Generatiiviset vastustavat verkot TensorFlow Agustinus Kristiadissa . Käyttöpäivä: 14. marraskuuta 2017. Arkistoitu alkuperäisestä 17. marraskuuta 2017.
  13. Kuvan viimeistely Deep Learning -sovelluksella TensorFlowissa . Haettu 14. marraskuuta 2017. Arkistoitu alkuperäisestä 15. marraskuuta 2017.
  14. Greenemeier, Larry Milloin tietokoneilla on maalaisjärkeä? Kysy Facebookista . Scientific American (20. kesäkuuta 2016). Haettu 31. heinäkuuta 2016. Arkistoitu alkuperäisestä 24. heinäkuuta 2016.
  15. Videoiden luominen kohtausdynamiikalla . web.mit.edu _ Haettu 19. heinäkuuta 2017. Arkistoitu alkuperäisestä 20. maaliskuuta 2017.
  16. 3D Generatiivinen Adversarial Network . 3dgan.csail.mit.edu . Haettu 19. heinäkuuta 2017. Arkistoitu alkuperäisestä 27. lokakuuta 2019.
  17. Schawinski, Kevin; Zhang, Ce; Zhang, Hantian; Fowler, Lucas & Santhanam, Gokula Krishnan (2017-02-01), Generative Adversarial Networks palauttaa piirteitä galaksien astrofysikaalisista kuvista dekonvoluutiorajan ulkopuolella, arΧiv : 1702.00403 [astro-ph.IM]. 

Linkit