Googlen hermokonekäännös

Google Neural Machine Translation  (GNMT) on  Googlen kehittämä ja marraskuussa 2016 esitelty  Neural Machine Translation (NMT) -järjestelmä, joka käyttää keinotekoista hermoverkkoa parantamaan käännösten sujuvuutta ja tarkkuutta Google-kääntäjässä . [1] [2] [3]

GNMT parantaa käännösten laatua käyttämällä esimerkkipohjaista konekäännöstä ( EBMT ), jossa järjestelmä "oppii miljoonista esimerkeistä". [2] Ehdotettua GNMT-järjestelmän oppimisarkkitehtuuria testattiin ensin yli sadalla Google-kääntäjän tukemalla kielellä. [2] Suuren päästä päähän -rakenteen ansiosta järjestelmä oppii ajan myötä tuottamaan parempia ja luonnollisempia käännöksiä. [1] GNMT pystyy kääntämään kokonaisia ​​lauseita, ei osia. [1] GNMT-verkko voi suorittaa kieltenvälisiä konekäännöksiä koodaamalla lauseen semantiikan sen sijaan, että se muistaisi yksittäisten lauseiden käännökset. [2] [4]

Historia

Google Brain -projektin loivat vuonna 2011 "Google X:n salaisessa tutkimuslaboratoriossa" [5] Googlen työntekijä Jeff Dean , Googlen tutkija Greg Corrado ja Stanfordin yliopiston tietojenkäsittelytieteen professori Andrew Ng . [6] [7] [8] Eunin työ oli perusta yhdelle Googlen ja Stanfordin suurimmista teknologisista läpimurroista. [5]

Syyskuussa 2016 Googlen tutkimusryhmä ilmoitti GNMT-käännösjärjestelmän kehittämisestä, ja marraskuussa Google Translate alkoi käyttää neurokonekäännöstä (NMT) aiempien tilastomenetelmien (SMT) sijaan [1] [9] [10] [ 11] , jota oli käytetty lokakuusta 2007 lähtien omassa suljetussa SMT-järjestelmässämme. [12] [13]

Google Translatessa oleva NMT-järjestelmä käyttää suurta keinotekoista hermoverkkoa, joka soveltuu syvään oppimiseen . [1] [2] [3] Tutkimalla miljoonia esimerkkejä GNMT parantaa käännöksen laatua käyttämällä laajempaa kontekstia sopivimman käännöksen päättelemiseen. Sitten tulos järjestetään uudelleen ja mukautetaan sopimaan ihmiskielen kielioppiin. GNMT ei luonut omaa sisäistä universaalia kieltä, vaan pyrki pikemminkin löytämään yhteisiä piirteitä monien kielten välillä, joiden pitäisi kiinnostaa enemmän psykologeja ja lingvistejä kuin tietotekniikan tutkijoita. [14] Vuonna 2016 lisättiin uusi käännöskone molempiin suuntiin yhdeksällä kielellä: englanti, ranska, saksa, espanja, portugali, kiina, japani, korea ja turkki. [15] Maaliskuussa 2017 lisättiin kolme muuta kieltä: venäjä, hindi ja vietnami. [16] Samassa kuussa heprean ja arabian tuki lisättiin Google-kääntäjäyhteisön avulla. [17] Lisätukea lisättiin huhtikuun 2017 lopussa yhdeksälle intialaiselle kielelle, nimittäin hindille, bengalille, marathille, gudžaratille, pandžabille, tamilille, telugulle, malajalamille ja kannadalle. [kahdeksantoista]

GNMT:n tukemat kielet

Alla on luettelo kielipareista, jotka käyttävät Googlen Neural Machine Translation (NMT) -mallia kääntämiseen. Heinäkuusta 2017 alkaen kaikilla kielillä tuetaan vain käännöksiä englannista ja englannista: [19]

kielipari Kielikoodit
yksi afrikaans <-> englanti af<->en
2 arabia <-> englanti ar<->en
3 bulgaria <-> englanti bg<->en
neljä kiina (yksinkertaistettu) <-> englanti zh-CN <->en
5 kiina (perinteinen) <-> englanti zh-TW<->en
6 kroatia <-> englanti hr<->en
7 Tšekki <-> englanti cs<->en
kahdeksan tanska <-> englanti da<->en
9 hollanti <-> englanti nl<->en
kymmenen ranska <-> englanti fr<->en
yksitoista saksa <-> englanti de<->en
12 kreikka <-> englanti el<->en
13 heprea <-> englanti iw<->en
neljätoista hindi <-> englanti hi<->en
viisitoista Islanti <-> englanti is<->en
16 Indonesian <-> englanti id<->en
17 italia <-> englanti it<->en
kahdeksantoista japani <-> englanti ja<->en
19 Korean <-> englanti ko<->en
kaksikymmentä norja <-> englanti no<->en
21 puola <-> englanti pl<->en
22 portugali <-> englanti pt<->en
23 romania <-> englanti ro<->en
24 venäjä <-> englanti ru<->en
25 slovakki <-> englanti sk<->en
26 espanja <-> englanti es<->en
27 ruotsi <-> englanti sv<->en
28 Thai <-> englanti th<->en
29 turkki <-> englanti tr<->en
kolmekymmentä vietnami <-> englanti vi<->en

Suora käännös

GNMT-järjestelmän sanotaan olevan Google-kääntäjän edellistä versiota parempi siinä mielessä, että se pystyy suorittamaan "suoran käännöksen", ts. kääntää suoraan kielestä toiselle (esimerkiksi japanista koreaan). [2] Aiemmin Google-kääntäjä käänsi ensin lähdekielestä englanniksi ja sitten englannista kohdekielelle sen sijaan, että se olisi kääntänyt suoraan kielestä toiselle. [neljä]

Katso myös

Linkit

  1. 1 2 3 4 5 Barak Turovsky (15. marraskuuta 2016), Löytyy käännöksestä: Tarkempia, sujuvampia lauseita Google-kääntäjässä , < https://blog.google/products/translate/found-translation-more-accurate-fluent -sentences-google-translate/ > . Haettu 11. tammikuuta 2017. Arkistoitu 7. huhtikuuta 2017 Wayback Machineen 
  2. 1 2 3 4 5 6 Mike Schuster, Melvin Johnson ja Nikhil Thorat (22. marraskuuta 2016), Zero-Shot Translation Googlen monikielisellä hermojen konekäännösjärjestelmällä , < https://research.googleblog.com/2016/11/ zero-shot-translation-with-googles.html > . Haettu 11. tammikuuta 2017. Arkistoitu 10. heinäkuuta 2017 Wayback Machineen 
  3. 1 2 Gil Fewster (5. tammikuuta 2017), Googlen järkyttävä tekoälyilmoitus, jonka luultavasti missasit , < https://medium.freecodecamp.com/the-mind-blowing-ai-announcement-from-google- that-you-probably-missed-2ffd31334805#.msj1mdvbh > . Haettu 11. tammikuuta 2017. Arkistoitu 31. toukokuuta 2017 Wayback Machinessa 
  4. 12 Boitet , Christian; Blanchon, Herve; Seligman, Mark; Bellynck, Valérie MT verkossa ja verkossa (PDF)  (linkki ei saatavilla) (2010). Käyttöpäivä: 1. joulukuuta 2016. Arkistoitu alkuperäisestä 29. maaliskuuta 2017.
  5. 1 2 Robert D. Hof. Kiinalainen Internet-jättiläinen alkaa haaveilla: Baidu on online-elämän kiintopiste Kiinassa, mutta se haluaa tulla globaaliksi voimaksi. Voiko yksi maailman johtavista tekoälytutkijoista auttaa sitä haastamaan Piilaakson suurimmat yritykset? . Teknologiakatsaus (14. elokuuta 2014). Haettu 11. tammikuuta 2017. Arkistoitu alkuperäisestä 8. tammikuuta 2020.
  6. Laajamittaisten aivosimulaatioiden käyttö koneoppimiseen ja tekoälyyn . Virallinen Google-blogi (26. kesäkuuta 2012). Haettu 26. tammikuuta 2015. Arkistoitu alkuperäisestä 23. elokuuta 2020.
  7. Googlen Large Scale Deep Neural Networks Project . Haettu 25. lokakuuta 2015. Arkistoitu alkuperäisestä 16. helmikuuta 2019.
  8. Markoff, John Kuinka monta tietokonetta kissan tunnistamiseen? 16 000 . New York Times (25. kesäkuuta 2012). Käyttöpäivä: 11. helmikuuta 2014. Arkistoitu alkuperäisestä 9. toukokuuta 2017.
  9. Katyanna Quach (17. marraskuuta 2016), Googlen hermoverkko oppii kääntämään kieliä, joihin sitä ei ole koulutettu: Ensimmäistä kertaa konekäännös on käyttänyt todellista siirtooppimista , < https://www.theregister.co.uk/ 2016/ 17/11/googles_neural_net_translates_languages_not_traained_on > . Haettu 11. tammikuuta 2017. Arkistoitu 22. syyskuuta 2017 Wayback Machinessa 
  10. Lewis-Kraus, Gideon . The Great AI Awakening , The New York Times  (14. joulukuuta 2016). Arkistoitu alkuperäisestä 5. toukokuuta 2017. Haettu 11 tammikuuta 2017.
  11. Le, Quoc; Schuster, Mike Konekäännösten hermoverkko tuotantomittakaavassa . Googlen tutkimusblogi . Google (27. syyskuuta 2016). Haettu 1. joulukuuta 2016. Arkistoitu alkuperäisestä 7. toukokuuta 2018.
  12. Google siirtyy omaan käännösjärjestelmäänsä Arkistoitu 29. huhtikuuta 2017 Wayback Machinessa 22. lokakuuta 2007
  13. Barry Schwartz. Google Translate Drops SYSTRAN kotitekoiseen käännökseen . Search Engine Land (23. lokakuuta 2007). Haettu 4. toukokuuta 2017. Arkistoitu alkuperäisestä 21. toukokuuta 2017.
  14. Chris McDonald (7. tammikuuta 2017), kommentoi Gil Fewsterin 5. tammikuuta julkaistua artikkelia Atlantilla , < https://medium.com/@chrismcdonald_94568/ok-slow-down-516f93f83ac8#.l0ti3ct0b > . Haettu 11. tammikuuta 2017. Arkistoitu 22. kesäkuuta 2017 Wayback Machinessa 
  15. Turovsky, Barak Löytyy käännöksestä: Tarkempia, sujuvampia lauseita Google-kääntäjässä . Avainsana Google-blogi . Google (15. marraskuuta 2016). Haettu 1. joulukuuta 2016. Arkistoitu alkuperäisestä 14. huhtikuuta 2020.
  16. Turovsky, Barak Laadukkaammat hermokäännökset useammille kielille . Avainsana Google-blogi . Google. Haettu 6. maaliskuuta 2017. Arkistoitu alkuperäisestä 7. maaliskuuta 2017.
  17. Novet, Jordania Google tarjoaa nyt tekoälypohjaisia ​​käännöksiä arabiaksi ja hepreaksi . Venture Beat (30. maaliskuuta 2017). Arkistoitu alkuperäisestä 1.1.2020.
  18. Turovsky, Barak Internetistä osallistavampi Intiassa . Avainsana (25. huhtikuuta 2017). Arkistoitu 11. marraskuuta 2020.
  19. Käännössovellusliittymän kielituki . Google Cloud Platform (4. toukokuuta 2017). Arkistoitu alkuperäisestä 16. syyskuuta 2017.

Ulkoiset linkit