Neural Machine Translation ( NMT) on lähestymistapa konekäännökseen , joka käyttää suurta keinotekoista hermoverkkoa . Se eroaa lausetilastoihin perustuvista konekäännösmenetelmistä , joissa käytetään erikseen kehitettyjä alikomponentteja [1] .
Googlen , Yandexin , Microsoftin ja PROMT :n [2] käännöspalvelut käyttävät jo hermokäännöstä. Google käyttää Google Neural Machine Translation (GNMT) -tekniikkaa aiemmin käytettyjen tilastomenetelmien sijaan. [3] Microsoft käyttää samanlaista tekniikkaa puheen kääntämiseen (mukaan lukien Microsoft Translator ja Skype Translator ). [4] Harvard Natural Language Processing Group julkaisi OpenNMT:n, avoimen lähdekoodin hermoston konekäännösjärjestelmän [5] . Yandex.Translatella on hybridimalli: sekä tilastollinen malli että hermoverkko tarjoavat omat käännösvaihtoehtonsa. Tämän jälkeen koneoppimiseen perustuva CatBoost- teknologia valitsee saaduista tuloksista parhaan [6] .
NMT-malleissa käytetään syväoppimista ja ominaisuusoppimista . Ne vaativat vain pienen määrän muistia verrattuna perinteisiin tilastollisiin konekäännösjärjestelmiin (SMT). Lisäksi, toisin kuin perinteiset käännösjärjestelmät, kaikki hermokäännösmallin osat harjoitetaan yhdessä (päästä päähän) käännöstehokkuuden maksimoimiseksi [7] [8] [9] .
Kaksisuuntaista toistuvaa hermoverkkoa (RNN), joka tunnetaan myös nimellä enkooderi , hermoverkko käyttää alkuperäisen lauseen koodaamiseen toista toistuvaa verkkoa varten, joka tunnetaan myös dekooderina ja jota käytetään ennustamaan sanoja lopullisella kielellä [10 ] .
Konekäännösten lähestymistavat | |
---|---|
|
luonnollisen kielen käsittely | |
---|---|
Yleiset määritelmät | |
Tekstianalyysi |
|
Viittaus |
|
Konekäännös |
|
Tunnistaminen ja tiedonkeruu | |
Temaattinen malli | |
Vertaisarviointi |
|
Luonnollisen kielen käyttöliittymä |