Transformaatioon perustuva konekäännös

Muunnospohjainen konekäännös on eräänlainen konekäännös (MT). Se on tällä hetkellä yksi yleisimmin käytetyistä konekäännösmenetelmistä. Toisin kuin suoran MT:n yksinkertaisemmassa mallissa, muunnospohjainen MT jakaa käännösprosessin kolmeen vaiheeseen: lähdekielen tekstin analysointi sen kieliopillisen rakenteen selvittämiseksi, tuloksena olevan rakenteen kääntäminen rakenteeseen, joka soveltuu kohdekielen tekstin tuottamiseen ja tekstin luominen. Siten muunnospohjaiset MT-järjestelmät pystyvät hyödyntämään lähdekielen ja kohdekielen tietoa [1] .

Laite

Transformaatioon perustuva käännös ja kieltenvälinen konekäännös perustuvat samaan ajatukseen, jonka mukaan kääntämistä varten on hankittava väliesitys. Sen avulla voit korjata alkuperäisen lauseen merkityksen, jotta voit rakentaa oikean käännöksen. Kieltenvälisessä MT:ssä tällaisen väliesityksen on oltava riippumaton sekä lähdekielestä että kohdekielestä, kun taas siirtopohjaisessa MT:ssä on tietty riippuvuus tietystä kieliparista. Muunnospohjaisten MT-järjestelmien toimintatavat vaihtelevat merkittävästi, mutta yleensä ne noudattavat samaa kaavaa: ne soveltavat kielellisiä sääntöjä, jotka määräytyvät lähdekielen ja kohdekielen rakenteen vastaavuudesta. Ensimmäinen vaihe sisältää syötetyn tekstin jäsentämisen morfologian ja syntaksin (joskus myös semantiikan ) suhteen väliesityksen luomiseksi. Tuloksena olevasta esityksestä muodostetaan käännös käyttämällä kaksikielisiä sanakirjoja ja kieliopillisia rakennussääntöjä. Tämän strategian avulla voit saada riittävän korkealaatuisen käännöksen noin 90 % tarkkuudella alkuperäisestä (tarkkuus riippuu kuitenkin suurelta osin tietystä kieliparista ja määräytyy kahden tietyn kielen läheisyyden mukaan).

Käännösprosessi

Sääntöpohjaisessa MT-järjestelmässä lähdeteksti analysoidaan ensin morfologian ja syntaksin suhteen syntaktisen esityksen saamiseksi. Jatkossa tätä esitystapaa voidaan muuttaa vähemmän spesifikaatioksi, koska on kiinnitettävä enemmän huomiota tärkeimpiin käännösten fragmentteihin, samalla kun muut tiedot jätetään huomiotta. Muunnosprosessin aikana lopullinen esitys (joka on edelleen olemassa lähdekielellä) muunnetaan kohdekielellä saman tason instantiaatioksi. Näitä kahta näkymää kutsutaan välinäkymäksi . Kohdekielisen esityksen muuntaminen valmiiksi tekstiksi koostuu vastaavista vaiheista, jotka suoritetaan käänteisessä järjestyksessä.

Analyysi ja muunnos

Ennen kuin lopullinen tulos saadaan, on mahdollista turvautua erilaisiin analyysi- ja muunnosmenetelmiin. Tilastollisten lähestymistapojen ohella generoivien hybridijärjestelmien määrää voidaan lisätä. Valitut menetelmät ja prioriteetit riippuvat pitkälti itse järjestelmän suunnittelusta. Useimmat olemassa olevat järjestelmät sisältävät kuitenkin ainakin seuraavat vaiheet:

Muutostyypit

Yksi muunnospohjaisten MT-järjestelmien pääpiirteistä on vaihe, jossa lähdekielen tekstin väliesitys käännetään tekstin väliesitykseen kohdekielellä. Tämä prosessi voi tapahtua jollakin lingvistisen analyysin tasoista tai niiden välisellä aikavälillä. Tasot näkyvät alla:

Katso myös

Muistiinpanot

  1. Jurafsky, Daniel; Martin, James H. (2009). Puheen ja kielen käsittely. Pearson. s. 906-908.