Jälkimuokkaus

Jälkimuokkaus ( postitus ) on prosessi, jossa käsitellään konekäännöksiä hyväksyttävän laadun saavuttamiseksi. Jälkimuokkausta suorittavaa henkilöä kutsutaan jälkieditoriksi . Käsite jälkieditointi liittyy käsitteeseen esieditointi . Parhaan tuloksen konekäännöksellä käännettäessä saa aikaan lähdetekstin esimuokkaus ja koneelta vastaanotetun tekstin jälkimuokkaus. Jälkimuokkaus on eri asia kuin pelkkä muokkaaminen , mikä tarkoittaa ihmisen luoman tekstin käsittelyä. Jälkimuokkausvaiheen läpäissyt tekstit voidaan toimittaa myös toimittajalle tyyli-, kielioppi- ja leksikaalisten virheiden korjaamiseksi.

Jälkieditointiin kuuluu konekäännöstulosten korjaaminen siten, että lopputuotteen laatu vastaa asiakkaan vaatimuksia. Kevyellä jälkieditaatiolla pyritään tekemään tuloksena olevasta tekstistä ymmärrettävää; täydellinen jälkimuokkaus alkuperäisen tyylin säilyttämiseksi käännöksessä. Konekäännösten kehityksen myötä täydellinen jälkimuokkaus on vaihtoehto manuaaliselle käännökselle. Lähes kaikki tietokoneavusteiset käännösjärjestelmät (CAT) tukevat nyt konekäännöstulosten jälkimuokkausta.

Jälkieditointi ja konekäännös

Jotkin suuret instituutiot, kuten Euroopan komissio ja Pan American Health Organization , ja myöhemmin jotkut yritykset, kuten Caterpillar ja General Motors , alkoivat käyttää konekäännöstä aiottuun tarkoitukseen 1970-luvun lopulla . Ensimmäinen editoinnin jälkeinen tutkimus tehtiin 1980-luvulla ja se liittyi näihin toteutuksiin. [1] Vuonna 1999 American Machine Translation Associationin (AMTA) ja European Association for Machine Translation (EAMT) jäsenet muodostivat Post-Editing Task Force -työryhmän kehittämään ohjeita ja koulutusta. [2]

1990-luvun jälkeen tietokoneiden suorituskyvyn ja liitettävyyden kehitys vauhditti konekääntämisen kehitystä ja mahdollisti sen toteuttamisen verkkoselaimen kautta, myös ilmaisena, hyödyllisenä lisäyksenä tärkeimpiin hakukoneisiin ( Google Translate , Bing Translator , Yahoo! Babel kala ). Alikehittyneiden konekäännösten suuremman hyväksynnän myötä on myös lisääntynyt jälkieditoinnin hyväksyntä. Koska tavaroiden ja palveluiden lokalisoinnin kysyntä kasvaa niin nopeasti, että ihmiskääntäjät eivät pysty vastaamaan siihen edes käännösmuisteilla ja muilla käännösten hallintatekniikoilla, alan elimet, kuten Translation Automation Users Society (TAUS) odottavat konekäännösten ja jälkieditointien toimivan. paljon suurempi rooli seuraavien vuosien aikana. [3]

Konekäännösten käyttöön liittyy joskus esieditointia .

Helppo ja täydellinen jälkimuokkaus

1980-luvulla tehdyissä tutkimuksissa erotettiin jälkieditoinnin asteet, joita aluksi kutsuttiin normaaliksi ja nopeaksi tai täyteläiseksi ja nopeaksi. Kevyt ja täydellinen jälkimuokkaus ovat yleisimpiä termejä.

Kevyt jälkieditointi vaatii vain vähän jälkieditorin puuttumista, sillä sen tarkoituksena on auttaa loppukäyttäjää ymmärtämään tekstin merkitys. Kevyttä jälkieditointia käytetään, kun asiakas tarvitsee dokumenttia kiireesti ja laatu tulee toiseksi.

Täysi jälkieditointi edellyttää enemmän puuttumista asiakkaan haluaman laadun saavuttamiseksi. Uskotaan, että tuloksena tulisi olla teksti, joka ei ole vain ymmärrettävää, vaan myös tyylillisesti yhdenmukainen alkuperäisen testin kanssa.

Täydellisen jälkitoimituksen kannalta tärkeintä on, että lopullisen tekstin tulee täyttää kaikki perinteisen käännöksen laatukriteerit. Uskotaan kuitenkin, että kääntäjät vaativat vähemmän vaivaa työskennelläkseen suoraan lähdetekstin kanssa kuin konekäännöksen jälkimuokkauksessa. Konekäännösten kehittyessä tilanne voi muuttua. Joidenkin kieliparien ja joidenkin tehtävien osalta sekä moottoreissa, jotka on viritetty verkkoaluekohtaisilla laadullisilla tiedoilla, jotkut asiakkaat pyytävät jo kääntäjiä tekemään jälkimuokkausta sen sijaan, että he kääntäisivät tyhjästä, koska uskovat, että laatu ja kustannukset ovat samanlaiset. - alla.

Muokkauksen jälkeinen tehokkuus

Jälkimuokkausta käytetään, kun raakakonekäännös ei ole riittävän hyvä eikä ihmisen käännöstä tarvita. Jälkimuokkaus on suositeltavaa, kun se voi lisätä manuaalisen kääntämisen tuottavuutta vähintään kaksinkertaiseksi ja kevyen jälkieditoinnin tapauksessa jopa nelinkertaiseksi.

Jälkimuokkauksen tehokkuutta on kuitenkin vaikea ennustaa. Eri tutkimusten mukaan jälkieditointi on yleensä nopeampaa kuin tyhjästä kääntäminen kielipareista tai kääntäjien kokemuksesta riippumatta. [4] Ei kuitenkaan ole yksimielisyyttä siitä, kuinka paljon aikaa (jos ollenkaan) voidaan säästää jälkimuokkauksella käytännössä: vaikka teollisuus on raportoinut noin 40 prosentin ajansäästöstä, [5] jotkut akateemiset tutkimukset viittaavat siihen, että aikaa säästyy todellisuudessa. työolot ovat todennäköisesti 0-20%. Asiantuntijat raportoivat myös negatiivisista tuottavuuden kasvusta, kun tekstin käsittely kestää kauemmin kuin kääntäminen tyhjästä. [6] [7]

Jälkieditointi ja käännöspalvelujen markkinat

Noin kolmekymmentä vuotta myöhemmin jälkieditointi on edelleen "syntyvä ammatti". [8] Mitä ominaisuuksia jälkitoimittajalla tulisi olla, ei vielä täysin ymmärretä. Jälkieditointi on vähän, mutta kietoutunut kääntämiseen ja editointiin. Useimmat ihmiset ajattelevat, että ihanteellinen post-editori olisi kääntäjä, joka haluaa oppia tiettyjä taitoja, mutta on niitä, jotka ajattelevat, että kaksikielistä ilman käännöskokemusta on helpompi opettaa. [9] Tiedetään vähän siitä, keitä todelliset jälkitoimittajat ovat, ovatko he ammattikääntäjiä, työskentelevätkö he ensisijaisesti palkansaajina vai itsenäisinä ammatinharjoittajina ja millä ehdoilla. Monet ammattikääntäjät eivät pidä jälkimuokkauksesta, osittain siksi, että siitä maksetaan yleensä halvemmalla kuin tavallisista käännöksistä, ja International Association of Professional Translators (IAPTI) on ollut erityisen äänekäs tästä. [kymmenen]

Konekäännöstulosten laatu jälkimuokkausta varten on korkeampi ja vaatii siksi vähemmän jälkimuokkaustyötä, kun konekäännös saadaan aikaan hermo-, pysty- tai mukautetulla konekäännöksellä. Käännöstehokkuuden paranemista voidaan mitata seuraamalla aikaa, joka lingvisteiltä kuluu konekäännösten korjaamiseen samassa käännösympäristössä, kuten XTM Cloud [11] , Translation Management Systems ja Computer Aided Translation Systems , joissa muokkauksen jälkeinen aika ja jälki -muokattuja laatupisteitä voidaan verrata.

Ei ole selvää näyttöä siitä, kuinka tärkeää jälkieditointi on käännösteollisuudessa. Tuoreen tutkimuksen mukaan 50 prosenttia kielipalveluntarjoajista tarjoaa sitä, mutta 85 prosentilla heistä jälkimuokkaus on alle 10 prosenttia heidän tuottavuudestaan. [12] Memsource , pilviympäristö automaattista kääntämistä varten, väittää, että yli 50 % englannin ja espanjan, ranskan ja muiden kielten välisistä käännöksistä tuotettiin käyttämällä käännösmuistia konekääntämisen ohella. [13] Jälkimuokkaus tehdään myös joukkolähdeportaalien, kuten Unbabelin , kautta, jolla oli yli 11 miljoonaa sanaa jälkimuokattuna marraskuussa 2014. [neljätoista]

Suorituskyky- ja volyymiarviot ovat joka tapauksessa tavoitteita, sillä konekäännösten edistyminen , joka johtuu suurelta osin jälkimuokatun tekstin palauttamisesta sen koneille, tarkoittaa, että mitä enemmän jälkimuokkausta tehdään, sitä korkeampi on konekäännösten laatu. olla ja mitä laajemmalle se tulee.

Muistiinpanot

  1. Senez, Dorothy. Jälkieditointipalvelu konekäännöskäyttäjille Euroopan komissiossa (1998). Haettu 4. tammikuuta 2021. Arkistoitu alkuperäisestä 20. tammikuuta 2021.
  2. Allen, Jeffrey. "Post-editing", kirjassa Harold Somers (toim.). Tietokoneet ja käännökset. Kääntäjän opas . (2003). Haettu 4. tammikuuta 2021. Arkistoitu alkuperäisestä 17. tammikuuta 2021.
  3. TAUS-verkkosivusto . Haettu 4. tammikuuta 2021. Arkistoitu alkuperäisestä 23. helmikuuta 2020.
  4. Green, Spence, Jeffrey Heer ja Christopher D. Manning. Ihmisen jälkimuokkauksen tehokkuus kielten käännöksissä . ACM Human Factors in Computing Systems (2013). Haettu 4. tammikuuta 2021. Arkistoitu alkuperäisestä 11. maaliskuuta 2020.
  5. Plitt, Mirko ja Francois Masselot (2010). "Tilastollisen konekäännöksen jälkimuokkauksen tuottavuustesti tyypillisessä lokalisointikontekstissa" (PDF) . Prahan matemaattisen kielitieteen tiedote . 93 :7–16. DOI : 10.2478/v10108-010-0010-x . Arkistoitu (PDF) alkuperäisestä 20.09.2020 . Haettu 2021-01-04 . Käytöstä poistettu parametri |deadlink=( ohje )
  6. Marcello Federico, Alessandro Cattelan ja Marco Trombetti (2012). "Käyttäjien tuottavuuden mittaaminen konekäännösten tehostetussa tietokoneavusteisessa käännöksessä" (PDF) . Amerikan konekäännösyhdistyksen (AMTA) kymmenennen kaksivuotiskonferenssin julkaisut, San Diego, Kalifornia, 28. lokakuuta – 1. marraskuuta . Arkistoitu alkuperäisestä (PDF) 2017-03-07 . Haettu 2021-01-04 . Käytöstä poistettu parametri |deadlink=( ohje )
  7. Läubli, Samuel, Mark Fishel, Gary Massey, Maureen Ehrensberger-Dow ja Martin Volk (2013). "Jälkieditoinnin tehokkuuden arviointi realistisessa käännösympäristössä" (PDF) . Toisen jälkieditointiteknologian ja -käytännön työpajan julkaisut . s. 83-91. Arkistoitu alkuperäisestä (PDF) 23.04.2018 . Haettu 2021-01-04 . Käytöstä poistettu parametri |deadlink=( ohje )
  8. TAUS-verkkosivusto . Haettu 4. tammikuuta 2021. Arkistoitu alkuperäisestä 12. elokuuta 2016.
  9. Hutchins, John. Pohdintoja konekääntämisen historiasta ja nykytilasta (linkki ei ole käytettävissä) (1995). Haettu 4. tammikuuta 2021. Arkistoitu alkuperäisestä 6. marraskuuta 2020. 
  10. IAPTI-verkkosivusto (downlink) . Haettu 4. tammikuuta 2021. Arkistoitu alkuperäisestä 7. helmikuuta 2017. 
  11. XTM Internationalin virallinen verkkosivusto . Haettu 4. tammikuuta 2021. Arkistoitu alkuperäisestä 24. huhtikuuta 2020.
  12. Julkaiseminen käytännössä. TAUS-raportti. (maaliskuu 2010). Haettu 4. tammikuuta 2021. Arkistoitu alkuperäisestä 22. tammikuuta 2022.
  13. Memsource-sivusto . Haettu 4. tammikuuta 2021. Arkistoitu alkuperäisestä 25. syyskuuta 2016.
  14. Unbabel lanseeraa ihmisen toimittaman konekäännöspalvelun, joka auttaa yrityksiä globaalistumaan ja lokalisoimaan asiakastuen . Haettu 4. tammikuuta 2021. Arkistoitu alkuperäisestä 27. helmikuuta 2021.