Rinnakkaisteksti ( biteksti ) on yhdellä kielellä oleva teksti yhdessä sen käännöksen kanssa toiselle kielelle. "Parallel Text Alignment" on vastaavien lauseiden tunnistaminen rinnakkaistekstin molemmissa puolisoissa. Suuria rinnakkaisten tekstien kokoelmia kutsutaan "rinnakkaiskorpuksiksi" (eng. parallel corpora ). Rinnakkainen runkokohdistus lausetasolla on välttämätön edellytys kielellisen tutkimuksen eri osa-alueille. Käännösprosessin aikana lauseita voidaan jakaa, yhdistää, poistaa, lisätä tai järjestää uudelleen. Tämän seurauksena kohdistamisesta tulee usein vaikea tehtävä.
Käännöstutkimuksen alalla "biteksti" on yhdistetty asiakirja, joka koostuu vastaavan tekstin lähde- ja kohdekieliversioista. Bitekstit luodaan erityisillä tietokoneohjelmilla, joita kutsutaan "kohdistustyökaluiksi" ( kohdistustyökalu ) tai "bitekstityökaluiksi" ( bitekstityökalu ), joiden avulla voit kohdistaa automaattisesti tekstin alkuperäisen version ja sen käännöksen. Tällaiset ohjelmat sopivat pääsääntöisesti jokaiseen lauseeseen kaksi tekstiä (alkuperäinen ja käännös). Bitekstien kokoelmaa kutsutaan nimellä "bitekstitietokanta" tai "kaksikielinen korpus", ja sitä voidaan käyttää viitteenä ja oikeiden yhdistelmien löytämisessä.
Bitekstin idea kuuluu Brian Harrisille, joka kirjoitti tästä konseptista ensimmäisen kerran tutkimuksen vuonna 1988, ja sen kehitti myöhemmin tutkijaryhmä Montrealin yliopistossa (Université de Montréal), nimeltään RALI ( Recherche appliquée en linguistique informatique ). tai Applied Research in Computational Linguistics - "Applied Research in Computational Linguistics"). Ryhmään kuului luonnollista tekstinkäsittelyä opiskelevia ohjelmoijia ja lingvistejä. Bitext-konseptin merkittäviä edistäjiä ovat Pierre Isabelle ja Claude Bédard.
Ajatteella "biteksti" on paljon yhteistä käännösmuistin käsitteen kanssa . Suurin ero näiden kahden välillä on se, että käännösmuisti on tietokanta, jossa tekstisegmentit (vastaavat lauseet) on järjestetty siten, että ne eivät liity alkuperäiseen kontekstiin, eli alkuperäinen lausesarja katoaa. Biteksti säilyttää alkuperäisen lausesarjan. Käännösmuistitietokantojen vaihtamisen vakiomuoto erilaisten automatisoitujen käännösjärjestelmien välillä on TMX-muoto (LISA:n (Localization Industries Association) julkaisema XML-sanakirja). TMX mahdollistaa lauseiden alkuperäisen järjestyksen säilyttämisen.
Bitekstit luodaan viitetyökaluksi asiantuntijakääntäjien konsultoinnille, ei automaattisille ohjelmille. Siksi pienet kohdistusvirheet tai epätarkkuudet, jotka voivat johtaa käännösmuistin epäonnistumiseen, eivät ole heille tärkeitä.