Geneettinen koodi on joukko sääntöjä , joiden mukaan elävissä soluissa nukleotidisekvenssi ( geenit ja mRNA ) muunnetaan aminohapposekvenssiksi ( proteiinit ). Varsinaisen translaation ( translation ) suorittaa ribosomi , joka yhdistää aminohapot ketjuksi mRNA - kodoneihin kirjoitettujen ohjeiden mukaisesti. Vastaavat aminohapot toimitetaan ribosomiin tRNA - molekyylien avulla. . Kaikkien maan elävien organismien geneettinen koodi on sama (on vain pieniä vaihteluita), mikä osoittaa yhteisen esivanhemman olemassaolon .
Geneettisen koodin säännöt määräävät, mikä aminohappo vastaa triplettiä (kolme peräkkäistä nukleotidia) mRNA:ssa. Harvinaisia poikkeuksia lukuun ottamatta [1] kukin kodoni vastaa vain yhtä aminohappoa. Tiettyä aminohappoa voi koodata useampi kuin yksi kodoni, ja on myös kodoneja, jotka merkitsevät proteiinin alkua ja loppua. Geneettisen koodin muunnelmaa, jota suurin osa elävistä organismeista käyttää, kutsutaan standardi- tai kanoniseksi geneettiseksi koodiksi. Tavanomaisesta geneettisestä koodista tunnetaan kuitenkin useita kymmeniä poikkeuksia, esimerkiksi mitokondrioissa käännettäessä käytetään geneettisen koodin hieman muunneltuja sääntöjä.
Yksinkertaisin esitys geneettisestä koodista on 64 solun taulukko, jossa jokainen solu vastaa yhtä 64 mahdollisesta kodonista [2] .
Yritykset ymmärtää, kuinka DNA-sekvenssi koodaa proteiinien aminohapposekvenssiä, alkoivat melkein heti DNA:n rakenteen ( double helix ) perustamisen jälkeen vuonna 1953. Georgy Gamow ehdotti, että kodonien tulisi koostua kolmesta nukleotidistä, jotta kodoneja olisi riittävästi kaikille 20 aminohapolle (yhteensä 64 erilaista kolmen nukleotidin kodonia on mahdollista: yksi neljästä nukleotidista voidaan sijoittaa kuhunkin kolmesta asemasta) [3 ] .
Vuonna 1961 geneettisen koodin kolmoisluonne vahvistettiin kokeellisesti. Samana vuonna Marshall Nirenberg ja hänen kollegansa Heinrich Mattei käyttivät solutonta järjestelmää in vitro -translaatioon . Templaatiksi otettiin oligonukleotidi , joka koostui urasiilitähteistä (UUUU...) . Siitä syntetisoitu peptidi sisälsi vain aminohapon fenyylialaniinin [4] . Joten kodonin merkitys selvitettiin ensin: kodoni UUU koodaa fenyylialaniinia. Lisäsäännöt kodonien ja aminohappojen vastaavuudelle vahvistettiin Severo Ochoan laboratoriossa . On osoitettu, että polyadeniini - RNA (AAA...) transloituu polylysiinipeptidiksi [5] ja vain proliinitähteistä koostuva peptidi syntetisoidaan polysytosiini- RNA:n (CCC...) templaatilla [6] . Jäljellä olevien kodonien merkitys määritettiin käyttämällä erilaisia kopolymeerejä Hara Gobind Qur'anin laboratoriossa suoritettujen kokeiden aikana . Pian tämän jälkeen Robert Holley loi translaatiota välittävän tRNA-molekyylin rakenteen. Vuonna 1968 Nirenberg, Korana ja Holly saivat Nobelin fysiologian tai lääketieteen palkinnon [7] .
Geneettisen koodin sääntöjen vahvistamisen jälkeen monet tutkijat alkoivat muuttaa sitä keinotekoisesti . Joten vuodesta 2001 lähtien geneettiseen koodiin on lisätty 40 aminohappoa, jotka eivät luonnossa ole osa proteiineja. Jokaiselle aminohapolle luotiin oma kodoni ja vastaava aminoasyyli-tRNA-syntetaasi . Geneettisen koodin keinotekoinen laajentaminen ja proteiinien luominen uusilla aminohapoilla voi auttaa tutkimaan proteiinimolekyylien rakennetta syvällisemmin sekä saamaan keinotekoisia proteiineja, joilla on halutut ominaisuudet [8] [9] . H. Murakami ja M. Sishido pystyivät muuttamaan joitain kodoneja kolmesta nukleotidistä neljäksi ja viideksi nukleotidiksi. Stephen Brenner sai 65. kodonin, joka toimi in vivo [10] .
Vuonna 2015 Escherichia coli -bakteeri onnistui muuttamaan kaikkien UGG-kodonien arvon tryptofaanista tienopyrrolialaniiniksi, jota ei esiinny luonnossa [11] . Vuonna 2016 saatiin ensimmäinen puolisynteettinen organismi - bakteeri, jonka genomi sisälsi kaksi keinotekoista typpiemästä (X ja Y), jotka säilyvät jakautumisen aikana [12] [13] . Vuonna 2017 Etelä-Korean tutkijat ilmoittivat luovansa hiiren , jolla on laajennettu geneettinen koodi ja joka pystyy syntetisoimaan proteiineja aminohapoilla, joita ei löydy luonnosta [14] .
Geenit koodataan nukleotidisekvenssin 5'→3'-suunnassa [15] . Lukukehyksen määrittää ensimmäinen tripletti, josta käännös alkaa. Ei-päällekkäisten kodonien sekvenssiä, joka alkaa aloituskodonilla ja päättyy lopetuskodoniin , kutsutaan avoimeksi lukukehykseksi . Esimerkiksi sekvenssi 5'-AAATGAACG-3' (katso kuvio) jaetaan ensimmäisestä nukleotidista luettuna kodoneiksi AAA, TGA ja ACG. Jos lukeminen alkaa toisesta nukleotidista, niin kodonit AAT ja GAA vastaavat sitä. Lopuksi, kun luetaan kolmannesta nukleotidista, käytetään ATG- ja AAC-kodoneja. Siten mikä tahansa sekvenssi voidaan lukea suunnassa 5' → 3' kolmella eri tavalla (kolmella eri lukukehyksellä), ja kussakin tapauksessa proteiinituotteen sekvenssi eroaa ribosomin eri kodonien tunnistamisen vuoksi. Jos otamme huomioon, että DNA:lla on kaksijuosteinen rakenne, niin 6 lukukehystä on mahdollista: kolme yhdessä juosteessa ja kolme toisessa [16] . Geenien lukeminen DNA:sta ei kuitenkaan ole satunnaista. Kaikki muut yhden geenin lukukehykset sisältävät yleensä lukuisia lopetuskodoneja, jotka pysäyttävät nopeasti ja vähentävät synteesin aineenvaihdunnan kustannuksia [17] .
Tietojen translaatio mRNA-sekvenssistä aminohapposekvenssiksi alkaa ns. aloituskodonilla - yleensä AUG, ja eukaryooteissa se lukee metioniinin ja bakteerien kaltaisen formyylimetioniinin . Yksi aloituskodoni ei riitä kääntämisen aloittamiseen; se vaatii translaation aloitustekijöitä sekä erikoiselementtejä viereisissä sekvensseissä, kuten Shine-Dalgarno-sekvenssi bakteereissa. Joissakin organismeissa aloituskodoneina käytetään kodoneja GUG, joka normaalisti koodaa valiinia , ja UUG, joka vastaa leusiinia standardikoodissa [18] .
Aloituskodonin jälkeen translaatio jatkuu kodonien peräkkäisellä lukemisella ja aminohappojen kiinnittymisellä toisiinsa ribosomin avulla, kunnes saavutetaan lopetuskodoni translaation pysäyttämiseksi. On kolme stop-kodonia, joilla kullakin on eri nimi: UAG (keltainen), UGA (opaali) ja UAA (okra). Stop-kodoneja kutsutaan myös terminaattoreiksi. Soluissa ei ole lopetuskodoneja vastaavia tRNA:ita, joten kun ribosomi saavuttaa lopetuskodonin, sen kanssa vuorovaikuttavat tRNA:n sijasta translaation lopetustekijät, jotka hydrolysoivat viimeisen tRNA:n aminohappoketjusta ja pakottavat sitten ribosomin dissosioitumaan . [19] . Bakteereissa translaation lopettamiseen osallistuu kolme proteiinitekijää : RF-1, RF-2 ja RF-3: RF-1 tunnistaa ja UAA-kodonit ja RF-2 tunnistaa UAA- ja UGA-kodonit. RF-3-tekijä tekee aputyötä. RF-1:n ja RF-2:n kolmiulotteinen rakenne muistuttaa tRNA:n muotoa ja varausjakaumaa ja on siten esimerkki molekyylimimikristä [20] . Eukaryooteissa translaation lopetustekijä eRF1 tunnistaa kaikki kolme lopetuskodonia. Ribosomista riippuvainen GTPaasi eRF3, jota pidetään toisena eukaryoottisen translaation lopetustekijänä, auttaa eRF1:tä vapauttamaan valmiin polypeptidin ribosomista [21] [22] [23] .
Lopetuskodonien jakautuminen organismin genomissa ei ole sattumaa, ja se voi liittyä genomin GC-koostumukseen [24] [25] . Esimerkiksi E. coli K-12 -kannan genomissa on 2705 TAA:ta (63 %), 1257 TGA:ta (29 %) ja 326 TAG-kodonia (8 %) GC-sisällön ollessa 50,8 % [26] . Laajamittainen tutkimus eri bakteerilajien genomeista osoitti, että TAA-kodonin osuus korreloi positiivisesti GC-koostumuksen kanssa, kun taas TGA:n osuus korreloi negatiivisesti. Harveimmin käytetyn lopetuskodonin, TAG:n, taajuus ei liity GC-koostumukseen [27] . Myös lopetuskodonien vahvuus vaihtelee. Spontaani translaation lopetus tapahtuu useimmiten UGA-kodonissa ja harvimmin UAA:ssa [23] .
Itse lopetuskodonin lisäksi sen ympäristö on ensiarvoisen tärkeä translaation lopettamisen kannalta. Välittömästi lopetuskodonin (+4) jälkeen sijaitsevan nukleotidin rooli on suurin. On todennäköistä, että nukleotidi +4 ja muut sitä seuraavat nukleotidit vaikuttavat translaation lopettamiseen tarjoamalla sitoutumiskohtia translaation lopetustekijöille. Tästä syystä jotkut tutkijat ehdottavat harkitsemaan neljän nukleotidin lopetussignaalia kolmen nukleotidin lopetuskodonin sijasta. Nukleotidit ylävirtaan lopetuskodoneista vaikuttavat myös translaatioon. Esimerkiksi hiivassa on osoitettu, että adeniini , joka sijaitsee 2 asemaa ylävirtaan ensimmäisestä lopetuskodonin nukleotidista, stimuloi translaation lopettamista UAG-lopetuskodonissa (mahdollisesti myös muissa kodoneissa) [23] .
Joskus stop-kodonit toimivat aistikodoneina. Esimerkiksi UGA-kodoni koodaa epästandardista aminohappoa selenokysteiiniä , jos niin sanottu SECIS-elementti sijaitsee sen vieressä transkriptissa [28] . Lopetuskodoni UAG voi koodata toista epästandardia aminohappoa, pyrrolysiiniä . Joskus stop-kodoni tunnistetaan sense-kodoniksi mutaatioissa, jotka vaikuttavat tRNA:han. Tämä ilmiö havaitaan useimmiten viruksissa , mutta se on kuvattu myös bakteereissa, hiivassa , Drosophilassa ja ihmisissä, joissa sillä on säätelevä rooli [29] [30] .
DNA:n replikaation aikana tapahtuu toisinaan virheitä tytärjuosteen synteesin aikana. Nämä virheet, joita kutsutaan mutaatioiksi , voivat vaikuttaa organismin fenotyyppiin , varsinkin jos ne vaikuttavat geenin koodaavaan alueeseen . Virheitä esiintyy 1/10-100 miljoonaa emäsparia (bp), koska DNA-polymeraasit voivat tehokkaasti korjata virheensä [31] [32] .
Pistemutaatiot ovat yhden typpipitoisen emäksen yksittäisiä substituutioita. Jos uusi emäs kuuluu samaan luokkaan kuin alkuperäinen (molemmat puriinit tai molemmat pyrimidiinit ), niin mutaatiota kutsutaan siirtymäksi . Jos puriini korvataan pyrimidiinillä tai pyrimidiini puriinilla, he puhuvat transversioista . Siirtymät ovat yleisempiä kuin transversiot [33] . Esimerkkejä pistemutaatioista ovat missense- ja nonsense-mutaatiot . Ne voivat aiheuttaa sairauksia, kuten sirppisoluanemiaa ja talassemiaa [34] [35 ] . Kliinisesti merkittävät missense-mutaatiot johtavat aminohappotähteen korvaamiseen tähteellä, jolla on erilaiset fysikaalis-kemialliset ominaisuudet, ja nonsense-mutaatiot johtavat ennenaikaisen lopetuskodonin ilmaantumiseen [16] .
Mutaatioita, joissa oikea lukukehys häiriintyy insertioiden ja deleetioiden vuoksi (niitä kutsutaan yhteisesti indeliksi ), jotka sisältävät ei-moninan kolmesta nukleotidista, kutsutaan kehyssiirtymämutaatioiksi. Näillä mutaatioilla proteiinituote on täysin erilainen kuin villityypissä . Lukukehyssiirtymien aikana ilmaantuu yleensä ennenaikaisia lopetuskodoneja, jotka aiheuttavat typistyneiden proteiinien muodostumista [36] . Koska nämä mutaatiot häiritsevät merkittävästi proteiinin toimintaa, ne korjataan harvoin valinnalla : usein proteiinin puuttuminen johtaa organismin kuolemaan jo ennen syntymää [37] . Frameshift-mutaatiot liittyvät sairauksiin, kuten Tay-Sachsin tautiin [38] .
Vaikka valtaosa mutaatioista on haitallisia tai neutraaleja , jotkut osoittautuvat hyödyllisiksi [39] . Ne voivat antaa organismille villityyppiä paremmin sopeutumisen tiettyihin ympäristöolosuhteisiin tai mahdollistaa sen lisääntymisen nopeammin kuin villityyppi. Tässä tapauksessa mutaatio leviää vähitellen populaatioon neutraalin valinnan aikana [40] . Virukset , joiden genomeja edustaa RNA, mutatoituvat erittäin nopeasti [41] , mikä usein hyödyttää niitä, koska immuunijärjestelmä , joka tunnistaa tehokkaasti jotkin virusantigeenien variantit , on voimaton hieman muuttuneita vastaan [42] . Suurissa aseksuaalisesti lisääntyvien organismien populaatioissa, kuten E. coli , voi esiintyä useita hyödyllisiä mutaatioita samanaikaisesti. Tätä ilmiötä kutsutaan klooniseksi häiriöksi ja se aiheuttaa kilpailua mutaatioiden välillä [43] .
Eri kodonien kykyä koodata samaa aminohappoa kutsutaan koodidegeneraatioksi. Nirenberg ja Bernfield kutsuivat geneettistä koodia ensimmäistä kertaa degeneroituneeksi Degeneraatiosta huolimatta geneettisessä koodissa ei ole epäselvyyttä. Esimerkiksi kodonit GAA ja GAG molemmat koodaavat glutamaattia , mutta kumpikaan ei koodaa mitään muuta aminohappoa samanaikaisesti. Samaa aminohappoa vastaavat kodonit voivat vaihdella missä tahansa paikassa, mutta useimmiten tällaisten kodonien kaksi ensimmäistä sijaintia ovat samat ja vain viimeinen eroaa. Tästä johtuen mutaatio, joka vaikuttaa kodonin kolmanteen asemaan, ei todennäköisesti vaikuta proteiinituotteeseen [44] .
Tämä ominaisuus voidaan selittää Francis Crickin ehdottamalla moniselitteisellä emäsparihypoteesilla . Tämän hypoteesin mukaan DNA-kodonin kolmas nukleotidi ei välttämättä ole täysin komplementaarinen tRNA-antikodonin kanssa kompensoidakseen tRNA-tyyppien lukumäärän ja kodonien lukumäärän välistä eroa [45] [46] .
Myös aminohappokodonit, joilla on samanlaiset fysikaalis-kemialliset ominaisuudet, ovat usein samanlaisia, minkä vuoksi mutaatiot eivät johda merkittäviin proteiinirakenteen rikkomuksiin. Siten NUN-kodonit (N on mikä tahansa nukleotidi) koodaavat yleensä hydrofobisia aminohappoja. NCN:t koodaavat pieniä aminohappoja, joilla on kohtalainen hydrofobisuus, kun taas NAN:t koodaavat keskikokoisia hydrofiilisiä aminohappoja. Geneettinen koodi on järjestetty niin optimaalisesti hydrofobisuuden kannalta, että matemaattinen analyysi käyttämällä 12 muuttujan singulaarista arvon hajottamista (4 nukleotidia 3 asemaa kohti) antaa merkittävän korrelaation (0,95) aminohapon hydrofobisuuden ennustamiseksi sen kodonin perusteella [47] . Mutaatiot kolmannessa asemassa eivät vaikuta kahdeksaan aminohappoon ollenkaan, ja toisessa asemassa olevat mutaatiot johtavat yleensä korvaamiseen aminohapolla, jolla on täysin erilaiset fysikaalis-kemialliset ominaisuudet. Kuitenkin mutaatioilla ensimmäisissä asemissa on suurin vaikutus proteiinituotteeseen. Siten mutaatiot, jotka johtavat varautuneen aminohapon korvaamiseen aminohapolla, jolla on vastakkainen varaus, voivat vaikuttaa vain ensimmäiseen asemaan, eivätkä koskaan toiseen. Tällaisella varauksen muutoksella on todennäköisesti voimakas vaikutus proteiinin rakenteeseen [48] .
Alla oleva taulukko näyttää geneettisen koodin, joka on yhteinen useimmille pro- ja eukaryooteille . Taulukossa luetellaan kaikki 64 kodonia ja luetellaan vastaavat aminohapot. Emäsjärjestys on mRNA:n 5'-3'-päästä. Aminohappojen kolmikirjaiminen ja yksikirjaiminen nimitykset on annettu.
ei-polaarinen | napainen | perus | happoa | (pysäytyskodoni) |
1. pohja |
2. pohja | 3. pohja | |||||||
---|---|---|---|---|---|---|---|---|---|
U | C | A | G | ||||||
U | UUU | (Phe/F) Fenyylialaniini | UCU | (Ser/S) Seriini | UAU | (Tyr/Y) Tyrosiini | UGU | (Cys/C) Kysteiini | U |
UUC | UCC | UAC | UGC | C | |||||
UUA | (Leu/L) Leusiini | UCA | UAA | Pysähdys ( okkeri ) | UGA | Stop ( Opaali ) | A | ||
UUG | UCG | UAG | Stop ( Amber ) | UGG | (Trp/W) Tryptofaani | G | |||
C | CUU | CCU | (Pro/P) Proliini | CAU | (His/H) Histidiini | CGU | (Arg/R) Arginiini | U | |
CUC | CCC | SERT | CGC | C | |||||
CUA | CCA | CAA | (Gln/Q) Glutamiini | CGA | A | ||||
CUG | CCG | CAG | CGG | G | |||||
A | AUU | (Ile/I) Isoleusiini | ACU | (Thr/T) Treoniini | AAU | (Asn/N) Asparagiini | AGU | (Ser/S) Seriini | U |
AUC | ACC | AAC | AGC | C | |||||
AUA | ACA | AAA | (Lys/K) Lysiini | AGA | (Arg/R) Arginiini | A | |||
ELOKUU [A] | (Met/M) Metioniini | ACG | AAG | AGG | G | ||||
G | GUU | (Val/V) Valiini | GCU | (Ala/A) Alaniini | GAU | (Asp/D) Asparagiinihappo | GGU | (Gly/G) Glysiini | U |
GUC | GCC | GAC | GGC | C | |||||
GUA | GCA | GAA | (Glu/E) Glutamiinihappo | GGA | A | ||||
GUG | GCG | GAG | GGG | G |
Ala /A | GCU, GCC, GCA, GCG | Leu/L | UUA, UUG, CUU, CUC, CUA, CUG |
---|---|---|---|
Arg /R | CGU, CGC, CGA, CGG, AGA, AGG | Lys/K | AAA, AAG |
Asn /N | AAU, AAC | Met/M | ELOK |
Asp /D | GAU, GAC | Phe/F | UUU, UUC |
Cys /C | UGU, UGC | Pro/P | CCU, CCC, CCA, CCG |
Gln /Q | CAA, CAG | Ser /S | UCU, UCC, UCA, UCG, AGU, AGC |
Liima | GAA, GAG | Thr /T | ACU, ACC, ACA, ACG |
Gly /G | GGU, GGC, GGA, GGG | Trp/W | UGG |
Hänen /H | CAU, SERT | Tyr /Y | UAU, UAC |
Ile/I | AUU, AUC, AUA | Val/V | GUU, GUC, GUU, GUG |
ALKAA | ELOK | LOPETTAA | UAG, UGA, UAA |
Joissakin proteiineissa ei-standardiaminohappoja koodaavat lopetuskodonit riippuen siitä, onko mRNA:ssa erityinen signaalisekvenssi. Esimerkiksi lopetuskodoni UGA voi koodata selenokysteiiniä , kun taas UAG voi koodata pyrrolysiiniä . Selenokysteiiniä ja pyrrolysiiniä pidetään 21. ja 22. proteogeenisina aminohappoina, vastaavasti. Toisin kuin selenokysteiini, pyrrolysiinillä on oma aminoasyyli-tRNA-syntetaasi [50] . Vaikka yleensä yhden organismin solujen käyttämä geneettinen koodi on kiinteä, arkeinen Acetohalobium arabaticum voi vaihtaa 20 aminohapon koodista 21 aminohapon koodiin (mukaan lukien pyrrolysiini) erilaisissa kasvuolosuhteissa [51] .
Poikkeamien olemassaolo normaalista geneettisestä koodista ennustettiin jo 1970-luvulla [52] . Ensimmäinen poikkeama kuvattiin vuonna 1979 ihmisen mitokondrioissa [53] . Myöhemmin kuvattiin useita muita vaihtoehtoisia geneettisiä koodeja, jotka poikkesivat hieman standardista, mukaan lukien vaihtoehtoiset mitokondriokoodit [54] .
Esimerkiksi Mycoplasma -suvun bakteereissa UGA-pysäytyskodoni koodaa tryptofaania, kun taas ns. "CTG- kladista " (mukaan lukien patogeeniset Candida albicans -lajit ) peräisin olevassa hiivassa CUG-kodoni koodaa seriiniä, ei leusiinia, kuten standardi geneettinen koodi [55] [56] [57] . Koska virukset käyttävät samaa geneettistä koodia kuin isäntäsolunsa, poikkeamat tavallisesta geneettisestä koodista voivat häiritä viruksen replikaatiota [58] . Jotkut virukset, kuten Totivirus -suvun virukset , käyttävät kuitenkin samaa vaihtoehtoista geneettistä koodia kuin isäntäorganismi [59] .
Bakteereissa ja arkeissa GUG ja UUG toimivat usein aloituskodoneina [60] . Ihmisen ydingenomissa on myös joitain poikkeamia normaalista geneettisestä koodista : esimerkiksi malaattidehydrogenaasientsyymin 4 %:ssa mRNA : ssa yksi lopetuskodoneista koodaa tryptofaania tai arginiinia [61] . Lopetuskodonin arvo riippuu sen ympäristöstä [30] . Poikkeamat organismin geneettisessä koodissa voidaan havaita etsimällä sen genomista hyvin konservatiivisia geenejä ja vertaamalla niiden kodoneja lähisukulaisten organismien homologisten proteiinien vastaaviin aminohappoihin . Tämän periaatteen mukaan toimii FACIL-ohjelma, joka laskee taajuuden, jolla jokainen kodoni vastaa tiettyä aminohappoa, ja määrittää myös lopetuskodonin tuen ja esittää tuloksen logon (LOGO) muodossa [62] . Kaikista näistä eroista huolimatta kaikkien organismien käyttämät geneettiset koodit ovat kuitenkin pitkälti samanlaisia [63] .
Alla olevassa taulukossa luetellaan tällä hetkellä tunnetut epästandardit geneettiset koodit [64] [65] . On olemassa 23 epästandardista geneettistä koodia, joista yleisin ero tavallisesta geneettisestä koodista on UGA-lopetuskodonin muuntaminen tryptofaania koodaavaksi sensekodoniksi [66] .
Luettelo epätyypillisistä geneettisistä koodeistaAminohappojen biokemialliset ominaisuudet | ei-polaarinen | napainen | pää | hapan | Lopetus: lopetuskodoni |
Koodi | Käännöstaulukko _ |
DNA kodoni | RNA kodoni | Lähetä tällä koodilla |
Normaali lähetys | Huomautuksia | ||
---|---|---|---|---|---|---|---|---|
Vakio | yksi | Sisältää käännöstaulukon 8 ( kasvikloroplastit ) | ||||||
Selkärankaisten mitokondriokoodi | 2 | AGA | AGA | Ter (*) | Arg (R) | |||
AGG | AGG | Ter (*) | Arg (R) | |||||
ATA | AUA | Met (M) | Ile (I) | |||||
TGA | UGA | TRP (W) | Ter (*) | |||||
Hiivan mitokondrioiden geneettinen koodi | 3 | ATA | AUA | Met (M) | Ile (I) | |||
CTT | CUU | Thr (T) | leu (L) | |||||
CTC | CUC | Thr (T) | leu (L) | |||||
CTA | CUA | Thr (T) | leu (L) | |||||
CTG | CUG | Thr (T) | leu (L) | |||||
TGA | UGA | TRP (W) | Ter (*) | |||||
CGA | CGA | poissa | Arg (R) | |||||
CGC | CGC | poissa | Arg (R) | |||||
Limahomesienten, alkueläinten, cnidarianien mitokondrioiden geneettinen koodi sekä mykoplasman ja spiroplasman geneettinen koodi | neljä | TGA | UGA | TRP (W) | Ter (*) | Sisältää käännöstaulukon 7 ( kinetoplast ) | ||
Selkärangattomien mitokondriokoodi | 5 | AGA | AGA | Ser (S) | Arg (R) | |||
AGG | AGG | Ser (S) | Arg (R) | |||||
ATA | AUA | Met (M) | Ile (I) | |||||
TGA | UGA | TRP (W) | Ter (*) | |||||
Ripsieläinten, Dasycladacean ja Hexamitan geneettinen koodi | 6 | TAA | UAA | GLN (Q) | Ter (*) | |||
TAG | UAG | GLN (Q) | Ter (*) | |||||
Piikkinahkaisten ja latomatojen mitokondrioiden geneettinen koodi | 9 | AAA | AAA | Asn (N) | Lys (K) | |||
AGA | AGA | Ser (S) | Arg (R) | |||||
AGG | AGG | Ser (S) | Arg (R) | |||||
TGA | UGA | TRP (W) | Ter (*) | |||||
Euplotidaen geneettinen koodi | kymmenen | TGA | UGA | Cys (C) | Ter (*) | |||
Kasvien bakteerien, arkkien ja plastidien geneettinen koodi | yksitoista | Katso käännöstaulukko 1 | ||||||
Hiivan vaihtoehtoinen geneettinen koodi | 12 | CTG | CUG | Ser (S) | leu (L) | |||
Askidian mitokondrioiden geneettinen koodi | 13 | AGA | AGA | Gly (G) | Arg (R) | |||
AGG | AGG | Gly (G) | Arg (R) | |||||
ATA | AUA | Met (M) | Ile (I) | |||||
TGA | UGA | TRP (W) | Ter (*) | |||||
Vaihtoehtoinen mitokondrioiden geneettinen koodi lattamatoille | neljätoista | AAA | AAA | Asn (N) | Lys (K) | |||
AGA | AGA | Ser (S) | Arg (R) | |||||
AGG | AGG | Ser (S) | Arg (R) | |||||
TAA | UAA | Tyr (Y) | Ter (*) | |||||
TGA | UGA | TRP (W) | Ter (*) | |||||
Blefarisman geneettinen koodi | viisitoista | TAG | UAG | GLN (Q) | Ter (*) | |||
Chlorophycian mitokondrioiden geneettinen koodi | 16 | TAG | UAG | leu (L) | Ter (*) | |||
Trematodien mitokondrioiden geneettinen koodi | 21 | TGA | UGA | TRP (W) | Ter (*) | |||
ATA | AUA | Met (M) | Ile (I) | |||||
AGA | AGA | Ser (S) | Arg (R) | |||||
AGG | AGG | Ser (S) | Arg (R) | |||||
AAA | AAA | Asn (N) | Lys (K) | |||||
Scenedesmus obliquuksen mitokondrioiden geneettinen koodi | 22 | TCA | UCA | Ter (*) | Ser (S) | |||
TAG | UAG | leu (L) | Ter (*) | |||||
Thraustochytriumin mitokondrioiden geneettinen koodi | 23 | TTA | UUA | Ter (*) | leu (L) | Samanlainen kuin käännöstaulukko 11. | ||
Siipikidusten mitokondrioiden geneettinen koodi | 24 | AGA | AGA | Ser (S) | Arg (R) | |||
AGG | AGG | Lys (K) | Arg (R) | |||||
TGA | UGA | TRP (W) | Ter (*) | |||||
Mahdollisten ryhmien SR1 ja Gracilibacteria geneettinen koodi | 25 | TGA | UGA | Gly (G) | Ter (*) | |||
Pachysolen tannophilus | 26 | CTG | CUG | Ala (A) | leu (L) | |||
Karyorelictean geneettinen koodi | 27 | TAA | UAA | GLN (Q) | Ter (*) | |||
TAG | UAG | GLN (Q) | Ter (*) | |||||
TGA | UGA | Ter (*) | tai | TRP (W) | Ter (*) | |||
Condylostooman geneettinen koodi | 28 | TAA | UAA | Ter (*) | tai | GLN (Q) | Ter (*) | |
TAG | UAG | Ter (*) | tai | GLN (Q) | Ter (*) | |||
TGA | UGA | Ter (*) | tai | TRP (W) | Ter (*) | |||
Mesodiniumin geneettinen koodi | 29 | TAA | UAA | Tyr (Y) | Ter (*) | |||
TAG | UAG | Tyr (Y) | Ter (*) | |||||
Peritrichian geneettinen koodi | kolmekymmentä | TAA | UAA | Liima (E) | Ter (*) | |||
TAG | UAG | Liima (E) | Ter (*) | |||||
Blastocrithidian geneettinen koodi | 31 | TAA | UAA | Ter (*) | tai | GLN (Q) | Ter (*) | |
TAG | UAG | Ter (*) | tai | GLN (Q) | Ter (*) | |||
TGA | UGA | TRP (W) | Ter (*) |
Monien organismien genomeissa havaitaan ns. kodonipreferenssi, eli kaikkien tiettyä aminohappoa vastaavien synonyymien kodonien esiintymistiheys ei ole sama ja joidenkin kodonien kohdalla se on korkeampi kuin toisten [67] [ 68] . Evoluutioperusta kodonipreferenssin syntymiselle on epäselvä. Yhden hypoteesin mukaan kodonit, jotka mutatoituvat useimmiten, ovat vähemmän yleisiä. Toinen hypoteesi väittää, että kodonien preferenssiä säätelee luonnollinen valinta niiden hyväksi, jotka tarjoavat suurimman tehokkuuden ja tarkkuuden geeniekspressioon [69] [70] . Kodonipreferenssi liittyy vahvasti genomin GC-sisältöön , ja joissain tapauksissa GC-sisältö voi jopa ennustaa kodonin käytön tiheyden [71] . Toiminnallisesta näkökulmasta kodonipreferenssi liittyy translaation tehokkuuteen ja tarkkuuteen ja siten geeniekspression tasoon [72] [73] .
Tällä hetkellä hyväksytyin hypoteesi elämän syntymisestä maapallolla on RNA-maailman hypoteesi . Mikä tahansa malli geneettisen koodin alkuperästä käyttää hypoteesia perustoimintojen siirtymisestä RNA-entsyymeistä ( ribotsyymeistä ) proteiinientsyymeihin. Kuten RNA-maailman hypoteesi ehdottaa, tRNA:t ilmestyivät ennen aminoasyyli-tRNA-syntetaaseja, joten nämä entsyymit eivät voineet vaikuttaa tRNA:iden ominaisuuksiin [74] .
Viimeisen yleisen yhteisen esi -isän (LUCA) geneettinen koodi perustui todennäköisesti DNA:han eikä RNA:han [75] . Geneettinen koodi koostui kolmesta nukleotidikodonista ja kaikkiaan 64 eri kodonia. Koska proteiinien rakentamiseen käytettiin vain 20 aminohappoa , joitain aminohappoja koodasivat useat kodonit [76] [77] [78] [79] .
Jos kodonien ja aminohappojen välinen vastaavuus olisi satunnaista, luonnossa olisi 1,5 × 10 84 geneettistä koodia [80] . Tämä luku saatiin laskemalla tapoja, joilla 21 kohdetta (20 aminohappokodonia ja yksi lopetuskodoni) voitiin lajitella 64 laatikkoon siten, että jokaista kohdetta käytettiin vähintään kerran [81] . Kodonien ja aminohappojen väliset vastaavuudet eivät kuitenkaan ole satunnaisia [82] . Aminohapoilla, joilla on yhteinen biosynteesireitti , on taipumus jakaa ensimmäinen kodonipaikka. Tämä tosiasia voi olla jäännös aikaisemmasta, yksinkertaisemmasta geneettisestä koodista, joka sisälsi vähemmän aminohappoja kuin nykyaikainen ja sisälsi vähitellen kaikki 20 aminohappoa [83] . Aminohappokodonit, joilla on samanlaiset fysikaalis-kemialliset ominaisuudet, ovat myös yleensä samanlaisia, mikä lieventää pistemutaatioiden ja translaatiohäiriöiden vaikutuksia [84] [85] .
Koska geneettinen koodi ei ole satunnainen, uskottavan hypoteesin sen alkuperästä pitäisi selittää sellaisia standardin geneettisen koodin ominaisuuksia kuin D -aminohappojen kodonien puuttuminen, vain 20 aminohapon sisällyttäminen mahdollisesta 64 aminohaposta, kodonien kolmannen aseman synonyymejä substituutioita, kodonien toimintaa lopetuskodoneina UAG, UGA ja UAA [86] . Geneettisen koodin alkuperästä on kolme päähypoteesia. Jokaista niistä edustaa monia malleja, monet mallit ovat hybridejä [87] .
Sanakirjat ja tietosanakirjat | |
---|---|
Bibliografisissa luetteloissa |
|