Ei-koodaava DNA tai roska-DNA ( eng. Non-codeding DNA eng. junk DNA ) - organismien genomisen DNA: n osat, jotka eivät koodaa proteiinisekvenssejä. Osa ei-koodaavasta DNA:sta muunnetaan toiminnallisiksi ei-koodaaviksi RNA-molekyyleiksi. Muita ei-koodaavan DNA:n toimintoja ovat proteiinia, sentromeeriä ja telomeeria koodaavien sekvenssien säätely. Termi "roska-DNA" tuli suosituksi 1960-luvulla. [1] [2] Genomibiologi T. Ryan Gregoryn mukaan ensimmäinen eksplisiittisen keskustelun roska-DNA:n luonteesta käytti David Comings vuonna 1972, ja hän sovelsi termiä kaikkeen ei-koodaaviin DNA:han. [3]Termin virallisti Susumu Ohno vuonna 1972 [4] , joka havaitsi, että neutraalien mutaatioiden geneettinen kuormitus on toimivien lokusten arvojen ylärajalla, joka olisi odotettavissa tyypillisen mutaationopeuden perusteella. Susumu ennusti, että nisäkäsgenomit eivät voi sisältää yli 30 000 lokusta luonnonvalinnan paineen vuoksi, koska mutaatiokuormituksen "kustannus" aiheuttaisi väistämätöntä kunnon heikkenemistä ja lopulta sukupuuttoon. Tämä ennuste pitää paikkansa, ihmisen genomi sisältää noin 20 000 geeniä. Toinen tuki Onon teorialle on havainto, että jopa läheisillä lajeilla voi olla hyvin erilaisia (suuruusluokkia) genomikokoja, mikä nimettiin C-paradoksiksi (genomin redundanssiksi) vuonna 1971. [5]
Vaikka termin "roska-DNA" hedelmällisyys on kyseenalaistettu sillä perusteella, että se herättää a priori oletuksen toiminnan täydellisestä puutteesta, ja vaikka neutraalimpaa termiä, kuten "ei-koodaava DNA" suositellaan; [3] Termi "roska-DNA" on edelleen nimi genomisen sekvenssin sille osalle, jolle ei ole löydetty merkittävää biologista toimintaa ja jossa sekvenssien vertailu ei paljasta konservoituneita elementtejä , jotka osoittaisivat, että se voi antaa mukautumisetua . 1970-luvun lopulla kävi ilmi, että suuri osa ei-koodaavasta DNA:sta suurissa genomeissa oli peräisin lisääntyvistä itsekkäistä liikkuvista elementeistä , joita W. Ford Doolittle ja Carmen Sapienza kuvasivat Naturessa vuonna 1980 : "On osoitettu, että jos tietty DNA tai DNA-luokka, jolla on todistamaton fenotyyppinen ilmentyminen, on kehittänyt strategian (kuten transponoinnin), joka varmistaa sen selviytymisen genomissa, silloin sen olemassaololle ei tarvita muuta selitystä. [6] Voidaan odottaa, että roska-DNA:n määrä riippuu näiden elementtien monistumisnopeudesta ja ei-toiminnallisen DNA:n häviämisnopeudesta. [7] Samassa Nature , Orgel, Lesley Ilizer ja Crick -numerossa Francis kirjoitti, että roska-DNA:lla on "vähän spesifisyyttä ja vähän tai ei ollenkaan selektiivistä etua organismille". [8] Termiä esiintyy ensisijaisesti tietokirjallisissa ja puhekielisissä tieteellisissä julkaisuissa , ja on ehdotettu, että Template:Quantifyn konnotaatiot voivat tukahduttaa mielenkiinnon koodaamattoman DNA:n biologisten toimintojen selvittämiseen. [9]
Useat todisteet osoittavat, että joillakin roska-DNA-sekvensseillä on todennäköisesti meille tuntematonta toiminnallista aktiivisuutta ja että alunperin itsekkään tai ei-toiminnallisen DNA:n fragmenttien eksaptaatioprosessi on ollut yleinen läpi evoluution. [10] Vuonna 2012 ENCODE -projekti, National Human Genome Research Instituten tukema tutkimusohjelma , raportoi, että 76 % ihmisen genomin ei-koodaavasta DNA:sta on transkription alainen ja että noin puolet genomista sitoutuu jotenkin säätelyyn. proteiinit, kuten transkriptiotekijät . [yksitoista]
Aikaisemmin uskottiin, että noin 95 % ihmisen genomin DNA-sekvensseistä voidaan lukea roska-DNA:n ansioksi. Tällaisia sekvenssejä ovat intronisekvenssit ja DNA:n alueet geenien välillä sekä toistuvia alueita. Kuitenkin vuonna 2012 Encyclopedia of DNA Elements (ENCODE) -projektin julkaisuissa osoitettiin, että roska-DNA:n osuus on suuresti yliarvioitu ja jopa 80 %:lla genomista on biokemiallisia toimintoja [12] [13] .
Vaikka ENCODE-viestiä, jonka mukaan yli 80 % ihmisen genomista on biokemiallisesti toimiva, ovat kritisoineet muut tutkijat [14] , jotka väittävät, että genomisekvenssien saatavuus transkriptiotekijöille tai niiden transkriptio ei takaa, että näillä sekvensseillä on biokemiallinen toiminta ja että niiden transkriptio antaa valikoivan edun . Lisäksi merkittävästi alhaisemmat toiminnallisuuspisteet ennen ENCODEa perustuivat nisäkkään genomin säilymispisteisiin. [5] [15] [16] [17]
Vastauksena tähän näkemykseen muut tutkijat väittävät, että laajalle levinnyt transkriptio ja silmukointi, joka havaitaan ihmisen genomissa suoraan biokemiallisissa analyyseissä, ovat tarkempia geneettisen toiminnan indikaattoreita kuin genomin konservatismi, koska konservatiivisuuden arvio on suhteellinen johtuen uskomattomista eroista genomikokoja jopa läheisten sukulajien keskuudessa. [18] [19] Konservatiivisuuspisteitä voidaan käyttää helpottamaan genomin toiminnallisten elementtien etsintää, mutta ei pudotukseen tai säilyttämiseen, kun arvioidaan genomista löytyvien toiminnallisten elementtien kokonaismäärää, koska elementit, jotka tekevät jotain molekyylitasolla voidaan jättää huomiotta.. vertailevan genomiikan menetelmiä. [18] Lisäksi suurin osa tunnetusta roska-DNA:sta osallistuu epigeneettiseen säätelyyn, jota ilmeisesti tarvitaan monimutkaisten organismien kehittymiseen. [20] [19] [21]
Vuoden 2014 paperissa ENCODE-tutkijat yrittivät vastata "kysymykseen, ovatko ei-konservatiiviset mutta biokemiallisesti aktiiviset alueet todella toimivia." He havaitsivat, että kirjallisuudessa genomin toiminnalliset osat on aiemmissa tutkimuksissa määritelty eri tavalla käytetyistä lähestymistavoista riippuen. Ihmisen genomin toiminnallisten osien tunnistamiseen käytetään kolmea yleistä lähestymistapaa: geneettiset menetelmät (perustuvat fenotyyppiseen vaihteluun), evoluutiomenetelmät (perustuvat konservatiivisuuteen) ja biokemialliset menetelmät (perustuvat biokemiallisiin tutkimuksiin ja joita ENCODE käyttää). Kaikilla kolmella menetelmällä on rajoituksensa: geneettiset menetelmät voivat menettää toiminnallisia elementtejä, jotka eivät ilmene fyysisesti organismissa, evoluutiomenetelmillä on vaikeuksia käyttää tarkkoja useiden sekvenssien rinnastuksia, koska jopa läheisesti sukua olevien lajien genomit eroavat toisistaan merkittävästi, ja biokemialliset tutkimukset, vaikka ne ovat erittäin toistettavissa, mutta biokemiallinen signaali ei aina tarkoita automaattisesti toimivuutta. [kahdeksantoista]
He huomasivat, että 70 %:lla transkriptoiduista sekvensseistä oli vähemmän kuin yksi transkriptio solua kohden. He huomauttivat, että "on vaikea tehtävä valita toistettavan mutta alhaisen biokemiallisen signaalin välillä, joka on luontainen suurelle osalle genomia ja jolla on vain vähän evolutionaarista konservatiivisuutta, erityistoimintoa tai biologista kohinaa". Lisäksi määrityksen resoluutio on usein paljon suurempi kuin sen taustalla olevat toiminnalliset aineosat, joten jotkin toistettavissa olevista "biokemiallisesti aktiivisista mutta selektiivisesti neutraaleista" sekvensseistä eivät todennäköisesti suorita merkityksellisiä toimintoja, etenkään ne, joilla on alhainen biokemiallinen signaali. Tähän he lisäsivät: "Työstämme kuitenkin myös merkittäviä rajoituksia nykyisessä rajojen määrittämisessämme, koska jotkut ihmiskohtaiset toiminnot ovat tärkeitä, mutta eivät konservatiivisia ja että taudin kannalta tärkeitä alueita ei tarvitse valikoivasti seuloa toimimaan. "." Toisaalta he väittivät, että 12-15 % toiminnallisesti rajoitetusta ihmisen DNA:sta, joka on arvioitu erilaisilla evolutionaarisilla ekstrapolaatiomenetelmillä, voidaan silti aliarvioida. He päättelivät, että toisin kuin evoluutio- ja geneettiset tiedot, biokemialliset tiedot antavat käsityksen sekä molekyylifunktiosta, jota taustalla olevat DNA-elementit palvelevat, että solutyypeistä, joissa ne toimivat. Viime kädessä geneettisiä, evoluutionaarisia ja biokemiallisia lähestymistapoja voidaan käyttää täydentävinä lähestymistavoina tunnistamaan alueita, jotka voivat toimia ihmisen biologiassa ja sairauksissa. [kahdeksantoista]
Jotkut kriitikot väittävät, että toimivuutta voidaan arvioida vain sopivan nollahypoteesin perusteella . Tässä tapauksessa nollahypoteesi olisi, että nämä genomin osat ovat ei-funktionaalisia ja niillä on ominaisuuksia, perustuivatpa niiden konservatiivisuuteen tai biokemialliseen aktiivisuuteen, joita heiltä odotettaisiin yhteisen käsityksemme perusteella molekyylievoluutiosta ja biokemiasta . Näiden kriitikkojen mukaan, kunnes kyseisellä alueella on osoitettu olevan muita toimintoja kuin mitä nollahypoteesissa odotetaan, se tulisi perinteisesti leimata ei-toiminnalliseksi. [22]
Evoluutioroolista ja "roska"-DNA:n syntymisestä ei ole vieläkään yhtenäistä käsitystä, mutta on olemassa mielipide, että eukaryoottinen ei-koodaava DNA on jäänteitä koodaamattomista DNA-sekvensseistä, jotka syntyivät elämän kehittymisen aikana. Prokaryootit pakotettiin pienentämään genomiensa kokoa vähentääkseen DNA:n määrää, jossa mutaatioita saattoi tapahtua, kun taas eukaryootit "menivät alas" diploidiaan ja säännölliseen seksuaaliseen prosessiin .
On myös vaihtoehtoinen nimi "roska-DNA:lle". Se ei kuitenkaan ole täysin totta, koska "ei-koodaava" DNA sisältää transposoneja , jotka koodaavat proteiineja, joiden toimintaa ei ole vielä vahvistettu, sekä joitain säätelyelementtejä.
Yhden version mukaan koodaamatonta DNA:ta, ainakin osittain, käytetään erityyppisten RNA :iden, nimittäin tRNA :n , rRNA :n , mikroRNA : n , pienen tuma-RNA:n , pienen nukleolaarisen RNA:n , tuotannossa . Kaikki nämä RNA:t osallistuvat solujen ja jopa monisoluisten organismien kriittisiin elämänprosesseihin (katso RNA-häiriöt ).
Genomiikassa ja siihen liittyvissä tieteenaloissa ei-koodaavat DNA-sekvenssit ovat organismin DNA :n osa, joka ei koodaa proteiinisekvenssejä . Jotkut ei-koodaavat DNA-sekvenssit transkriptoidaan toiminnallisiksi ei-koodaaviksi RNA- molekyyleiksi (esimerkiksi tRNA :ksi , rRNA :ksi ja säätely-RNA:ksi ). Muita ei-koodaavan DNA:n toimintoja ovat proteiinia koodaavien sekvenssien, SAR-sekvenssien , replikaation aloituskohtien , sentromeerien ja telomeerien transkription ja translaation säätely .
Koodaamattoman DNA:n määrä vaihtelee huomattavasti lajista toiseen. Kun vain pieni osa genomista on vastuussa proteiinien koodaamisesta, säätelytoimintoja suorittavan genomisen DNA:n prosenttiosuus kasvaa. Jos genomissa on paljon ei-koodaavaa DNA:ta, suurimmalla osalla siitä ei näytä olevan mitään biologista toimintaa organismille, kuten teoriassa ennustettiin 1960-luvulla. Siitä lähtien tätä toimimatonta osaa on usein kutsuttu "roska-DNA:ksi", termi, joka on aiheuttanut paljon vastareaktiota vuosien ajan. [yksitoista]
Kansainvälinen projekti ( ENCODE ) totesi suorilla biokemiallisilla tutkimuksilla, että vähintään 80 prosentilla ihmisen genomisesta DNA:sta on biokemiallista aktiivisuutta. [23] Vaikka tämä ei olekaan täydellinen yllätys, koska aikaisempien tutkimusvuosikymmenten aikana on löydetty monia toiminnallisia ei-koodaavia alueita, [24] [20] jotkut tutkijat ovat kritisoineet johtopäätöstä, että biokemiallinen aktiivisuus liittyy biologiseen toimintaan . [14] [5] [15] [16] [17] Vertailevien genomiikan menetelmien perusteella genomimme biologisesti merkittävän osan osuuden arvioidaan olevan 8-15 %. [25] [18] [26] Toisilla on kuitenkin argumentteja sitä vastaan, että luotetaan pelkästään vertailevan genomiikan arvioihin sen rajoitusten vuoksi, koska ei-koodaavan DNA:n on osoitettu osallistuvan epigeneettisiin prosesseihin ja toisiinsa liittyvien geneettisten vuorovaikutusten kompleksiin. . [20] [18] [19] [21]
Kokonaisgenomisen DNA:n määrä vaihtelee suuresti organismista toiseen, ja myös koodaavan ja ei-koodaavan DNA:n osuus näissä genomeissa vaihtelee suuresti. Esimerkiksi alun perin ajateltiin, että yli 98 % ihmisen genomista ei koodaa proteiinisekvenssejä, mukaan lukien useimmat intronien ja intergeenien sekvenssit [27] , kun taas prokaryoottigenomeille on tyypillistä, että vain 20 % genomi ei koodaa. [24]
Vaikka genomin koko ja ei-koodaavan DNA:n määrän kasvu korreloivat organismin monimutkaisuuden kanssa, on monia poikkeuksia. Esimerkiksi yksisoluisen Polychaos dubiumin (tunnetaan myös nimellä Amoeba dubia ) genomi sisältää yli 200 kertaa enemmän DNA:ta kuin ihmisen. [28] Takifugu rubripes -kalan genomi on vain noin kahdeksasosa ihmisen genomista, mutta sillä näyttää olevan sama määrä geenejä; Noin 90 % Takifugu rubripes -genomista on ei-koodaavaa DNA:ta. [27] Eukaryoottisten lajien ydingenomin koon suuria vaihteluita kutsutaan C-paradoksiksi (genomin redundanssiksi) . [29] Useimmat erot genomin koossa näyttävät johtuvan ei-koodaavasta DNA:sta.
Kasvitutkimus on paljastanut aiemmin merkityksettömänä pidetyn ei-koodaavan DNA:n osan avaintoiminnon ja lisännyt uutta tietoa geenisäätelyn ymmärtämiseen. [kolmekymmentä]
Koodaamattomat RNA:t ovat toiminnallisia RNA -molekyylejä , joita ei transloida proteiineihin. Esimerkkejä ei-koodaavista RNA:ista ovat rRNA , tRNA , piRNA ja mikroRNA .
MikroRNA:iden uskotaan säätelevän noin 30 %:n translaatioaktiivisuutta kaikista nisäkkäiden proteiineja koodaavista geeneistä, ja ne voivat olla elintärkeitä erilaisten sairauksien, mukaan lukien syövän , sydän- ja verisuonitautien sekä immuunivasteen infektioille , kehittämisessä tai hoidossa . [31]
Cis-säätelyelementit ovat sekvenssejä, jotka säätelevät lähellä olevan geenin transkriptiota . Cis-elementit voivat sijaita 5'- tai 3'- kääntämättömällä alueella tai intronien sisällä . Transsäätelyelementit säätelevät geenin transkriptiota pitkiä matkoja.
Promoottorit edistävät tietyn geenin transkriptiota ja sijaitsevat yleensä ylävirtaan koodaavasta alueesta. Tehostajasekvenssit voivat myös vaikuttaa geenin transkription tasoon hyvin suurilla etäisyyksillä. [32]
Intronit ovat geenin ei-koodaavia alueita, jotka transkriptoidaan mRNA:n prekursorisekvensseiksi (pre-mRNA) , mutta ne poistetaan kokonaan silmukoinnin aikana lähetti- RNA :n kypsymisprosessin aikana . Monet intronit ovat liikkuvia geneettisiä elementtejä . [33]
Tetrahymena - alkueläimen tyypin I introneilla tehdyt tutkimukset osoittavat, että jotkut intronit ovat isäntäneutraaleja itsekkäitä transposoituvia elementtejä, koska ne voivat irrota itsensä ympäröivistä eksoneista RNA:n transkription jälkeisen modifikaation aikana eivätkä vaikuta alleelien ja intronien väliseen ilmentymistasojen suhteeseen tai ilman niitä. . [33] Joillakin introneilla näyttää olevan samanlaiset biologiset toiminnot, mahdollisesti siksi, että ne toimivat ribotsyymeinä , jotka voivat säädellä tRNA :n ja rRNA :n aktiivisuutta sekä proteiinia koodaavien geenien ilmentymistä, ilmeisesti organismeissa, jotka ovat tulleet riippuvaisiksi tällaisista introneista pitkän käyttöajan jälkeen. aika; Esimerkiksi kaikissa kasveissa esiintyvä trnL-introni näyttää periytyneen vertikaalisesti useita miljardeja vuosia, mukaan lukien yli miljardi vuotta kloroplasteissa ja vielä 2-3 miljardia vuotta ennen sitä kloroplastien esivanhemmissa syanobakteereissa . [33]
Pseudogeenit ovat DNA-sekvenssejä, jotka ovat samanlaisia kuin tavalliset geenit , jotka ovat menettäneet kykynsä koodata proteiinia tai eivät enää ilmennä solussa. Pseudogeenit syntyvät funktionaalisten geenien retrotranspositiosta tai monistamisesta, ja niistä tulee toimimattomia "fossiilisia geenejä" mutaatioiden vuoksi, jotka estävät geenin transkription , sekä mutaatiot promoottorialueella tai muuttavat kokonaan geenin translaation , kuten stop - kodoni tai kehyssiirto . [34] RNA-välituotteiden retrotranspositiosta johtuvat pseudogeenit tunnetaan typistetyinä pseudogeeneina; Pseudogeenejä, jotka johtuvat monistuneiden geenien jäänteistä tai inaktivoituneista geeneistä, kutsutaan käsittelemättömiksi pseudogeeneiksi. [34]
Vaikka evoluution peruuttamattomuuden laki viittaa siihen, että pseudogeenien toiminnan menettämisen on oltava pysyvää, hiljaiset geenit voivat itse asiassa säilyttää toimintansa useita miljoonia vuosia ja voivat "aktivoitua uudelleen" palauttamalla proteiinia koodaavan sekvenssin [35] ja huomattavan määrän entisiä pseudogeenejä. . aktiivisesti litteroitu. [34] [36] Koska pseudogeenit voivat muuttua odotetusti ilman evoluutiorajoituksia, ne voivat toimia mallina tyypillisille ja toistuville erilaisille spontaaneille geneettisille mutaatioille . [37]
Transposonit ja retrotransposonit ovat liikkuvia geneettisiä elementtejä . Retrotransposonitoistosekvenssit , mukaan lukien pitkät dispergoidut toistot (LINE:t) ja lyhyet dispergoidut toistot (SINE:t), muodostavat suurimman osan genomisesta sekvenssistä monissa lajeissa . Alu-toistot , jotka luokitellaan lyhyiksi hajautetuiksi toistoiksi, ovat yleisin transponoitava elementti ihmisen genomissa. Joitakin esimerkkejä on havaittu siitä, että SINEt vaikuttavat joidenkin proteiinia koodaavien geenien transkription säätelyyn. [38] [39] [40]
Endogeeniset retrovirussekvenssit ovat tuotteita retrovirusgenomien käänteistranskriptiosta ja niiden liittämisestä ituradan solujen genomiin . Mutaatiot näissä käänteistranskriptoiduissa sekvensseissä voivat inaktivoida virusgenomin. [41]
Yli 8 % ihmisen genomista on peräisin (enimmäkseen rappeutuneista) endogeenisistä retrovirussekvensseistä, joista yli 42 % on tunnistettavissa retrotransposoneista, kun taas loput 3 % voidaan tunnistaa transposoni-DNA :n jäännöksiksi . Suurimman osan jäljellä olevasta genomista, jolla ei ole tällä hetkellä selvää alkuperää, uskotaan olevan peräisin transponoitavista elementeistä, jotka olivat aktiivisia hyvin monta vuotta sitten (> 200 miljoonaa vuotta), mutta satunnaiset mutaatiot tekivät niistä tunnistamattomia. [42] Genomikoon erot ainakin kahdessa kasvilajissa johtuvat pääasiassa eroista niiden retrotransposonisekvenssien sisällössä. [43] [44]
Telomeerit ovat toistuvan DNA:n alueita kromosomien päissä, jotka suojaavat niitä lyhentymiseltä DNA:n replikaation aikana .
On olemassa mielipide, että suuren koodaamattoman DNA-määrän läsnäolo on stabiloinut genomia mutaatioiden suhteen (aktiiviseen geeniin "iskun" esiintymistiheys on laskenut). Tämä oli ehto monisoluisten organismien syntymiselle [45] .
Monilla ei-koodaavilla DNA-sekvensseillä on tärkeitä biologisia toimintoja, kuten vertailevat genomiikkatutkimukset osoittavat , ja ne raportoivat joistakin ei-koodaavista DNA-alueista, jotka ovat erittäin konservoituneita ( englanniksi . Conserved non-coding sequence ), joskus satojen miljoonien vuosien mittakaavassa. , mikä tarkoittaa, että nämä ei-koodaavat alueet ovat voimakkaan evoluutiopaineen ja positiivisen valinnan alaisia . [46] Esimerkiksi ihmisen ja hiiren genomissa , joka erosi yhteisestä esi -isästä 65-75 miljoonaa vuotta sitten, proteiinia koodaavat DNA-sekvenssit muodostavat vain noin 20 % konservoituneesta DNA:sta ja loput 80 % konservoituneesta DNA:sta. ei-koodaavilla alueilla. [47] Yhdistetty perinnöllisyys paljastaa usein tautiin liittyviä kromosomien alueita, joilta puuttuu koodaavien geenien toiminnallisia variantteja alueella, mikä osoittaa, että sairautta aiheuttavat sekvenssimuunnokset sijaitsevat ei-koodaavassa DNA:ssa. [47] Mutaatioiden merkitystä koodaamattomassa DNA:ssa tutkittiin huhtikuussa 2013. [48]
Ei-koodaavan sekvenssin geneettisen polymorfismin on myös osoitettu vaikuttavan herkkyyteen tartuntataudeille, kuten hepatiitti C:lle. [49] Lisäksi ei-koodaavan sekvenssin geneettisen polymorfismin on osoitettu myötävaikuttavan alttiuteen Ewingin sarkoomaan , joka on erittäin aggressiivinen tauti. lapsuuden luusyöpä. [viisikymmentä]
Jotkut spesifiset ei-koodaavat DNA-sekvenssit voivat olla erityisen tärkeitä kromosomirakenteen, sentromeeritoiminnan ja homologisten kromosomien tunnistamisen ylläpitämiseksi meioosissa . [51]
Yli 300 prokaryoottista ja yli 30 eukaryoottista genomia koskevan vertailevan tutkimuksen mukaan [ 52] eukaryootit näyttävät tarvitsevan vähintään minimaalisen määrän ei-koodaavaa DNA:ta. Tämä minimi voidaan ennustaa käyttämällä säätelygeneettisten verkostojen kasvumallia, mikä tarkoittaa, että se on tarpeen sääntelytarkoituksiin. Ihmisillä ennustettu vähimmäismäärä on noin 5 % koko genomista.
On näyttöä siitä, että merkittävä osa (yli 10 %) 32 nisäkkään genomista voi toimia spesifisten sekundaaristen RNA-rakenteiden muodostumisen kautta. [53] Tutkimuksessa käytettiin vertailevia genomiikan tekniikoita kompensoivien DNA-mutaatioiden tunnistamiseksi, jotka säilyttävät RNA-kaksoistumisen, joka on RNA -molekyylien tunnusmerkki . Yli 80 % genomin alueista, jotka tarjoavat evoluutionaalista näyttöä RNA-rakenteen säilymisestä, eivät tarjoa luotettavaa DNA-rakenteen säilymistä.
Ei-koodaava DNA erottaa geenejä pitkillä aikaväleillä niin, että mutaatio yhdessä geenissä tai kromosomin alueella, kuten deleetio tai insertio, ei johda " kehyssiirtymämutaatioihin " koko kromosomissa. Kun genomin monimutkaisuus on suhteellisen korkea, kuten ihmisen genomin, ei vain yksittäisiä geenejä, vaan myös yksittäisiä geenin osia erottavat ei-koodaavat alueet - intronit , jotka suojaavat geenin koko koodittavaa sekvenssiä ja minimoivat geenin aiheuttamat muutokset. mutaatio.
On ehdotettu, että ei-koodaava DNA voi vähentää geenivaurion todennäköisyyttä kromosomien risteytyksen aikana . [54]
Jotkut ei-koodaavat DNA-sekvenssit toimivat geneettisinä "kytkiminä", jotka määrittävät missä ja milloin geenit ilmentyvät. [55] Esimerkiksi pitkän ei-koodaavan RNA- molekyylin ( lncRNA ) on osoitettu auttavan estämään rintasyövän kehittymistä estämällä geneettistä kytkintä tarttumasta kiinni. [56]
Jotkut ei-koodaavat DNA-sekvenssit määrittävät eri geenien ilmentymistason. [57]
Jotkut ei-koodaavat DNA-sekvenssit, jotka määrittävät transkriptiotekijöiden sitoutumiskohdan. [57] Transkriptiotekijät ovat proteiineja, jotka sitoutuvat tiettyihin ei-koodaaviin DNA-sekvensseihin ohjaten siten geneettisen tiedon siirtoa (tai transkriptiota) DNA:sta mRNA:han. Transkriptiotekijät toimivat täysin eri paikoissa genomissa eri ihmisillä.
OperaattoritOperaattori on DNA:n osa, johon repressorit sitoutuvat . Repressorit ovat DNA:ta sitovia proteiineja, jotka säätelevät yhden tai useamman geenin ilmentymistä sitoutumalla operaattoriin ja estämällä RNA-polymeraasin kiinnittymisen promoottoriin, mikä estää geenin transkription. Tätä geeniekspression estämistä kutsutaan tukahduttamiseksi.
TehosteetTehostaja on DNA:n alue, joka voi sitoutua proteiineihin ( trans-toimiviin tekijöihin ), yleensä joukkoon transkriptiotekijöitä, mikä lisää geenien transkription tasoa geeniklusterissa.
ÄänenvaimentimetÄänenvaimennin on DNA-jakso, joka inaktivoi geenin ilmentymisen, kun säätelyproteiinit sitoutuvat siihen. Sen toiminta on hyvin samanlainen kuin tehostajan, mutta sillä erolla, että se inaktivoi geenin.
PromoottoritPromoottori on DNA:n osa, joka varmistaa tietyn geenin transkription. Promoottori sijaitsee yleensä lähellä geeniä, jonka transkriptio säätelee.
EristimetGeneettinen eriste on demarkaatioelementti, jolla on kaksi erillistä roolia geenin ilmentymisessä, joista ensimmäinen on tehostajan vaikutuksen estäminen, mutta useimmiten se on este kromatiinin kondensaatioprosessin etenemiselle viereisille alueille. DNA-sekvenssissä oleva eriste on verrattavissa kielitieteen sanaerottimeen , kuten pilkkuun (,) lauseessa, koska eriste osoittaa, missä ovat aktivoitujen tai repressoituneiden sekvenssien rajat.
Ilmeisesti ei-koodaavan DNA:n yhteiset sekvenssit ovat pääasiallinen todiste syntyperästä yhteisestä esi -isästä . [58]
Pseudogeenisekvenssit näyttävät keräävän mutaatioita nopeammin kuin koodaavat sekvenssit luonnollisen valinnan selektiivisen paineen menettämisen vuoksi. [37] Tämän avulla voit luoda mutanttialleeleja, joilla on uusia toimintoja ja jotka voidaan poimia luonnollisella valinnalla; näin ollen pseudogeenit voivat toimia evoluution materiaalina ja niitä voidaan pitää "protogeeneina". [59]
Tilastollisesti merkitsevä ero koodaavien ja ei-koodaavien DNA-sekvenssien välillä osoitettiin. On havaittu, että DNA:n ei-koodaavan DNA-sekvenssin nukleotidit osoittavat pitkän mittakaavan teholakikorrelaation, kun taas koodaavilla sekvensseillä ei ole. [60] [61] [62]
Poliisi ottaa joskus DNA-näytteitä todisteena tunnistamista varten . Kuten on kuvattu julkaisussa Maryland v. King , 2013 Yhdysvaltain korkeimman oikeuden päätös: [63]
Nykyinen oikeuslääketieteellisen DNA-pohjaisen tunnistamisen standardi perustuu kaikkien ihmissolujen ytimissä olevien kromosomien analyysiin. "Kromosomien DNA-materiaali koostuu "koodaavista" ja "ei-koodaavista" alueista. Koodaavat alueet tunnetaan geeneinä ja sisältävät tiedot, joita solu tarvitsee proteiinien valmistamiseksi. . . . Alueet, jotka eivät koodaa proteiineja. . . eivät liity suoraan proteiinien tuotantoon, [ja] ne on luokiteltu "roska-DNA:ksi". Adjektiivi "roska" voi johtaa maallikon harhaan, koska itse asiassa tätä DNA:n osaa käytetään lähes ehdottoman tarkkaan henkilön tunnistamiseen.
Patrushev L.I. Geenien ilmentyminen. - M .: Nauka, 2000. - 830 s. — ISBN 5-02-001890-2 .
Bennett, Michael D.; Leitch, Ilia J. Genomin koon kehitys kasveissa // Genomin kehitys / Gregory, T. Ryan. - San Diego: Elsevier , 2005. - S. 89-162. - ISBN 978-0-08-047052-8 . Gregory, TR Genomin koon kehitys eläimissä // Genomin kehitys / TR Gregory (toim.). - San Diego: Elsevier , 2005. - ISBN 0-12-301463-8 . Shabalina SA, Spiridonov NA; Spiridonov. Nisäkkään transkripti ja ei-koodaavien DNA-sekvenssien toiminta (englanniksi) // Genome Biol. : päiväkirja. - 2004. - Voi. 5 , ei. 4 . - s. 105 . - doi : 10.1186/gb-2004-5-4-105 . — PMID 15059247 . Castillo-Davis CI Koodaamattoman DNA:n kehitys: kuinka paljon roskaa, kuinka paljon funktiota? (englanti) // Trends Genet. : päiväkirja. - 2005. - lokakuu ( osa 21 , nro 10 ). - s. 533-536 . - doi : 10.1016/j.tig.2005.08.001 . — PMID 16098630 .Sanakirjat ja tietosanakirjat |
---|