DNA-elementtien tietosanakirja

Kokeneet kirjoittajat eivät ole vielä tarkistaneet sivun nykyistä versiota, ja se voi poiketa merkittävästi 10. helmikuuta 2017 tarkistetusta versiosta . tarkastukset vaativat 17 muokkausta .
KOODAA
Sisältö
Kuvaus Koko genomitietokanta
Yhteystiedot
Tutkimuskeskus Kalifornian yliopisto Santa Cruz
Laboratorio Biomolekyylitieteen ja tekniikan keskus
Kirjailijat Brian J Raney [1]
Alkuperäinen julkaisu PMID 21037257
Julkaisupäivä 2010
Saatavuus
Verkkosivusto encodeproject.org

Encyclopedia of DNA Elements ( ENCODE  ) on syyskuussa 2003 perustettu kansainvälinen tutkimuskonsortio . Järjestäjä ja rahoittaja US National Human Genome Research Institute ( NHGRI ) [1] [2] [3] . Human Genome Projectin jatkoksi suunniteltu ENCODE pyrkii suorittamaan täydellisen analyysin ihmisen genomin toiminnallisista elementeistä . Kaikki hankkeen toteuttamisen aikana saadut tulokset julkaistaan ​​julkisissa tietokantoissa .  

5. syyskuuta 2012 hankkeen ensimmäiset tulokset julkaistiin 30 toisiinsa liittyvänä julkaisuna Nature- , Genome Biology ja Genome Research -lehtien verkkosivuilla [4] [ 5] . Nämä julkaisut osoittavat, että vähintään 80 % ihmisen genomista on biologisesti aktiivista, ja siihen asti hallitsi käsitys, että suurin osa DNA:sta oli " roskaa ". Monet tutkijat kuitenkin arvostelevat tällaisia ​​hätiköityjä johtopäätöksiä, jotka osoittavat, että näiden elementtien toimivuudesta ei ole riittävästi todisteita [6] .

Relevanssi

Ihmisen genomin arvioidaan sisältävän 20 000 proteiinia koodaavaa geeniä (yhdessä ne muodostavat eksomin ), ja ne muodostavat vain noin 1,5 % ihmisen genomin DNA :sta. ENCODE-projektin ensisijainen tavoite on selvittää muun genomin toiminta, josta suurinta osaa on perinteisesti pidetty " roskakuorena " (esimerkiksi transkriptiomaton DNA ).

Noin 90 % ihmisen genomin yhden nukleotidin polymorfismista (jotka on osoitettu liittyvän erilaisiin sairauksiin genominlaajuisilla assosiaatiotutkimuksilla ) löytyy proteiinia koodaavien alueiden ulkopuolelta. [7]

Proteiinia koodaavien geenien aktiivisuutta ja ilmentymistä voidaan säädellä regulomeilla - DNA:n eri elementeillä, kuten promoottorilla , säätelysekvensseillä ja kromatiinialueilla , sekä histonimodifikaatioilla . Uskotaan, että muutokset säätelyalueilla voivat häiritä proteiinien ilmentymistä ja solujen toimintaa ja siten johtaa sairauksiin ( ENCODE Project Background ). Määrittämällä säätelyelementtien sijaintia ja niiden vaikutusta transkriptioon voidaan selvittää tiettyjen geenien ilmentymistasojen muutosten ja sairauksien kehittymisen välinen yhteys. [kahdeksan]

ENCODE on tarkoitettu kattavaksi resurssiksi, jonka avulla tiedeyhteisö ymmärtää paremmin, miten genomi voi vaikuttaa ihmisten terveyteen ja edistää uusien sairauksien ehkäisy- ja hoitomenetelmien kehittämistä. [9]

Toistaiseksi projekti auttaa löytämään uusia DNA:n säätelyelementtejä, tarjoamalla uusia näkemyksiä geeniemme ja genomiemme organisoinnista ja säätelystä sekä siitä, miten DNA-sekvenssin muutokset voivat vaikuttaa sairauksien kehittymiseen. [7] Yksi projektin tärkeimmistä tuloksista on kuvaus, jonka mukaan 80 % ihmisen genomista on osoitettu liittyvän ainakin yhteen biokemialliseen toimintoon. [10] [11] Suurin osa tästä ei-koodaavasta DNA:sta on mukana koodaavien geenien ilmentymisen säätelyssä. [10] Lisäksi kunkin koodaavan geenin ilmentymistä säätelevät useat säätelyalueet, jotka sijaitsevat sekä lähellä geeniä että etäällä siitä. Nämä tulokset osoittavat, että geenisäätely on paljon monimutkaisempaa kuin aiemmin luultiin. [12]

Projekti ENCODE

ENCODE-projekti toteutetaan kolmessa vaiheessa: alkuvaihe, teknologian kehitysvaihe ja tuotantovaihe.

Alkuvaiheessa ENCODE-konsortio arvioi strategioita erityyppisten genomielementtien tunnistamiseksi . Alkuvaiheen tavoitteena oli määritellä menetelmäsarja, joka yhdessä mahdollistaisi ihmisen genomin laajojen alueiden tarkan ja yksityiskohtaisen karakterisoinnin , ottaen huomioon prosessin taloudellisen kannattavuuden ja korkean tehokkuuden. Alkuvaiheessa oli tunnistettava puutteita työkalusarjassa funktionaalisten sekvenssien määrittämiseksi sekä osoittaa, havaittiinko jokin käytetyistä menetelmistä tehottomaksi tai sopimattomaksi skaalaamiseen. Osa näistä ongelmista jouduttiin ratkaisemaan ENCODE-teknologian kehitysvaiheessa (samanaikaisesti hankkeen alkuvaiheen kanssa), jonka tavoitteena oli kehittää uusia laboratorio- ja laskennallisia menetelmiä, jotka parantaisivat tunnettujen funktionaalisten sekvenssien tunnistamista tai uusien tutkimusta. genomin toiminnalliset elementit. Kahden ensimmäisen vaiheen tulos, käyttäen esimerkkiä, jossa tutkittiin 1 % ihmisen genomista, määritti parhaan tavan analysoida loput 99 % mahdollisimman tehokkaasti ja alhaisin kustannuksin tuotantovaiheen aikana. [9]

ENCODE-projektin I vaihe: alkuvaihe

Pilottivaiheessa tutkittiin ja vertailtiin olemassa olevia menetelmiä ihmisen genomisekvenssin tietyn osan perusteellista analysointia varten. Se järjestettiin avoimeksi konsortioksi, ja se kokosi yhteen tutkijoita erilaisista taustoista ja taustoista arvioimaan kunkin tekniikan, teknologian ja strategian ansioita monipuolisesta ryhmästä. Samalla hankkeen teknologian kehitysvaiheen tavoitteena oli kehittää uusia, erittäin tehokkaita menetelmiä toiminnallisten elementtien määrittämiseen. Tämän työn tavoitteena oli määrittää joukko lähestymistapoja, jotka mahdollistaisivat kaikkien ihmisen genomin toiminnallisten elementtien tarkimman määrittämisen. Alkuvaiheessa selvitettiin eri menetelmien kyky skaalata koko ihmisen genomin analysoimiseksi ja tunnistettiin aukkoja genomisekvenssin toiminnallisten elementtien määrittelyssä.

Projektin alkuvaihe tapahtui tiiviissä yhteistyössä kokeilijoiden ja teoreetikkojen välillä, mikä mahdollisti useiden menetelmien arvioinnin ihmisen genomin annotointiin. Projektin alkuvaiheen kohteeksi valittiin joukko alueita, jotka edustavat noin 1 % (30 Mb) ihmisen genomista, ja kaikki hankkeen pilottivaiheen osallistujat analysoivat sen. Kaikki ENCODEn osallistujien näitä alueita koskevat tiedot julkaistiin nopeasti julkisiin tietokantoihin. [13] [14]

Vaiheen I tulokset [13]
  • Ihmisen genomi transkriptoidaan kaikkialla, joten useimmat sen emäkset liittyvät vähintään yhteen primääriseen transkriptiin, ja monet transkriptit yhdistävät distaalisia alueita spesifisiin proteiinia koodaaviin lokuksiin.
  • Lukuisia uusia ei-proteiinia koodaavia transkriptejä on tunnistettu, joista monet menevät päällekkäin proteiinia koodaavien lokusten ja muiden lokusten kanssa, jotka sijaitsevat genomin alueilla, joita aiemmin pidettiin transkriptionaalisesti hiljaisina.
  • On tunnistettu lukuisia aiemmin tunnistamattomia transkription aloituskohtia, joista monilla on kromatiinirakenne ja proteiinisekvenssispesifiset sitoutumisominaisuudet, jotka ovat samanlaisia ​​kuin hyvin karakterisoidut promoottorit.
  • Transkription aloituskohtia ympäröivät säätelysekvenssit ovat jakautuneet symmetrisesti ilman siirtymää päällekkäin oleville alueille.
  • Kromatiinin saatavuus ja histonin modifikaatiomallit ennustavat erittäin hyvin sekä transkription aloituskohtien läsnäoloa että aktiivisuutta.
  • Distaalisilla yliherkkäillä DNaseI-kohdilla on tyypillisiä histonien modifikaatiokuvioita, jotka erottavat ne luotettavasti promoottorista.
  • DNA:n replikaatioaika korreloi kromatiinin rakenteen kanssa.
  • Kaiken kaikkiaan 5 % genomin emäksistä voidaan varmuudella tunnistaa olevan evoluution rajoitusten alaisia ​​nisäkkäissä; noin 60 %:lla näistä rajoitetuista emäksistä on näyttöä toimivuudesta tähän mennessä tehtyjen kokeellisten analyysien perusteella.
  • Erilaiset toiminnalliset elementit vaihtelevat suuresti sekvenssivaihtelultaan ihmispopulaatiossa ja todennäköisyydessään olla genomin rakenteellisesti vaihtelevalla alueella.
  • Yllättäen monet toiminnalliset elementit eivät näytä rajoittuvan nisäkkäiden evoluutioon. Tämä viittaa mahdollisuuteen suurella määrällä neutraaleja alkuaineita, jotka ovat biokemiallisesti aktiivisia, mutta jotka eivät tuota paljon hyötyä keholle. Tämä allas voi toimia "varastona" luonnolliselle valinnalle, joka mahdollisesti toimii sukulinjaspesifisten elementtien ja toiminnallisesti säilyneiden mutta ei-ortologisten elementtien lähteenä lajien välillä.

ENCODE-projektin vaihe II: tuotantovaihe

Syyskuussa 2007 aloitettiin ENCODE-projektin tuotantovaiheen rahoitus. Tässä vaiheessa tavoitteena oli analysoida koko genomi ja tehdä "lisätutkimuksia teollisissa olosuhteissa." [15]

Tuotantovaiheen työ organisoitiin kuten alkuvaiheessakin avoimena konsortiona. Lokakuussa 2007 National Institute for Human Genome Research myönsi sille yhteensä yli 80 miljoonan dollarin apurahat neljäksi vuodeksi. [16] Tuotantovaiheen aikana hankkeeseen kuuluivat Data Coordination Center, Data Analysis Center ja Technology Development Center. [17] Tällä hetkellä projekti muuttuu todella massiiviseksi hankkeeksi, jossa on mukana 440 tiedemiestä 32 laboratoriosta ympäri maailmaa. Vuonna 2007, kun alkuvaihe valmistui, projekti nosti kapasiteettia suurelta osin seuraavan sukupolven sekvensoinnin ansiosta . Todellakin, paljon dataa käsiteltiin, tutkijat saivat noin 15 teratavua raakatietoa.

Vuoteen 2010 mennessä ENCODE-projekti oli vastaanottanut yli 1000 genominlaajuista aineistoa. Yhdessä nämä tiedot osoittavat, mitkä alueet näyttävät säätelevän tietyissä solutyypeissä käytettyjen geenien ilmentymistä ja mitkä alueet ovat vuorovaikutuksessa suuren joukon proteiineja kanssa. Projekti tarjoaa tietoa transkriptiokohdista, niihin liittyvistä transkriptiotekijöistä, kromatiinin rakenteesta ja histonien modifikaatioista.

Vaiheen II tulokset [18]
  • Suurin osa (80,4 %) ihmisen genomista liittyy vähintään yhteen RNA:han ja/tai kromatiiniin liittyvään biokemialliseen tapahtumaan ainakin yhdessä solutyypissä. Suurin osa genomista sijaitsee lähellä säätelytapahtumia: 95 % genomista on 8 kiloemäksen sisällä DNA-proteiini-vuorovaikutuksesta (mitattuna ChIP-seq-motiivianalyysillä tai DNaasi I -sitoutumisella), ja 99 % on 1,7 kiloemäksen sisällä vähintään yksi ENCODEn esittämistä biokemiallisista tapahtumista.
  • Genomin luokittelu seitsemään kromatiinitilaan viittaa alkuperäiseen joukkoon, jossa on 399 124 aluetta, joilla on tehostajakaltaisia ​​ominaisuuksia, ja 70 292 aluetta, joilla on promoottorin kaltaiset ominaisuudet, sekä satoja tuhansia ei-liikkuvia alueita. Korkean resoluution analyysi jakaa genomin edelleen tuhansiin kapeisiin tiloihin, joilla on erilaiset toiminnalliset ominaisuudet.
  • RNA-sekvenssin muodostus ja prosessointi voidaan korreloida kvantitatiivisesti sekä kromatiinimerkkien että transkriptiotekijän (TF) sitoutumisen kanssa promoottorissa, mikä osoittaa, että promoottorin toiminnallisuus voi selittää suuren osan RNA-ilmentymisen vaihtelusta.
  • Monet yksittäisten genomisekvenssien ei-koodaavat variantit sijaitsevat ENCODE-annotoiduilla toiminnallisilla alueilla; tämä luku on vähintään yhtä suuri kuin ne, jotka sisältyvät proteiineja koodaaviin geeneihin.
  • GWAS:n aiheuttamaan sairauteen liittyvät SNP:t ovat rikastuneet ei-koodaavilla toiminnallisilla elementeillä, joista useimmat löytyvät tietyiltä ENCODE-määritetyiltä alueilta tai niiden läheltä proteiinia koodaavien geenien ulkopuolella. Monissa tapauksissa sairauden fenotyypit voivat liittyä tiettyyn solutyyppiin tai transkriptiotekijään.
  • ENCODE-konsortio

ENCODE-konsortio koostuu pääasiassa tutkijoista, joita sponsoroi Yhdysvaltain kansallinen ihmisgenomitutkimuslaitos . Muut hankkeen osallistujat ovat konsortion tai analyyttisen työryhmän jäseniä.

Hankkeen alkuvaihe koostui kahdeksasta opintoryhmästä ja kahdestatoista ryhmästä, jotka osallistuivat ENCODE-projektin teknologian kehitysvaiheeseen ( ENCODE Pilot Project: Participants and Projects ). Vuoden 2007 loppuun mennessä, jolloin hankkeen pilottivaihe virallisesti päättyi, osallistujamäärä oli kasvanut 440 tutkijaan 32 laboratoriosta ympäri maailmaa. Tällä hetkellä konsortio koostuu useista keskuksista, jotka suorittavat erilaisia ​​tehtäviä ( ENCODE Participants and Projects ):

  1. Tuotantokeskukset (ENCODE-tuotantokeskukset)
  2. Tietojen koordinointikeskus (ENCODE Data Coordination Center)
  3. Tietojen analysointikeskus (ENCODE Data Analysis Center)
  4. Tulosten laskennallinen analyysi (ENCODE Computational Analysis Awards)
  5. Teknologinen kehitys (ENCODE Technology Development Effort)

Esitetyt tiedot

Vuodesta 2007 lähtien ENCODE-projektin osallistujat ovat tehneet lukuisia erilaisiin biologisiin sekvensseihin perustuvia tutkimuksia kartoittaakseen ihmisen genomin toiminnallisia elementtejä [19] . Kartoitettuja elementtejä (ja käytettyjä lähestymistapoja) ovat RNA:n transkriptioalueet (RNA-seq, CAGE, RNA-PET ja manuaalinen annotaatio), proteiinia koodaavat alueet (massaspektrometria), transkriptiotekijän sitoutumiskohdat (ChIP-seq ja DNase-seq), kromatiinin rakenne (DNaasi-seq, FAIRE-seq, histoni ChIP-seq ja MNase-seq) ja DNA:n metylaatiokohdat (RRBS-analyysi). Alla on yksityiskohtainen kuvaus tiedoista, joita hankkeen osallistujat ovat saaneet vuosien aikana ja esitelty projektin verkkosivuilla.

Transkriptoidut ja proteiinia koodaavat alueet

Projektissa käytettiin manuaalista ja automaattista merkintää luomaan kattava luettelo ihmisen proteiineja koodaavista ja ei-koodaavista RNA:ista ja pseudogeeneistä, nimeltään GENCODE. [20] [21] Luettelossa on 20 687 proteiinia koodaavaa geeniä, joista keskimäärin 6,3 vaihtoehtoisesti silmukoitunut per lokus.

Lisäksi 8801 automaattisesti luotua pientä RNA:ta ja 9640 manuaalisesti kuratoitua pitkää ei-koodaavaa RNA:ta (lncRNA:ta) merkittiin annotaatioiksi. LncRNA:iden vertailu muihin ENCODE-tietoihin osoittaa, että lncRNA:t syntyvät samanlaisen reitin kautta kuin proteiinia koodaavat geenit. [22] GENCODE-projekti merkitsi myös huomautuksia 11 224 pseudogeenistä, joista 863 on transkriptoitua ja yhdistetty aktiiviseen kromatiiniin. [23]

RNA

  • RNA:t sekvensoitiin 16 eri solulinjasta ja useista subsellulaarisista fraktioista laajan luettelon kehittämiseksi RNA-ilmentymisestä. Olettaen, että RNA-aktiivisuuden alueiden tunnistamiseen käytetään konservatiivista kynnystä, 62 % genomista emäksistä on toistettavasti edustettuina sekvensoiduissa pitkissä (> 200 nukleotidia) RNA-molekyylissä tai GENCODE-eksoneissa.
  • CAGE-seq (5' cap -kohde-RNA:n eristäminen ja sekvensointi) -menetelmää käytettiin tunnistamaan 62 403 transkription aloituskohtaa (TSS) suurella varmuudella (IDR 0,01).
  • Lopuksi havaittiin merkittävä osa koodaavista ja ei-koodaavista transkripteistä, jotka prosessoitiin pysyviksi stabiileiksi RNA:iksi, jotka olivat lyhyempiä kuin 200 nukleotidia. Näitä esiasteita ovat siirto-RNA, miRNA , pieni tuma-RNA ja pieni nukleolaarinen RNA ( tRNA , miRNA , snRNA ja snoRNA, vastaavasti)

Proteiinia sitovat kohdat

Sääntelyalueiden tunnistamiseksi suoraan projektin osallistujat kartoittivat 119 erilaisen DNA:ta sitovan proteiinin ja useiden RNA-polymeraasikomponenttien sitoutumiskohdat 72 solutyypissä ChIP-seq:n avulla. [24] Jokainen sitoutumiskohta tutkittiin tunnettujen DNA:ta sitovien motiivien rikastumisen ja uusien motiivien läsnäolon varalta.

Genomin alueet, jotka ovat yliherkkiä DNaasi I:lle

Kromatiinin saatavuus, jolle on tunnusomaista DNaasi I -yliherkkyys, on DNA:n säätelyalueiden tunnusmerkki. [25] [26] Projektin osallistujat kartoittivat 2,89 miljoonaa ainutlaatuista, ei-päällekkäistä DNaasi I -yliherkkyyskohtaa (DHS) käyttämällä DNase-seq:iä 125 solutyypissä.

Histonin muokkauspaikat

12 histonimuunnelman kromosomipaikat 46 solutyypissä analysoitiin. Saadut tiedot osoittavat, että globaalit modifikaatiomallit vaihtelevat suuresti eri solutyypeillä transkriptioaktiivisuuden muutosten mukaisesti. On havaittu, että erilaisten histonien modifikaatiotietojen integrointia voidaan käyttää systemaattisesti funktionaalisten attribuuttien osoittamiseen genomialueille. [27]

DNA metylaatio

Sytosiinin metylaatio (yleensä CpG-dinukleotideissa) liittyy geeniekspression epigeneettiseen säätelyyn. Promoottorimetylaatio liittyy usein repressioon, kun taas geenimetylaatio korreloi transkription aktiivisuuden kanssa. [28] Projektin osallistujat käyttivät Restricted Genomic Loci Set Bisulfite Sequencing (RRBS) -menetelmää DNA:n metylaation kvantitatiiviseen profilointiin keskimäärin 1,2 miljoonalla CpG:llä kussakin 82 solulinjassa ja kudoksessa, mukaan lukien CpG:t proksimaalisten promoottorien ja alueiden välisillä geenialueilla. geeni (geenikappaleet). [29]

Kromosomivuorovaikutuspaikat

Fyysisiä vuorovaikutuksia kromosomien yksittäisten alueiden välillä, jotka voidaan erottaa toisistaan ​​sadoilla kiloemäksillä, pidetään tärkeänä geenin ilmentymisen säätelyssä 46. 5C-menetelmä on paljastanut pitkän kantaman vuorovaikutuksia transkription aloituskohtien (TSS) kanssa kohdealueella 1 %. genomi (44 ENCODE-pilottialuetta) neljässä solutyypissä (GM12878, K562, HeLa-S3 ja H1 hESC) 49. Jokaisesta solutyypistä löydettiin satoja tilastollisesti merkittäviä pitkän kantaman vuorovaikutuksia kromatiinipolymeerin käyttäytymisen ja kokeellisen vaihtelun huomioimisen jälkeen. Vuorovaikutteisten lokusten parit osoittivat vahvan korrelaation TSS-geenin ilmentymisen tason ja tiettyjen toiminnallisten elementtiluokkien, kuten tehostajien , läsnäolon välillä . TSS:n kanssa vuorovaikutuksessa olevien distaalisten elementtien keskimääräinen lukumäärä oli 3,9 ja distaalisen elementin kanssa vuorovaikutuksessa olevien TSS:n keskimääräinen lukumäärä oli 2,5, mikä viittaa toisiinsa yhdistetyn kromatiinin monimutkaiseen verkostoon. Tämä toisiinsa kietoutunut "pitkän kantaman" arkkitehtuuri on myös paljastettu koko genomissa kromatiinivuorovaikutusanalyysillä, jossa on parillinen päätemerkkisekvensointi ( ChIA-PET ), jota käytetään havaitsemaan vuorovaikutuksia RNA-polymeraasi II:lla (Pol II) rikastetussa kromatiinissa viidessä solutyypissä. [kolmekymmentä]

Kritiikki

Huolimatta konsortion väitteistä, että ENCODE-projekti ei ole kaukana ohi, palaute jo julkaistuihin artikkeleihin ja lehdistötiedotteisiin on ollut myönteistä. Nature -lehden toimittajat ja ENCODE-projektin kirjoittajat kirjoittavat: "... olemme tehneet yhteistyötä useiden kuukausien ajan tehdäksemme suurimman mahdollisen roiskeen, joka kiinnittää paitsi tiedeyhteisön myös suuren yleisön huomion" ("... tehnyt yhteistyötä useiden kuukausien ajan tehdäkseen suurimman mahdollisen vaikutuksen ja kiinnittääkseen paitsi tutkimusyhteisön myös suuren yleisön huomion"). [31] ENCODE-projektin esittämä väite, jonka mukaan 80 prosentilla ihmisen genomista on biokemiallinen tehtävä [10] , otettiin nopeasti esille populaaritieteellisissä julkaisuissa, joissa luonnehdittiin hankkeen tulosten aiheuttavan "roska"-DNA: n kuolemaa. . [32] [33]

Johtopäätöstä, jonka mukaan suurin osa genomista on "toiminnallinen", on kuitenkin kritisoitu sillä perusteella, että ENCODE-projekti määrittelee "toiminnallisuuden" liian laajasti, eli että kaikella, mitä soluun transkriptoidaan, on funktio. Tämä johtopäätös tehtiin huolimatta yleisesti hyväksytystä näkemyksestä, jonka mukaan monet transkriptoidut DNA:n elementit , kuten pseudogeenit , eivät kuitenkaan ole toimivia. Lisäksi ENCODE-projekti painotti herkkyyttä pikemminkin kuin spesifisyyttä, mikä johti moniin vääriin positiivisiin tuloksiin . [34] [35] [36] Hieman mielivaltainen solulinjojen ja transkriptiotekijöiden valinta sekä tarvittavien kontrollikokeiden puute on lisännyt vakavaa kritiikkiä ENCODEa kohtaan, koska satunnainen DNA-molekyyli voi jäljitellä tällaista "toiminnallinen" käyttäytyminen ENCODE-tulkinnoissa. [37]

Vastauksena näihin kritiikkiin on väitetty, että useimmat genomin transkriptio ja silmukointi , kuten ihmisillä nähdään, on tarkempi geneettisen toiminnan indikaattori kuin sekvenssin konservatismi. Lisäksi suurin osa "roska-DNA :sta" osallistuu epigeneettiseen säätelyyn ja oli välttämätön edellytys monimutkaisten organismien kehittymiselle. [38] Vastauksena sanan "toiminnallinen" määritelmää koskeviin kommentteihin monet huomauttivat, että tässä tapauksessa kiista koskee määritelmän eroa, ei hankkeen ydintä, joka on tietojen toimittaminen myöhempiä biokemiallisia tutkimuksia varten. ei-proteiinia koodaavien DNA-alueiden aktiivisuus. Vaikka määritelmät ovat tärkeitä ja tiede rajoittuu kieleen, ENCODE näyttää täyttäneen tarkoituksensa, koska useissa tutkimuspapereissa käytetään tällä hetkellä projektin tuottamaa dataa sen sijaan, että keskustellaan "toiminnallisuuden" määritelmistä. [39] Ewan Birney, yksi ENCODE-tutkijoista, kommentoi joitain reaktioita projektiin. Hän huomauttaa, että sanaa "funktio" on käytetty pragmaattisesti viittaamaan "tiettyyn biokemialliseen aktiivisuuteen", joka ilmenee eri koeryhmissä eri tavoin: RNA:n läsnäolo , histonimuunnelmat , DNaseI - yliherkät alueet, ChIP -seq- transkriptiotekijän piikit , DNA jalanjälki , transkriptiotekijän sitoutumiskohdat ja eksonit . [40]

Lisäksi hanketta on kritisoitu sen korkeasta budjetista (yhteensä noin 400 miljoonaa dollaria) ja niin sanotun "suuren tieteen" - tieteellisen perustutkimuksen - suojelemisesta, joka vie rahaa tuottavammalta tieteelliseltä kehitykseltä, joka on suoritettava tutkijoiden itsensä kustannuksella. [41] ENCODE-projektin alkuvaiheen arvoksi arvioitiin 55 miljoonaa dollaria, sen laajentaminen maksoi noin 130 miljoonaa dollaria, ja Yhdysvaltain kansallinen ihmisgenomitutkimuslaitos oli valmis osoittamaan jopa 123 miljoonaa dollaria projektin seuraavaan vaiheeseen. Jotkut tutkijat väittävät, että oikeaa sijoitetun pääoman tuottoa ei ole vielä seurannut. Yritetään laskea kaikki julkaisut, joissa ENCODElla on merkittävä rooli, vuodesta 2012 lähtien on tunnistettu 300 tällaista artikkelia, joista 110 perustui laboratorioiden tuloksiin ilman ENCODE-rahoitusta. Lisäongelmana oli se, että ENCODE ei ole ainutlaatuinen nimi, joka viittaa vain ENCODE-projektiin, joten sana "koodaa" (koodaa) ponnahtaa esiin monissa genetiikkaa ja genomitutkimusta käsittelevässä kirjallisuudessa . [7]

Toisena tärkeänä huomautuksena väitetään, että tulokset eivät oikeuttaneet käytettyä aikaa ja että hanke on periaatteessa luonteeltaan ääretön. Vaikka sitä on verrattu Human Genome Projectiin ja jopa kutsuttu sen jatkoksi, The Human Genomella on selkeä loppu, joka ENCODEsta tällä hetkellä puuttuu.

Projektin kirjoittajat ilmeisesti jakavat tiedemaailman huolen eivätkä kiellä ongelmien olemassaoloa, mutta samalla he yrittävät perustella ponnistelujaan selittämällä projektin yksityiskohtia haastatteluissa paitsi tiedeyhteisölle, vaan myös medialle. He sanovat, että kesti yli puoli vuosisataa ymmärtää, että DNA on perinnöllisyyden  aineellinen perusta , ihmisen genomin sekvenssin tulkitsemiseen , joten heidän seuraavan vuosisadan suunnitelmansa on ymmärtää tämä sekvenssi [7] .

Muut projektit

Tällä hetkellä ENCODE-konsortio on mukana useissa lisähankkeissa, joilla on samanlaiset tavoitteet. Jotkut näistä projekteista olivat osa ENCODEn toista vaihetta.

modeENCODE

Analogisesti ENCODE-projektin kanssa käynnistettiin myös projekti, jossa kartoitetaan tärkeimpien malliobjektien  - Drosophila melanogaster ja Caenorhabditis elegans - genomin toiminnalliset elementit  - englanti.  Malliorganismien DNA-elementtien ENCyclopedia (modENCODE) . Tämän projektin etuna on mahdollisuus tehdä joitain kokeita malliorganismeilla, joita on vaikea tai mahdoton suorittaa ihmisillä. [42]

National Institutes of Health ( NIH ) perusti hankkeen vuonna 2007. [  43] [44] Vuonna 2010 modeENCODE-konsortio esitteli Science -lehdessä useita artikkeleita genomin funktionaalisten elementtien jakauman annotaatiosta ja analysoinnista. Drosophila melanogaster ja Caenorhabditis elegans Tiedot näistä julkaisuista ovat saatavilla modENCODE-verkkosivustolla [45] .

Tällä hetkellä modENCODE on 11 siemenprojektin tutkimusryhmittymä, joka on jaettu D. melanogasterin ja C. elegansin tutkimuksen kesken . Hanke kattaa tutkimuksen seuraavilla aloilla:

moderni

MODERN (  malliorganismi Encyclopedia of Regulatory Networks ) on modENCODEn sivuhaara .  Projekti yhdistää C. elegans- ja D. melanogaster -ryhmien tutkimuksen ja keskittyy transkriptiotekijöiden lisäsitoutumiskohtien tunnistamiseen. Projekti käynnistettiin samanaikaisesti ENCODEn kolmannen vaiheen kanssa, ja sen on määrä valmistua vuonna 2017. Tähän mennessä modern on julkaissut 198 kokeen tulokset, vielä 500 on hyväksytty julkaistavaksi ja niitä käsittelee ENCODE-tietojen selvityskeskus.

Geenisääntelyn genomiikka

Genomics of   Gene Regulation (GGR) -ohjelman käynnisti vuoden 2015 alussa Yhdysvaltain kansallinen terveysinstituutti, ja se kestää kolme vuotta. Ohjelman tavoitteena on tutkia geeniverkostoja ja -reittejä eri kehon järjestelmissä edistääkseen ymmärrystä geenien ilmentymistä ohjaavista mekanismeista. Vaikka ENCODE-projekti on erillinen GGR:stä, ENCODE Data Clearinghouse ylläpitää GGR-tietoja portaalissaan.

Tiekartta

Vuonna 2008 Yhdysvaltain kansallinen terveysinstituutti järjesti Roadmap Epigenomics   Mapping Consortiumin kehittääkseen julkisen lähteen ihmisen genomin epigeneettisille tiedoille biologista ja lääketieteellistä tutkimusta varten. Työn tulosten perusteella konsortio julkaisi helmikuussa 2015 artikkelin "Integrative analysis of 111 reference human epigenomes". Konsortio keräsi ja kommentoi säätelyelementtejä 127 referenssiepigenomissa, joista 16 oli osa ENCODE-projektia. Roadmap-projektin tiedot ovat saatavilla Roadmap- tai ENCODE -portaaleissa .

fruitENCODE

fruitENCODE-projekti: tietosanakirja kypsyvien hedelmien DNA-elementeistä, osa ENCODEa. Projektin tavoitteena on tuottaa aineistoja: DNA:n metylaatiokohdat, histonimodifikaatiot, DNaasi I -yliherkät kromatiinialueet, geeniekspressio, transkriptiotekijän sitoutumiskohdat kaikenlaisille meheville hedelmille eri kehitysvaiheissa. Tulosten alustava julkaisupäivä on julkaistu fruitENCODE- portaalissa .

Factorbook

ENCODEn hankkimat transkriptiotekijän sitomistiedot ovat tällä hetkellä saatavilla Wikipohjaisessa tietokannassa Factorbook.org [47]  . FactorBookin ensimmäinen numero sisältää:

  • 457 ChIP-seq-tietosarjaa 119 transkriptiotekijälle joissakin ihmissoluviljelmissä
  • Keskimääräiset histonimodifikaatioiden profiilit ja nukleosomien sijainti transkriptiotekijän sitoutumiskohtien ympärillä
  • Motiivit, jotka rikastavat sitoutumiskohtia, sekä niiden välistä etäisyyttä ja niiden suuntaa [48]

Katso myös

Muistiinpanot

  1. 1 2 Raney BJ, Cline MS, Rosenbloom KR, Dreszer TR, Learned K., Barber GP, Meyer LR, Sloan CA, Malladi VS, Roskin KM, Suh BB, Hinrichs AS, Clawson H., Zweig AS, Kirkup V. , Fujita PA, Rhead B., Smith KE, Pohl A., Kuhn RM, Karolchik D., Haussler D., Kent, WJ . ENCODE koko genomin tiedot UCSC-genomiselaimessa (2011 päivitys  )  // Nucleic Acids Res. : päiväkirja. - 2011. - tammikuu ( nide 39 , nro Tietokantanumero ). - P.D871-5 . doi : 10.1093 / nar/gkq1017 . — PMID 21037257 .
  2. EGASP: ihmisen ENCODE Genome Annotation Assessment Project.  (englanniksi) . PubMed .
  3. Kleshchenko E. DNA ilman roskaa  // The New Times. - 2012. - Ongelma. 29 (256) .
  4. ENCODE-projekti UCSC:ssä (downlink) . ENCODE-konsortio. Haettu 5. syyskuuta 2012. Arkistoitu alkuperäisestä 10. syyskuuta 2012. 
  5. Walsh, Fergus . Yksityiskohtainen kartta genomin toiminnasta  (5. syyskuuta 2012). Arkistoitu alkuperäisestä 5. syyskuuta 2012. Haettu 6. syyskuuta 2012.
  6. Dan Graurin blogi .
  7. 1 2 3 4 Maher B. ENCODE: The Human Encyclopaedia   // Luonto . - 2012. - syyskuu ( osa 489 , nro 7414 ). - s. 46-8 . - doi : 10.1038/489046a . — PMID 22962707 .
  8. Saey, Tina Hesman Team julkaisee jatko-osan ihmisen genomille . Society for Science & the Public (6. lokakuuta 2012). Haettu: 18. lokakuuta 2012.
  9. 1 2 ENCODE-projektikonsortio. ENCODE (ENCyclopedia Of DNA Elements) -projekti . Tiede (2004).
  10. 1 2 3 Bernstein BE, Birney E., Dunham I., Green ED, Gunter C., Snyder M. Integroitu tietosanakirja DNA-elementeistä ihmisen genomissa  //  Nature : Journal. - 2012. - syyskuu ( osa 489 , nro 7414 ). - s. 57-74 . - doi : 10.1038/luonto11247 . — . — PMID 22955616 .
  11. Timmer J. Suurin osa lukemastasi oli väärin: kuinka lehdistötiedotteet kirjoittivat tieteellisen historian uudelleen . Henkilökunta / From the Minds of Ars . Ars Technica (10. syyskuuta 2012). Haettu: 10. syyskuuta 2012.
  12. Pennisi E. Genomics. ENCODE-projekti kirjoittaa muistopuheita roska-DNA  :lle (englanniksi)  // Science : Journal. - 2012. - syyskuu ( osa 337 , nro 6099 ). - s. 1159, 1161 . - doi : 10.1126/tiede.337.6099.1159 . — PMID 22955811 .
  13. 1 2 Birney E. , Stamatoyannopoulos JA , Dutta A. et ai. Funktionaalisten elementtien tunnistaminen ja analysointi 1 %:ssa ihmisen genomista ENCODE-pilottiprojektissa.  (englanniksi)  // Luonto. - 2007. - Voi. 447, nro 7146 . - s. 799-816. - doi : 10.1038/luonto05874 . — PMID 17571346 .
  14. ENCODE Ohjelman henkilökunta. ENCODE: Pilottiprojekti: yleiskatsaus . National Human Genome Research Institute (18. lokakuuta 2012).
  15. Genome.gov | ENCODE ja modeENCODE Projektit . ENCODE-projekti: DNA-elementtien ENCyclopedia . Yhdysvaltain kansallinen ihmisgenomitutkimuslaitos (1. elokuuta 2011). Haettu: 5. elokuuta 2011.
  16. National Human Genome Research Institute - Organisaatio . NIH-almanakka . Yhdysvaltain kansalliset terveysinstituutit. Haettu: 5. elokuuta 2011.
  17. Genome.gov | ENCODE Osallistujat ja projektit . ENCODE-projekti: DNA-elementtien ENCyclopedia . Yhdysvaltain kansallinen ihmisgenomitutkimuslaitos (1. elokuuta 2011). Haettu: 5. elokuuta 2011.
  18. Joseph R. Ecker, Wendy A. Bickmore, Inês Barroso, Jonathan K. Pritchard, Yoav Gilad. ENCODE selitetty   // Luonto . – 2012-09. — Voi. 489 , iss. 7414 . — s. 52–54 . — ISSN 1476-4687 . - doi : 10.1038/489052a .
  19. ENCODE-projektikonsortio. Käyttäjän opas DNA-elementtien tietosanakirjaan (ENCODE  )  // PLOS Biology. – 19.4.2011. — Voi. 9 , iss. 4 . — P.e1001046 . — ISSN 1545-7885 . - doi : 10.1371/journal.pbio.1001046 .
  20. Jennifer Harrow, Adam Frankish, Jose M. Gonzalez, Electra Tapanari, Mark Diekhans. GENCODE: ENCODE-projektin ihmisen genomin viitemerkintä  //  Genomitutkimus. – 01.09.2012. — Voi. 22 , iss. 9 . — s. 1760–1774 . — ISSN 1549-5469 1088-9051, 1549-5469 . - doi : 10.1101/gr.135350.111 .
  21. Cédric Howald, Andrea Tanzer, Jacqueline Chrast, Felix Kokocinski, Thomas Derrien. Yhdistämällä RT-PCR-seq ja RNA-seq luetteloimaan kaikki ihmisen genomiin koodatut geenielementit  //  Genome Research. – 01.09.2012. — Voi. 22 , iss. 9 . — P. 1698–1710 . — ISSN 1549-5469 1088-9051, 1549-5469 . - doi : 10.1101/gr.134478.111 .
  22. Thomas Derrien, Rory Johnson, Giovanni Bussotti, Andrea Tanzer, Sarah Djebali. Ihmisen pitkien ei-koodaavien RNA:iden GENCODE v7 -luettelo: niiden geenirakenteen, evoluution ja ilmentymisen analyysi  //  Genomitutkimus. – 01.09.2012. — Voi. 22 , iss. 9 . - s. 1775-1789 . — ISSN 1549-5469 1088-9051, 1549-5469 . - doi : 10.1101/gr.132159.111 .
  23. Baikang Pei, Cristina Sisu, Adam Frankish, Cedric Howald, Lukas Habegger. GENCODE-pseudogeeniresurssi  // Genomibiologia. - 05-09-2012. - T. 13 , no. 9 . - S. R51 . — ISSN 1474-760X . - doi : 10.1186/gb-2012-13-9-r51 .
  24. Mark B. Gerstein, Anshul Kundaje, Manoj Hariharan, Stephen G. Landt, Koon-Kiu Yan. ENCODE-tiedoista johdettu ihmisen säätelyverkoston arkkitehtuuri   // Luonto . – 2012-09. — Voi. 489 , iss. 7414 . — s. 91–100 . — ISSN 1476-4687 . - doi : 10.1038/luonto11245 .
  25. David S. Gross, William T. Garrard. Nukleaasiyliherkät kohdat kromatiinissa  // Annual Review of Biochemistry. - 1.6.1988. - T. 57 , no. 1 . - S. 159-197 . — ISSN 0066-4154 . - doi : 10.1146/annurev.bi.57.070188.001111 .
  26. Fjodor D. Urnov. Kromatiinin uudelleenmuotoilu oppaana transkription säätelyverkostoihin nisäkkäissä  (fr.)  // Journal of Cellular Biochemistry. - 2003. - Voi. 88 , livr. 4 . — s. 684–694 . — ISSN 1097-4644 . - doi : 10.1002/jcb.10397 .
  27. Jason Ernst, Pouya Kheradpour, Tarjei S. Mikkelsen, Noam Shoresh, Lucas D. Ward. Kromatiinitilan dynamiikan kartoitus ja analyysi yhdeksässä ihmissolutyypissä   // Luonto . - 2011-05. — Voi. 473 , iss. 7345 . — s. 43–49 . — ISSN 1476-4687 . - doi : 10.1038/luonto09906 .
  28. Madeleine P. Ball, Jin Billy Li, Yuan Gao, Je-Hyuk Lee, Emily M. LeProust. Kohdennetut ja genomimittakaavaiset strategiat geenien ja kehon metylaatioiden allekirjoitusten paljastamiseksi ihmissoluissa  //  Nature Biotechnology. - 2009-04. — Voi. 27 , iss. 4 . — s. 361–368 . — ISSN 1546-1696 . - doi : 10.1038/nbt.1533 .
  29. Alexander Meissner, Tarjei S. Mikkelsen, Hongcang Gu, Marius Wernig, Jacob Hanna. Genomimittakaavaiset DNA-metylaatiokartat pluripotenteista ja erilaistuneista soluista  (englanniksi)  // Luonto. - 2008-08. — Voi. 454 , iss. 7205 . — s. 766–770 . — ISSN 1476-4687 . - doi : 10.1038/luonto07107 .
  30. Uudelleenohjaus . linkinghub.elsevier.com . Haettu: 10.11.2020.
  31. Maher B. Taistelu ENCODEsta ja roskista . Uutiset Blogi . Nature Publishing Group (6. syyskuuta 2012).
  32. Kolata G. DNA Dark Matter on kaukana "roskasta" - osoittautuu terveyden kannalta ratkaisevan tärkeäksi , The New York Times (5. syyskuuta 2012).
  33. Gregory TR. ENCODE-mediahype-kone . Genomicron (6. syyskuuta 2012).
  34. Graur D., Zheng Y., Price N., Azevedo RB, Zufall RA, Elhaik E. Televisioiden kuolemattomuudesta: "toiminto" ihmisen genomissa ENCODEn evoluutiovapaan evankeliumin mukaan  /  / Genome Biol Evol : päiväkirja. - 2013. - Vol. 5 , ei. 3 . - s. 578-590 . - doi : 10.1093/gbe/evt028 . — PMID 23431001 .
  35. Moran L.A. Sandwalk: Sanan "toiminto" merkityksestä . Sandwalk (15. maaliskuuta 2013).
  36. Gregory TR. ENCODE-kritiikkiä vertaisarvioiduissa lehdissä. "Genomicron (linkki ei saatavilla) . Genomicron (11. huhtikuuta 2013). Haettu 30. huhtikuuta 2015. Arkistoitu alkuperäisestä 2. huhtikuuta 2015. 
  37. White MA, Myers CA, Corbo JC, Cohen BA Massiivinen rinnakkainen in vivo tehostajamääritys paljastaa, että erittäin paikalliset piirteet määräävät ChIP-seq-huippujen cis-säätelytoiminnon   // Proceedings of the National Academy of Sciences of the United States of America  : päiväkirja. - 2013. - heinäkuu ( osa 110 , nro 29 ). - P. 11952-11957 . - doi : 10.1073/pnas.1307449110 . — PMID 23818646 .
  38. Mattick JS, Dinger ME Toiminnan laajuus ihmisen genomissa  (määrittämätön)  // The HUGO Journal. - 2013. - T. 7 , nro 1 . - S. 2 . - doi : 10.1186/1877-6566-7-2 .
  39. Nature Editorial. Muoto ja toiminta   // Luonto . - 2013. - 14. maaliskuuta ( nide 495 ). - s. 141-142 . - doi : 10.1038/495141b .
  40. Birney, Ewan ENCODE: Omat ajatukseni . Ewanin blogi: Bioinformatikko yleisesti (5. syyskuuta 2012).
  41. Timpson T. Debating ENCODE: Dan Graur, Michael Eisen . Mendelspod (5. maaliskuuta 2013).
  42. ModeENCODE-projekti: DNA-elementtien malliorganismien ENCyclopedia (modENCODE) . NHGRI:n verkkosivuilla . Haettu 13.11.2008.
  43. modENCODE Osallistujat ja projektit . NHGRI:n verkkosivuilla . Haettu 13.11.2008.
  44. Berkeley Lab Life Sciences myönsi NIH:n apurahoja hedelmäkärpästen ja sukkulamatojen tutkimuksiin . Lawrence Berkeley National Laboratoryn verkkosivusto (14. toukokuuta 2007). Haettu 13.11.2008.
  45. modeENCODE . National Human Genome Research Institute.
  46. Celniker S. Genomin salaisuuksien avaaminen . Luonto (11. kesäkuuta 2009).
  47. FactorBook
  48. Wang J. Factorbook.org: Wiki-pohjainen tietokanta ENCODE-konsortion luomille transkriptiotekijöitä sitoville tiedoille . Nukleiinihappotutkimus (29. marraskuuta 2012).

Linkit