KOODAA | |
---|---|
Sisältö | |
Kuvaus | Koko genomitietokanta |
Yhteystiedot | |
Tutkimuskeskus | Kalifornian yliopisto Santa Cruz |
Laboratorio | Biomolekyylitieteen ja tekniikan keskus |
Kirjailijat | Brian J Raney [1] |
Alkuperäinen julkaisu | PMID 21037257 |
Julkaisupäivä | 2010 |
Saatavuus | |
Verkkosivusto | encodeproject.org |
Encyclopedia of DNA Elements ( ENCODE ) on syyskuussa 2003 perustettu kansainvälinen tutkimuskonsortio . Järjestäjä ja rahoittaja US National Human Genome Research Institute ( NHGRI ) [1] [2] [3] . Human Genome Projectin jatkoksi suunniteltu ENCODE pyrkii suorittamaan täydellisen analyysin ihmisen genomin toiminnallisista elementeistä . Kaikki hankkeen toteuttamisen aikana saadut tulokset julkaistaan julkisissa tietokantoissa .
5. syyskuuta 2012 hankkeen ensimmäiset tulokset julkaistiin 30 toisiinsa liittyvänä julkaisuna Nature- , Genome Biology ja Genome Research -lehtien verkkosivuilla [4] [ 5] . Nämä julkaisut osoittavat, että vähintään 80 % ihmisen genomista on biologisesti aktiivista, ja siihen asti hallitsi käsitys, että suurin osa DNA:sta oli " roskaa ". Monet tutkijat kuitenkin arvostelevat tällaisia hätiköityjä johtopäätöksiä, jotka osoittavat, että näiden elementtien toimivuudesta ei ole riittävästi todisteita [6] .
Ihmisen genomin arvioidaan sisältävän 20 000 proteiinia koodaavaa geeniä (yhdessä ne muodostavat eksomin ), ja ne muodostavat vain noin 1,5 % ihmisen genomin DNA :sta. ENCODE-projektin ensisijainen tavoite on selvittää muun genomin toiminta, josta suurinta osaa on perinteisesti pidetty " roskakuorena " (esimerkiksi transkriptiomaton DNA ).
Noin 90 % ihmisen genomin yhden nukleotidin polymorfismista (jotka on osoitettu liittyvän erilaisiin sairauksiin genominlaajuisilla assosiaatiotutkimuksilla ) löytyy proteiinia koodaavien alueiden ulkopuolelta. [7]
Proteiinia koodaavien geenien aktiivisuutta ja ilmentymistä voidaan säädellä regulomeilla - DNA:n eri elementeillä, kuten promoottorilla , säätelysekvensseillä ja kromatiinialueilla , sekä histonimodifikaatioilla . Uskotaan, että muutokset säätelyalueilla voivat häiritä proteiinien ilmentymistä ja solujen toimintaa ja siten johtaa sairauksiin ( ENCODE Project Background ). Määrittämällä säätelyelementtien sijaintia ja niiden vaikutusta transkriptioon voidaan selvittää tiettyjen geenien ilmentymistasojen muutosten ja sairauksien kehittymisen välinen yhteys. [kahdeksan]
ENCODE on tarkoitettu kattavaksi resurssiksi, jonka avulla tiedeyhteisö ymmärtää paremmin, miten genomi voi vaikuttaa ihmisten terveyteen ja edistää uusien sairauksien ehkäisy- ja hoitomenetelmien kehittämistä. [9]
Toistaiseksi projekti auttaa löytämään uusia DNA:n säätelyelementtejä, tarjoamalla uusia näkemyksiä geeniemme ja genomiemme organisoinnista ja säätelystä sekä siitä, miten DNA-sekvenssin muutokset voivat vaikuttaa sairauksien kehittymiseen. [7] Yksi projektin tärkeimmistä tuloksista on kuvaus, jonka mukaan 80 % ihmisen genomista on osoitettu liittyvän ainakin yhteen biokemialliseen toimintoon. [10] [11] Suurin osa tästä ei-koodaavasta DNA:sta on mukana koodaavien geenien ilmentymisen säätelyssä. [10] Lisäksi kunkin koodaavan geenin ilmentymistä säätelevät useat säätelyalueet, jotka sijaitsevat sekä lähellä geeniä että etäällä siitä. Nämä tulokset osoittavat, että geenisäätely on paljon monimutkaisempaa kuin aiemmin luultiin. [12]
ENCODE-projekti toteutetaan kolmessa vaiheessa: alkuvaihe, teknologian kehitysvaihe ja tuotantovaihe.
Alkuvaiheessa ENCODE-konsortio arvioi strategioita erityyppisten genomielementtien tunnistamiseksi . Alkuvaiheen tavoitteena oli määritellä menetelmäsarja, joka yhdessä mahdollistaisi ihmisen genomin laajojen alueiden tarkan ja yksityiskohtaisen karakterisoinnin , ottaen huomioon prosessin taloudellisen kannattavuuden ja korkean tehokkuuden. Alkuvaiheessa oli tunnistettava puutteita työkalusarjassa funktionaalisten sekvenssien määrittämiseksi sekä osoittaa, havaittiinko jokin käytetyistä menetelmistä tehottomaksi tai sopimattomaksi skaalaamiseen. Osa näistä ongelmista jouduttiin ratkaisemaan ENCODE-teknologian kehitysvaiheessa (samanaikaisesti hankkeen alkuvaiheen kanssa), jonka tavoitteena oli kehittää uusia laboratorio- ja laskennallisia menetelmiä, jotka parantaisivat tunnettujen funktionaalisten sekvenssien tunnistamista tai uusien tutkimusta. genomin toiminnalliset elementit. Kahden ensimmäisen vaiheen tulos, käyttäen esimerkkiä, jossa tutkittiin 1 % ihmisen genomista, määritti parhaan tavan analysoida loput 99 % mahdollisimman tehokkaasti ja alhaisin kustannuksin tuotantovaiheen aikana. [9]
Pilottivaiheessa tutkittiin ja vertailtiin olemassa olevia menetelmiä ihmisen genomisekvenssin tietyn osan perusteellista analysointia varten. Se järjestettiin avoimeksi konsortioksi, ja se kokosi yhteen tutkijoita erilaisista taustoista ja taustoista arvioimaan kunkin tekniikan, teknologian ja strategian ansioita monipuolisesta ryhmästä. Samalla hankkeen teknologian kehitysvaiheen tavoitteena oli kehittää uusia, erittäin tehokkaita menetelmiä toiminnallisten elementtien määrittämiseen. Tämän työn tavoitteena oli määrittää joukko lähestymistapoja, jotka mahdollistaisivat kaikkien ihmisen genomin toiminnallisten elementtien tarkimman määrittämisen. Alkuvaiheessa selvitettiin eri menetelmien kyky skaalata koko ihmisen genomin analysoimiseksi ja tunnistettiin aukkoja genomisekvenssin toiminnallisten elementtien määrittelyssä.
Projektin alkuvaihe tapahtui tiiviissä yhteistyössä kokeilijoiden ja teoreetikkojen välillä, mikä mahdollisti useiden menetelmien arvioinnin ihmisen genomin annotointiin. Projektin alkuvaiheen kohteeksi valittiin joukko alueita, jotka edustavat noin 1 % (30 Mb) ihmisen genomista, ja kaikki hankkeen pilottivaiheen osallistujat analysoivat sen. Kaikki ENCODEn osallistujien näitä alueita koskevat tiedot julkaistiin nopeasti julkisiin tietokantoihin. [13] [14]
Vaiheen I tulokset [13]Syyskuussa 2007 aloitettiin ENCODE-projektin tuotantovaiheen rahoitus. Tässä vaiheessa tavoitteena oli analysoida koko genomi ja tehdä "lisätutkimuksia teollisissa olosuhteissa." [15]
Tuotantovaiheen työ organisoitiin kuten alkuvaiheessakin avoimena konsortiona. Lokakuussa 2007 National Institute for Human Genome Research myönsi sille yhteensä yli 80 miljoonan dollarin apurahat neljäksi vuodeksi. [16] Tuotantovaiheen aikana hankkeeseen kuuluivat Data Coordination Center, Data Analysis Center ja Technology Development Center. [17] Tällä hetkellä projekti muuttuu todella massiiviseksi hankkeeksi, jossa on mukana 440 tiedemiestä 32 laboratoriosta ympäri maailmaa. Vuonna 2007, kun alkuvaihe valmistui, projekti nosti kapasiteettia suurelta osin seuraavan sukupolven sekvensoinnin ansiosta . Todellakin, paljon dataa käsiteltiin, tutkijat saivat noin 15 teratavua raakatietoa.
Vuoteen 2010 mennessä ENCODE-projekti oli vastaanottanut yli 1000 genominlaajuista aineistoa. Yhdessä nämä tiedot osoittavat, mitkä alueet näyttävät säätelevän tietyissä solutyypeissä käytettyjen geenien ilmentymistä ja mitkä alueet ovat vuorovaikutuksessa suuren joukon proteiineja kanssa. Projekti tarjoaa tietoa transkriptiokohdista, niihin liittyvistä transkriptiotekijöistä, kromatiinin rakenteesta ja histonien modifikaatioista.
Vaiheen II tulokset [18]ENCODE-konsortio koostuu pääasiassa tutkijoista, joita sponsoroi Yhdysvaltain kansallinen ihmisgenomitutkimuslaitos . Muut hankkeen osallistujat ovat konsortion tai analyyttisen työryhmän jäseniä.
Hankkeen alkuvaihe koostui kahdeksasta opintoryhmästä ja kahdestatoista ryhmästä, jotka osallistuivat ENCODE-projektin teknologian kehitysvaiheeseen ( ENCODE Pilot Project: Participants and Projects ). Vuoden 2007 loppuun mennessä, jolloin hankkeen pilottivaihe virallisesti päättyi, osallistujamäärä oli kasvanut 440 tutkijaan 32 laboratoriosta ympäri maailmaa. Tällä hetkellä konsortio koostuu useista keskuksista, jotka suorittavat erilaisia tehtäviä ( ENCODE Participants and Projects ):
Vuodesta 2007 lähtien ENCODE-projektin osallistujat ovat tehneet lukuisia erilaisiin biologisiin sekvensseihin perustuvia tutkimuksia kartoittaakseen ihmisen genomin toiminnallisia elementtejä [19] . Kartoitettuja elementtejä (ja käytettyjä lähestymistapoja) ovat RNA:n transkriptioalueet (RNA-seq, CAGE, RNA-PET ja manuaalinen annotaatio), proteiinia koodaavat alueet (massaspektrometria), transkriptiotekijän sitoutumiskohdat (ChIP-seq ja DNase-seq), kromatiinin rakenne (DNaasi-seq, FAIRE-seq, histoni ChIP-seq ja MNase-seq) ja DNA:n metylaatiokohdat (RRBS-analyysi). Alla on yksityiskohtainen kuvaus tiedoista, joita hankkeen osallistujat ovat saaneet vuosien aikana ja esitelty projektin verkkosivuilla.
Projektissa käytettiin manuaalista ja automaattista merkintää luomaan kattava luettelo ihmisen proteiineja koodaavista ja ei-koodaavista RNA:ista ja pseudogeeneistä, nimeltään GENCODE. [20] [21] Luettelossa on 20 687 proteiinia koodaavaa geeniä, joista keskimäärin 6,3 vaihtoehtoisesti silmukoitunut per lokus.
Lisäksi 8801 automaattisesti luotua pientä RNA:ta ja 9640 manuaalisesti kuratoitua pitkää ei-koodaavaa RNA:ta (lncRNA:ta) merkittiin annotaatioiksi. LncRNA:iden vertailu muihin ENCODE-tietoihin osoittaa, että lncRNA:t syntyvät samanlaisen reitin kautta kuin proteiinia koodaavat geenit. [22] GENCODE-projekti merkitsi myös huomautuksia 11 224 pseudogeenistä, joista 863 on transkriptoitua ja yhdistetty aktiiviseen kromatiiniin. [23]
Sääntelyalueiden tunnistamiseksi suoraan projektin osallistujat kartoittivat 119 erilaisen DNA:ta sitovan proteiinin ja useiden RNA-polymeraasikomponenttien sitoutumiskohdat 72 solutyypissä ChIP-seq:n avulla. [24] Jokainen sitoutumiskohta tutkittiin tunnettujen DNA:ta sitovien motiivien rikastumisen ja uusien motiivien läsnäolon varalta.
Kromatiinin saatavuus, jolle on tunnusomaista DNaasi I -yliherkkyys, on DNA:n säätelyalueiden tunnusmerkki. [25] [26] Projektin osallistujat kartoittivat 2,89 miljoonaa ainutlaatuista, ei-päällekkäistä DNaasi I -yliherkkyyskohtaa (DHS) käyttämällä DNase-seq:iä 125 solutyypissä.
12 histonimuunnelman kromosomipaikat 46 solutyypissä analysoitiin. Saadut tiedot osoittavat, että globaalit modifikaatiomallit vaihtelevat suuresti eri solutyypeillä transkriptioaktiivisuuden muutosten mukaisesti. On havaittu, että erilaisten histonien modifikaatiotietojen integrointia voidaan käyttää systemaattisesti funktionaalisten attribuuttien osoittamiseen genomialueille. [27]
Sytosiinin metylaatio (yleensä CpG-dinukleotideissa) liittyy geeniekspression epigeneettiseen säätelyyn. Promoottorimetylaatio liittyy usein repressioon, kun taas geenimetylaatio korreloi transkription aktiivisuuden kanssa. [28] Projektin osallistujat käyttivät Restricted Genomic Loci Set Bisulfite Sequencing (RRBS) -menetelmää DNA:n metylaation kvantitatiiviseen profilointiin keskimäärin 1,2 miljoonalla CpG:llä kussakin 82 solulinjassa ja kudoksessa, mukaan lukien CpG:t proksimaalisten promoottorien ja alueiden välisillä geenialueilla. geeni (geenikappaleet). [29]
Fyysisiä vuorovaikutuksia kromosomien yksittäisten alueiden välillä, jotka voidaan erottaa toisistaan sadoilla kiloemäksillä, pidetään tärkeänä geenin ilmentymisen säätelyssä 46. 5C-menetelmä on paljastanut pitkän kantaman vuorovaikutuksia transkription aloituskohtien (TSS) kanssa kohdealueella 1 %. genomi (44 ENCODE-pilottialuetta) neljässä solutyypissä (GM12878, K562, HeLa-S3 ja H1 hESC) 49. Jokaisesta solutyypistä löydettiin satoja tilastollisesti merkittäviä pitkän kantaman vuorovaikutuksia kromatiinipolymeerin käyttäytymisen ja kokeellisen vaihtelun huomioimisen jälkeen. Vuorovaikutteisten lokusten parit osoittivat vahvan korrelaation TSS-geenin ilmentymisen tason ja tiettyjen toiminnallisten elementtiluokkien, kuten tehostajien , läsnäolon välillä . TSS:n kanssa vuorovaikutuksessa olevien distaalisten elementtien keskimääräinen lukumäärä oli 3,9 ja distaalisen elementin kanssa vuorovaikutuksessa olevien TSS:n keskimääräinen lukumäärä oli 2,5, mikä viittaa toisiinsa yhdistetyn kromatiinin monimutkaiseen verkostoon. Tämä toisiinsa kietoutunut "pitkän kantaman" arkkitehtuuri on myös paljastettu koko genomissa kromatiinivuorovaikutusanalyysillä, jossa on parillinen päätemerkkisekvensointi ( ChIA-PET ), jota käytetään havaitsemaan vuorovaikutuksia RNA-polymeraasi II:lla (Pol II) rikastetussa kromatiinissa viidessä solutyypissä. [kolmekymmentä]
Huolimatta konsortion väitteistä, että ENCODE-projekti ei ole kaukana ohi, palaute jo julkaistuihin artikkeleihin ja lehdistötiedotteisiin on ollut myönteistä. Nature -lehden toimittajat ja ENCODE-projektin kirjoittajat kirjoittavat: "... olemme tehneet yhteistyötä useiden kuukausien ajan tehdäksemme suurimman mahdollisen roiskeen, joka kiinnittää paitsi tiedeyhteisön myös suuren yleisön huomion" ("... tehnyt yhteistyötä useiden kuukausien ajan tehdäkseen suurimman mahdollisen vaikutuksen ja kiinnittääkseen paitsi tutkimusyhteisön myös suuren yleisön huomion"). [31] ENCODE-projektin esittämä väite, jonka mukaan 80 prosentilla ihmisen genomista on biokemiallinen tehtävä [10] , otettiin nopeasti esille populaaritieteellisissä julkaisuissa, joissa luonnehdittiin hankkeen tulosten aiheuttavan "roska"-DNA: n kuolemaa. . [32] [33]
Johtopäätöstä, jonka mukaan suurin osa genomista on "toiminnallinen", on kuitenkin kritisoitu sillä perusteella, että ENCODE-projekti määrittelee "toiminnallisuuden" liian laajasti, eli että kaikella, mitä soluun transkriptoidaan, on funktio. Tämä johtopäätös tehtiin huolimatta yleisesti hyväksytystä näkemyksestä, jonka mukaan monet transkriptoidut DNA:n elementit , kuten pseudogeenit , eivät kuitenkaan ole toimivia. Lisäksi ENCODE-projekti painotti herkkyyttä pikemminkin kuin spesifisyyttä, mikä johti moniin vääriin positiivisiin tuloksiin . [34] [35] [36] Hieman mielivaltainen solulinjojen ja transkriptiotekijöiden valinta sekä tarvittavien kontrollikokeiden puute on lisännyt vakavaa kritiikkiä ENCODEa kohtaan, koska satunnainen DNA-molekyyli voi jäljitellä tällaista "toiminnallinen" käyttäytyminen ENCODE-tulkinnoissa. [37]
Vastauksena näihin kritiikkiin on väitetty, että useimmat genomin transkriptio ja silmukointi , kuten ihmisillä nähdään, on tarkempi geneettisen toiminnan indikaattori kuin sekvenssin konservatismi. Lisäksi suurin osa "roska-DNA :sta" osallistuu epigeneettiseen säätelyyn ja oli välttämätön edellytys monimutkaisten organismien kehittymiselle. [38] Vastauksena sanan "toiminnallinen" määritelmää koskeviin kommentteihin monet huomauttivat, että tässä tapauksessa kiista koskee määritelmän eroa, ei hankkeen ydintä, joka on tietojen toimittaminen myöhempiä biokemiallisia tutkimuksia varten. ei-proteiinia koodaavien DNA-alueiden aktiivisuus. Vaikka määritelmät ovat tärkeitä ja tiede rajoittuu kieleen, ENCODE näyttää täyttäneen tarkoituksensa, koska useissa tutkimuspapereissa käytetään tällä hetkellä projektin tuottamaa dataa sen sijaan, että keskustellaan "toiminnallisuuden" määritelmistä. [39] Ewan Birney, yksi ENCODE-tutkijoista, kommentoi joitain reaktioita projektiin. Hän huomauttaa, että sanaa "funktio" on käytetty pragmaattisesti viittaamaan "tiettyyn biokemialliseen aktiivisuuteen", joka ilmenee eri koeryhmissä eri tavoin: RNA:n läsnäolo , histonimuunnelmat , DNaseI - yliherkät alueet, ChIP -seq- transkriptiotekijän piikit , DNA jalanjälki , transkriptiotekijän sitoutumiskohdat ja eksonit . [40]
Lisäksi hanketta on kritisoitu sen korkeasta budjetista (yhteensä noin 400 miljoonaa dollaria) ja niin sanotun "suuren tieteen" - tieteellisen perustutkimuksen - suojelemisesta, joka vie rahaa tuottavammalta tieteelliseltä kehitykseltä, joka on suoritettava tutkijoiden itsensä kustannuksella. [41] ENCODE-projektin alkuvaiheen arvoksi arvioitiin 55 miljoonaa dollaria, sen laajentaminen maksoi noin 130 miljoonaa dollaria, ja Yhdysvaltain kansallinen ihmisgenomitutkimuslaitos oli valmis osoittamaan jopa 123 miljoonaa dollaria projektin seuraavaan vaiheeseen. Jotkut tutkijat väittävät, että oikeaa sijoitetun pääoman tuottoa ei ole vielä seurannut. Yritetään laskea kaikki julkaisut, joissa ENCODElla on merkittävä rooli, vuodesta 2012 lähtien on tunnistettu 300 tällaista artikkelia, joista 110 perustui laboratorioiden tuloksiin ilman ENCODE-rahoitusta. Lisäongelmana oli se, että ENCODE ei ole ainutlaatuinen nimi, joka viittaa vain ENCODE-projektiin, joten sana "koodaa" (koodaa) ponnahtaa esiin monissa genetiikkaa ja genomitutkimusta käsittelevässä kirjallisuudessa . [7]
Toisena tärkeänä huomautuksena väitetään, että tulokset eivät oikeuttaneet käytettyä aikaa ja että hanke on periaatteessa luonteeltaan ääretön. Vaikka sitä on verrattu Human Genome Projectiin ja jopa kutsuttu sen jatkoksi, The Human Genomella on selkeä loppu, joka ENCODEsta tällä hetkellä puuttuu.
Projektin kirjoittajat ilmeisesti jakavat tiedemaailman huolen eivätkä kiellä ongelmien olemassaoloa, mutta samalla he yrittävät perustella ponnistelujaan selittämällä projektin yksityiskohtia haastatteluissa paitsi tiedeyhteisölle, vaan myös medialle. He sanovat, että kesti yli puoli vuosisataa ymmärtää, että DNA on perinnöllisyyden aineellinen perusta , ihmisen genomin sekvenssin tulkitsemiseen , joten heidän seuraavan vuosisadan suunnitelmansa on ymmärtää tämä sekvenssi [7] .
Tällä hetkellä ENCODE-konsortio on mukana useissa lisähankkeissa, joilla on samanlaiset tavoitteet. Jotkut näistä projekteista olivat osa ENCODEn toista vaihetta.
Analogisesti ENCODE-projektin kanssa käynnistettiin myös projekti, jossa kartoitetaan tärkeimpien malliobjektien - Drosophila melanogaster ja Caenorhabditis elegans - genomin toiminnalliset elementit - englanti. Malliorganismien DNA-elementtien ENCyclopedia (modENCODE) . Tämän projektin etuna on mahdollisuus tehdä joitain kokeita malliorganismeilla, joita on vaikea tai mahdoton suorittaa ihmisillä. [42]
National Institutes of Health ( NIH ) perusti hankkeen vuonna 2007. [ 43] [44] Vuonna 2010 modeENCODE-konsortio esitteli Science -lehdessä useita artikkeleita genomin funktionaalisten elementtien jakauman annotaatiosta ja analysoinnista. Drosophila melanogaster ja Caenorhabditis elegans Tiedot näistä julkaisuista ovat saatavilla modENCODE-verkkosivustolla [45] .
Tällä hetkellä modENCODE on 11 siemenprojektin tutkimusryhmittymä, joka on jaettu D. melanogasterin ja C. elegansin tutkimuksen kesken . Hanke kattaa tutkimuksen seuraavilla aloilla:
MODERN ( malliorganismi Encyclopedia of Regulatory Networks ) on modENCODEn sivuhaara . Projekti yhdistää C. elegans- ja D. melanogaster -ryhmien tutkimuksen ja keskittyy transkriptiotekijöiden lisäsitoutumiskohtien tunnistamiseen. Projekti käynnistettiin samanaikaisesti ENCODEn kolmannen vaiheen kanssa, ja sen on määrä valmistua vuonna 2017. Tähän mennessä modern on julkaissut 198 kokeen tulokset, vielä 500 on hyväksytty julkaistavaksi ja niitä käsittelee ENCODE-tietojen selvityskeskus.
Genomics of Gene Regulation (GGR) -ohjelman käynnisti vuoden 2015 alussa Yhdysvaltain kansallinen terveysinstituutti, ja se kestää kolme vuotta. Ohjelman tavoitteena on tutkia geeniverkostoja ja -reittejä eri kehon järjestelmissä edistääkseen ymmärrystä geenien ilmentymistä ohjaavista mekanismeista. Vaikka ENCODE-projekti on erillinen GGR:stä, ENCODE Data Clearinghouse ylläpitää GGR-tietoja portaalissaan.
Vuonna 2008 Yhdysvaltain kansallinen terveysinstituutti järjesti Roadmap Epigenomics Mapping Consortiumin kehittääkseen julkisen lähteen ihmisen genomin epigeneettisille tiedoille biologista ja lääketieteellistä tutkimusta varten. Työn tulosten perusteella konsortio julkaisi helmikuussa 2015 artikkelin "Integrative analysis of 111 reference human epigenomes". Konsortio keräsi ja kommentoi säätelyelementtejä 127 referenssiepigenomissa, joista 16 oli osa ENCODE-projektia. Roadmap-projektin tiedot ovat saatavilla Roadmap- tai ENCODE -portaaleissa .
fruitENCODE-projekti: tietosanakirja kypsyvien hedelmien DNA-elementeistä, osa ENCODEa. Projektin tavoitteena on tuottaa aineistoja: DNA:n metylaatiokohdat, histonimodifikaatiot, DNaasi I -yliherkät kromatiinialueet, geeniekspressio, transkriptiotekijän sitoutumiskohdat kaikenlaisille meheville hedelmille eri kehitysvaiheissa. Tulosten alustava julkaisupäivä on julkaistu fruitENCODE- portaalissa .
ENCODEn hankkimat transkriptiotekijän sitomistiedot ovat tällä hetkellä saatavilla Wikipohjaisessa tietokannassa Factorbook.org [47] . FactorBookin ensimmäinen numero sisältää:
Sanakirjat ja tietosanakirjat |
---|