Rikastumisen analyysi toiminnallisen kuuluvuuden mukaan
Kokeneet kirjoittajat eivät ole vielä tarkistaneet sivun nykyistä versiota, ja se voi poiketa merkittävästi 14.5.2019 tarkistetusta
versiosta . tarkastukset vaativat
2 muokkausta .
Funktionaalinen rikastusanalyysi [1] ( englanniksi gene set enrichment analysis, GSEA [2] ) on joukko menetelmiä geenisarjan yhdistämiseksi fenotyypin muutokseen [ 2] . Fenotyyppiä koskevien olemassa olevien tietojen virallistamiseksi tällaiset menetelmät käyttävät usein tietokantoja aiemmin annotoiduista geenisarjoista (esimerkiksi Gene ontology (GO) -projektin termit: molekyylifunktiot, biologiset prosessit tai solukomponentit [3] ). Menetelmän soveltamisen (ohjelman antamisen) tuloksena on tässä tapauksessa joukko esiannotoituja joukkoja, joiden taajuus syöttöjoukossa poikkeaa tilastollisesti merkitsevästi taustasta (esimerkiksi taajuus koko genomissa tai muussa geenisarja). Tällaisia esiannotoituja joukkoja kutsutaan yliedustetuiksi (jos taajuus on taustan yläpuolella) tai aliedustetuiksi (jos taajuus on taustan alapuolella).
GSEA:n tärkeä innovaatio aikaisempiin analyysimenetelmiin verrattuna on kyky analysoida yksittäisten geenien datan lisäksi itsenäisesti myös geenien toiminnalliset suhteet toisiinsa. Joissakin tapauksissa, esimerkiksi yksittäisten geenien yksilöllisen ilmentymisen vähäisellä muutoksella, GSEA:n käyttö johtaa menetelmän herkkyyden kasvuun ja täydellisempään kuvaan differentiaalisesta ilmentymisestä [4] .
Useat tutkijaryhmät kehittivät tämän lähestymistavan itsenäisesti vuosina 2002–2003, ja se on otettu laajalti käyttöön. Samaan aikaan ehdotettiin ensimmäisiä ohjelmia sen toteuttamiseksi [5] [6] [7] [8] [9] [10] [11] .
Huomaa, että termiä GSEA käytetään useissa merkityksissä: tässä artikkelissa käsitellyn laajan menetelmäluokan nimenä [2] , suppeamman menetelmäluokan nimenä [2] , erillisen ohjelman nimenä [4 ] ] .
Tausta
Ihmisgenomiprojektin myötä syntyi ongelma, kuinka tulkita ja analysoida suurta määrää uutta tietoa vanhoilla menetelmillä. Geeniekspression analysointimenetelmien syntymisen vuoksi kudosmuutoksia sairastavilla ihmisillä. Microarray-dataa on käytetty kudosten luokitteluun molekyyliominaisuuksien perusteella ja hypoteesien luomiseen sairauden mekanismeista esimerkiksi syöpätutkimuksessa , jossa yksittäisten geenien ilmentymisessä on usein havaittu suuria muutoksia [12] . Kuitenkin, kun muutokset geenien ilmentymisessä eivät ole kovin selkeitä, testattujen geenien suuri määrä, suuri yksilöiden välinen vaihtelu ja ihmistutkimuksissa yleiset rajalliset näytekoot tekevät todellisten erojen erottamisen melusta vaikeaksi. Monet geenit voivat osallistua samaan aineenvaihduntareittiin , ja siksi ilmentymisen kokonaismuutos geeniryhmän sisällä johtaa eroon fenotyyppisessä ilmentymisessä. Geenien funktionaalisten ryhmien esityksen analyysi keskittyy muutoksiin ekspressiossa geeniryhmissä, joten tämä menetelmä ratkaisee ongelman löytää pieniä muutoksia yksittäisten geenien ilmentymisessä [8] .
Lähestymistavat
GSEA-ongelman formalisoimiseen ja ratkaisemiseen käytetään matemaattisten tilastojen menetelmiä : joidenkin kullekin aiemmin annotoidulle ryhmälle lasketun tilaston merkitys arvioidaan [13] .
Yleistetty GSEA-algoritmi
Yleistetty GSEA-algoritmi sisältää seuraavat vaiheet [13] :
- Aiemmin merkittyjen geeniryhmien tilastojen laskeminen - käytetään toista kahdesta tavasta:
- Maailmanlaajuinen testi – tilastojen luominen syötejoukosta suoraan kullekin ennalta merkitylle ryhmälle, esimerkiksi Hotelling-testin tai ANCOVA
- Geenitilastojen yhdistäminen - yksittäisten geenien tilastojen rakentaminen, joiden perusteella rakennetaan ryhmätilastot. Sitten määritellään seuraavat asiat järjestyksessä:
- Geenitilastot — syöttötiedon tyypistä riippuen geeneille on mahdollista valita erilaisia tilastoja, esimerkiksi signaali-kohinasuhde kokeessa tai esikäsittelystä saatu todennäköisyyssuhde
- Geenien tilastojen muunnos — geenien tilastot voidaan muunnella: siten voidaan suorittaa tilastojen järjestysmuunnos tai tilaston arvosta riippuen valitaan tietty osajoukko kaikista geeneistä jatkoanalyysiin
- Geenijoukon tilastot - yllä saadut geenitilastot yhdistetään valmiiksi merkittyjen geenisarjojen tilastojen muodostamiseksi: esimerkiksi ryhmätilasto määritellään sen sisältämien geenien tilastojen keskiarvoksi
- Merkittävyyden arviointi - laaditun tilaston pää- ja vaihtoehtoisten hypoteesien muotoilu, tilaston merkityksen arviointi. Koska suuri määrä hypoteeseja testataan tällä tavalla (jokaisen aiemmin annotoidun geeniryhmän yli-/aliedustus), merkitsevyysarvio sisältää usein korjauksen useiden testausten osalta .
Menetelmien luokitus
Edellä käsitellyn yleisen algoritmin näkökulmasta ero GSEA-menetelmien välillä piilee eri vaiheissa käytettävien toimenpiteiden järjestyksessä. Yleistetyn algoritmin kirjoittajat vertasivat 261 menettelyjen yhdistelmää [13] ; vuoden 2008 katsauksen [14] kirjoittajat kuvaavat 68 erillistä ohjelmaa, jotka toteuttavat näitä menetelmiä. Tässä katsauksessa ehdotetaan menetelmien luokittelua kolmeen pääluokkaan: ainutlaatuinen rikastusanalyysi (SEA), geenisarjan rikastusanalyysi (GSEA suppeassa merkityksessä) ja modulaarinen rikastusanalyysi (MEA). Jotkut ohjelmat kuuluvat useampaan kuin yhteen luokkaan. Huomaa, että GSEA-ongelmalle ei ole yleisesti hyväksyttyä muodollista muotoilua (laajassa merkityksessä), mikä vaikeuttaa tulosten arvioimista ja menetelmien vertailua [2] .
Ainutlaatuinen rikastusanalyysi
Singulaarinen rikastusanalyysi - menetelmät , jotka vastaanottavat kandidaattigeenejä syötteenä - geenit, jotka liittyvät johonkin tutkijoita kiinnostaviin geenien osajoukkoon (esimerkiksi geenit, jotka muuttivat merkittävästi ilmentymistä ( geenitilastot ) tietyllä merkitsevyystasolla), ja vasta sitten näille geeneissä funktionaalisten ryhmien yliedustus määräytyy. Siten nämä menetelmät antavat tutkijalle mahdollisuuden valita geenitilastot ja suorittaa transformaatio - valitse geenit tilaston arvon mukaan, sitten esiannotoidun joukon tilastot rakennetaan joukossa olevien geenien lukumäärän perusteella. ehdokasgeenejä. Tilastollisina malleina käytetään hypergeometristä jakaumaa , binomijakaumaa (käytetään suurille näytteille), χ² , Fisherin tarkkaa testiä . Useimmissa tapauksissa tilastollisten mallien väliset erot ovat merkityksettömiä [15] .
Tämä on yksinkertainen ja tehokas menetelmä, mutta tulos riippuu ehdokasgeenin valintakriteerien parametreista. Lisäksi geenien valtavan määrän vuoksi (tyypillinen kokeen tulos on useita kymmeniä tuhansia ilmentymisprofiileja [9] ), suhteet aiemmin merkittyjen ryhmien välillä voivat kadota [14] .
Tähän menetelmään perustuvat ohjelmat: GoStat, GoMiner, GOTM, BinGO, GOtoolBox, GFinder, Onto-Express, GARBAN, FatiGO, BayGO [14] .
Geenijoukon rikastusanalyysi
Geenijoukon rikastusanalyysi on vaihtoehtoinen lähestymistapa, joka sisältää kaikkien geenien luokittelun ( muunnoksen ) sen ominaisuuden ilmenemisasteen mukaan ( geenitilastot ), jolle analyysi tehdään . Tässä tapauksessa otetaan huomioon koko geenisarja, ei vain merkittävimpiä geenejä. Käytetään ryhmätilastoja , kuten Kolmogorov - tilastot , Studentin t-tilastot , Mann-Whitneyn U-tilastot , ryhmäsijoitusmediaania [2] .
Suurin etu on, että tämä menetelmä käyttää kaikkea kokeista saatua tietoa. Syötteenä se kuitenkin edellyttää funktionaalisen ryhmän määrittelyä kullekin geenille, mikä on usein vaikea tehtävä. Menetelmän taustalla oleva oletus, että listan vastakkaisista päistä peräisin olevat geenit edistävät enemmän biologista toimintaa, ei aina pidä paikkaansa, säätelyproteiinit usein muuttavat ilmentymistään hieman, mutta tämä johtaa suuriin seurauksiin [14] .
Tähän menetelmään perustuvat ohjelmat: GSEA (ohjelman nimi), CapMap, FatiScan, ADGO, ermineJ, PAGE, iGA, GO-Mapper, GOdist, FINA, T-profiler, MetaGP [14] .
Modulaarinen rikastusanalyysi
Modulaarinen rikastusanalyysi ( eng. modular richment analysis ) - menetelmät, jotka ottavat syötteenä, kuten ainutlaatuisen rikastumisen analyysin, listan ehdokasgeeneistä, mutta toisin kuin yliedustuksen merkitystä arvioitaessa (eli määrittelyvaiheissa). geenijoukon tilastot ja merkittävyyden arvioiminen ) ottaa huomioon GO-termien välisen suhteen. Tätä varten käytetään esimerkiksi Kappa statistic . Tällä tavalla voidaan kuvata geenien syöttöjoukon funktio, joka ei vastaa yhtä termiä. Menetelmän rajoituksena on, että geenit, joilla ei ole vahvoja naapurisuhteita, jätetään analyysin ulkopuolelle [14] .
Tähän menetelmään perustuvat ohjelmat: ADGO, GeneCodis, ProfCom, topGO, Ontologizer, POSOC, DAVID, GoToolBox [14] .
Sovellukset
Näillä menetelmillä analysoidaan kokeiden tuloksia, jotka edustavat tiettyä geenilistaa, joka eroaa koko geeninäytteestä. Esimerkiksi toiminnallista rikastusanalyysiä käytetään usein geeneille, jotka ilmentyvät eri tavalla eri olosuhteissa, jolloin tehtävänä on poimia ilmentymisprofiileista tietoa kaikista biologisista mekanismeista
Tämän menetelmän tärkeä sovellusalue [3] on genominlaajuinen assosiaatiohaku – sairaiden ja terveiden genotyyppien vertailu, jossa yritetään löytää yksittäisen nukleotidin polymorfismeja (SNP) , jotka ovat yliedustettuina potilaan genomissa ja jotka voivat liittyä annettu ehto. Tämä geenien funktionaalisten ryhmien esityksen analyysin sovellus ei ainoastaan auta sairauksiin liittyvien SNP:iden löytämisessä, vaan myös auttaa selventämään sairauksien relevantteja reittejä ja mekanismeja [16] . GSEA:ta on käytetty esimerkiksi sellaisten sairauksien tutkimiseen, kuten spontaani ennenaikainen synnytys [17] , munuaissyöpä [18] , masennus [19] , neosporoosi [20] , skitsofrenia [21] ja monet muut.
Muistiinpanot
- ↑ Sun GP , Jiang T. , Xie PF , Lan J. , Sun GP , Jiang T. , Xie PF , Lan J. Parodontiittiin liittyvien geenien tunnistaminen koekspressioverkkojen avulla // Molecular Biology. - 2016. - T. 50 , nro 1 . - S. 143-150 . — ISSN 0026-8984 . - doi : 10.7868/S0026898416010195 . (Venäjän kieli)
- ↑ 1 2 3 4 5 6 Hung J.-H. , Yang T.-H. , Hu Z. , Weng Z. , DeLisi C. Geenijoukon rikastusanalyysi: suorituskyvyn arviointi ja käyttöohjeet // Briefings in Bioinformatics. - 2011. - 7. syyskuuta ( nide 13 , nro 3 ). - s. 281-291 . — ISSN 1467-5463 . doi : 10.1093 / bib/bbr049 .
- ↑ 1 2 Mooney Michael A. , Wilmot Beth. Geenijoukon analyysi: vaiheittainen opas // American Journal of Medical Genetics, osa B: Neuropsychiatric Genetics. - 2015. - 8. kesäkuuta ( nide 168 , nro 7 ). - s. 517-527 . — ISSN 1552-4841 . - doi : 10.1002/ajmg.b.32328 .
- ↑ 1 2 Subramanian A. , Tamayo P. , Mootha VK , Mukherjee S. , Ebert BL , Gillette MA , Paulovich A. , Pomeroy SL , Golub TR , Lander ES , Mesirov JP Geenijoukon rikastusanalyysi: Tietopohjainen lähestymistapa genominlaajuisten ilmentymisprofiilien tulkitseminen (englanniksi) // Proceedings of the National Academy of Sciences. - 2005. - 30. syyskuuta ( nide 102 , nro 43 ). - P. 15545-15550 . — ISSN 0027-8424 . - doi : 10.1073/pnas.0506580102 .
- ↑ Rhodes Daniel R , Chinnaiyan Arul M. Syövän transkription integroiva analyysi // Nature Genetics. - 2005. - Kesäkuu ( osa 37 , nro S6 ). -P.S31- S37 . — ISSN 1061-4036 . - doi : 10.1038/ng1570 .
- ↑ Doniger Scott W , Salomonis Nathan , Dahlquist Kam D , Vranizan Karen , Lawlor Steven C , Conklin Bruce R. [1] // Genomibiologia. - 2003. - Voi. 4 , ei. 1 . – P.R7 . — ISSN 1465-6906 . - doi : 10.1186/gb-2003-4-1-r7 .
- ↑ Zeeberg Barry R , Feng Weimin , Wang Geoffrey , Wang May D , Fojo Anthony T , Sunshine Margot , Narasimhan Sudarshan , Kane David W , Reinhold William C , Lababidi Samir , Bussey Kimberly J , Riss N. John Joseph , We Barrett J. [2] (englanniksi) // Genomibiologia. - 2003. - Voi. 4 , ei. 4 . — P.R28 . — ISSN 1465-6906 . - doi : 10.1186/gb-2003-4-4-r28 .
- ↑ 1 2 Mootha Vamsi K , Lindgren Cecilia M , Eriksson Karl-Fredrik , Subramanian Aravind , Sihag Smita , Lehar Joseph , Puigserver Pere , Carlsson Emma , Ridderstråle Martin , Laurila Esa , Houstis J , Nick , Pati Mesterly Nicholas Jill P , Golub Todd R , Tamayo Pablo , Spiegelman Bruce , Lander Eric S , Hirschhorn Joel N , Altshuler David , Groop Leif C. Oksidatiiviseen fosforylaatioon osallistuvat PGC-1α-responsiiviset geenit säätelevät koordinoidusti ihmisen diabeteksessa / Naturesh Genetiikka. - 2003. - 15. kesäkuuta ( nide 34 , nro 3 ). - s. 267-273 . — ISSN 1061-4036 . - doi : 10.1038/ng1180 .
- ↑ 1 2 Draghici S. Onto-Tools, modernin biologin työkalupakki: Onto-Express, Onto-Compare, Onto-Design ja Onto-Translate // Nucleic Acids Research. - 2003. - 1. heinäkuuta ( osa 31 , nro 13 ). - P. 3775-3781 . — ISSN 1362-4962 . - doi : 10.1093/nar/gkg624 .
- ↑ Al-Shahrour F. , Diaz-Uriarte R. , Dopazo J. FatiGO: verkkotyökalu geeniontologian termien merkittävien assosiaatioiden löytämiseksi geeniryhmien kanssa // Bioinformatics . - 2004. - 22. tammikuuta ( nide 20 , nro 4 ). - s. 578-580 . — ISSN 1367-4803 . - doi : 10.1093/bioinformatics/btg455 .
- ↑ Volinia S. , Evangelisti R. , Francioso F. , Arcelli D. , Carella M. , Gasparini P. TAVOITE: ilmentymisprofiilien automaattinen geeniontologiaanalyysi // Nucleic Acids Research. - 2004. - 1. heinäkuuta ( nide 32 , no. Web Server ). - P.W492-W499 . — ISSN 0305-1048 . doi : 10.1093 / nar/gkh443 .
- ↑ Golub TR syövän molekyyliluokitus: luokan löytäminen ja luokan ennustaminen geenien ilmentymisen seurannalla // Tiede . - 1999. - 15. lokakuuta ( nide 286 , nro 5439 ). - s. 531-537 . — ISSN 0036-8075 . - doi : 10.1126/tiede.286.5439.531 .
- ↑ 1 2 3 4 Ackermann Marit , Strimmer Korbinian. Yleinen modulaarinen kehys geenijoukon rikastusanalyysille (englanniksi) // BMC Bioinformatics. - 2009. - 3. helmikuuta ( osa 10 , nro 1 ). — ISSN 1471-2105 . - doi : 10.1186/1471-2105-10-47 .
- ↑ 1 2 3 4 5 6 7 Huang Da Wei , Sherman Brad T. , Lempicki Richard A. Bioinformatiikan rikastustyökalut: polkuja suurten geeniluetteloiden kattavaan toiminnalliseen analyysiin // Nucleic Acids Research. - 2008. - 25. marraskuuta ( nide 37 , nro 1 ). - s. 1-13 . — ISSN 1362-4962 . - doi : 10.1093/nar/gkn923 .
- ↑ Khatri P. , Draghici S. Geeniekspressiotietojen ontologinen analyysi: nykyiset työkalut, rajoitukset ja avoimet ongelmat // Bioinformatiikka . - 2005. - 30. kesäkuuta ( osa 21 , nro 18 ). - P. 3587-3595 . — ISSN 1367-4803 . - doi : 10.1093/bioinformatics/bti565 .
- ↑ Holden Marit , Deng Shiwei , Wojnowski Leszek , Kulle Bettina. GSEA-SNP: geenijoukon rikastusanalyysin soveltaminen SNP-tietoihin genominlaajuisista assosiaatiotutkimuksista // Bioinformatics . - 2008. - 14. lokakuuta ( osa 24 , nro 23 ). - s. 2784-2785 . — ISSN 1460-2059 . - doi : 10.1093/bioinformatics/btn516 .
- ↑ Manuck Tracy A. , Watkins Scott , Esplin M. Sean , Parry Samuel , Zhang Heping , Huang Hao , Biggio Joseph R. , Bukowski Radek , Saade George , Andrews William , Baldwin Don , Sadovsky Yoel , Reddy Uma , Varnerkis John Michael W. , Jorde Lynn B. , Yandell Mark. 242: Geenijoukon rikastustutkimus äidin eksomin vaihtelusta spontaanissa ennenaikaisessa synnytyksessä (SPTB ) // American Journal of Obstetrics and Gynecology. - 2016. - tammikuu ( osa 214 , nro 1 ). - P.S142-S143 . — ISSN 0002-9378 . - doi : 10.1016/j.ajog.2015.10.280 .
- ↑ Maruschke Matthias , Hakenberg Oliver W , Koczan Dirk , Zimmermann Wolfgang , Stief Christian G , Buchner Alexander. Metastaattisen munuaissolukarsinooman ilmentymisprofilointi geenisarjan rikastusanalyysillä (englanniksi) // International Journal of Urology. - 2013. - 2. toukokuuta ( nide 21 , nro 1 ). - s. 46-51 . — ISSN 0919-8172 . - doi : 10.1111/iju.12183 .
- ↑ Elovainio Marko , Taipale Tuukka , Seppälä Ilkka , Mononen Nina , Raitoharju Emma , Jokela Markus , Pulkki-Råback Laura , Illig Thomas , Waldenberger Melanie , Hakulinen Christian , Hintsa Taina , Kivimäki Kelärinen Mika- , Lehtari Kelärinen Mika- , Lehtari Raiho Mika - J Kähönvitsi . Aktivoituneet immuuni-inflammatoriset reitit liittyvät pitkäaikaisiin masennusoireisiin: todisteita nuorten suomalaisten tutkimuksen geenijoukon rikastusanalyyseistä // Journal of Psychiatric Research. - 2015. - joulukuu ( osa 71 ). - s. 120-125 . — ISSN 0022-3956 . - doi : 10.1016/j.jpsychires.2015.09.017 .
- ↑ Nishimura Maki , Tanaka Sachi , Ihara Fumiaki , Muroi Yoshikage , Yamagishi Junya , Furuoka Hidefumi , Suzuki Yutaka , Nishikawa Yoshifumi . Transkripti ja histopatologiset muutokset Neospora caninum -tartunnan saaneissa hiiren aivoissa // Tieteelliset raportit. - 2015. - 21. tammikuuta ( nide 5 , nro 1 ). — ISSN 2045-2322 . - doi : 10.1038/srep07936 .
- ↑ Hass Johanna , Walton Esther , Wright Carrie , Beyer Andreas , Scholz Markus , Turner Jessica , Liu Jingyu , Smolka Michael N. , Roessner Veit , Sponheim Scott R. , Gollub Randy L. , Calhoun Vince Stefan D. , E. DNA-metylaation ja skitsofreniaan liittyvien välifenotyyppien väliset yhteydet - Geenijoukon rikastusanalyysi // Progress in Neuro-Psychopharmacology and Biological Psychiatry. - 2015. - kesäkuu ( osa 59 ). - s. 31-39 . — ISSN 0278-5846 . - doi : 10.1016/j.pnpbp.2015.01.006 .