Cancer Genome Atlas ( TCGA ) tai ARG on projekti, jonka tavoitteena on systematisoida tietoa syöpään johtavista geneettisistä mutaatioista [1] . Systematisointi tapahtuu sekvensointi - ja bioinformatiikan menetelmillä . Tämä projekti on yhteistyö National Cancer Instituten ja Human Genome Research Instituten , USA:n [2] välillä .
Jotta jokainen syöpävariantti voitaisiin tutkia täydellisesti, vastaavalle näytteelle tehtiin laajamittainen tutkimus, jossa käytettiin sekvensointi- ja bioinformatiikan menetelmiä: geeniekspression kvantitatiivinen analyysi ja muunnelmien geenikopiomäärä, yksittäisen nukleotidin polymorfismien genotyypitys , genominlaajuinen DNA-metylaatiomallien analyysi. , eksonin sekvensointi . Saatu tieto on julkista, ja kuka tahansa tutkija voi tutustua niihin ja käyttää niitä työssään.
ARG-projekti on osoittanut, että aktiivinen ja laaja-alainen eri instituutioiden tutkijoiden yhteistyö voi olla hedelmällistä ja työn tuloksena saatua dataa voivat hyödyntää tutkijat ympäri maailman.
AWG alkoi vuonna 2005 kolmivuotisena pilottiprojektina [3] . Lähes 100 miljoonaa dollaria myönnettiin AWG:n julkaisuversion rahoittamiseen. Alkuvaiheessa tutkijat luonnehtivat glioblastooma multiformea , keuhkosyöpää ja munasarjasyöpää , koska nämä sairaudet aiheuttavat joka vuosi monia kuolemantapauksia Yhdysvalloissa [4] .
Työn ensimmäinen vaihe saatiin päätökseen onnistuneesti, joten tavoitteena oli karakterisoida 20-25 syöpätyyppiä vuoteen 2014 mennessä. Geneettisten mutaatioiden systematisoinnista huolehtivat kahden tyyppiset keskukset: sekvensointivaiheen järjestivät genomien kuvauskeskukset ja bioinformaattisen data-analyysin genomitietojen analysointikeskukset [ 5] .
Syyskuussa 2013 ARG-projekti keräsi tarpeeksi kasvainkudosnäytteitä yli 30 syöpätyypin karakterisoimiseksi. Vuoteen 2017 mennessä tutkittiin yksityiskohtaisesti 33 tyyppistä pahanlaatuista kasvainta, mukaan lukien 10 harvinaista tyyppiä [6] .
AWG päättyy vuonna 2017, mutta kaikki AWG:n vastaanottamat tiedot pysyvät julkisina. Esimerkki tämän projektin onnistumisesta todistaa useiden organisaatioiden yhteisen työn toteutettavuuden syöpägenomiikan parissa työskennellessä ja auttaa tulevassa alan tutkimuksessa [2] .
Potilailta, joilla on diagnosoitu syöpä, otetaan heidän luvalla pala syöpä- ja normaalikudosta (yleensä verta ). Analyysissä käytettyjä kudoksia ja nesteitä kutsutaan näytteeksi tai biomateriaaliksi.
Genomitutkimukseen käytettävien potilaiden kudosnäytteiden on läpäistävä tiukka laadunvalvonta, jotta niiden geneettistä materiaalia ( DNA ja RNA ) voidaan käyttää monimutkaisessa geneettisessä analyysissä seuraavan sukupolven sekvensointitekniikoilla. ARG:n (Biospecimen Core Resources) [7] näytteiden analysointilaboratoriot suorittavat kudosten testauksen, käsittelyn ja valmistelun jatkoanalyysiä varten sekä DNA:n ja RNA:n suoran eristämisen . Kaikki potilastiedot ovat luottamuksellisia. Näytteille asetetaan tiukat laatukriteerit, esimerkiksi syöpäsolujen pitoisuuden biomateriaalissa on oltava vähintään 60 %. Aikaisemmin tämä kriteeri oli 80%, mutta sitä alennettiin seuraavan sukupolven sekvensoinnin käyttöönoton myötä .
Jokaisen syöpätyypin osalta analysoidaan kasvain ja normaalit kudokset sadoilta potilailta. Tarvitaan suuri määrä näytteitä vastaavan sairauden täydellisen genomiprofiilin määrittämiseksi tilastollisesti . Genominen profilointi on tarpeen kasvaimen kehittymiseen johtavien muutosten tunnistamiseksi. Tämä työ sisältää keskuksia genomien kuvausta varten [8] , korkean suorituskyvyn sekvensoinnin keskuksia [9] sekä keskuksia genomitietojen analysointia varten [10] . Edellinen analysoi monia geneettisiä muutoksia (kuten geenikopiomuunnelmien lukumäärää), jotka voivat mahdollisesti osallistua kasvaimen kehittymiseen, sekä muutoksia geeniekspressiotasoissa syöpäkudoksissa verrattuna normaaleihin kehon soluihin, jotka toimivat kontrolleina. Korkean suorituskyvyn sekvensointikeskukset määrittävät sitten tiettyyn syöpätyyppiin liittyvät muutokset DNA:ssa. Tämä saavutetaan käyttämällä eksomin sekvensointia , 10 % kudoksista läpikäy koko genomin sekvensoinnin sellaisten muutosten tunnistamiseksi, jotka eivät vaikuta eksoneihin , mutta voivat mahdollisesti vaikuttaa syövän transformaatioon. Tuloksena on valtava määrä tietoa, jota genomitietojen analysointikeskukset käsittelevät. Samat keskukset tarjoavat DGA:ssa erilaisia datan visualisointi- ja analysointityökaluja edistääkseen niiden laajempaa käyttöä tutkijoiden keskuudessa ympäri maailmaa.
Kaikki tutkijoiden työskentelyn aikana saadut tiedot tallennettiin TCGA Data Coordinating Centeriin [11] ja syötettiin avoimiin tietokantoihin. Tutkijat etsivät, latasivat ja analysoivat ARG-tietoja käyttämällä asianmukaista portaalia (TCGA Data Portal) [12] , joka sisälsi vastaavien syöpätyyppien genomiprofiilit. Koordinointikeskuksen (DCC) kanssa tehdyn AWG-sopimuksen irtisanomisen vuoksi AWG-tietoportaali suljettiin 15.7.2016. Nyt AWG-projektin tiedot ovat vapaasti saatavilla Genomics Data Commons -portaalissa [13] .
Vuonna 2008 ryhmä ARG-tutkijoita raportoi joitakin tuloksia aivokasvaimen, glioblastooman , tutkimuksessaan ; he löysivät DNA:sta uusia geneettisiä mutaatioita, joita voidaan käyttää diagnoosissa ja hoidossa [17] . Tutkijat saavuttivat tämän tuloksen 206 glioblastoomadiagnoosin saaneen potilaan kasvainkudoksesta eristettyjen genomien laajan tutkimuksen ansiosta. Tiedot sisältävät tietoa pistemutaatioista , kromosomaalisista uudelleenjärjestelyistä (kuten geenikopioiden vaihteluista), geenien ilmentymistasoista ja epigenomiikasta . ARG:n henkilökunta sekvensoi 601 geeniä kasvainkudosnäytteistä ja vertasi näitä tuloksia kontrollinäytteisiin. He pystyivät tunnistamaan merkittäviä ja tilastollisesti merkittäviä mutaatioita, jotka erottavat glioblastoomasolut normaaleista soluista ja joita ei ole aiemmin karakterisoitu. Tutkijat ovat kyenneet tunnistamaan neljä glioblastooman alatyyppiä, jotka eroavat toisistaan genomiominaisuuksiltaan, eloonjäämisasteen, potilaiden iän ja hoitovasteen suhteen [18] . Nämä alatyypit on nimetty proneuraaliseksi, hermo-, klassiseksi ja mesenkymaaliseksi glioblastoomaksi. Potilaiden luokittelu on tärkeää yksilöllisen terapian kehittämisen kannalta, mikä voi johtaa lääketieteellisen hoidon tehokkuuden lisääntymiseen.
Munasarjasyöpä on viidenneksi yleisin naisten kuolinsyy Yhdysvalloissa. Tehokkaiden hoitojen puuttumisen vuoksi tämän diagnoosin saaneiden naisten ennuste on melko negatiivinen: vain 31 % kaikista potilaista elää pidempään kuin viisi vuotta taudin toteamisesta. Tämäntyyppisen syövän tutkimuksen äärimmäisen merkityksen vuoksi ARG:n tutkijat päättivät luonnehtia sitä yhdeksi ensimmäisistä ja ehdottaa mahdollisia uusia hoitokohteita. Tutkijat ovat löytäneet kasvainkudoksista satoja geenejä, jotka on poistettu tai kopioitu . Näistä geeneistä on 68 päällekkäistä geeniä, joiden tuotteille vastaavat inhibiittorit ovat jo tiedossa . Tämä löytö tarjoaa lähtökohdan uusien lääkkeiden etsimiselle munasarjasyövän hoitoon. Tutkijat havaitsivat, että riippuen siitä, mitkä geenit yli-ilmentyvät munasarjakasvainsoluissa, on mahdollista ennustaa potilaan elinajanodote. On tunnistettu 108 ja 85 geeniä, jotka liittyvät hyvään ja huonoon eloonjäämiseen. Ihmiset, jotka yli-ilmentävät vastaavat 108 geeniä, elävät 23 % pidempään kuin ne, jotka yli-ilmentävät muita 85 geeniä. Munasarjasyöpään verrattuna glioblastoomalla on perustavanlaatuisesti erilainen genomimalli: sille ovat enemmän tyypillisiä geneettiset mutaatiot, yleensä samoissa geeneissä, ja geenien kopioiden lukumäärän vaihtelu, toisin kuin munasarjasyöpä, on paljon vähemmän edustettuna. Tämä viittaa siihen, että eri syöpätyypit eroavat toisistaan juuri DNA:n muutosten luonteen suhteen. Jos tämä teoria pitää paikkansa, kullekin syövälle voidaan suunnitella yksilölliset genomiprofiilit [19] .
National Cancer Institute (NCI) ja Human Genome Research Institute (NHGRI) rahoittivat ARG-projektin testiversiota kolmen vuoden ajan , kukin 50 miljoonaa dollaria. Sen jälkeen NCI tarjosi 25 miljoonaa dollaria vuodessa tukeakseen AWG:n toista vaihetta viiden vuoden ajan, ja NHGRI lähetti 25 miljoonaa dollaria vuodessa kahden vuoden ajan. Vuonna 2009 allekirjoitettiin laki (American Recovery and Reinvestment Act, ARRA), joka myönsi ARG:lle 175 miljoonan dollarin lisärahoitusta [20] . Tämän asiakirjan allekirjoittamisen jälkeen alkoi AWG:n olemassaolon toinen vaihe. NCI :n hallitus tarjosi 25 miljoonaa dollaria lisää ensimmäisenä vuonna ARRA:n jälkeen sekvenssianalyysiin ja vielä 25 miljoonaa dollaria ARG:n toisen vaiheen toisena vuonna. Yhteensä 150 miljoonaa dollaria osoitettiin näytteiden sekvensointiin ja 70 miljoonaa dollaria näytteiden keräämiseen, laadunvalvontaan sekä DNA:n ja RNA:n eristämiseen.
ARG sisältää näytteitä yli 11 000 potilaalta 33 syöpätyypistä [21] , ja se on ylivoimaisesti suurin kasvainkokoelma. Näistä näytteistä analysoidaan tärkeimmät genomi- ja molekyyliominaisuudet. ARG-näytteiden keruu päättyi vuonna 2013, ja huhtikuusta 2017 lähtien ARG-tutkijat ovat vihdoin saaneet päätökseen kaikentyyppisten kasvainten eksomi-sekvensoinnin ja koko genomin sekvensoinnin yli 1000 syöpäkudosnäytteelle. Yli 2700 tieteellistä artikkelia viittaa ARG:n työhön, mikä osoittaa tämän hankkeen valtavan roolin syöpää koskevien ideoiden kehittämisessä [22] . Kaikki ARG-tiedot ovat saatavilla ja niitä voidaan käyttää julkaisuihin ilman rajoituksia [23] .
syövän tyyppi | Analysoitujen näytteiden määrä [21] | Tunnistetut mutaatiot [24] |
---|---|---|
Akuutti myelooinen leukemia | 200 | 99,5 %:ssa tapauksista vähintään yksi ei-synonyymi mutaatio tunnistetaan jossakin seuraavista geeneistä: NPM1 (27 %), kasvainsuppressorigeenit (15,5 %),
DNA-metylaatioon liittyvät geenit (43,5 %), signaaligeenit (59 %), kromatiinia modifioivat geenit (30,5 %), myeloiditranskriptiotekijägeenit (22 %), kohesiinikompleksigeenit (13 %) ja silmukointigeenit (13,5 %) [ 25] . |
lisämunuaiskuoren syöpä | 92 | Mutaatiot PRKAR1A-, RPL22-, TERF2-, CCNE1- ja NF1-geeneissä. Myös DNA:n suuren osan toistuva menetys, jota seurasi koko genomin kaksinkertaistuminen, lisääntynyt TERT:n ilmentyminen, telomeerien pituuden väheneminen ja solusykliohjelmien aktivoituminen, havaittiin [26] . |
Virtsarakon uroteelikarsinooma | 412 | Merkittäviä toistuvia mutaatioita 32 geenissä, mukaan lukien geenit, jotka osallistuvat solusyklin säätelyyn, kromatiinin säätelyyn ja kinaasisignalointireitteihin. Jaksottaisia kehyksen sisäisiä FGFR3-TACC3-fuusioita sekä useiden virusten (mukaan lukien HPV16) ilmentymistä ja integraatiota on tunnistettu [27] . |
Aivojen 2 gliooma | 516 | IDH-mutaatioihin ja 1p/19q-deleetioon liittyy mutaatioita CIC-, FUBP1-, NOTCH1-geeneissä ja TERT-geenin promoottorissa; genomiset poikkeamat ovat samanlaisia kuin glioblastoomassa [28] . |
Invasiivinen rintasyöpä | 1098 | Kolmen geenin TP53, PIK3CA ja GATA3 somaattisia mutaatioita havaittiin > 10 %:ssa tapauksista; joissakin tapauksissa havaittiin GATA3-, PIK3CA- ja MAP3K1-geenien spesifisiä mutaatioita [29] . E-kadheriinigeenin menetys ja mutaatiot PTEN-, TBX3- ja FOXA1-geeneissä on myös tunnistettu [30] . |
Kohdunkaulansyöpä | 307 | Mutaatiot SHKBP1-, ERBB3-, CASP8-, HLA-A- ja TGFBR2-geeneissä. Amplifikaatioita havaittiin myös immuunikohteissa CD274/PD-L1 ja PDCD1LG2/PD-L2. HPV-virusten integroituminen havaittiin kaikissa HPV18-infektiotapauksissa ja 76 %:ssa HPV16-infektiotapauksista, johon liittyi erilaisia rakenteellisia poikkeavuuksia ja lisääntynyt kohde-DNA:n ilmentyminen. HPV-negatiivisissa kasvaimissa on tunnistettu toistuvia KRAS-, ARID1A- ja PTEN-geenien mutaatioita [31] . |
Kolangiokarsinooma | 51 | IDH-mutaatiot, joihin liittyy kromatiinimuuntajien alhainen ilmentyminen, lisääntynyt mitokondriogeenien ilmentyminen ja lisääntynyt mitokondrioiden DNA:n kopiomäärä [32] . |
Paksusuolen adenokarsinooma | 461 | Mutaatiot APC-, TP53-, SMAD4-, PIK3CA-, KRAS-, ARID1A-, SOX9- ja FAM123B/WTX-geeneissä, ERBB2:n, IGF2:n monistuminen, NAV2:n ja TCF7L1:n fuusio (WNT-signalointireitin komponentti), hypermetylaatio ja hiljentäminen 75MLH1:ssä % tapauksista [33] . |
Ruokatorven syöpä | 185 | Toistuvat CCND1:n ja SOX2:n ja/tai TP63:n genomiset lisääntymiset okasolukarsinoomassa ja ERBB2:n, VEGFA:n ja GATA4:n ja/tai GATA6:n monistuminen adenokarsinoomassa [34] . |
Glioblastoma multiforme | 617 | Mutaatiot EGFR:ssä, NF1:ssä, TP53:ssa, PlK3R1:ssä, PIK3CA:ssa, IDH1:ssä, PTEN:ssä, RB1:ssä, LZTR1:ssä [35] , mutaatiot kromatiinimuuntajageeneissä 40 %:ssa tapauksista [36] . |
Pään ja kaulan okasolusyöpä | 528 | PIK3CA:n onkogeenimutaatiot, TRAF3-geenin menetys ja E2F1-solusykligeenin monistuminen ovat vallitsevia. Tupakoinnin aiheuttamissa kasvaimissa havaitaan TP53-mutaatioita, CDKN2A:n inaktivoitumista ja 3q26/28:n ja 11q13/22:n monistumista, WNT:tä ja oksidatiivisen stressitekijän NFE2L2:n aktivaatiota [37] . Myös TP63-geenin monistuminen ja immuniteetti- ja lisääntymisgeenien lisääntynyt ilmentyminen [38] . |
Munuaisten kromofobinen karsinooma | 113 | Mutaatio TERT-geenin promoottorialueella, lisääntynyt tämän geenin ilmentyminen [39] . |
Hypernefroidisyöpä | 537 | Mutaatiot VHL :ssä , PBRM1:ssä, ARID1A:ssa, SMARCA4:ssä, mutaatiot PI(3)K/AKT-polun geeneissä, muutokset Krebsin syklin geeneissä, pentoosifosfaattireitin ja glutamiinin kuljettajageenien geeneissä, muutokset MiR-21:n metylaatiossa ja GRB10-promoottori [40] . |
papillaarinen munuaissyöpä | 291 | MET- tai SETD2-mutaatiot, CDKN2A-hiljennys, TFE3-fuusiot, NRF2:n yli-ilmentyminen, ARE-signalointireitin komponentti [41] . |
Maksasolukarsinooma | 377 | |
Keuhkojen adenokarsinooma | 585 | Mutaatioita RIT1:ssä, MGA:ssa, EGFR:ssä (useammin naisilla), RBM10:ssä (useammin miehillä), poikkeavuuksia NF1:ssä, MET:ssä, ERBB2:ssa ja RIT1:ssä havaittiin 13 %:ssa tapauksista [42] . |
Keuhkojen okasolusyöpä | 504 | Mutaatiot TP53:ssa, mutaatiot tärkeimmässä histoyhteensopivuusgeenissä HLA-A, luokka I, mutaatiot squamousin erilaistumisgeeneissä, PI(3)K-reitin geeneissä sekä mutaatiot NFE2L2-, KEAP1-, CDKN2A- ja RB1-geeneissä [43] , TP63-geeni, lisääntynyt ekspressioimmuniteetti ja lisääntymisgeenit [38] . |
Diffuusi suuri B-solulymfooma | 58 | |
Mesoteliooma | 87 | |
Seroottinen munasarjojen kystadenokarsinooma | 608 | TP53:n mutaatiot havaittiin 96 %:ssa tutkituista tapauksista; NF1-, BRCA1-, BRCA2-, RB1- ja CDK12-mutaatiot, 168 geenin promoottorimetylaatio ja 113 geenin merkittävät kopiopoikkeamat, havaittiin myös, että homologinen rekombinaatiojärjestelmä oli vaurioitunut noin puolessa tapauksista [44] . |
Haiman adenokarsinooma | 185 | |
Feokromosytooma ja paragangliooma | 179 | Mutaatiot CSDE1-, HRAS-, RET-, EPAS1- ja NF1-geeneissä; MAML3-, BRAF-, NGFR- ja NF1-geenien erilaiset fuusiot [45] . |
eturauhasen adenokarsinooma | 500 | ERG-, ETV1/4- ja FLI1-geenien fuusio tai SPOP-, FOXA1- ja IDH1-geenien mutaatiot havaittiin 74 %:ssa tapauksista, poikkeavuuksia PI3K- tai MAPK-signalointireiteissä havaittiin 25 %:lla syöpätapauksista ja DNA:n inaktivoituminen. korjausgeenejä havaittiin myös 19 %:lla [46] . |
Peräsuolen adenokarsinooma | 172 | Mutaatiot APC-, TP53-, SMAD4-, PIK3CA-, KRAS-, ARID1A-, SOX9- ja FAM123B/WTX-geeneissä, ERBB2:n, IGF2:n monistuminen, NAV2:n ja TCF7L1:n fuusio (WNT-signalointireitin komponentti), hypermetylaatio ja hiljentäminen 75MLH1:ssä % tapauksista [33] . |
Sarkooma | 261 | |
Ihon melanooma | 470 | Mutaatiot BRAF:ssa, RAS:ssa, NF1:ssä, KIT:ssä [47] . |
Vatsan adenokarsinooma | 443 | PIK3CA-geenin mutaatiot, lisääntyneet DNA-metylaatiotasot, JAK2-, CD274- ja PDCD1LG2-geenien monistuminen [48] . |
Kivesten alkiosolujen kasvaimet | 150 | |
tymooma | 124 | |
Kilpirauhasen syöpä | 507 | EIF1AX, PPM1D, CHEK2 ja erilaiset geenifuusiot [49] . |
Kohdun karsinosarkooma | 57 | Mutaatiot TP53-, PTEN-, PIK3CA-, PPP2R1A-, FBXW7- ja KRAS-geeneissä [50] . |
Kohdun endometriumin sarkooma | 560 | Pieni määrä muutoksia TP53-geenin kopioiden tai mutaatioiden lukumäärässä, toistuvia mutaatioita PTEN-, CTNNB1-, PIK3CA-, ARID1A-, KRAS-, ARID5B-muodossa [51] . |
Uveaalinen melanooma | 80 |