STARR-Seq ( itsetranskriboiva aktiivisen säätelyalueen sekvensointi ) on menetelmä miljoonien DNA -sekvenssien tehostajaaktiivisuuden analysoimiseksi samanaikaisesti mielivaltaisten organismien genomeista . STARR-seqillä on korkea suorituskyky, ja sitä voidaan käyttää genominlaajuiseen etsimiseen ja tehostajaaktiivisuuden kvantifiointiin [1] .
Eukaryooteissa transkriptiota säätelevät transkriptiotekijät - proteiinit , jotka sitoutuvat tiettyihin DNA-alueisiin geenipromoottoreissa sekä alueille, jotka eivät sijaitse geenien välittömässä läheisyydessä, mukaan lukien tehostajat . Tehostajat ovat DNA:n ei-koodaavia alueita, jotka sisältävät spesifisiä sitoutumiskohtia erilaisille transkriptiotekijöille [2] . Tehostajat rekrytoivat transkriptiotekijöitä, jotka aktivoivat RNA-polymeraasi II:n ja yleiset transkriptiotekijät lähellä promoottoria, mikä johtaa geenin transkriptioon. Tehostajat voivat säädellä kohdegeenien transkriptiota kudosspesifisellä tavalla [1] riippumatta niiden sijainnista DNA:ssa ja etäisyydestä geenipromoottorista. Joissakin tapauksissa ne voivat säädellä eri kromosomissa sijaitsevien geenien transkriptiota [3] . Toistaiseksi tieto on kuitenkin rajoittunut muutaman tehostajan tutkimukseen niiden genominlaajuisen haun monimutkaisuuden vuoksi [2] . Lisäksi monet säätelyelementit toimivat yksinomaan tietyissä solutyypeissä ja tietyissä olosuhteissa [4] .
Tehostajien määrittämiseksi Drosophilassa käytetään tekniikkaa, jossa käytetään minimaalista promoottoria koodaavan transposonin satunnaista insertiota reportteriproteiinin kanssa . Tämä menetelmä tarjoaa tietoa geenien säätelystä, jotka sijaitsevat lähellä insertiokohtaa tehostajilla [5] .
Viime vuosina on tutkittu erilaisia aktiivisten ja inaktiivisten tehostajien ominaisuuksia postgenomisen teknologian avulla. Uusien menetelmien, kuten DNase-seq , FAIRE-Seq , ChIP-seq , kehittäminen mahdollisti tehostajien sijainnin ennustamisen genomissa. DNase-seq ja FAIRE-seq eivät kuitenkaan salli tehostajan ja sen aktiivisuuden suoraa määritystä. Lisäksi näillä menetelmillä ei voida testata suurta määrää ehdokassekvenssejä tehostajaaktiivisuuden esiintymisen suhteen. STARR-seq:n kehittäminen mahdollistaa tehostajien etsimisen genomin laajuisesti ja niiden aktiivisuuden kvantifioinnin [1] .
Idea STARR-seq:stä esitettiin A. Starkin laboratoriossa (A. Stark, Institute of Molecular Pathology , Wien , Itävalta ) genominlaajuiseen mielivaltaisten organismien tehostajien etsimiseen sekä niiden toiminnan määrällinen määrittäminen. Menetelmä perustuu siihen, että tehostajat voivat toimia riippumatta niiden suhteellisesta sijainnista DNA:ssa. Menetelmän ydin on potentiaalisen tehostajan sijainti minimaalisen promoottorin jälkeen, jolloin aktiivinen tehostaja voi aktivoida oman sekvenssinsä sisältävän DNA:n transkription. Kunkin tehostajan aktiivisuudelle on tunnusomaista RNA :n rikastumisaste tehostajasekvenssillä kaikkien solujen RNA:iden joukossa. Tätä lähestymistapaa käyttämällä on mahdollista tarkistaa samanaikaisesti miljoonia DNA-leikkeitä mielivaltaisesta lähteestä [1] .
Genominen DNA hajotetaan satunnaisesti pieniksi fragmenteiksi. Tietyn pituiset fragmentit valitaan, adapterit sidotaan niihin. Sen jälkeen DNA - fragmentit sovittimien kanssa monistetaan . PCR - tuotteet puhdistetaan ja insertoidaan plasmidiin minimipromoottorin jälkeen reportterigeenin 3'-transloitumattomalla alueella , jolloin aktiivinen tehostaja voi aktivoida RNA-polymeraasin transkription DNA-alueelta, joka sisältää transkription aloituskohdan jälkeen sekvenssin. itse tehostajasta. Sitten solut transfektoidaan tuloksena saadulla reportterikirjastolla ja viljellään. Polyadenyloitu RNA eristetään kokonais-RNA:sta ja cDNA saadaan käänteistranskriptiolla , joka monistetaan, minkä jälkeen fragmenttien sekvenssi tunnistetaan paripäisen sekvensoinnin avulla . Sekvensoidut fragmentit kartoitetaan referenssigenomiin ja tiedot lähetetään tietokonekäsittelyyn [1] .
STARR-seq-menetelmää sovellettiin alun perin Drosophilan genomiin . Havaittiin, että suurin osa (55,6 %) tehostajista sijaitsee introneissa , erityisesti ensimmäisessä intronissa, ja intergeenisillä alueilla. On mielenkiintoista, että pieni osa (4,5 %) tehostajista sijaitsee transkription aloituskohdissa, ja siksi voidaan olettaa, että nämä tehostajat voivat sekä aloittaa transkription tästä kohdasta että vaikuttaa muiden geenien transkriptioon. Aktiivisimmat tehostajat sijaitsevat lähellä konstitutiivisia geenejä , kuten sytoskeletaalisia proteiineja koodaavia geenejä, ja joitain kehityssäätelyaineita, kuten transkriptiotekijöitä. Kirjoittajat osoittivat, että monia geenejä säätelevät useat itsenäiset aktiiviset tehostajat. Lisäksi kävi ilmi, että geenin ilmentymistasot korreloivat keskimäärin tehostajan kokonaisaktiivisuuden kanssa geeniä kohti, mikä tarjoaa suoran yhteyden ilmentymistason ja tehostajaaktiivisuuden välillä [1] .
Käyttämällä STARR-seq:ää säätelevien alleelivarianttien etsimiseen ja karakterisoimiseen Vockey ym. havaitsivat ihmisen geneettisen variaation vaikutukset ei-koodaavien säätelyelementtien toimintaan mittaamalla 100 oletetun tehostajan aktiivisuutta 95 yksilön genomista. Tämä lähestymistapa mahdollistaa genomisissa lokuksissa sijaitsevien säätelyvarianttien (mukaan lukien SNP :t) tunnistamisen, jotka myötävaikuttavat eri mRNA :iden ilmentymistasojen muutoksiin ( eQTL ), sekä myötävaikuttavat monimutkaisiin fenotyyppeihin [7] .
STARR-seq-menetelmällä on seuraavat edut:
STARR-seq yhdistää klassiset molekyylibiologian menetelmät erittäin erikoistuneisiin bioinformaattisiin menetelmiin tehostajaaktiivisuuden havaitsemiseksi ja kvantifioimiseksi. Tähän mennessä STARR-seq:iä on käytetty hiiren ja ihmisen soluissa, ja sen tehokkuus on vahvistettu [8] . STARR-seq:n soveltaminen erilaisiin eri organismien solutyyppeihin mahdollistaa merkittävän askeleen geenisäätelyn ja siitä vastuussa olevien signalointireittien tutkimuksessa kehityksen ja solujen erilaistumisen aikana normaaleissa ja patologisissa olosuhteissa [6 ] .