Haulikko menetelmä

Kokeneet kirjoittajat eivät ole vielä tarkistaneet sivun nykyistä versiota, ja se voi poiketa merkittävästi 15.5.2019 tarkistetusta versiosta . tarkastukset vaativat 5 muokkausta .

Haulikkosekvensointi on tekniikka ,  jota käytetään pitkien DNA -osien sekvensointiin . Menetelmän ydin on saada tietyn organismin kloonatuista DNA-fragmenteista satunnainen massiivinen näyte, jonka perusteella voidaan palauttaa alkuperäinen DNA-sekvenssi [1] .

Edellytyksenä haulikkomenetelmän syntymiselle oli se, että ensimmäisillä sekvensointimenetelmillä pystyttiin palauttamaan vain pieniä, noin 1000 nukleotidin DNA-sekvenssejä [2] , joten pitkien sekvenssien sekvensointiin tarvittiin uusi lähestymistapa. Haulikkosekvensoinnissa DNA fragmentoidaan satunnaisesti pieniin osiin, jotka sitten sekvensoidaan millä tahansa käytettävissä olevalla menetelmällä, kuten Sanger-sekvensoinnilla . Saadut päällekkäiset satunnaiset DNA-fragmentit kootaan sitten erityisohjelmistolla yhdeksi kokonaiseksi sekvenssiksi [1] .

Haulikkomenetelmää käytettiin organismien ensimmäisten täydellisten genomien saamiseksi [1] .

Esimerkki

Oletetaan esimerkiksi, että meillä on kaksi satunnaista haulikkopalaa:

Ketju Jakso
Alkukirjain AGCATGCTGCAGTCATGCTTAGGCTA
Ensimmäinen fragmentti AGCATGCTGCAGTCATGCT-------
-------------------TAGGCTA
Toinen fragmentti AGCATG--------------------
------CTGCAGTCATGCTTAGGCTA
Palautettu sekvenssi AGCATGCTGCAGTCATGCTTAGGCTA

Tämä esimerkki on erittäin yksinkertaistettu. Se heijastaa kuitenkin yhtä haulikkosekvenssiprosessin tärkeimmistä piirteistä. Mikään taulukossa esitetyistä neljästä lukemasta ei nimittäin kata kokonaan koko alkuperäistä sarjaa. Alkuperäinen sekvenssi voidaan kuitenkin palauttaa sen perusteella, että kukin alkuperäisen sekvenssin nukleotidi esiintyy vähintään yhdessä lukukerrassa ja lukujen osittaisen päällekkäisyyden vuoksi useammassa kuin yhdessä. [1] .

Todellisten DNA-molekyylien haulikkosekvensointi tuottaa miljoonia lukuja [3] , joista osa voi sisältää virheitä, jotka on sitten yhdistettävä alkuperäiseen sekvenssiin. Tämän suuruista työtä ei tietenkään voida tehdä manuaalisesti, joten DNA-sekvenssin kokoamiseen lukemista käytetään erityisiä ohjelmistoja . Tehtävää mutkistaa se, että DNA sisältää usein toistuvia sekvenssejä , mikä tarkoittaa, että samanlaisia ​​lukemia voidaan saada toisistaan ​​kaukana olevista DNA:n osista [4] .

Tämän ongelman ratkaisemiseksi sekvensointi suoritetaan yleensä siten, että jokainen alkuperäisen sekvenssin nukleotidi ei esiinny yhdessä, vaan useissa lukukerroissa kerralla. Esimerkiksi ihmisen genomia sekvensoitaessa käytettiin 12-kertaista peittoa, eli jokainen nukleotidi löydettiin keskimäärin 12 lukemasta [5] .

Koko genomin haulikkosekvensointi

Historia

Ajatus haulikkomenetelmän käytöstä pienten genomien (4000–7000 kb) sekvensointiin esitettiin vuonna 1979 [1] . Ja kaksi vuotta myöhemmin, vuonna 1981, haulikkomenetelmää käytettiin ensimmäisen kerran käytännössä sekvensoimaan kukkakaalin mosaiikkiviruksen koko genomi [6] [7] .

Menetelmä

Haulikon sekvensointiprosessi koostuu useista vaiheista. Ensin sekvensoitava DNA monistetaan . Tuloksena saadut DNA-kopiot leikataan fragmenteiksi käyttämällä ei-spesifisiä nukleaaseja. Paikan epäspesifisyys on tärkeää päällekkäisten fragmenttien saamiseksi [8] [9] . Genomikirjasto rakennetaan saaduista fragmenteista upottamalla fragmentit johonkin vektoriin . Tietty osajoukko fragmentteja valitaan satunnaisesti tuloksena olevasta genomisesta kirjastosta, joista jokainen sekvensoidaan esimerkiksi Sangerin menetelmällä . Sitten erityisohjelmiston avulla alkuperäisen DNA:n nukleotidisekvenssi kootaan saaduista fragmenttien nukleotidisekvensseistä, joita kutsutaan lukuteksteiksi [1] .

Kokoonpano

Alkuperäisen DNA-sekvenssin kokoamisprosessin aikana päällekkäiset lukemat kootaan suuremmiksi sekvensseiksi, joita kutsutaan jatkuviksi. Jatkoviivat ovat rekonstruoitavan DNA-sekvenssin vierekkäisiä osia. Jatkut puolestaan ​​yhdistetään vielä suuremmiksi sekvensseiksi - telineiksi - jotka eivät enää välttämättä ole alkuperäisen DNA:n jatkuvia osia ja voivat sisältää aukkoja. Jos sekvensointi suoritettiin parillisten lukujen menetelmällä , niin telineen jatkuvien etäisyys voidaan johtaa parillisten lukujen sijaintitietojen perusteella [10] . Riippuen jatkeiden välisestä etäisyydestä voidaan käyttää erilaisia ​​menetelmiä telineen aukkojen täyttämiseen. Jos aukko on pieni (5–20 kb), alue monistetaan PCR :llä ja sitten sekvensoidaan. Jos aukko on suuri (> 20 kb), puuttuva fragmentti kloonataan erityisiin vektoreihin, kuten bakteerin keinotekoiseen kromosomiin , minkä jälkeen suoritetaan vektorin sekvensointi [11] .

Parillinen lukujärjestys

Kun yhä pidempiä DNA-sekvenssejä alettiin sekvensoida, kävi selväksi, että oli hyödyllistä sekvensoida molemmat DNA-juosteet. Ensinnäkin on tapauksia, joissa DNA-konformaation erityispiirteistä johtuen nukleotidin määrittäminen tietyssä kohdassa toisessa ketjussa on erittäin vaikeaa, kun taas toisessa juosteessa samassa kohdassa oleva nukleotidi voidaan määrittää helposti. Toiseksi tietoa parillisten lukujen suhteellisesta sijainnista voidaan käyttää määrittämään rakennustelineen jatkuvien etäisyyksien välinen etäisyys. Haulikkomenetelmän modifikaatiota, joka sekvensoi molemmat DNA-juosteet, kutsutaan paritukselliseksi lukusekvenssiksi tai "kaksipiippuiseksi" haulikkomenetelmäksi. Tämä menetelmä on yleistynyt ja sitä on käytetty erityisesti ihmisen genomin sekvensoinnissa [5] .

Pareittain luetussa sekvensoinnissa DNA leikataan satunnaisiksi fragmenteiksi, jotka sitten ryhmitellään painon mukaan (tyypillisesti 2, 10, 50 ja 150 kb) ja kloonataan vektoreihin . Kloonit sekvensoidaan molemmista päistä käyttämällä ketjun lopetusmenetelmää , mikä johtaa kahteen lyhyeen sekvenssiin. Jokaista sekvenssiä kutsutaan lopulliseksi lukuksi tai yksinkertaisesti lukuksi, ja kaksi lukusekvenssiä samasta kloonista ovat parillisia päätteitä. Koska lukujen pituus ketjun lopetusmenetelmää käytettäessä ei yleensä ylitä 1000 emäsparia, kaikissa paitsi pienimmässä klooneissa paritetut päät menevät harvoin päällekkäin [12] .

Ensimmäinen julkaistu kuvaus paired-end-sekvensointimenetelmän käytöstä on vuodelta 1990 [13] . Tämä työ keskittyi ihmisen hypoksantiini-guaniinifosforibosyylitransferaasigeenin sekvensointiin , mutta parillisia päitä käytettiin vain sekvenssin aukkojen korjaamiseen klassisen haulikkomenetelmän soveltamisen jälkeen. Vuonna 1991 julkaistiin ensimmäinen teoreettinen kuvaus paripään sekvensoinnista täydessä muodossaan [14] , jossa käytettiin vakiopituisia fragmentteja. Tuolloin uskottiin, että parillisia päitä sekvensoitaessa on optimaalista käyttää fragmentteja, joiden pituus on kolme kertaa lukujen pituus. Vuonna 1995 osoitettiin [12] , että on mahdollista käyttää erikokoisia fragmentteja sekvensoitaessa parillisia päitä, mikä osoittaa, että tätä lähestymistapaa voidaan käyttää pitkien DNA-sekvenssien sekvensoimiseen. Myöhemmin tätä lähestymistapaa käytettiin aktiivisesti eri organismien genomien sekvensoinnissa: Haemophilus influenzaen genomin vuonna 1995 [15] , Drosophilan ( hedelmäkärpäsen ) genomin vuonna 2000 [16] ja lopuksi ihmisen genomin [5] vuonna 2001.

Kattavuus

Kattavuus on keskimääräinen lukujen lukumäärä, jotka kattavat yhden kohdan rekonstruoidussa sekvenssissä. Se voidaan laskea alkuperäisestä genomin pituudesta ( ), lukujen lukumäärästä ( ) ja keskimääräisestä lukupituudesta ( ), kuten: . Kattavuutta kutsutaan joskus myös lukujen peittämien genomiasemien osuukseksi. Haulikkomenetelmän korkea kattavuus on välttämätöntä, koska sen avulla voit päästä eroon kokoonpanovirheistä, jotka liittyvät toistuvien sekvenssien esiintymiseen DNA:ssa [17] .

Hierarkkinen haulikkojärjestys

Motivaatio

Teoriassa haulikkomenetelmää voidaan soveltaa kaikenkokoisiin genomeihin, mutta alun perin sen todellisen soveltamisen mahdollisuus koko genomin sekvensointiin kyseenalaistettiin sekä suurten tietomäärien käsittelyssä syntyvien teknisten vaikeuksien vuoksi että lisävaikeuksien vuoksi syntyvät, koska suurissa genomeissa on valtava määrä toistuvia alueita [18] . Hierarkkisen sekvensoinnin tulo mahdollisti haulikkomenetelmän soveltamisen suuriin genomeihin käytännössä.

Menetelmä

Monistettu genomi leikataan ensin suuriksi paloiksi (50–200 kb) ja kloonataan bakteeri-isäntään käyttämällä keinotekoista bakteerikromosomia . Koska genomista leikattiin satunnaisesti useita kopioita, näiden kloonien sisältämillä fragmenteilla, joita kutsutaan myös BAC-kontigeiksi, on erilaiset päät, mikä tarkoittaa, että voidaan löytää teline, jolla on tyydyttävä peitto ja joka kattaa koko genomin. Tällaista telinettä kutsutaan peitepoluksi [19] .

Kun peittävä polku on löydetty, tämän polun muodostavat BAC-jatkokset leikataan satunnaisesti pienemmiksi fragmenteiksi, jotka sitten sekvensoidaan haulikkomenetelmällä. Vaikka BAC-kontigtien nukleotidisekvenssit ovat tuntemattomia, niiden suhteellinen asema voidaan määrittää, ja tätä tietoa voidaan sitten käyttää peittävän reitin rakentamiseen [19] .

Päällekkäiset kloonit voidaan tunnistaa useilla tavoilla. Yksi tapa on käyttää pientä radioaktiivisesti tai kemiallisesti leimattua DNA-sekvenssiä (STS). Tällainen sekvenssi hybridisoituu mikrosirulle , jossa klooneja tuotetaan [19] . Siten kaikki leimatun sekvenssin sisältävät kloonit tunnistetaan. Yhden näistä klooneista pää sekvensoidaan ja sitä käytetään uutena STS-sekvenssinä. Tätä iteratiivista prosessia kutsutaan kromosomikävelyksi [20] .

Toinen tapa tunnistaa risteäviä klooneja on käyttää restriktioentsyymejä . Tietty osa genomista käsitellään joukolla restriktionukleaaseja, minkä jälkeen tuloksena olevien DNA-fragmenttien kokoa verrataan. Tämän avulla voit rakentaa rajoituskartan, joka osoittaa kunkin rajoituskohdan sijainnin suhteessa muihin paikkoihin [19] . Tätä genomisen kartoitusmenetelmää kutsutaan restriktiokartoitukseksi, koska se tunnistaa jokaisen kloonin sisältämät restriktiokohdat [21] .

Tarve rakentaa laaja BAC-kirjasto ja valita peittävä polku tekee hierarkkisesta sekvensoinnista paljon hitaampaa ja työläämpää kuin haulikkogenomin sekvensointi. Ja nyt, kun tekniikat mahdollistavat tarvittavien laskumäärien suorittamisen riittävän nopeasti ja tiedoista on tullut varsin luotettavaa, haulikkolaajuinen genomin sekvensointi on korvaamassa hierarkkisen sekvensoinnin, koska se on tehokkaampaa sekä nopeuden että kustannusten kannalta [18] .

Haulikkomenetelmä ja seuraavan sukupolven sekvensointimenetelmät

Klassinen haulikkomenetelmä perustui Sangerin menetelmään ja oli edistynein genomin sekvensointimenetelmä noin vuoteen 2005 asti. Haulikkomenetelmää käytetään edelleen, mutta se on korvattu uusilla sekvensointitekniikoilla, joita kutsutaan usein yhteisesti  seuraavan sukupolven sekvensointiteknologiaksi . Nämä tekniikat tuottavat lyhyempiä lukuja (suuruusluokkaa 25-500 bp), mutta erittäin suurella nopeudella (noin miljoona lukua päivässä) [3] . Tämän seurauksena kattavuus kasvaa , mutta genomin kokoamisesta lukemista tulee laskennallisesti aikaa vievämpää. Kaiken kaikkiaan seuraavan sukupolven sekvensointimenetelmät vaativat haulikkomenetelmään verrattuna suuria laskentaresursseja, mutta niiden avulla voidaan saada täydellinen genomisekvenssi lyhyemmässä ajassa [22] .

Muistiinpanot

  1. 1 2 3 4 5 6 Staden R. DNA-sekvensoinnin strategia tietokoneohjelmalla  //  Nucleic Acids Research. - 1979. - Voi. 6 , ei. 7 . Arkistoitu alkuperäisestä 5. maaliskuuta 2016.
  2. Sanger F., Nicklen S., Coulson AR DNA-sekvensointi ketjun päättävien estäjien kanssa   // PNAS . - 1977. - Voi. 74 , nro. 12 . - P. 5463-5467 . Arkistoitu alkuperäisestä 2. huhtikuuta 2017.
  3. 1 2 Voelkerding KV, Dames SA, Durtschi JD Seuraavan sukupolven sekvensointi: Perustutkimuksesta diagnostiikkaan  //  Kliininen kemia. - 2009. - Vol. 55 , nro. 4 . - s. 41-47 . Arkistoitu alkuperäisestä 14. toukokuuta 2016.
  4. Jason de Koning AP, Gu W., Castoe TA et ai. Toistuvat elementit voivat käsittää yli kaksi kolmasosaa ihmisen genomista  //  PLoS Genetics. - 2011. - Vol. 7 , ei. 12 . Arkistoitu alkuperäisestä 2. heinäkuuta 2017.
  5. 1 2 3 Lander ES, Linton LM, Birren B. et ai. Ihmisen genomin alkusekvensointi ja analyysi   // Luonto . - 2001. - Voi. 409 , no. 6822 . - s. 860-921 . Arkistoitu alkuperäisestä 15. kesäkuuta 2018.
  6. Gardner RC, Howarth AJ, Hahn P., Brown-Luedi M., Shepherd RJ, Messing J. Kukkakaalin mosaiikkiviruksen tarttuvan kloonin täydellinen nukleotidisekvenssi M13mp7-haulikkosekvensoinnilla  //  Nucleic Acids Research. - 1981. - Voi. 9 , ei. 12 . - P. 2871-2888 . Arkistoitu alkuperäisestä 15. syyskuuta 2019.
  7. Doctrow B. Joachim Messingin profiili  //  PNAS. - 2016. - Vol. 113 , nro. 29 . - P. 7935-7937 . Arkistoitu alkuperäisestä 26. toukokuuta 2018.
  8. Staden R. DNA-sekvensoinnin strategia tietokoneohjelmia käyttäen  //  Nucleic Acids Research. - 1979. - Voi. 6 , ei. 7 . - P. 2601-2610 . Arkistoitu 1. joulukuuta 2020.
  9. Anderson S. Shotgun-DNA-sekvensointi käyttäen kloonattuja DNaasi I:n tuottamia fragmentteja  //  Nucleic Acids Research. - 1981. - Voi. 9 , ei. 13 . - s. 3015-3027 . Arkistoitu alkuperäisestä 22. joulukuuta 2015.
  10. Fullwood MJ, Wei CL, Liu ET et ai. Seuraavan sukupolven DNA-sekvensointi paired-end tags (PET) transkriptio- ja genomianalyyseissä  //  Genomitutkimus. - 2009. - Vol. 19 , ei. 4 . - s. 521-532 . Arkistoitu alkuperäisestä 20. toukokuuta 2016.
  11. Gregory S. Contig Assembly  //  Encyclopedia of Life Sciences. - 2005. Arkistoitu 24. heinäkuuta 2017.
  12. 1 2 Roach JC, Boysen C., Wang K., Hood L. Pairwise end sekvensointi: yhtenäinen lähestymistapa genomisen kartoitukseen ja sekvensointiin   // Genomics . - 1995. - Voi. 26 , nro. 2 . - s. 345-353 . Arkistoitu alkuperäisestä 2. lokakuuta 2016.
  13. Edwards A., Caskey T. Sulkemisstrategiat satunnaiseen DNA-sekvensointiin  //  A Companion to Methods in Enzymology. - 1991. - Voi. 3 , ei. 1 . - s. 41-47 . Arkistoitu alkuperäisestä 24. syyskuuta 2015.
  14. Edwards A., Voss H., Rice P., Civitello A., Stegemann J., Schwager C., Zimmerman J., Erfle H., Caskey T., Ansorge W. Ihmisen HPRT-lokuksen  automatisoitu DNA-sekvensointi.)  // Genomiikka. - 1990. - Voi. 6 , ei. 4 . - s. 593-608 . Arkistoitu alkuperäisestä 24. joulukuuta 2013.
  15. Fleischmann R. D. et ai. Haemophilus influenzae Rd:n koko genomin satunnaissekvensointi ja kokoonpano   // Tiede . - 1995. - Voi. 269 , nro. 5223 . - s. 496-512 . Arkistoitu alkuperäisestä 7. maaliskuuta 2016.
  16. Adams M.D. et ai. Drosophila melanogasterin genomisekvenssi  (englanniksi)  // Tiede. - 2000. - Voi. 287 , nro. 5461 . - s. 2185-2195 . Arkistoitu alkuperäisestä 12. huhtikuuta 2016.
  17. Meyerson M., Gabriel S., Getz G. Edistyy syövän genomien ymmärtämisessä toisen sukupolven sekvensoinnin avulla.  (englanniksi)  // Nature Reviews Genetics. - 2010. - Vol. 11 , ei. 10 . - s. 685-696 . Arkistoitu alkuperäisestä 14. joulukuuta 2015.
  18. ↑ 1 2 Venter JC Shotgunning the Human Genome: A Personal View  //  Encyclopedia of Life Sciences. – 2006.
  19. ↑ 1 2 3 4 Hyvä PH genomikartoitus  //  Encyclopedia of Life Sciences. - 2005. Arkistoitu 3. kesäkuuta 2016.
  20. Chinault AC, Carbon J. Päällekkäishybridisaatioseulonta: Hiivan kromosomin III leu2-geeniä ympäröivien päällekkäisten DNA-fragmenttien eristäminen ja karakterisointi   // Gene . - 1979. - Voi. 5 , ei. 2 . - s. 111-126 .
  21. Gibson G., Muse SV A Primer of Genome Science. (Englanti)  // Biotieteiden tietosanakirja. - 2006. - Voi. 3. , ei. 84 .
  22. Metzker ML -sekvensointiteknologiat - seuraava sukupolvi  //  Nature Reviews Genetics. - 2010. - Vol. 11 , ei. 1 . - s. 31-46 . Arkistoitu alkuperäisestä 4. maaliskuuta 2016.

Linkit