16S rRNA on yksi kolmesta rRNA :n päätyypistä, jotka muodostavat prokaryoottisten ribosomien selkärangan . rRNA:n nimessä olevat numerot ovat yhtä suuria kuin sedimentaatiovakion arvo . Vastaavasti tietylle molekyylille tämä arvo on 16S ( Swedberg-yksikköä ). Kaiken kaikkiaan prokaryoottisista mikro-organismeista löydettiin kolmen tyyppistä rRNA:ta: 23S ja 5S ribosomin suuresta alayksiköstä (50S), 16S ribosomin pienestä alayksiköstä (30S). Samalla tavalla kahden muun rRNA-molekyylin vakiot ovat 23 ja 5 S, vastaavasti. 16S rRNA :n eukaryoottinen analogi on 18S rRNA [1] .
Tähän mennessä 16S rRNA:n ja 18S rRNA:n nukleotidisekvenssejä on tutkittu yli 400 lajin osalta eri villieläinten valtakunnista . 16S rRNA - geenisekvenssiä käytetään pääasiassa bakteerien ja arkkien fylogenetiikkaa tutkittaessa . Vuodesta 2010 lähtien on käynnistetty Earth Microbiome -projekti , joka kokoaa yhteen aihetta koskevan tutkimuksen. 16S rRNA-geenisekvenssiä käytetään myös patogeenisten bakteerien lääketieteellisessä tutkimuksessa.
Eisenberg ja Litaur eristivät ensimmäisen kerran 16S - rRNA :n vuonna 1959 Escherichia colin RNA :n fysikaalisten ominaisuuksien eristämiseksi ja tutkimiseksi . RNA- ja DNA -liuosten viskositeettien vertailun perusteella he ehdottivat, että RNA on yksijuosteinen molekyyli. Bakteerisoluista eristettyjä RNA-molekyylejä erotettaessa löydettiin kaksi RNA-fraktiota, jotka eroavat sedimentaatiokertoimien arvoista. Kevyemmälle jakeelle kerroin oli 16S ja raskaamman jakeen 25S [2] .
Myöhemmin, 1960-luvulla, A. Belozersky ja A. Spirin havaitsivat, että rRNA:n osuus kaikista solujen RNA:sta on 80–90 %. He myös kuvasivat ensimmäistä kertaa eron rRNA:n rakenteessa ja koostumuksessa prokaryoottisissa ja eukaryoottisissa organismeissa. Prokaryoottisen tyypin ribosomien ja rRNA:n löytämisestä mitokondrioissa ja kloroplasteissa tuli yksi symbiogeneesiteorian todisteista [3] [4] [5] .
16S- rRNA : n primäärirakennetta edustaa yksijuosteinen sekvenssi, joka koostuu 1600 ribonukleotidista . Koko sekvenssin ajan, monille lajeille konservoitunut, ja hypervariaabelit alueet ovat jakautuneet tasaisesti. Alueita kutsutaan konservatiivisiksi, joiden sekvenssit poikkeavat hieman tai eivät eroa lainkaan tarkasteltavina olevissa organismeissa. Hypervariaabelit ovat alueita, joiden sekvenssit eroavat suuresti kaukaisissa organismeissa, mutta läheisissä organismeissa niillä on tietty prosenttiosuus samankaltaisuutta [6] [7] .
16S - rRNA-geeni sisältää yhdeksän hypervariaabelia aluetta, jotka on nimetty V1-V9:ksi. Jokainen alue on 30-100 emäsparin pituinen. Nämä kohdat ovat mukana ribosomin pienen alayksikön sekundaarirakenteen muodostumisessa . Hypervariaabelien alueiden välissä 16S-rRNA-geeni sisältää erittäin konservoituneita sekvenssejä. Hypervariaabelien alueiden konservatiivisuuden aste ei ole sama - on osoitettu, että konservoituneempien alueiden sekvenssit ovat samankaltaisia organismeissa korkealuokkaisten taksonien tasolla ja vähemmän konservatiivisia - alhaisten taksonomisten ryhmien , kuten sukujen , tasolla. ja lajit [8] [9] .
16S rRNA : n sekundaarirakenteessa voidaan erottaa 4 hyvin määriteltyä domeenia (kuten proteiinidomeeni , RNA-domeeni on stabiili, itsekokoontuva molekyylin rakenne): 5'-domeeni (tähteet 1-556), keskusalue. (tähteet 564-912) ja kaksi '-päätä (suuri domeeni 926-1391 ja pieni domeeni 1392-1542). Eri domeenit on erotettu toisistaan helikseillä, jotka päättyvät RNA- hiusneulaan . Myös 16S-rRNA:n sekundaarinen rakenne sisältää 5'- ja 3'-parittomia emäksiä, jotka muodostavat silmukoita. Oletetaan, että nämä emäkset voivat osallistua 16S rRNA:n tertiaarisen rakenteen muodostumiseen yhdistäen vetysidosten kautta , ei kanonisen Watson-Crick-emässidoksen mukaisesti [11] .
Seuraavat toiminnot on kuvattu 16S rRNA:lle:
Kaikki kolme prokaryoottista rRNA-geeniä (16S, 23S ja 5S ) ovat yhteistranskriptoidussa operonissa , ja ne erotetaan tRNA -geenien ja spacer-sekvenssien avulla . Endonukleaasien suorittaman primaarisen transkriptin käsittelyn aikana spacer-sekvenssit poistetaan ja välituotteet ilmestyvät tuotteena ja lopulta kypsänä RNA:na [13] .
16S-rRNA on ribosomin pienen alayksikön komponentti ja sillä on tärkeä rooli mRNA :n dekoodauksessa . rRNA-prekursori on 17S-rRNA, joka vapautuu primäärisestä transkriptistä RNaasi III -nukleaasin toimesta . 5'-pään jatkokäsittely suoritetaan RNaasien E ja G avulla. Kuinka 3'-pää käsitellään, on tällä hetkellä epäselvä [13] .
16S- rRNA-sekvenssiä edustaa yhdeksän hypervariaabelia aluetta ja konservoituneita sekvenssejä, jotka erottavat ne. Näiden primäärirakenteen ominaisuuksien vuoksi ehdotettiin 16S-rRNA -geenin käyttöä fylogeneettisiin tutkimuksiin . Ensimmäinen tiedemies, joka käytti 16S rRNA:ta perhesuhteiden luomiseen bakteeriryhmien välille, oli Carl Woese . Hän ehdotti, että 16S-rRNA-geeniä voitaisiin käyttää luotettavana molekyylikellona , koska havaittiin, että evoluutionaalisesti etäisten bakteerilajien 16S-rRNA:lla on samanlaiset osat sekvenssistä ja toiminnasta [14] [1] [15] .
Siten hypervariaabelit alueet mahdollistavat eri lajien erottamisen toisistaan, ja erittäin konservoituneiden alueiden läsnäolo mahdollistaa universaalien alukkeiden luomisen, joita voidaan käyttää bakteerien ja arkkien tutkimiseen riippumatta niiden taksonomisesta kuulumisesta. Weisburg ym. [14] kehittivät ensimmäisen laajalti käytetyn yleisalukkeen parin.
On myös huomattava, että valittu alukkeen pariutumisalue on niin konservatiivinen, että universaaleja alukkeita voidaan käyttää mitokondrioiden ja kloroplastien , alfa-proteobakteerien ja syanobakteerien jälkeläisten, 16S-rRNA : n monistamiseen [16] .
Sekvensointimenetelmiä yleisalukkeilla käytetään lääketieteellisessä mikrobiologiassa nopeana ja halvana vaihtoehtona morfologiselle bakteeritunnistuksen menetelmälle , joka vaatii paljon manipulaatioita, mukaan lukien usein tarpeen viljellä mahdollista taudinaiheuttajaa laboratorio-olosuhteissa pitkään. Lisäksi sekvensointi antaa luotettavampia tuloksia [17] . Tällä alalla käytetään tiettyjä hypervariaabelialueita: esimerkiksi V3-alue on paras patogeenisuvujen tunnistamiseen ja V6-alue lajien tunnistamiseen [18] .
Vuonna 2010 käynnistettiin Earth Microbiome -projekti , joka asetti itselleen kunnianhimoisen tehtävän luoda maailmanlaajuinen luettelo planeettamme viljelemättömien mikro -organismien biologisesta monimuotoisuudesta , toisin sanoen niistä, joita on vaikea kasvattaa ja ylläpitää laboratoriossa. . Tämän laajan tutkimuksen tarkoituksena on analysoida mikrobiyhteisöjä yli 200 000 ympäristönäytteestä, jotka laboratoriot ovat toimittaneet ympäri maailmaa. 16S-rRNA-geenien sekvenssejä käytetään määrittämään näytteissä olevien mikro-organismien taksonominen kuuluvuus. DNA eristetään kerätyistä näytteistä ja sitten suoritetaan PCR 16S rRNA:n alukkeilla. PCR:n aikana saadut amplikonit sekvensoidaan . Tällaisessa tutkimuksessa voidaan käyttää Illumina , Ion Torrent -sekvensointiteknologioita ja myös muita alustoja . Yleensä kiinnostavien hypervariaabelien alueiden täydelliset sekvenssit voidaan saada yhden sekvensointitapahtuman jälkeen [19] . Projektissa on tähän mennessä analysoitu yli 30 000 näytettä [20] .
Tällaisissa tutkimuksissa kiinnitetään erityistä huomiota alukkeiden ja monistettavan fragmentin valintaan . Tärkeimmät kriteerit ovat tutkittujen organismien (tässä tapauksessa arkeoiden ja bakteerien) täydellinen kattavuus ja sekvenssin fylogeneettinen erottelukyky eli kuinka yksityiskohtaisesti organismin taksonominen kuuluvuus sekvenssistä on mahdollista määrittää [21] .
Earth Microbiome Project käyttää hypervariaabelia alueita V4 ja V4-V5 mikro- organismien luokitteluun , koska näitä alueita pidetään optimaalisina mikrobiyhteisöjen luokittelussa . Näiden fragmenttien PCR-alukkeet ovat parannus aiemmin käytettyihin alukkeisiin 515F, 907R ja 806R. Alukkeiden vanhan version parantamista vaadittiin, jotta pystyttiin saamaan pidempiä amplikoneja, mikä teki mahdolliseksi tunnistaa paremmin Crenarachaeota/Thaumarchaeota-ryhmien organismit, joiden tarkkaa luokitusta ei voitu määrittää aiemmin [22] [23] .
Vahvistettava alue | Pohjan nimi | Alukesekvenssi (5'-3') |
---|---|---|
V4 | 515F | GTG YCA GCM GCC GCG GTA A |
V4 [24] | 806R | GGA CTA CHV GGG TWT CTA AT |
V4-V5 | 515F | GTG YCA GCM GCC GCG GTA A |
V4-V5 | 926R | CCG YCA ATT YMT TTR AGT TT |
V4-V5 [23] | 907R | CCG TCA ATT CCT TTG AGT TT |
Suuren tietomäärän kerääntyessä havaittiin, että jotkin bakteerityypit oli luokiteltu väärin morfologisten ominaisuuksien mukaan. 16S- rRNA- sekvensoinnin perusteella on eristetty uusia lajeja, mukaan lukien ne, joita ei voitu viljellä laboratoriossa [25] [26] ja jopa suvut [27] . Kolmannen sukupolven sekvensoinnin myötä monissa laboratorioissa on tullut mahdolliseksi tunnistaa samanaikaisesti tuhansia 16S-rRNA-sekvenssejä muutamassa tunnissa, mikä mahdollistaa metagenomiset tutkimukset , kuten suoliston mikroflooran tutkimukset [28] .
Niiden monien etujen lisäksi, joita kuvatulla menetelmällä luoda perhesiteitä organismiryhmien välillä (käytön yleisyys ja suhteellinen suoritusnopeus) on, on myös haittoja. Erityisesti hypervariaabelit alueet eivät juurikaan erottele läheisesti sukua olevien lajien välillä . Esimerkiksi 16S-rRNA-geenin sekvenssit Enterobacteriaceae- , Clostridiaceae - ja Peptostreptococcaceae -perheiden edustajilla ovat 99-prosenttisesti samanlaisia. Toisin sanoen V4:n hypervariaabeli alue voi erota vain muutaman nukleotidin verran , mikä tekee mahdottomaksi erottaa luotettavasti matala-arvoisten bakteerien taksonit . Jos bakteeritaksonomian tutkimus rajoittuu 16S rRNA:n hypervariaabelien alueiden analysointiin, voidaan virheellisesti yhdistää läheisiä ryhmiä yhdeksi taksoniksi ja aliarvioida tutkitun bakteeriryhmän monimuotoisuutta [29] [30] .
Lisäksi bakteerigenomi voi sisältää useita 16S-rRNA- geenejä , joiden hypervariaabelit alueet V1, V2 ja V6 edustavat suurinta spesifistä monimuotoisuutta. Vaikka hypervariaabelien alueiden analyysi ei ole tarkin menetelmä bakteerilajien luokitteluun, se on edelleen yksi käytetyimmistä menetelmistä, joita voidaan soveltaa bakteeriyhteisöjen tutkimukseen [31] .
Ottaen huomioon oletuksen, että evoluutiota ohjaa geneettisen materiaalin pystysuora siirtyminen esivanhemmista jälkeläisille, 16S rRNA -geenejä on pitkään pidetty lajispesifisinä ja siksi erittäin tarkkoina markkereina prokaryoottiryhmien välisen suhteen määrittämiseksi . Yhä useammat havainnot viittaavat kuitenkin näiden geenien horisontaalisen siirron mahdollisuuteen. Luonnossa horisontaalista geeninsiirtoa koskevien havaintojen lisäksi näistä tapahtumista on esitetty kokeellisia todisteita. Tutkimuksessa käytettiin mutanttia Escherichia coli -kantaa , jolta puuttui oma 16S-rRNA-geeni. Kuitenkin toiminnallisen ribosomin kokoamista on havaittu käyttämällä 16S rRNA:ta, joka on lainattu ei-sukulaiselta E. coli -bakteerilta [32] [15] . Samanlaista yhteentoimivuutta on havaittu myös Thermus thermophiluksessa . Lisäksi sekä täydellinen että osittainen geeninsiirto havaittiin T. thermophilus -bakteerissa . Osittainen siirtyminen ilmeni ilmeisen satunnaisen kimeerisen sekvenssin spontaanin muodostumisena isäntäbakteerin geenin ja vieraan geenin välillä [33] .
Joten 16S-rRNA-geeni on voinut kehittyä useilla tavoilla, mukaan lukien pystysuora ja horisontaalinen geeninsiirto. Jälkimmäisen muunnelman esiintymistiheys voi olla huomattavasti suurempi kuin aiemmin on ajateltu.
16S-rRNA-geenien täydelliset sekvenssit, kuten monet muutkin, kootaan lukemista - tietyistä nukleotidisekvensseistä, jotka on saatu sekvensoinnin jälkeen . Sekvensointi suoritetaan Illumina -alustalla (lukupituus saavuttaa 250 emäsparia); käyttämällä Sanger-sekvensointitekniikkaa (lukemien pituus - jopa 1000 emäsparia); käyttämällä ionipuolijohdesekvensointia (lukemien pituus - jopa 200 emäsparia). Seuraavaksi lukemia verrataan 16S-rRNA-geenin referenssisekvenssiin, jolloin koko geenisekvenssi kootaan useista lukemista.
16S rRNA - geenisekvenssit on määritetty bakteerien ja arkkien tyyppikannoille ja kerätty avoimiin tietokantoihin , kuten NCBI . Tällaisten tietokantojen sisältämien sekvensoitujen sekvenssien laatua ei kuitenkaan usein tarkisteta. Tämän seurauksena sekundäärisiä tietokantoja, jotka sisältävät vain 16S-rRNA-geenisekvenssejä, käytetään laajalti [34] . Alla on lueteltu yleisimmin käytetyt tietokannat.
EzBioCloud-tietokanta, joka tunnettiin aiemmin nimellä EzTaxon, koostuu täydellisestä hierarkkisesta taksonomisesta järjestelmästä, joka sisältää 65 342 bakteeri- ja arkeaalista 16S-rRNA-sekvenssiä helmikuussa 2020. EzBioCloud-tietokanta on systemaattisesti kuratoitu ja sitä päivitetään säännöllisesti. Lisäksi tietokantasivusto tarjoaa bioinformatiikan työkaluja , kuten ANI-laskimen, jolla voidaan löytää prosentuaalinen samankaltaisuus prokaryoottisten genomien kahden sekvenssin välillä, kahden sekvenssin parikohdistustyökalu ja monet muut [35] .
RDP on kuratoitu tietokanta, joka tarjoaa rRNA-sekvenssitietoja sekä niihin liittyviä ohjelmia ja palveluita. Ehdotettu sisältö sisältää fylogeettisesti ryhmiteltyjä rRNA - linjauksia, kohdistuksesta johdettuja fylogeneettisiä puita , rRNA:n sekundaarirakenteita ja erilaisia ohjelmia tietojen visualisointiin ja analysoimiseen rRNA-geenitutkimusta varten. Useimmat ohjelmistopaketit ovat ladattavissa ja paikalliseen käyttöön [36] .
SILVA on tietokanta, joka sisältää manuaalisesti tarkistetun ja säännöllisesti päivitettävän sarjan ribosomin pienten alayksiköiden (16S/18S) ja suurten ribosomien alayksiköiden (23S/28S) rRNA-sekvenssien rinnastuksia, jotka liittyvät kaikkiin kolmeen elämänalueeseen . Tietokannan perusteella luotiin myös palvelu alukkeiden suunnittelua ja fylogeneettisten kohdistusten rakentamista varten [37] .