Proteogenomiikka

Kokeneet kirjoittajat eivät ole vielä tarkistaneet sivun nykyistä versiota, ja se voi poiketa merkittävästi 21. tammikuuta 2020 tarkistetusta versiosta . tarkastukset vaativat 3 muokkausta .

Proteogenomiikka on biologisen tutkimuksen ala, joka käyttää proteomiikan , genomiikan ja transkriptomiikan yhdistelmää peptidien löytämiseen ja tunnistamiseen . Proteogenomiikkaa käytetään uusien peptidien tunnistamiseen vertaamalla MS/MS - spektrejä ( esim . Tandem massaspektrometria ) proteiinitietokantaan , joka on saatu genomisesta ja transkriptiosta . Proteogenomiikka viittaa usein tutkimuksiin, joissa käytetään esimerkiksi massaspektrometrialla saatua proteomista tietoa parantamaan genomimerkintöjä ( englanniksi DNA annotation ). [1] Genomiikka käsittelee kokonaisten organismien DNA :ta ja geneettistä koodia, kun taas transkriptomiikka käsittelee RNA -sekvenssejä ja transkriptioita . Proteomics käyttää tandemmassaspektrometriaa ja nestekromatografiaa proteiinien toimintojen määrittämiseen ja tutkimiseen. Proteomiikkaa käytetään kaikkien organismissa ilmentyvien proteiinien löytämiseen , joka tunnetaan sen proteomina. [2] [3] Proteomiikan ratkaisematon ongelma on, että se perustuu olettamukseen, että nykyiset geenimallit ovat oikeita ja että oikeat proteiinisekvenssit voidaan löytää käyttämällä vertailusekvenssien tietokantaa; Tämä ei kuitenkaan aina pidä paikkaansa, koska joitain peptidejä ei löydy tietokannoista. Lisäksi mutaatioista voi johtua uusia proteiinisekvenssejä. Tämä ongelma voidaan ratkaista käyttämällä proteomista, genomista ja transkriptomista dataa. Proteomiikan ja genomiikan menetelmien yhteiskäyttö johti proteogenomiikan syntymiseen, joka nousi itsenäiseksi alaksi vuonna 2004. [1] [4] [5]

Metodologia

Proteogenomisen lähestymistavan pääajatuksena on tunnistaa peptidit vertaamalla MS/MS-tietoja proteiinitietokantoihin, jotka sisältävät ennustettuja proteiinisekvenssejä. Proteiinitietokantoja luodaan monin eri tavoin käyttämällä genomista ja transkriptiotietoa. Seuraavassa on joitakin tapoja luoda proteiinitietokantoja:

Kuuden kehyksen käännökset

Kaksijuosteisen DNA-molekyylin kuutta mahdollista translaatiota voidaan käyttää proteiinisekvenssejä ennustavan tietokannan luomiseen. Tämän menetelmän rajoituksena on, että tietokannat ovat erittäin suuria generoitujen sekvenssien lukumäärän vuoksi, joista suurinta osaa ei ole luonnossa. [yksi]

Ab initio -geenin ennuste

Tässä menetelmässä proteiinirunko luodaan käyttämällä geenien ennustusalgoritmeja, jotka mahdollistavat proteiinia koodaavien alueiden tunnistamisen . Tällä tavalla luotu tietokanta on samanlainen kuin kuuden kehyksen transkriptiolla luotu tietokanta, koska se voi olla hyvin suuri. [yksi]

Muut menetelmät

Proteiinitietokantoja voidaan myös luoda käyttämällä RNA -sekvensointidataa, annotoituja RNA-transkriptejä ja proteiinisekvenssivariantteja. Lisäksi on olemassa muita erikoistuneempia proteiinitietokantoja, jotka voidaan luoda spesifisten peptidien tunnistamiseksi oikein. [yksi]

Toinen menetelmä proteiinien identifioimiseksi proteogenomiikassa on vertaileva proteogenomiikka, joka perustuu useiden sukulaislajien proteomitietojen vertaamiseen samanaikaisesti ja käyttää niiden proteiinien välistä homologiaa parantaakseen annotaatioita suuremmalla tilastollisella varmuudella. [6] [7]

Sovellukset

Proteogenomiikan monien sovellusten joukossa on geenimerkintöjen parantaminen eri organismeissa. Kuten tiedät, geenien annotaatio sisältää geenien ja niiden toimintojen löytämisen. [8] Proteogenomiikasta on tullut erityisen hyödyllistä erilaisten prokaryoottisten organismien genomien annotaatioiden luomisessa ja parantamisessa. Proteogenomista lähestymistapaa on käytetty tutkimuksissa erilaisten mikro-organismien genomien annotaatiosta: Escherichia coli , erityyppiset Mycobacterium- ja Shewanella -suvun bakteerit . [9]

Geenimerkintöjen parantamisen lisäksi proteogenomiset tutkimukset voivat myös tarjota arvokasta tietoa ohjelmoitujen lukukehyssiirtymien, N-terminaalisen metioniinin deleetiosta, signaalipeptideistä, proteolyysistä ja muista translaation jälkeisistä modifikaatioista . [4] [6]

Vaikeudet

Proteogenomiikka voi tarjota menetelmiä peptidien tunnistamiseksi ilman proteomiikan kohtaamia epätäydellisiä ja epätarkkoja proteiinitietokantoja; kuitenkin muita vaikeuksia syntyy käytettäessä proteogenomista lähestymistapaa. [1] Yksi proteogenomiikan suurimmista ongelmista on tuotettujen proteiinitietokantojen koko. Tilastollisesti suuri proteiinitietokanta on todennäköisemmin ristiriidassa proteiinitietokannan ja MS/MS-tietojen kanssa, mikä voi häiritä uusien peptidien tunnistamista. Suuri määrä vääriä positiivisia tunnistustuloksia aiheuttaa myös vaikeuksia proteogenomisessa lähestymistavassa. Väärät positiiviset tulokset voivat johtua erittäin suurten proteiinitietokantojen muodostumisesta, joissa epäjohdonmukaiset tiedot johtavat virheelliseen tunnistamiseen. Toinen ongelma on MS/MS-spektrien yhteensopimattomuus proteiinisekvenssitietojen kanssa, jotka vastaavat samanlaista peptidiä todellisuudessa läsnä olevan peptidin sijaan. On mahdollista saada tietoa useissa kohdissa sijaitsevasta peptidistä, minkä seurauksena näitä tietoja voidaan tulkita eri tavoin. Näistä ongelmista huolimatta on olemassa tapoja vähentää tapahtuvien virheiden määrää. Esimerkiksi työskennellessäsi erittäin suuren proteiinitietokannan kanssa voidaan verrata tunnistettuja uusia peptidisekvenssejä kaikkiin tietokannan sekvensseihin ja verrata sitten translaation jälkeisiä modifikaatioita. Sitten voidaan määrittää, edustavatko nämä kaksi sekvenssiä samaa peptidiä vai ovatko ne kaksi eri peptidiä. [yksi]

Muistiinpanot

↑ 1 2 3 4 5 6 7 Nesvizhskii, Alexey I. Proteogenomiikka: käsitteet, sovellukset ja laskennalliset strategiat (englanniksi) // Nature Methods : Journal. - 2014. - 1. marraskuuta ( osa 11 , nro 11 ). - s. 1114-1125 . - doi : 10.1038/nmeth.3144 . — PMID 25357241 .
↑ Sajjad, Wasim; Rafiq, Muhammad; Ali, Barkat; Hayat, Muhammad; Zada, Sahib; Sajjad, Wasim; Kumar, Tanweer. Proteogenomiikka: uusi kehittyvä teknologia // HAYATI Journal of Biosciences. - 2016. - heinäkuu ( osa 23 , nro 3 ). - S. 97-100 . - doi : 10.1016/j.hjb.2016.11.002 .
↑ Genetiikka. Ensyklopedinen sanakirja. - Minsk: Valko-Venäjän tiede. Kartel N. A., Makeeva E. N., Mezenko A. M. 2011.
↑ 1 2 Gupta N., Tanner S., Jaitly N., Adkins JN, Lipton M., Edwards R., Romine M., Osterman A., Bafna V., Smith RD, et ai. Translation jälkeisten modifikaatioiden koko proteomianalyysi: Massaspektrometrian sovellukset proteogenomiseen annotaatioon. Genome Res. 2007;17:1362-1377.
↑ Ansong, C.; Smith, R.D.; Purvine, SO; Lipton, MS; Adkins, JN Proteogenomics: tarpeet ja roolit, jotka proteomiikan on täytettävä genomimerkinnöissä // Lyhyt . Toiminto. Genomics Proteomics: Journal. - 2008. - tammikuu ( nro 7 ). - s. 50-62 . doi : 10.1093 / bfgp/eln010 .
↑ 1 2 Gupta N., Benhamida J., Bhargava V., Goodman D., Kain E., Kerman I., Nguyen N., Ollikainen N., Rodriguez J., Wang J. et ai. Vertaileva proteogenomiikka: Yhdistämällä massaspektrometria ja vertaileva genomiikka useiden genomien analysoimiseksi. Genome Res. 2008;18:1133–1142.
↑ Gallien S., Perrodou E., Carapito C., Deshayes C., Reyrat JM, Van Dorsselaer A., Poch O., Schaeffer C., Lecompte O. (2009) Ortho-proteogenomics: multiple proteomes research through ortology ja uusi MS-pohjainen protokolla. Genome Res 19, 128-135.
↑ Ansong, C.; Purvine, SO; Adkins, JN; Lipton, MS; Smith, RD Proteogenomics: tarpeet ja roolit, jotka tulee täyttää proteomiikassa genomimerkinnöissä // Briefings onfunctional genomics : Journal . - 2008. - 7. maaliskuuta ( osa 7 , nro 1 ) - s. 50-62 . doi : 10.1093 / bfgp/eln010 . — PMID 18334489 .
↑ Kucharova, Veronica; Wiker, Harald G. Proteogenomiikka mikrobiologiassa: käännös oikealle genomiikan ja proteomiikan risteyksessä // Proteomics : Journal. - 2014. - joulukuu ( osa 14 , nro 23-24 ). - P. 2360-2675 . - doi : 10.1002/pmic.201400168 . — PMID 25263021 .

Linkit

Wiggins Arthur Proteomics: Seuraava raja