Proteiinirakenteen ennuste

Proteiinirakenteen ennuste on  suuntaus molekyylimallinnukseen , kolmiulotteisen proteiinirakenteen [ 1] ( sekundaarinen , tertiäärinen tai kvaternäärinen ) ennustaminen aminohapposekvenssin perusteella. Tämä tehtävä on yksi bioinformatiikan ja teoreettisen kemian tärkeimmistä tavoitteista . Ennustetietoja käytetään lääketieteessä (esimerkiksi lääkkeissä ) ja bioteknologiassa uusien entsyymien luomiseen .

Johdanto

Valtavia määriä proteiinisekvensointidataa on tullut saataville nykypäivän laajamittaisten DNA - sekvensointitoimien , kuten Human Genome Projectin , seurauksena . Huolimatta koko yhteisön ponnisteluista rakennegenomiikan alalla , kokeellisesti määritettyjen proteiinirakenteiden määrä  - yleensä työvoimavaltaisella ja suhteellisen kalliilla röntgenkristallografialla tai NMR-spektroskopialla  - on huomattavasti jäljessä proteiinisekvenssien lukumäärästä , mikä tekee proteiinin tertiaarirakenteen ennustaminen erittäin kysyttyä [2] .

Proteiinin rakenteen ennustaminen on edelleen erittäin vaikea ja ratkaisematon ongelma. Kaksi pääongelmaa ovat vapaan energian laskeminen ja tämän energian globaalin minimin löytäminen [3] . Proteiinirakenteen ennustusmenetelmällä on tutkittava kaikkien mahdollisten proteiinirakenteiden tila , joka on tähtitieteellisesti suuri. Nämä ongelmat voidaan osittain kiertää vertailevalla (homologisella) mallinnuksella ja laskosten tunnistusmenetelmillä , joissa hakutilaa pienennetään, koska oletetaan, että kyseessä oleva proteiini omaksuu rakenteen, joka on lähellä toisen homologisen proteiinin kokeellisesti määritettyä rakennetta. Toisaalta ab initio -proteiinirakenteen ennustusmenetelmien pitäisi eksplisiittisesti ratkaista nämä ongelmat luottamatta alkuperäisiin oletuksiin [4] [5] .

Joulukuussa 2020 DeepMind -tiimi ( Googlen tutkimusosasto ) ilmoitti ratkaisseensa proteiinirakenteen ennustamisen tieteellisen perusongelman. Yrityksen kehittämä ja hermoverkkoihin perustuva ohjelma pystyi ennustamaan proteiinin rakenteen suurella tarkkuudella. [6]

Proteiinin rakenne

Proteiinin toissijainen rakenne

Alpha Helix

Alfaheliksi on yleisin proteiinien sekundaarirakennetyyppi. Alfakierteessä on 3,6 aminohappoa kierrosta kohti, ja joka neljännen tähteen väliin muodostuu H-sidos ; keskimääräinen pituus on 10 aminohappoa (3 kierrosta) tai 10 Å , mutta vaihtelee välillä 5 - 40 (1,5 - 11 kierrosta). H-sidosten kohdistus luo kierteelle dipolimomentin , jossa kierteen aminopäässä on positiivinen nettovaraus . α-heliksien yleisin sijainti on proteiinien pinnalla, jossa ne tarjoavat vuorovaikutusta vesiympäristön kanssa [7] .

Heliksin sisäpuoli sisältää yleensä hydrofobisia aminohappoja ja ulkopuoli hydrofiilisiä aminohappoja. Siten joka kolmas ketjun neljästä aminohaposta on hydrofobinen, ja siksi tämä aminohappo voidaan helposti havaita. Leusiinivetoketjussa leusiinijäämien toistuva kuvio kahden vierekkäisen heliksin ulkosivuilla on suurelta osin osoitus rakenteesta. Muissa proteiinin hydrofobisessa ytimessä tai proteiinien transmembraanidomeeneissa esiintyvissä α-kierteissä on suurempi prosenttiosuus hydrofobisia aminohappoja, jotka jakautuvat tasaisemmin ketjussa, mikä toimii myös hyvänä merkkiaineena näille proteiinin osille. . Laadullinen aminohappopitoisuus voi olla hyvä merkki α-kierteiselle alueelle. Alueet, joilla on korkea pitoisuus erilaisia ​​aminohappoja , kuten alaniinia (A), glutamiinihappoa (E), leusiinia (L) ja metioniinia (M), sekä huonommat pitoisuudet proliinia (P), glysiiniä (G), tyrosiinia (Y) ja seriini (S) pyrkivät muodostamaan α-heliksin [8] [9] .

β-lista

β-levyt muodostuvat H-sidoksista keskimäärin 5-10 peräkkäisen aminohapon välillä ketjun yhdessä osassa ja toisen 5-10 ketjun alempana. Jokainen ketju voi kulkea samaan suuntaan muodostaen yhdensuuntaisen levyn, jos ketjut kulkevat eri suuntiin, muodostuu vastasuuntainen levy. H-sidoksen luonne on erilainen rinnakkaisessa ja anti-rinnakkaiskonfiguraatiossa. Arkkien aminohappojen ψ- ja φ-kulmat vaihtelevat huomattavasti yhdellä Ramachandran-kartan alueella . β-levyjen sijainnin ennustaminen proteiinirakenteessa on vaikeampaa kuin α-heliksien ennustaminen [10] [11] .

Loop

Silmukat ovat proteiiniketjun alueita, jotka ovat α-kierteiden ja β-levyjen välissä, eripituisia ja kolmiulotteisia konfiguraatioita, ja ne voivat sijaita sekä proteiinin pinnalla että lähempänä ydintä [12] .

Hiusneulasilmukat, jotka edustavat täydellistä käännettä kaksi antirinnakkaista β-juostetta yhdistävässä polypeptidiketjussa , voivat olla jopa kaksi aminohappoa pitkiä. Silmukat voivat olla vuorovaikutuksessa ympäristön (veden ja muiden liuottimien) ja muiden proteiinien kanssa. Koska silmukoiden aminohappojen geometria ei ole avaruudessa rajoitettu, koska aminohapot ytimen alueella, jossa ketju on erittäin tiheästi laskostunut, eivätkä vaikuta proteiinin oikeaan laskostumiseen niin paljon, olla enemmän substituutioita, insertioita ja deleetioita , jotka eivät vaikuta proteiinin toimintoihin. Siten, kun sekvenssit ovat rinnastettuja, näiden mutaatioiden (insertit, deleetiot, substituutiot) läsnäolo voi viitata silmukaan. Genomisen DNA : n introniasemat vastaavat joskus silmukkakohtia koodatussa proteiinissa, silmukoissa on myös yleensä varautuneita ja polaarisia aminohappoja, ja ne ovat usein osa sitoutumiskohtia [13] .

Proteiinin tertiäärinen rakenne

Tertiäärinen rakenne  - sekundaarirakenteen kaikkien elementtien avaruudellinen rakenne (mukaan lukien konformaatio ), joka koostuu yhdestä aminohappoketjusta. Lineaarisen polypeptidiketjun spiralisointi pienentää sen kokoa noin 4 kertaa; ja asettaminen tertiääriseen rakenteeseen tekee siitä kymmenen kertaa tiiviimmän kuin alkuperäinen ketju [14] .

Koska polypeptidiketju, α-heliksit ja β-levyt eivät anna käsitystä polypeptidiketjun tilavuudesta , muodosta, tutkijalla on aina tarve määrittää proteiinin kolmiulotteinen tai spatiaalinen konfiguraatio . [viisitoista]

Kvaternäärinen proteiinirakenne

Kvaternaarinen rakenne - tapa asettaa avaruuteen yksittäisiä polypeptidiketjuja, joilla on sama (tai erilainen) primaarinen , sekundaarinen tai tertiäärinen rakenne, ja yksittäisen makromolekyylimuodostelman muodostaminen rakenteellisesti ja toiminnallisesti. Proteiinien kvaternaarisen rakenteen spesifisyys ilmenee proteiinimakromolekyylin muodostavien polypeptidifragmenttien tietyssä konformaatiossa. Hydrofobisten vuorovaikutusten osuus proteiinien tertiäärisen ja kvaternaarisen rakenteen stabiloinnissa on erittäin merkittävä: tertiäärisen rakenteen tapauksessa ne muodostavat yli puolet stabilointivoimasta. [16]

Monet proteiinit ovat useiden polypeptidiketjujen kokoonpanoja. Esimerkkejä kvaternäärisen rakenteen omaavista proteiineista ovat hemoglobiini , DNA-polymeraasi ja erilaiset ionikanavat [17]

Proteiinirakenteen ennuste

Toissijaisen rakenteen ennustusalgoritmit

Toissijaisen rakenteen ennustusalgoritmit ovat joukko menetelmiä proteiinien paikallisen sekundaarirakenteen ennustamiseksi, joka perustuu vain tietoon niiden aminohapposekvenssistä [18] . Proteiinien osalta ennustus koostuu aminohapposekvenssin yksittäisten osien yhdistämisestä todennäköisimpiin sekundaarirakenteiden luokkiin, kuten α-heliksit, β-säikeet tai silmukat [18] . Ennustetarkkuus määritellään niiden aminohappojen lukumäärän suhteeksi, joille ennustettu rakenneluokka vastasi tälle aminohapolle DSSP [en] -algoritmilla (tai vastaavalla algoritmilla, esimerkiksi STRIDE-algoritmilla ) määritettyä rakenneluokkaa. aminohappojen kokonaismäärä sekvenssissä. Nämä algoritmit merkitsevät proteiinin aminohapposekvenssin sen mukaan, kuuluvatko aminohapot johonkin sekundaarirakenteen luokkiin, jotka eroavat spesifisillä vetysidosmalleilla ja dihedraalisten kulmien sarjoilla. DSSP:lle nämä ovat 8 luokkaa, jotka voidaan yhdistää kolmeen ryhmään: 3 heliksiluokkaa (α-heliksi, π-heliksi ja 3 10 -kierre ), kaksi β-rakenteiden luokkaa (eristetyt β-sillat ja β-levyt) ja kolmenlaisia ​​silmukoita (käännöksiä, mutkia ja luokittelemattomia elementtejä, jotka täyttävät silmukan ominaisuudet) [19] . Useimmiten rakenteen laadun arvioimiseksi käytetään yksinkertaistettua luokitusta, jossa näiden kolmen ryhmän luokat pidetään identtisinä [2] . Algoritmit proteiinin sekundaarirakenteen ennustamiseksi voidaan jakaa ehdollisesti ryhmiin niiden taustalla olevien periaatteiden perusteella. Näihin ryhmiin kuuluvat tilastolliset menetelmät, lähin naapurin menetelmät, hermoverkkoja käyttävät menetelmät, tukivektorimenetelmät ja piilotettuihin Markovin malleihin perustuvat menetelmät . [kaksikymmentä]

Joitakin näistä algoritmeista käsitellään alla.

Chow-Fasmanin tilastollinen menetelmä perustuu arvioon siitä todennäköisyydestä, että tietty aminohappo kuuluu tietokantojen tiettyyn sekundaarirakenteen luokkaan. Ennuste tehdään kolmen sekundaarirakenteen luokan suhteen: silmukka, β-lehti ja rotaatio. Algoritmin tavoitteena on löytää kullekin toissijaiselle rakenneluokalle määritetystä peräkkäisten aminohappojen määrästä segmentti, jolle jokaiselle arvio todennäköisyydestä kuulua tähän sekundäärirakenneluokkaan on annettua arvoa suurempi. Tällaiset algoritmit tuottavat lähdössä tällä tavalla ennustettuja segmenttejä kullekin kolmelle toissijaisten rakenteiden pääluokalle, jotka on kartoitettu sekvenssiin. [21]

Lähimmän naapurin menetelmän ( NNSSP-algoritmi ) ensimmäinen vaihe on löytää homologinen sekvenssi, jonka kolmiulotteinen rakenne tunnetaan. Ottaen huomioon tietyn aminohappotähteen paikalliset rakenteelliset piirteet homologisen sekvenssin kolmiulotteisessa rakenteessa, kuten liuottimen saavutettavuus, polaarisuus ja sekundaarinen rakenne, kullekin aminohappotähteelle osoitetaan "ympäristöluokka". Arvio todennäköisyydestä, että tutkitun n aminohapon pituisen segmentin keskellä oleva aminohappo kuuluu tiettyyn sekundaarirakenteen luokkaan, lasketaan logaritmina tämän aminohapon esiintymistiheydestä ympäristössä, johon suurin osa sen naapurit kuuluvat tietokantoihin. [22]

Yksi neuroverkkoja käyttävistä algoritmeista, PSIPRED , sisältää neljä päävaihetta: sijaintipainomatriisin luominen PSI-BLAST :n avulla, toissijaisen rakenteen ensisijainen ennuste ja ennusteiden lisäsuodatus. Toinen ja kolmas vaihe sisältävät kaksi hermoverkkoa. Sen määrittämiseksi, kuuluuko aminohappo tiettyyn sekundaarirakenteen luokkaan, ensimmäisen hermoverkon sisäänmenoon syötetään fragmentti kooltaan 33x21 sijaintipainomatriisista, joka vastaa fragmenttia alkuperäisestä 33 aminohapon sekvenssistä. mielenkiinnon kohteena oleva aminohappo keskellä [23] . Tässä verkossa on kaksi piilotettua kerrosta ja kolme lähtösolmua, jotka vastaavat kolmea ennustettua toisiorakenneluokkaa. Toista hermoverkkoa käytetään suodattamaan ensimmäisen verkon ennusteet ja sillä on myös kolme lähtösolmua kullekin toissijaiselle rakenneluokalle tutkittavan ikkunan keskipisteessä. Lähdössä algoritmi tuottaa aminohapposekvenssin merkinnän sekundaarirakenteen elementtien avulla. [24]

Edellä mainittujen lisäksi klassisia algoritmeja, jotka käyttävät piilotettuja Markov-malleja, kuten eteenpäin-taakse- algoritmia , Viterbi-algoritmia ja Baum-Welsh-algoritmia , voidaan optimoida yhdistämään aminohapposekvenssi sekundäärirakenteiden luokkiin. [25]

Parhaat nykyaikaiset menetelmät proteiinin sekundaarirakenteen määrittämiseen saavuttavat noin 80 % tarkkuuden [26] . Nykyisten sekundaarirakenteiden ennustamismenetelmien tarkkuutta arvioivat viikoittain päivitetyt resurssit, kuten LiveBench arkistoitu 12.4.2020 Wayback Machinessa ja EVA Arkistoitu 24.2.2020 Wayback Machinessa [27] .

Tertiäärisen rakenteen ennustusalgoritmit

Peruskoulutus

Useimmat tertiaarisen rakenteen mallinnusmenetelmät on optimoitu yksittäisten proteiinidomeenien tertiaarisen rakenteen mallintamiseen. Vaihe, jota kutsutaan domeeniraja-analyysiksi tai domeenirajan ennustamiseksi, suoritetaan yleensä ensin proteiinin erottamiseksi mahdollisiksi rakennedomeeneiksi. Kuten muutkin tertiäärisen rakenteen ennustusvaiheet, tämä voidaan tehdä vertaamalla tunnettuihin rakenteisiin tai ab initio pelkällä sekvenssillä (yleensä koneoppimisella , johon liittyy kovarianssi ) [28] [29] . Yksittäisten domeenien rakenteet yhdistetään yhdeksi lopulliseksi tertiäärirakenteeksi prosessissa, jota kutsutaan domain-kokoonpanoksi [30] .

Energiapohjaiset menetelmät

Ab initio -mallinnusmenetelmillä pyritään luomaan kolmiulotteisia proteiinimalleja tyhjästä, eli ne perustuvat fysikaalisiin periaatteisiin eikä suoraan kokeellisesti johdettuun rakennetietoon. On monia mahdollisia lähestymistapoja, jotka joko yrittävät jäljitellä proteiinin laskostumista tai soveltavat stokastisia menetelmiä mahdollisten ratkaisujen löytämiseen (eli etsivät jonkin energiafunktion globaalia maksimiarvoa ) [31] . Nämä lähestymistavat ovat yleensä laskennallisesti intensiivisiä ja siksi niitä voidaan soveltaa vain pieniin proteiineihin. Proteiinirakenteen ennustaminen ab initio suuremmille proteiineille vaatii kehittyneempiä algoritmeja ja suurempia laskentaresursseja, joita edustavat joko tehokkaat supertietokoneet (kuten Blue Gene tai MDGRAPE-3 ) tai hajautettu laskenta (kuten Folding@home , Human Proteome Folding Project ja Rosetta @Home ) [32] .

Yhdessä kehittyvät sekvenssit 3D-kontaktien ennustamisessa

Kun sekvensointi yleistyi 1990-luvulla, useat tutkijaryhmät käyttivät proteiinisekvenssien rinnastusta ennustaakseen korreloivia mutaatioita, ja toivottiin, että näitä yhdessä kehittyviä tähteitä voitaisiin käyttää tertiäärisen rakenteen ennustamiseen . Ajatellaan, että kun yhden aminohappotähteen mutaatio ei ole tappava, voi tapahtua kompensoiva mutaatio tähteiden välisten vuorovaikutusten stabiloimiseksi. Varhaisessa työssä käytettiin ns. paikallisia menetelmiä korreloituvien mutaatioiden laskemiseen proteiinisekvensseissä, kun taas kunkin jäännösparin itsenäisen tarkastelun vuoksi syntyi vääriä korrelaatioita [33] [34] .

Vuonna 2011 toinen tilastollinen lähestymistapa osoitti, että ennustetut yhdessä kehittyvät tähteet riittävät ennustamaan kolmiulotteisen proteiinin laskostumisen edellyttäen, että saatavilla on riittävästi sekvenssejä (tarvitaan > 1000 homologista sekvenssiä) [35] . EVfold-menetelmä ei käytä homologiamallinnusta, ja sitä voidaan ajaa tavallisella henkilökohtaisella tietokoneella jopa satoja jäämiä sisältäville proteiineille . Tämän ja siihen liittyvien lähestymistapojen ennustetarkkuus on osoitettu monilla rakenteilla ja kontaktikartoilla [36] [37] [38] .

Proteiinirakenteen vertaileva mallinnus

Vertaileva proteiinirakenteen mallinnus käyttää lähtökohdina aiemmin kokeellisilla menetelmillä saatuja rakenteita. Tämä on tehokasta, koska ilmeisesti vaikka olemassa olevien proteiinien määrä on valtava, tertiääristen rakenteellisten motiivien määrä , joihin useimmat proteiinit kuuluvat , on rajallinen [4] .

Nämä menetelmät voidaan myös jakaa kahteen ryhmään [39] :

  1. Homologiamallinnus perustuu oletukseen, että homologisilla proteiineilla on samanlainen rakenne. Koska proteiinilaskos on konservoituneempi kuin sen aminohapposekvenssi , tutkittavan proteiinin rakenne voidaan ennustaa hyvällä tarkkuudella, vaikka se olisi kaukaa sukua templaattina käytettävälle proteiinille, edellyttäen, että templaatin ja kohteen välinen homologia proteiini voidaan jäljittää sekvenssien rinnastuksen avulla [40] . On ehdotettu, että vertailevan mallintamisen suurin heikkous piilee kohdistusten epätarkkuuksissa pikemminkin kuin virheissä rakenteen ennustuksessa tunnetun hyvän kohdistuksen vuoksi [41] . Ei ole yllättävää, että homologiamallinnus saavuttaa parhaat tulokset, kun kohdeproteiinilla ja templaatilla on samanlaiset sekvenssit. [neljä]
  2. Taitoksen tunnistus etsii tunnettujen rakenteiden tietokannasta aminohapposekvenssiä, jonka rakennetta ei tunneta [42] . Kussakin tapauksessa pisteytysfunktiota käytetään sekvenssin yhteensopivuuden arvioimiseen rakenteen kanssa, jonka avulla voit saada joukon mahdollisia kolmiulotteisia malleja. Tämän tyyppinen tekniikka tunnetaan myös nimellä 3D-1D-kertainen tunnistus 3D-rakenteiden ja lineaaristen proteiinisekvenssien välisen yhteensopivuusanalyysin vuoksi . [43]
Sivuradikaalien geometriaennuste

Sivuaminohapporadikaalien sijainnin tarkka ennustaminen rakenteessa on erillinen ongelma proteiinirakenteen ennustamisessa. Menetelmiä, jotka ratkaisevat sivuradikaaligeometrian ennustamisen ongelman, ovat lukkiutuman eliminointi ja itsekonsistentit kenttämenetelmät [44] [45] . Matalaenergiset sivuketjukonformaatiot määritellään tavallisesti jäykässä polypeptidirungossa , ja niissä käytetään joukkoa erillisiä sivuketjukonformaatioita , "rotameereja". Tällaisten menetelmien toimintaperiaate on etsiä rotameerisarja, joka minimoi mallin kokonaisenergian [40] .

Näissä menetelmissä käytetään rotameerien kirjastoja, jotka ovat edullisia konformaatioita proteiinin kullekin tähtetyypille. Rotamer-kirjastot voivat sisältää tietoa konformaatiosta, sen taajuudesta ja keskihajonnoista suhteessa vääntökulmien keskiarvoihin, joita voidaan käyttää vaihtoehtojen valinnassa [46] . Rotameerikirjastot luodaan rakenteellisella bioinformatiikalla tai muulla tilastollisella analyysillä sivuketjujen konformaatioista kokeellisesti tunnetuissa proteiinirakenteissa. Rotamer-kirjastot voivat olla rungosta riippumattomia , toissijaisesta rakenteesta riippuvaisia ​​tai rungosta riippumattomia. Rungosta riippumattomat rotameerikirjastot eivät käytä rungon konformaatiotietoja, ja ne lasketaan kaikista saatavilla olevista tietyn tyyppisistä sivuketjuista (esimerkiksi ensimmäinen esimerkki rotameerikirjastosta, jonka Ponder ja Richards tekivät Yalen yliopistossa vuonna 1987 [47] ). Toissijaisesta rakenteesta riippuvat kirjastot ovat erilaisia ​​vääntökulmia ja/tai rotameeritaajuuksia sekundäärirakenteiden luokille (alfa heliksi, beetalevy tai silmukka [48] ). Rotameerien rungosta riippuvaiset kirjastot ovat konformaatioita ja (tai) niiden taajuuksia riippuen pääketjun paikallisesta konformaatiosta, jonka määräävät vääntökulmat phi ja psi, eikä se riipu sekundaarirakenteesta [49] . Useimmissa ohjelmissa käytetyt nykyaikaiset versiot näistä kirjastoista esitetään monimuuttujatodennäköisyys- tai taajuusjakaumina, joissa huiput vastaavat erillisinä rotamereina katsottuja vääntökulmakonformaatioita. [viisikymmentä]

Quaternary Structure Prediction Algorithms

Protein-protein telakointi

Proteiini-proteiini-telakka (tai Protein-Protein Interaction (PPI) ) on molekyylimallinnusmenetelmä , jonka avulla voidaan ennustaa yhden molekyylin (ligandin) suotuisin orientaatio ja konformaatio toisen sitoutumiskeskuksessa (reseptorissa) molekyylin muodostumista varten. vakaa kompleksi . Kumppaniproteiinien asemaa ja konformaatiota koskevia tietoja käytetään vuorovaikutuksen voimakkuuden ennustamiseen niin sanottujen pisteytysfunktioiden avulla. [51]

Laskennalliset menetelmät proteiini-proteiini-vuorovaikutusten ennustamiseen

Koska vuorovaikutuksesta ei vielä ole täydellistä tietoa eikä kaikkia proteiini-proteiinivuorovaikutuksia ole löydetty, käytetään erilaisia ​​laskennallisia menetelmiä vuorovaikutusten signalointi- tai metabolisten karttojen rekonstruoinnissa. Niiden avulla voit täyttää aukot ennustamalla tiettyjen verkkosolmujen välisiä vuorovaikutuksia. Laskennallisten menetelmien avulla on mahdollista ennustaa paitsi WBV:n mahdollisuus myös niiden vahvuus [52] .

Seuraavassa on useita laskennallisia lähestymistapoja proteiini-proteiini-vuorovaikutusten ennustamiseen:

  • Geeni- tai proteiinidomeenifuusiotapahtumien etsiminen : geenifuusioita , mikä tarkoittaa usein myös domeenifuusiota, voidaan käyttää proteiinien välisen toiminnallisen suhteen etsimiseen. Tässä käytetään oletusta, että näiden geenien fuusio evoluution aikana helpotti valinta [53] .
  • Vertaileva genomiikka ja geeniklusterointimenetelmät : usein geenit, jotka koodaavat proteiineja, joilla on samanlainen toiminta tai vuorovaikutuksessa olevia proteiineja, ovat samassa operonissa (bakteerien tapauksessa) tai ovat yhteissäädeltyjä (yhteissäätely) (eukaryoottien tapauksessa). Tällaiset geenit sijaitsevat yleensä lähekkäin genomissa. Geeniklusterointimenetelmät arvioivat saman klusterin geenejä koodaavien proteiiniortologien yhteisesiintymisen todennäköisyyttä. Tällaiset lähestymistavat auttavat paljastamaan proteiinien välisen toiminnallisen vuorovaikutuksen pikemminkin kuin niiden fyysisen kontaktin [52] .
  • Fylogeneettisiin profiileihin perustuvat menetelmät : Tällaisissa menetelmissä oletetaan, että jos ei-homologiset proteiinit ovat toiminnallisesti sukua, niin on mahdollista, että ne voivat päästä PPI:hen ja kehittyä yhdessä. Funktionaalisen suhteen löytämiseksi proteiinien välillä käytetään näiden proteiinien fylogeneettisten profiilien klusterointia tai arvioidaan proteiinien yhteisesiintymisen todennäköisyys eri proteomeissa [52] . Ajatusta siitä, että vuorovaikutuksessa olevilla proteiineilla on usein topologisesti samankaltaisia ​​fylogeneettisiä puita , käytetään peilipuumenetelmässä [54] .
  • Homologiaan perustuvat ennustusmenetelmät : Tämä lähestymistapa olettaa, että tutkittavat proteiinit ovat vuorovaikutuksessa toistensa kanssa, jos niiden homologien tiedetään olevan vuorovaikutuksessa. Tällaisia ​​eri organismien proteiinipareja, jotka ovat säilyttäneet kyvyn olla vuorovaikutuksessa toistensa kanssa evoluution aikana, kutsutaan interologeiksi . Esimerkkejä tätä menetelmää käyttävistä palveluista ovat PPISearch ja BIPS [52] .
  • Ennustus perustuu geenien yhteisilmentymistietoihin : jos tutkitut proteiinit koodaavat geenejä, joilla on samankaltaiset ilmentymismallit (samanlainen profiili ja ilmentymistaso ) eri aikavälein, voidaan olettaa, että nämä proteiinit ovat toiminnallisesti sukua keskenään ja mahdollisesti jollain tavalla vuorovaikutuksessa kunkin kanssa. muu [55] .
  • Verkkotopologiaan perustuvat menetelmät : BWV-verkot voidaan esittää graafina, jossa solmut ovat proteiineja ja jokainen reuna edustaa proteiinien välistä vuorovaikutusta. PPI-verkon matemaattisen tulkinnan avulla (esim. vierekkäisyysmatriisin muodossa ) voidaan määrittää, miten proteiinit liittyvät toiminnallisesti toisiinsa, sekä ennustaa uusia PPI:itä. Jos kahdella proteiinilla on paljon yhteisiä kumppaneita verkostossa, ne todennäköisesti osallistuvat samaan biologiseen prosessiin ja voivat mahdollisesti olla vuorovaikutuksessa toistensa kanssa [52] .
  • In-Silico Two-Hybrid Approach : Tämän menetelmän pääoletus on, että vuorovaikutuksessa olevat proteiinit kehittyvät yhdessä toiminnallisuuden ylläpitämiseksi. Tämä menetelmä analysoi proteiiniperheen useita rinnastuksia ja etsii korreloituja mutaatioita ennustaakseen PPV:tä ja etsiäkseen emäksiä sitoutumiskohdasta [56] .
  • Rakenteeseen perustuva PPI-ennustus : Tämän lähestymistavan avulla ei vain voida selvittää, voivatko proteiinit olla vuorovaikutuksessa, vaan myös karakterisoida tämä vuorovaikutus (esimerkiksi sen fysikaaliset ominaisuudet tai aminohapot, jotka muodostavat kahden proteiinin vuorovaikutuspinnan). Yksi menetelmistä, joissa käytetään proteiinien kolmiulotteista rakennetta, on telakointi . Tämä sisältää myös menetelmät, joissa oletetaan vuorovaikutuspinnan muodostavien emästen evoluution konservatiivisuutta. Näin ollen jo tunnettujen rakenteiden perusteella on mahdollista ennustaa, miltä tutkittujen proteiinien monimolekyylinen kompleksi tulee näyttämään [52] .
  • Koneoppimiseen tai tekstinlouhintaan perustuvat menetelmät : koneoppimiseen perustuen on kehitetty menetelmä PPI:n ennustamiseen, joka käyttää vain tutkittujen proteiinien sekvenssejä [57] . Tämä mahdollistaa suuremman määrän mahdollisia vuorovaikutuksia analysoinnin, vaikkakin vähemmän tarkasti, koska työhön käytetään vain aminohapposekvenssejä. Tekstinlouhinta etsii yhteyksiä proteiinien välillä ottamalla huomioon niiden keskinäisen maininnan eri tekstilohkojen lauseissa tai kappaleissa [58] .


CASP

CASP ( englanniksi.  Critical Assessment of protein Structure Prediction  - kriittinen arvio proteiinirakenteiden ennustamisesta) on laajamittainen koe proteiinirakenteiden ennustamisesta. Se on järjestetty vuodesta 1994 lähtien kahden vuoden välein [59] . CASP testaa objektiivisesti proteiinirakenteen ennustusmenetelmiä ja tarjoaa riippumattoman arvion rakenteellisesta mallintamisesta. CASP:n päätavoitteena on auttaa parantamaan menetelmiä proteiinien kolmiulotteisen rakenteen määrittämiseksi niiden aminohapposekvensseistä . Hankkeeseen osallistuu jatkuvasti yli 100 tutkimusryhmää. Yksi CASP:n pääperiaatteista on, että osallistujilla ei ole muuta ennakkotietoa proteiinista kuin aminohapposekvenssi. Tästä syystä CASP käyttää kaksoissokkomenetelmää  – järjestäjät, asiantuntijat tai osallistujat eivät tiedä testattujen proteiinien rakennetta ennen ennustusvaiheen loppua. Testatut proteiinit ovat useimmiten ratkaisemattomia rakenteita, jotka on saatu röntgendiffraktioanalyysillä ja NMR:llä [60] .

Tämä tapahtuma auttaa vertailemaan kehittyneitä menetelmiä proteiinirakenteiden ennustamiseen ja etsimään "ihanteista" algoritmia, joka voi ennustaa proteiinin tertiaarisen rakenteen vain aminohapposekvenssin perusteella [61] .

Viimeisimmän CASP13:n voitti joukkue, joka käytti AlphaFold- hermoverkkoa . Joten todennäköisimmin proteiinirakenteiden ennustaminen tulevaisuudessa tehdään hermoverkkojen avulla [62] .


Taita

Foldit on online-proteiinin taittopulma. Peli on osa tutkimusprojektia ja kehitetty Washingtonin yliopistossa . Pelin tavoitteena on taittaa valittujen proteiinien rakenne parhaalla mahdollisella tavalla; parhaat käyttäjäratkaisut analysoivat tiedemiehet, jotka voivat ratkaista niiden avulla todellisia tieteellisiä rokotteiden etsintään ja biologisiin innovaatioihin liittyviä ongelmia. Useimmilla parhailla Folditin pelaajilla ei ole biokemian taustaa [63] .

Tämän pelin tavoitteena on ennustaa tietyn proteiinin kolmiulotteinen rakenne, jolla on alhaisin vapaaenergiataso [64] . Jokainen tehtävä julkaistaan ​​sivustolla tietyn ajan, jonka aikana käyttäjät kilpailevat keskenään.

Pelin aikana pelaajat manipuloivat vuorovaikutteisesti molekyyliä muuttamalla proteiinin rungon kulmia ja myös aminohapporadikaalien järjestystä. Pelaajat voivat asettaa rajoituksia tietyille alueille ("kuminauhat") tai "jäädyttää" ne. Käyttäjille tarjotaan myös työkalurivi automaattisten tehtävien suorittamista varten, kuten "heilu"-komento minimoidakseen energian paikallisesti.

Käyttäjä saa tietoa siitä, kuinka hyvin hän onnistuu laskostamaan proteiinia, pisteinä, joita myönnetään erityisesti uusien vetysidosten muodostumisesta, hydrofobisten jäänteiden piilottamisesta molekyylin sisään jne. Ohjelma antaa myös pelaajille vihjeitä, esimerkiksi korostaa alueita, joilla tietyt ryhmät menevät päällekkäin ja jotka tulisi laimentaa, avoimet hydrofobiset alueet, jotka tulisi piilottaa veden vaikutuksilta jne. Sivuston avulla käyttäjät voivat jakaa ja keskustella ratkaisuista keskenään [63] .


Historia

Yksi ensimmäisistä algoritmeista proteiinin sekundaarirakenteen ennustamiseksi oli Chou - Fasmanin  menetelmä , joka perustui ensisijaisesti todennäköisyysparametreihin, jotka määritettiin käyttämällä kunkin aminohapon suhteellista esiintymistiheyttä kussakin sekundaarirakenteen tyypissä [21] . Chow-Fasmanin menetelmän tarkkuus on noin 50-60 % [65] .

Seuraava huomionarvoinen ohjelma oli informaatioteoriaan perustuva menetelmä GOR , joka on nimetty kehittäjiensä nimien ensimmäisten kirjainten mukaan [66] . Se käyttää Bayesin päättelyn probabilistista menetelmää [66] . GOR-menetelmä ei ota huomioon vain todennäköisyyttä, että tietyn tyyppinen aminohappo sisältyy tiettyyn sekundaarirakenteeseen, vaan myös ehdollisen todennäköisyyden, että aminohappo sisältyy tähän sekundaarirakenteeseen, ottaen huomioon sen naapureiden panoksen. (ei oleta, että naapureilla olisi sama rakenne) [66] . Alkuperäisen GOR-menetelmän tarkkuus oli noin 65 %, ja se onnistui huomattavasti paremmin alfakierteiden ennustamisessa kuin beetaheliksit , jotka se usein ennusti väärin silmukoiksi tai epäorganisoituneiksi patchiksi 65] .

Toinen iso askel eteenpäin oli koneoppimismenetelmien käyttö: ensimmäisiä hermoverkkojen menetelmiä käytettiin ohjelmissa ennustamaan proteiinien toissijaisia ​​rakenteita. Koulutusnäytteinä he käyttivät proteiinisekvenssejä, joissa oli kokeellisesti saatuja rakenteita, määrittämään yhteisiä motiiveja , jotka liittyvät tiettyyn sekundaarirakenteiden järjestelyyn [67] . Nämä menetelmät ovat yli 70 % tarkkoja ennusteissaan, vaikka beeta-säikeiden lukumäärä on myös usein aliarvioitu, koska kolmiulotteisesta rakenteesta ei ole tietoa, joka mahdollistaisi vetysidoskuvioiden arvioinnin , jotka voivat myötävaikuttaa solujen muodostumiseen. beta-arkki [65] . PSIPRED arkistoitu 21. heinäkuuta 2011 Wayback Machinessa ja JPRED arkistoitu 7. huhtikuuta 2020 Wayback Machinessa ovat tunnetuimpia hermoverkkoon perustuvia proteiinien sekundaarirakenteen ennustusohjelmia [68] [69] . Viime aikoina tukivektorikoneet ovat osoittautuneet erityisen hyödyllisiksi ennustamaan käännöksiä, joita on vaikea tunnistaa tilastollisilla menetelmillä [70] [71] .

Laajennuksia koneoppimismenetelmiin käytetään ennustamaan tarkempia proteiinien paikallisia ominaisuuksia, kuten vääntörunkokulmia luokittelemattoman rakenteen alueilla. Tämän ongelman ratkaisemiseen on käytetty sekä tukivektorikoneita että neuroverkkoja [70] [72] [73] . Äskettäin Wayback Machinen SPINE -X -ohjelma, joka on arkistoitu 12. huhtikuuta 2020, mahdollisti todellisten vääntökulmien tarkan ennustamisen ja onnistuneesti näiden tietojen käytön ennakoimaan ab initio -rakennetta [74] .

Muistiinpanot

  1. Zaki, MJ, Bystroff, C. Proteiinin rakenteen ennustaminen , Humana Press, 2008, 337 s. Katkelma tekstiä Google- kirjoista
  2. ↑ 1 2 Yang Y. , Gao J. , Wang J. , Heffernan R. , Hanson J. , Paliwal K. , Zhou Y. Kuusikymmentäviisi vuotta pitkää marssia proteiinien toissijaisen rakenteen ennustamisessa: viimeinen venytys?  (englanti)  // Briefings In Bioinformatics. - 2018. - 1. toukokuuta ( nide 19 , nro 3 ). - s. 482-494 . - doi : 10.1093/bib/bbw129 . — PMID 28040746 .
  3. Anfinsen CB -periaatteet, jotka hallitsevat proteiiniketjujen taittumista   // Tiede . - 1973. - 20. heinäkuuta ( nide 181 , nro 4096 ). - s. 223-230 . — ISSN 0036-8075 . - doi : 10.1126/tiede.181.4096.223 .
  4. ↑ 1 2 3 Li Bian , Fooksa Michaela , Heinze Sten , Meiler Jens. Neulan löytäminen heinäsuovasta: kohti proteiinin laskostumisongelman ratkaisemista laskennallisesti  //  Biokemian ja molekyylibiologian kriittisiä arvioita. - 2017. - 4. lokakuuta ( nide 53 , nro 1 ). - s. 1-28 . — ISSN 1040-9238 . doi : 10.1080 / 10409238.2017.1380596 .
  5. Zhang Yang. Proteiinirakenteen ennustamisen edistyminen ja haasteet  //  Current Opinion in Structural Biology. - 2008. - Kesäkuu ( osa 18 , nro 3 ) - s. 342-348 . — ISSN 0959-440X . - doi : 10.1016/j.sbi.2008.02.004 .
  6. Perustava "proteiiniongelma" ratkaistu. Tiedemiehet taistelivat siitä puoli vuosisataa , ja lopulta Googlen ohjelmoijat auttoivat heitä – ja tämä voi olla erittäin tärkeää lääketieteen kannalta
  7. Richardson Jane S. The Anatomy and Taxonomy of Protein Structure  (englanniksi)  // Advances in Protein Chemistry Volume 34. - 1981. - P. 167-339 . — ISBN 9780120342341 . — ISSN 0065-3233 . - doi : 10.1016/S0065-3233(08)60520-3 .
  8. Pace CN , Scholtz JM Helixin kokeellinen taipumusasteikko, joka perustuu peptidien ja proteiinien tutkimuksiin.  (englanniksi)  // Biophysical Journal. - 1998. - Heinäkuu ( osa 75 , nro 1 ) . - s. 422-427 . - doi : 10.1016/s0006-3495(98)77529-0 . — PMID 9649402 .
  9. Nick Pace C. , Martin Scholtz J. Helix Propensity Scale, joka perustuu peptidien ja proteiinien kokeellisiin tutkimuksiin  //  Biophysical Journal. - 1998. - Heinäkuu ( osa 75 , nro 1 ) . - s. 422-427 . — ISSN 0006-3495 . - doi : 10.1016/s0006-3495(98)77529-0 .
  10. Chothia C. Kierrettyjen beetalaskosten arkkien konformaatio proteiineissa.  (Englanti)  // Journal Of Molecular Biology. - 1973. - 5. huhtikuuta ( osa 75 , nro 2 ). - s. 295-302 . - doi : 10.1016/0022-2836(73)90022-3 . — PMID 4728692 .
  11. Richardson JS , Richardson DC Luonnolliset beeta-arkkiproteiinit käyttävät negatiivista suunnittelua välttääkseen reunasta reunaan aggregaatiota.  (englanniksi)  // Amerikan yhdysvaltojen kansallisen tiedeakatemian julkaisut. - 2002. - 5. maaliskuuta ( nide 99 , nro 5 ). - P. 2754-2759 . - doi : 10.1073/pnas.052706099 . — PMID 11880627 .
  12. Finkelstein A. V., Ptitsyn O. B. Polypeptidiketjujen toissijaiset rakenteet // Protein Physics. - Moskova: KDU, 2005. - S. 86-95. — ISBN 5-98227-065-2 .
  13. Choi Yoonjoo , Agarwal Sumeet , Deane Charlotte M. Kuinka pitkä on pala silmukkaa?  (englanniksi)  // PeerJ. - 2013. - 12. helmikuuta ( osa 1 ). -P.e1 . _ — ISSN 2167-8359 . - doi : 10.7717/peerj.1 .
  14. Mitä ovat makromolekyylirakenteet? . Haettu 20. huhtikuuta 2020. Arkistoitu alkuperäisestä 12. toukokuuta 2020.
  15. tertiäärinen rakenne Arkistoitu 19. toukokuuta 2011 Wayback Machinessa // IUPAC, 1996, 68, 2193. (Stereokemian perusterminologia (IUPAC Recommendations 1996)) sivulla 2220, IUPAC Gold Book.
  16. Clarke, Jeremy M. Berg; John L. Tymoczko; Lubert Stryer. Verkkosisällön kirjoittanut Neil D. Osa 3.5 Kvaternäärinen rakenne: Polypeptidiketjut voivat koota monialayksikkörakenteiksi // Biokemia . - 5. painos, 4. painos. - New York, NY [ua]: W. H. Freeman, 2002. - ISBN 0-7167-3051-0 .
  17. Chou, Kuo-Chen; Cai, Yu Dong. Proteiinin kvaternaarisen rakenteen ennustaminen pseudoaminohappokoostumuksen perusteella  // Proteiinit  : rakenne, toiminta ja bioinformatiikka : päiväkirja. - 2003. - 1. marraskuuta ( nide 53 , nro 2 ). - s. 282-289 . - doi : 10.1002/prot.10500 . — PMID 14517979 .
  18. ↑ 1 2 Yang Yuedong , Gao Jianzhao , Wang Jihua , Heffernan Rhys , Hanson Jack , Paliwal Kuldip , Zhou Yaoqi. Kuusikymmentäviisi vuotta pitkää marssia proteiinien sekundaarirakenteen ennustamisessa: viimeinen jakso?  (englanniksi)  // Tiedotustilaisuudet bioinformatiikasta. - 2016 - 31. joulukuuta. -P.bbw129 . _ — ISSN 1467-5463 . - doi : 10.1093/bib/bbw129 .
  19. Wolfgang Kabsch, Christian Sander. Proteiinin sekundaarirakenteen sanakirja: Vetysidosten ja geometristen piirteiden kuvioiden tunnistus  // Biopolymeerit. - 1983-12. - T. 22 , no. 12 . — S. 2577–2637 . - ISSN 1097-0282 0006-3525, 1097-0282 . - doi : 10.1002/bip.360221211 . Arkistoitu 29. toukokuuta 2020.
  20. Xu, Ying, Xu, Dong, Liang, Jie. Proteiinirakenteen ennustamisen ja mallintamisen laskennalliset menetelmät: Osa 1: Peruskarakterisointi . - 2007. - ISBN 978-0-387-68372-0 . Arkistoitu 11. kesäkuuta 2020 Wayback Machinessa
  21. ↑ 1 2 Chou Peter Y. , Fasman Gerald D. Proteiinikonformaation ennustaminen   // Biochemistry . - 1974. - 15. tammikuuta ( nide 13 , nro 2 ). - s. 222-245 . — ISSN 0006-2960 . - doi : 10.1021/bi00699a002 .
  22. Asaf A. Salamov, Victor V. Solovjev. Proteiinin toissijaisen rakenteen ennustaminen yhdistämällä lähin naapurialgoritmit ja useita sekvenssikohdistuksia  // Journal of Molecular Biology. - 1995-03. - T. 247 , no. 1 . - S. 11-15 . — ISSN 0022-2836 . - doi : 10.1006/jmbi.1994.0116 .
  23. Daniel W. A. ​​Buchan, David T Jones. PSIPRED-proteiinianalyysityöpöytä: 20 vuotta  // Nucleic Acids Research. - 26-04-2019. - T. 47 , no. W1 . — S. W402–W407 . — ISSN 1362-4962 0305-1048, 1362-4962 . - doi : 10.1093/nar/gkz297 .
  24. David T Jones. Proteiinin sekundaarirakenteen ennuste, joka perustuu paikkakohtaisiin pisteytysmatriiseihin 1 1Toimittaja G. Von Heijne  // Journal of Molecular Biology. - 1999-09. - T. 292 , no. 2 . — S. 195–202 . — ISSN 0022-2836 . - doi : 10.1006/jmbi.1999.3091 .
  25. Kiyoshi Asai, Satoru Hayamizu, Ken'ichi Handa. Proteiinin sekundaarirakenteen ennustaminen piilotetulla Markovin mallilla  // Bioinformatiikka. - 1993. - T. 9 , no. 2 . — S. 141–146 . - ISSN 1460-2059 1367-4803, 1460-2059 . - doi : 10.1093/bioinformatiikka/9.2.141 .
  26. Pirovano Walter , Heringa Jaap. Proteiinin sekundaarirakenteen ennustaminen  (englanniksi)  // Methods in Molecular Biology. - 2009 - 30. lokakuuta. - s. 327-348 . — ISBN 9781603272407 . — ISSN 1064-3745 . - doi : 10.1007/978-1-60327-241-4_19 .
  27. Bioinformatiikka / Shui Qing Ye. – Chapman ja Hall/CRC, 20.8.2007. — ISBN 978-0-429-14203-1 .
  28. Seung Hwan Hong, Keehyoung Joo, Jooyoung Lee. ConDo: proteiinialueen rajan ennustaminen yhteisevoluutioinformaation avulla   // Bioinformatics . – 15.7.2019 — Voi. 35 , iss. 14 . - P. 2411-2417 . — ISSN 1367-4803 . - doi : 10.1093/bioinformatics/bty973 .
  29. Ovchinnikov S, Kim De, Wang Ry, Liu Y, DiMaio F, Baker D. Paransi De Novo -rakenteen ennustetta CASP11:ssä sisällyttämällä koevoluutiotiedot  Rosettaan . Proteiinit (syyskuu 2016). Haettu 13. huhtikuuta 2020. Arkistoitu alkuperäisestä 1. huhtikuuta 2021.
  30. Dong Xu, Lukasz Jaroszewski, Zhanwen Li, Adam Godzik. AIDA: ab initio -domeenin kokoonpano automatisoituun monitoimialueen proteiinirakenteen ennustamiseen ja domain-domain-vuorovaikutuksen ennustamiseen  (englanniksi)  // Bioinformatics. - 01-07-2015 — Voi. 31 , iss. 13 . - s. 2098-2105 . — ISSN 1367-4803 . - doi : 10.1093/bioinformatics/btv092 . Arkistoitu alkuperäisestä 3. kesäkuuta 2018.
  31. Bian Lia et ai. Neulan löytäminen heinäsuovasta: kohti proteiinin laskostumisongelman ratkaisemista laskennallisesti  //  Crit Rev Biochem Mol Biol : lehti. - 2018. - Vol. 52 , no. 1 . - s. 1-28 . doi : 10.1080 / 10409238.2017.1380596 .
  32. Philip Hunter. taiteeseen. Tekniikan ja algoritmien edistyminen mahdollistaa suuria harppauksia proteiinirakenteen ennustamisessa  // EMBO raportoi. - 2006-03. - T. 7 , no. 3 . — S. 249–252 . — ISSN 1469-221X . - doi : 10.1038/sj.embor.7400655 .
  33. Ulrike Göbel, Chris Sander, Reinhard Schneider, Alfonso Valencia. Korreloidut mutaatiot ja jäännöskontaktit proteiineissa  (englanniksi)  // Proteins: Structure, Function, and Bioinformatics. - 1994. - Voi. 18 , iss. 4 . - s. 309-317 . — ISSN 1097-0134 . - doi : 10.1002/prot.340180402 .
  34. William R. Taylor, Kerr Hatrick. Muutosten kompensoiminen proteiinien useiden sekvenssien kohdistuksissa  //  Protein Engineering, Design and Selection. - 1.3.1994. — Voi. 7 , iss. 3 . - s. 341-348 . — ISSN 1741-0126 . doi : 10.1093 / proteiini/7.3.341 .
  35. Debora S. Marks, Lucy J. Colwell, Robert Sheridan, Thomas A. Hopf, Andrea Pagnani. Proteiinin 3D-rakenne laskettu evoluutionaarisen sekvenssin vaihtelusta  // PLOS One  . - Julkinen tiedekirjasto , 12.7.2011. — Voi. 6 , iss. 12 . —P.e28766 . _ — ISSN 1932-6203 . - doi : 10.1371/journal.pone.0028766 . Arkistoitu alkuperäisestä 8. maaliskuuta 2022.
  36. Lukas Burger, Erik van Nimwegen. Erottaminen suoraan jäämien epäsuorasta yhteisevoluutiosta proteiinien kohdistuksissa  //  PLOS Computational Biology. - 01-01-2010. — Voi. 6 , iss. 1 . — P.e1000633 . — ISSN 1553-7358 . - doi : 10.1371/journal.pcbi.1000633 . Arkistoitu alkuperäisestä 18. helmikuuta 2022.
  37. Faruck Morcos, Andrea Pagnani, Bryan Lunt, Arianna Bertolino, Debora S. Marks. Jäännöksen yhteisevoluution suora kytkentäanalyysi kaappaa natiivikontakteja monien proteiiniperheiden välillä  // Proceedings of the National Academy of Sciences  . - National Academy of Sciences , 2011-12-06. — Voi. 108 , iss. 49 . - P. E1293–E1301 . - ISSN 1091-6490 0027-8424, 1091-6490 . - doi : 10.1073/pnas.1111471108 . Arkistoitu alkuperäisestä 25.7.2020.
  38. Timothy Nugent, David T. Jones. Suurien transmembraanisten proteiinidomeenien tarkka de novo -rakenteen ennuste käyttämällä fragmenttien kokoamista ja korreloitua mutaatioanalyysiä  // Proceedings of the National Academy of Sciences  . - National Academy of Sciences , 12.6.2012. — Voi. 109 , iss. 24 . - P. E1540–E1547 . - ISSN 1091-6490 0027-8424, 1091-6490 . - doi : 10.1073/pnas.1120036109 . Arkistoitu 25. toukokuuta 2021.
  39. Yang Zhang. Proteiinirakenteen ennustamisen edistyminen ja haasteet  //  Current Opinion in Structural Biology. — Elsevier , 2008-06-01. — Voi. 18 , iss. 3 . - s. 342-348 . — ISSN 0959-440X . - doi : 10.1016/j.sbi.2008.02.004 .
  40. ↑ 1 2 Bian Li, Michaela Fooksa, Sten Heinze, Jens Meiler. Neulan löytäminen heinäsuovasta: kohti proteiinin laskostumisongelman ratkaisemista laskennallisesti  //  Biokemian ja molekyylibiologian kriittisiä arvioita. - 2018-01-02. — Voi. 53 , iss. 1 . - s. 1-28 . — ISSN 1549-7798 1040-9238, 1549-7798 . doi : 10.1080 / 10409238.2017.1380596 .
  41. Yang Zhang, Jeffrey Skolnick. Proteiinirakenteen ennustusongelma voitaisiin ratkaista käyttämällä nykyistä PDB-kirjastoa  // Proceedings of the National Academy of Sciences  . - National Academy of Sciences , 25.1.2005. — Voi. 102 , iss. 4 . - s. 1029-1034 . - ISSN 1091-6490 0027-8424, 1091-6490 . - doi : 10.1073/pnas.0407152101 . Arkistoitu alkuperäisestä 22. heinäkuuta 2020.
  42. JU Bowie, R. Luthy, D. Eisenberg. Menetelmä tunnetuksi kolmiulotteiseksi rakenteeksi laskostuvien proteiinisekvenssien tunnistamiseksi   // Tiede . - 12.7.1991. — Voi. 253 , iss. 5016 . - s. 164-170 . — ISSN 1095-9203 0036-8075, 1095-9203 . - doi : 10.1126/tiede.1853201 . Arkistoitu alkuperäisestä 21. helmikuuta 2020.
  43. Yo Matsuo, Haruki Nakamura, Ken Nishikawa. Proteiinin 3D-1D-yhteensopivuuden havaitseminen, jota luonnehtii sivuketjujen pakkauksen ja sähköstaattisten vuorovaikutusten arviointi  //  The Journal of Biochemistry. - 1995-07. — Voi. 118 , iss. 1 . — s. 137–148 . — ISSN 0021-924X 1756-2651, 0021-924X . - doi : 10.1093/oxfordjournals.jbchem.a124869 .
  44. Desmet J, De Maeyer M, Hazes B, Lasters I. Dead -end-eliminaatiolause ja sen käyttö proteiinien sivuketjun sijoittelussa  . Luonto (9. huhtikuuta 1992). Haettu 27. huhtikuuta 2020. Arkistoitu alkuperäisestä 31. lokakuuta 2021.
  45. Patrice Koehl, Marc Delarue. Itsejohdonmukaisen keskikenttäteorian soveltaminen proteiinien sivuketjujen konformaation ennustamiseen ja niiden konformaatioentropian  arvioimiseen // Journal of Molecular Biology. - 1994-06. - T. 239 , no. 2 . - S. 249-275 . — ISSN 0022-2836 . - doi : 10.1006/jmbi.1994.1366 .
  46. Roland L Dunbrack. Rotamer-kirjastot 2000-luvulla  //  Current Opinion in Structural Biology. - Elsevier , 2002-08-01. — Voi. 12 , iss. 4 . - s. 431-440 . — ISSN 0959-440X . - doi : 10.1016/S0959-440X(02)00344-5 .
  47. Jay W. Ponder, Frederic M. Richards. Tertiaariset templaatit proteiineille: Pakkauskriteerien käyttö sallittujen sekvenssien luetteloinnissa eri rakenneluokille  //  Journal of Molecular Biology. - 20.2.1987. — Voi. 193 , iss. 4 . - s. 775-791 . — ISSN 0022-2836 . - doi : 10.1016/0022-2836(87)90358-5 .
  48. Simon C. Lovell, J. Michael Word, Jane S. Richardson, David C. Richardson. Toiseksi viimeinen rotameerikirjasto  (saksa)  // Proteiinit: rakenne, toiminta ja bioinformatiikka. - 2000. - Bd. 40 , H.3 . - S. 389-408 . — ISSN 1097-0134 . - doi : 10.1002/1097-0134(20000815)40:33.0.CO;2-2 .
  49. Maxim V. Shapovalov, Roland L. Dunbrack. Tasoitettu rungosta riippuvainen Rotamer-kirjasto adaptiivisista ydintiheysarvioista ja regressioista johdetuille proteiineille   // Rakenne . – 08.06.2011. — Voi. 19 , iss. 6 . - s. 844-858 . — ISSN 0969-2126 . - doi : 10.1016/j.str.2011.03.019 . Arkistoitu alkuperäisestä 21. heinäkuuta 2013.
  50. Andrew M. Watkins, Timothy W. Craven, P. Douglas Renfrew, Paramjit S. Arora, Richard Bonneau. Rotamer Libraries for the High-Resolution Design of β-aminohappo Foldamers  // Structure (Lontoo, Englanti: 1993). – 7.11.2017. - T. 25 , no. 11 . — S. 1771–1780.e3 . — ISSN 0969-2126 . - doi : 10.1016/j.str.2017.09.005 .
  51. Thomas Lengauer, Matthias Rarey. Laskennalliset menetelmät biomolekyylien telakointiin  //  Current Opinion in Structural Biology. - 1.6.1996. — Voi. 6 , iss. 3 . - s. 402-406 . — ISSN 0959-440X . - doi : 10.1016/S0959-440X(96)80061-3 . Arkistoitu alkuperäisestä 29. marraskuuta 2012.
  52. 1 2 3 4 5 6 Keskin, O.; Tuncbag, N; Gursoy, A. Proteiinin ja proteiinin välisten vuorovaikutusten ennustaminen molekyylistä proteomitasolle   // Chemical Reviews : päiväkirja. - 2016. - Vol. 116 , nro. 8 . - P. 4884-4909 . — PMID 27074302 .
  53. Enright, AJ; Iliopoulos, I.; Kyrpides, N.C.; Ouzounis, CA Proteiinivuorovaikutuskartat täydellisille  genomeille, jotka perustuvat geenifuusiotapahtumiin //  Nature : Journal. - 1999. - Voi. 402 , no. 6757 . - s. 86-90 . — PMID 10573422 .
  54. Pazos, F.; Valencia, A. Fylogeneettisten puiden samankaltaisuus proteiinin ja proteiinin välisen vuorovaikutuksen indikaattorina  // Protein Eng  ., Des. Sel. : päiväkirja. - 2001. - Voi. 14 , ei. 9 . - s. 609-614 . — PMID 11707606 .
  55. Jansen, R.; IGreenbaum, D.; Gerstein, M. Koko genomin ilmentymistietojen yhdistäminen proteiini-proteiinivuorovaikutuksiin  // Genome Res  . : päiväkirja. - 2002. - Voi. 12 , ei. 1 . - s. 37-46 . — PMID 11779829 .
  56. Pazos, F.; Valencia, A. In Silico Two-Hybrid System for Selection of Physically Interacting Protein Pairs  //  Proteins: Struct., Funct., Genet. : päiväkirja. - 2002. - Voi. 47 , nro. 2 . - s. 219-227 . — PMID 11933068 .
  57. Shen, J.; IZhang, J.; Luo, X.; Zhu, W.; Yu, K.; Chen, K.; Li, Y.; Jiang, H. Proteiini-proteiini-vuorovaikutusten ennustaminen vain sekvenssitietoihin perustuen  (englanti)  // Proceedings of the National Academy of Sciences of the United of America  : Journal. - 2007. - Voi. 104 , no. 11 . - P. 4337-4341 . — PMID 17360525 .
  58. Papanikolaou, N.; Pavlopoulos, G.A.; Theodosiou, T.; Iliopoulos, I. Proteiini-proteiini-vuorovaikutuksen ennusteet käyttämällä tekstinlouhintamenetelmiä  //  Methods : Journal. - 2015. - Vol. 74 . - s. 47-53 . — PMID 25448298 .
  59. Moult John , Pedersen Jan T. , Judson Richard , Fidelis Krzysztof. Laajamittainen kokeilu proteiinirakenteen ennustusmenetelmien arvioimiseksi  //  Proteiinit: rakenne, toiminta ja genetiikka. - 1995. - marraskuu ( osa 23 , nro 3 ) . - P. ii-iv . — ISSN 0887-3585 . - doi : 10.1002/prot.340230303 .
  60. Moult J. , Pedersen JT , Judson R. , Fidelis K. Laajamittainen kokeilu proteiinirakenteen ennustusmenetelmien arvioimiseksi.  (englanniksi)  // Proteiinit. - 1995. - marraskuu ( osa 23 , nro 3 ) . - doi : 10.1002/prot.340230303 . — PMID 8710822 .
  61. Ben-David M. , Noivirt-Brik O. , Paz A. , Prilusky J. , Sussman JL , Levy Y. CASP8-rakenteen ennusteiden arviointi mallivapaille kohteille.  (englanniksi)  // Proteiinit. - 2009. - Vol. 77 Supple 9 . - s. 50-65 . - doi : 10.1002/prot.22591 . — PMID 19774550 .
  62. Googlen DeepMind ennustaa proteiinien 3D-muotoja , The Guardian  (2. joulukuuta 2018). Arkistoitu alkuperäisestä 18. heinäkuuta 2019. Haettu 19.7.2019.
  63. 1 2 Cooper S., Khatib F., Treuille A., Barbero J., Lee J., Beenen M., Leaver-Fay A., Baker D., Popović Z., Players F. Proteiinirakenteiden ennustaminen moninpelissä online-peli  (eng.)  // Luonto: päiväkirja. - 2010. - Vol. 466 . - s. 756-760 . - doi : 10.1038/luonto09304 . — PMID 20686574 .
  64. Hyvät BM, Su AI -pelit, joilla on tieteellinen tarkoitus  // Genome Biol .. - 2011. - V. 12 . - S. 135 . - doi : 10.1186/gb-2011-12-12-135 . — PMID 22204700 .
  65. ↑ 1 2 3 Mount, David W. Bioinformatiikka: sekvenssi- ja genomianalyysi . - 2. painos - Cold Spring Harbor, NY: Cold Spring Harbor Laboratory Press, 2004. - xii, 692 sivua s. — ISBN 0-87969-687-7 , 978-0-87969-687-0, 0-87969-712-1, 978-0-87969-712-9 652-070-9. Arkistoitu 5. tammikuuta 2009 Wayback Machinessa
  66. ↑ 1 2 3 Garnier J. , Osguthorpe DJ , Robson B. Analyysi yksinkertaisten menetelmien tarkkuudesta ja vaikutuksista globulaaristen proteiinien sekundaarirakenteen ennustamiseen  //  Journal of Molecular Biology. - 1978. - Maaliskuu ( osa 120 , nro 1 ) . - s. 97-120 . — ISSN 0022-2836 . - doi : 10.1016/0022-2836(78)90297-8 .
  67. Holley LH , Karplus M. Proteiinin sekundaarirakenteen ennustus hermoverkolla.  (englanti)  // Proceedings of the National Academy of Sciences. - 1989. - 1. tammikuuta ( nide 86 , nro 1 ). - s. 152-156 . — ISSN 0027-8424 . - doi : 10.1073/pnas.86.1.152 .
  68. Buchan Daniel WA , Jones David T. PSIPRED Protein Analysis Workbench: 20 years on  //  Nucleic Acids Research. - 2019. - 26. huhtikuuta ( nide 47 , nro W1 ). - P.W402-W407 . — ISSN 0305-1048 . - doi : 10.1093/nar/gkz297 .
  69. Drozdetskiy Alexey , Cole Christian , Procter James , Barton Geoffrey J. JPred4: proteiinin sekundaarirakenteen ennustuspalvelin  //  Nucleic Acids Research. - 2015. - 16. huhtikuuta ( nide 43 , nro W1 ). - P.W389-W394 . — ISSN 0305-1048 . - doi : 10.1093/nar/gkv332 .
  70. 1 2 PHAM THO HOAN , SATOU KENJI , HO TU BAO. TUKI VEKTORIKONEITA PROTEIINIEN BETA- JA GAMMA-KÄÄNTÖJEN ENNUSTAMISTA JA ANALYYSIÄ  //  Journal of Bioinformatics and Computational Biology. - 2005. - huhtikuu ( osa 03 , nro 02 ). - s. 343-358 . — ISSN 0219-7200 . - doi : 10.1142/S0219720005001089 .
  71. Zhang Q. , Yoon S. , Welsh WJ Parannettu menetelmä käännöksen ennustamiseen tukivektorikoneella   // Bioinformatiikka . - 2005. - 29. maaliskuuta ( osa 21 , nro 10 ). - s. 2370-2374 . — ISSN 1367-4803 . - doi : 10.1093/bioinformatics/bti358 .
  72. Zimmermann O. , Hansmann UHE Tukivektorikoneet dihedral-kulma-alueiden ennustamiseen   // Bioinformatiikka . - 2006. - 27. syyskuuta ( osa 22 , nro 24 ). - s. 3009-3015 . — ISSN 1367-4803 . - doi : 10.1093/bioinformatics/btl489 .
  73. Kuang R. , Leslie C.S. , Yang A.-S. Proteiinin selkärangan kulman ennustaminen koneoppimismenetelmillä   // Bioinformatiikka . - 2004. - 26. helmikuuta ( osa 20 , nro 10 ). - s. 1612-1621 . — ISSN 1367-4803 . - doi : 10.1093/bioinformatics/bth136 .
  74. Faraggi Eshel , Yang Yuedong , Zhang Shesheng , Zhou Yaoqi. Jatkuvan paikallisen rakenteen ennustaminen ja sen sekundaarirakenteen korvaamisen vaikutus fragmentittomassa proteiinirakenteen ennustuksessa   // Rakenne . - 2009. - marraskuu ( osa 17 , nro 11 ). - s. 1515-1527 . — ISSN 0969-2126 . - doi : 10.1016/j.str.2009.09.006 .