Rosetta@home | |
---|---|
| |
Tyyppi | Protein Structure Prediction , Volunteer Computing ja Berkeley Open Infrastructure for Network Computing -projekteja [d] |
Kehittäjä | Baker-laboratorio , Washingtonin yliopisto , Rosetta Commons |
Käyttöjärjestelmä | Monialustainen ohjelmisto |
Ensimmäinen painos | 6. lokakuuta 2005 |
Laitteistoalusta | BOINC |
uusin versio | Rosetta Mini: 3,71 [1] ( 20. tammikuuta 2016 ) |
Osavaltio | Aktiivinen |
Lisenssi | Ilmainen akateemiseen ja voittoa tavoittelemattomaan käyttöön, oma lisenssi kaupalliseen käyttöön [2] |
Verkkosivusto | boinc.bakerlab.org/roset… |
Mediatiedostot Wikimedia Commonsissa |
Rosetta@home | |
---|---|
Alusta | BOINC |
Ohjelmiston latauskoko | 48 Mt |
Työn tietojen ladattu koko | 2,5 Mt |
Lähetettyjen työtietojen määrä | 6-150 kt |
Levytila _ | 130 Mt |
Käytetty muistin määrä | 255 Mt |
GUI | on |
Keskimääräinen tehtävän laskenta-aika | 0,5 - 10 tuntia (aikasäätö mahdollista) |
takaraja | 10 päivää |
Mahdollisuus käyttää GPU :ta | Ei |
Mediatiedostot Wikimedia Commonsissa |
Rosetta@Home on vapaaehtoinen laskentaprojekti , jonka tavoitteena on ratkaista yksi molekyylibiologian suurimmista ongelmista - proteiinien tertiäärisen rakenteen laskeminen niiden aminohapposekvensseistä . Valmistuneen Human Genome Projectin ansiosta kaikkien ihmiskehon proteiinien aminohapposekvenssit tunnetaan. Tämän hankkeen tutkimus auttaa myös uusien, olemattomien proteiinien suunnittelussa. Vaikka suuri osa hankkeesta keskittyy perustutkimukseen parantaakseen proteomisten menetelmien tarkkuutta ja kestävyyttä, Rosetta@home edistää myös soveltavaa tutkimusta sairauksien, kuten syövän , malarian , Alzheimerin , pernaruton ja muiden geneettisten ja virussairauksien torjumiseksi [3] . Foldit on Rosetta@Homen videopeli, jonka tavoitteena on saavuttaa projektin tavoitteet joukkolähdettämällä .
Rosetta@Home laskentatuloksia ei ole suoraan saatavilla. Et myöskään voi käyttää oman tietokoneesi laskelmien tuloksia. [4] Niitä käytetään kuitenkin useissa tieteellisissä julkaisuissa. [5]
Pohjimmiltaan Rosetta on tietokoneohjelma, jonka päätehtävät ovat:
Tämä projekti käyttää ennakointia ja tulospalautetta parantaakseen mahdollisia hakuominaisuuksia ja -algoritmeja .
Rosetta@home-sovellus ja BOINC Distributed Computing Platform , saatavilla Windows-, Linux- ja macOS-käyttöjärjestelmille; BOINC toimii myös useilla muilla, kuten FreeBSD:llä. Rosetta@homeen osallistuminen edellyttää keskusyksikköä (CPU), jonka kellotaajuus on vähintään 500 MHz, 200 megatavua vapaata levytilaa, 512 megatavua fyysistä muistia ja Internet-yhteyden. 27.6.2020 alkaen Rosetta Mini -sovelluksen nykyinen versio on 4.20. BOINC-ohjelmiston nykyinen suositeltu versio on 7.16.7. Standard Hypertext Transfer Protocol (HTTP) (portti 80) käytetään viestintään käyttäjän BOINC-asiakkaan ja Rosetta@home-palvelimien välillä Washingtonin yliopistossa . Salasanan vaihdossa käytetään HTTPS:ää (portti 443). BOINC-asiakkaan etä- ja paikallinen hallinta käyttää portteja 31416 ja 1043, jotka voidaan erityisesti poistaa, jos ne ovat palomuurin takana. Yksittäisten proteiinien tietoja sisältävät työyksiköt jaetaan Washingtonin yliopiston Baker Labissa sijaitsevilta palvelimilta vapaaehtoisille tietokoneille, jotka sitten laskevat rakenneennusteen määrätylle proteiinille. Tietyn proteiinin toistuvien rakenneennusteiden välttämiseksi jokainen työlohko alustetaan satunnaisella määrällä siemeniä. Tämä antaa jokaiselle ennusteelle ainutlaatuisen liikeradan laskeutua proteiinin energiamaiseman läpi. Rosetta@homen proteiinirakenteen ennusteet ovat likimääräisiä arvoja globaalille minimille tietyn proteiinin energiamaisemassa. Tämä globaali minimi edustaa energeettisesti edullisinta proteiinikonformaatiota, eli sen natiivitilaa.
Rosetta@home graafisen käyttöliittymän (GUI) pääominaisuus on näytönsäästäjä, joka näyttää käynnissä olevan moduulin nykyisen tilan proteiinin laskostumisen simulaation aikana. Nykyisen aloitusnäytön vasemmassa yläkulmassa näkyy kohdeproteiini, joka omaksuu erilaisia muotoja (konformaatioita) etsiessään pienimmän energian rakennetta. Välittömästi oikealla on viimeksi vastaanotetun rakenne. Oikeassa yläkulmassa näkyy nykyisen asettelun pienin energiamuoto; alla on proteiinin todellinen tai natiivi rakenne, jos se on jo määritetty. Aloitusnäytössä on kolme kaaviota. Keskikohdan lähellä näkyy käyrä hyväksytyn mallin termodynaamiselle vapaalle energialle, joka vaihtelee hyväksytyn mallin muuttuessa. Oikealla näkyy hyväksytyn mallin standardihajonnan (RMSD) käyrä, joka mittaa, kuinka rakenteellisesti samanlainen hyväksytty malli on alkuperäisen mallin kanssa. Vastaanotetun energiakäyrän oikealla puolella ja RMSD-käyrän alapuolella näiden kahden funktion tuloksia käytetään kuvaamaan energia verrattuna RMSD:hen, kun mallia asteittain jalostetaan.
Kuten kaikki BOINC-projektit, Rosetta@home toimii taustalla käyttäjän tietokoneella käyttämättömän tietokoneen virtaa käyttäen isännän käyttöjärjestelmän tilille kirjautumisen aikana tai ennen sitä . Ohjelma vapauttaa resursseja suorittimesta muiden sovellusten tarpeessa, mikä ei vaikuta tietokoneen normaaliin käyttöön. Monet ohjelmavaihtoehdot voidaan määrittää käyttäjätilin asetuksista, mukaan lukien: ohjelman käyttämien prosessoriresurssien enimmäisprosenttiosuus (virrankulutuksen ohjaamiseen tai lämmön tuottamiseen vakioteholla toimivasta tietokoneesta), kellonaika, jolloin ohjelma voi toimia, ja enemmän muuta.
Rosetta@home-verkossa toimiva Rosetta-ohjelmisto on kirjoitettu uudelleen C++-kielellä, jotta sen kehittäminen olisi helpompaa kuin sen alkuperäinen versio, joka on kirjoitettu Fortranilla. Tämä uusi versio on oliopohjainen ja julkaistiin 8. helmikuuta 2008. Rosetta-koodin kehittämisestä vastaa Rosetta Commons. Ohjelmisto on vapaasti lisensoitu akateemisen yhteisön käyttöön, ja se on lääkeyhtiöiden saatavilla maksua vastaan.
Genomisekvensointiprojektien lisääntymisen myötä tutkijat voivat päätellä aminohapposekvenssin tai primäärirakenteen monille soluissa toimivia proteiineja. Ymmärtääkseen paremmin proteiinin toimintaa ja auttaakseen järkevässä lääkesuunnittelussa tutkijoiden on tiedettävä proteiinin kolmiulotteinen tertiäärinen rakenne.
Proteiinien kolmiulotteiset rakenteet määritetään tällä hetkellä kokeellisesti käyttäen röntgenkristallografiaa tai ydinmagneettista resonanssia (NMR) spektroskopiaa. Prosessi on hidas (voi kestää viikkoja tai jopa kuukausia selvittää, kuinka proteiini kiteytyy ensimmäistä kertaa) ja kallis (noin 100 000 dollaria proteiinia kohden). Valitettavasti uusien sekvenssien löytämisnopeus ylittää huomattavasti rakenteen määrittämisen – National Center for Biotechnology Informationin (NCBI) pelkistämättömien (nr) proteiinien tietokannasta saatavilla yli 7 400 000 proteiinisekvenssistä alle 52 000 kolmiulotteista. proteiinirakenteet on selvitetty ja sijoitettu Protein Data Bankiin, joka on proteiineja koskevien rakenteellisten tietojen päävarasto [6] . Yksi Rosetta@homen päätavoitteista on ennustaa proteiinirakenteita nykyisten menetelmien kanssa samalla tarkkuudella, mutta huomattavasti vähemmän aikaa ja rahaa vaativalla tavalla. Rosetta@home kehittää myös menetelmiä membraaniproteiinien (esim. G-proteiinikytketyt reseptorit (GPCR)) rakenteen ja telakoinnin määrittämiseksi, joita on erittäin vaikea analysoida perinteisillä menetelmillä, kuten röntgenkristallografialla ja NMR-spektroskopialla, mutta jotka edustavat suurinta osaa nykyaikaisten lääkkeiden kohteista.
Proteiinirakenteen ennustamisen edistymistä mitataan Critical Assessment for Protein Structure Prediction (CASP) -kokeessa, joka tehdään kaksi kertaa vuodessa, jossa tutkijat ympäri maailmaa yrittävät johtaa proteiinin rakennetta proteiinin aminohapposekvenssistä. Tässä toisinaan kilpailevassa kokeessa menestyviä ryhmiä pidetään de facto standardina proteiinirakenteen ennustamisessa. Rosetta, Rosetta @ homen perustana oleva ohjelma, käytettiin CASP5:n kanssa vuonna 2002. Vuoden 2004 CASP6-kokeessa Rosetta teki historiaa saavuttamalla ensimmäisenä lähes atomiresoluution ab initio -proteiinirakenteen ennusteen esittämässään mallissa CASP-kohteeseen T0281. Ab initio -mallinnusta pidetään erityisen haastavana proteiinirakenteen ennustuskategoriana, koska siinä ei käytetä tietoa rakenteellisesta homologiasta ja sen on turvauduttava sekvenssihomologiasta saatuun tietoon ja proteiinin sisällä olevien fysikaalisten vuorovaikutusten mallintamiseen. Rosetta@homea on käytetty CASP:ssä vuodesta 2006, jolloin se oli yksi parhaista ennustajista kaikissa CASP7:n rakenteellisissa ennustekategorioissa. Nämä korkealaatuiset ennusteet perustuivat Rosetta@home-vapaaehtoisten laskentatehoon. Kasvava laskentateho antaa Rosetta@homelle mahdollisuuden valita enemmän konformaatioavaruuden alueita (mahdollisia muotoja, joita proteiini voi ottaa), joiden Levinthalin paradoksin mukaan ennustetaan kasvavan eksponentiaalisesti proteiinin pituuden mukana.
Rosetta@homea käytetään myös proteiini-proteiini-telakointiennustuksessa, joka määrittää useiden monimutkaisten proteiinien rakenteen tai kvaternaarisen rakenteen. Tämän tyyppinen proteiinivuorovaikutus vaikuttaa moniin solutoimintoihin, mukaan lukien antigeeni-vasta-ainesitoutuminen ja entsyymi-inhibiittorisitoutuminen, sekä solujen tuonti ja vienti. Näiden yhteisvaikutusten määrittäminen on ratkaisevan tärkeää lääkekehityksen kannalta. Rosettaa käytetään Critical Interaction Prediction Evaluation (CAPRI) -kokeessa, joka arvioi proteiinin telakointikentän tilaa samalla tavalla kuin CASP mittaa edistymistä proteiinin rakenteen ennustamisessa. Rosetta@home-projektin vapaaehtoisten tarjoama laskentateho mainittiin yhdeksi Rosettan suorituskyvyn päätekijöistä CAPRIssa, jossa sen telakointiennusteet olivat tarkimpia ja täydellisimpiä.
Vuoden 2008 alussa Rosettalla suunniteltiin laskennallisesti proteiinia, jolla on toiminto, jota ei ole aiemmin nähty luonnossa. Tämä sai osittain inspiraationsa kuuluisan vuoden 2004 julkaisun lyhenteestä, joka alun perin kuvaili proteiinin laskennallista suunnittelua, jolla on parannettu entsymaattinen aktiivisuus verrattuna sen luonnolliseen muotoon. David Bakerin ryhmän vuoden 2008 tutkimuspaperi, jossa kuvataan proteiinin valmistusta ja jossa Rosetta@home viittaa hänen käyttöön antamiinsa laskennallisiin resursseihin, on tärkeä todiste tämän proteiininmuokkausmenetelmän konseptista. Tämän tyyppisellä proteiinisuunnittelulla voi olla tulevaisuuden sovelluksia lääkekehitykseen, vihreään kemiaan ja bioremediatioon.
Rosetta-ohjelmistopaketin komponenttia, RosettaDesignia, on käytetty ennustamaan tarkasti, mitkä amyloidogeenisten proteiinien alueet todennäköisimmin muodostavat amyloidin kaltaisia fibrillejä. Ottamalla kiinnostavan proteiinin heksapeptidejä (kuusi aminohappoa pitkää fragmenttia) ja valitsemalla pienimmän energian vastaavuuden tunnetun fibrilliä muodostavan heksapeptidin rakenteelle, RosettaDesign pystyi tunnistamaan peptidit kaksi kertaa todennäköisemmin muodostamaan fibrillejä kuin satunnaiset proteiinit. . Rosetta@homea käytettiin samassa tutkimuksessa ennustamaan rakenteita beeta-amyloidille, fibrillejä muodostavalle proteiinille, jonka uskotaan aiheuttavan Alzheimerin tautia. Alustavia, mutta vielä julkaisemattomia tuloksia on saatu Rosettan kehittämistä proteiineista, jotka voivat estää fibrillien muodostumista, vaikka ei tiedetä, voiko tämä estää taudin.
Toista Rosettan komponenttia, RosettaDockia, on käytetty yhdessä kokeellisten menetelmien kanssa vuorovaikutusten mallintamiseen kolmen proteiinin – letaalitekijän (LF), turvotustekijän (EF) ja suojaavan antigeenin (PA) – välillä, jotka muodostavat pernaruttotoksiinin. Tietokonemalli ennusti tarkasti LF:n ja PA:n välisen telakoinnin, mikä auttoi määrittämään, mitkä vastaavien proteiinien domeenit ovat mukana LF-PA-kompleksissa. Tätä ymmärrystä käytettiin lopulta tutkimuksessa, mikä johti parempiin pernaruttorokotteisiin.
Herpes simplex -virus tyyppi 1
RosettaDockia käytettiin vasta-aineen (immunoglobuliini G) ja herpesviruksen, herpes simplex virus 1:n (HSV-1) ekspressoiman pintaproteiinin välisen telakoinnin mallintamiseen, mikä toimii antiviraalisen vasta-aineen hajottajana. RosettaDockin ennustama proteiinikompleksi sopi tiiviisti erityisen vaikeasti saatavien kokeellisten mallien kanssa, mikä johti tutkijat päättelemään, että telakointimenetelmä voisi ratkaista joitakin röntgenkristallografian ongelmia proteiinien ja proteiinien välisten rajapintojen mallintamisessa.
19,4 miljoonan dollarin Bill & Melinda Gatesin apurahalla rahoitetun tutkimuksen kautta. USA, Rosetta@homea on käytetty monien mahdollisten ihmisen immuunikatovirus (HIV) -rokotteiden kehittämisessä.
Great Challenges in Global Health -aloitteeseen liittyvässä tutkimuksessa Rosettaa on käytetty laskennallisesti kehittämään uusia endonukleaasiproteiineja, jotka voivat tappaa Anopheles gambiae tai muutoin tehdä hyttysen kykenemättömäksi levittämään malariaa. Kyky spesifisesti mallintaa ja muuttaa proteiini-DNA-vuorovaikutuksia, kuten kotiutuvien endonukleaasien vuorovaikutuksia, antaa laskennallisille proteiinimuokkausmenetelmille, kuten Rosettalle, tärkeän roolin geeniterapiassa (johon sisältyy mahdollisia syövänhoitoja).
Rosetta@Home [7] -projektin osallistujien virallisten tilastojen perusteella lokakuussa 2011 aktiivisia osallistujia oli 38 tuhatta henkilöä [8] . Heinäkuussa 2017 projektilla oli noin 300 000 aktiivista käyttäjää [9] .
tietojenkäsittelyprojektit | Vapaaehtoiset|
---|---|
Tähtitiede |
|
Biologia ja lääketiede |
|
kognitiivinen |
|
Ilmasto |
|
Matematiikka |
|
Fyysinen ja tekninen |
|
Monikäyttöinen |
|
muu |
|
Apuohjelmat |
|