Rosetta@home

Kokeneet kirjoittajat eivät ole vielä tarkistaneet sivun nykyistä versiota, ja se voi poiketa merkittävästi 16. heinäkuuta 2015 tarkistetusta versiosta . tarkastukset vaativat 23 muokkausta .
Rosetta@home

Tyyppi Protein Structure Prediction , Volunteer Computing ja Berkeley Open Infrastructure for Network Computing -projekteja [d]
Kehittäjä Baker-laboratorio , Washingtonin yliopisto , Rosetta Commons
Käyttöjärjestelmä Monialustainen ohjelmisto
Ensimmäinen painos 6. lokakuuta 2005
Laitteistoalusta BOINC
uusin versio Rosetta Mini: 3,71 [1] ( 20. tammikuuta 2016 )
Osavaltio Aktiivinen
Lisenssi Ilmainen akateemiseen ja voittoa tavoittelemattomaan käyttöön, oma lisenssi kaupalliseen käyttöön [2]
Verkkosivusto boinc.bakerlab.org/roset…
 Mediatiedostot Wikimedia Commonsissa
Rosetta@home
Alusta BOINC
Ohjelmiston latauskoko 48 Mt
Työn tietojen ladattu koko 2,5 Mt
Lähetettyjen työtietojen määrä 6-150 kt
Levytila _ 130 Mt
Käytetty muistin määrä 255 Mt
GUI on
Keskimääräinen tehtävän laskenta-aika 0,5 - 10 tuntia (aikasäätö mahdollista)
takaraja 10 päivää
Mahdollisuus käyttää GPU :ta Ei
 Mediatiedostot Wikimedia Commonsissa

Rosetta@Home  on vapaaehtoinen laskentaprojekti , jonka tavoitteena on ratkaista yksi molekyylibiologian suurimmista ongelmista - proteiinien tertiäärisen rakenteen laskeminen niiden aminohapposekvensseistä . Valmistuneen Human Genome Projectin ansiosta kaikkien ihmiskehon proteiinien aminohapposekvenssit tunnetaan. Tämän hankkeen tutkimus auttaa myös uusien, olemattomien proteiinien suunnittelussa. Vaikka suuri osa hankkeesta keskittyy perustutkimukseen parantaakseen proteomisten menetelmien tarkkuutta ja kestävyyttä, Rosetta@home edistää myös soveltavaa tutkimusta sairauksien, kuten syövän , malarian , Alzheimerin , pernaruton ja muiden geneettisten ja virussairauksien torjumiseksi [3] . Foldit  on Rosetta@Homen videopeli, jonka tavoitteena on saavuttaa projektin tavoitteet joukkolähdettämällä .

Rosetta@Home laskentatuloksia ei ole suoraan saatavilla. Et myöskään voi käyttää oman tietokoneesi laskelmien tuloksia. [4] Niitä käytetään kuitenkin useissa tieteellisissä julkaisuissa. [5]

Pohjimmiltaan Rosetta on tietokoneohjelma, jonka päätehtävät ovat:

Tämä projekti käyttää ennakointia ja tulospalautetta parantaakseen mahdollisia hakuominaisuuksia ja -algoritmeja .

Tietojenkäsittelyalusta

Rosetta@home-sovellus ja BOINC Distributed Computing Platform , saatavilla Windows-, Linux- ja macOS-käyttöjärjestelmille; BOINC toimii myös useilla muilla, kuten FreeBSD:llä. Rosetta@homeen osallistuminen edellyttää keskusyksikköä (CPU), jonka kellotaajuus on vähintään 500 MHz, 200 megatavua vapaata levytilaa, 512 megatavua fyysistä muistia ja Internet-yhteyden. 27.6.2020 alkaen Rosetta Mini -sovelluksen nykyinen versio on 4.20. BOINC-ohjelmiston nykyinen suositeltu versio on 7.16.7. Standard Hypertext Transfer Protocol (HTTP) (portti 80) käytetään viestintään käyttäjän BOINC-asiakkaan ja Rosetta@home-palvelimien välillä Washingtonin yliopistossa . Salasanan vaihdossa käytetään HTTPS:ää (portti 443). BOINC-asiakkaan etä- ja paikallinen hallinta käyttää portteja 31416 ja 1043, jotka voidaan erityisesti poistaa, jos ne ovat palomuurin takana. Yksittäisten proteiinien tietoja sisältävät työyksiköt jaetaan Washingtonin yliopiston Baker Labissa sijaitsevilta palvelimilta vapaaehtoisille tietokoneille, jotka sitten laskevat rakenneennusteen määrätylle proteiinille. Tietyn proteiinin toistuvien rakenneennusteiden välttämiseksi jokainen työlohko alustetaan satunnaisella määrällä siemeniä. Tämä antaa jokaiselle ennusteelle ainutlaatuisen liikeradan laskeutua proteiinin energiamaiseman läpi. Rosetta@homen proteiinirakenteen ennusteet ovat likimääräisiä arvoja globaalille minimille tietyn proteiinin energiamaisemassa. Tämä globaali minimi edustaa energeettisesti edullisinta proteiinikonformaatiota, eli sen natiivitilaa.

Rosetta@home graafisen käyttöliittymän (GUI) pääominaisuus on näytönsäästäjä, joka näyttää käynnissä olevan moduulin nykyisen tilan proteiinin laskostumisen simulaation aikana. Nykyisen aloitusnäytön vasemmassa yläkulmassa näkyy kohdeproteiini, joka omaksuu erilaisia ​​muotoja (konformaatioita) etsiessään pienimmän energian rakennetta. Välittömästi oikealla on viimeksi vastaanotetun rakenne. Oikeassa yläkulmassa näkyy nykyisen asettelun pienin energiamuoto; alla on proteiinin todellinen tai natiivi rakenne, jos se on jo määritetty. Aloitusnäytössä on kolme kaaviota. Keskikohdan lähellä näkyy käyrä hyväksytyn mallin termodynaamiselle vapaalle energialle, joka vaihtelee hyväksytyn mallin muuttuessa. Oikealla näkyy hyväksytyn mallin standardihajonnan (RMSD) käyrä, joka mittaa, kuinka rakenteellisesti samanlainen hyväksytty malli on alkuperäisen mallin kanssa. Vastaanotetun energiakäyrän oikealla puolella ja RMSD-käyrän alapuolella näiden kahden funktion tuloksia käytetään kuvaamaan energia verrattuna RMSD:hen, kun mallia asteittain jalostetaan.

Kuten kaikki BOINC-projektit, Rosetta@home toimii taustalla käyttäjän tietokoneella käyttämättömän tietokoneen virtaa käyttäen isännän käyttöjärjestelmän tilille kirjautumisen aikana tai ennen sitä . Ohjelma vapauttaa resursseja suorittimesta muiden sovellusten tarpeessa, mikä ei vaikuta tietokoneen normaaliin käyttöön. Monet ohjelmavaihtoehdot voidaan määrittää käyttäjätilin asetuksista, mukaan lukien: ohjelman käyttämien prosessoriresurssien enimmäisprosenttiosuus (virrankulutuksen ohjaamiseen tai lämmön tuottamiseen vakioteholla toimivasta tietokoneesta), kellonaika, jolloin ohjelma voi toimia, ja enemmän muuta.

Rosetta@home-verkossa toimiva Rosetta-ohjelmisto on kirjoitettu uudelleen C++-kielellä, jotta sen kehittäminen olisi helpompaa kuin sen alkuperäinen versio, joka on kirjoitettu Fortranilla. Tämä uusi versio on oliopohjainen ja julkaistiin 8. helmikuuta 2008. Rosetta-koodin kehittämisestä vastaa Rosetta Commons. Ohjelmisto on vapaasti lisensoitu akateemisen yhteisön käyttöön, ja se on lääkeyhtiöiden saatavilla maksua vastaan.

Hankkeen merkitys

Genomisekvensointiprojektien lisääntymisen myötä tutkijat voivat päätellä aminohapposekvenssin tai primäärirakenteen monille soluissa toimivia proteiineja. Ymmärtääkseen paremmin proteiinin toimintaa ja auttaakseen järkevässä lääkesuunnittelussa tutkijoiden on tiedettävä proteiinin kolmiulotteinen tertiäärinen rakenne.

Proteiinien kolmiulotteiset rakenteet määritetään tällä hetkellä kokeellisesti käyttäen röntgenkristallografiaa tai ydinmagneettista resonanssia (NMR) spektroskopiaa. Prosessi on hidas (voi kestää viikkoja tai jopa kuukausia selvittää, kuinka proteiini kiteytyy ensimmäistä kertaa) ja kallis (noin 100 000 dollaria proteiinia kohden). Valitettavasti uusien sekvenssien löytämisnopeus ylittää huomattavasti rakenteen määrittämisen – National Center for Biotechnology Informationin (NCBI) pelkistämättömien (nr) proteiinien tietokannasta saatavilla yli 7 400 000 proteiinisekvenssistä alle 52 000 kolmiulotteista. proteiinirakenteet on selvitetty ja sijoitettu Protein Data Bankiin, joka on proteiineja koskevien rakenteellisten tietojen päävarasto [6] . Yksi Rosetta@homen päätavoitteista on ennustaa proteiinirakenteita nykyisten menetelmien kanssa samalla tarkkuudella, mutta huomattavasti vähemmän aikaa ja rahaa vaativalla tavalla. Rosetta@home kehittää myös menetelmiä membraaniproteiinien (esim. G-proteiinikytketyt reseptorit (GPCR)) rakenteen ja telakoinnin määrittämiseksi, joita on erittäin vaikea analysoida perinteisillä menetelmillä, kuten röntgenkristallografialla ja NMR-spektroskopialla, mutta jotka edustavat suurinta osaa nykyaikaisten lääkkeiden kohteista.

Proteiinirakenteen ennustamisen edistymistä mitataan Critical Assessment for Protein Structure Prediction (CASP) -kokeessa, joka tehdään kaksi kertaa vuodessa, jossa tutkijat ympäri maailmaa yrittävät johtaa proteiinin rakennetta proteiinin aminohapposekvenssistä. Tässä toisinaan kilpailevassa kokeessa menestyviä ryhmiä pidetään de facto standardina proteiinirakenteen ennustamisessa. Rosetta, Rosetta @ homen perustana oleva ohjelma, käytettiin CASP5:n ​​kanssa vuonna 2002. Vuoden 2004 CASP6-kokeessa Rosetta teki historiaa saavuttamalla ensimmäisenä lähes atomiresoluution ab initio -proteiinirakenteen ennusteen esittämässään mallissa CASP-kohteeseen T0281. Ab initio -mallinnusta pidetään erityisen haastavana proteiinirakenteen ennustuskategoriana, koska siinä ei käytetä tietoa rakenteellisesta homologiasta ja sen on turvauduttava sekvenssihomologiasta saatuun tietoon ja proteiinin sisällä olevien fysikaalisten vuorovaikutusten mallintamiseen. Rosetta@homea on käytetty CASP:ssä vuodesta 2006, jolloin se oli yksi parhaista ennustajista kaikissa CASP7:n rakenteellisissa ennustekategorioissa. Nämä korkealaatuiset ennusteet perustuivat Rosetta@home-vapaaehtoisten laskentatehoon. Kasvava laskentateho antaa Rosetta@homelle mahdollisuuden valita enemmän konformaatioavaruuden alueita (mahdollisia muotoja, joita proteiini voi ottaa), joiden Levinthalin paradoksin mukaan ennustetaan kasvavan eksponentiaalisesti proteiinin pituuden mukana.

Rosetta@homea käytetään myös proteiini-proteiini-telakointiennustuksessa, joka määrittää useiden monimutkaisten proteiinien rakenteen tai kvaternaarisen rakenteen. Tämän tyyppinen proteiinivuorovaikutus vaikuttaa moniin solutoimintoihin, mukaan lukien antigeeni-vasta-ainesitoutuminen ja entsyymi-inhibiittorisitoutuminen, sekä solujen tuonti ja vienti. Näiden yhteisvaikutusten määrittäminen on ratkaisevan tärkeää lääkekehityksen kannalta. Rosettaa käytetään Critical Interaction Prediction Evaluation (CAPRI) -kokeessa, joka arvioi proteiinin telakointikentän tilaa samalla tavalla kuin CASP mittaa edistymistä proteiinin rakenteen ennustamisessa. Rosetta@home-projektin vapaaehtoisten tarjoama laskentateho mainittiin yhdeksi Rosettan suorituskyvyn päätekijöistä CAPRIssa, jossa sen telakointiennusteet olivat tarkimpia ja täydellisimpiä.

Vuoden 2008 alussa Rosettalla suunniteltiin laskennallisesti proteiinia, jolla on toiminto, jota ei ole aiemmin nähty luonnossa. Tämä sai osittain inspiraationsa kuuluisan vuoden 2004 julkaisun lyhenteestä, joka alun perin kuvaili proteiinin laskennallista suunnittelua, jolla on parannettu entsymaattinen aktiivisuus verrattuna sen luonnolliseen muotoon. David Bakerin ryhmän vuoden 2008 tutkimuspaperi, jossa kuvataan proteiinin valmistusta ja jossa Rosetta@home viittaa hänen käyttöön antamiinsa laskennallisiin resursseihin, on tärkeä todiste tämän proteiininmuokkausmenetelmän konseptista. Tämän tyyppisellä proteiinisuunnittelulla voi olla tulevaisuuden sovelluksia lääkekehitykseen, vihreään kemiaan ja bioremediatioon.

Sairaustutkimus

Alzheimerin tauti

Rosetta-ohjelmistopaketin komponenttia, RosettaDesignia, on käytetty ennustamaan tarkasti, mitkä amyloidogeenisten proteiinien alueet todennäköisimmin muodostavat amyloidin kaltaisia ​​fibrillejä. Ottamalla kiinnostavan proteiinin heksapeptidejä (kuusi aminohappoa pitkää fragmenttia) ja valitsemalla pienimmän energian vastaavuuden tunnetun fibrilliä muodostavan heksapeptidin rakenteelle, RosettaDesign pystyi tunnistamaan peptidit kaksi kertaa todennäköisemmin muodostamaan fibrillejä kuin satunnaiset proteiinit. . Rosetta@homea käytettiin samassa tutkimuksessa ennustamaan rakenteita beeta-amyloidille, fibrillejä muodostavalle proteiinille, jonka uskotaan aiheuttavan Alzheimerin tautia. Alustavia, mutta vielä julkaisemattomia tuloksia on saatu Rosettan kehittämistä proteiineista, jotka voivat estää fibrillien muodostumista, vaikka ei tiedetä, voiko tämä estää taudin.

pernarutto

Toista Rosettan komponenttia, RosettaDockia, on käytetty yhdessä kokeellisten menetelmien kanssa vuorovaikutusten mallintamiseen kolmen proteiinin – letaalitekijän (LF), turvotustekijän (EF) ja suojaavan antigeenin (PA) – välillä, jotka muodostavat pernaruttotoksiinin. Tietokonemalli ennusti tarkasti LF:n ja PA:n välisen telakoinnin, mikä auttoi määrittämään, mitkä vastaavien proteiinien domeenit ovat mukana LF-PA-kompleksissa. Tätä ymmärrystä käytettiin lopulta tutkimuksessa, mikä johti parempiin pernaruttorokotteisiin.

Herpes simplex -virus tyyppi 1

RosettaDockia käytettiin vasta-aineen (immunoglobuliini G) ja herpesviruksen, herpes simplex virus 1:n (HSV-1) ekspressoiman pintaproteiinin välisen telakoinnin mallintamiseen, mikä toimii antiviraalisen vasta-aineen hajottajana. RosettaDockin ennustama proteiinikompleksi sopi tiiviisti erityisen vaikeasti saatavien kokeellisten mallien kanssa, mikä johti tutkijat päättelemään, että telakointimenetelmä voisi ratkaista joitakin röntgenkristallografian ongelmia proteiinien ja proteiinien välisten rajapintojen mallintamisessa.

19,4 miljoonan dollarin Bill & Melinda Gatesin apurahalla rahoitetun tutkimuksen kautta. USA, Rosetta@homea on käytetty monien mahdollisten ihmisen immuunikatovirus (HIV) -rokotteiden kehittämisessä.

Malaria

Great Challenges in Global Health -aloitteeseen liittyvässä tutkimuksessa Rosettaa on käytetty laskennallisesti kehittämään uusia endonukleaasiproteiineja, jotka voivat tappaa Anopheles gambiae tai muutoin tehdä hyttysen kykenemättömäksi levittämään malariaa. Kyky spesifisesti mallintaa ja muuttaa proteiini-DNA-vuorovaikutuksia, kuten kotiutuvien endonukleaasien vuorovaikutuksia, antaa laskennallisille proteiinimuokkausmenetelmille, kuten Rosettalle, tärkeän roolin geeniterapiassa (johon sisältyy mahdollisia syövänhoitoja).

Osallistujamäärä

Rosetta@Home [7] -projektin osallistujien virallisten tilastojen perusteella lokakuussa 2011 aktiivisia osallistujia oli 38 tuhatta henkilöä [8] . Heinäkuussa 2017 projektilla oli noin 300 000 aktiivista käyttäjää [9] .

Muistiinpanot

  1. Sovellukset . Haettu 14. maaliskuuta 2016. Arkistoitu alkuperäisestä 14. maaliskuuta 2016.
  2. Portfolion kohokohta: Rosetta++ Software Suite  (englanniksi)  (linkki ei ole käytettävissä) . UW TechTransfer – Digital Ventures. Haettu 7. syyskuuta 2008. Arkistoitu alkuperäisestä 16. helmikuuta 2012.
  3. Rosetta@Home - Tautitutkimus Arkistoitu 23.9.2008.
  4. Rosettan käyttöehdot arkistoitu 19. huhtikuuta 2014.
  5. Baker Lab -julkaisut arkistoitu 24. marraskuuta 2011.
  6. RCSB-proteiinitietopankki. ATE:n tilastot : Pelkästään proteiinia sisältävät rakenteet julkaistaan ​​vuodessa  . www.rcsb.org . Haettu 1. toukokuuta 2021. Arkistoitu alkuperäisestä 1. toukokuuta 2021.
  7. Rosetta@Home yksityiskohtaiset tilastot . Haettu 15. helmikuuta 2017. Arkistoitu alkuperäisestä 15. helmikuuta 2017.
  8. BOINCstats | Rosetta@Home - Luottotiedot (linkki ei saatavilla) (7. lokakuuta 2011). Haettu 27. syyskuuta 2017. Arkistoitu alkuperäisestä 7. lokakuuta 2011. 
  9. Rosetta@Home - Tarkemmat tilastot | BOINCstats/BAM! (linkki ei saatavilla) (11. heinäkuuta 2017). Haettu 27. syyskuuta 2017. Arkistoitu alkuperäisestä 11. heinäkuuta 2017. 

Katso myös

Linkit