Molekyylitelakka on molekyylimallinnusmenetelmä , jonka avulla voidaan ennustaa yhden molekyylin ( ligandin ) suotuisin orientaatio ja konformaatio toisen ( reseptorin ) sitoutumiskohdassa stabiilin kompleksin muodostumiselle [1] . Kumppanien asemaa ja konformaatiota koskevia tietoja käytetään vuorovaikutuksen voimakkuuden ennustamiseen niin sanottujen pisteytysfunktioiden avulla. Jos ligandi on makromolekyyli , telakointia kutsutaan makromolekyyliksi .
Molekyylitelakka voidaan ajatella "avaimen" (ligandin) optimaalisen sijainnin etsimiseksi "lukossa" (reseptorissa) [2] . Tässä tapauksessa molekyylejä pidetään jäykinä kappaleina. Kuitenkin todellisuudessa telakointiprosessin aikana ligandi ja proteiini muuttavat konformaatioita parhaan sitoutumisen saavuttamiseksi. Muutokset proteiinin konformaatiossa voivat sisältää silmukoiden ja domeenien liikkeet [2] . Tällaista onnistuneeseen sitoutumiseen johtavaa prosessia kutsutaan "indusoiduksi sovitukseksi" [3] .
Molekyylitelakointia käytetään mallintamaan molekyylien tunnistusprosessia. Yleensä on tarpeen löytää optimaalinen ligandin konformaatio. Tämä asema saavutetaan, kun sitoutumisen vapaa energia on minimaalinen. [4] .
Biologisesti merkittävien molekyylien, kuten proteiinien, nukleiinihappojen , hiilihydraattien ja lipidien , komplekseilla on keskeinen rooli kemiallisessa signaalinsiirrossa. Lisäksi kahden vuorovaikutuksessa olevan molekyylin suhteellinen orientaatio voi vaikuttaa tuotetun signaalin tyyppiin (olipa se sitten estävä tai katalyyttinen ). Siksi biologisten molekyylien välinen vuorovaikutus on tärkeä sekä tuotetun signaalin tyypin että voimakkuuden ennustamisessa [5] .
Telakointia käytetään usein ennustamaan pienen lääkemolekyylin affiniteettia ja aktiivisuutta kohdeproteiiniin. Siten molekyylien telakointi, joka on yksi lääkekehityksen vaiheista , on tärkeässä roolissa tässä prosessissa [6] .
Yksi molekyylitelakan eduista on sen automatisointimahdollisuus. Osana lääkekehitystehtävää tulee mahdolliseksi seuloa pienimolekyylisten yhdisteiden kirjastoja . Molekyylitelakka mahdollistaa optimaalisimmin vuorovaikutteisen yhdisteen - lääkkeen - määrittämisen useista analogeista, joilla on samanlainen koostumus [7] .
Yksi lääkekehityksessä käytetyistä menetelmistä on fragmentoitu suunnittelu . Menetelmä perustuu pienten fragmenttien etsimiseen, joilla on alhainen sitoutumisaffiniteetti kohteeseen, ja niiden edelleen yhdistämiseen korkean affiniteetin omaavan yhdisteen etsimiseksi. Fragmenttisuunnittelua käytetään tehokkaiden estäjien etsimiseen. Tämä ongelma ratkaistaan eri menetelmillä. Näitä ovat tietyntyyppiset NMR-spektroskopia , isoterminen titraus-kalorimetria , mikroskooppinen termoforeesimenetelmä , plasmoniresonanssi ja muut [8] . Molekyylitelakointi puolestaan mahdollistaa myös samanlaisen ongelman ratkaisemisen skannaamalla erilaisten yhdisteiden kirjastoja, sekä alhaisen molekyylipainon että komplekseja, ja arvioimalla niiden affiniteettia [9] .
Telakointia voidaan käyttää bioremediatiossa tiettyjen entsyymien hajottamien ympäristösaasteiden etsimiseen [10] .
On kuitenkin tapauksia, joissa vuorovaikutuspaikkaa ei tiedetä suoraan. Sitten käytetään niin kutsuttua "sokea" telakointia [11] . Tämän lähestymistavan erilaisia muunnelmia toteutetaan seuraavissa algoritmeissa: MolDock [12] , Fragment Hotspot Maps [11] , DoGSiteScorer [13] .
Molekyylitelakan perussovellusalueita ovat [4] :
Telakoinnin mallintamiseen on erilaisia lähestymistapoja. Yksi lähestymistapa käyttää sovitustekniikkaa, joka kuvaa proteiinia ja ligandia lisäpinnoina [14] [15] . Toinen lähestymistapa mallintaa varsinaista telakointiprosessia, jossa lasketaan pareittain vuorovaikutusenergiat . Molemmilla lähestymistavoilla on merkittäviä etuja sekä joitain rajoituksia [16] .
"Jäykkää" kutsutaan telakaatioksi, jossa telakointiparien sidospituudet, kulmat ja vääntökulmat pysyvät muuttumattomina simulaation aikana. Vuorovaikutuksen seurauksena toisen proteiinin tai ligandin kanssa tapahtuu kuitenkin konformaatiomuutoksia sekä itse proteiinin rungossa että sivuketjuissa. Selkärangan liikkuvuus voidaan puolestaan jakaa kahteen tyyppiin: proteiinin suurten osien liikkuvuuteen - domeenit, niin sanottu "siirto" -liike ja yksittäisten osien, kuten silmukoiden, liikkuvuus. Tässä tapauksessa "kova" telakointi kuvaa väärin vuorovaikutuksia. Siksi on olemassa joitain muita "joustavia" telakointialgoritmeja. Ne mahdollistavat konformaatiomuutokset, minkä seurauksena tällä lähestymistavalla voidaan saada luonnollisia lähimpänä olevia vuorovaikutusestimaatteja. Kuitenkin kaikkien mahdollisten konformaatiomuutosten laskeminen ottaen huomioon liike tietyllä tietokoneen kehitystasolla, veisi valtavasti aikaa. Lisäksi suuri määrä vapausasteita voi myös johtaa väärien positiivisten tulosten määrän kasvuun. Näiden ongelmien yhteydessä on tarpeen valita rationaalisesti pieni osa mahdollisista konformaatiomuutoksista mallintamiseen [17] .
"Joustavaa" telakointia voidaan käyttää myös pienen molekyylipainon yhdistetelakoinnin yhteydessä. Tässä tapauksessa kierto minkä tahansa ligandin molekyylin sidosten ympärillä on kuitenkin sallittua, kun taas proteiini pysyy "jäykkänä" rakenteena [18] .
Telakointi voidaan jakaa myös yksittäiseen ( englantilainen single ) ja peräkkäiseen ( englantilainen peräkkäinen ) [19] . Jaksottaista telakointia käytetään pääasiassa useiden pienimolekyylipainoisten yhdisteiden (ligandien) telakointiin. Kun yksi ligandeista on telakoitu erilliseen tiedostoon, proteiinin rakenne tämän ligandin kanssa tallennetaan. Lisäksi algoritmi toistetaan ja toiselle ligandille toteutetaan telakointi aiemmin tallennettuun rakenteeseen. Tämä lähestymistapa voi olla hyödyllinen allosteeristen keskusten etsimisessä [20] .
Geometrinen vastaavuus (menetelmiä muotojen keskinäisen riippuvuuden määrittämiseksi) on kuvattu proteiinille ja ligandille joukona ominaisuuksia, jotka määräävät niiden optimaalisen vuorovaikutuksen [21] . Nämä ominaisuudet voivat sisältää sekä itse molekyylipinnan että kuvauksen pinnan lisäominaisuuksista Tässä tapauksessa reseptorin molekyylipintaa kuvataan sen saavutettavuuden perusteella liuottimelle ja ligandin molekyylipintaa kuvataan sen suhteen, että se vastaa reseptorin pinnan kuvausta. Kahden pinnan välinen keskinäinen riippuvuus muodostaa muotosovituskuvauksen, joka voi auttaa havaitsemaan ligandin eri asennot. Toinen lähestymistapa on kuvata proteiinin hydrofobisia piirteitä käyttämällä kiertoja rungon atomeissa . Toinen lähestymistapa voi perustua Fourier-muunnokseen [22] [23] [24] .
Tässä lähestymistavassa proteiinia ja ligandia erottaa jokin fyysinen etäisyys, ja ligandi löytää paikkansa proteiinin aktiivisesta kohdasta tietyn määrän "vaiheita" jälkeen. Vaiheet sisältävät jäykät kehon muunnokset , kuten translaatio ja rotaatio , sekä sisäiset muutokset ligandirakenteessa, mukaan lukien kulmakierrot. Jokainen näistä vaiheista avaruudessa muuttaa järjestelmän kokonaisenergiaarviota, ja siksi se lasketaan jokaisen siirron jälkeen. Tämän menetelmän ilmeinen etu on, että se mahdollistaa ligandin joustavuuden tutkimisen simuloinnin aikana, kun taas muotosuhdemenetelmissä täytyy käyttää jotain muuta lähestymistapaa ligandin liikkuvuuden oppimiseksi. Toinen etu on, että prosessi on fyysisesti lähempänä sitä, mitä todellisuudessa tapahtuu, kun proteiini ja ligandi lähestyvät toisiaan molekyylitunnistuksen jälkeen. Tämän tekniikan haittana on, että optimaalisen telakointiratkaisun arvioiminen vie aikaa, koska on tarpeen tutkia melko laajaa energiamaisemaa [1] .
Ensimmäinen asia, jota tarvitaan molekyylien seulomiseen telakoimalla, on kiinnostavan proteiinin rakenne. Yleensä rakenne määritetään biofysikaalisilla menetelmillä ( röntgendiffraktioanalyysi tai NMR-spektroskopia ), se voidaan saada myös homologiamallinnuksella . Proteiinirakenne yhdessä mahdollisten ligandien tietokannan kanssa toimivat syötteenä telakointiohjelmaan. Telakoinnin onnistuminen riippuu kahdesta komponentista: hakualgoritmista ja arviointifunktiosta [4] .
Onnistunut telakointi vaatii kaksi ehtoa [25] :
Monissa tapauksissa, esim. vasta -aineissa ja kilpailevissa inhibiittoreissa , sitoutumiskohta tunnetaan. Muissa tapauksissa sitoutumiskohta voidaan määrittää mutageneesin tai filogeneesin perusteella . Konfiguraatiot, joissa proteiiniatomit menevät päällekkäin (ns. flare, englanninkielisestä clashistä ), suljetaan aina pois [26] .
Kun kompleksit on seulottu pois soihduttamalla, kunkin rakenteen (kompleksimallin) energia mitataan ns. nopeus (arviointi) -funktiolla. Jälkimmäisen on erotettava "luotettava" rakenne yli vähintään 100 000 vaihtoehtoa. Tämä on monimutkainen laskennallinen ongelma, joten sen ratkaisemiseksi on kehitetty monia menetelmiä. Algoritmit voidaan jakaa deterministisiin ja stokastisiin [4] .
Matemaattisesta näkökulmasta katsottuna telakointi on vapaan energiafunktion globaalin minimin etsimistä, joka on annettu moniulotteisessa avaruudessa kaikista mahdollisista tavoista sitoa ligandi proteiiniin. Hakuavaruus koostuu teoriassa kaikista mahdollisista paikoista avaruudessa ja ligandiin liittyvän proteiinin konformaatioista. Käytännössä käytettävissä olevilla laskentaresursseilla on kuitenkin mahdotonta tutkia hakuavaruutta täysin - tämä edellyttäisi jokaisen molekyylin kaikkien mahdollisten siirtymien laskemista (molekyylit ovat dynaamisia ja esiintyvät konformaatiotilojen kokonaisuutena) ja kaikki rotaatio- ja ligandin sijaintipaikat suhteessa proteiiniin tietyllä yksityiskohtatasolla. Useimmat telakointiohjelmat ottavat huomioon muunnelmien koko konformaatiotilan ligandille ("joustava" ligandi), ja jotkut yrittävät myös mallintaa "joustavaa" reseptoriproteiinia. Jokaista tämän parin kiinteää sijaintia avaruudessa kutsutaan telakointiratkaisuksi [27] .
Algoritmit parhaan sidoksen löytämiseksi voidaan jakaa seuraaviin luokkiin: systemaattiset menetelmät, satunnaiset tai stokastiset heuristiset menetelmät, molekyylidynamiikan menetelmät ja termodynaamiset menetelmät [28] .
Menetelmät, jotka takaavat globaalin minimin löytämisen äärellisessä määrässä vaiheita, ovat systemaattisia menetelmiä, eli menetelmiä, joilla luetellaan peräkkäin kaikki ligandin mahdolliset asemat kohdeproteiinin aktiivisessa keskustassa. Vaadittujen laskelmien suuren määrän vuoksi tämä menetelmä vaatii kuitenkin merkittäviä yksinkertaistuksia. On muitakin globaaleja optimointimenetelmiä, jotka eivät taatusti löydä globaalia minimiä äärellisessä määrässä ohjelman vaiheita, mutta käytännössä ne pystyvät löytämään tällaiset minimit paljon nopeammin kuin systemaattiset laskentamenetelmät. Tällaiset menetelmät voidaan jakaa kahteen suureen ryhmään: heuristisiin ja termodynaamisiin [29] .
Heuristiset menetelmät käyttävät joitain empiirisiä strategioita globaalin minimin löytämiseen, mikä nopeuttaa prosessia verrattuna yksinkertaiseen hyperpinnan skannaukseen. Tunnetuimpia ja suosituimpia ovat seuraavat heuristiset menetelmät [28] :
Termodynaamisiin menetelmiin kuuluu hehkutusmallinnus .
Monte Carlo -tyyppisissä menetelmissä alkuperäistä konfiguraatiota jalostetaan hyväksymällä tai hylkäämällä vaiheet (iteratiiviset muutokset joihinkin parametrijoukkoon) arviointifunktion (eli rakennepisteen) arvosta riippuen (katso Metropolis-kriteeri ), kunnes tietty määrä toimia on toteutettu. Oletetaan, että konvergenssi parhaaseen rakenteeseen tulee suuresta alkuperäisten luokasta, joista vain yksi on otettava huomioon. Alkurakenteet voidaan analysoida paljon nopeammin "karkeilla" ( karkeilla ) menetelmillä . On vaikea löytää pisteytysfunktiota, joka sekä erottaisi ”hyvän” rakenteen hyvin että konvergoisi sen kanssa suurelta etäisyydeltä (näytteenottotilassa). Siksi ehdotettiin kahden approksimaatiotason ("karkea" ja "tarkka") käyttöä erilaisilla arviointifunktioilla. Rotaatio voidaan ottaa käyttöön Monte Carlossa lisäparametrina vaiheessa [34] .
Monte Carlo -menetelmät ovat stokastisia eivätkä takaa tyhjentävää hakua, joten paras konfiguraatio voidaan jättää huomiotta jopa käytettäessä estimaattoria, joka teoriassa erottaa sen. Sitä, kuinka vakavasti tämä ongelma vaikuttaa telakoinnin tuloksiin, ei ole vielä selvitetty [34] .
Tämä lähestymistapa on toteutettu RosettaDock- algoritmissa . RossettaCommons . Haettu 27. huhtikuuta 2020. [35] .
Telakoinnin seurauksena syntyy suuri määrä potentiaalisia ligandikohtia, joista osa hylätään välittömästi johtuen törmäyksistä proteiinimolekyylin kanssa. Loput arvioidaan käyttämällä pisteytysfunktiota, joka ottaa syötteeksi nykyisen telakointipäätöksen ja palauttaa luvun, joka ilmaisee todennäköisyyden, että telakointipäätös edustaa suotuisaa sitovaa vuorovaikutusta. Siten yhden ligandin sitoutumistehokkuus suhteessa toiseen voidaan arvioida [4] .
Nykyaikaisissa telakointialgoritmeissa voidaan erottaa kolme päätyyppiä arviointifunktioita: voimakenttäpohjainen, empiirinen ja tilastollinen.
Useimmat pisteytysfunktiot perustuvat molekyylimekaniikan voimakenttien fysiikkaan , jotka arvioivat telakointiliuoksen energian sitoutumiskohdan sisällä. Erilaisia panoksia telakointiratkaisun energiaan voidaan kirjoittaa yhtälönä [4] :
Yhtälön komponentteja ovat liuotinvaikutukset, proteiinin ja ligandin konformaatiomuutokset, proteiini-ligandi-vuorovaikutuksista johtuva vapaa energia, sisäiset rotaatiot, ligandin ja reseptorin assosiaatioenergia yhdeksi kompleksiksi ja vapaa energia värähtelyn muutoksista. tilat. Matala (negatiivinen) energia osoittaa vakaan järjestelmän ja siten todennäköisen sidosvuorovaikutuksen [36] .
Empiiriset arviointifunktiot, toisin kuin voimakenttiin perustuvat, sisältävät komponentteja, jotka kuvaavat molekyylien välisiä kontakteja yksinkertaisemmin. Tässä tapauksessa ei ole suoria analogioita pareittain olevien molekyylien välisten fysikaalisten vuorovaikutusten kanssa. Tällaisen lähestymistavan ennustekyky riippuu suuresti sekä itse komponenteista että kertoimista, joilla ne tulevat yhtälöön. Molekyylien väliset vuorovaikutukset esitetään lineaarisena yhdistelmänä termejä, jotka kuvaavat erilaisia kontakteja: vetysidoksia, hydrofobisia vuorovaikutuksia, vuorovaikutuksia metalli-ionien kanssa ja muita. Yksinkertaistaminen esimerkiksi koordinaatiosidoksille metalli-ionien tai hydrofobisten kontaktien kanssa koostuu niiden kuvauksesta käyttäen ligandin ja reseptorin vastaavien atomien välisiä etäisyyksiä, mutta tällainen approksimaatio ei ole fysikaalisesti oikea. Vetysidoksia kuvaavat empiiriset geometriset parametrit (luovuttajan ja vastaanottajan välinen etäisyys sekä niiden ja vetyatomin välinen kulma), ei niiden energiaominaisuuksilla [37] .
Vaihtoehtoinen lähestymistapa tilastollisten pisteytysfunktioiden avulla on hankkia tietoon perustuva tilastollinen potentiaali vuorovaikutuksille proteiini-ligandikompleksien PDB -tietokannasta ja arvioida telakointiliuoksen sopivuus arvioidun potentiaalin mukaan [38] .
Proteiinien teoreettiseen telakointiin on olemassa monia ohjelmia. Suurin osa siitä toimii näin: yksi proteiini kiinnittyy avaruuteen ja toinen pyörii sen ympäri. Tässä tapauksessa jokaiselle käännöskokoonpanolle tehdään arviointilaskelmat arviointitoiminnon mukaisesti. Arviointifunktio perustuu pinnan komplementaarisuuteen, sähköstaattisiin vuorovaikutuksiin, van der Waalsin hylkimiseen ja niin edelleen. Tämän haun ongelmana on, että koko konfigurointiavaruuden laskelmien laskeminen kestää kauan, mikä harvoin johtaa yhteen ratkaisuun [39] .
Arviointitoiminnon epätäydellisyys johtaa väistämättä tarpeeseen arvioida tietyn telakointialgoritmin (esimerkiksi AutoDock, ICM) ennustekyky. Tämä vaatii lisää kokeellisia tietoja, kuten viiterakennetta. Arviointi voidaan suorittaa useilla tavoilla [4] :
Telakointitarkkuus [ 40] on yksi algoritmin soveltuvuuden arvioinnista, algoritmin kyvystä toistaa kokeellista dataa.
Rikastuskerroin arvioidaan algoritmin kyvyksi erottaa (edustaa parhaiden joukossa) "oikeat" ligandit "epätosista" näytteessä, jossa "epätosien" lukumäärä on paljon suurempi kuin "tosien" lukumäärä . . "Tosi" tarkoittaa ligandeja, joiden sitoutuminen on kokeellisesti todistettu, ja "false" tarkoittaa ligandeja, joiden sitoutumista ei ole todistettu. Menetelmän ROC - käyrän analyysi suoritetaan usein [41] .
Telakointiohjelmien kykyä toistaa röntgendiffraktioanalyysillä saatuja rakenteita voidaan arvioida useilla benchmarking - menetelmillä [42] .
Pienten molekyylien tapauksessa vertailevaa analyysiä varten voidaan ottaa kokeellisia tietoja sisältäviä erityisiä referenssisarjoja. Esimerkiksi Astex Diverse Set [43] , joka sisältää proteiinien rakenteita ligandeilla, jotka on saatu röntgendiffraktioanalyysillä tai Directory of Useful Decoys (DUD) -menetelmällä [44] .
Peptiditelakoinnin tapauksessa voidaan käyttää Lessons for Efficiency Assessment of Docking and Scoring (LEADS-PEP) [45] .
Viime aikoina on ilmestynyt yhä enemmän virtuaaliseen seulomiseen ja telakointiin omistettuja tieteellisiä artikkeleita. Älä kuitenkaan luota sokeasti heidän tuloksiinsa. Jotkut tutkijoiden useimmin kysymistä kysymyksistä ovat:
Useiden erilaisten algoritmien nopean kehityksen myötä ongelmana on myös sopivimman algoritmin valinta. Paras valintastrategia on löytää algoritmi, joka testattiin tehtävään sopivalla näytteellä ja näytti optimaaliset arvot [47] .
Biologiassa suuri määrä biokemiallisia prosesseja tapahtuu makromolekyylitasolla . Prosesseja välittävät proteiini-proteiini ja proteiini - nukleiinihappo -vuorovaikutukset. Tämäntyyppisten vuorovaikutusten tutkimiseen käytetään makromolekyylitelakointia. Tämä menetelmä mahdollistaa tutkitun kompleksin kolmiulotteisen rakenteen ennustamisen luonnollisessa ympäristössä. Kuten molekyylitelakka, tutkimuksen tuloksena on joukko kompleksin (rakenteiden) malleja, jotka luokitellaan edelleen estimoidun (pistemäärä, pisteytys, pistemäärä) funktion perusteella [48] .
Tällä menetelmällä voidaan ratkaista suurempi määrä biologisia ongelmia [49] .