Proteiiniperhe on ryhmä evoluutionaalisesti samankaltaisia proteiineja , joilla on homologinen aminohapposekvenssi . Tämä termi on melkein synonyymi termille "geeniperhe", koska jos proteiineissa on homologisia aminohapposekvenssejä, niin niitä koodaavien geenien täytyy myös osoittaa merkittävää homologiaa DNA - nukleotidisekvensseissä . Tätä termiä ei pidä sekoittaa termiin " perhe " elävien organismien lajien taksonomiassa .
Kuten monien muidenkin biologisten termien kohdalla, proteiiniperheen käyttö riippuu suuresti kontekstista: se voi viitata suureen ryhmään proteiineja, joilla on hienovarainen primaarisekvenssihomologia, tai hyvin kapeaan ryhmään proteiineja, joilla on lähes sama primaarirakenne, toiminta ja kolmiulotteinen organisaatio tai jokin muu välitapaus. Näiden kahden ääritilanteen erottamiseksi Dyhoff esitteli käsitteen proteiinien superperhe [1] [2] [3] . Ajan myötä keksittiin sellaisia käsitteitä kuin luokka , ryhmä , klaani ja alaperhe , mutta ne kaikki kärsivät saman epäselvän kohtalon. Yleisessä käytössä superperheen (rakennehomologia) ymmärretään sisältävän perheitä (primaarisekvenssihomologia), jotka sisältävät alaperheitä. Siksi superperheellä, kuten PA-proteaasiklaanilla, on vähemmän konservoituneita sekvenssejä kuin yhdellä sen jäsenperheistä, kuten C04-perheellä. Näyttää epätodennäköiseltä, että tarkka määritelmä selkeine kriteereineen ilmaantuu lähitulevaisuudessa, ja siksi lukijan on itse päätettävä, kuinka nämä termit oikein ymmärtää kussakin erityisessä kontekstissa.
.
Proteiiniperheen käsite syntyi aikana, jolloin oli vielä hyvin vähän proteiineja, joilla oli tunnettu primaarinen ja tertiaarinen rakenne; pääasiassa pieniä yksidomeeniproteiineja, kuten myoglobiinia , hemoglobiinia ja sytokromi c :tä, on tutkittu . Siitä lähtien monien proteiinien on havaittu sisältävän monia rakenteellisesti ja toiminnallisesti itsenäisiä yksiköitä tai domeeneja . Evoluution aikana tapahtuneen geenien rekombinaatiosta johtuen eri domeenit kehittyivät itsenäisesti. Tästä syystä viime vuosina on kiinnitetty yhä enemmän huomiota proteiinidomeeniperheisiin. Useita verkkoresursseja on omistettu tällaisten verkkotunnusten määrittelyyn ja luetteloimiseen (katso luettelo artikkelin lopussa).
Kunkin proteiinin osilla on erilaisia rakenteellisia rajoituksia (eli rakenteellisia ominaisuuksia, jotka ovat välttämättömiä proteiinin rakenteen ja toiminnan ylläpitämiseksi). Esimerkiksi entsyymin aktiivisen kohdan toiminnan kannalta on välttämätöntä, että tietyt aminohappotähteet sijaitsevat hyvin tarkasti suhteessa toisiinsa kolmiulotteisessa tilassa. Toisaalta proteiini-proteiini-vuorovaikutus voi tapahtua suurella pinnalla ja sitä rajoittaa aminohappojen hydrofobisuus tai hydrofiilisyys . Proteiinien toiminnallisesti tärkeät osat kehittyvät hitaammin kuin konservoitumattomat alueet, kuten pintasilmukat, ja synnyttävät konservoituneiden sekvenssien lohkoja. Tällaisia lohkoja kutsutaan yleensä motiiveiksi . Kuten edellisessä tapauksessa, niiden määrittelyyn ja luetteloimiseen on omistettu useita online-resursseja.
Nykyisten käsitysten mukaan proteiiniperheitä voidaan muodostaa kahdella tavalla. Ensimmäisessä tapauksessa vanhempainlaji on jaettu kahteen geneettisesti eristettyyn jälkeläislajiin, mikä mahdollistaa geenin/proteiinin itsenäisesti kerääntyvän muunnelmia ( mutaatioita ) näissä kahdessa linjassa. Tämän seurauksena muodostuu ortologisten proteiinien perhe, jolla on yleensä yhteinen konservoitunut motiivi. Toinen tapa on geenien kaksinkertaistuminen ja paralogin esiintyminen . Koska geenin ensimmäinen kopio pystyy edelleen suorittamaan tehtävänsä, kaksoiskappale voi vapaasti muuttua ja hankkia uusia toimintoja (satunnaisten mutaatioiden kautta). Jotkin geeni-/proteiiniperheet, erityisesti eukaryooteissa , läpikäyvät merkittävän kopioinnin tai vähentymisen evoluution aikana, joskus koko genomin kaksinkertaistuessa.
Kun tunnetun rakenteen omaavien proteiinien kokonaismäärä kasvaa ja kiinnostus proteomiseen analyysiin lisääntyy, proteiinit yritetään järjestää perheiksi ja kuvata niiden domeeneja ja motiiveja. Proteiiniperheiden luotettava tunnistaminen on elintärkeää fylogeneettiselle analyysille, proteiinin toiminnan määrittämiselle ja proteiinitoimintojen moninaisuuden tutkimiselle tietyssä fylogeneettisessä ryhmässä. Enzyme Function Initiative (EFI) käyttää proteiiniperheitä ja superperheitä perustana strategian luomiseen tuntemattoman funktion entsyymien laajamittaiseen taksonomiseen jakautumiseen [4] .
Algoritmiset keinot proteiiniperheen muodostamiseksi perustuvat samankaltaisuuden käsitteeseen. Suurimman osan ajasta ainoa samankaltaisuus, johon meillä on pääsy, on primaarirakenteen homologia.
Proteiiniperheille on omistettu monia biologisia tietokantoja , joiden avulla voit nopeasti määrittää, onko äskettäin löydetty ja tunnistettu proteiini jo tunnetun proteiiniperheen jäsen. Erityisesti:
On myös erikoistuneita hakukoneita: