A makromolekuláris dokkolás két vagy több kölcsönhatásban lévő biológiai makromolekula által alkotott komplexek kvaterner szerkezetének molekuláris modellezési módszere . Leggyakrabban fehérje-fehérje komplexeket, ritkábban fehérje - nuklein komplexeket tanulmányoznak .
A dokkolás végső célja a vizsgált makromolekuláris komplexum háromdimenziós szerkezetének előrejelzése a természetes környezetben. A dokkolás eredménye a komplex (struktúrák) modelljeinek halmaza. Különféle módszerekkel rangsorolhatók, például egy értékelési (pontszám, pontozás, pontozás) függvény segítségével kiválasztható a legvalószínűbb (a szervezetben nagyobb valószínűséggel előforduló).
A dokkolás vagy dokkolás kifejezés az 1970-es évek végén jelent meg két molekula dokkolásának modellezése értelmében, melyben az utóbbiak orientációja nem változott (csak a pozíció változott). A számítógép teljesítményének növekedésével lehetővé vált a partnerek orientációjának megváltoztatása, ezt a dokkolási lehetőséget „merev dokkolónak” vagy merev test dokkolásnak („merev test”) nevezik. A következő lépés a „rugalmas dokkolásra” való áttérés volt, melynek során a partnerek belső geometriája (konformációja) megváltozik.
A legtöbb fehérje biológiai szerepe, amelyet az ír le, hogy milyen molekulákkal képesek kölcsönhatásba lépni, legjobb esetben is ismert, legalábbis csak hiányosan. Még a jól tanulmányozott biológiai folyamatokban részt vevő fehérjék is (pl . TCA ) váratlan interakciós anyagokkal vagy új biológiai funkciókkal rendelkezhetnek.
A fehérje-fehérje kölcsönhatások esetében további kérdések merülnek fel. Úgy gondolják, hogy a genetikai betegségeket (pl . cisztás fibrózist ) rosszul hajtogatott ( mutált ) fehérjék okozzák, és felmerül a vágy annak megértésére, hogy egy adott mutáció milyen abnormális fehérje-fehérje kölcsönhatásokat okozhat . Ha a jövőben lehetővé válik olyan fehérjék tervezése, amelyek biológiai funkciókat látnak el, akkor fontos lesz meghatározni a lehetséges kölcsönhatások körét.
Egy bizonyos fehérjekészlet esetében a következő problémákat lehet megoldani:
Ha összekapcsolódnak
Ha nem csatlakoznak,
A fehérje-fehérje dokkolás használható ezeknek a problémáknak a megoldására.
Ezen túlmenően, a dokkolás segíthet az ismeretlen funkciójú fehérjék tanulmányozásában (egy viszonylag kevéssé vizsgált terület). Ha nincs térszerkezeti modell, akkor modellezhető (lásd a fehérjeszerkezet előrejelzését ).
A fehérje-nukleinsav kölcsönhatások fontos szerepet játszanak egy élő sejtben. A transzkripciós faktorok szabályozzák a génexpressziót , a replikációt végző polimerázok pedig fehérjekomplexek , és a genetikai anyag, amelyhez kötődnek, nukleinsavakból áll . A fehérje-nukleinsav kölcsönhatások modellezése nehézségekkel jár, amelyeket az alábbiakban ismertetünk.
Az 1970-es években a komplex modellezés abból állt, hogy manuálisan azonosították az elemeket az interaktív anyagok (partnerek) felületén, és értelmezték a kötődésre, funkcióra és aktivitásra gyakorolt hatásokat; A szimulációs folyamat végén általában bármilyen számítógépes programot használtak annak a viszonylag kevés konfigurációnak a megkülönböztetésére, amely a heurisztikus megszorítások alkalmazása után megmaradt. Először használtak számítógépeket a sarlósejtes rostokban lévő hemoglobin kölcsönhatásának vizsgálatára. [1] Aztán 1978-ban megjelent a munka a tripszin - aprotinin komplexszel . [2] Számítógépeket használnak a "rossz" és a "jó" modellek megkülönböztetésére, pontozási függvényen keresztül. Nagy határfelületet (kötőfelületet) „jutalmaztak”, az átfedő területekért pedig büntetést szabtak ki. A számítógép a kölcsönhatásba lépő fehérjék egyszerűsített ábrázolását használta: minden maradékot egyetlen kötőhelyként ábrázoltunk. Az elektrosztatikus kölcsönhatásokat, például a hidrogénkötéseket kézzel elemezték.
Az 1990-es évek elejére bonyolultabb struktúrákat határoztak meg, miközben a rendelkezésre álló számítási teljesítmény jelentősen megnőtt. A bioinformatika megjelenésével a hangsúly az tetszőleges interakciós anyagokra ésszerű számítási költséggel és további filogenetikai vagy kísérleti adatok hiányában alkalmazható módszerek kifejlesztésére került.
1992-ben megjelent egy módszer [3] , amely a gyors Fourier-transzformációt használta. Ebben a módszerben a dokkolópartnerek "durva" ábrázolása volt: háromdimenziós mátrixok formájában, amelyekben a számok megfeleltek az atomok helyzetének. A gyors Fourier transzformáció segítségével sokkal gyorsabban sikerült megtalálni a partnerek kapcsolatának megfelelő mátrixok helyét, mint más dokkolási módszerek. 1997-ben ez a módszer elkezdte figyelembe venni az elektrosztatikus kölcsönhatásokat.
1996-ban publikálták az első tanulmány [4] eredményeit , amelyben hat kutatócsoport próbálta megjósolni a TEM-1 béta-laktamáz komplex béta-laktamáz inhibitor proteinnel (BLIP) szerkezetét. A tanulmány megállapította, hogy figyelembe kell venni a konformációs változásokat és a konformerek megkülönböztetésének nehézségét.
A dokkolás alapvető mechanizmusa hasonló a molekuláris dokkoláshoz . Monte Carlo-típusú módszereket is alkalmaznak , amelyekben a paraméterkészlet iteratív változtatásai során a kezdeti konfiguráció finomodik. Minden lépésben a konfiguráció elfogadása vagy elutasítása az értékelési függvény értéke alapján történik.
A fehérjék mindegyike egyszerű köbös rácsként ábrázolható. Azon összetett modelleknél, amelyek a fehérje pozíciójának megváltoztatásával fordítódnak át egymásba, egy bizonyos kiértékelési függvény szinte azonnal kiszámítható a konvolúciós tétel segítségével . Lehetőség van értelmes, bár hozzávetőleges "konvolúciós" pontozási függvények létrehozására, amelyek figyelembe veszik a sztereokémiai és elektrosztatikus kölcsönhatásokat.
A reciprok térmódszereket széles körben alkalmazzák, mivel képesek nagyszámú szerkezet értékelésére. Elveszítik sebességelőnyüket, ha torziós változások következnek be. További hátránya, hogy a felhalmozott tudást nem lehet hatékonyan felhasználni. Az is kérdés, hogy ez a módszer nem elég pontos-e ahhoz, hogy megbízhatóan feltárja a legjobb komplexum szerkezetét.
A legjobb modellek megkülönböztetését lehetővé tévő pontszám (valamilyen mutató) keresésére egy speciális tesztmintát (Benchmark, lásd alább) fejlesztettek ki a fehérje-fehérje struktúrákból. A pontszámok rangsorolása a legjobb struktúrának adott rangsor alapján történik (ideális esetben a pontszámok szerinti rangsorolás a "kísérleti" legjobb struktúrát hozza a csúcsra) és a lefedettség alapján (a kontrollesetek aránya, amelyeknél elfogadható eredményt értek el). A pontszámok több kategóriába sorolhatók, többek között:
Jellemzően a hibrid pontszámokat (magukat a pontszámfüggvényeket) úgy hozzák létre, hogy a fenti kategóriák közül egyet vagy többet (a továbbiakban a pontfüggvény "kifejezései") kombinálnak egy súlyozott összeggé, amelyek súlyozását tesztminták segítségével optimalizálják ( az úgynevezett benchmarkok). A torzítások elkerülése érdekében a súlyok optimalizálására használt tesztmodellek nem lehetnek átfedésben a hibrid pontozás végső tesztjéhez használt tesztmodellekkel.
A fehérje-fehérje dokkolás problémájában fontos olyan pontszámfüggvény megtalálása, amely megbízhatóan tükrözi a partnerek affinitására vonatkozó információkat. Egy ilyen funkció nagymértékben felgyorsítaná az in silico fehérjefejlesztés , a gyógyszerfejlesztés és az interaktóm nagy áteresztőképességű annotációjának fejlődését (azaz mely fehérjék kötődnek és melyek nem). Számos pontozási függvényt javasoltak a kötési affinitás/szabadenergia értékelésére. [5] [6] [7] [8] [9] A kísérletileg meghatározott kötési affinitás és a kilenc népszerű pontszámfüggvény előrejelzése közötti korreláció azonban majdnem ortogonálisnak bizonyult (R 2 ~ 0). [10] [11] Azt is megfigyelték, hogy egyes kifejezések jobban korrelálnak a kísérleti kötési energiákkal, mint a teljes becslés, ami azt sugallja, hogy lehetséges a pontszámfüggvény megtalálása és javítása a komponensek (kifejezések) súlyának áttekintésével. A kötési affinitás meghatározásának kísérleti módszerei között szerepel a felületi plazmonrezonancia (SPR), a Förster-rezonancia energiatranszfer , a radioligandumokat használó módszerek, az izotermikus titráló kalorimetria (ITC), a mikroszkópos termoforézis (MST) vagy a spektroszkópiai mérések, ill. mások fluoreszcens módszerek. A tudományos cikkekből származó információk is jó forrást jelenthetnek a pontozás javításához. [12]
A dokkolási módszerek teszteléséhez egy tesztmintát (Benchmark) készítettek 84 fehérje-fehérje komplex szerkezetéből. [13] A tesztmintában szereplő struktúrákat kifejezetten úgy választották ki, hogy az interakciós típusok széles skáláját lefedjék, és a lehető legheterogénebbek legyenek (a lehető legkevesebb ismétlődő jellemzőt tartalmazzák, mint például a partnercsaládok profilja a SCOP adatbázisban ) . A tesztelemek három összetettségi szintre oszlanak (a legnehezebb tartalmazza a gerinc konformációjának legnagyobb változását). A fehérje-fehérje dokkolás tesztmodelljei például az enzim-inhibitor szerkezetek, az antigén-antitest szerkezetek és a homomultimer komplexek.
A fehérje-fehérje dokkolás benchmark legújabb verziója 230 komplexből áll [14] , a DNS-fehérje dokkolás esetében pedig 47. [15] Az RNS-fehérje dokkolás legújabb tesztkészlete 126 elemet tartalmaz. [16] Összevont vizsgálati minták vannak 209 komplexből. [17]
Az affinitási tesztkészlet a fehérje-fehérje dokkoló tesztkészleten alapult. [10] 81 fehérje-fehérje komplexet tartalmazott, kísérletileg mért affinitással. Ezek a komplexek 11 nagyságrendű affinitást ölelnek fel.
Ezt a mintát további szakértői értékelésnek vetették alá, és jelentősen bővítették. [18] Az új tesztkészlet különböző biológiai funkciójú fehérjéket tartalmaz. G-fehérjékből és a receptorok extracelluláris doménjéből, valamint antigén/antitest, enzim/inhibitor és enzim/szubsztrát komplexekből áll. A partnerek egymás iránti affinitása tekintetében is változatos, K d értéke 10 -5 és 10 -14 M között van. A kilenc elem egymáshoz szorosan kapcsolódó komplexek, amelyek szerkezete hasonló, de nagyon eltérő affinitással. Mivel a komplex komponenseinek szerkezete külön-külön ismert, így a kialakulás során a partnerek konformációjában bekövetkezett változások értékelhetők. A legtöbb komplexumban nagyon jelentősek. Ez a tesztkészlet olyan biofizikai modellekhez is használható, amelyek célja a fehérje-fehérje kölcsönhatások affinitása és szerkezete közötti kapcsolat megállapítása, figyelembe véve a reagensekre és azok konformációs változásaira vonatkozó adatokat, nem csak a termékre (komplexumra) vonatkozóan. [tizennyolc]
A CAPRI (Critical Assessment of PRediction of Interactions) [19] rendszeres esemény, amely során a kutatókat a világ minden tájáról meghívják egy fehérje-fehérje komplex szerkezetének megállapítására, ha csak a reagensek szerkezetét adják meg dokkolás útján. A rendezvényekre (fordulókra) körülbelül 6 havonta kerül sor. A résztvevő minden kör során megkapja a komplex reagenseinek szerkezetét, amelyek szerkezetét nemrégiben kísérletileg határozták meg. A komplexum koordinátáit titokban tartják. A CAPRI értékelése kettős vak , mivel a résztvevők nem ismerik a komplexum felépítését, és a szervezők sem tudják, hogy melyik résztvevő javasolta a komplexum egy adott modelljét.
Jelenleg a CAPRI egyre népszerűbb (a hetedik fordulóban világszerte 37 csoport vett részt). Bár a CAPRI eredményei csekély statisztikai jelentőséggel bírnak az egyes körökben lévő célpontok kis száma miatt, a CAPRI szerepe meglehetősen jelentős. A CASP pontszám hasonló gyakorlat a fehérjeszerkezet előrejelzésében.