A molekuláris dokkolás egy olyan molekuláris modellezési módszer , amely lehetővé teszi egy molekula ( ligandum ) legkedvezőbb orientációjának és konformációjának előrejelzését egy másik ( receptor ) kötőhelyén a stabil komplex kialakulásához [1] . A partnerek helyzetére és felépítésére vonatkozó adatokat az úgynevezett pontozási függvények segítségével az interakció erősségének előrejelzésére használják. Ha a ligandum egy makromolekula , a dokkolást makromolekulárisnak nevezzük .
A molekuláris dokkolás felfogható úgy, mint a „kulcs” (ligandum) optimális helyzetének keresése a „zárban” (receptorban) [2] . Ebben az esetben a molekulákat merev testeknek tekintjük. A valóságban azonban a dokkolási folyamat során a ligandum és a fehérje megváltoztatja a konformációt a legjobb kötődés elérése érdekében. A fehérje konformációjában bekövetkező változások magukban foglalhatják a hurkok és a domének [2] mozgását . Az ilyen sikeres kötéshez vezető folyamatot "indukált illesztésnek" [3] nevezik .
A molekuláris dokkolás a molekuláris felismerési folyamat modellezésére szolgál. Általában meg kell találni az optimális ligandum konformációt. Ezt a pozíciót akkor érjük el, ha a kötés szabad energiája minimális. [4] .
A biológiailag jelentős molekulák, például fehérjék, nukleinsavak , szénhidrátok és lipidek komplexei kulcsszerepet játszanak a kémiai jelátvitelben. Ezenkívül a két kölcsönható molekula relatív orientációja befolyásolhatja a termelt jel típusát (legyen az gátló vagy katalitikus ). Ezért a biológiai molekulák közötti kölcsönhatás fontos az előállított jel típusának és erősségének előrejelzéséhez [5] .
A dokkolást gyakran használják egy kis gyógyszermolekula célfehérjével szembeni affinitásának és aktivitásának előrejelzésére. Így a molekuláris dokkolás, amely a gyógyszerfejlesztés egyik szakasza , fontos szerepet játszik ebben a folyamatban [6] .
A molekuláris dokkolás egyik előnye az automatizálás lehetősége. A gyógyszerfejlesztési feladat részeként lehetővé válik a kis molekulatömegű vegyületek könyvtárainak szűrése . A molekuláris dokkolás lehetővé teszi a legoptimálisabban kölcsönhatásba lépő vegyület meghatározását - egy gyógyszert számos hasonló összetételű analógból [7] .
A gyógyszerfejlesztés egyik módszere a fragmentált tervezés . A módszer a célponthoz alacsony kötődési affinitással rendelkező kis fragmensek felkutatásán és ezek további kombinációján alapul, hogy nagy affinitású vegyületet keressünk. A töredéktervezést hatékony inhibitorok keresésére használják. Ezt a problémát különféle módszerekkel oldják meg. Ezek közé tartozik az NMR spektroszkópia bizonyos típusai , az izoterm titrálás-kalorimetria , a mikroszkópos termoforézis módszer , a plazmonrezonancia és mások [8] . A molekuláris dokkolás pedig egy hasonló probléma megoldását is lehetővé teszi különféle – mind alacsony molekulatömegű, mind komplex – vegyületek könyvtárainak letapogatásával és affinitásuk felmérésével [9] .
A dokkolás felhasználható a bioremediációban bizonyos enzimek által lebontott környezeti szennyező anyagok felkutatására [10] .
Vannak azonban olyan esetek, amikor az interakció helye közvetlenül nem ismert. Ezután alkalmazzuk az úgynevezett vakdokkolást [11] . Ennek a megközelítésnek a különféle változatait a következő algoritmusok valósítják meg: MolDock [12] , Fragment Hotspot Maps [11] , DoGSiteScorer [13] .
A molekuláris dokkolás alapvető alkalmazási területei közé tartozik [4] :
Különféle megközelítések léteznek a dokkolás modellezésére. Az egyik megközelítés egy illesztési technikát használ, amely a fehérjét és a ligandumot további felületként írja le [14] [15] . Egy másik megközelítés modellezi a tényleges dokkolási folyamatot, amelyben a páronkénti kölcsönhatási energiákat számítják ki . Mindkét megközelítésnek vannak jelentős előnyei, valamint bizonyos korlátai [16] .
A "merev"-et dokkolónak nevezzük, amelyben a dokkolópartnerek kötéshosszai, szögei és torziós szögei változatlanok maradnak a szimuláció során. Más fehérjével vagy ligandummal való kölcsönhatás eredményeként azonban mind a fehérjevázban, mind az oldalláncokban konformációs változások következnek be. A gerinc mobilitása viszont két típusra osztható: a fehérje nagy szakaszainak - doméneknek - mobilitása, az úgynevezett "shift" mozgás, valamint az egyes részek, például hurkok mobilitása. Ebben az esetben a „kemény” dokkolás helytelenül írja le az interakciókat. Ezért van néhány további "rugalmas" dokkolási algoritmus. Lehetővé teszik a konformációs változásokat, aminek eredményeként ez a megközelítés lehetővé teszi a természeteshez legközelebb álló interakciós becslések készítését. Az összes lehetséges konformációs változás kiszámítása azonban, figyelembe véve a mozgást a számítógép fejlettségi szintjén, óriási időt vesz igénybe. Sőt, a szabadságfok nagy száma a téves pozitívumok számának növekedéséhez is vezethet. Ezekkel a problémákkal kapcsolatban szükségessé válik a lehetséges konformációs változások egy kis részhalmazának racionális kiválasztása a modellezéshez [17] .
A "rugalmas" dokkolás az alacsony molekulatömegű vegyület dokkoló esetében is használható. Ebben az esetben azonban megengedett a ligandum molekulájában lévő bármely kötés körüli forgás, miközben a fehérje „merev” szerkezet marad [18].
A dokkolás felosztható egyszeres ( angol single ) és szekvenciális ( angol szekvenciális ) [19] . A szekvenciális dokkolást főként számos kis molekulatömegű vegyület (ligandum) dokkolására használják. Miután az egyik ligandumot külön fájlba dokkoltuk, a fehérje szerkezete ezzel a ligandummal mentésre kerül. Továbbá az algoritmus megismétlődik, és a második ligandum dokkolása megvalósul az előzőleg mentett struktúrába. Ez a megközelítés hasznos lehet az alloszterikus centrumok keresésében [20] .
A geometriai megfelelést (módszerek az alak kölcsönös függésének meghatározására) egy fehérjére és egy ligandumra számos jellemzőként írják le, amelyek meghatározzák optimális kölcsönhatásukat [21] . Ezek a jellemzők magukban foglalhatják magát a molekulafelületet és a további jellemzők leírását is. Ebben az esetben a receptor molekuláris felületét az oldószerhez való hozzáférhetőségével, a ligandum molekulafelületét pedig a receptor felületének leírásával írjuk le. A két felület közötti kölcsönös függés olyan alakegyeztetési leírást jelent, amely segíthet a ligandum különböző pozícióinak kimutatásában. Egy másik megközelítés egy fehérje hidrofób jellemzőinek leírása a gerinc atomjaiban lévő rotáció segítségével. Egy másik megközelítés a Fourier transzformáción alapulhat [22] [23] [24] .
Ebben a megközelítésben a fehérjét és a ligandumot bizonyos fizikai távolság választja el egymástól, és a ligandum bizonyos számú „lépés” után megtalálja a helyét a fehérje aktív helyén . A lépések magukban foglalják a merev test transzformációit , például a transzlációt és a rotációt , valamint a ligandum szerkezetének belső változásait, beleértve a szögelfordulásokat is. A térben végzett lépések mindegyike megváltoztatja a rendszer általános energiabecslését, és ezért minden lépés után kiszámításra kerül. A módszer nyilvánvaló előnye, hogy lehetővé teszi a ligandum flexibilitásának feltárását a szimuláció során, míg az alakkapcsolati módszereknek más megközelítést kell alkalmazniuk a ligand mobilitásának megismeréséhez. További előnye, hogy a folyamat fizikailag közelebb áll ahhoz, ami valójában történik, amikor a fehérje és a ligandum közeledik egymáshoz a molekuláris felismerés után. Ennek a technikának az a hátránya, hogy időbe telik az optimális dokkoló-megoldás kiértékelése, mivel meglehetősen nagy energiaterületet kell feltárni [1] .
Az első dolog, amelyre szükség van a molekulák dokkolás útján történő szűréséhez, az a kérdéses fehérje szerkezete. A szerkezetet általában biofizikai módszerekkel ( röntgendiffrakciós analízis vagy NMR spektroszkópia ) határozzák meg, homológia modellezéssel is megkaphatjuk . A fehérje szerkezete, valamint a potenciális ligandumok adatbázisa bemenetként szolgál a dokkoló programhoz. A dokkolás sikere két összetevőtől függ: a keresési algoritmustól és a kiértékelő függvénytől [4] .
A sikeres dokkoláshoz két feltétel szükséges [25] :
Sok esetben, például antitestek és kompetitív inhibitorok esetében, a kötőhely ismert. Más esetekben a kötőhely meghatározható mutagenezisből vagy filogenezisből . Azokat a konfigurációkat, amelyekben a fehérjeatomok átfedik egymást (az úgynevezett flare, az angol clash szóból ), mindig ki vannak zárva [26] .
A fáklyás komplexek kiszűrése után az egyes szerkezetek (komplex modellek) energiáját az úgynevezett sebesség (értékelő) függvény segítségével mérjük. Ez utóbbinak meg kell különböztetnie a „megbízható” struktúrát legalább 100 000 alternatíva felett. Ez egy összetett számítási probléma, ezért számos módszert fejlesztettek ki a megoldására. Az algoritmusok determinisztikusra és sztochasztikusra oszthatók [4] .
Matematikai szempontból a dokkolás a szabadenergia -függvény globális minimumának keresése , amely a ligandum fehérjéhez való kötésének minden lehetséges módját tartalmazó többdimenziós térben megadva. A keresési tér elméletben a ligandumhoz kapcsolódó fehérje összes lehetséges térbeli pozíciójából és konformációjából áll. A gyakorlatban azonban a rendelkezésre álló számítási erőforrásokkal lehetetlen a keresési tér teljes körű feltárása – ehhez minden egyes molekula minden lehetséges eltolódását ki kell számítani (a molekulák dinamikusak és konformációs állapotok együtteseként léteznek), valamint minden forgási ill. a ligandum pozíciói a fehérjéhez képest egy adott részletességi szinten. A legtöbb dokkoló program figyelembe veszi egy ligandum (egy "rugalmas" ligandum) variánsainak teljes konformációs terét, és néhányan egy "flexibilis" receptorfehérjét is megkísérelnek modellezni. Ennek a párnak minden fix helyzetét a térben dokkolási megoldásnak nevezzük [27] .
A legjobb kötés megtalálására szolgáló algoritmusok a következő kategóriákra oszthatók: szisztematikus módszerek, véletlenszerű vagy sztochasztikus heurisztikus módszerek, molekuladinamikai módszerek és termodinamikai módszerek [28] .
Azok a módszerek, amelyek garantálják, hogy véges számú lépésben megtaláljuk a globális minimumot, szisztematikus módszerek, vagyis a ligandum összes lehetséges pozíciójának szekvenciális felsorolásának módszerei a célfehérje aktív központjában. A szükséges számítások nagy száma miatt azonban ez a módszer jelentős egyszerűsítéseket tesz szükségessé. Vannak más globális optimalizálási módszerek, amelyek nem garantálják, hogy véges számú programlépésben megtalálják a globális minimumot, de a gyakorlatban sokkal gyorsabban képesek megtalálni az ilyen minimumokat, mint a szisztematikus felsorolási módszerek. Az ilyen módszerek két nagy csoportra oszthatók: heurisztikus és termodinamikai [29] .
A heurisztikus módszerek néhány empirikus stratégiát alkalmaznak a globális minimum meghatározására, amelyek felgyorsítják az eljárást a hiperfelület egyszerű letapogatásához képest. A leghíresebb és legnépszerűbb a következő heurisztikus módszerek [28] :
A termodinamikai módszerek közé tartozik a lágyítási modellezés .
A Monte Carlo-típusú módszerekben a kezdeti konfigurációt lépések elfogadásával vagy elutasításával finomítják (bizonyos paraméterkészlet iteratív változtatása), az értékelési függvény értékétől (vagyis a struktúra pontszámától) függően (lásd a Metropolis-kritériumot ), amíg a bizonyos számú lépést tettek. Feltételezzük, hogy a legjobb struktúrához való konvergencia a kezdeti struktúrák nagy csoportjából származik, amelyek közül csak az egyiket kell figyelembe venni. A kezdeti struktúrák sokkal gyorsabban elemezhetők "durva" ( durva ) módszerekkel . Nehéz olyan pontszámfüggvényt találni, amely egyrészt jól megkülönböztetné a „jó” struktúrát, másrészt pedig nagy távolságból (a mintavételezett térben) konvergálna vele. Ezért javasolták a közelítés két szintjének ("durva" és "pontos") alkalmazását, különböző kiértékelési függvényekkel. A [34] lépéshez kiegészítő paraméterként bevezethető a forgatás Monte Carlóban .
A Monte Carlo módszerek sztochasztikusak és nem garantálják a kimerítő keresést, ezért a legjobb konfigurációt még az elméletileg megkülönböztető becslő használatakor is el lehet hagyni. Az, hogy ez a probléma mennyire komolyan befolyásolja a dokkolás eredményeit, még nem tisztázott egyértelműen [34] .
Ezt a megközelítést a RosettaDock algoritmus valósítja meg . RossettaCommons . Letöltve: 2020. április 27. [35] .
A dokkolás eredményeként nagyszámú potenciális ligandum-pozíció keletkezik, amelyek egy része azonnal kilökődik a fehérjemolekulával való ütközés miatt. A többit egy pontozási függvény segítségével értékeli, amely az aktuális dokkolási döntést veszi bemenetként, és egy számot ad vissza, amely jelzi annak valószínűségét, hogy a dokkolási döntés kedvező kötési kölcsönhatást jelent. Így az egyik ligandum kötődési hatékonysága a másikhoz viszonyítva értékelhető [4] .
A modern dokkoló algoritmusokban az értékelési függvényeknek három fő típusa különböztethető meg: erőtér alapú, empirikus és statisztikai.
A legtöbb pontozási függvény a molekuláris mechanikai erőterek fizikán alapul , amelyek a kötőhelyen belüli dokkolóoldat energiáját becsülik meg. A dokkoló megoldás energiájához különböző hozzájárulások írhatók fel [4] egyenletként :
Az egyenlet összetevői közé tartoznak az oldószerhatások, a fehérje és ligandum konformációs változásai, a fehérje-ligandum kölcsönhatások következtében fellépő szabad energia, a belső forgások, a ligandum és a receptor asszociációs energiája, hogy egyetlen komplexet képezzenek, valamint a rezgésváltozások miatti szabad energia. módok. Az alacsony (negatív) energia stabil rendszert és így valószínű kötési kölcsönhatást jelez [36] .
Az empirikus kiértékelő függvények az erőtereken alapulókkal ellentétben olyan komponenseket tartalmaznak, amelyek egyszerűbben írják le az intermolekuláris érintkezéseket. Ebben az esetben nincs közvetlen analógia a páronkénti intermolekuláris fizikai kölcsönhatásokkal. Egy ilyen megközelítés előrejelző képessége nagymértékben függ maguktól az összetevőktől és az együtthatóktól, amelyekkel az egyenletbe belépnek. Az intermolekuláris kölcsönhatásokat a különböző típusú érintkezéseket leíró kifejezések lineáris kombinációjaként mutatják be: hidrogénkötések, hidrofób kölcsönhatások, fémionokkal való kölcsönhatások és mások. Az egyszerűsítés például a fémionokkal vagy hidrofób kontaktusokkal való koordinációs kötések esetében abból áll, hogy leírásukat a ligandum és a receptor megfelelő atomjai közötti távolságok felhasználásával végezzük, azonban ez a közelítés fizikailag nem helyes. A hidrogénkötéseket empirikus geometriai paraméterekkel (a donor és akceptor távolsága, valamint a köztük és a hidrogénatom bezárt szöge) írják le, és nem az energiajellemzőik [37] .
Egy alternatív megközelítés a statisztikai pontozási függvényeken keresztül az, hogy tudásalapú statisztikai potenciált nyerünk a kölcsönhatásokhoz a fehérje-ligandum komplexek PDB adatbázisából , és értékeljük a dokkoló megoldás illeszkedését a becsült potenciálnak megfelelően [38] .
Számos program létezik a fehérjék elméleti dokkolására. A legtöbb így működik: az egyik fehérje rögzítve van a térben, a másik pedig körülötte forog. Ebben az esetben a fordulók minden konfigurációjához a kiértékelő számításokat az értékelési függvénynek megfelelően végezzük. Az értékelési függvény a felület komplementaritásán, az elektrosztatikus kölcsönhatásokon, a van der Waals taszításon és így tovább. Ezzel a kereséssel az a probléma, hogy a teljes konfigurációs térre kiterjedő számítások kiszámítása hosszú időt vesz igénybe, és ritkán vezet egyetlen megoldáshoz [39] .
Az értékelési funkció tökéletlensége elkerülhetetlenül egy adott dokkoló algoritmus (például AutoDock, ICM) előrejelző képességének értékeléséhez vezet. Ehhez további kísérleti adatokra, például referenciaszerkezetre van szükség. Az értékelés többféleképpen is elvégezhető [4] :
A dokkolási pontosság [40] az egyik értékelése egy algoritmus alkalmazhatóságának, egy algoritmus kísérleti adatok reprodukálására való képességének.
A dúsítási tényezőt az algoritmus azon képességeként becsülik, hogy meg tudja különböztetni (a legjobbak tetején jelenlévő) "igaz" ligandumokat a "hamis"-tól a mintában, ahol a "hamis"-ok száma sokkal nagyobb, mint az "igaz"-ok száma. . Az „igaz” olyan ligandumokra utal, amelyek kötődése kísérletileg igazolt, a „hamis” pedig olyan ligandumokra utal, amelyek kötődése nem bizonyított. A módszer ROC - görbéjének elemzését gyakran végzik [41] .
A dokkoló programok röntgendiffrakciós elemzéssel nyert szerkezetek reprodukálására való képessége számos benchmarking módszerrel értékelhető [42] .
Kis molekulák esetén az összehasonlító elemzéshez speciális, kísérleti adatokat tartalmazó referenciakészleteket vehetünk fel. Például az Astex Diverse Set [43] , amely röntgendiffrakciós elemzéssel vagy a Directory of Useful Decoys (DUD) [44] módszerével nyert ligandumokkal rendelkező fehérjék szerkezetét tartalmazza .
Peptid dokkolás esetén a Lessons for Efficiency Assessment of Docking and Scoring (LEADS-PEP) [45] használható .
Az utóbbi időben egyre több tudományos cikk jelent meg a virtuális szűrésnek és dokkolásnak szentelve. Azonban ne bízzon vakon az eredményeikben. A kutatók által leggyakrabban feltett kérdések közé tartozik:
A nagyszámú különböző algoritmus rohamos fejlődésével a legmegfelelőbb algoritmus kiválasztása is problémát jelent. A legjobb kiválasztási stratégia az, ha megtaláljuk azt az algoritmust, amelyet a feladathoz megfelelő mintán teszteltek és optimális értékeket mutattak [47] .
A biológiában nagyszámú biokémiai folyamat megy végbe makromolekuláris szinten . A folyamatokat fehérje-fehérje és fehérje - nukleinsav kölcsönhatások közvetítik . Az ilyen típusú kölcsönhatások tanulmányozására makromolekuláris dokkolást alkalmaznak. Ez a módszer lehetővé teszi a vizsgált komplexum háromdimenziós szerkezetének előrejelzését a természetes környezetben. A vizsgálat eredménye a molekuláris dokkoláshoz hasonlóan a komplex (struktúrák) modelljeinek halmaza, amelyeket a becsült (pontszám, pontozás, pontszám) függvény alapján tovább rangsorolunk [48] .
Ez a módszer több biológiai probléma megoldását teszi lehetővé [49] .