Rosetta@home | |
---|---|
| |
Típusú | Protein Structure Prediction , Volunteer Computing és Berkeley Open Infrastructure for Network Computing projektek [d] |
Fejlesztő | Baker laboratórium , Washingtoni Egyetem , Rosetta Commons |
Operációs rendszer | Többplatformos szoftver |
Első kiadás | 2005. október 6 |
Hardver platform | BOINC |
legújabb verzió | Rosetta Mini: 3,71 [1] ( 2016. január 20. ) |
Állapot | Aktív |
Engedély | Tudományos és non-profit használatra ingyenes, kereskedelmi használatra szabadalmaztatott licenc [2] |
Weboldal | boinc.bakerlab.org/roset… |
Médiafájlok a Wikimedia Commons oldalon |
Rosetta@home | |
---|---|
Felület | BOINC |
Szoftverletöltés mérete | 48 MB |
Munkaadatok betöltött mérete | 2,5 MB |
Az elküldött munkaadatok mennyisége | 6-150 KB |
Lemezterület _ | 130 MB |
Felhasznált memória mennyisége | 255 MB |
GUI | van |
Átlagos feladat számítási idő | 0,5-10 óra (időszabályozás lehetséges) |
határidő | 10 nap |
GPU használatának képessége | Nem |
Médiafájlok a Wikimedia Commons oldalon |
A Rosetta@Home egy önkéntes számítástechnikai projekt , amelynek célja a molekuláris biológia egyik legnagyobb problémájának megoldása - a fehérjék harmadlagos szerkezetének kiszámítása aminosavszekvenciáikból . A befejezett Human Genome Projectnek köszönhetően az emberi szervezetben található összes fehérje aminosavsorrendje ismert. A projekt keretében végzett kutatás új, nem létező fehérjék tervezésében is segít. Míg a projekt nagy része a proteomikai módszerek pontosságának és robusztusságának javítását célzó alapkutatásokra összpontosít, a Rosetta@home olyan betegségek leküzdésére irányuló alkalmazott kutatásokat is támogatja, mint a rák , malária , Alzheimer-kór , lépfene és más genetikai és vírusos betegségek [3] . A Foldit a Rosetta@Home videojátéka, amelynek célja a projekt céljainak elérése közösségi forrásból származó megközelítéssel.
A Rosetta@Home számítási eredmények közvetlenül nem érhetők el. Ezenkívül nem használhatja a saját számítógépének számítási eredményeit. [4] Azonban számos tudományos publikációhoz használják őket. [5]
A Rosetta lényegében egy számítógépes program , amelynek fő feladatai a következők:
Ez a projekt előrejelzéseket és eredmények visszajelzést használ a potenciális keresési funkciók és algoritmusok javítására .
Rosetta@home alkalmazás és BOINC Distributed Computing Platform , elérhető Windows, Linux és macOS operációs rendszerekhez; A BOINC számos máson is fut, például a FreeBSD-n. A Rosetta@home programban való részvételhez legalább 500 MHz órajelű központi feldolgozó egység (CPU), 200 megabájt szabad lemezterület, 512 megabájt fizikai memória és internetkapcsolat szükséges. 2020. június 27-től a Rosetta Mini alkalmazás jelenlegi verziója 4.20. A BOINC szoftver jelenlegi ajánlott verziója a 7.16.7. Standard Hypertext Transfer Protocol (HTTP) (80-as port) a felhasználó BOINC-kliense és a Washingtoni Egyetem Rosetta@home szerverei közötti kommunikációra szolgál . A jelszócsere során a HTTPS-t (443-as port) használják. A BOINC kliens távoli és helyi felügyelete a 31416-os és az 1043-as portot használja, amelyek kifejezetten feloldhatók, ha tűzfal mögött vannak. Az egyes fehérjékre vonatkozó adatokat tartalmazó munkaegységeket a Washingtoni Egyetem Baker Labjában található szerverekről önkéntes számítógépekre osztják szét, amelyek aztán kiszámítják a hozzárendelt fehérje szerkezeti előrejelzését. Egy adott fehérjére vonatkozó ismétlődő szerkezeti előrejelzések elkerülése érdekében minden munkablokkot véletlenszerű számú maggal inicializálunk. Ez minden előrejelzésnek egyedi pályát ad a fehérje energia táján való leereszkedéshez. A Rosetta@home fehérjeszerkezeti előrejelzései hozzávetőleges értékek a globális minimumhoz egy adott fehérje energiakörnyezetében. Ez a globális minimum jelenti az energetikailag legkedvezőbb fehérjekonformációt, vagyis a natív állapotát.
A Rosetta@home grafikus felhasználói felület (GUI) fő jellemzője egy képernyővédő, amely megjeleníti a futó modul aktuális állapotát a fehérjehajtogatás szimulációja során. Az aktuális nyitóképernyő bal felső sarkában a célfehérje különböző alakzatokat (konformációkat) felvetve a legalacsonyabb energiájú szerkezetet keresve látható. Közvetlenül jobbra az utoljára fogadott szerkezete látható. A jobb felső sarokban az aktuális elrendezés legalacsonyabb energiájú konformációja látható; alább látható a fehérje valódi vagy natív szerkezete, ha azt már meghatározták. A nyitóképernyő három diagramot tartalmaz. A középső rész közelében egy diagram jelenik meg az elfogadott modell termodinamikai szabadenergiájáról, amely az elfogadott modell változásával ingadozik. A jobb oldalon látható az elfogadott modell szórás (RMSD) diagramja, amely azt méri, hogy az elfogadott modell szerkezetileg mennyire hasonlít a natív modellhez. A kapott energiadiagramtól jobbra és az RMSD-diagram alatt e két függvény eredményeit használják az energia és az RMSD ábrázolására, ahogy a modell fokozatosan finomodik.
Mint minden BOINC projekt, a Rosetta@home a háttérben fut a felhasználó számítógépén, a tétlen számítógépről származó áramot használva a gazdagép operációs rendszerén lévő fiókba való bejelentkezés közben vagy előtt . A program erőforrásokat szabadít fel a CPU-ból, ahogy más alkalmazásoknak szüksége van rájuk, ami nem befolyásolja a számítógép normál használatát. Számos programbeállítás állítható be a felhasználói fiók beállításain keresztül, beleértve: a program által felhasználható CPU-erőforrások maximális százalékos arányát (az energiafogyasztás szabályozására vagy az állandó teljesítményen működő számítógép hőtermelésére), a program futtatásának napszakát, és több más.
A Rosetta, a Rosetta@home hálózaton futó szoftvert átírták C++ nyelven, hogy könnyebben fejleszthető legyen, mint azt eredeti, Fortran nyelven írt verziója lehetővé tette. Ez az új verzió objektum-orientált, és 2008. február 8-án jelent meg. A Rosetta kód fejlesztését a Rosetta Commons végzi. A szoftver szabadon licencelhető a tudományos közösség számára, és térítés ellenében a gyógyszergyárak rendelkezésére áll.
A genomszekvenálási projektek elterjedésével a tudósok számos olyan fehérje aminosavszekvenciájára vagy elsődleges szerkezetére következtethetnek, amelyek funkciót töltenek be a sejtben. A fehérje működésének jobb megértéséhez és a racionális gyógyszertervezés elősegítéséhez a tudósoknak ismerniük kell a fehérje háromdimenziós harmadlagos szerkezetét.
A fehérjék háromdimenziós szerkezetét jelenleg kísérleti úton határozzák meg röntgenkrisztallográfiával vagy mágneses magrezonancia (NMR) spektroszkópiával. A folyamat lassú (hetekbe, sőt hónapokba is telhet, mire rájönnek, hogyan lehet először kristályosítani egy fehérjét) és költséges (fehérjénként körülbelül 100 000 dollár). Sajnos az új szekvenciák felfedezésének sebessége messze meghaladja a szerkezetmeghatározásét – a Nemzeti Biotechnológiai Információs Központ (NCBI) redukálatlan (nr) fehérjeadatbázisában elérhető több mint 7 400 000 fehérjeszekvencia közül kevesebb, mint 52 000 háromdimenziós fehérjeszekvencia található. A fehérjeszerkezeteket feloldották és a Protein Data Bankba helyezték el, amely a fehérjék szerkezeti információinak fő tárháza [6] . A Rosetta@home egyik fő célja a fehérjeszerkezetek előrejelzése a meglévő módszerekkel megegyező pontossággal, de lényegesen kevesebb időt és pénzt igénylő módon. A Rosetta@home emellett módszereket fejleszt a membránfehérjék szerkezetének és dokkolásának meghatározására (pl. G-protein-kapcsolt receptorok (GPCR)), amelyeket rendkívül nehéz hagyományos módszerekkel, például röntgenkrisztallográfiával és NMR-spektroszkópiával elemezni, de a modern drogok többségét jelentik.
A fehérjeszerkezet előrejelzésében elért előrehaladást a Critical Assessment for Protein Structure Prediction (CASP) kétévenkénti kísérletben mérik, amelyben a világ minden tájáról érkező kutatók egy fehérje aminosav-szekvenciájából próbálnak kideríteni a fehérje szerkezetét. A jól teljesítő csoportok ebben az időnként versengő kísérletben a de facto szabványnak tekinthetők a fehérjeszerkezet előrejelzésében. A Rosetta programot, amelyen a Rosetta @ home alapul, 2002-ben használták a CASP5-tel. A 2004-es CASP6 kísérletben Rosetta történelmet írt azzal, hogy elsőként ért el közel atomi felbontást ab initio fehérjeszerkezet előrejelzést bemutatott modelljében a CASP T0281 célponthoz. Az ab initio modellezést a fehérjeszerkezet előrejelzésének különösen nagy kihívást jelentő kategóriájának tekintik, mivel nem használja fel a szerkezeti homológiából származó információkat, és a szekvenciahomológiából és a fehérjén belüli fizikai kölcsönhatások modellezéséből származó információkra kell támaszkodnia. A Rosetta@home-ot 2006 óta használják a CASP-ben, ahol a CASP7 minden strukturális előrejelzési kategóriájában az egyik legjobb előrejelző volt. Ezeket a kiváló minőségű előrejelzéseket a Rosetta@home önkéntesei által biztosított számítási teljesítmény hajtotta végre. A növekvő számítási teljesítmény lehetővé teszi a Rosetta@home számára, hogy több konformációs térrégiót válasszon ki (a fehérjék lehetséges alakjait), amelyek a Levinthal-paradoxon szerint exponenciálisan növekednek a fehérje hosszával.
A Rosetta@home-ot fehérje-fehérje dokkolás előrejelzésében is használják, amely több komplex fehérje szerkezetét vagy kvaterner szerkezetét határozza meg. Ez a típusú fehérje kölcsönhatás számos sejtfunkciót érint, beleértve az antigén-antitest- és az enzim-inhibitor-kötést, valamint a sejtek importját és exportját. Ezen kölcsönhatások meghatározása kritikus fontosságú a gyógyszerfejlesztés szempontjából. A Rosetta-t a Critical Interaction Prediction Evaluation (CAPRI) kísérletben használják, amely egy fehérje dokkolómezőjének állapotát értékeli, hasonlóan ahhoz, ahogy a CASP a fehérjeszerkezet előrejelzésében méri az előrehaladást. A Rosetta@home projekt önkéntesei által biztosított számítási teljesítményt a Rosetta teljesítményének egyik fő hajtóerejeként említették a CAPRI-nál, ahol a dokkoló előrejelzései a legpontosabbak és legteljesebbek közé tartoztak.
2008 elején a Rosetta-t egy olyan fehérje számítási tervezésére használták, amelynek funkciója korábban nem volt látható a természetben. Ezt részben egy híres, 2004-es cikk rövidítése ihlette, amely eredetileg egy olyan fehérje számítási tervezését írta le, amely jobb enzimaktivitással rendelkezik a természetes formájához képest. David Baker csoportjának 2008-as kutatási cikke, amely leírja, hogyan készült a fehérje, amelyben a Rosetta@home az általa elérhetővé tett számítási erőforrásokra hivatkozik, fontos bizonyítéka ennek a fehérjetechnológiai módszernek az elgondolására. Az ilyen típusú fehérjetervezésnek a jövőbeni alkalmazásai lehetnek a gyógyszerkutatásban, a zöld kémiában és a bioremediációban.
A Rosetta szoftvercsomag egyik összetevőjét, a RosettaDesign-t használták annak pontos előrejelzésére, hogy az amiloidogén fehérjék mely régiói képeznek leginkább amiloidszerű fibrillákat. Egy érdeklődésre számot tartó fehérje hexapeptidjeinek (hat aminosav hosszú fragmentumának) felvételével és a legalacsonyabb energiájú egyezés kiválasztásával egy ismert fibrillumképző hexapeptid szerkezetéhez hasonló szerkezethez a RosettaDesign kétszer nagyobb valószínűséggel tudta azonosítani a peptideket, amelyek fibrillumot képeznek, mint a véletlenszerű fehérjék. . A Rosetta@home-ot ugyanabban a vizsgálatban használták a béta-amiloid szerkezetének előrejelzésére, amely egy olyan rostképző fehérje, amelyről úgy gondolják, hogy Alzheimer-kórt okoz. Előzetes, de még nem publikált eredmények születtek a Rosetta által kifejlesztett fehérjékről, amelyek megakadályozhatják a rostok képződését, bár nem tudni, hogy ezzel megelőzhető-e a betegség.
A Rosetta másik összetevőjét, a RosettaDock-ot kísérleti módszerekkel együtt alkalmazták három fehérje – a letális faktor (LF), az ödémafaktor (EF) és a protektív antigén (PA) – közötti kölcsönhatások modellezésére, amelyek az antrax toxint alkotják. A számítógépes modell pontosan megjósolta az LF és PA közötti dokkolást, segítve annak megállapítását, hogy a megfelelő fehérjék mely doménjei vesznek részt az LF-PA komplexben. Ezt a felfogást végül a kutatás során használták fel, ami jobb lépfene-vakcinákat eredményezett.
1-es típusú herpes simplex vírus
A RosettaDock-ot egy antitest (immunglobulin G) és a herpes simplex vírus 1 (HSV-1) által expresszált felszíni fehérje közötti dokkolás modellezésére használták, amely a vírusellenes antitest lebontására szolgál. A RosettaDock által megjósolt fehérjekomplex szorosan megegyezett a különösen nehezen beszerezhető kísérleti modellekkel, így a kutatók arra a következtetésre jutottak, hogy a dokkolási módszer megoldhat néhány olyan problémát, amelyet a röntgenkrisztallográfia a fehérje-fehérje interfészek modellezésében jelent.
A Bill & Melinda Gates 19,4 millió dolláros támogatásával finanszírozott kutatás révén. Amerikai Egyesült Államok, Rosetta@home számos lehetséges humán immundeficiencia vírus (HIV) vakcina kifejlesztéséhez használták.
A Great Challenges in Global Health kezdeményezéshez kapcsolódó kutatások során a Rosetta-t olyan új endonukleáz fehérjék kifejlesztésére használták, amelyek elpusztíthatják az Anopheles gambiae-t, vagy más módon képtelenné teszik a szúnyogot malária átvitelére. A fehérje-DNS kölcsönhatások specifikus modellezésének és megváltoztatásának képessége, mint például az endonukleázok kölcsönhatásai, fontos szerepet ad a számítási fehérje-mérnöki módszereknek, mint például a Rosetta a génterápiában (amely magában foglalja a lehetséges rákkezeléseket is).
A Rosetta@Home [7] projekt résztvevőinek hivatalos statisztikái alapján 2011 októberében az aktív résztvevők száma 38 ezer fő volt [8] . 2017 júliusában a projektnek körülbelül 300 000 aktív felhasználója volt [9] .
Önkéntes számítástechnikai projektek | |
---|---|
Csillagászat |
|
Biológia és orvostudomány |
|
kognitív |
|
Éghajlat |
|
Matematika |
|
Fizikai és műszaki |
|
Többcélú |
|
Egyéb |
|
segédprogramok |
|