A Cancer Genome Project a Sanger Institute kutatási projektje, amelynek célja olyan mutációk felkutatása , amelyek emberi rák kialakulásához vezetnek . A projektet Michael Stratton [1] indította el 2000-ben, és ő és kollégája, Peter Campbell [2] vezeti . A "Cancer Genome", mint a hasonló projekt, az " Atlas of the Cancer Genome " ( Eng. The Cancer Genome Atlas (TCGA) ) az Egyesült Államok Nemzeti Rákkutató Intézetében , célja a daganatos betegségek diagnosztizálásának, kezelésének és megelőzésének javítása a kutatások segítségével. fejlődésük molekuláris alapja [3] .
Nagy áteresztőképességű szekvenálási módszerekkel különböző típusú daganatok genetikai anyagát tanulmányozzák. Az eredményeket a Catalog of Somatic Mutations in Cancer (COSMIC) publikálják, amely a rákos sejtek genetikai változásairól elérhető legátfogóbb adatbázis [4] . 2019. május 4-én a 88. verzió 2019. március 19-én jelent meg [5] . Az adatbázist háromhavonta frissítik [4] .
A bostoni Massachusetts Általános Kórház Molekuláris Terápiás Központjával közösen a Cancer Genome fejleszti a rákgyógyszer-szűréssel kapcsolatos információkat tartalmazó adatbázist a Genomics of Drug Sensitivity in Cancer (GDSC) . Az együttműködés célja a rák kezelésének javítása a páciens daganatellenes gyógyszerre adott lehetséges válaszának előrejelzése alapján [6] .
A Cancer Genome Projecten dolgozó kutatócsoport a Sanger Institute portálján teszi közzé azokat a programjait, amelyeket a rákos genomokkal kapcsolatos adatokkal való munkavégzéshez fejlesztettek ki: BioView és AutoCSA (mutációk kimutatására szolgáló programok), Allélspecifikus másolatszám elemzése (ASCAT) ) és mások [7] . A projekt oldalán a kutatócsoport publikációi találhatók, amelyek többsége publikus [8] .
KOZMIKUS | |
---|---|
Tartalom | |
Leírás | A daganatok szomatikus mutációinak listája |
Kapcsolatok | |
Kutatóközpont | Sanger Intézet |
Kiadási dátum | 2004. február 4 |
Elérhetőség | |
Weboldal | http://cancer.sanger.ac.uk/cosmic |
A Catalog of Somatic Mutations in Cancer (COSMIC) az egyik legnagyobb és legátfogóbb online adatbázis a különböző típusú emberi rákos megbetegedésekhez kapcsolódó szomatikus mutációkról . Háromhavonta frissítik. 2019. május 4-én a 88. verzió 2019. március 19-én jelent meg [5] .
A rendszer feltöltése kétféleképpen történik. Az első a felügyelő szakértők által végzett kézi adatgyűjtés; a forrás lektorált publikációk, amelyekből a szakértők információkat választanak ki és beviszik a rendszerbe. A második a félautomata adatgyűjtés: a nagy rákgenomok és exomák nagy léptékű szűrésére vonatkozó adatokat a The Cancer Genome Atlas ( TCGA ) és az International Cancer Genome Consortium (ICGC) adatbázisaiból töltik be [4] .
A COSMIC által 2500 emberi rákos megbetegedésről felhalmozott információ alapján arra a következtetésre juthatunk, hogy a mutációk egy bizonyos típusú daganatnak felelnek meg. A COSMIC-ben bemutatott adatokat tudományos publikációk (körülbelül 20 000 PubMed cikk ) erősítik meg, amelyeket a kurátorok gondosan kiválasztottak (a publikációk körülbelül 30%-át elutasítják) [4] . A COSMIC-ban bemutatott összes adat több formátumban letölthető az oldalon való regisztrációt követően [9] .
Az adatbázis 2004. február 4-én indult, és négy génről tartalmazott információkat: HRAS, KRAS , NRAS és BRAF [10] . 2005 végére az adatbázis 529 génszekvenciát tartalmazott 115 327 daganatból, amelyek 20 981 mutációt tartalmaztak [11] . 2009 augusztusának végére a COSMIC 1,5 millió kísérlet adatait foglalta össze, amelyek több mint 90 000 mutációt írtak le 13 423 génben, közel 370 000 daganattípusban [12] . A COSMIC 2010 júliusában kiadott 48-as verziója 141 212 mutációt tartalmazott, amelyeket több mint 2,76 millió kísérletben azonosítottak több mint 50 000 tumortípusra [13] . A 70. verzió (2014. augusztus) már 2 002 811 pontmutációt tartalmazott több mint egymillió humán daganatot kódoló szekvenciában. Az ilyen típusú mutációk mellett a 70. verzió már több mint 6 millió mutációt írt le nem kódoló régiókban , 10 534 génfúziót, 61 299 genomiális átrendeződést, 695 504 kópia-torzult régiót és több mint 60 millió génexpressziós változást. [4] .
A COSMIC hozzáférést biztosít a rendszerben lévő összes adathoz. A rendszer számos eszközt tartalmaz: Cancer Browser, Genome Browser, GA4GH Beacon, CONAN [9] .
A Cancer Browser lehetővé teszi több mint 2500 ráktípus információinak elemzését. A szövet típusának (a 80-as verzióban 44 változat) és szövettanának kiválasztásával adatokat nyerhetünk a bennük lévő mutációk előfordulásáról. Például kaphat egy grafikont, amely bemutatja a rákos génszámlálás során a leggyakrabban mutált géneket és azok mutációs arányát, amely a mutációt mutató minták számának (kék színnel) és az elemzett minták számának (pirossal látható) aránya. ) [9] .
A Genome Browser lehetővé teszi az érdeklődésre számot tartó gén mutációira vonatkozó információk keresését. Így a p53 (TP53) transzkripciós faktor génre vonatkozóan a COSMIC 72. változata 104 011 egyedi minta elemzésén alapuló adatokat mutat be , és ezek közül 27 507 hordozta ennek a génnek a mutációját. 2213 PubMed -cikk is található leírásokkal és forráshivatkozásokkal [9] .
A GA4GH (Global Alliance for Genomics and & Health ) Beacon a COSMIC közösség általi genetikai adatokkal való ellátására szolgáló szolgáltatás [ 9] .
A CONAN egy eszköz a génkópiaszám-variációk elemzésére [9] .
A Cancer Gene Census tartalmazza a gének listáját (2019 májusában 723, 88-as verzió) [9] , ezek kapcsolatát a betegség kezdetével, a rákos sejtekben génműködési zavarokhoz vezető mutációk típusait, valamint a daganatok típusait. amelyekben ezek a mutációk megfigyelhetők [14] .
A jelöltek kiválasztása a rák kialakulásához vezető szomatikus mutációk mintáinak felkutatásával kezdődik. Ezt követően a szakirodalom alapos áttekintését végzik el, hogy azonosítsák a kiválasztott gén funkcióját és hatását a rák kialakulására. Ebben a szakaszban a gént onkogénnek , tumorszuppresszor génnek vagy mindkettőnek osztályozzák. Ha egy gén funkciója egy másik génnel való fúzió eredményeként nyilvánul meg, akkor fúziós génnek ( eng. fusion gene ) [14] jelöljük .
Attól függően, hogy egy génnek az onkogenezisben való részvétele mennyire bizonyított, a géneket két "szintre" ( eng. tiers ) sorolják. A Tier 1 (Tire 1) géneket olyan mutációs minták jellemzik, amelyek részvétele és funkciója a tumor etiológiájában határozottan bizonyítottnak tekinthető. Ahhoz, hogy egy gént Tier 1-be sorolhassunk, két független csoportból legalább két olyan publikációnak kell megjelennie, amelyek a gén szomatikus mutációját írják le legalább egy ráktípusban. A 2. szint (Tire 2) olyan géneket tartalmaz, amelyeknek a rák kialakulásában való részvételét kiterjedt irodalmi adatok igazolják, de nem áll rendelkezésre elegendő információ a mutáció következményeinek megerősítésére [14] .
A CGC legújabb verziója 723 gént tartalmaz (576 Tier 1, 147 Tier 2). Ebből 562-t onkogénként és/vagy onkoszuppresszorként határoztak meg, 132 ismeretlen funkciójú gén mutatja aktivitását fúzió eredményeként, 30 gént nem soroltak be egyik csoportba sem [14] .
A 86. frissítésben lehetőség nyílt a génnek a tumorfejlődésben való részvételének jellemzőire vonatkozó adatok megjelenítésére. A rövid szócikk magának a génnek a funkcióját és a rák tíz fő jellemzőjével való kapcsolatát írja le [14] .
A COSMIC-3D egy interfész a rákmutációk tanulmányozására egy fehérje háromdimenziós szerkezetében; először a COSMIC [5] 80. számában mutatták be , amelyet az Astex Pharmaceuticals -szal (Cambridge, Egyesült Királyság) közösen készítettek . Az eszköz több mint 8000 mutációval jelölt fehérje 3D-s megjelenítését mutatja be a COSMIC adatbázisból, valamint ezek gyakoriságát és hatását [9] .
A program elején a mutációt leképezzük az UniProt fehérjeszekvenciájára, majd a SIFTS UniProt-to-PDB segítségével a fehérje PDB szerkezetére. Ezenkívül a COSMIC-3D kereshet metszéspontokat egy rákot okozó mutáció helye, az ismert kis molekulakötő helyek és az fPocket által megjósolt gyógyszerkötő helyek között. A kapott adatok lehetővé tehetik olyan molekulák előállítását, amelyek specifikusan kötődnek mutált fehérjékhez [14] .
A COSMIC Cell Line Project több mint 1015 különböző rákos sejtvonal teljes exome szekvenálásáról tartalmaz információkat . Az exomákat közvetlenül a beérkezésük után, a közzététel előtt adják hozzá [4] . A COSMIC Cell Line Project alkalmazása lehetővé teszi a sejtvonalak értelmesebb kiválasztását a kutatáshoz és az eredmények jobb értelmezését [9] .
A rák gyógyszerérzékenységének genomikája (GDSC) a Cancer Genome Project további forrása, amely több mint 700 tumorsejtvonal több mint 140 rákellenes gyógyszerrel szembeni érzékenységéről, valamint a mutációk és a gyógyszerérzékenység közötti összefüggésről szolgáltat adatokat. [6] . A GDSC-nek jelentett adatokat a Sanger Institute és a bostoni Massachusetts General Hospital Molekuláris Terápiás Központja által a Cancer Genome Project által végzett nagy áteresztőképességű szűréssel állítottuk elő , több mint 1000 sejtvonal gyűjteményén. A szűrésre kiválasztott vegyületek közé tartoznak a klinikán való használatra engedélyezett és klinikai vizsgálatok alatt álló gyógyszerek, valamint a még fejlesztés alatt álló gyógyszerek. Ezek a vegyületek számos célpontra hatnak, beleértve a tirozin-kináz receptorokat, a sejtciklus- szabályozást és a DNS- károsodás válaszrendszerét érintő jelátviteli útvonalak összetevőit [15] .
A GDSC szerves jellemzője a rákgenomokra és a daganatsejtek gyógyszerekkel szembeni érzékenységére vonatkozó információk integrálása. A gyógyszerválasz előrejelzésére szolgáló markerek azonosítására két egymást kiegészítő analitikai megközelítést alkalmaznak [15] .
Az első megközelítés a többváltozós varianciaanalízis (MANOVA), az ANOVA módszer egy változata , amelyet a gyógyszerérzékenység (az IC50 és a dózis-válasz görbe meredeksége szerint ) és a sejtgenom változásai ( pontmutációk ) közötti összefüggés meghatározására használnak. , amplifikációk vagy géndeléciók stb.). Ugyanakkor minden gyógyszer-gén MANOVA párnál meghatározzuk a hatás jellegét és a kapcsolat statisztikai szignifikanciáját. Az adatok "Vulcano plot" formájában jelennek meg . A megjelenített körök mérete megfelel az elemzésre vett események számának. A kör fölé mozgatva információkat kapunk a minta méretéről (sejtvonalak száma), a hatásról (hányszor nő vagy csökken a gyógyszer iránti érzékenység) és a p-értékről [15] .
A második megközelítés a rugalmas nettó büntetés függvény használata. Az ezzel a büntetőfüggvénnyel elemzett adatok a MANOVA által szolgáltatottakon kívül genomszintű transzkripciós profilokat és szövettípusokat is tartalmaznak. Az elasztikus nettó függvény határozza meg egy adott sejtvonal adott gyógyszerválaszához ( IC50 érték) kapcsolódó jellemzőket. Az adatok "rugalmas nettó diagram" - hőtérkép és hisztogram - formájában jelennek meg. A hőtérkép a 20 legrezisztensebb és 20 legérzékenyebb sejtvonal mutációit jeleníti meg egy adott gyógyszerrel szemben. A térkép színei a kifejezést és a másolatszámot tükrözik (kék - alacsony, piros - magas). A hisztogram a mutációnak megfelelő gyógyszerrel szembeni érzékenység változását mutatja (növekedés - piros, csökkenés - zöld) [15] .
A Cancer Genome Project tagjai által végzett kutatások kiegészítik a tumortranszformációhoz vezető genommódosításokról felhalmozott tudást , lehetővé téve az előrejelzési, diagnosztikai és terápiai módszerek javítását. A munkák a különböző típusú daganatok tanulmányozására irányulnak. Ezen túlmenően folyamatban van a rák markereinek felkutatása és a modellszervezetek kutatására szolgáló rendszerek fejlesztése [3] .
A Cancer Genome Project egyik munkaterülete a mellrák vizsgálata . Így a 21. típusú emlőrák szomatikus mutációinak elemzése olyan régiók jelenlétét tárta fel, ahol a mutációk gyakoribbak (egy ilyen régiót "kataegis"-nek neveztek). Ezek a régiók szomatikus átrendeződésekkel kolokalizálódtak, és ezekben a régiókban a szubsztitúciók szinte mindig a citozin TpC dinukleotidokért felelősek. E jelenség alapjául az APOBEC citidin-deaminázok családjának képviselőinek munkáját javasolták [16] . További tanulmányok alátámasztották ezt a hipotézist, kimutatva, hogy az APOBEC3B deléciós emlőrák típusait nagyszámú mutáció jellemzi a kataegis régiókban [17] .
A pontmutációk és a génkópiaszám-variációk elemzése 100 típusú mellrák esetében számos rendellenességet tárt fel a genomban, különösen 9 új gént (AKT2, ARID1B, CASP8, CDKN1B , MAP3K1, MAP3K13, NCOR1, SMARCD1 és TBX3) kapcsoltak össze. ez a fajta rák [18] . Ugyanakkor a MAP3K1, MAP2K4, MAP3K13 és AKT2 gének mutációi megzavarják a JUN jelátviteli útvonal aktivációját, amelynek aktivitásának csökkenését az emlőrák típusok több mint 50%-ánál kimutatták [19] . Számos gén (ARID1B, CASP8, MAP3K1, MAP3K13, NCOR1, SMARCD1 és CDKN1B ) mutációinál a csonkolt fehérjeizoformák fokozott expresszióját találták, ami arra utal, hogy ezeknek a fehérjéknek az eredeti formái a transzformációk kifejlődésének szuppresszorai lehetnek. . Ezenkívül összefüggést mutattak ki az ösztrogénreceptorok csökkent expressziója és a mutációk életkor előrehaladtával felgyorsult felhalmozódása között [18] .
Körülbelül 3500 gén szűrése számos új gént tárt fel, amelyek mutációi a vese hypernephroid daganatának, a veserák ritka típusának kialakulásához vezetnek . E gének közé tartozik az UTX (KDM6A) [20] és JARID1C (KDM5C) demetiláz, valamint a SETD2 metiláz gén [21] . Ezek az enzimek módosítják a kulcsfontosságú H3 hiszton lizin-maradékokat , befolyásolva a kromatin szerkezetét és a géntranszkripciót. Ugyanakkor ezek a mutációk az esetek kevesebb mint 15%-ában vannak jelen a vese hypernephroid daganatának kialakulásában, ami még nem azonosított gének létezésére utal. Az újabb exome szekvenálási kísérletek a PBRM1 gént, a kromatin átrendeződésekért felelős SWI/SNF komplex egyik komponensét azonosították az egyik legfontosabb génként, amelynek mutációi az esetek 41%-ában vese hypernephroid tumorokhoz vezetnek [22] .
Az NCI- H209 kissejtes tüdőrák sejtvonal szekvenálási eredményei 22 910 szomatikus szubsztitúciót mutattak ki , ebből 132 a dohányzással összefüggő kódoló régiókban . Ugyanakkor a CHD7 3-8. exonjainak megkettőződését mutatták ki az NCI-H209 sejtvonal esetében, és a PVT1 és CHD7 gének fúzióját mutatták ki a kissejtes tüdődaganat másik két vonalánál , ami együttesen a mutációkra utal. a CHD7 génben hozzájárulnak a betegség kialakulásához [23] .
Kimutatták, hogy a hasnyálmirigyrákot különféle átrendeződések jellemzik, amelyek a telomerek diszfunkciójához és a sejtciklus szabályozásának megzavarásához vezetnek , különösen a G1 fázisból az S fázisba való átmenet meghibásodásához. Ez kiváltja az onkogének amplifikációját , ami túlnyomórészt a betegség kialakulásának korai szakaszában fordul elő [24] .
A kutatócsoport fontos munkaterülete a rák egyik leggyakoribb típusának, a vastagbélráknak (kolorektális karcinóma) vizsgálata [8] .
A különböző genetikai változások kombinációinak száma nem teszi lehetővé az egyes potenciális gének tumorfejlődéshez való funkcionális hozzájárulásának feltárását. Ezért annak ellenére, hogy az egyes daganatok genomiális változásainak meghatározása nagy pontossággal és viszonylag alacsony költséggel lehetséges, ezek az adatok nehezen értelmezhetők a betegség kialakulásának előrejelzése és a megfelelő gyógyszerek megtalálása szempontjából, ehhez egy modellrendszer megléte szükséges a genotípus-fenotípus korreláció elemzésére. Ilyen modellrendszerként a háromdimenziós organoidok szolgálhatnak . Ebben a vizsgálatban 20 kolorektális karcinómában szenvedő beteg organoid tenyészetét vettük Lgr5 őssejtek felhasználásával (kriptákban). Kimutatták, hogy a genetikai változások spektruma, valamint a génexpresszió elemzése az organoidban összhangban van magában a daganatban tapasztaltakkal. Ezenkívül az organoid alkalmas gyógyszerszűrésre. Példaként a sertésinhibitor RNF43 gén mutánsaira gyakorolt hatását adták meg, aminek következtében a mutáns növekedése leállt [25] .
Az intratumorális diverzitás természetének tisztázása érdekében három különböző kolorektális karcinóma tumorból származó számos egyedi sejtből, valamint kripta őssejtekből származó organoidokat jellemeztünk. Kimutatták, hogy minden rákos sejtben a szomatikus mutációk száma többszöröse, mint a normál sejtekben, és a mutációk többsége a rák végső klonális expanziója során keletkezett, olyan folyamatok révén, amelyek a normál sejtekben hiányoznak. Az intratumorális sejtek transzkriptómáiban és metilómáiban is különbségeket figyeltek meg. Ezek a különbségek abban nyilvánulnak meg, hogy még a közeli rokon sejtek is eltérő választ adnak a rákellenes gyógyszerekre [26] .
A GDSC-nek jelentett adatok elemzése számos lehetséges biomarkert azonosított terápiás felhasználásra. A TP53 mutációkról kimutatták, hogy korrelálnak a nutlin-3a-val, az MDM2 p53 ubiquitin ligáz inhibitorával szembeni rezisztenciával . A CCND1 (CyclinD1) amplifikációja vagy az SMAD4 elvesztése az EGFR család számos inhibitorával , például a lapatinibbel szembeni túlérzékenységgel jár együtt . Az SMAD4 elvesztését az EGFR fokozott expressziója kísérte. Az STK11, egy mTOR -represszor inaktiválása korrelált a HSP90 hősokk-fehérje inhibitorral , a 17-AAG-val szembeni fokozott érzékenységgel. Ezen túlmenően, az EWS- FLI1 transzlokáció azonosítása a PARP -inhibitorokkal szembeni érzékenység markereként, Ewing-szarkómasejtekben az ilyen jellegű vegyületekkel szembeni fokozott érzékenységet figyeltek meg , ami új módszereket javasol a betegség leküzdésére [15] .
A Caenorhabditis elegans orsóféreg , egy széles körben használt modellszervezet , kísérleti rendszerként javasolták a rákkeltő anyagok hatásainak és a DNS-javító rendszer hibáinak tanulmányozására . 183 C. elegans populáció 17 fajta genetikai hátterű ( vad típusú és knockout génekkel rendelkező egyedek DNS-javító és DNS-károsodás válaszrendszerek) teljes genom szekvenálását végezték el, melynek eredményeként 1559 szubsztitúció, 406 inszerció és 281 genomiális átrendeződés. azonosították. A kapott eredményeket összehasonlították a humán karcinogenezisről felhalmozott adatokkal [27] .
Elemezték az olyan karcinogének , mint az aflatoxin B1, a klórmetin és a ciszplatin C. elegansra gyakorolt hatását . Érdekes módon a ciszplatin mutagén tulajdonságai az xpf-1 mutánsokban voltak a legkifejezettebbek, ami arra utal, hogy ez a gén fontos szerepet játszik a sejtek védelmében ettől a DNS-károsító szertől. Általánosságban elmondható, hogy a kísérletek eredményei megfeleltek a szóban forgó rákkeltő anyagok hatásáról korábban ismert adatoknak , bizonyítva a kísérleti rendszer alkalmazásának lehetőségét kevésbé vizsgált anyagok tanulmányozására. Több mint 240 vegyületet tekintenek potenciális rákkeltőnek . A cselekvésükről felhalmozott információ azonban nem elegendő, ennek megszerzésére egy kísérleti rendszer használata kényelmes [27] .
A nyelőcső epiteliális sejtek genomjának elemzése azt mutatta, hogy egyes mutációk a hám feldúsulásához vezetnek mutált sejtek klónjaival. Így a NOTCH1 gén mutánsai, amelyek az érintkező sejtek kölcsönhatásáért felelősek, a középkorú és idősebb emberek hámsejtjeinek akár 80%-át, a TP53 gén mutánsai pedig akár 37%-át is alkothatják. Hasonló eredményeket kaptak mindössze 14, a rákos degenerációban szerepet játszó mutációnál. Ugyanakkor a NOTCH1 mutánsok gyakorisága egészséges emberekben magasabb volt, mint a nyelőcsőrákban szenvedő betegeknél. Ez arra utal, hogy egyes mutációk gyors klonális szaporodáshoz vezethetnek, de csökkentik a rákos degeneráció esélyét [28] .
A prosztata 112 primer és metasztatikus daganatának szekvenálásának eredménye 22 új gén felfedezéséhez vezetett, amelyek rák kialakulásához vezetnek. Ezen kívül 2 további, a prosztatarákhoz kapcsolódó, nem fehérjét kódoló régiót találtak. Azt is tisztázták, hogy milyen sorrendben fordulnak elő ezek a mutációk a fejlődő daganatokban. A felfedezett és már ismert mutációk elemzése kimutatta, hogy ezek közül 11 a meglévő gyógyszerek célpontja, 7 a klinikai vizsgálatok alatt álló gyógyszerek célpontja, 13 a gyógyszerek kutatása és fejlesztése, 49 pedig potenciálisan jövőbeli gyógyszerek célpontja lehet [29] .
A CRISPR-Cas rendszer által okozott torzulások pontosabb felmérése a gének kiütéssel történő elemzésére, egy új algoritmus, a CRISPRcleanR készült. Figyelembe vették a logFC szisztematikus alulbecslését a vezető RNS-célpontok sok másolatát tartalmazó régiókban, valamint néhány egyéb eltérést. Az új algoritmus csökkenti a hamis pozitív arányt, miközben a valódi pozitív arányt változatlan marad [30] . A CRISPRcleanR szabadon elérhető R csomagként [31] és Python csomagként [32] .