A DNS-elemek enciklopédiája

Az oldal jelenlegi verzióját még nem ellenőrizték tapasztalt hozzászólók, és jelentősen eltérhet a 2017. február 10-én felülvizsgált verziótól ; az ellenőrzések 17 szerkesztést igényelnek .
KÓDOL
Tartalom
Leírás Teljes genom adatbázis
Kapcsolatok
Kutatóközpont Kaliforniai Egyetem, Santa Cruz
Laboratórium Biomolekuláris Tudományos és Műszaki Központ
A szerzők Brian J Raney [1]
Eredeti kiadvány PMID 21037257
Kiadási dátum 2010
Elérhetőség
Weboldal encodeproject.org

A DNS- elemek enciklopédiája ( ENCODE  ) egy 2003 szeptemberében létrehozott nemzetközi kutatókonzorcium . Az US National Human Genome Research Institute ( NHGRI ) által szervezett és finanszírozott [1] [2] [3] . A Human Genome Project folytatásaként kialakított ENCODE célja az emberi genom funkcionális elemeinek teljes körű elemzése . A projekt végrehajtása során elért összes eredmény nyilvános adatbázisokban kerül közzétételre .  

2012. szeptember 5-én a projekt első eredményeit 30, egymással összefüggő publikáció formájában tették közzé a „ Nature ”, „ Genome Biology ” és „ Genome Research ” folyóiratok honlapján [4] [ 5] . Ezek a publikációk azt mutatják, hogy az emberi genom legalább 80%-a biológiailag aktív, addig az a felfogás uralkodott , hogy a legtöbb DNS „ szemét ” volt. Az ilyen elhamarkodott következtetéseket azonban számos tudós bírálja, rámutatva, hogy hiányzik a szükséges bizonyíték ezen elemek működőképességére [6] .

Relevancia

A becslések szerint az emberi genom 20 000 fehérjét kódoló gént tartalmaz (együtt alkotják az exomot ), és ezek az emberi genom DNS -ének csak körülbelül 1,5%-át teszik ki. Az ENCODE projekt elsődleges célja a genom többi részének funkciójának meghatározása, amelyek többségét hagyományosan " szemétnek " tekintették (például a nem átírt DNS-t ).

Az emberi genomban előforduló egynukleotidos polimorfizmusok hozzávetőleg 90% -a (amelyekről kimutatták, hogy különböző betegségekhez kapcsolódnak a genomszintű asszociációs vizsgálatok alapján) a fehérjét kódoló régiókon kívül találhatók. [7]

A fehérjét kódoló gének aktivitását és expresszióját szabályozhatják a regulomok - a DNS különböző elemei, mint például a promoter , a szabályozó szekvenciák és a kromatin régiók , valamint a hiszton módosítások . Úgy gondolják, hogy a szabályozó régiókban bekövetkezett változások megzavarhatják a fehérje expresszióját és a sejtműködést, és így betegségekhez vezethetnek ( ENCODE Project Background ). A szabályozó elemek elhelyezkedésének és transzkripcióra gyakorolt ​​hatásának meghatározásával lehetővé válik az egyes gének expressziós szintjének változása és a betegségek kialakulása közötti kapcsolat tisztázása. [nyolc]

Az ENCODE célja, hogy átfogó forrás legyen, amely lehetővé teszi a tudományos közösség számára, hogy jobban megértse, hogyan befolyásolhatja a genom az emberi egészséget, és ösztönözheti a betegségek megelőzésének és kezelésének új módszereinek kidolgozását. [9]

A projekt a mai napig új DNS-szabályozó elemek felfedezésében segít, új betekintést ad génjeink és genomunk szerveződésébe és szabályozásába, valamint azt, hogy a DNS-szekvencia változásai hogyan befolyásolhatják a betegségek kialakulását. [7] A projekt egyik fő eredménye annak leírása, hogy az emberi genom 80%-áról kimutatták, hogy legalább egy biokémiai funkcióhoz kapcsolódik. [10] [11] Ennek a nem kódoló DNS-nek a nagy része a kódoló gének expressziójának szabályozásában vesz részt. [10] Ezenkívül az egyes kódoló gének expresszióját számos, a gén közelében és attól távol elhelyezkedő szabályozó régió szabályozza. Ezek az eredmények azt mutatják, hogy a génszabályozás sokkal összetettebb, mint azt korábban gondolták. [12]

Projekt ENCODE

Az ENCODE projekt három szakaszban valósul meg: a kezdeti szakaszban, a technológiafejlesztési szakaszban és a termelési szakaszban.

A kezdeti szakaszban az ENCODE konzorcium értékelte a különböző típusú genomelemek azonosítására szolgáló stratégiákat . A kezdeti szakasz célja egy olyan eljáráskészlet meghatározása volt, amely együttesen lehetővé teszi az emberi genom nagy régióinak pontos és részletes jellemzését , figyelembe véve a folyamat gazdasági életképességét és nagy hatékonyságát. A kezdeti szakasz a funkcionális sorozatok meghatározásához szükséges eszközkészlet hiányosságainak azonosítása volt, valamint annak kimutatása, hogy valamelyik alkalmazott módszer nem bizonyult-e hatékonynak vagy alkalmatlannak a méretnövelésre. E problémák egy részét az ENCODE technológia fejlesztési szakaszában (a projekt kezdeti szakaszával párhuzamosan) kellett megoldani, amelynek célja olyan új laboratóriumi és számítási módszerek kifejlesztése volt, amelyek javítják az ismert funkcionális szekvenciák azonosítását vagy újak tanulmányozását. a genom funkcionális elemei. Az első két szakasz eredménye, a humán genom 1%-ának tanulmányozásának példáján, meghatározta a legjobb módszert a fennmaradó 99% maximális hatékonysággal és legalacsonyabb költséggel történő elemzésére a termelési fázisban. [9]

Az ENCODE projekt I. fázisa: kezdeti fázis

A kísérleti szakaszban a meglévő módszerek kutatását és összehasonlítását végezték el az emberi genom szekvencia egy bizonyos szakaszának alapos elemzésére. Nyílt konzorciumként szervezték meg, és különböző hátterű és hátterű kutatókat hozott össze, hogy egy változatos halmazból értékeljék az egyes technikák, technológiák és stratégiák érdemeit. Ugyanakkor a projekt technológiai fejlesztési szakaszának célja új, rendkívül hatékony funkcionális elemek meghatározására szolgáló módszerek kidolgozása volt. E munka célja egy olyan megközelítési mód meghatározása volt, amely lehetővé teszi az emberi genom összes funkcionális elemének legpontosabb meghatározását. A kezdeti szakaszban meghatározták, hogy a különböző módszerek mennyire képesek a teljes emberi genom elemzésére, és azonosították a genomszekvencia funkcionális elemeinek meghatározásában lévő hiányosságokat.

A projekt kezdeti szakasza a kísérletezők és a teoretikusok szoros együttműködésében zajlott, ami lehetővé tette számos módszer értékelését az emberi genom annotálására. A projekt kezdeti szakaszában az emberi genom körülbelül 1%-át (30 Mb) képviselő régiók halmazát választották ki, és a projekt kísérleti szakaszában minden résztvevő elemezte. Az ENCODE résztvevői által ezekről a régiókról szerzett összes adatot gyorsan közzétettük nyilvános adatbázisokban. [13] [14]

Az I. fázis eredményei [13]
  • A humán genom mindenütt átíródik, így a legtöbb bázis legalább egy elsődleges transzkriptumhoz kapcsolódik, és sok transzkriptum disztális régiókat társít specifikus fehérjét kódoló lókuszokhoz.
  • Számos új, nem fehérjét kódoló transzkriptumot azonosítottak, amelyek közül sok átfedi a fehérjét kódoló lókuszokat és más lókuszokat, amelyek a genom olyan régióiban helyezkednek el, amelyeket korábban transzkripciós szempontból csendesnek tekintettek.
  • Számos korábban fel nem ismert transzkripciós starthelyet azonosítottak, amelyek közül sok a jól jellemzett promóterekhez hasonló kromatin szerkezetet és fehérjeszekvencia-specifikus kötődési tulajdonságokat mutat.
  • A transzkripció kezdőhelyeit körülvevő szabályozó szekvenciák szimmetrikusan oszlanak el, és nincs eltolódás a fedő régiók felé.
  • A kromatin elérhetősége és a hiszton módosulási mintázatok nagymértékben megjósolják a transzkripciós kezdőhelyek jelenlétét és aktivitását.
  • A disztális hiperszenzitív DNázI helyek jellegzetes hisztonmódosítási mintázattal rendelkeznek, amelyek megbízhatóan megkülönböztetik őket a promóterektől.
  • A DNS replikációs ideje korrelál a kromatin szerkezetével.
  • A genomban található bázisok összesen 5%-a biztosan azonosítható emlősökben evolúciós korlátozások alatt állóként; ezeknek a korlátozott bázisoknak körülbelül 60%-ára van bizonyíték a működésre az eddig elvégzett kísérleti elemzések alapján.
  • A különböző funkcionális elemek szekvencia-variabilitásukat tekintve nagymértékben különböznek az emberi populációban, és attól, hogy a genom egy szerkezetileg variábilis régiójában vannak-e.
  • Meglepő módon úgy tűnik, hogy sok funkcionális elem nem korlátozódik az emlősök evolúciójára. Ez arra utal, hogy nagyszámú semleges elem létezik, amelyek biokémiailag aktívak, de nem nyújtanak túl sok előnyt a szervezet számára. Ez a medence „raktárként” szolgálhat a természetes szelekció számára, potenciálisan származásspecifikus elemek és funkcionálisan megőrzött, de nem ortológ elemek forrásaként a fajok között.

Az ENCODE projekt II. fázisa: produktív szakasz

2007 szeptemberében megkezdődött az ENCODE projekt produktív szakaszának finanszírozása. Ebben a szakaszban a teljes genom elemzése volt a cél, és "további vizsgálatok ipari körülmények között" [15] .

A produktív szakasz munkáját a kezdeti szakaszhoz hasonlóan nyitott konzorciumként szervezték meg. 2007 októberében a National Institute for Human Genome Research 4 évre összesen több mint 80 millió dollár támogatást ítélt oda. [16] A termelési szakaszban a projekt magában foglalta az Adatkoordinációs Központot, az Adatelemző Központot és a Technológiai Fejlesztési Központot. [17] Jelenleg a projekt egy igazán hatalmas vállalkozássá válik, amelyben 440 tudós vesz részt a világ 32 laboratóriumából. 2007-ben, amikor a kezdeti szakasz befejeződött, a projekt nagyrészt a következő generációs szekvenálásnak köszönhetően növelte a kapacitást . Valóban rengeteg adatot dolgoztak fel, a kutatók körülbelül 15 terabájtnyi nyers információt kaptak.

2010-re az ENCODE projekt több mint 1000 genomszintű adatkészletet kapott. Összességében ezek az adatok azt mutatják, hogy mely régiók szabályozzák bizonyos sejttípusokban használt gének expresszióját, és mely régiók lépnek kölcsönhatásba a fehérjék széles skálájával. A projekt információkat nyújt a transzkripciós helyekről, a hozzájuk tartozó transzkripciós faktorokról, a kromatin szerkezetéről és a hiszton módosulásairól.

fázis eredményei [18]
  • Az emberi genom túlnyomó többsége (80,4%) legalább egy sejttípusban részt vesz legalább egy RNS-sel és/vagy kromatinnal kapcsolatos biokémiai eseményben. A genom nagy része szabályozási események közelében található: a genom 95%-a a DNS-fehérje kölcsönhatástól 8 kilobázison belül van (a ChIP-seq motívumanalízissel vagy a DNáz I kötődéssel mérve), és 99%-a a legalább 1,7 kilobázison belül van. az egyik az ENCODE által bemutatott biokémiai eseményekből.
  • A genom hét kromatin állapotba való besorolása 399 124 enhanszer-szerű jellemzőkkel és 70 292 promoter-szerű jellemzőkkel rendelkező régióból, valamint több százezer nem mozgó régióból álló kezdeti halmazra utal. A nagy felbontású elemzés tovább osztja a genomot több ezer keskeny állapotra, amelyek eltérő funkcionális tulajdonságokkal rendelkeznek.
  • Az RNS-szekvencia létrehozása és feldolgozása kvantitatívan korrelálható mind a kromatin-jelekkel, mind a transzkripciós faktor (TF) promótereken való kötődésével, ami azt jelzi, hogy a promóter funkcionalitása felelős az RNS-expresszió változásaiért.
  • Az egyes genomszekvenciákban számos nem kódoló variáns található az ENCODE-jelöléssel ellátott funkcionális régiókban; ez a szám legalább olyan magas, mint a fehérjéket kódoló gének.
  • A GWAS által a betegséggel kapcsolatos SNP-k nem kódoló funkcionális elemekben gazdagok, amelyek többsége bizonyos ENCODE által meghatározott régiókban vagy azok közelében található, a fehérjét kódoló géneken kívül. Sok esetben a betegség fenotípusa egy adott sejttípushoz vagy transzkripciós faktorhoz köthető.
  • ENCODE Konzorcium

Az ENCODE Konzorcium elsősorban tudósokból áll, akiket az Egyesült Államok Nemzeti Humán Genom Kutatóintézete támogat . A projekt további résztvevői a Konzorcium vagy az Elemző Munkacsoport tagjai.

A projekt kezdeti szakasza nyolc tanulmányi csoportból és tizenkét csoportból állt, amelyek részt vettek az ENCODE projekt technológiai fejlesztési szakaszában ( ENCODE Pilot Project: Participants and Projects ). 2007 végére, amikor a projekt kísérleti szakasza hivatalosan is véget ért, a résztvevők száma 440 tudósra nőtt a világ 32 laboratóriumából. Jelenleg a konzorcium különböző központokból áll, amelyek különböző feladatokat látnak el ( ENCODE résztvevők és projektek ):

  1. Gyártóközpontok (ENCODE termelési központok)
  2. Adatkoordinációs központ (ENCODE adatkoordinációs központ)
  3. Adatelemző központ (ENCODE adatelemző központ)
  4. Az eredmények számítási elemzése (ENCODE Computational Analysis Awards)
  5. Technológiai fejlesztés (ENCODE Technology Development Effort)

Bemutatott adatok

2007 óta az ENCODE projekt résztvevői számos, különböző biológiai szekvenciákon alapuló tanulmányt végeztek az emberi genom funkcionális elemeinek feltérképezésére [19] . A feltérképezett elemek (és az alkalmazott megközelítések) magukban foglalják az RNS-transzkripciós régiókat (RNS-seq, CAGE, RNS-PET és manuális annotáció), fehérjekódoló régiókat (tömegspektrometria), transzkripciós faktor kötőhelyeket (ChIP-seq és DNáz-seq), kromatin szerkezete (DNáz-seq, FAIRE-seq, hiszton ChIP-seq és MNase-seq) és DNS-metilációs helyekre (RRBS-analízis). Az alábbiakban a projekt résztvevői által a munkája során szerzett és a projekt honlapján bemutatott adatok részletes leírása található.

Átírt és fehérjét kódoló régiók

A projekt manuális és automatizált annotációval létrehozta a humán fehérjét kódoló és nem kódoló RNS-ek és pszeudogének átfogó katalógusát, GENCODE néven. [20] [21] A katalógus 20 687 fehérjét kódoló gént tartalmaz, amelyekből lókuszonként átlagosan 6,3 alternatív splicing van.

Ezenkívül 8801 automatikusan generált kis RNS-t és 9640 manuálisan kurált hosszú, nem kódoló RNS-t (lncRNS) annotáltak. Az lncRNS-ek összehasonlítása más ENCODE-adatokkal azt mutatja, hogy az lncRNS-ek a fehérjét kódoló génekhez hasonló útvonalon keresztül keletkeznek. [22] A GENCODE projekt 11 224 pszeudogént is jegyzett, amelyek közül 863 átíródik, és aktív kromatinhoz kapcsolódik. [23]

RNS

  • Az RNS -eket 16 különböző sejtvonalból és több szubcelluláris frakcióból szekvenálták, hogy kidolgozzák az RNS-expresszió kiterjedt katalógusát. Feltételezve, hogy konzervatív küszöbértéket használnak az RNS-aktivitás régióinak azonosítására, a genomi bázisok 62%-a reprodukálhatóan szekvenált hosszú (>200 nukleotid) RNS-molekulákban vagy GENCODE-exonokban van jelen.
  • A CAGE-seq (5' cap target RNS izolálás és szekvenálás) módszert 62 403 transzkripciós starthely (TSS) azonosítására használtuk nagy biztonsággal (IDR 0,01).
  • Végül a kódoló és nem kódoló transzkriptumok jelentős részét találták, amelyeket 200 nukleotidnál rövidebb, tartósan stabil RNS-ekké dolgoztak fel. Ezek a prekurzorok magukban foglalják a transzfer RNS-t, a miRNS -t , a kis nukleáris RNS-t és a kis nukleoláris RNS-t ( tRNS , miRNS , snRNS és snoRNS).

Fehérjekötő helyek

A szabályozó régiók közvetlen azonosítása érdekében a projekt résztvevői 119 különböző DNS-kötő fehérje és számos RNS polimeráz komponens kötőhelyét térképezték fel 72 sejttípusban ChIP-seq segítségével. [24] Minden kötőhelyet megvizsgáltak az ismert DNS-kötő motívumok feldúsulására és új motívumok jelenlétére.

A genom DNáz I-re túlérzékeny régiói

A kromatin hozzáférhetősége, amelyet a DNáz I túlérzékenység jellemez, a DNS-szabályozó régiók egyik jellemzője. [25] [26] A projekt résztvevői 2,89 millió egyedi, nem átfedő DNáz I túlérzékenységi (DHS) helyet térképeztek fel DNáz-seq segítségével 125 sejttípusban.

Hisztonmódosító helyek

12 hiszton módosulat kromoszómális elhelyezkedését elemeztük 46 sejttípusban. A kapott adatok azt mutatják, hogy a globális módosulási mintázatok nagymértékben változnak a különböző sejttípusok esetében a transzkripciós aktivitás változásainak megfelelően. Azt találtuk, hogy a különböző hisztonmódosítási információk integrálása szisztematikusan felhasználható funkcionális attribútumok genomiális régiókhoz való hozzárendelésére. [27]

DNS-metiláció

A citozin- metiláció (általában a CpG-dinukleotidoknál) részt vesz a génexpresszió epigenetikai szabályozásában. A promóter metilációja gyakran represszióval, míg a génmetiláció a transzkripciós aktivitással korrelál. [28] A projekt résztvevői a Restricted Genomic Loci Set Bisulfite Sequencing (RRBS) módszert használták a DNS-metiláció kvantitatív profilálására átlagosan 1,2 millió CpG esetében mind a 82 sejtvonalban és szövetben, beleértve a proximális promoterek és azon belüli régiók intergénikus régióiban található CpG-ket is. egy gén (géntestek). [29]

A kromoszóma-kölcsönhatások helyszínei

A kromoszómák több száz kilobázissal elválasztható egyes régiói közötti fizikai kölcsönhatásokat fontosnak tartják a génexpresszió szabályozásában 46. Az 5C módszer hosszú távú kölcsönhatásokat tárt fel a transzkripciós starthelyekkel (TSS) a megcélzott 1%-ban. a genom (44 ENCODE pilot régió) négy sejttípusban (GM12878, K562, HeLa-S3 és H1 hESC) 49. Több száz statisztikailag szignifikáns hosszú távú kölcsönhatást találtunk minden sejttípusban, miután figyelembe vettük a kromatin polimer viselkedését és a kísérleti eltéréseket. A kölcsönható lókuszok párjai erős korrelációt mutattak a TSS génexpresszió szintje és a funkcionális elemek bizonyos osztályai, például az enhanszerek jelenléte között . A TSS-sel kölcsönhatásba lépő disztális elemek átlagos száma 3,9, a távoli elemmel kölcsönhatásba lépő TSS átlagos száma 2,5 volt, ami az összekapcsolt kromatin komplex hálózatát jelzi. Ezt az összefonódó „hosszú hatótávolságú” architektúrát a genomban a kromatinkölcsönhatás-elemzés és a páros végjel-szekvenálás ( ChIA-PET ) segítségével is feltárták, amelyet az RNS-polimeráz II-vel (Pol II) dúsított kromatin kölcsönhatásainak kimutatására használnak öt sejttípusban. [harminc]

Kritika

Annak ellenére, hogy a konzorcium azt állítja, hogy az ENCODE projekt még korántsem ért véget, a már megjelent cikkekre és sajtóvisszhangra a visszhang pozitív volt. A Nature folyóirat szerkesztői és az ENCODE projekt szerzői ezt írják: "... hosszú hónapok óta együttműködünk, hogy a lehető legnagyobb feltűnést hozzuk létre, amely nemcsak a tudományos közösség, hanem a nagyközönség figyelmét is felkelti." ("... sok hónapon keresztül együttműködött, hogy a lehető legnagyobb feltűnést keltse, és ne csak a kutatói közösség, hanem a nagyközönség figyelmét is felkeltse"). [31] Az ENCODE projekt állítása, miszerint az emberi genom 80%-ának biokémiai funkciója van [10] , gyorsan átvették a népszerű tudományos publikációk, amelyek a projekt eredményeit úgy jellemezték, hogy a „szemét” DNS halálát okozzák. . [32] [33]

Mindazonáltal azt a következtetést, hogy a genom nagy része „működőképes”, bírálták azon az alapon, hogy az ENCODE projekt túlságosan tágan határozza meg a „funkcionalitást”, nevezetesen, hogy mindennek, ami egy sejtben átíródik, van funkciója. Ezt a következtetést annak az általánosan elfogadott nézetnek a ellenére tették le, hogy a DNS számos eleme, amely átíródik , mint például a pszeudogén , ennek ellenére nem működik. Ezenkívül az ENCODE projekt inkább az érzékenységet hangsúlyozta, mint a specifikusságot, ami sok hamis pozitív eredményhez vezetett . [34] [35] [36] A sejtvonalak és a transzkripciós faktorok kissé önkényes megválasztása , valamint a szükséges kontrollkísérletek hiánya az ENCODE komoly kritikájának további forrásává vált, mivel egy véletlenszerű DNS-molekula utánozhat egy ilyen "funkcionális" viselkedés az ENCODE értelmezésekben. [37]

Válaszul ezekre a kritikákra, azt állították, hogy a legtöbb genom - transzkripció és splicing , ahogyan az embereknél látható, pontosabb mutatója a genetikai funkciónak, mint a szekvencia-konzervativizmus. Ezen túlmenően, a legtöbb "szemét" DNS részt vesz az epigenetikai szabályozásban , és szükséges előfeltétele volt az összetett organizmusok fejlődésének. [38] A „funkcionális” szó meghatározásával kapcsolatos észrevételekre válaszolva sokan megjegyezték, hogy ebben az esetben a vita a meghatározás különbségére vonatkozik, nem pedig a projekt lényegére, vagyis arra, hogy adatokat szolgáltasson a biokémiai anyagok későbbi vizsgálataihoz. a nem fehérjét kódoló DNS-régiók aktivitása. Míg a definíciók fontosak, és a tudomány a nyelvre korlátozódik, az ENCODE úgy tűnik, hogy elérte a célját, mivel jelenleg számos kutatási cikk használja a projekt által generált adatokat ahelyett, hogy a „funkcionalitás” definícióit tárgyalná. [39] Ewan Birney, az ENCODE egyik kutatója kommentálta a projektre adott reakciókat. Megjegyzi, hogy a „funkció” szót pragmatikusan használták „bizonyos biokémiai aktivitás” megjelölésére, amely a kísérletek különböző osztályaiban különböző módon nyilvánul meg: RNS jelenléte , hiszton -módosítások , DNázI - túlérzékeny régiók, ChIP-seq transzkripciós faktor csúcsok. , DNS lábnyom , transzkripciós faktor kötőhelyek és exonok . [40]

Ezenkívül a projektet kritizálták magas költségvetése (összesen körülbelül 400 millió dollár) és az úgynevezett "nagy tudomány" pártfogója miatt, amely olyan tudományos alapkutatás, amely pénzt von el a produktívabb tudományos fejlesztésekből, amelyeket az intézményben végre kell hajtani. maguk a kutatók költségére. [41] Az ENCODE projekt kezdeti szakaszát 55 millió dollárra becsülték, bővítése körülbelül 130 millió dollárba került, és az Egyesült Államok Nemzeti Humángenom Kutatóintézete kész volt akár 123 millió dollárt is elkülöníteni a projekt következő szakaszára. Egyes kutatók azzal érvelnek, hogy a befektetés megfelelő megtérülése még nem következett be. Annak érdekében, hogy megszámoljuk az összes olyan publikációt, amelyben az ENCODE jelentős szerepet játszik, 2012 óta 300 ilyen cikket azonosítottak, amelyek közül 110 az ENCODE-finanszírozás nélküli laboratóriumok eredményein alapult. További probléma volt, hogy az ENCODE nem egy egyedi név, amely csak az ENCODE projektre utal, így a „kódolás” (kódolás) szó felbukkan a genetikai és genomkutatási szakirodalomban . [7]

Egy másik fontos megjegyzésként azt állítják, hogy az eredmények nem igazolták a ráfordított időt, és hogy a projekt elvileg végtelen. Bár a Human Genome Project -hez hasonlították, és még folytatásának is nevezték, a The Human Genome-nak egyértelmű vége van, ami jelenleg hiányzik az ENCODE-ból.

A projekt szerzői láthatóan osztják a tudományos világ aggodalmát, és nem tagadják a problémák létezését, ugyanakkor igyekezetüket azzal próbálják igazolni, hogy interjúkban magyarázzák el a projekt részleteit, nemcsak a tudományos közösség számára, hanem a médiának is. Azt mondják, hogy több mint fél évszázad kellett ahhoz, hogy megértsék, hogy a DNS az öröklődés  anyagi alapja az emberi genom szekvenciájának megfejtéséig , ezért a következő évszázadra az a tervük, hogy megértsék ezt a szekvenciát [7] .

Egyéb projektek

Jelenleg az ENCODE konzorcium több további hasonló célú projektben vesz részt. E projektek egy része az ENCODE második szakaszának részét képezte.

modENCODE

Az ENCODE projekthez hasonlóan egy projekt is indult a főbb modellobjektumok  - Drosophila melanogaster és Caenorhabditis elegans  - genom funkcionális elemeinek feltérképezésére .  Modellorganizmus ENCyclopedia Of DNA Elements (modENCODE) . Ennek a projektnek az az előnye, hogy olyan kísérleteket lehet végezni modellszervezeteken, amelyeket nehéz vagy lehetetlen embereken elvégezni. [42]

A projektet 2007-ben alapította a National Institutes of Health ( NIH ) [  43] [44] 2010-ben a modENCODE konzorcium számos cikket mutatott be a Science -ben a funkcionális elemek genomjában való eloszlásának annotációjáról és elemzéséről. Drosophila melanogaster és Caenorhabditis elegans Az ezekből a publikációkból származó adatok elérhetők a modENCODE honlapján [45] .

Jelenleg a modENCODE 11 magprojektből álló kutatási konglomerátum, amely a D. melanogaster és a C. elegans kutatás között oszlik meg . A projekt a következő területeken kutat:

modern

A moderN (  Model Organisum Encyclopedia of Regulatory Networks ) a modENCODE egy leszármazottja .  A projekt egyesíti a C. elegans és a D. melanogaster csoportok kutatását, és további transzkripciós faktor kötőhelyek azonosítására összpontosít. A projekt az ENCODE harmadik fázisával párhuzamosan indult, és a tervek szerint 2017-ben fejeződik be. A moder mai napig 198 kísérlet eredményét tette közzé, további 500 kísérletet fogadott el publikálásra, és ezeket az ENCODE adatelszámolóház dolgozza fel.

A génszabályozás genomika

A Genomics of   Gene Regulation (GGR) programot 2015 elején indította el az Egyesült Államok Nemzeti Egészségügyi Intézete, és három évig fog tartani. A program célja a génhálózatok és útvonalak tanulmányozása a különböző testrendszerekben, hogy tovább erősítsék a génexpressziót szabályozó mechanizmusok megértését. Bár az ENCODE projekt elkülönül a GGR-től, az ENCODE Data Clearinghouse karbantartja a GGR-adatokat a portálján.

Útiterv

2008 -ban az Egyesült Államok Nemzeti Egészségügyi Intézete szervezte meg a Roadmap Epigenomics   Mapping Consortiumot , amely az emberi genom epigenetikai adatainak nyilvános forrását dolgozta ki biológiai és orvosi kutatásokhoz. A munka eredményei alapján 2015 februárjában a konzorcium megjelentette a „111 referencia humán epigenom integráló elemzése” című cikket. A konzorcium 127 referencia epigenomban gyűjtött össze és jegyzett szabályozó elemeket, amelyek közül 16 az ENCODE projekt része volt. Az ütemterv projekt adatai a Roadmap vagy az ENCODE portálokon érhetők el .

fruitENCODE

fruitENCODE projekt: az érésben lévő gyümölcsök DNS-elemeinek enciklopédiája, az ENCODE része. A projekt célja adathalmazok generálása: DNS metilációs helyek, hiszton módosítások, DNáz I hiperszenzitív kromatin régiók, génexpresszió, transzkripciós faktor kötőhelyek mindenféle, különböző fejlődési stádiumú zamatos gyümölcshöz. Az eredmények előzetes közzétételi dátuma a fruitENCODE portálon található .

Factorbook

Az ENCODE által megszerzett transzkripciós faktor kötési adatok jelenleg a Factorbook.org [47] webhelyen érhetők el  , egy wiki-alapú adatbázisban. A FactorBook első száma a következőket tartalmazza:

  • 457 ChIP-seq adatkészlet 119 transzkripciós faktorhoz egyes emberi sejttenyészetekben
  • A hisztonmódosítások átlagos profilja és a nukleoszóma pozicionálása a transzkripciós faktor kötőhelyek körül
  • Motívumok, amelyek gazdagítják a kötési helyeket, valamint a köztük lévő távolságot és orientációjukat [48]

Lásd még

Jegyzetek

  1. 1 2 Raney BJ, Cline MS, Rosenbloom KR, Dreszer TR, Learned K., Barber GP, Meyer LR, Sloan CA, Malladi VS, Roskin KM, Suh BB, Hinrichs AS, Clawson H., Zweig AS, Kirkup V. , Fujita PA, Rhead B., Smith KE, Pohl A., Kuhn RM, Karolchik D., Haussler D., Kent, WJ . ENCODE a teljes genom adatait az UCSC genomböngészőjében (2011-es frissítés  )  // Nucleic Acids Res. : folyóirat. - 2011. - január ( 39. évf. , no. Adatbáziskiadás ). - P.D871-5 . doi : 10.1093 / nar/gkq1017 . — PMID 21037257 .
  2. EGASP: az emberi ENCODE Genome Annotation Assessment Project.  (angol) . PubMed .
  3. Kleshchenko E. DNS szemét nélkül  // The New Times. - 2012. - Kiadás. 29 (256) .
  4. ENCODE projekt az UCSC-nél (downlink) . ENCODE Konzorcium. Letöltve: 2012. szeptember 5. Az eredetiből archiválva : 2012. szeptember 10.. 
  5. Walsh, Fergus . A genom funkciójának részletes térképe  (2012. szeptember 5.). Az eredetiből archiválva: 2012. szeptember 5. Letöltve: 2012. szeptember 6.
  6. Dan Graur blogja .
  7. 1 2 3 4 Maher B. KÓDOLÁS: Az emberi enciklopédia   // Természet . - 2012. - szeptember ( 489. évf. , 7414. sz.). - P. 46-8 . - doi : 10.1038/489046a . — PMID 22962707 .
  8. Saey, Tina Hesman Team kiadja az emberi genom folytatását . Society for Science & the Public (2012. október 6.). Letöltve: 2012. október 18.
  9. 1 2 Az ENCODE Projekt Konzorcium. Az ENCODE (ENCyclopedia Of DNA Elements) projekt . Tudomány (2004).
  10. 1 2 3 Bernstein BE, Birney E., Dunham I., Green ED, Gunter C., Snyder M. Anintegrated encyclopedia of DNA elements in the human genome  //  Nature : Journal. - 2012. - szeptember ( 489. évf. , 7414. sz.). - 57-74 . o . - doi : 10.1038/természet11247 . — . — PMID 22955616 .
  11. Timmer J. Az olvasottak többsége téves: hogyan írták át a sajtóközlemények a tudománytörténetet . Staff / From the Minds of Ars . Ars Technica (2012. szeptember 10.). Letöltve: 2012. szeptember 10.
  12. Pennisi E. Genomika. Az ENCODE projekt laudációt ír a junk DNS-ért  (angol)  // Science : Journal. - 2012. - szeptember ( 337. évf. , 6099. sz.). - 1159., 1161. o . - doi : 10.1126/tudomány.337.6099.1159 . — PMID 22955811 .
  13. 1 2 Birney E. , Stamatoyannopoulos JA , Dutta A. et al. Funkcionális elemek azonosítása és elemzése az emberi genom 1%-ában az ENCODE kísérleti projekttel.  (angol)  // Természet. - 2007. - Vol. 447. sz. 7146 . - P. 799-816. - doi : 10.1038/nature05874 . — PMID 17571346 .
  14. ENCODE Program munkatársai. ENCODE: Kísérleti projekt: áttekintés . Nemzeti Humán Genom Kutatóintézet (2012. október 18.).
  15. Genome.gov | ENCODE és modeENCODE projektek . Az ENCODE projekt: DNS-elemek enciklopédiája . Az Egyesült Államok Nemzeti Humángenom Kutatóintézete (2011. augusztus 1.). Letöltve: 2011. augusztus 5.
  16. Nemzeti Humán Genom Kutató Intézet - Szervezet . Az NIH Almanach . Az Egyesült Államok Nemzeti Egészségügyi Intézete. Letöltve: 2011. augusztus 5.
  17. Genome.gov | ENCODE Résztvevők és projektek . Az ENCODE projekt: DNS-elemek enciklopédiája . Az Egyesült Államok Nemzeti Humángenom Kutatóintézete (2011. augusztus 1.). Letöltve: 2011. augusztus 5.
  18. Joseph R. Ecker, Wendy A. Bickmore, Inês Barroso, Jonathan K. Pritchard, Yoav Gilad. Az ENCODE magyarázata   // Természet . — 2012-09. — Vol. 489 , iss. 7414 . — P. 52–54 . — ISSN 1476-4687 . - doi : 10.1038/489052a .
  19. Az ENCODE Projekt Konzorcium. Használati útmutató a DNS-elemek enciklopédiájához (ENCODE  )  // PLOS Biology. — 2011-04-19. — Vol. 9 , iss. 4 . — P.e1001046 . — ISSN 1545-7885 . - doi : 10.1371/journal.pbio.1001046 .
  20. Jennifer Harrow, Adam Frankish, Jose M. Gonzalez, Electra Tapanari, Mark Diekhans. GENCODE: Az ENCODE Project referencia humán genom annotációja  //  Genome Research. — 2012-09-01. — Vol. 22 , iss. 9 . — P. 1760–1774 . — ISSN 1549-5469 1088-9051, 1549-5469 . - doi : 10.1101/gr.135350.111 .
  21. Cédric Howald, Andrea Tanzer, Jacqueline Chrast, Felix Kokocinski, Thomas Derrien. Az RT-PCR-seq és az RNA-seq kombinálása az emberi genomban kódolt összes génelem katalogizálásához  //  Genome Research. — 2012-09-01. — Vol. 22 , iss. 9 . — P. 1698–1710 . — ISSN 1549-5469 1088-9051, 1549-5469 . - doi : 10.1101/gr.134478.111 .
  22. Thomas Derrien, Rory Johnson, Giovanni Bussotti, Andrea Tanzer, Sarah Djebali. Az emberi hosszú, nem kódoló RNS-ek GENCODE v7 katalógusa: Génszerkezetük, evolúciójuk és expressziójuk elemzése  //  Genome Research. — 2012-09-01. — Vol. 22 , iss. 9 . - P. 1775-1789 . — ISSN 1549-5469 1088-9051, 1549-5469 . - doi : 10.1101/gr.132159.111 .
  23. Baikang Pei, Cristina Sisu, Adam Frankish, Cedric Howald, Lukas Habegger. A GENCODE pszeudogén erőforrás  // Genome Biology. — 2012-09-05. - T. 13 , sz. 9 . - S. R51 . — ISSN 1474-760X . - doi : 10.1186/gb-2012-13-9-r51 .
  24. Mark B. Gerstein, Anshul Kundaje, Manoj Hariharan, Stephen G. Landt, Koon-Kiu Yan. Az ENCODE adatokból származó emberi szabályozó hálózat architektúrája   // Természet . — 2012-09. — Vol. 489 , iss. 7414 . — P. 91–100 . — ISSN 1476-4687 . - doi : 10.1038/természet11245 .
  25. David S. Gross, William T. Garrard. Nukleáz-túlérzékeny helyek a kromatinban  // Annual Review of Biochemistry. - 1988-06-01. - T. 57 , sz. 1 . – S. 159–197 . — ISSN 0066-4154 . - doi : 10.1146/annurev.bi.57.070188.001111 .
  26. Fjodor D. Urnov. A kromatin-átalakítás, mint útmutató az emlősök transzkripciós szabályozó hálózataihoz  (fr.)  // Journal of Cellular Biochemistry. - 2003. - 1. évf. 88 , livr. 4 . — P. 684–694 . — ISSN 1097-4644 . - doi : 10.1002/jcb.10397 .
  27. Jason Ernst, Pouya Kheradpour, Tarjei S. Mikkelsen, Noam Shoresh, Lucas D. Ward. A kromatin állapot dinamikájának feltérképezése és elemzése kilenc emberi sejttípusban   // Nature . — 2011-05. — Vol. 473 , iss. 7345 . — P. 43–49 . — ISSN 1476-4687 . - doi : 10.1038/nature09906 .
  28. Madeleine P. Ball, Jin Billy Li, Yuan Gao, Je-Hyuk Lee, Emily M. LeProust. Célzott és genom szintű stratégiák a gén-test metilációs aláírások feltárására az emberi sejtekben  //  Nature Biotechnology. — 2009-04. — Vol. 27 , iss. 4 . — P. 361–368 . — ISSN 1546-1696 . - doi : 10.1038/nbt.1533 .
  29. Alexander Meissner, Tarjei S. Mikkelsen, Hongcang Gu, Marius Wernig, Jacob Hanna. Genom léptékű DNS-metilációs térképek pluripotens és differenciált sejtekről  (angol)  // Természet. — 2008-08. — Vol. 454 , iss. 7205 . — P. 766–770 . — ISSN 1476-4687 . - doi : 10.1038/nature07107 .
  30. Átirányítás . linkinghub.elsevier.com . Letöltve: 2020. november 10.
  31. Maher B. Harc az ENCODE-ról és a szemétről . Hírek Blog . Nature Publishing Group (2012. szeptember 6.).
  32. Kolata G. Távol a „szeméttől”, a DNS-sötét anyag kulcsfontosságú az egészség szempontjából , The New York Times (2012. szeptember 5.).
  33. Gregory TR. Az ENCODE médiahype gép . Genomikron (2012. szeptember 6.).
  34. Graur D., Zheng Y., Price N., Azevedo RB, Zufall RA, Elhaik E. A televíziókészülékek halhatatlanságáról: "működés" az emberi genomban az  ENCODE evolúciómentes evangéliuma szerint  / / Genome Biol Evol : folyóirat. - 2013. - Kt. 5 , sz. 3 . - P. 578-590 . - doi : 10.1093/gbe/evt028 . — PMID 23431001 .
  35. Moran L.A. Sandwalk: A „funkció” szó jelentéséről . Sandwalk (2013. március 15.).
  36. Gregory TR. Az ENCODE kritikái lektorált folyóiratokban. "Genomicron (hivatkozás nem érhető el) . Genomicron (2013. április 11.). Letöltve: 2015. április 30. Az eredetiből archiválva : 2015. április 2.. 
  37. White MA, Myers CA, Corbo JC, Cohen BA A nagymértékben párhuzamos in vivo fokozó vizsgálat feltárja, hogy az erősen lokális jellemzők meghatározzák a ChIP-seq csúcsok cisz-szabályozó funkcióját   // Proceedings of the National Academy of Sciences of the United States of America  : folyóirat. - 2013. - július ( 110. évf. , 29. sz.). - P. 11952-11957 . - doi : 10.1073/pnas.1307449110 . — PMID 23818646 .
  38. Mattick JS, Dinger ME A funkcionalitás mértéke az emberi genomban  (határozatlan)  // The HUGO Journal. - 2013. - T. 7 , 1. sz . - S. 2 . - doi : 10.1186/1877-6566-7-2 .
  39. Nature Editorial. Forma és funkció   // Természet . - 2013. - március 14. ( 495. köt. ). - P. 141-142 . - doi : 10.1038/495141b .
  40. Birney, Ewan ENCODE: Saját gondolataim . Ewan blogja: A bioinformatikus a szabadban (2012. szeptember 5.).
  41. Timpson T. Vita KÓDOLÁS: Dan Graur, Michael Eisen . Mendelspod (2013. március 5.).
  42. A modENCODE projekt: Modell Organism ENCyclopedia Of DNA Elements (modENCODE) . NHGRI honlapja . Letöltve: 2008. november 13.
  43. modENCODE Résztvevők és projektek . NHGRI honlapja . Letöltve: 2008. november 13.
  44. A Berkeley Lab Life Sciences NIH-támogatásokat kapott gyümölcslégy- és fonálférgek tanulmányozására . Lawrence Berkeley National Laboratory honlapja (2007. május 14.). Letöltve: 2008. november 13.
  45. modENCODE . Az Országos Humán Genom Kutatóintézet.
  46. Celniker S. A genom titkainak feltárása . Természet (2009. június 11.).
  47. FactorBook
  48. Wang J. Factorbook.org: az ENCODE konzorcium által generált átírási faktor-kötő adatok Wiki-alapú adatbázisa . Nukleinsavkutatás (2012. november 29.).

Linkek