Együttes

Az oldal jelenlegi verzióját még nem ellenőrizték tapasztalt közreműködők, és jelentősen eltérhet a 2022. március 14-én felülvizsgált verziótól ; az ellenőrzések 3 szerkesztést igényelnek .

Az Ensembl  az Európai Bioinformatikai Intézet és a Sanger Intézet közös kutatási projektje . A projekt fő célja, hogy a szakemberek integrált hozzáférést biztosítsanak a több mint 50 gerinces faj genomjának szerkezetével kapcsolatos adatbázisokhoz, beleértve az embert ( Homo sapiens ), egeret ( Mus musculus ), patkányt ( Rattus norvegicus ), Danio-t. -rerio hal ( Danio rerio ) stb. [1] . A projekt 1999-ben indult a Human Genome Project [2] befejezése előtt .

Az Ensembl adatbázisait évente legalább kétszer frissítik. A Project 88 jelenlegi verziója 2017. március 29-én jelent meg [3] . A projekt legfrissebb híreit a hivatalos weboldalon teszik közzé. Ezen kívül információkat találhat az Ensembl-lel való együttműködés során végzett személyes oktatási tevékenységekről [4] . A rendszerrel való munkavégzés alapjait az Ensembl honlapján és az EMBL-EBI Archived 2017. április 16-án a Wayback Machine -en található tematikus videók megtekintésével is elsajátíthatja .

A genom annotációja

A gerincesek genomjának alapelemei

Az Ensembl projekt a gerincesek genomjairól szóló részletes információk nyújtására összpontosít . Egy ilyen genom tipikus mérete több milliárd bázispár. Például az egér ( Mus musculus ) és az ember ( Homo sapiens ) genomja körülbelül 3 milliárd bázispárt tartalmaz. A genomnak csak néhány százaléka kódoló szekvencia, ami az ember esetében körülbelül 20-25 ezer génnek felel meg [5] . A kódoló szekvenciák nem véletlenszerű felépítésűek, ami lehetővé teszi azok kimutatását a genomelemzés során. A genom nem kódoló szekvenciái bizonyos esetekben biológiailag is funkcionálisak, pszeudogénekre , transzfer génekre és riboszomális RNS -ekre, hosszú, nem kódoló RNS-ekre, kis nukleáris RNS -ekre , kis nukleoláris RNS -ekre , mikroRNS - ekre stb. A genom elemeivel csak akkor lehet dolgozni, ha van információ ennek az elemnek a helyzetéről és másokkal való interakciójáról. Az egyes ilyen elemek pozíciójának megjelölését genom annotációnak nevezzük [6] .

A genom annotációja elvégezhető manuálisan egy szakértői csoport által, és automatikus szoftveres megközelítések segítségével, amint azt az Ensembl [7] implementálja .

Ensembl annotációs rendszer

A standard Ensembl annotációs eljárás legfeljebb 4 hónapig tart, és több szakaszból áll [8] . Kezdetben az ismétlődések automatikus maszkolása és a gének helyzetének előrejelzése történik. Ezután egy adott organizmus ismert, kísérletileg nyert fehérjekódoló szekvenciáit a genomhoz igazítják. Ha a genom egy régiójához nincs ilyen szekvencia, akkor a következő lépésben a közeli rokon fajok szekvenciáit használjuk erre a célra. Ezenkívül az ismert fajspecifikus cDNS- és EST -szekvenciákra vonatkozó információkat alkalmazzák a genomra . Ha lehetséges, az RNS-szekvenálási kísérletekből származó adatokat is ráhelyezzük a genomra [9] .

Az emberi és egérgenomok esetében a standard annotálási folyamatot kiegészíti a HAVANA projekt annotációja Archivált 2017. április 15-én a Wayback Machine -nél . A kombinált Ensembl/HAVANA annotáció alkotja a GENCODE humán és egér génkészletet.Archiválva 2017. április 15-én a Wayback Machine -nél [10] .

Az Ensembl nómenklatúrában egy génhez 3 státusz rendelhető: ismert, újszerű, egyesített . Az ismert állapot azt jelzi, hogy a régió megfelel ennek a szervezetnek az UniProtKB és az NCBI RefSeq nyilvános adatbázisokból ismert szekvenciájának Archivált 2006-03-30 . . Ha csak egy másik organizmus szekvenciájával van egyezés, akkor a gén új állapotot kap . Az egyesített állapot az Ensembl és a HAVANA annotációk teljes egyezését jelzi [8] .

Az Ensembl Genomic Browser

Az Ensembl projekt elsődleges célja a gerincesek genomjainak automatikus elemzése és annotálása, valamint hozzáférés biztosítása ezekhez a genomokhoz. Az Ensembl genomikus böngésző képes megjeleníteni az Ensembl adatbázisban elérhető genomokat és annotációikat különböző léptékben, a teljes kariotípustól a genomszekvencia egy meghatározott szakaszáig szöveges formában. A megjegyzésekkel ellátott elemek sávokként (sávokként) jelennek meg a referenciagenomhoz képest. A pályák megjelenítését a felhasználó testreszabhatja saját igényei szerint. Az egyes megjegyzéselemekkel kapcsolatos további információk a felugró ablakokban érhetők el, amikor az egérmutatót az elem fölé viszi. A felhasználóknak lehetőségük van saját genomikus annotációs adataik feltöltésére és megjelenítésére. Ez történhet akár DAS-szerver ( Distributed Annotation System ) használatával, akár egy támogatott formátumú fájl feltöltésével (BigBED, BigWig, VCF, BAM és mások) [11] [12] [13] [14] .

API és egyéb hozzáférési módszerek

Az Ensembl MySQL - en alapuló relációs adatbázisokat használ az információk tárolására . Az Ensembl adatbázisokból való információszerzéshez a Perlben írt API -k (Application Programming Interface) készletét használjuk . Az API-k lehetővé teszik, hogy harmadik féltől származó alkalmazások ne függjenek az adatbázis-struktúra változásaitól. Az Ensembl API-t a projekt webes felületén használják az adatok megjelenítésére, és a felhasználó is betöltheti, és szkripteket írhat az Ensembl adatbázisokból származó adatok fogadásának automatizálására. Az Ensembl API letöltésével, telepítésével és használatával kapcsolatos információk a projekt weboldalán találhatók. Archivált 2017. április 15-én a Wayback Machine -nél [15] .

Az Ensembl API szakaszokra van felosztva a feldolgozott adatok típusa szerint: Ensembl Core API (génekkel, szekvenciákkal és egyéb automatikus annotációs elemekkel való munkához), Ensembl-Compara API (összehasonlító genomikai adatokkal való munkavégzéshez), Ensembl-Variation API (egy nukleotid polimorfizmusokkal, szomatikus mutációkkal, szerkezeti variációkkal kapcsolatos adatokkal való munkavégzéshez), Ensembl-Regulation API (genomszabályozási adatokkal való munkavégzéshez) és mások [16] .

Az Ensembl adatbázis más programozási nyelvű kliens használatával való eléréséhez használja az Ensembl REST szervert, archiválva 2016. június 23-án a Wayback Machine -en [17] . A BioMart szolgáltatás nagy mennyiségű adat megszerzésére használható Archivált 2011. január 8. a Wayback Machine -en . Ezenkívül a projekt FTP-kiszolgálója segítségével letöltheti a teljes Ensembl-adatbázist MySQL-en. 2020. május 28-i archivált példány a Wayback Machine -en .

Rendelkezésre álló eszközök

Az Ensembl weboldalán számos eszköz elérhető mind az Ensembl adatbázisból származó, mind a felhasználó által feltöltött adatok feldolgozására [18] . BLAT vagy BLAST algoritmusok segítségével keresnek egy adott szekvenciát az összes Ensembl genomban. Archiválva : 2017. május 11. a Wayback Machine -nél . Létezik egy eszköz az Ensembl adatbázisból adatok letöltésére módosított formátumban ( File Chameleon Archived 2017. április 15. a Wayback Machine -nél ), valamint az adatformátum lefordítására a különböző genom-összeállítások között Archivált 2017. április 27-én a Wayback Machine -nél és az Ensembl kiadja Archivált 2017. április 15-től a Wayback Machine -nél .

Variáns hatás előrejelző

Az Ensembl Variant Effect Prediktor Archivált : 2017. április 30. a Wayback Machine -nél (VEP) a kódoló és nem kódoló régiók genomiális variációinak elemzésére és annotálására szolgáló eszköz. A VEP az Ensembl adatbázis-adatbázisok széles készlete alapján jegyzi a genomiális variációt, beleértve az átiratokat, a szabályozó régiókat, a korábban megfigyelt eltérések gyakoriságát, a klinikai adatokat és a variáció biofizikai következményeinek előrejelzéseit. A variációk két kategóriájának elemzése lehetséges: kicsi, pontosan meghatározott variációk ( inszerciók , deléciók, tandem ismétlődések , egyetlen nukleotid polimorfizmusok ) vagy a genom nagyobb szerkezeti változatai (a génkópiaszám változásai, nagy inszerciók vagy deléciók ). A VEP szolgáltatásként elérhető az Ensembl weboldalán, önálló Perl-szkriptként és az Ensembl REST-en [19] keresztül .

Partnerprojektek

Ensemble Genomes

Kezdetben az Ensembl projekt gerinces genomokra specializálódott, de a más élőlények genomjaival kapcsolatos információk mennyiségének növekedése az Ensembl Genomes projekt megjelenéséhez vezetett 2009-ben. Archiválva 2017. április 19-én a Wayback Machine -nél , az Ensembl platformot használva. , eszközök és annotációs rendszer [20] . A projekt keretében 5 divíziót hoztak létre:

Genomok összeállítása Az Ensembl Genomes egyszerre jelenik meg minden részleg számára, függetlenül a fő projekttől. A szolgáltatás jelenlegi verziója 34, az utolsó frissítés 2016 decemberében történt [21] .

Ensemble Pre!

A genomokhoz való hozzáférés az annotáció folyamatában az Ensembl Pre! Archiválva : 2017. június 9. a Wayback Machine -nál . 2017-től 17 organizmus genomjáról áll rendelkezésre információ. A szolgáltatás utolsó frissítése 2015. január 19-én történt [22] .

Jegyzetek

  1. Paul Flicek, Bronwen L. Aken, Benoit Ballester, Kathryn Beal, Eugene Bragin. Az Ensembl 10. éve  //  ​​Nucleic Acids Research. — 2010-01-01. — Vol. 38 , iss. suppl_1 . — P. D557–D562 . — ISSN 0305-1048 . doi : 10.1093 / nar/gkp972 . Archiválva az eredetiből 2017. április 16-án.
  2. Paul Flicek, M. Ridwan Amode, Daniel Barrell, Kathryn Beal, Simon Brent. Ensembl 2011  //  Nucleic Acids Research. — 2011-01-01. — Vol. 39 , iss. suppl_1 . — P. D800–D806 . — ISSN 0305-1048 . doi : 10.1093 / nar/gkq1064 . Archiválva az eredetiből 2017. április 16-án.
  3. Megjelent az Ensembl 88! (2017. március 29.). Letöltve: 2017. április 14. Az eredetiből archiválva : 2017. április 15..
  4. Együttes workshopok . Ensembl . Letöltve: 2017. április 15. Az eredetiből archiválva : 2017. április 16..
  5. Emberi összeállítás és génannotáció . Együttes (2017. március). Letöltve: 2017. április 15. Az eredetiből archiválva : 2017. május 25.
  6. Roger P. Alexander, Gang Fang, Joel Rozowsky, Michael Snyder, Mark B. Gerstein. A genom nem kódoló régióinak annotálása  //  Nature Reviews Genetics. — Vol. 11 , iss. 8 . - P. 559-571 . doi : 10.1038 / nrg2814 .
  7. Val Curwen, Eduardo Eyras, T. Daniel Andrews, Laura Clarke, Emmanuel Mongin. Az Ensemble Automatic Gene Annotation System  //  Genomkutatás. - 2004-05-01. — Vol. 14 , iss. 5 . — P. 942–950 . - doi : 10.1101/gr.1858004 . Archiválva az eredetiből 2017. május 2-án.
  8. ↑ 1 2 Ensembl annotation (downlink) . Letöltve: 2017. április 14. Az eredetiből archiválva : 2017. április 15.. 
  9. Bronwen L. Aken, Sarah Ayling, Daniel Barrell, Laura Clarke, Valery Curwen. Az Ensembl génannotációs rendszer   // Adatbázis . — 2016-01-01. — Vol. 2016 . - doi : 10.1093/database/baw093 . Archiválva az eredetiből 2017. április 15-én.
  10. Miért változik az ember és az egér génszáma a GENCODE kiadások között? (nem elérhető link) . GencodeGenes (2016. szeptember 13.). Letöltve: 2017. április 15. Az eredetiből archiválva : 2017. május 24.. 
  11. Andrew Yates, Wasiu Akanni, M. Ridwan Amode, Daniel Barrell, Konstantinos Billis. Ensembl 2016  //  Nucleic Acids Research. — 2016-01-04. — Vol. 44 , iss. D1 . — P. D710–D716 . — ISSN 0305-1048 . - doi : 10.1093/nar/gkv1157 . Archiválva az eredetiből 2017. április 15-én.
  12. Giulietta M. Spudich, Xose M. Fernández-Suárez. Touring Ensembl: Gyakorlati útmutató a genom böngészéséhez  //  BMC Genomics. — 2010-01-01. — Vol. 11 . - 295. o . — ISSN 1471-2164 . - doi : 10.1186/1471-2164-11-295 .
  13. Giulietta Spudich, Xose M. Fernández-Suárez, Ewan Birney. Genomböngészés az Ensembl segítségével: gyakorlati áttekintés  //  Tájékoztatás a funkcionális genomikából. — 2007-09-01. — Vol. 6 , iss. 3 . — P. 202–219 . — ISSN 2041-2649 . - doi : 10.1093/bfgp/elm025 . Archiválva az eredetiből 2017. április 15-én.
  14. Xose M. Fernández-Suárez, Michael K. Schuster. Az Ensembl Genome Server használata genomi szekvencia adatok böngészéséhez  //  Jelenlegi protokollok a bioinformatikában. – John Wiley & Sons, Inc., 2002-01-01. — ISBN 9780471250951 . - doi : 10.1002/0471250953.bi0115s30 . Archiválva az eredetiből 2017. április 15-én.
  15. Arne Stabenau, Graham McVicker, Craig Melsopp, Glenn Proctor, Michele Clamp. Az Ensembl Core Software Libraries  //  Genome Research. - 2004-05-01. — Vol. 14 , iss. 5 . — P. 929–933 . - doi : 10.1101/gr.1857204 . Archiválva az eredetiből 2017. március 12-én.
  16. Doxygen Perl  dokumentáció . www.ensemble.org. Letöltve: 2017. április 14. Az eredetiből archiválva : 2017. november 5..
  17. Andrew Yates, Kathryn Beal, Stephen Keenan, William McLaren, Miguel Pignatelli. Az Ensembl REST API: Ensembl Data for Any Language   // Bioinformatika . — 2015-01-01. — Vol. 31 , iss. 1 . — P. 143–145 . — ISSN 1367-4803 . - doi : 10.1093/bioinformatics/btu613 . Archiválva az eredetiből 2017. április 15-én.
  18. Ensembl Tools  . www.ensemble.org. Letöltve: 2017. április 14. Az eredetiből archiválva : 2017. április 30.
  19. William McLaren, Laurent Gil, Sarah E. Hunt, Harpreet Singh Riat, Graham RS Ritchie. Az Ensembl Variant Effect Predictor  //  Genombiológia. — 2016-01-01. — Vol. 17 . — 122. o . — ISSN 1474-760X . - doi : 10.1186/s13059-016-0974-4 .
  20. Paul Julian Kersey, James E. Allen, Irina Armean, Sanjay Boddu, Bruce J. Bolt. Ensembl Genomes 2016: több genom, több komplexitás  //  Nucleic Acids Research. — 2016-01-04. — Vol. 44 , iss. D1 . — P. D574–D580 . — ISSN 0305-1048 . - doi : 10.1093/nar/gkv1209 . Archiválva az eredetiből 2017. április 15-én.
  21. Ensemble Genomes . Letöltve: 2017. április 14. Az eredetiből archiválva : 2017. április 19..
  22. Murphy Dan (Genebuild). Új Ensemble Pre! oldalak . Ensembl Blog . Együttes (2015. január 19.). Letöltve: 2017. április 15. Az eredetiből archiválva : 2017. április 16..

Linkek