Számítógépes genomika

Az oldal jelenlegi verzióját még nem ellenőrizték tapasztalt közreműködők, és jelentősen eltérhet a 2013. június 26-án áttekintett verziótól ; az ellenőrzések 6 szerkesztést igényelnek .

A számítógépes genomika számítógépes elemzést használ a genomszekvenciák és a kapcsolódó adatok megfejtésére [1] , beleértve a DNS- és RNS-szekvenciákat is . A számítógépes genomika a bioinformatika egyik ágaként is definiálható , de azzal a különbséggel, hogy figyelmet fordítanak a teljes genomok elemzésére (nem pedig az egyes génekre), hogy megértsük, hogyan irányítanak különböző DNS-ek egy szervezetet molekuláris szinten. [2] .

Történelem

A számítógépes genomika a bioinformatikával egyidőben indult ki. Az 1960-as években Margaret Dayhoff és a National Biomedical Research Foundation munkatársai adatbázisokat hoztak létre különféle fehérjeszekvenciákról evolúciós kutatásokhoz [3] . Vizsgálatuk egy filogenetikai fát épített fel, amely meghatározta azokat a változásokat, amelyek szükségesek ahhoz, hogy egy adott fehérje egy másik fehérjévé fejlődjön. Ez egy szubsztitúciós mátrix létrehozásához vezetett, amely értékeli annak valószínűségét, hogy egy fehérje kapcsolódjon a másikhoz.

Az 1980-as évektől kezdődően megjelentek a genomszekvencia-adatbázisok, de új kihívások merültek fel az egyes génekre vonatkozó adatok megtalálása és összehasonlítása terén. A weboldalakon használt szöveges keresési algoritmusokkal ellentétben a genetikai hasonlóság keresése során olyan szekvenciákat kell azonosítani, amelyek nem feltétlenül azonosak, hanem egyszerűen hasonlóak. Ez vezetett a Needleman-Wunsch algoritmus megjelenéséhez , amely egy dinamikus programozási algoritmus aminosav-szekvenciák készleteinek egymással való összehasonlítására M. Deyhoff korábbi tanulmányában kapott szubsztitúciós mátrixok segítségével. Később megjelent a BLAST algoritmus , amely gyors és optimalizált keresést tesz lehetővé a génszekvenciák adatbázisaiban. A BLAST és módosításai az erre a célra legszélesebb körben használt algoritmusok közé tartoznak [4] .

A „számítógépes genomika” kifejezés megjelenése egybeesik a teljes, annotált genomok megjelenésével az 1990-es évek második felében. A számítógépes genomikáról szóló első éves konferenciát a Genomikai Kutatóintézet (TIGR) tudósai szervezték 1998-ban, fórumot biztosítva ennek a szakterületnek, és hatékonyan megkülönböztetve ezt a tudományterületet a genomika vagy a számítógépes biológia általánosabb területeitől [5] [ 5] 6] . A tudományos irodalomban először ezt a kifejezést a MEDLINE szerint egy évvel korábban használták (a Nucleic Acids Research folyóiratban [7] ).

Jegyzetek

  1. Koonin EV (2001) Computational Genomics, National Center for Biotechnology Information, National Library of Medicine, NIH (PubMed ID: 11267880)
  2. Számítógépes genomika és proteomika az MIT-n (a hivatkozás nem érhető el) . Letöltve: 2010. december 13. Az eredetiből archiválva : 2018. március 22. 
  3. David Mount (2000), Bioinformatika, Sequence and Genome Analysis, pp. 2-3, Cold Spring Harbor Laboratory Press, ISBN 0-87969-597-8
  4. T. A. Brown (1999), Genomes, John Wiley & Sons, ISBN 0-471-31618-0
  5. [backPid]=67&cHash=fd69079f5e [https://web.archive.org/web/20170107160058/http://www.jcvi.org/cms/press/press-releases/full-text/archive/2004// cikk/computational-genomics-conference-to-attract-leading-scientists/?tx_ttnews[backPid]=67&cHash=fd69079f5e Archiválva : 2017. január 7., a Wayback Machine The 7th Annual Conference on Computational Genomics (2004)]
  6. The 9th Annual Conference on Computational Genomics (2006) Archiválva : 2007. február 12.
  7. A. Wagner (1997), Számítógépes genomikai megközelítés a génhálózatok azonosításához, Nucleic Acids Res., Sep 15;25(18):3594-604, ISSN 0305-1048