A számítógépes genomika számítógépes elemzést használ a genomszekvenciák és a kapcsolódó adatok megfejtésére [1] , beleértve a DNS- és RNS-szekvenciákat is . A számítógépes genomika a bioinformatika egyik ágaként is definiálható , de azzal a különbséggel, hogy figyelmet fordítanak a teljes genomok elemzésére (nem pedig az egyes génekre), hogy megértsük, hogyan irányítanak különböző DNS-ek egy szervezetet molekuláris szinten. [2] .
A számítógépes genomika a bioinformatikával egyidőben indult ki. Az 1960-as években Margaret Dayhoff és a National Biomedical Research Foundation munkatársai adatbázisokat hoztak létre különféle fehérjeszekvenciákról evolúciós kutatásokhoz [3] . Vizsgálatuk egy filogenetikai fát épített fel, amely meghatározta azokat a változásokat, amelyek szükségesek ahhoz, hogy egy adott fehérje egy másik fehérjévé fejlődjön. Ez egy szubsztitúciós mátrix létrehozásához vezetett, amely értékeli annak valószínűségét, hogy egy fehérje kapcsolódjon a másikhoz.
Az 1980-as évektől kezdődően megjelentek a genomszekvencia-adatbázisok, de új kihívások merültek fel az egyes génekre vonatkozó adatok megtalálása és összehasonlítása terén. A weboldalakon használt szöveges keresési algoritmusokkal ellentétben a genetikai hasonlóság keresése során olyan szekvenciákat kell azonosítani, amelyek nem feltétlenül azonosak, hanem egyszerűen hasonlóak. Ez vezetett a Needleman-Wunsch algoritmus megjelenéséhez , amely egy dinamikus programozási algoritmus aminosav-szekvenciák készleteinek egymással való összehasonlítására M. Deyhoff korábbi tanulmányában kapott szubsztitúciós mátrixok segítségével. Később megjelent a BLAST algoritmus , amely gyors és optimalizált keresést tesz lehetővé a génszekvenciák adatbázisaiban. A BLAST és módosításai az erre a célra legszélesebb körben használt algoritmusok közé tartoznak [4] .
A „számítógépes genomika” kifejezés megjelenése egybeesik a teljes, annotált genomok megjelenésével az 1990-es évek második felében. A számítógépes genomikáról szóló első éves konferenciát a Genomikai Kutatóintézet (TIGR) tudósai szervezték 1998-ban, fórumot biztosítva ennek a szakterületnek, és hatékonyan megkülönböztetve ezt a tudományterületet a genomika vagy a számítógépes biológia általánosabb területeitől [5] [ 5] 6] . A tudományos irodalomban először ezt a kifejezést a MEDLINE szerint egy évvel korábban használták (a Nucleic Acids Research folyóiratban [7] ).