Sorozat-igazítás

A szekvenciaillesztés egy bioinformatikai technika, amely két vagy több DNS- , RNS- vagy fehérjemonomer -szekvenciát egymás alá helyezve oly módon, hogy könnyen látható legyen ezekben a szekvenciákban hasonló területek. Két molekula primer szerkezetének hasonlósága tükrözheti azok funkcionális, szerkezeti vagy evolúciós kapcsolatait [1] . A nukleotidok vagy aminosavak egymáshoz igazodó bázisszekvenciáit általában egy mátrix soraiként ábrázolják. Az alapok közé hézagokat adunk, így a mátrix egymást követő oszlopaiban ugyanazok vagy hasonló elemek helyezkednek el [2] .

Szekvencia igazítási algoritmusokat is használnak az NLP -ben [3] .

Grafikus és szöveges ábrázolás

Az illesztési eredmény legtöbb ábrázolásában a szekvenciák a mátrix soraiban úgy vannak elrendezve, hogy az egyező elemek (nukleotidok vagy aminosavak) egymás alatt (ugyanabban az oszlopban) legyenek. A „réseket” egy „-” jel váltja fel, amelyet gap-nek neveznek (az angol „ gap ” szóból) [4] , és egy indel -t jelöl , vagyis egy esetleges beszúrás vagy törlés helyét [5] [ 2] .

Szövegábrázolás

Szöveges megjelenítéssel egyszerűen gyors formátumban lehet írni , amikor a sorozatok hézagokkal vannak felírva, és azonos hosszúságúak [6] . Ezt a fajta rögzítést gyakran használják a programok, és kényelmes a gépi feldolgozáshoz [7] .

A másik fajta szövegábrázolás a felhasználó kényelmét szolgálja (az alábbiakban három különböző példát mutatunk be). Ebben a szekvenciák egymás alá vannak írva, és a közöttük lévő sorban különböző szimbólumok jelzik az aminosavak közötti különböző kapcsolatokat. A szóköz (szimbólum hiánya) az aminosavak közötti kapcsolat hiányát jelzi, mind a homológia, mind a funkció szempontjából: a "*", "|" szimbólumok vagy a betű ( BLAST ) - ugyanazok az aminosavak; ":" vagy "+" - hasonló tulajdonságokkal; "." — tulajdonságaiban hasonló [8] .

Robbanás: 15. lekérdezés FQQAWANPKHAWAQVNGETRLTQNLIILERETR 47 FW PKHA +QVNG T ++Q+ IIL RR Sbjct 14 FHHNWTRPKHASSQVNGHTEMSQHNIILRRVPR 46 CLUSTAL: THE12851.1 MGKKGYKRNEYNNPFQQAWANPKHAWAQVNGETRLTQNLIILERETRKRS- 50 WP_104057486.1 MSTK-DQLDPQSQAFHHNWTRPKHASSQVNGHTEMSQHNIILRRVPRSGRR 50 *..* : : .: *::*:.**** :****.*.::*: ***.* *. EMBOSS tű: THE12851.1 1 MGKKGYKRNEYNNPFQQAWANPKHAWAQVNGETRLTQNLIILERETRKRS 50 |..|. :.:..:..|...|..||||.:||||.|.:|:.|||.|..|... WP_104057486. 1 MSTKD-QLDPQSQAFHHNWTRPKHASSQVNGHTEMSQHNIILRRVPRSGR 49

Grafikus ábrázolás

A grafikus ábrázolás maximálisan a vizuális észlelésre koncentrál. Szokásos a szekvenciákat is egymás alá helyezni, de a különböző szekvenciákból származó aminosavak kapcsolatának jelentését a szín jelzi. Vannak olyan foltok, amelyek az aminosavak tulajdonságait jelölik, mint például a "Zappo", amely megfesti az egyes aminosavakat, és a "Clustal", amely az azonos aminosavtulajdonságokkal rendelkező rudakat festi. A foltok egy része, például az „%Identity” lehetővé teszi az aminosavak azonosságának és megőrzésének megtekintését az oszlopban. Vannak olyan színek is, amelyek az aminosavak hidrofób jellegét mutatják [10] .

A leghíresebb igazításnézők: Jalview [9] , UGENE [11] , MEGA [12] . A teljes listát lásd az igazítási vizualizációs szoftver listája című cikkben.

A konszenzusos szekvencia ábrázolására is van mód - Sequence Logo [13] .

Pontmátrix

A hasonlósági pontmátrix a páronkénti igazítás vizuális ábrázolásának módja. Általában nagy szekvenciákhoz, példáulbakteriális genomokhoz használják. Mindkét sorozat koordinátái a tengelyek mentén vannak ábrázolva, homológiájukat szegmensek ábrázolják. Tehát az azonos sorozatokból álló pontmátrix úgy fog kinézni, mint egy négyzet átlója. Ez a megjelenítési mód lehetővé teszi az inverziók , a duplikációk vagy törlések , valamint a transzlokációk nyomon követését [14] .

Pair alignment

Páronkénti illesztést használunk két szekvencia hasonló régióinak megtalálására. Tegyen különbséget a globális és a lokális igazodás között. A globális igazítás feltételezi, hogy a szekvenciák teljes hosszukban homológok. A globális igazítás mindkét teljes bemeneti szekvenciát tartalmazza. Lokális illesztést alkalmazunk, ha a szekvenciák rokon (homológ) és nem rokon régiókat is tartalmaznak. A lokális illesztés eredménye egy hely kiválasztása az egyes szekvenciákban, és a helyek közötti igazítás [15] .

A dinamikus programozási módszer variációit használjuk a pár-illesztés eléréséhez . Ezeket az algoritmusokat különösen az Európai Molekuláris Biológiai Laboratórium ( Pairwise Sequence Alignment . EMBL-EBI . (határozatlan) ) szolgáltatásaiban valósítják meg. Így például a Needle . (határozatlan), egy globális igazítási algoritmus, a Needleman-Wunsch algoritmust [16] használja , míg a Water . (határozatlan), a lokális igazítási algoritmus a Smith-Waterman algoritmus [16] .

Globális és lokális igazítások összehasonlítása

A globális és a lokális összehangolás közötti különbség bemutatására egy mesterséges példát vehetünk figyelembe. Vegyük az A és B sorozatot, és végezzünk globális és lokális igazítást. A szekvencia egy központi homológ régiót és jelentősen eltérő éleket tartalmazott.

A Global alignment [15] mindkét szekvencia teljes hosszát használja, és felhasználható a szekvenciák homológiájának (közös eredetű) tesztelésére teljes hosszukban. Ha azonban a szekvenciáknak kevés homológ régiója van (vagy egyszerűen csak hasonlóság), akkor nem mindig lehet jól meghatározni ezeket a régiókat. A fenti példában az algoritmus négy egyező aminosavra van kötve, így a homológia hosszú szakasza nem látható. Ez alapján feltételezhető, hogy a szekvenciák nem teljesen homológok egymással [17] .

A lokális illesztés [15] a szekvenciák azon részeit használja, amelyeken a maximális homológia megjósolható. Nagyszerű, ha a szekvenciáknak csak egy része hasonló, például a rekombináció vagy a konvergens evolúció során . Mindig ügyeljen a kis, alacsony hasonlóságú területekre, különösen nagy sorozatok összehangolásakor, mivel ez növeli a véletlenszerű hasonló területekkel való találkozás valószínűségét. Az ábra példájában a lokális igazítás a sorozatok hosszának felét tartalmazta. Rendezett 11 aminosav hasonló működésű, van 2 hét. Ez alapján, ha az A és B peptidek hasonló funkciójáról is ismert, elmondható, hogy mindkét peptid központi régiói ellátják a teljes peptid funkcióját, vagy fontosak a funkciója szempontjából [18] .

Előfordulhat azonban, hogy a kérdéses szekvenciarégió nem mindig esik a helyi illesztésbe. Ezt úgy lehet megkerülni, hogy a szekvenciát a kívánt régió határai mentén levágjuk. A globális és lokális igazítások egyéb kombinációi is lehetségesek [19] .

Keresési algoritmusok

Arra használják, hogy nagy adatbázisokban keressenek olyan szekvenciákat, amelyek hasonlóak egy adott szekvenciához meghatározott kritériumok szerint. Az alkalmazott igazítás helyi. Különféle heurisztikus módszereket alkalmaznak a keresési sebesség növelésére. A leghíresebb programok a BLAST [20] és a FASTA3x . (határozatlan)[21] .

Többszörös igazítás

A többszörös illesztés három vagy több szekvencia összehangolása. Konzervált régiók megtalálására használják homológ szekvenciák sorozatában. A legtöbb esetben a többszörös vonalvezetés megépítése szükséges lépés a filogenetikai fák rekonstrukciójában . Az optimális többszörös igazítás megtalálása dinamikus programozással túl sok időbonyolítást igényel, ezért a többszörös igazítások különféle heurisztikus elemek alapján épülnek fel. A többszörös igazítást végző leghíresebb programok a Clustal ( clustal . (határozatlan) ) [22] , T-COFFEE ( tcoffee . (határozatlan) ), MUSCLE ( izom . (határozatlan) ) [23] és MAFFT ( mafft . (határozatlan) ). Több igazítás megtekintésére és szerkesztésére is vannak programok, mint például a Jalview[9] vagy az orosz nyelvű UGENE [11] .

Szerkezeti igazítás

A molekulák másodlagos és harmadlagos térszerkezetére vonatkozó információk felhasználásával fehérjékre vagy ribonukleinsavakra konstruálható . A cél az, hogy megkíséreljük két vagy több struktúra homológiájának megállapítását a térben hasonlóan egymásra halmozott helyek megtalálásával és összehasonlításával. A szerkezeti összeillesztést általában struktúrák egymásra helyezésével, azaz olyan térbeli mozgások megtalálásával kíséri, amelyek adott molekulákra történő alkalmazása a legjobban kombinálja azokat. De ellentétben az egyszerű térbeli szuperpozícióval, amelyben két szerkezet ekvivalens aminosav- maradékainak ismert megfeleltetése van , a szerkezeti illesztési algoritmusok általában nem igényelnek előzetes ismereteket a szekvencia-illesztésről. Számos olyan , amelyeken különféle szerkezeti igazítási programokA térbeli illesztések különösen fontosak a szerkezeti genomikai és proteomikai adatok elemzéséhez , és felhasználhatók a szekvencia-összehasonlításokból nyert illesztések értékelésére is. [24] .

A strukturális illesztést sikeresen alkalmazták alacsony szekvencia-homológiájú fehérjék összehasonlítására, amikor az evolúciós kapcsolatok standard szekvenciaillesztési módszerekkel nem állapíthatók meg, de ebben az esetben figyelembe kell venni a konvergens evolúció hatását, a fő hatást. ami a nem rokon aminosavszekvenciák harmadlagos szerkezetének hasonlóságában nyilvánul meg [25] .

A térbeli elrendezés lehetővé teszi két vagy több ismert háromdimenziós szerkezetű molekula összehasonlítását, amelyek kísérleti előállítása röntgendiffrakciós elemzésen és NMR-spektroszkópián alapul . A fehérjeszerkezet-előrejelzési módszerekből származó struktúrák térbeli igazításra is használhatók . Ezenkívül az ilyen előrejelzések minőségének értékelése gyakran a létrehozott modell és a fehérje szerkezetének térbeli összehangolásán alapul, amelynek harmadlagos szerkezetét közvetlenül a kísérletből kaptuk. Vannak adatok a kisszögű röntgenszórásos módszer alkalmazásáról is különböző fehérjemolekulák háromdimenziós szerkezetének elemzésére [26] .

Összehasonlítási típusok

A szerkezeti igazítási programok eredménye általában az atomi koordináták kombinációja . Leggyakrabban egy ilyen összehasonlítás keresése során az eredményt a struktúrák közötti legkisebb szórás (RMSD) függvény értéke alapján értékelik ki, amelyet az igazítási konstrukciós algoritmus igyekszik minimalizálni. [27]

{\begin{aligned}\mathrm {RMSD} (\mathbf {v} ,\mathbf {w} )&={\sqrt ({\frac {1}{n))\sum _{i=1 }^{n}\|v_{i}-w_{i}\|^{2}}}\\&={\sqrt {{\frac {1}{n}}\sum _{i=1} ^{n}(({v_{i}}_{x}-{w_{i}}_{x})^{2}+({v_{i}}_{y}-{w_{i} }_{y})^{2}+({v_{i}}_{z}-{w_{i}}_{z})^{2}}})\end{aligned}}

ahol a pontok (atomok) száma a mintában (szerkezetben), és a megfelelő szerkezet atomjai , , és , , koordinátákkal . $n$ $\mathbf{v}$ $\mathbf {w}$ $\mathbf {v_{i}} _{x}$ $\mathbf {v_{i}} _{y}$ $\mathbf {v_{i}} _{z}$ $\mathbf {w_{i}} _{x}$ $\mathbf {w_{i}} _{y}$ $\mathbf {w_{i}} _{z}$

Az RMSD értéket hosszegységekben fejezzük ki, a szerkezetbiológiában leggyakrabban használt mértékegység az angström (Å), amely 10–10 m. Az RMSD , mint az egymáshoz igazított struktúrák térbeli eltérésének mértéke azonban számos Hátrányok: a kiugró értékek instabilitása és több domén jelenléte az összehangolt fehérjék szerkezetében, mivel ezeknek a doméneknek a két struktúra közötti relatív helyzetében bekövetkező változások mesterségesen megváltoztathatják az RMSD értéket.

Emellett bonyolultabb, szerkezeti hasonlóságot értékelő paraméterek is kiszámíthatók, például a globális távolságteszt [28] .

Szerkezeti elrendezés létrehozásához és a megfelelő RMSD-értékek kiszámításához a fehérjemolekula összes atomja és azok részhalmazai egyaránt használhatók. Például az aminosavak oldalgyökeinek atomjait nem mindig veszik figyelembe, és csak a molekula peptidvázában lévő atomok használhatók az illesztéshez. Ezt az opciót akkor választjuk, ha az egymáshoz igazodó struktúrák aminosav-szekvenciája nagyon eltérő, és az oldalgyökök nagy számban különböznek egymástól. Emiatt alapértelmezés szerint a térbeli igazítási módszerek csak a peptidkötésben részt vevő gerincatomokat használják . A nagyobb egyszerűsítés és a hatékonyság növelése érdekében gyakran csak az alfa- szénatomok helyzetét alkalmazzák , mivel ezek helyzete meglehetősen pontosan meghatározza a polipeptid gerincének atomjainak helyzetét. Csak nagyon hasonló vagy akár azonos szerkezetek egymáshoz igazításánál fontos figyelembe venni az oldallánc atomjainak helyzetét. Ebben az esetben az RMSD nemcsak a fehérjeváz konformációjának hasonlóságát tükrözi , hanem az oldalláncok rotamer állapotait is. A zaj csökkentésének és a helyes egyezések számának növelésének további módjai a másodlagos szerkezeti elemek címkézése, a natív érintkezési térképek vagy a maradványok kölcsönhatási mintái, az oldallánc-tömörödés mértékének mérése és a hidrogénkötések megmaradásának mértéke [29] .

Módszerek

DALI

Az egyik népszerű szerkezeti igazítási módszer a DALI ( távolsági mátrix módszer ) . A kezdeti fehérjeszerkezeteket hexapeptidekre bontják, és a távolságmátrixot a fragmentumok közötti érintkezési minták értékelésével számítják ki. A másodlagos szerkezet elemei, amelyek maradványai szomszédosak a sorozatban, a mátrix főátlóján vannak; a mátrix fennmaradó átlói a sorozatban nem egymás mellett található csoportok közötti térbeli érintkezéseket tükrözik. Ha két fehérje távolságmátrixában azonos vagy hasonló elemek vannak megközelítőleg azonos pozícióban, akkor elmondható, hogy a fehérjék hasonló hajtásúak, és másodlagos szerkezeti elemeiket hozzávetőlegesen azonos hosszúságú hurkok kötik össze. A DALI-illesztés közvetlen folyamata két fehérjéhez épített hasonlósági mátrixok keresése, amelyeket aztán egy standard pontszámmaximalizáló algoritmus segítségével újra összeállítanak a végső illesztésbe [30] .

A DALI módszerrel létrehozták az FSSP ( Families of Structuralally Like Proteins ) adatbázist, amelyben az összes ismert fehérjeszerkezetet páronként egymáshoz igazították, hogy meghatározzák térbeli kapcsolatukat és a redők osztályozását [31] .

A DaliLite egy letölthető program, amely a DALI algoritmust használja [32] .

Kombinatorikus kiterjesztés

A kombinatorikus kiterjesztési (CE) módszer hasonló a DALI-hoz, mivel az egyes struktúrákat több töredékre bontja, amelyeket aztán megpróbál újra összeállítani egy teljes igazításba. A töredékek páronkénti kombinációinak sorozatát, az úgynevezett AFP-ket ( illesztett fragmenspárok ) használják egy hasonlósági mátrix meghatározására, amelyen keresztül egy optimális útvonalat rajzolnak meg a végső igazítás meghatározásához. Az illesztésnek megfelelő utat a hasonlósági mátrixon keresztüli optimális útvonalként számítjuk ki a szekvenciákon való lineáris áthaladással, meghosszabbítva a következő lehetséges magas pontszámú AFP igazítását. Csak azok az AFP-k szerepelnek a mátrixban, amelyek megfelelnek a megadott lokális hasonlósági kritériumoknak, ami csökkenti a szükséges keresési területet és növeli a hatékonyságot [33] .

A DALI-hoz vagy az SSAP-hoz hasonlóan a CE-t használták a PDB-ből származó fehérjék ismert térbeli struktúrái alapján a redők osztályozási adatbázisának létrehozására [34] .

Jegyzetek

↑ Szerelje fel a DM-et. Bioinformatika: szekvencia- és genomelemzés . — 2. - Cold Spring Harbor Laboratory Press: Cold Spring Harbor, NY., 2004. - ISBN 0-87969-608-7 .
↑ 1 2 Basic Local Alignment Search Tool (BLAST) // Bioinformatika és funkcionális genomika. - Hoboken, NJ, USA: John Wiley & Sons, Inc. - 100-138. o . - ISBN 9780470451496 , 9780470085851 .
↑ Bill MacCartney, Michel Galley, Christopher D. Manning. Fázisalapú igazítási modell természetes nyelvi következtetéshez // A természetes nyelvi feldolgozás empirikus módszerei konferencia előadásai - EMNLP '08. - Morristown, NJ, USA: Association for Computational Linguistics, 2008. - doi : 10.3115/1613715.1613817 .
↑ Julie D. Thompson, Desmond G. Higgins, Toby J. Gibson. CLUSTAL W: a progresszív többszörös szekvencia-illesztés érzékenységének javítása szekvenciasúlyozás, pozíció-specifikus résbüntetések és súlymátrixválasztás révén // Nucleic Acids Research. - 1994. - T. 22 , sz. 22 . - S. 4673-4680 . — ISSN 1362-4962 0305-1048, 1362-4962 . doi : 10.1093 / nar/22.22.4673 .
↑ INDEL Mutáció - MeSH - NCBI . www.ncbi.nlm.nih.gov. Hozzáférés időpontja: 2019. április 29. (határozatlan)
↑ Igazított FASTA formátum . www.cgl.ucsf.edu. Letöltve: 2019. április 29. Az eredetiből archiválva : 2021. január 24. (határozatlan)
↑ Igazítási formátumok . emboss.sourceforge.net. Letöltve: 2019. április 30. Az eredetiből archiválva : 2018. június 24. (határozatlan)
↑ Bioinformatikai eszközök GYIK - Munkarendezői szekvenciaelemző eszközök - EMBL-EBI . www.ebi.ac.uk. Letöltve: 2019. április 23. Az eredetiből archiválva : 2019. április 23. (határozatlan)
↑ 1 2 3 4 A. M. Waterhouse, JB Procter, DMA Martin, M. Clamp, GJ Barton. Jalview 2-es verzió – egy többszörös szekvencia-illesztési szerkesztő és elemző munkaasztal // Bioinformatika . — 2009-05-01. — Vol. 25 , iss. 9 . - P. 1189-1191 . - ISSN 1460-2059 1367-4803, 1460-2059 . - doi : 10.1093/bioinformatika/btp033 . Archiválva az eredetiből 2017. október 24-én.
↑ Színsémák . www.jalview.org. Letöltve: 2019. április 23. Az eredetiből archiválva : 2019. április 26.. (határozatlan)
↑ 1 2 Mihail Fursov, Olga Golosova, Konstantin Okonechnikov. Unipro UGENE: egységes bioinformatikai eszköztár // Bioinformatika . — 2012-04-15. — Vol. 28 , iss. 8 . - P. 1166-1167 . — ISSN 1367-4803 . - doi : 10.1093/bioinformatika/bts091 . Archiválva az eredetiből: 2019. április 30.
↑ Koichiro Tamura, Joel Dudley, Masatoshi Nei, Sudhir Kumar. MEGA: Biológus-centrikus szoftver DNS- és fehérjeszekvenciák evolúciós elemzéséhez (angol) // Briefings in Bioinformatics. — 2008-07-01. — Vol. 9 , iss. 4 . - P. 299-306 . — ISSN 1467-5463 . - doi : 10.1093/bib/bbn017 . Archiválva az eredetiből: 2019. április 30.
↑ Thomas D. Schneider, R. Michael Stephens. Szekvencialogók: új módja a konszenzusos szekvenciák megjelenítésének // Nucleic Acids Research. - 1990. - T. 18 , sz. 20 . - S. 6097-6100 . — ISSN 1362-4962 0305-1048, 1362-4962 . doi : 10.1093 / nar/18.20.6097 .
↑ Erik LL Sonnhammer, Richard Durbin. Egy pontmátrix program dinamikus küszöbszabályozással genomiális DNS- és fehérjeszekvencia- analízishez // Gene. — Elsevier , 1995-12. — Vol. 167 , iss. 1-2 . - P. GC1-GC10 . — ISSN 0378-1119 . - doi : 10.1016/0378-1119(95)00714-8 . Az eredetiből archiválva: 2008. december 2.
↑ 1 2 3 Valerij O Poljanovszkij, Mikhail A Roytberg, Vladimir G Tumanyan. Egy globális algoritmus és egy lokális algoritmus minőségének összehasonlító elemzése két szekvencia összehangolására // Algorithms for Molecular Biology. - 2011. - 20. évf. 6 , iss. 1 . — 25. o . — ISSN 1748-7188 . - doi : 10.1186/1748-7188-6-25 . Archiválva az eredetiből 2019. április 23-án.
↑ 1 2 Páronkénti szekvencia igazítási eszközök < EMBL-EBI . www.ebi.ac.uk. Letöltve: 2019. április 23. Az eredetiből archiválva : 2019. április 12. (határozatlan)
↑ Aloysius J. Phillips. Homológiaértékelés és molekuláris szekvencia-illesztés // Journal of Biomedical Informatics. — 2006-02. - T. 39 , sz. 1 . - S. 18-33 . — ISSN 1532-0464 . - doi : 10.1016/j.jbi.2005.11.005 .
↑ MC Frith. Funkcionális szekvenciaelemek keresése többszörös lokális illesztéssel // Nucleic Acids Research. - 2004-01-02. — Vol. 32 , iss. 1 . - P. 189-200 . — ISSN 1362-4962 . doi : 10.1093 / nar/gkh169 . Archiválva az eredetiből 2017. július 22-én.
↑ M. Brudno, S. Malde, A. Poliakov, C. B. Do, O. Couronne. Glokális igazítás: átrendeződések keresése az igazítás során // Bioinformatika. - 2003-07-03. - T. 19 , sz. Rugalmas 1 . - S. i54-i62 . - ISSN 1460-2059 1367-4803, 1460-2059 . - doi : 10.1093/bioinformatika/btg1005 .
↑ BLAST: Alapvető helyi igazítási keresőeszköz . blast.ncbi.nlm.nih.gov. Letöltve: 2019. április 23. Az eredetiből archiválva : 2020. augusztus 21. (határozatlan)
↑ WR Pearson, DJ Lipman. Továbbfejlesztett eszközök a biológiai szekvencia-összehasonlításhoz (angol) // Proceedings of the National Academy of Sciences . - Nemzeti Tudományos Akadémia , 1988-04-01. — Vol. 85 , iss. 8 . - P. 2444-2448 . - ISSN 1091-6490 0027-8424, 1091-6490 . - doi : 10.1073/pnas.85.8.2444 .
↑ J. Thompson. A CLUSTAL_X windows felület: rugalmas stratégiák többszörös szekvencia-illesztéshez minőségelemző eszközökkel // Nucleic Acids Research. — 1997-12-15. - T. 25 , sz. 24 . - S. 4876-4882 . — ISSN 1362-4962 . doi : 10.1093 / nar/25.24.4876 .
↑ R. C. Edgar. MUSCLE: többszörös szekvencia illesztés nagy pontossággal és nagy áteresztőképességgel // Nucleic Acids Research. - 2004-03-08. - T. 32 , sz. 5 . - S. 1792-1797 . — ISSN 1362-4962 . doi : 10.1093 / nar/gkh340 .
↑ Zhang Y. , Skolnick J. A fehérjeszerkezet előrejelzési problémája a jelenlegi PDB könyvtár használatával megoldható. (angol) // Proceedings of the National Academy of Sciences of the United States of America. - 2005. - 20. évf. 102. sz. 4 . - P. 1029-1034. - doi : 10.1073/pnas.0407152101 . — PMID 15653774 .
↑ Zhang, Y.; Skolnick, J. Gyengén homológ fehérjék automatizált szerkezetének előrejelzése genomi skálán // Proceedings of the National Academy of Sciences of the United States of America : Journal . - 2004. - május. - doi : 10.1073/pnas.0305695101 . — PMID 15126668 .
↑ GL Hura; AL Menon. Robusztus, nagy áteresztőképességű megoldás szerkezeti elemzései kis szögű röntgenszórással (SAXS ) // Nature Methods : Journal. - 2009. - július. - doi : 10.1038/nmeth.1353 . — PMID 19620974 .
↑ Cohen, F.E.; Sternberg, MJ A fehérjeszerkezet előrejelzéséről: a négyzetgyök-eltérés jelentősége // Journal of Molecular Biology : folyóirat. - 1980. - doi : 10.1016/0022-2836(80)90289-2 . — PMID 7411610 .
↑ Zemla A. LGA: Módszer fehérjeszerkezetek 3D hasonlóságainak megtalálására. (angol) // Nukleinsavak kutatása. - 2003. - 20. évf. 31. sz. 13 . - P. 3370-3374. — PMID 12824330 .
↑ Godzik A. Két fehérje közötti szerkezeti összeillesztés: van-e egyedi válasz? (angol) // Protein science: a Protein Society kiadványa. - 1996. - 1. évf. 5, sz. 7 . - P. 1325-1338. - doi : 10.1002/pro.5560050711 . — PMID 8819165 .
↑ Liisa Holm; Laura M. Laakso. Dali szerver frissítés (eng.) // Nature Methods : Journal. - 2016. - április 29. - doi : 10.1093/nar/gkw357 . — PMID 27131377 .
↑ Holm L. , Sander C. A háromdimenziós fehérjeredők Dali/FSSP osztályozása. (angol) // Nukleinsavak kutatása. - 1997. - 1. évf. 25, sz. 1 . - P. 231-234. — PMID 9016542 .
↑ Holm L. , Park J. DaliLite munkapad fehérjeszerkezet összehasonlításhoz. (angol) // Bioinformatika. - 2000. - Vol. 16. sz. 6 . - P. 566-567. — PMID 10980157 .
↑ Shindyalov IN , Bourne PE A fehérjeszerkezet összehangolása az optimális út inkrementális kombinatorikus kiterjesztésével (CE). (angol) // Protein engineering. - 1998. - Vol. 11, sz. 9 . - P. 739-747. — PMID 9796821 .
↑ Prlic A. , Bliven S. , Rose PW , Bluhm WF , Bizon C. , Godzik A. , Bourne PE Pre-calculated protein structure alignments at the RCSB PDB website. (angol) // Bioinformatika. - 2010. - 20. évf. 26. sz. 23 . - P. 2983-2985. - doi : 10.1093/bioinformatika/btq572 . — PMID 20937596 .

Húrok
Karakterlánc hasonlósági mértékek	Távolság Damerau és Loewenstein között Levenshtein távolság Hamming távolság Jaro-Winkler hasonlóságok
Substring keresés	Boyer-Moore algoritmus Boyer-Moore-Horspool algoritmus Knuth-Morris-Pratt algoritmus Rabin-Karp algoritmus előtag funkció Z-függvény Algoritmus Aho - Korasik
palindromák	palindromfa Menedzser algoritmusa
Sorozat-igazítás	Needleman-Wunsha algoritmus Smith-Waterman algoritmus
Utótag szerkezetek	Utótag tömb Utótag automata utótag fa előtag fa
Egyéb	elemzése Mintaillesztés A legnagyobb közös sorozat Legnagyobb közös részkarakterlánc