Motívum (molekuláris biológia)

A molekuláris biológiában a motívum egy viszonylag rövid nukleotid- vagy aminosav-szekvencia , amely keveset változik az evolúció során , és legalábbis feltételezhetően bizonyos biológiai funkcióval rendelkezik [1] [2] [3] . A motívumot néha nem egy meghatározott sorozatként, hanem valamilyen módon leírt szekvenciákként értjük, amelyek mindegyike képes egy adott motívum egy bizonyos biológiai funkcióját betölteni [4] .

A motívumok mindenütt jelen vannak az élő szervezetekben, és számos létfontosságú funkciót látnak el, mint például a transzkripció és transzláció szabályozása (nukleotid motívumok esetén), a poszttranszlációs módosítás és a fehérjék sejtes lokalizációja , és részben meghatározzák funkcionális tulajdonságaikat ( leucin cipzár ) [ 2] [5] . Széles körben használják a bioinformatikában a gének és fehérjék funkcióinak előrejelzésére, szabályozási térképek felépítésére, és fontosak a géntechnológia és általában a molekuláris biológia számos problémájában [6] [7] [8] .

A motívumok gyakorlati jelentősége miatt mind bioinformatikai módszereket ( MEME , Gibbs Sampler), mind in vivo motívumkeresési módszereket ( ChIP-seq , ChIP-exo) fejlesztettek ki. Ez utóbbiak meglehetősen gyakran adják meg a motívumok közelítő koordinátáit, majd eredményeiket bioinformatikai módszerekkel [ 1 ] .mátrix[6]2][ [2] finomítják .

A motívumot meg kell különböztetni a szorosan kapcsolódó, jelentős biológiai funkcióval nem rendelkező organizmusok konzervatív területeitől, ahol a mutációs folyamatnak nem volt ideje kellőképpen megváltoztatni azokat [9] .

Motívumok nukleinsavakban

A DNS esetében a motívumok leggyakrabban olyan rövid szekvenciák, amelyek fehérjék, például nukleázok és transzkripciós faktorok kötőhelyei , vagy már RNS szinten is részt vesznek olyan fontos szabályozó folyamatokban , mint a riboszóma leszállás , mRNS feldolgozás és transzkripció termináció . [4] .

A tanulás rövid története

A DNS-ben található motívumok vizsgálata a DNS- szekvenálási eljárás (a DNS-fragmens nukleotidszekvenciáját meghatározó ) 1973-as [10] megjelenése révén vált lehetővé . Először a lac operátor és a lambda operátor [11] szekvenciáját határoztuk meg . A produktívabb szekvenálási módszerek [12] megjelenése előtt azonban a motívumszekvenciák száma meglehetősen kicsi maradt. Az 1970-es évek végére számos példa volt olyan mutáns szekvenciákra (helyekre), amelyek transzkripciós faktorokat és megváltozott specificitású szekvenciákat kötnek [13] . A szekvenciák számának növekedésével a motívumok elméleti előrejelzésének módszerei kezdtek kialakulni. 1982 - ben állítottak elő először egy pozíciósúly mátrixot (PWM) a transzlációs iniciációs hely motívumából. A megszerkesztett PVM segítségével más fordítási iniciációs helyeket is megjósoltak [14] . Ez a megközelítés meglehetősen hatékonynak bizonyult, és a mai napig különféle formákban használják ismert motívumok keresésére a genomokban, és a specifikus módszerek csak a súlyfüggvény típusában különböznek [4] . A meglévő szekvenciák alapján a PWM felépítésén alapuló megközelítés azonban nem tette lehetővé alapvetően új motívumok megtalálását, ami nehezebb feladat. Az első algoritmust, amely ezt a problémát megoldotta, Gallas és munkatársai javasolták 1985-ben [15] . Ez az algoritmus azon alapult, hogy közös szavakat találtak szekvenciákban, és nagy százalékban adtak hamis negatívokat, de egy egész algoritmuscsalád alapja lett [16] . Később pontosabb valószínűségi módszereket fejlesztettek ki: a várakozásmaximalizálási eljáráson alapuló MEME algoritmust [17] és a szintén várakozásmaximalizálási eljáráson alapuló Gibbs Sampler algoritmust [18] . Mindkét módszer nagyon érzékenynek bizonyult, és jelenleg a szekvenciakészletek motívumainak előrejelzésére használják.

A transzkripciós faktor kötő motívumainak előrejelzésére és megfelelő számú transzkripciós faktor és motívum közötti megfeleltetés megállapítására szolgáló hatékony eszközök kifejlesztése után lehetővé vált egy, a motívumhoz közel eső operon funkcióinak előrejelzése a transzkripciós faktor specifitása alapján. kötődik hozzá, és fordítva, hogy előre jelezze a transzkripciós faktort az operonban lévő génekből, egy bizonyos motívum mellett [3] .

Oldalak összekapcsolása

Transzkripciós szabályozás

Tipikus példák a transzkripció szabályozására, amelyet egy speciális motívumot felismerő fehérje segítségével hajtanak végre:

  1. Purin represszor hely PurR Escherichia coliban . A PurR egy 16 nukleotidból álló szekvenciához kötődik, amely a purin operon előtt helyezkedik el, és szabályozza a purin és pirimidin nukleotidok szintéziséért felelős gének transzkripcióját [5] [19] . Érdekes módon az E. colitól evolúciósan távol lévő Bacillus subtilis baktérium is rendelkezik egy purinrepresszorral, amely nem homológ a PurR-rel [20] ;
  2. A Lac laktóz operon helye . A laktóz operont a LacI represszor szabályozza , amely a DNS-hez kötődve megakadályozza a laktóz katabolizmusáért felelős gének átírását [6] .
Fordítási szabályzat

A motívumfelismerő szabályozók transzlációs szabályozásának néhány legismertebb példája:

  1. A prokarióta riboszóma leszállóhelye  a Shine-Dalgarno szekvencia [21] , itt a kötődés a riboproteinnel történik ;
  2. Az eukarióta riboszóma leszállóhelye  a Kozak szekvencia , a kötődés az eIF1 eukarióta transzlációs iniciációs faktorral történik [7] ;
  3. Az IRE  olyan szabályozó elemek, amelyek az enzimek (például a ferritin ) mRNS- ének 5'UTR -én és/vagy 3'UTR -ján helyezkednek el, és szabályozzák a sejt vastartalmát. Az IRP1 ( az akonitáz citoszolos formája) és az IRP2 (katalitikusan inaktív akonitáz homológ ) fehérjék ezekhez a motívumokhoz kötődnek, és már az mRNS -hez való kötődésük tényével szabályozzák lebomlásuk sebességét vagy az abból végbemenő transzláció sebességét [22] .
Az indíték ereje

Egy fehérje vagy RNS és egy DNS-motívum kölcsönhatásának erőssége elsősorban ennek a motívumnak a szekvenciájától függ. Vannak "erős" motívumok, amelyek erős kölcsönhatást adnak egy fehérjével vagy RNS-sel, és vannak "gyenge" motívumok, amelyekkel a kölcsönhatás gyengébb. Szinte mindig meg lehet kapni az úgynevezett "konszenzus sorozatot" ("konszenzus"), vagyis olyan sorozatot, amelynek minden pozíciójában van egy betű, amely leggyakrabban a megfelelő pozícióban található a sorozatokban. különböző szervezetektől származó motívumok. A konszenzussorozatot tekintjük a legerősebbnek, ami szinte mindig az [23] . Kisebb (leggyakrabban 1-3) számú helyettesítés segítségével gyengébb motívumokat nyerünk belőle [24] .

Az indíték erejének fejlődése

Az evolúció folyamatában a motívumok erejét a természetes kiválasztódás szabályozza, és az indíték erősödhet vagy gyengülhet [25] . A motívum erősségének ilyen beállításának jellegzetes példája a Shine-Dalgarno (SD) szekvencia változékonysága. Szoros összefüggés van a szervezet által igényelt lefordított fehérje mennyisége és az előtte álló SD erőssége között [8] .

Fontos megjegyezni, hogy SD esetén bár a fehérjekötés erőssége közvetlenül korrelál a riboszóma 16S alegységének kötődésének erősségével, a transzlációs iniciáció sajátosságai miatt a konszenzus szekvencia nem feltétlenül garantálja a legtöbbet. hatékony transzláció ( a riboszóma iniciációs helyről való elhagyásának nehézsége miatt ). ) [6] . Ezért a Shine-Dalgarno szekvencia leggyakrabban 4-5 nukleotidot tartalmaz a konszenzus szekvenciából, az utóbbi körülbelül 7 nukleotid hosszúságú [26] .

RNS kapcsolók

Egy egyértelműen biológiailag jelentős szerepet játszó motívum jelenléte nem mindig jelenti a szabályozó fehérje jelenlétét. A szabályozás úgy is végrehajtható, hogy az RNS-t valamilyen kis molekulatömegű anyaghoz kötjük . Ezt az elvet alkalmazzák RNS-kapcsolók  , a transzkripció során az RNS-en kialakuló, kis molekulák megkötésére képes struktúrák felépítésére [27] [28] . A molekulakötés befolyásolja a riboswitch azon képességét, hogy megállítsa a transzkripciót vagy zavarja a transzlációt. Ebben az esetben nem a nukleotidsorrend mint olyan a fontos, hanem a komplementer nukleotidok jelenléte a szekvencia megfelelő helyein [4] .

Szabályozás másodlagos szerkezet szerint

A transzláció szabályozása is csak a nukleinsav által alkotott másodlagos szerkezetnek köszönhetően valósítható meg.

  1. A Rho-független transzkripciós terminátor  egy hajtű , amely a szintetizált mRNS-en képződik a transzláció megkezdése előtt, megakadályozva a további mRNS-szintézist ( Terminátor (DNS) ) [29] ;
  2. Az IRES  egy összetett szerkezet az eukarióta vírusok mRNS-ében, amely biztosítja a transzláció belső iniciációját [30] .

Motívum szerkezete

A transzkripciós faktor-kötő motívumok gyakran valamilyen szekvencia közvetlen ismétlődései, fordított ismétlődései vagy palindrom szekvenciák formájában jelentkeznek . Ez magyarázható a transzkripciós faktorok fehérje dimerek formájában történő munkájával, amelyekben a monomerek mindegyike ugyanazt a szekvenciát köti. Vannak a nagyobb ismétlés motívumai is [6] . A motívumok ilyen szerkezete élesebb reakciót biztosít a külső körülmények változásaira. Például, ha a kötődés egy anyag koncentrációjától függ a sejtben, akkor megkapjuk a Michaelis-Menten egyenlet által leírt sejtreakcióerő függőségét . A fehérjekötő egységek számának növekedésével (feltételezzük, hogy egy motívumhoz való fehérjekötés hatása csak az összes ismétlődéshez való kötődés esetén nyilvánul meg), a függőség egyre inkább a Heaviside felé hajló szigmoidhoz hasonlít. határig tartó funkció , amely leírja az élő rendszerek számos hatásra adott válaszának egyik fő elvét - a "all-or-nothing" törvényt ( angol  all-or-nothing law ) [6] , például az akciós potenciál [31] .

Motívumok fehérjékben

A fehérjék esetében különbséget kell tenni

  • motívum az aminosavszekvenciában
  • szerkezeti motívum - a másodlagos szerkezet több egymáshoz közel elhelyezkedő elemének kölcsönös elrendezése a térben [2] [22] . A sorozaton ezek az elemek távol lehetnek egymástól [32] .

Motívumok az elsődleges szerkezetben (fehérje szekvenciák)

Az elsődleges szerkezet motívumai hasonlóak a nukleinsavak motívumaihoz. Tipikus példák ezekre:

  1. A szignálpeptidek  rövid, körülbelül 3-60 aminosav hosszúságú aminosavszekvenciák egy fehérjén belül [33] , amelyek meghatározzák, hogy a szintézis után a sejt melyik részébe kerüljön . Ilyen például a nukleáris lokalizációs jel ;
  2. fehérjék poszttranszlációs módosulásának helyei , amelyek 5-12 aminosav nagyságrendű konzervatív peptidek [6] . Példa erre az acetilációs helyek egy fehérjében [34]

Strukturális motívumok

A fehérjékben a szerkezeti motívumok a másodlagos szerkezet elemei közötti kötéseket írják le. Az ilyen motívumok gyakran változó hosszúságú szakaszokkal rendelkeznek, amelyek bizonyos esetekben teljesen hiányozhatnak [22] .

  1. Leucin cipzár  – a DNS-t megkötő dimer fehérjékre jellemző. A leucinvillám hidrofób kölcsönhatások következtében érintkezést biztosít két fehérje monomer között [22] [35] . Jellemzője , hogy minden hetedik pozícióban van egy leucin - maradék .
  2. Cink ujjak  - jellemző a DNS-kötő transzkripciós faktorokra [22] [36] ;
  3. A Helix-turn-helix  egy DNS-kötő motívum, pontosan ilyen DNS-kötő fragmentum a Lac-represszorban [22] .
  4. A homeodomain  egy olyan motívum, amely megköti a DNS-t és az RNS-t. Az eukariótákban a homeodoménnel rendelkező fehérjék sejtdifferenciációt indukálnak azáltal, hogy a szövetek és szervek kialakulásához szükséges génkaszkádokat indítják el. Úgy néz ki, mint egy „spirál-fordul-spirál” motívum, ezért gyakran nem különítik el [22] [37] .
  5. A Rossmann-redő  egy olyan motívum, amely nukleotidokat köt (például NAD) [38] . Különösen a dehidrogenázokban fordul elő, beleértve a gliceraldehid-3-foszfát-dehidrogenázt , amely részt vesz a glikolízisben .
  6. Az EF kar, egy Ca 2+ -ionokat megkötő motívum, szintén hasonló a hélix-turn-helix motívumhoz [39] .
  7. Fészek  – három egymást követő aminosav alkotja az anionkötő helyet [40] .
  8. Niche  – három egymást követő aminosav kationkötő helyet alkot [41] .
  9. Béta-hajtű  – két β-szál, amelyeket a fehérjelánc rövid fordulata köt össze [42] .

A béta-hajtűn kívül sok más motívumot is megkülönböztetnek, amelyek funkciója a fehérje szerkezeti vázának kialakítása [43] .

A fehérje szerkezeti motívuma kifejezéshez közel áll a styling  – a másodlagos szerkezet elemeinek jellegzetes elrendezése. Hasonlóságuk miatt a kifejezéseket gyakran használják a másik helyett, és a köztük lévő határ elmosódik [43] [44] .

Motívumok ábrázolása

Kezdetben van egy sor motívum különböző sorozatokból, és a feladat be van állítva [2] :

  • mutassa be azokat tömören és világosan;
  • hogy egy motívum bemutatásán meg tudjon kutatni annak új előfordulásai után.

A motívumok ábrázolásának több általánosan elfogadott módja is létezik [45] . Némelyikük alkalmas fehérjékre és nukleotidokra, a másik részük csak fehérjékre vagy nukleotidokra.

Konszenzus

Szigorú konszenzus

A motívum szigorú konszenzusa egy olyan karakterlánc, amely a motívum megvalósításainak halmazában a leginkább reprezentált betűkből áll. A gyakorlatban nem csak az adott pozícióban leggyakrabban előforduló betűt tüntetik fel, hanem azt is, ha egy adott pozícióban bármely betű előfordulásának maximális gyakorisága kisebb, mint egy adott küszöbérték, akkor x(az ábécé bármely betűje) kerül beírásra. ez a hely konszenzusban. Ilyen konszenzussal szinte biztosan találunk olyan szekvenciákat, amelyek valójában motívumok, de nagyon sok olyan motívum hiányzik, amelyek több helyettesítéssel különböznek a konszenzustól [2] [4] [9] . Az alábbiakban egy példa az erős konszenzusra egy öt UniProt fehérje motívumrégiójára vonatkozóan, leucin cipzár motívummal (a küszöbértéket 80%-nak vettük):

Pozíciószám
UniProt azonosító egy 2 3 négy 5 6 7 nyolc 9 tíz tizenegy 12 13 tizennégy tizenöt
O35048 L S P C G L R L én G A H P én L
Q6XXX9 L G K D én C D L F én A L D V L
Q9N298 L G K V T C D L F én A L D V L
Q61247 L S P L S V A L A L S H L A L
B0BC06 L T én G K Y S L Y A én D G T L
Konszenzus L x x x x x x L x x x x x x L
Laza konszenzus

A nem szigorú konszenzus a megfelelő helyen leginkább reprezentált betűk listáinak sorozata. Leírjuk az összes vagy a leggyakrabban előforduló betűket egy adott helyen (általában egy minimális gyakorisági küszöb van beállítva) [2] . Valójában a motívumot egy reguláris kifejezéssel írják le [4] [9] . Megnevezésként a következők használatosak:

  • ábécé - egyedi karakterek halmaza, amelyek egy adott aminosavat / nukleotidot vagy aminosavak / nukleotidok halmazát jelölik;
  • ABC - alfabetikus karaktersorozat, amely az egymást követő karakterek sorozatát jelöli;
  • [ABC] - a szögletes zárójelben lévő ábécéből vett karaktersorok bármelyike ​​megegyezik a megfelelő karakterekkel; például az [ABC] egyezik A-val vagy B-vel vagy C-vel;
  • {ABC..DE} - az ábécéből vett karakterláncok bármely aminosavnak megfelelnek, kivéve a zárójelben lévőket; például {ABC}megfelel bármely aminosavnak, kivéve A, Bés C;
  • xkisbetű - az ábécé bármely karaktere.

Egy ilyen reprezentáció esetén egyensúlyt kell teremteni a konszenzus érzékenysége (az általuk talált valós motívumok száma) és a specificitás (a módszer azon képessége között, hogy elutasítja a felesleges szekvenciákat) között [1] . Az alábbiakban egy példa látható a nem szigorú konszenzusra ugyanarra az öt fehérjeszekvenciára, mint az erős konszenzusra (a küszöbértéket 20%-nak vettük). Látjuk, hogy a 10. pozícióban a motívum nem teljesen objektív – a leucin ( L) és az izoleucin ( I) tulajdonságaiban nagyon hasonló aminosavak, és logikus lenne, ha mindkettőt belefoglalnánk a konszenzusba.

Pozíciószám
UniProt azonosító egy 2 3 négy 5 6 7 nyolc 9 tíz tizenegy 12 13 tizennégy tizenöt
O35048 L S P C G L R L én G A H P én L
Q6XXX9 L G K D én C D L F én A L D V L
Q9N298 L G K V T C D L F én A L D V L
Q61247 L S P L S V A L A L S H L A L
B0BC06 L T én G K Y S L Y A én D G T L
Konszenzus L [SG] [PQ] x x C D L F én A [LH] D V L
Prosite konszenzus (fehérjékhez)

A PROSITE az IUPAC -ot használja az egybetűs aminosavkódok jelölésére, a mintaelemek között használt "-" összefűzési karakter kivételével. A PROSITE használatakor számos szimbólumot adunk hozzá, hogy megkönnyítsük a fehérje motívum ábrázolását [46] :

  • ' <' - a minta a szekvencia N-terminálisára korlátozódik;
  • ' >' - a minta a sorozat C-végére korlátozódik;

Ha e egy elemsablon, és més nkét decimális egész szám és m<= n, akkor:

  • e(m)egyenértékű a epontosan megyszeri megismétléssel;
  • e(m,n)egyenlő azzal, hogy minden olyan egész számot megismételünk e, amely megfelel a feltételnek: <= <= ;kkmkn

Példa: egy cink ujj C2H2-típusú aláírásával ellátott domain motívum így néz ki: C-x(2,4)-C-x(3)-[LIVMFYWC]-x(8)-H-x(3,5)-H[47]

Pozíciós súlymátrix

A pozíciósúly mátrix egy olyan mátrix, amelynek oszlopai a sorozat pozícióinak, sorai pedig az ábécé betűinek felelnek meg. Ennek a mátrixnak az értékei egy adott betű előfordulásának gyakoriságai (vagy a frekvenciák monoton függvényei) a sorozat egy adott pozíciójában. Ebben az esetben általában a nulla gyakoriságok kizárása érdekében a pozíció minden betűjének előfordulási számához adnak egy bizonyos számot a betűk hasonló sorozatokban való a priori eloszlása ​​alapján [4] (például Laplace-korrekció bevezetik [48] ). Ez a megközelítés az előzőekhez hasonlóan implicit módon feltételezi, hogy a motívumban lévő pozíciók függetlenek, ami valójában még a nukleotidszekvenciák esetében sem figyelhető meg [2] [4] .

Tegyük fel, hogy 7 DNS-szekvenciánk van, amelyek a motívumot reprezentálják [9] :

Pozíciószám
Szám

sorozatok

egy 2 3 négy 5 6 7 nyolc
egy A T C C A G C T
2 G G G C A A C T
3 A T G G A T C T
négy A A G C A A C C
5 T T G G A A C T
6 A T G C C A T T
7 A T G G C A C T

A helyzetmátrix számukra a következő alakú lesz ( +1 - figyelembe véve a Laplace-szabályt) [9] :

Pozíciószám
Nukleotid egy 2 3 négy 5 6 7 nyolc
A 5+1 1+1 0+1 0+1 5+1 5+1 0+1 0+1
C 1+1 0+1 1+1 4+1 2+1 0+1 6+1 1+1
G 0+1 1+1 6+1 3+1 0+1 1+1 0+1 0+1
T 1+1 5+1 0+1 0+1 0+1 1+1 1+1 6+1

A gyakoriságok normalizálhatók a szekvencia teljes számára, ezáltal becslést kaphatunk egy adott szekvenciában egy adott nukleotid találkozásának valószínűségére (valójában a PWM-et általában egy ilyen reprezentációban tárolják) [2] :

Pozíciószám
Nukleotid egy 2 3 négy 5 6 7 nyolc
A 0,55 0.18 0,09 0,09 0,55 0,55 0,09 0,09
C 0.18 0,09 0.18 0,45 0.27 0,09 0,64 0.18
G 0,09 0.18 0,64 0,36 0,09 0.18 0,09 0,09
T 0.18 0,55 0,09 0,09 0,09 0.18 0.18 0,64

HMM (Hidden Markov Models)

A nagyobb pontosság érdekében a motívumban a szomszédos pozíciók függőségét figyelembe lehet venni az első és magasabb rendű rejtett Markov-modellek segítségével [2] [4] . Ez a megközelítés tele van bizonyos nehézségekkel, mivel alkalmazása megköveteli a motívumlehetőségek kellően reprezentatív mintáját. Az előző példa esetében a következőket kapjuk:

  • Egy 0-s rendű Markov-modellhez (egy nukleotid egy adott pozícióban való előfordulásának valószínűsége nem függ más pozícióktól – a PWM értelmezésének egy másik módja) [4] ;
  • Egy 1. rendű Markov-modellnél (a nukleotid egy adott pozícióban való megjelenésének valószínűsége csak az előző szekvenciában szereplő nukleotidtól függ. Könnyen belátható, hogy a modellparaméterek száma nagymértékben megnőtt) [4] . Az átmeneti valószínűségek kiszámításakor a Laplace-szabályt is alkalmaztuk. Az állapotok emissziós valószínűsége 1 azoknak a nukleotidoknak, amelyeknek megfelelnek, és 0 a többire.

A változó méretű és nukleotid összetételű régiókat tartalmazó motívumok esetében lehetőség lenne ezekre a régiókra külön modellt bevezetni, külön a konzervatívokra, majd köztes „néma” állapotok és átmenet hozzáadásával egy modellbe „ragasztani” őket. valószínûségei rájuk és onnan.. [4] .

SCS (Stochastic Context-Free Grammar)

Az RNS-ben másodlagos struktúrákat (RNS-kapcsolókat) alkotó motívumok esetében fontos figyelembe venni a másodlagos szerkezet elemeiben a nukleotidpárosodás lehetőségét . Az SCS megbirkózik ezzel a feladattal . Az SCS képzés azonban még nagyobb mintaméretet igényel, mint a HMM, és számos nehézséggel jár [4] .

Megtekintés nagy adatbázisokhoz

Azokban az esetekben, amikor fontos a keresés gyorsasága, és elfogadható motívumunk egyes előfordulásainak kihagyása, a kutatók különféle trükkökhöz folyamodnak, amelyek lehetővé teszik egy biopolimer (RNS vagy fehérje) térszerkezetének elfogadható pontosságú titkosítását, a kibővítéssel. ábécé [49] .

Motívumok megjelenítése a fehérjékben a fehérje térszerkezetének kódolásával

Az Escherichia coli laktózrepresszor LacI operonja ( PDB 1lcc lánc A) és a katabolizmus aktivátor génje ( PDB 3gap lánc A) egyaránt rendelkezik hélix-turn-helix motívummal, de aminosav-szekvenciáik nem nagyon hasonlóak. Kutatók egy csoportja kifejlesztett egy kódot, amelyet "3D-s lánckódnak" nevezett el, amely egy fehérje szerkezetét betűsorként ábrázolja. Ez a kódolási séma a szerzők szerint sokkal világosabban mutatja a fehérjék közötti hasonlóságot, mint az aminosavszekvenciák [49] :

Példa : a fent említett két fehérje összehasonlítása ezzel a kódolási sémával [49] :

EKT azonosító 3D kód Aminosav szekvencia
1lccA TWWWWWWWKCLKWWWWWWG LYDVAEYAGVSYQTVSRVV
3gapA KWWWWWWGKCFKWWWWWWW RQEIGQIVGCSRETVGRIL
Összehasonlítás Világos hasonlóság van a fehérjék között A fehérjék aminosav-szekvenciájukban nagyon különböznek egymástól.

ahol Wegy α-hélixnek, és Eés Degy β-szálnak felel meg.

Motívumok megjelenítése RNS-ben másodlagos szerkezettel (foldedBlast)

Ebben a munkában a BLAST - hoz hasonló keresési algoritmus alkalmazása érdekében a nukleotid ábécét (ATGC, mivel a keresés a genomban történt) kibővítettük nukleotidok és a feltételezett párosítási irányukat jellemző három karakter kombinálásával [50] :

  • ( - a nukleotid párosul a jobb oldali nukleotiddal;
  • ) - a nukleotid párosul a bal oldali nukleotiddal;
  • . - a nukleotid nincs párosítva.

Így az új ábécé 12 betűjét (4 nukleotid * 3 "irány") kaptuk, amely helyes használat esetén lehetővé teszi a BLAST-szerű keresést, amelyet a szerzők foldedBlast [50] -nek neveznek .

Sorozat logó

A motívumok vizuális megjelenítéséhez gyakran használják a sorozatok logóját - a motívum egyes pozícióinak konzervativizmusának grafikus ábrázolását. Ugyanakkor ez a vizualizáció sikeresen alkalmazható mind a motívum konszenzusos vagy pozicionális súlymátrix formájában történő ábrázolása esetén , mind a HMM szekvencia modell reprezentálására, ahogy az a Pfam fehérjecsalád adatbázisában történik [51]. .

Ezen túlmenően, ha például egy motívumban lévő egyes nukleotidok fényességét használjuk annak indikátoraként, hogy milyen gyakran felel meg egy komplementer nukleotidnak ugyanabban a motívumban , akkor a motívum másodlagos szerkezetére vonatkozó információ is részben ábrázolható. Ez történik például a RegPredict bioinformatikai webszolgáltatásban [52] .

Transzkripciós faktor kötőhelyek keresése in silico

A szabályozó fehérjék kötődéséért felelős motívumok nukleotid szekvenciákban történő keresésekor azt az elképzelést használják, hogy ezek [motívumok] viszonylag lassan változnak, ami azt jelenti, hogy ha olyan organizmusokat veszünk, amelyek elég távol vannak egymástól ahhoz, hogy a mutációk felhalmozódhassanak. szekvenciáik erősen változó pozícióiban, és a helyek még nem nagyon változtak, akkor használhatjuk a „ami konzervatív, az fontos” [2] szabályt . Miután olyan szekvenciákat kaptunk, amelyekben egy adott motívum jelenléte várható, a motívumszekvencia megtalálásának két megközelítését alkalmazzák elsősorban: a filogenetikai lábnyomat és a problémát a beillesztett motívum megtalálásának problémájára redukáljuk .

Filogenetikai lábnyom

A filogenetikai lábnyom-vizsgálat egy félig automatizált módszer. A szekvenciákat a többszörös illesztési program dolgozza fel , és az így létrejövő illesztésben a kutató olyan mintákat keres, amelyek motívumnak tekinthetők. E megközelítés alkalmazásának egyik legsikeresebb példája a nem riboszómális peptidek kódolásának nem riboszomális peptid szintetázok (NRPS) általi megfejtése [2] [53] [54] . Ez a módszer nem teszi lehetővé az indítékkeresés folyamatának teljes automatizálását, ugyanakkor nincsenek olyan súlyos korlátai, mint az alábbiak.

A beillesztett motívum megtalálásának problémája

A törés nélküli (majdnem) és a (majdnem) változó hosszúságú szakaszok nélküli motívumok esetében a motívumkeresés problémája lecsökkenthető a beillesztett motívum keresésének feladatára ( eng.  Planted motif search ) [2] [9] .

A feladat megfogalmazása a következő: „ A bemenet n db s 1 , s 2 , …, s n hosszúságú karakterlánc, amelyek mindegyike A betűkből és két számból – l és d – áll. Keresse meg az összes l hosszúságú x karakterláncot úgy, hogy bármelyik adott karakterlánc legalább egy részsorozatot tartalmazzon x-ből legfeljebb d Hamming-távolságra » [55] .

Mivel általános esetben nem tudható, hogy minden általunk kapott szekvenciában megvan-e a kívánt motívum, és ennek pontos hossza sem ismert, a problémát általában heurisztikus módszerekkel oldják meg - maximalizálva a talált motívum valószínűségét adott sorozatoknál. A MEME [17] és a GibbsSampler [56] programok ezen az elven alapulnak .

Ha beállítunk egy minimális küszöböt a motívumot tartalmazó szekvenciák számára, és valamilyen módon korlátozzuk a hosszát, akkor pontos módszereket használhatunk a probléma megoldására, például a RISOTTO algoritmust [57] . Némelyikük lehetővé teszi a kívánt motívumra vonatkozó korlátozások megszüntetését - a RISOTTO-ban a kívánt motívum megszakadhat, több részből állhat.

Ezek a módszerek azonban ritkán adnak jobb eredményeket, mint a MEME és a GibbsSamler, és sokkal tovább tartanak [2] [58] .

Kötőhelyek keresése in vitro

ChIP seq

A DNS-fehérje kölcsönhatások elemzésére szolgáló módszer, amely a kromatin immunprecipitáció (ChIP) és a nagy teljesítményű DNS- szekvenálás ötleteit ötvözi (a fehérjét a DNS-hez fuzionálják, majd a fehérjéhez fuzionált DNS-darabokat szekvenálásra küldik). A módszer működése során körülbelül 150 nukleotid hosszúságú régiókat kapunk, amelyeket azután in silico elemezni lehet egy motívum jelenlétére [59] .

ChIP-on-chip

A ChIP-seq módszerhez hasonlóan kromatin immunprecipitációt (ChIP) végeznek, majd a fehérjével való keresztkötést megfordítják, és a kapott DNS-t hibridizálják a DNS microarray -vel . A ChIP-on-chip módszer olcsóbb, mint a ChIP-seq, de pontossága jóval gyengébb az utóbbinál [6] .

ChIP-exo

Szintén kromatin immunprecipitáción (ChIP) alapuló módszer. A DNS-t csak az 5' végétől és csak a fehérjével való érintkezés hiányában lebontó λ fág exonukleáz alkalmazása lehetővé teszi több nukleotid nagyságrendű pontosság elérését a fehérjekötő hely helyzetének meghatározásában [ 60] .

SELEX

Egy iteratív módszer egy adott fehérjéhez jól kötődő nukleotidszekvenciák keresésére [61] . Az általános eljárás így néz ki:

  1. A számunkra érdekes fehérjét az oszlophoz varrjuk , amelyen azután egy randomizált régióból és egy adapterből álló szekvenciákból álló oldatot vezetünk át;
  2. Az oszlopon elhúzódó szekvenciákat PCR eljárással klónozzuk , és a reakcióelegy összetételét úgy választjuk meg, hogy a másolás során további hibákat okozzon. Az eredményül kapott klónokat a SELEX új köréhez küldik;
  3. Néhány szakaszonként szigorítanak a feltételek ( az oldat pH-ja , ionerőssége ), hogy egyre több fehérje-specifikus szekvencia maradjon az oszlopon;
  4. A kapott szekvenciák gyakran hasonlóak az élő szervezetek tényleges fehérjekötő motívumaihoz.

DamID

A vizsgált proteinből és adenin DNS metiltranszferáz Damból hibrid fehérjét állítanak elő [62] . Természetes körülmények között a legtöbb eukarióta esetében az adenin nem metilálódik. Amikor a hibrid fehérje a szervezet DNS-ének egy helyéhez kötődik, a metiltranszferáz rész módosítja az adenineket ezen a helyen, ami lehetővé teszi restrikciós endonukleázok felhasználását annak a helynek az izolálására, ahol a kívánt motívum valószínűleg található.

Jegyzetek

  1. ↑ 1 2 3 D'haeseleer Patrik. Mik azok a DNS-szekvencia motívumok?  (angol)  // Természet Biotechnológia. - 2006. - április 1. ( 24. kötet , 4. szám ). — P. 423–425 . — ISSN 1087-0156 . - doi : 10.1038/nbt0406-423 . Archiválva az eredetiből 2017. április 12-én.
  2. ↑ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Compeau Phillip, Pevzner Pavel. Bioinformatikai algoritmusok: aktív tanulási megközelítés, 2. kiadás. Vol. 1 , Phillip Compeau  . — 2. kiadás. - Active Learning Publishers, 2015. - 384 p. — ISBN 9780990374619 .
  3. ↑ 1 2 Koonin Eugene V. A véletlen logikája: A biológiai evolúció természete és eredete. - 1 kiadás. - FT Press, 2011. 06. 23. — 529 p. — ISBN 978-0132542494 .
  4. ↑ 1 2 3 4 5 6 7 8 9 10 11 12 13 Durbin Richard, Eddy Sean R., Krogh Anders, Mitchison Graeme. Biológiai szekvenciaelemzés: Fehérjék és nukleinsavak valószínűségi modelljei. - Cambridge University Press, 1998. - 372 p. — ISBN 978-0521620413 .
  5. ↑ 1 2 Purin represszor - Proteopedia, élet  3D -ben . proteopedia.org. Letöltve: 2017. április 11. Az eredetiből archiválva : 2017. április 12..
  6. ↑ 1 2 3 4 5 6 7 8 Alberts Bruce, Johnson Alexander, Lewis Julian, Raff Martin, Roberts Keith. A sejt molekuláris biológiája . — 4. - Garland Science, 2002-01-01. — ISBN 0815332181 . — ISBN 0815340729 . Archiválva : 2017. szeptember 27. a Wayback Machine -nál
  7. ↑ 1 2 Pestova TV, Kolupaeva VG, Lomakin IB, Pilipenko EV, Shatsky IN A fordítás kezdeményezésének molekuláris mechanizmusai eukariótákban  (angol)  // Proceedings of the National Academy of Sciences of the United States of America. - 2001. - június 19. ( 98. évf. , 13. szám ). — P. 7029–7036 . — ISSN 0027-8424 . - doi : 10.1073/pnas.111145798 . Archiválva az eredetiből 2017. április 23-án.
  8. ↑ 1 2 Evfratov Sergey A., Osterman Ilya A., Komarova Ekaterina S., Pogorelskaya Alexandra M., Rubtsova Maria P. A válogatás és a következő generációs szekvenálás alkalmazása az 5΄-UTR hatásának vizsgálatára a fordítási hatékonyságra Escherichia coliban   // Nukleinsav kutatás. - 2017. - április 7. ( 45. évf. , 6. szám ). - P. 3487-3502 . — ISSN 0305-1048 . - doi : 10.1093/nar/gkw1141 . Archiválva az eredetiből 2017. április 12-én.
  9. ↑ 1 2 3 4 5 6 Jones Neil C., Pevzner Pavel A. Bevezetés a bioinformatikai algoritmusokba. - 1 kiadás. - The MIT Press, 2004. - 435 p. — ISBN 9780262101066 .
  10. Gilbert W, Maxam A. A lac operátor nukleotidszekvenciája  //  Proceedings of the National Academy of Sciences. - 1973. - December ( 70. évf. , 12. szám ). - P. 3581-3584 . — PMID 4587255 . Archiválva az eredetiből 2017. április 24-én.
  11. Maniatis T, Ptashne M, Backman K, Kield D, Flashman S, Jeffrey A, Maurer R. Recognition sequences of repressor and polymerase in the operators of bacteriophage lambda   // Cell . - 1975. - június ( 5. kötet , 2. szám ). - 109-113 . o . — PMID 1095210 . Archiválva az eredetiből 2017. április 24-én.
  12. Sanger F, Nicklen S, Coulson AR. DNS szekvenálás láncvégző inhibitorokkal  (angol)  // Proceedings of the National Academy of Sciences. - 1977. - December ( 74. évf. , 12. szám ). - P. 5463-5467 . Archiválva az eredetiből 2017. április 2-án.
  13. Stormo GD. DNS-kötő helyek: reprezentáció és felfedezés.  (angol)  // Bioinformatika. - 2000. - január ( 16. évf. , 1. szám ). - P. 16-23 . Archiválva az eredetiből 2017. április 19-én.
  14. Stormo GD, Schneider TD, Gold LM. Translációs iniciációs helyek jellemzése E. coliban  //  Nucleic Acids Research. - 1982. - május 11. ( 10. kötet , 9. szám ). - P. 2971-2996 . Archiválva az eredetiből 2017. április 24-én.
  15. Gála DJ, Eggert M, Waterman MS. Szigorú mintafelismerő módszerek DNS-szekvenciákhoz. Escherichia coli-ból származó promoterszekvenciák elemzése.  (angol)  // Journal of Molecular Biology. - 1985. - november 5. ( 186. évf. , 1. sz.). — P. 117–128 . Archiválva az eredetiből 2017. április 24-én.
  16. Stormo GD. DNS-kötő helyek: reprezentáció és felfedezés.  (angol)  // Bioinformatika. - 2000. - január ( 16. évf. , 1. sz.). — P. 16–23 . Archiválva az eredetiből 2017. április 19-én.
  17. ↑ 1 2 T. L. Bailey, C. Elkan. Az előzetes tudás értéke a motívumok felfedezésében MEME segítségével   // Proceedings . Molekuláris Biológiai Intelligens Rendszerek Nemzetközi Konferencia. - 1995. - január 1. ( 3. köt. ). — P. 21–29 . — ISSN 1553-0833 . Archiválva az eredetiből 2017. április 24-én.
  18. Lawrence CE1, Altschul SF, Boguski MS, Liu JS, Neuwald AF, Wootton JC. Finom szekvenciajelek észlelése: Gibbs mintavételi stratégia többszörös igazításhoz.  (angol)  // Tudomány. - 1993. - október 8. ( 262. évf. , 5131. sz.). — P. 208–214 . Archiválva az eredetiből 2017. április 24-én.
  19. Jendresen Christian Bille, Martinussen Jan, Kilstrup Mogens. A PurR regulon a Lactococcus lactisben - a purin nukleotid metabolizmus és a transzlációs gépezet transzkripciós szabályozása  (angol)  // Mikrobiológia (Reading, Anglia). - 2012. - augusztus 1. ( 158. évf. , 8. szám ). — P. 2026–2038 . — ISSN 1465-2080 . - doi : 10.1099/mic.0.059576-0 . Archiválva az eredetiből 2017. április 19-én.
  20. Sinha Sangita C., Krahn Joseph, Shin Byung Sik, Tomchick Diana R., Zalkin Howard. A Bacillus subtilis purin represszora: a transzkripció szabályozására adaptált domének új kombinációja  (angol)  // Journal of Bacteriology. - 2003. - július 1. ( 185. évf. , 14. szám ). — P. 4087–4098 . — ISSN 0021-9193 . - doi : 10.1128/JB.185.14.4087-4098.2003 . Archiválva az eredetiből 2017. április 19-én.
  21. Shine J., Dalgarno L. Bakteriális riboszomális RNS terminális szekvencia analízise. Korreláció a 16-S RNS 3'-terminális polipirimidin szekvenciája és a riboszóma transzlációs specificitása között  //  European Journal of Biochemistry. - 1975. - szeptember 1. ( 57. kötet , 1. szám ). — P. 221–230 . — ISSN 0014-2956 . Archiválva az eredetiből 2017. április 19-én.
  22. ↑ 1 2 3 4 5 6 7 Nelson David L., Cox Michael M. Lehninger Biokémia alapelvei. — 7 kiadás. – W.H. Freeman, 2017.01.01. — 1328 p. — ISBN 9781464126116 .
  23. Stormo GD, Schneider TD, Gold L. A nukleotidszekvencia és a funkcionális aktivitás közötti kapcsolat kvantitatív elemzése  //  Nucleic Acids Research. - 1986. - augusztus 26. ( 14. kötet , 16. szám ). — P. 6661–6679 . — ISSN 0305-1048 . Archiválva az eredetiből 2017. április 19-én.
  24. Stormo GD DNS-kötő helyek: reprezentáció és felfedezés   // Bioinformatika (Oxford, Anglia) . - 2000. - január 1. ( 16. évf. , 1. szám ). — P. 16–23 . — ISSN 1367-4803 . Archiválva az eredetiből 2017. április 19-én.
  25. Shultzaberger Ryan K., Zehua Chen, Lewis Karen A., Schneider Thomas D. Az Escherichia coli σ 70 promoter anatómiája  //  Nucleic Acids Research. - 2007. - február 1. ( 35. kötet , 3. szám ). — P. 771–788 . — ISSN 1362-4962 . doi : 10.1093 / nar/gkl956 . Archiválva az eredetiből 2017. április 19-én.
  26. J. Shine, L. Dalgarno. A bakteriális riboszomális RNS terminális szekvencia elemzése. Korreláció a 16-S RNS 3'-terminális polipirimidin szekvenciája és a riboszóma transzlációs specificitása között  //  European Journal of Biochemistry. - 1975. - szeptember 1. ( 57. kötet , 1. szám ). - P. 221-230 . — ISSN 0014-2956 . Archiválva az eredetiből 2017. április 19-én.
  27. Riboswitch, RNS kapcsoló (riboswitch) . humbio.ru. Letöltve: 2017. április 11. Az eredetiből archiválva : 2017. április 12..
  28. Samuel E. Bocobza, Asaph Aharoni. Kis molekulák, amelyek kölcsönhatásba lépnek az RNS-sel: riboswitch-alapú génszabályozás és részvétele a növények és algák metabolikus szabályozásában  //  The Plant Journal: For Cell and Molecular Biology. - 2014. - augusztus 1. ( 79. évf. , 4. szám ). — P. 693–703 . — ISSN 1365-313X . - doi : 10.1111/tpj.12540 . Archiválva az eredetiből 2017. április 19-én.
  29. Hironori Otaka, Hirokazu Ishikawa, Teppei Morita, Hiroji Aiba. A bakteriális kis RNS-ek rho-független terminátorának poliU-farka elengedhetetlen a Hfq-működéshez  //  Proceedings of the National Academy of Sciences of the United States of America. - 2011. - augusztus 9. ( 108. évf. , 32. szám ). — P. 13059–13064 . — ISSN 0027-8424 . - doi : 10.1073/pnas.1107050108 . Archiválva az eredetiből 2022. július 3-án.
  30. Hiroshi Yamamoto, Marianne Collier, Justus Loerke, Jochen Ismer, Andrea Schmidt. A riboszómához kötött Hepatitis C vírus belső riboszomális belépési helyének RNS-ének molekuláris felépítése  //  The EMBO Journal. - 2015. - december 14. ( 34. évf. , 24. szám ). — P. 3042–3058 . — ISSN 0261-4189 . - doi : 10.15252/embj.201592469 .
  31. Andrej Kamkin, Andrej Alekszandrovics Kamenszkij. Alapvető és klinikai élettan. - Academia, 2004-01-01. — 1072 p. — ISBN 5769516755 .
  32. Strukturális motívumok  , EMBL - EBI Train online  (2011. november 25.). Archiválva az eredetiből 2017. április 12-én. Letöltve: 2017. április 12.
  33. Gonter Blobel, Bernhand Dobberstein. A fehérjék átvitele a membránokon keresztül. I. Proteolitikusan feldolgozott és feldolgozatlan születőben lévő immunglobulin könnyű láncok jelenléte az egér mielóma membránhoz kötött riboszómáin  //  The Journal of Cell Biology. - 1975. - december 1. ( 67. kötet , 3. szám ). — P. 835–851 . — ISSN 0021-9525 . Archiválva az eredetiből 2022. április 2-án.
  34. Qiu Wang-Ren, Sun Bi-Qian, Xiao Xuan, Xu Zhao-Chun, Chou Kuo-Chen. iPTM-mLys: több lizin PTM helyek és különböző típusaik azonosítása  (angol)  // Bioinformatika (Oxford, Anglia). - 2016. - október 15. ( 32. évf. , 20. szám ). — P. 3116–3123 . — ISSN 1367-4811 . - doi : 10.1093/bioinformatika/btw380 . Archiválva az eredetiből 2017. április 19-én.
  35. Landschulz WH, Johnson PF, McKnight SL A leucin cipzár: a DNS-kötő fehérjék új osztályára jellemző hipotetikus szerkezet   // Science (New York, NY) . - 1988. - június 24. ( 240. kötet , 4860. szám ). — P. 1759–1764 . — ISSN 0036-8075 . Archiválva az eredetiből 2017. április 19-én.
  36. Klug A., Rhodes D. Cink ujjak: új fehérjeredő a nukleinsavfelismeréshez  //  Cold Spring Harbor Symposia on Quantitative Biology. - 1987. - január 1. ( 52. köt. ). — P. 473–482 . — ISSN 0091-7451 . Archiválva az eredetiből 2017. április 19-én.
  37. Bürglin Thomas R., Affolter Markus. Homeodomain proteinek: frissítés  (angol)  // Chromosoma. - 2016. - január 1. ( 125. köt. ). — P. 497–521 . — ISSN 0009-5915 . - doi : 10.1007/s00412-015-0543-8 . Archiválva az eredetiből 2021. március 8-án.
  38. Rao ST, Rossmann MG A fehérjék szuperszekunder struktúráinak összehasonlítása  //  Journal of Molecular Biology. - 1973. - május 15. ( 76. kötet , 2. szám ). — P. 241–256 . — ISSN 0022-2836 . Archiválva az eredetiből 2017. április 23-án.
  39. Nelson Melanie R., Thulin Eva, Fagan Patricia A., Forsén Sture, Chazin Walter J. The EF-hand domain: A globally cooperative structure unit  //  Protein Science: A Publication of the Protein Society. - 2017. - április 14. ( 11. évf. , 2. szám ). — P. 198–205 . — ISSN 0961-8368 . - doi : 10.1110/ps.33302 .
  40. Watson James D., Milner-White E. James. Egy új főlánc anionkötő hely a fehérjékben: a fészek. A φ,ψ értékek sajátos kombinációja az egymást követő maradékokban olyan anionkötő helyeket eredményez, amelyek gyakran előfordulnak, és gyakran megtalálhatók a funkcionálisan fontos régiókban1  //  Journal of Molecular Biology. - 2002. - január 11. ( 315. évf. , 2. szám ). — P. 171–182 . - doi : 10.1006/jmbi.2001.5227 .
  41. Torrance Gilleain M., David P. Leader, Gilbert David R., Milner-White E. James. Egy új főlánc-motívum a kationos csoportokkal áthidalt fehérjékben: a niche  (angol)  // Journal of Molecular Biology. - 2009. - január 30. ( 385. évf. , 4. szám ). — P. 1076–1086 . — ISSN 1089-8638 . - doi : 10.1016/j.jmb.2008.11.007 . Archiválva az eredetiből 2017. április 23-án.
  42. Milner-White EJ, Poet R. A béta-hajtűk négy osztálya a fehérjékben.  (angol)  // Biokémiai folyóirat. - 1986. - november 15. ( 240. évf. , 1. szám ). — P. 289–292 . — ISSN 0264-6021 .
  43. ↑ 1 2 Efimov Alexander V. A globuláris fehérjékben kedvelt szerkezeti motívumok  (angol)  // Struktúra. - 1994. - november 1. ( 2. kötet , 11. szám ). — P. 999–1002 . - doi : 10.1016/S0969-2126(94)00102-2 .
  44. Holm L., Sander C. Dictionary of recurrent domains in protein structures   // Proteins . - 1998. - október 1. ( 33. kötet , 1. szám ). — P. 88–96 . — ISSN 0887-3585 . Archiválva az eredetiből 2017. április 23-án.
  45. Schneider TD, Stephens RM Sequence logók: új módja a konszenzusos szekvenciák megjelenítésének  //  Nucleic Acids Research. - 1990. - október 25. ( 18. évf. , 20. szám ). — P. 6097–6100 . — ISSN 0305-1048 . Archiválva az eredetiből 2017. április 20-án.
  46. de Castro Edouard, Sigrist Christian JA, Gattiker Alexandre, Bulliard Virgini, Langendijk-Genevaux Petra S. ScanProsite: detection of PROSITE signature matches and ProRule-asszociált funkcionális és szerkezeti maradékok fehérjékben  //  Nucleic Acids Research. - 2006. - július 1. ( 34. évf. , Web Server kiadás ). — P. W362–365 . — ISSN 1362-4962 . doi : 10.1093 / nar/gkl124 . Archiválva az eredetiből 2016. október 6-án.
  47. InterPro EMBL-EBI. Cink ujj C2H2-típusú (IPR013087) < InterPro < EMBL-  EBI . www.ebi.ac.uk. Letöltve: 2017. április 15. Az eredetiből archiválva : 2017. április 15.
  48. Flach Péter. Gépi tanulás. Az adatokból tudást kinyerő algoritmusok felépítésének tudománya és művészete. Tankönyv. — DMK Press, 2015-01-01. — 400 s. - ISBN 9785970602737 , 9781107096394.
  49. ↑ 1 2 3 Matsuda H., Taniguchi F., Hashimoto A. A fehérjeszerkezeti motívumok kimutatásának megközelítése gerinckonformációk kódolási sémája segítségével  //  Pacific Symposium on Biocomputing. Pacific Symposium on Biocomputing. - 1997. - január 1. — P. 280–291 . — ISSN 2335-6936 . Archiválva az eredetiből 2017. április 23-án.
  50. ↑ 1 2 Tseng Huei-Hun, Weinberg Zasha, Gore Jeremy, Breaker Ronald r., Ruzzo Walter l. Nem kódoló rnas keresése genomléptékű klaszterezés segítségével  //  Journal of Bioinformatics and computational Biology. - 2017. - április 12. ( 7. kötet , 2. szám ). — P. 373–388 . — ISSN 0219-7200 .
  51. Schuster-Böckler Benjamin, Jörg Schultz, Rahmann Sven. HMM logók fehérjecsaládok megjelenítéséhez  (angol)  // BMC Bioinformatics. - 2004. - január 1. ( 5. köt. ). — 7. o . — ISSN 1471-2105 . - doi : 10.1186/1471-2105-5-7 .
  52. Novichkov Pavel S., Rodionov Dmitry A., Stavrovskaya Elena D., Novichkova S., Kazakov Alexey E. RegPredict: anintegrated system for regulon inference in prokaryotes by comparative genomics approach  //  Nucleic Acids Research. - 2010. - július 1. ( 38. kötet , Webszerver kiadás ). —P.W299–307 . _ — ISSN 1362-4962 . doi : 10.1093 / nar/gkq531 . Archiválva az eredetiből 2017. április 24-én.
  53. Marahiel Mohamed A. A peptidszintézisben részt vevő többdomain enzimek  //  FEBS Letters. - 1992. - július 27. ( 307. kötet , 1. szám ). — P. 40–43 . — ISSN 1873-3468 . - doi : 10.1016/0014-5793(92)80898-Q . Archiválva az eredetiből 2017. április 12-én.
  54. Stachelhaus T., Mootz HD, Marahiel MA Az adenilációs domének specifitást biztosító kódja nem riboszómális peptid-szintetázokban  //  Chemistry & Biology. - 1999. - augusztus 1. ( 6. kötet , 8. szám ). - P. 493-505 . — ISSN 1074-5521 . - doi : 10.1016/S1074-5521(99)80082-9 . Archiválva az eredetiből 2017. április 19-én.
  55. Keich U., Pevzner PA Motívumok keresése a szürkületi zónában   // Bioinformatika (Oxford, Anglia) . - 2002. - október 1. ( 18. évf. , 10. szám ). - P. 1374-1381 . — ISSN 1367-4803 . Archiválva az eredetiből 2017. április 19-én.
  56. Thompson William A., Newberg Lee A., Conlan Sean, McCue Lee Ann, Lawrence Charles E. The Gibbs Centroid Sampler  //  Nucleic Acids Research. - 2007. - július 1. ( 35. évf. , Web Server kiadás ). –P.W232–237 . _ — ISSN 1362-4962 . - doi : 10.1093/nar/gkm265 .
  57. Carvalho AM, Freitas AT, Oliveira AL, Sagot MF Egy hatékony algoritmus strukturált motívumok azonosítására DNS-promoterszekvenciákban  //  IEEE/ACM Transactions on Computational Biology and Bioinformatics. - 2006. - április 1. ( 3. kötet , 2. szám ). — P. 126–140 . — ISSN 1545-5963 . - doi : 10.1109/TCBB.2006.16 . Archiválva az eredetiből 2017. szeptember 8-án.
  58. Dinh Hieu, Rajasekaran Sanguthevar, Davila Jaime. qPMS7: Gyors algoritmus a (ℓ, d)-motívumok megtalálásához a DNS- és fehérjeszekvenciákban  (angol)  // PLOS ONE. - 2012. - július 24. ( 7. kötet , 7. szám ). — ISSN 1932-6203 . - doi : 10.1371/journal.pone.0041425 . Archiválva az eredetiből 2022. június 15-én.
  59. Johnson David S., Mortazavi Ali, Myers Richard M., Wold Barbara. Az in vivo fehérje-DNS kölcsönhatások genomszintű feltérképezése  (angol)  // Science (New York, NY). - 2007. - június 8. ( 316. kötet , 5830. szám ). — P. 1497–1502 . — ISSN 1095-9203 . - doi : 10.1126/tudomány.1141319 . Archiválva az eredetiből 2017. április 24-én.
  60. Rhee Ho Sung, Pugh B. Franklin. Átfogó, az egész genomra kiterjedő fehérje-DNS kölcsönhatások egyetlen nukleotid felbontással detektálva   // Sejt . - 2011. - december 9. ( 147. évf. , 6. szám ). - P. 1408-1419 . — ISSN 1097-4172 . - doi : 10.1016/j.cell.2011.11.013 . Archiválva az eredetiből 2017. április 24-én.
  61. Tuerk C., Gold L. A ligandumok szisztematikus evolúciója exponenciális dúsítással: RNS ligandumok a bakteriofág T4 DNS polimerázhoz // Science  (  New York, NY). - 1990. - augusztus 3. ( 249. kötet , 4968. szám ). - P. 505-510 . — ISSN 0036-8075 . Archiválva az eredetiből 2017. április 24-én.
  62. Greil Frauke, Moorman Celine, van Steensel Bas. DamID: in vivo fehérje-genom kölcsönhatások feltérképezése kötött DNS-adenin-metiltranszferáz segítségével  //  Methods in Enzymology. - 2006. - január 1. ( 410. kötet ). — P. 342–359 . — ISSN 0076-6879 . - doi : 10.1016/S0076-6879(06)10016-6 . Archiválva az eredetiből 2017. április 24-én.

Irodalom

  • Durbin R., Eddie S., Krogh A., Mitchison G. Biological Sequence Analysis: Probabilistic Models of Proteins and Nucleic Acids. - Regular and Chaotic Dynamics, Institute for Computer Research, 2006. - P. 480. - ISBN 5939725597 .
  • Jones Neil C., Pevzner Pavel A. Bevezetés a bioinformatikai  algoritmusokba . - The MIT Press, 2004. - ISBN 9780262101066 .
  • Compeau Phillip, Pevzner Pavel. Bioinformatikai algoritmusok: aktív tanulási megközelítés, 2. kiadás. Vol. 1 , Phillip Compeau  . - Active Learning Publishers, 2015. - P. 384. - ISBN 9780990374619 .
  • Durbin Richard, Eddy Sean R., Krogh Anders, Mitchison Graeme. Biológiai szekvenciaelemzés: Fehérjék és nukleinsavak valószínűségi  modelljei . - Cambridge University Press, 1998. - P. 372. - ISBN 978-0521620413 .
  • Nelson David L., Cox Michael M. Lehninger Biokémia alapelvei  (angol) . - W.H. Freeman, 2017. - P. 1328. - ISBN 9781464126116 .

Linkek

Videó tanfolyamok ebben a témában

Motívumkereső szolgáltatások

Motívum adatbázisok

  • PROSITE  - fehérjecsaládok és domének adatbázisa
  • TRANSFAC  - kereskedelmi (korlátozott nyilvános hozzáférésű) transzkripciós faktorok adatbázisa
  • HOCOMOCO archiválva : 2013. június 6. a Wayback Machine -nél  – emberi és egér transzkripciós faktorok gyűjteménye
  • Minimotif Miner  – keressen rövid ismert motívumokat

Vegyes