ChIP szekv

A ChIP-seq egy DNS - fehérje interakciós  elemzési módszer , amely kromatin immunprecipitáción (ChIP) és nagy teljesítményű DNS szekvenáláson alapul . A módszert a hiszton módosulások vizsgálatára fejlesztették ki az egész genomban [1] [2] , valamint transzkripciós faktor kötőhelyek keresésére [3] . Korábban a legnépszerűbb módszer a DNS-fehérje kölcsönhatások megállapítására a ChIP-on-chip volt , amely a kromatin immunprecipitációt a DNS microarray -eken történő hibridizációval kombinálja [4] .

Módszertan

Kromatin immunprecipitáció (ChIP)

A kromatin immunprecipitáció  egy olyan technika, amelyet a kérdéses fehérjéhez kapcsolódó rövid DNS-szekvenciák élő sejtekben történő specifikus felhalmozására használnak [5] . Egy tipikus technika a következő lépéseket tartalmazza [5] :

Ennek eredményeként az összes DNS izolálódik, de a minta olyan fragmentumokkal gazdagodik, amelyekhez a vizsgált fehérje társult [5] .

Sorrend

Ez a szakasz magában foglalja a DNS-fragmensek immunprecipitációja után kapott elsődleges szekvencia bármely rendelkezésre álló módszerrel történő meghatározását. A ChIP-on-Chip-től eltérően a ChIP-seq következő generációs szekvenálást használ a DNS-szekvencia meghatározására [6] . A ChIP-seq-ben az egyvégű szekvenálást gyakrabban használják, de a kétvégű szekvenálás alkalmazása növeli a leképezés pontosságát (ami különösen fontos az ismételt leképezésnél ) [7] . Az eredmény rövid, egymást átfedő sorozatok (olvasások vagy olvasások) halmaza. Az eredeti DNS-fragmensek jellemzően 150-500 bp hosszúak. , és az így kapott leolvasások hossza leggyakrabban 50 bp. [7]

Bioinformatikai elemzés

A bioinformatikai elemzés a következő szakaszokat tartalmazza [5] :

A fogadott beolvasások szűrésére a FastQC és a FastX ToolKit [8] szoftvercsomagok használhatók . A leolvasások minőségének meghatározása a Phred minőségi pontszámon  – azon a súlyon alapul, amelyet az egyes nukleotidokhoz hozzárendelnek a leolvasáskor. Az olyan szoftvercsomagok, mint a Gencore , FQStat , Picard és Cutadapt használhatók az olvasás minőségének értékelésére és javítására. A Gencore eltávolítja a duplikált olvasásokat, így egyetlen konszenzusos olvasmány marad. Ez tisztább adatokat eredményez, mint az ismétlődések egyszerű eltávolítása. A Picard egy olyan eszközkészlet, amely lehetővé teszi az alternatív formátumok használatát: SAM / BAM / CRAM és VCF. Az FQStat egy önálló, platformfüggetlen szoftvercsomag-eszköz, amely párhuzamos programozással értékeli a FASTQ fájlok minőségét. Ezenkívül az Illumina házon belüli Illumina tisztasági szűrő olvasási minőségbiztosítási szolgáltatást is nyújt. Ezenkívül az olvasás minőségének javítása érdekében hasznos lehet a "kivágás" - az eltérésből adódó gyenge minőségű leolvasások végeinek levágása (a következő generációs szekvenálás jellemzője). A vágás a Trimmomatic programmal [9] történik . A térképezés annak meghatározása, hogy egy adott leolvasás melyik régiót és melyik kromoszómát olvasta le. A leolvasások genomhoz való leképezéséhez olyan szoftvercsomagok használhatók, mint a BWA , Bowtie , Bowtie 2 és GSNAP [6] . A masszív párhuzamos szekvenálásból származó leolvasások általában rövidek (100-200 nukleotid ), míg az átlagos eukarióta kromoszóma körülbelül 100 millió nukleotidból áll. A genom leolvasásának feltérképezése nem mindig triviális feladat, mivel az eukarióta genomban nagyszámú ismétlődés található (például a LINE és a SINE  ismétlődések, amelyek az emberi DNS-szekvencia 17%-át és 11%-át teszik ki , illetve), és így az ismétlődő leolvasások egyszerre több helyen is leképezhetők. Általában az egyedileg leképezett leolvasások elegendőek az elemzéshez (például transzkripciós faktorok ), de bizonyos esetekben több régióra leképezett leolvasások is szerepelnek az elemzésben [7] . Alternatív megoldásként a rosszul feltérképezett területeken a jelveszteség korrigálására használható a mapping, egy olyan indikátor, amely különböző kísérleti és elemzési paraméterektől függ, beleértve az olvasások hosszát és az adatfeldolgozáshoz használt programokat [10] . Szűrésre a SAMTools [11] [6] szoftvercsomag használható . A térképezés után lehetővé válik a vizsgált fehérje kötődési helyeinek meghatározása a genomban az erre a helyre térképezett leolvasások számával (ha sok van, ott volt a fehérje) [6] . Az immunprecipitáció eredményeként kapott leolvasási sorozat sikertelen lehet a további elemzéshez az elégtelen szekvenálási mélység, az immunprecipitáció során a DNS-t felhasított fragmentumok méretének rossz megválasztása vagy a fehérjéhez kapcsolódó fragmensek nem megfelelő reprezentációja miatt. vizsgálat az immunprecipitáció után kapott keverékben (rossz antitestek stb.). . P.). A fentiek meghatározásához a CHANCE [8] szoftvercsomagot használjuk . A leolvasások genomhoz való feltérképezése után a kötőhelyek (régiók) azonosítása érdekében először a lefedettség szintjét értékeljük. Ezt követően azonosítjuk a csúcsokat (nagy lefedettségű területek, ahol valószínűleg a vizsgált fehérje kötődött), elkülönítjük a zajt, és meghatározzuk a csúcsok határait. Fontos az érzékenység és a specificitás egyensúlyának fenntartása [8] . A probléma megoldására használható szoftvercsomagok közül néhány az SPP , PeakSeq [10] , MACS , MACS 2, UGENE [6] . E programok munkájának eredménye a régiók listája, amelyet vagy az abszolút jel nagysága (vagyis az olvasások száma) vagy a dúsítás jelentősége (például p-érték vagy FDR ) szerint rangsorolnak. A megfelelő módszer kiválasztása a vizsgált fajtól és fehérjétől, valamint a kísérleti körülményektől függ. A különböző programok különböző feltételezéseket és feltételezéseket használnak a p-érték és az FDR kiszámításához. Például az SPP és a MACS eredeti verziója csak a ChIP-Seq kísérletből és a kontrollból (ha van ilyen) származó adatokat használ, míg a MOSAiCS figyelembe veszi a térképezhetőségi pontszámot és a GC összetételét . Ezért meglehetősen nehéz összehasonlítani a különböző csúcshívási algoritmusok eredményeit. Számos algoritmusillesztő dokumentum a talált csúcsok számának érvényesítését használja ChIP-on-Chip, qPCR stb. kísérletekből [12] [13] [14] . A helyzetet az is bonyolítja, hogy a valódi kötőhelyek rossz annotációi vannak, ezért ha egy ismeretlen kötőhellyel rendelkező fehérje csúcsait keresik, negatív kontrollokat kell használni [7] . Az annotáció célja, hogy kapcsolatot létesítsen a kötőhely és a funkcionális DNS-régió között, amelyen a kötőhely landolt. Ilyen funkcionális hely lehet egy promoter , egy transzkripciós starthely , egy intergénikus hely stb. [6] . Az előre jelzett kötőhelyek és a funkcionális DNS-elemek metszéspontja vizuálisan elemezhető az egyik genomikus böngészőben ; a Diffbind , CEAS vagy ChIPpeakAnno [8] segítségével megjegyzésekkel ellátott szöveges fájlt is kaphat . A kapott csúcsokban (nagyságrendileg több száz nukleotid hosszúság) néha azonosítani lehet jellegzetes szekvenciákat, amelyek mentén a fehérjekötés megtörténik - motívumok (általában körülbelül 20 nukleotid hosszúak). A motívumok kereséséhez használhatja a MEME algoritmust , Gibbs sampler [8] , ChIPMunk . Ha a kötőmotívum már ismert a vizsgált fehérjéhez, akkor jelenléte a csúcsokban jó indikátorként szolgálhat a ChIP-seq minőségére vonatkozóan [8] .

A módszer jellemzői

A ChIP-seq kísérlet megtervezésekor és a további bioinformatikai elemzés során figyelembe kell venni a technika néhány tényezőjét és korlátait [7] :

Szabálytalan töredezettség és szabályozás

A kromatin hozzáférhetősége a fragmentáció során a genom különböző részein nem azonos: az aktívan átírt régiókban jobban hozzáférhető, így a megfelelő DNS-fragmensek lesznek túlsúlyban a mintában, ami téves pozitív eredményhez vezethet. Ezzel szemben a sűrűn tömött régiók kevésbé érzékenyek a töredezettségre, ezért kevésbé vannak jelen a mintában, ami hamis negatív eredményhez vezethet [7] .

Az egyenetlen töredezettség és egyéb tényezők miatt fontos a megfelelő szabályozás alkalmazása. Az ENCODE konzorcium két fő típusú vezérlést ír le [15] . Az első változatban a sejtekből azonos körülmények között, de kicsapás nélkül izolált DNS-t használnak kontrollként (ún. bemeneti DNS-kontroll). A második típusban egy másik ChIP-kísérletet végeznek olyan antitestek felhasználásával, amelyek jelentéktelen extranukleáris antigénekhez kötődnek (az úgynevezett "IgG-kontroll"). Mindkét esetben a szekvenálás mélysége nem lehet kisebb, mint a ChIP-seq kísérlet mélysége [15] .

Cellák száma

A klasszikus technikának számos korlátja van. Így a ChIP-hez általában jelentős számú sejtre van szükség (kb. 10 millió), ami megnehezíti a módszer alkalmazását kis modellszervezeteken , és korlátozza az értékes mintával végezhető kísérletek számát is. Ennek a korlátnak a leküzdésére számos olyan módszert fejlesztettek ki, amelyek a ChIP-seq utáni DNS-amplifikáción alapulnak (pl. nano-ChIP-seq). Az egysejtű ChIP-seq ( eng.  Single-cell ChIP-seq ) az antitestek nem specifikus kötődése által okozott háttérzaj miatt nagyon összetett, és a 21. század második évtizedének közepére már csak egy munka jelent meg. amelyben sikeresen végrehajtották a Single-cell ChIP-seq-et. Ez a vizsgálat csepp mikrofluidikát használt, és az alacsony lefedettség miatt több ezer sejtet kellett szekvenálni a sejt heterogenitásának feltárásához [16] .

Jel-zaj arány

A jel-zaj viszonyt (S/N) az egyes mintákhoz kapott csúcsok száma és teljesítménye határozza meg, és felhasználható a zajszint becslésére. A magas S/N érték nem garantálja a kötőhelyek helyes meghatározását, hanem csak nagyszámú genomrégió jelenlétét tükrözi, amelyekhez sok leolvasást leképeztek [7] . Ennek a mutatónak a meghatározásához az ENCODE két mérőszámot kínál [15] :

Sorozati mélység

A szekvenálási mélység (lefedettség) a referenciagenom egy adott régiójára leképezett egyedi leolvasások száma. A szekvenálás mélysége befolyásolja a csúcsok kimutatását: számuk a szekvenálás mélységének növekedésével növekszik, hiszen a leolvasások számának növekedésével nagyobb számú hely válik statisztikailag szignifikánssá [17] . Ezért az összes funkcionális hely felismeréséhez mély szekvenálásra van szükség [7] .

A megfelelő szintű lefedettség értéke az antitest jel-zaj arányától függ, és úgy definiálható, mint az a szekvenálási mélység, amelynél a leolvasások véletlenszerű részhalmazából származó csúcsok számának aránya a csúcsok számához képest. az olvasmányok teljes halmaza elér egy fennsíkot. Ilyen telítettség nem mindig érhető el (például hisztonok esetében nem létezik ), és ilyen esetekben ezt az értéket empirikusan állítják be [7] .

A könyvtár összetettsége

A könyvtári komplexitást (NRF) úgy definiáljuk, mint az N nonred dúsítatlan olvasások számának a leképezett N all olvasások teljes számához viszonyított arányát . A nem dúsított leolvasások olyan leolvasások, amelyek a genom ugyanazon régiójára T-szer vagy kevesebbszer vannak leképezve (a T értéke paraméterként van megadva). A dúsított leolvasásokat (az N nonred -ben nem szereplő leolvasásokat ) nem veszik figyelembe a további elemzésben. Ember esetében a T paramétert általában 1-nek veszik, mivel a várt szekvenálási mélység ebben az esetben általában sokkal kisebb, mint egy. Kis genomoknál a szekvenálási mélység 1-nél nagyobb is lehet, ezért érdemes nagyobb T értéket venni.A különböző minták NRF-jének összehasonlításakor érdemes megjegyezni, hogy ez a leképezett leolvasások teljes számától függ [7] .

Az NRF csökken, ahogy a könyvtári szekvenálás mélysége nő. Ez végül elér egy olyan pontot, ahol a komplexitás maximális lesz, és megtörténik a PCR -rel amplifikált ugyanazon DNS-fragmensek szekvenálása . Alacsony könyvtári komplexitás fordulhat elő például, ha nagyon kevés DNS szabadul fel az immunprecipitáció során [15] .

Érzékenység

A technológia érzékenysége a szekvenálás mélységétől, a genom hosszától és egyéb tényezőktől függ. Az emlősök transzkripciós faktoraihoz és az enhanszerhez kapcsolódó kromatin-módosításokhoz, amelyek általában meghatározott szűk helyekre lokalizálódnak, és ezer kötőhelyet tartalmaznak, körülbelül 20 millió leolvasás elegendő [6] . A nagyszámú kötőhellyel rendelkező fehérjék ( RNS-polimeráz III ) akár 60 millió leolvasást igényelnek [6] . Féreg vagy légy transzkripciós faktorok esetén körülbelül 4 millió leolvasás szükséges [6] . Az immunprecipitáció után kapott fragmentumok szekvenálásának költsége közvetlenül korrelál a szekvenálás mélységével. Ha nagy érzékenységgel kell megjeleníteni a gyakran nagy genomban található fehérjék kötőhelyeit, akkor nagy költségekre lesz szükség, mivel nagyszámú leolvasásra lesz szükség. Ez különbözteti meg ezt a módszert a ChIP-on-Chip módszertől, amelyben az érzékenység nincs összefüggésben az elemzés költségével [6] .

A másik különbség a DNS-microarray-n alapuló ChIP módszerektől, hogy a ChIP-seq pontosságát nem korlátozza az adott próbák közötti távolság. Nagyszámú rövid leolvasás integrálásával a kötőhelyek nagy pontosságú lokalizálása érhető el. A ChIP-on-Chip módszerekkel összehasonlítva a ChIP-seq adatok felhasználhatók a tényleges fehérjekötő hely lokalizálására tíz nukleotidon belül. A kötési helyeken a leolvasási sűrűség jó indikátora a fehérje-DNS kötés erősségének, megkönnyítve a fehérjeaffinitás számszerűsítését és összehasonlítását a különböző helyeken [18] .

Pontosság és specifikusság

Egy tipikus fehérjekötő hely hossza 6-20 nukleotid, a ChIP után kapott fragmentumok hossza pedig körülbelül 200, ami miatt a kötőhely meghatározása nem túl pontos. Ezenkívül az így létrejövő könyvtárak gyakran tartalmazhatnak olyan DNS-régiókat, amelyek nem kapcsolódnak a vizsgált fehérjéhez, ami hibákhoz vezet az eredményekben. A módszernek különféle módosításai vannak a pontosság javítására (például ChIP-exo). A ChIP-seq kísérlet minősége közvetlenül függ az antitestek specificitásától és a minta dúsításának mértékétől is az immunprecipitáció szakaszában. A fő probléma az antitest alacsony reaktivitása a kívánt fehérjével szemben és/vagy más fehérjékkel való keresztreaktivitása lehet. Az ENCODE konzorcium számos módszert kínál az antitestek specificitásának felmérésére [15] .

Egy epitóp is fuzionálható a kérdéses fehérjével immunprecipitáció végrehajtásához . Ez a módszer mindkét problémát megoldja, amelyek az antitest immunprecipitáció során merülnek fel, azonban ebben az esetben a csatolt címke befolyásolhatja a vizsgált fehérjét (például megváltoztathatja annak expressziós szintjét vagy kötőképességét) [15] .

Alternatív módszerek

ChIP-on-chip

A ChIP-on-chip , amely a kromatin immunprecipitációt DNS-mikromátrixokon történő hibridizációval kombinálja [4] , korábban a DNS-fehérje kölcsönhatások megállapításának legnépszerűbb módszere volt. A Chip-seq és a ChIP-on-chip a két legszélesebb körben alkalmazott megközelítés a DNS-fehérje kölcsönhatások in vivo genomszintű vizsgálataiban. E módszerek részletesebb összehasonlítása azonban a Chip-seq jelentős előnyeit mutatja [4] . A Chip-seq és a ChIP-on-Chip módszerek összehasonlítása a [4] táblázatban látható :

Index ChIP szekv Chip-on-Chip
Az eredeti DNS mennyisége kevesebb, mint 10 ng 4 mcg
A módszer rugalmassága igen: bármely szekvenált organizmus genomszintű elemzése vannak korlátai: a DNS-mikromátrixok elérhetősége
A kötési hely helyzetének meghatározásának pontossága +/- 50 hó +/- 500 − 1000 hó
Érzékenység változó: a leolvasások számának növelésével növelheti az érzékenységet gyenge: a hibridizáció minőségétől függ
Kereszthibridizáció (egyszálú DNS hibridizálása azzal a részlegesen komplementer szondával) kizárva: minden DNS-molekulát külön-külön szekvenálnak jelentős lehet, ami nagymértékben csökkenti az elemzés pontosságát

DamID

A DamID (DNS-adenin-metiltranszferáz azonosítás) lehetővé teszi a DNS-fehérje kölcsönhatási helyek feltérképezését eukarióta sejtekben. Ennek érdekében a sejtek kiméra fehérjét expresszálnak, amely a kérdéses fehérjéből és az E. coli adenin-metiltranszferáz (Dam) DNS -ből áll , amely a GATC szekvencián azmetiláljaA legtöbb eukarióta esetében nem fordul elő endogén adenin metiláció a GATC helyeken. Amikor egy érdeklődésre számot tartó Dam-fúziós fehérje kötődik DNS-hez vagy más DNS-asszociált fehérjékhez, a Dam metilálja a kötőhelyet körülvevő DNS-ben lévő adenin-maradékokat, így ez a módszer lehetővé teszi a célfehérje DNS-sel és DNS-hez kapcsolódó kölcsönhatási helyek jelölését. fehérjék. A kiméra fehérjével metilált szekvenciák azonosításához a metilált fragmentumokat szelektíven amplifikálják és microarray-eken hibridizálják [19] .

A metilált DNS-fragmensek szelektív amplifikációja egy speciális PCR protokollon alapul. Először a GATC helyeken metilált DNS-t a DpnI restrikciós enzim elvágja a GA m és a TC nukleotidok között . A DpnI-vel végzett hasítás 5' TC és 3' GA m tompa végű DNS-fragmensek képződéséhez vezet . Ezt követően kétszálú adaptereket ligálnak a kapott fragmentumokhoz. A ligációs termékeket ezután a DpnII restrikciós endonukleázzal hasítjuk . A DpnII elvágja a DNS-t a nem metilált GATC helyeken, így csak az egymást követő metilált GATC helyekkel határolt fragmentumok (azaz olyan helyek, amelyek között nem találhatók nem metilált GATC helyek) amplifikálódnak. Ezután PCR-t hajtanak végre az adapterekkel komplementer primerekkel, és így a genomi fragmentumok metilált GATC helyekkel a széleken specifikusan amplifikálódnak [20] .

Módszer módosítások

A ChIP-Seq feltalálása óta ennek a módszernek számos olyan módosítását találták ki, amelyek lehetővé teszik egyik vagy másik részfeladat hatékonyabb végrehajtását.

ChIA-PET

Ezzel a módszerrel a genomban egymástól jelentős távolságra elhelyezkedő kromatin régiók kölcsönhatásait határozzák meg [21] . A ChIA-PET a proximális ligálás ( proximity ligation) elméletén alapul , amely azt állítja, hogy a fehérjekomplexhez kapcsolódó kromatin régiók közeli végei nagyobb valószínűséggel kötődnek egymáshoz, mint a fehérje komplexhez kapcsolódó kromatin régiók végei. olyan régiók, amelyek oldatban vannak, vagy egy másik fehérjekomplexhez kapcsolódnak.

PLAC seq

Számos módszer létezik a kromatin hosszú távú kölcsönhatásainak tanulmányozására, de ezek elemzéséhez nagyszámú sejtre van szükség. Ennek a korlátnak a leküzdésére fejlesztették ki a PLAC-seq (Proximity Ligation-Assisted ChIP-seq) módszert, melyben a kromatin fragmentáció és immunprecipitáció előtt az összefüggő régiók keresztkötését hajtják végre a sejtmagban . A PLAC-seq kiváló pontosságot, teljesítményt és reprodukálhatóságot mutat a ChIA-PET-hez képest az emlőssejtek nagy hatótávolságú kontaktusainak meghatározásában [22] .

Nano-ChIP seq

A nano-ChIP-seq módszer azon alapul, hogy a ChIP kísérlet során izolált DNS-t PCR-rel amplifikálják, majd szekvenálják [23] . Ez lehetővé teszi, hogy az elemzést kis számú, jellemzően körülbelül 10 000 sejten végezzék el. A megfelelő számú sejt azonban számos tényezőtől függ, így például az antitestek hatékonyságától és a minta célfehérjével való dúsításától, így esetenként több mint 10 ezer sejtre is szükség lehet [23] .

ChIP-exo és ChIP-nexus

A ChIP-exo módszer  a ChIP-seq protokoll egy olyan módosítása, amely több száz bázispárról majdnem egy nukleotidra javítja a talált kötőhelyek felbontását. A ChIP-exo λ-exonukleázt használ a szennyező DNS és a célfehérjéhez kapcsolódó DNS-fragmensek 5'-végeinek eltávolítására egészen a fehérjekötő helytől bizonyos távolságra lévő pozícióig [24] . Mivel mindkét szál DNS-fragmensei a ChIP-kísérlet eredményeként jönnek létre, az egymáshoz igazodó 5'-végeket a genom két pozíciójához térképezzük fel, amelyek között a fehérjekötő hely található. Élesztőkísérletek kimutatták, hogy a ChIP-exo lehetővé teszi a kötőhelyek azonosítását nukleotid pontossággal és 40-szer magasabb jel-zaj aránnyal, mint a ChIP-seq és a ChIP-on-Chip [24] .

A ChIP-exo protokoll egy módosítása a ChIP-nexus protokoll [25] (ChIP kísérletek nukleotid felbontással exonukleázon, egyedi vonalkódon és egyszeri ligáláson keresztül). Ebben a protokollban speciális adaptereket kötnek a DNS-hez, amelyek egy pár szekvenciát tartalmaznak a könyvtári amplifikációhoz, egy BamHI restrikciós enzimhelyet és egy randomizált vonalkódot , amely lehetővé teszi a fragmentumok túlzott amplifikációjának nyomon követését. A ChIP-exo protokollhoz hasonlóan itt is λ-exonukleázzal kezeljük, amely a DNS-t az 5'-végtől egy fizikai akadályig hasítja, DNS-hez kötött fehérje formájában. Ezt követően a DNS intramolekuláris cirkularizálását, majd BamHI restrikciós enzimes kezeléssel történő relinearizálását hajtják végre [25] . Így a kérdéses fragmens szélein amplifikációs szekvenciák találhatók. Ez a további lépés javítja a DNS-fragmensek könyvtárba való beépítésének hatékonyságát [25] .

Competition-ChIP

A Competition-ChIP  a ChIP-seq protokoll egy módosítása, amelyet a transzkripciós faktor DNS-hez való kötődésének relatív dinamikájának mérésére használnak [26] . A módszer ötlete a vizsgált transzkripciós faktor két, különböző epitópjelekkel rendelkező másolatának kifejezésén alapul . E másolatok egyike állandó jelleggel van kifejezve, a másodiké pedig, amely versenytársként működik, indukálható. Az egyes lókuszokhoz kapcsolódó izoformák arányát ChIP-seq vagy ChIP-on-chip segítségével határozzuk meg. Az a sebesség, amellyel egy konstitutívan kifejeződő formát indukálható formára cserélik, lehetővé teszi a vizsgált faktor tartózkodási idejének kiszámítását az egyes kötőhelyeken.

CLIP seq

A CLIP-seq (más néven HITS-CLIP  – keresztkötéses immunprecipitációval izolált RNS nagy áteresztőképességű szekvenálása) egy módszer RNS-fehérje kölcsönhatások és RNS-módosítások in vivo tanulmányozására [27] .

DRIP-seq és DRIVE-seq

Az R-hurkok háromszálú struktúrák, amelyeket kiszorított egyszálú DNS (ssDNS) és egy RNS-ssDNS duplex alkot. In vivo a genom körülbelül 5-8%-át teszik ki. A különböző fehérjék kötődésének szabályozásán keresztül az R-hurkok számos sejtfolyamatban vesznek részt, így például az embrionális őssejtek differenciálódásában [ 28] . Az R-hurkok tanulmányozására kifejlesztették a DRIP-seq (DNA:RNA ImmunoPrecipitation and Sequencing) módszert, amely lényegében nagyon hasonlít a ChIP-Seq-hez, de az R-hurokra specifikus antitestek felhasználásán alapul [29] ] . Az R-hurkok tanulmányozásának másik módja a DRIVE-seq (DNA:RNA In Vitro Enrichment and Sequencing) módszer, amely inaktivált MBP-RNASEH1 endonukleázt használ antitestek helyett [29] . A DRIVE-seq használható a DRIP-seq segítségével készített előrejelzések finomításához. Mindkét módszer lehetővé teszi az R-hurkok számának pontos és gyakorlati számszerűsítését. Első alkalommal alkalmazták a DRIP-seq-et az R-hurkok tanulmányozására a humán genomban: kimutatták, hogy ezek nagy részét a promoterek CpG-szigetei [29] .

CETCh-seq

A CETCh-seq módszert egy olyan technikai probléma megoldására tervezték, mint a ChIP-seq kísérletekhez alkalmas antitestek elérhetősége a DNS-fehérje kölcsönhatások tanulmányozása során. A CRISPR/Cas9 - et használó genomiális szerkesztést alkalmazva epitópot adnak a kérdéses fehérjékhez, például transzkripciós faktorokhoz, hogy a megfelelő antitestek további felismerjék őket [30] .

CUT&RUN

A CUT&RUN  a ChIP-seq olyan módosítása, amely lehetővé teszi a jel-zaj arány nagymértékű növelését. A hatást a protein A - val fuzionált mikrokokális nukleáz alkalmazásával érik el azimmunprecipitáció szakaszában [31] .

CUT&Tag

A CUT&Tag  a CUT&RUN-hoz hasonló módszer, de a mikrokokális nukleáz helyett Tn5 transzpozázt használnakA módszer előnye a CUT&RUN-nal szemben, hogy nem igényel sejtlízist és kromatin frakcionálást [32] .

Alkalmazás

A ChIP-seq elvben alkalmazható minden olyan fehérjére, amely a kromatin immunprecipitáció során kicsapódik. A ChIP-seq módszer alkalmazásának tipikus példája a transzkripciós faktorok, DNS polimeráz , szerkezeti fehérjék, valamint hiszton módosulások és kromatin szerkezet kötőhelyeinek meghatározása [6] . A ChIP-seq alternatívájaként számos nem immunprecipitációs módszert ( DNáz-Seq és FAIRE-Seq ) fejlesztettek ki a nukleoszómamentes DNS - régiók kimutatására [6] .

Motívumok keresése

A ChIP-seq kísérletek egyik fő célja a fehérjekötődéshez szükséges DNS-szekvencia motívumok felkutatása. A transzkripciós faktorokkal és más fehérjékkel fizikailag érintkező DNS-régiók kromatin immunprecipitációval izolálhatók. A kísérlet során a vizsgált fehérjéhez in vivo kapcsolódó DNS-fragmensek sorozatát kapjuk . A további elemzés magában foglalja a masszív párhuzamos szekvenálás és a teljes genom adatbázisok használatát a kötőhelyek helyzetének meghatározására a genomban [6] . A legszélesebb körben használt motívumészlelő eszköz a MEME (Multiple EM for Motif Elicitation) algoritmus. Gyakran sok motívum megtalálható egyetlen adatkészlet alapján, és a motívumelemzés még gyenge minőségű ChIP-seq adatokon is elvégezhető, de az ilyen motívumok jelentősége és megbízhatósága kisebb lesz [33] .

Biológiai funkciójú helyek keresése

A ChIP-seq kísérletekből származó adatokat gyakran használják a szabályozó régiók azonosítására egy érdeklődési területhez [15] . A ChIP-seq-et különösen széles körben használják bakteriális regulonok tanulmányozására [34] . Ehhez a kötőhelyek megtalálása után feltételezett szabályozott gének után kutatnak [34] .

Differenciálanalízis

A ChIP-Seq profilok közötti különbségeket különböző körülmények között a csúcsok lehívása után határozzuk meg. A különböző kísérletekben kapott csúcsokat ezután egy listába vonják össze. A jelölt helyek további azonosítására gyakran használnak differenciális génexpresszió-analízis programokat , mint például a DESeq2 [35] és az edgeR [36] . Ezek a programok képesek differenciálanalízist végezni azáltal, hogy az eredményül kapott csúcsok listáit „gének” listáiként kezelik. Léteznek olyan programok is, amelyeket kifejezetten a ChIP-Seq adatok differenciális elemzésére terveztek (pl. DiffBind [37] , ChIPComp [38] , DBChIP [39] ), amelyek hasonló elven működnek. Sok más program (például a PePr [40] ) olyan modelleket használ, amelyek nem igénylik a csúcsok előzetes hívását [40] .

A kromatin állapotának vizsgálata

A DNS-metiláció és a hiszton módosulások erős változásokon mennek keresztül a fejlődési átmenetek során és olyan betegségekben, mint a rák, és így jelentős mértékben hozzájárulnak a kromatin dinamikus természetéhez. Különféle hisztonmódosításokat vizsgálunk specifikus antitestek segítségével, hogy megkapjuk a mintában lévő hisztonnyomok profilját. Az ENCODE konzorcium saját kísérletei során gondosan teszteli a különféle, eltérően módosított hisztonterminális peptideken alkalmazott antitestek specifitását. Közös sejtforrásokat is használnak, profiloznak és hasonlítanak össze a kísérletek közötti következetesség biztosítása érdekében. Az ENCODE konzorcium jelenlegi irányelvei az antitestek validálására, a kísérleti reprodukálhatóságra, a szekvenálási mélységre, az adatminőség-elemzésre, valamint az adatok és metaadatok közzétételére vonatkoznak [33] [41] .

Az allél egyensúlyhiány elemzése

Egyre nagyobb érdeklődésre tart számot a ChIP-Seq adatok elemzése egy másik allél belső kontrolljával az allél egyensúlyhiány azonosítására [42] . Ugyanakkor a ChIP-Seq kísérletből nyert adatokat felhasználják a biológiai szignálok és az egynukleotid polimorfizmusok (SNP-k) kapcsolatának keresésére [42] . Ez az elemzés három szakaszból áll [43] :

  1. leolvasások összehangolása, azaz a genomban elfoglalt pozíció és az allél meghatározása minden egyes leolvasáshoz,
  2. megszámoljuk a megbízhatóan leképezett leolvasások számát minden egyes SNP-hez minden allél esetében,
  3. a lehetséges SNP-k rangsorolása és az allél egyensúlyhiány statisztikai értékelése.

Az első két szakaszban fontos a referenciagenomhoz való leolvasás helyes feltérképezése, mivel meg kell különböztetni a szekvenálási hibákat a valódi alléloktól. A harmadik szakaszhoz számos programot fejlesztettek ki különböző statisztikai tesztek segítségével, mint például az AlleleDB [44] , NPBin [42] és a WASP [45] .

Adatbázisok

A többsejtű élőlények genomja rendkívül összetett, és nem teljesen világos részletesen, hogyan történik az örökletes információ megvalósítása. A genom működésének részletes megértéséhez szükség van a funkcionális elemek teljes listájára, valamint annak leírására, hogyan működnek az időben és a különböző sejttípusokban. A probléma megoldására az ENCODE és a modENCODE [46] projektek jöttek létre . A ChIP-seq eredmények mellett az ENCODE és a modENCODE olyan elemzésekből származó adatokat integrál, mint az 5C és a ChIA-PET a kromoszómakonformáció meghatározásához; DNáz-seq és FAIRE-Seq a nukleoszómamentes régiók azonosítására; biszulfit szekvenálás és Infinium metilációs vizsgálat a metilcitozinok DNS-ben való jelenlétének meghatározására, RT-PCR és RNS szekvenálás a génexpresszió szintjének meghatározására, valamint CLIP-seq és RIP-seq az RNS - protein azonosítására kölcsönhatások [46] .

A 21. század második évtizedétől számos olyan adatbázis létezik, amely a ChIP-seq kísérletek eredményeit és azok elemzését tartalmazza:

Kutatás

Eukarióták

A ChIP-seq sikeres alkalmazására eukarióták tanulmányozására példa a promoterek nukleoszóma architektúrájának tanulmányozása . ChIP-seq segítségével sikerült megállapítani, hogy az élesztőben lehetnek nukleoszómamentes promoterrégiók (kb. 150 bp hosszúak), amelyekből az RNS-polimeráz képes transzkripciót indítani [60] . Ezt a módszert sikeresen alkalmazták 22 transzkripciós faktor kötőhelyek keresésére is a C. elegans fonálféreg genomjában . A fonálféreg genom összes annotált génjének 20%-ánál meghatározták az ezeket szabályozó transzkripciós faktorokat [61] .

A ChIP-seq-et széles körben használják hisztonmódosítások tanulmányozására is. Több mint 100 hiszton módosulás ismert [62] [63] . Például ismert, hogy az acetilezés, különösen a H3 hiszton (H3K9Ac) lizin 9-es acetilezése, általában a kromatin (euchromatin) nyitott és hozzáférhető régióihoz kapcsolódik . Ugyanakkor a hiszton metiláció a kromatin ( heterokromatin ) nyitott és sűrűn csomagolt régióihoz egyaránt köthető. Különösen a H3 hiszton (H3K4me1 vagy H3K4me3) lizin 4 mono- és trimetilációja általában nyitott kromatinhoz kapcsolódik, és ezek a jelek mindegyike a nyitott kromatin egy speciális kategóriáját jelenti: a H3K4me3 promóter régiókat, a H3K4me1 a transzkripciós fokozókat, a H3K36me3 marksokat. a genom átírt régiói. Ezzel szemben a H3 hiszton (H3K9me3 és H3K27me3) lizin 9-es és 27-es trimetilációja a kromatin tömörödésével és ennek következtében a génrepresszióval jár . A H3K9me3 és a H3K27me3 különböző típusú géneket szabályoz: a H3K27me3 túlnyomórészt elnyomja a homeobox transzkripciós faktorokat, míg a H3K9me3 célgének túlnyomórészt cinkujj transzkripciós faktorok [64 • ] . A hisztonjelek különféle kombinációi még részletesebb információval szolgálhatnak: például két jelölés, a H3K4me3 (euchromatin marks) és a H3K9me3 (heterokromatin jelek) jelenléte a promóteren benyomott gének azonosítója lehet [65] .

Prokarióták

Baktériumokban a génexpresszió szabályozása a transzkripció szintjén transzkripciós faktorok segítségével történik [66] . A ChIP-seq módszer használható az ilyen transzkripciós faktorok kötőhelyeinek azonosítására. Egyes bakteriális transzkripciós faktorok több kötőhelyet tartalmaznak a promoterben (azaz egymástól 100 bp-nál kisebb távolságra) [67] . A legtöbb csúcskeresési algoritmus egyként azonosítja az ilyen szorosan elhelyezkedő helyeket. A probléma megoldására úgynevezett csúcsdekonvolúciós algoritmusokat használnak, például CSDeconv [68] , GEM [69] , PICS [70] vagy dPeak [71] .

A következő lépés a kötőhelyek meghatározása után a szabályozott gének meghatározása. Általában a talált csúcsok génekkel való társítását algoritmikusan hajtják végre a közeli transzkripciós starthelyek (TSS) keresésével. A baktériumok (köztük az E. coli ) esetében azonban előfordulhat, hogy nem sok génre határozható meg a TSS, így a TSS helyett kereshetünk közeli transzlációs kezdőhelyeket, manuálisan vizsgálhatjuk a csúcs genomiális környezetét, vagy használhatunk génexpressziót. adatok (például vad típusú regulon expresszió összehasonlítása).és a vizsgált transzkripciós faktor törlése esetén az RNS-seq adatok alapján) [34] .

A fejlődés kilátásai

A ChIP-seq módszer jelenlegi fejlődése már lehetővé teszi a sokkal kevesebb sejtet tartalmazó minták elemzését, ami nagymértékben kiterjeszti alkalmazhatóságát olyan területeken, mint az embriológia és a fejlődésbiológia, ahol a nagy minták beszerzése túl drága vagy nehéz. A módszer minden bizonnyal képes kimutatni a kötőhelyek mutációit , amelyek befolyásolják a fehérjekötődést és a génexpresszió szabályozását [6] .

Azonban világossá válik, hogy a ChIP-seq problémák új kísérleti, statisztikai és számítási megoldásokat igényelnek. Csökkenteni kell a műtermékek és a hamis pozitív eredmények számát, valamint meg kell tanulni megkülönböztetni a vizsgált jelenségek egyedi hatásait a kontextusfüggőktől. Fontos újdonságok a disztális (a géntől jelentős távolságra elhelyezkedő) szabályozó régiók felfedezéséhez és elemzéséhez kapcsolódnak. Valószínűleg a ChIP-seq használatával lehetővé válik az indirekt DNS-kötés meghatározása, például további fehérjéken vagy fehérjekomplexeken keresztül, mivel a megjósolt helyek funkcionálisak lehetnek, függetlenül egy adott motívum jelenlététől. Végül további információkat (például expressziós szintet vagy kromatin konformációs adatokat) kell használni a tényleges funkcionalitás megkülönböztetéséhez, mivel a DNS-kötés nem feltétlenül jelent specifikus funkciót [18] .

Ígéretes irány a nagyszámú kísérletből nyert adatok integrálása a komplex kölcsönhatások feloldására és elemzésére. Erre a célra gyakran alkalmaznak különféle gépi tanulási módszereket [72] [73] [74] .

Jegyzetek

  1. Mikkelsen TS , Ku M. , Jaffe DB , Issac B. , Lieberman E. , Giannoukos G. , Alvarez P. , Brockman W. , Kim TK , Koche RP , Lee W. , Mendenhall E. , O'Donovan A. , Presser A. , ​​Russ C. , Xie X. , Meissner A. , ​​Wernig M. , Jaenisch R. , Nusbaum C. , Lander ES , Bernstein BE Genome-wide maps of chromatin state in pluripotent and lineage-committed cell.  (angol)  // Természet. - 2007. - Vol. 448. sz. 7153 . - P. 553-560. - doi : 10.1038/nature06008 . — PMID 17603471 .
  2. Barski A. , Cuddapah S. , Cui K. , Roh TY , Schones DE , Wang Z. , Wei G. , Chepelev I. , Zhao K. Hisztonmetilációk nagy felbontású profilozása az emberi genomban.  (angol)  // Cell. - 2007. - Vol. 129. sz. 4 . - P. 823-837. - doi : 10.1016/j.cell.2007.05.009 . — PMID 17512414 .
  3. Johnson DS , Mortazavi A. , Myers RM , Wold B. In vivo fehérje-DNS interakciók genomszintű térképezése.  (angol)  // Tudomány (New York, NY). - 2007. - Vol. 316. sz. 5830 . - P. 1497-1502. - doi : 10.1126/tudomány.1141319 . — PMID 17540862 .
  4. ↑ 1 2 3 4 Park PJ ChIP-seq: az érlelő technológia előnyei és kihívásai.  (angol)  // Természetismertetők. genetika. - 2009. - 1. évf. 10, sz. 10 . - P. 669-680. doi : 10.1038 / nrg2641 . — PMID 19736561 .
  5. ↑ 1 2 3 4 Barbara Kaboord, Maria Perr. Fehérjék és fehérjekomplexek izolálása immunprecipitációval  //  Methods in Molecular Biology (Clifton, NJ). — 2008-01-01. — Vol. 424 . — P. 349–364 . — ISSN 1064-3745 . - doi : 10.1007/978-1-60327-064-9_27 . Archiválva az eredetiből 2017. április 23-án.
  6. ↑ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Terrence S. Furey. ChIP-seq és azon túl: új és továbbfejlesztett módszerek a fehérje-DNS kölcsönhatások kimutatására és jellemzésére  //  Nature Reviews. genetika. — 2012-12-01. — Vol. 13 , iss. 12 . — P. 840–852 . — ISSN 1471-0064 . - doi : 10.1038/nrg3306 . Archiválva az eredetiből 2017. április 23-án.
  7. ↑ 1 2 3 4 5 6 7 8 9 10 Ryuichiro Nakato, Katsuhiko Shirahige. A ChIP-seq elemzés legújabb eredményei: a minőségirányítástól a teljes genom annotációig  //  Briefings in Bioinformatics. — 2016-03-15. —P.bbw023 . _ - ISSN 1477-4054 ​​1467-5463, 1477-4054 . - doi : 10.1093/bib/bbw023 . Az eredetiből archiválva : 2022. január 21.
  8. ↑ 1 2 3 4 5 6 Timothy Bailey, Pawel Krajewski, Istvan Ladunga, Celine Lefebvre, Qunhua Li. Gyakorlati útmutatók a ChIP-seq adatok átfogó elemzéséhez  //  PLoS számítási biológia. — 2013-01-01. — Vol. 9 , iss. 11 . — P.e1003326 . — ISSN 1553-7358 . - doi : 10.1371/journal.pcbi.1003326 . Archiválva az eredetiből 2017. május 4-én.
  9. Anthony M. Bolger, Marc Lohse, Bjoern Usadel. Trimmomatic: rugalmas trimmer az Illumina szekvenciaadatokhoz   // Bioinformatika . — 2014-08-01. — Vol. 30 , iss. 15 . — P. 2114–2120 . — ISSN 1367-4803 . - doi : 10.1093/bioinformatika/btu170 . Archiválva az eredetiből 2017. április 24-én.
  10. ↑ 1 2 Joel Rozowsky, Ghia Euskirchen, Raymond K Auerbach, Zhengdong D Zhang, Theodore Gibson. A PeakSeq lehetővé teszi a ChIP-seq kísérletek szisztematikus pontozását a kontrollokhoz képest  //  Nature Biotechnology. — 2009-1. — Vol. 27 , iss. 1 . — P. 66–75 . - ISSN 1546-1696 1087-0156, 1546-1696 . - doi : 10.1038/nbt.1518 . Az eredetiből archiválva : 2019. március 30.
  11. Heng Li, Bob Handsaker, Alec Wysoker, Tim Fennell, Jue Ruan. A Sequence Alignment/Map formátum és a SAMtools  (angol)  // Bioinformatika. — 2009-08-15. — Vol. 25 , iss. 16 . — P. 2078–2079 . — ISSN 1367-4803 . - doi : 10.1093/bioinformatika/btp352 . Archiválva az eredetiből 2017. április 24-én.
  12. Hashem Koohy, Thomas A. Down, Mikhail Spivakov, Tim Hubbard. A DNase-Seq adatokhoz használt csúcshívások összehasonlítása  // PLoS ONE. — 2014-05-08. - T. 9 , sz. 5 . — S. e96303 . — ISSN 1932-6203 . - doi : 10.1371/journal.pone.0096303 .
  13. Elizabeth G. Wilbanks, Marc T. Facciotti. Algoritmusteljesítmény értékelése a ChIP-Seq csúcsérzékelésben  // PLoS ONE. — 2010-07-08. - T. 5 , sz. 7 . — S. e11471 . — ISSN 1932-6203 . - doi : 10.1371/journal.pone.0011471 .
  14. Teemu D Laajala, Sunil Raghav, Soile Tuomela, Riitta Lahesmaa, Tero Aittokallio. A ChIP-seq kísérletekben a transzkripciós faktor kötőhelyek kimutatására szolgáló módszerek gyakorlati összehasonlítása  // BMC Genomics. - 2009. - T. 10 , sz. 1 . - S. 618 . — ISSN 1471-2164 . - doi : 10.1186/1471-2164-10-618 .
  15. ↑ 1 2 3 4 5 6 7 S. G. Landt, G. K. Marinov, A. Kundaje, P. Kheradpour, F. Pauli. Az ENCODE és a modENCODE konzorcium ChIP-seq irányelvei és gyakorlata  (angol)  // Genome Research. — 2012-09-01. — Vol. 22 , iss. 9 . — P. 1813–1831 . — ISSN 1088-9051 . - doi : 10.1101/gr.136184.111 .
  16. Assaf Rotem, Oren Ram, Noam Shoresh, Ralph A. Sperling, Alon Goren. Az egysejtű ChIP-seq a kromatin állapot által meghatározott sejtalpopulációkat tár fel  // Természet biotechnológia. — 2015-11. - T. 33 , sz. 11 . - S. 1165-1172 . — ISSN 1087-0156 . - doi : 10.1038/nbt.3383 . Archiválva az eredetiből 2016. május 21-én.
  17. Az ENCODE Projekt Konzorcium. Használati útmutató a DNS-elemek enciklopédiájához (ENCODE  )  // PLoS Biology / Peter B. Becker. — 2011-04-19. — Vol. 9 , iss. 4 . — P.e1001046 . — ISSN 1545-7885 . - doi : 10.1371/journal.pbio.1001046 .
  18. 1 2 Joshua WK Ho, Eric Bishop, Peter V. Karchenko, Nicolas Nègre, Kevin P. White. ChIP-chip versus ChIP-seq: leckék a kísérleti tervezéshez és adatelemzéshez  (angol)  // BMC genomika. — 2011-02-28. — Vol. 12 . — 134. o . — ISSN 1471-2164 . - doi : 10.1186/1471-2164-12-134 . Archiválva az eredetiből 2017. május 4-én.
  19. Frauke Greil, Celine Moorman, Bas van Steensel. [16 DamID: In vivo fehérje–genom kölcsönhatások feltérképezése kötött DNS-adenin-metiltranszferáz segítségével]  //  Methods in Enzymology. - Elsevier, 2006. - Vol. 410 . — P. 342–359 . — ISBN 9780121828158 . - doi : 10.1016/s0076-6879(06)10016-6 . Archiválva : 2019. május 12.
  20. Bas van Steensel, Daniel Peric-Hupkes, Maartje J. Vogel. In vivo fehérje-DNS kölcsönhatások kimutatása DamID segítségével emlőssejtekben  (angol)  // Nature Protocols. — 2007-06. — Vol. 2 , iss. 6 . — P. 1467–1478 . — ISSN 1750-2799 . - doi : 10.1038/nprot.2007.148 . Archiválva : 2021. május 25.
  21. Yi Eve Sun, Weihong Ge. Faculty of 1000 értékelése Az ösztrogén-receptor-alfa-kötött humán kromatin interakcióhoz. . F1000 – Az orvosbiológiai irodalom publikáció utáni szakértői értékelése (2009. december 4.). Hozzáférés időpontja: 2020. április 18.
  22. Rongxin Fang, Miao Yu, Guoqiang Li, Sora Chee, Tristin Liu. Nagy hatótávolságú kromatin kölcsönhatások feltérképezése proximity ligation-assisted ChIP-seq  //  Cell Research. — 2016-12. — Vol. 26 , iss. 12 . — P. 1345–1348 . — ISSN 1748-7838 1001-0602, 1748-7838 . - doi : 10.1038/cr.2016.137 . Az eredetiből archiválva : 2019. március 30.
  23. ↑ 1 2 Mazhar Adli, Bradley E Bernstein. Teljes genom kromatin profilalkotás korlátozott számú sejtből nano-ChIP-seq segítségével  //  Nature Protocols. – 2011-10. — Vol. 6 , iss. 10 . — P. 1656–1668 . — ISSN 1750-2799 1754-2189, 1750-2799 . - doi : 10.1038/nprot.2011.402 . Archiválva az eredetiből: 2019. április 18.
  24. ↑ 1 2 Ho Sung Rhee, B. Franklin Pugh. Átfogó, az egész genomra kiterjedő fehérje-DNS kölcsönhatások egy nukleotid felbontásnál   // Sejt . — 2011-12. — Vol. 147 , iss. 6 . - P. 1408-1419 . - doi : 10.1016/j.cell.2011.11.013 . Archiválva az eredetiből: 2019. április 18.
  25. ↑ 1 2 3 Qiye He, Jeff Johnston, Julia Zeitlinger. ChIP-nexus: új ChIP-exo protokoll az in vivo transzkripciós faktort kötő lábnyomok jobb kimutatására  // Természet biotechnológia. — 2015-4. - T. 33 , sz. 4 . – S. 395–401 . — ISSN 1087-0156 . - doi : 10.1038/nbt.3121 .
  26. Colin R Lickwar, Florian Mueller, Jason D Lieb. A fehérje-DNS-kötés dinamikájának genomszintű mérése kompetitív ChIP segítségével  //  Nature Protocols. — 2013-7. — Vol. 8 , iss. 7 . - P. 1337-1353 . — ISSN 1750-2799 1754-2189, 1750-2799 . - doi : 10.1038/nprot.2013.077 . Az eredetiből archiválva : 2019. április 20.
  27. Robert B. Darnell. HITS-CLIP: panorámaképek a fehérje-RNS szabályozásról élő sejtekben  //  Wiley Interdiszciplináris áttekintések: RNA. — 2010-9. — Vol. 1 , iss. 2 . — P. 266–286 . - ISSN 1757-7012 1757-7004, 1757-7012 . - doi : 10.1002/wrna.31 . Az eredetiből archiválva : 2019. április 20.
  28. Halász László, Karányi Zsolt, Boros-Oláh Beáta, Kuik-Rózsa Tímea, Sipos Éva. RNS-DNS hibrid (R-hurok) immunprecipitációs térképezés: analitikai munkafolyamat az inherens torzítások értékeléséhez  //  Genome Research. — 2017-6. — Vol. 27 , iss. 6 . — P. 1063–1073 . — ISSN 1549-5469 1088-9051, 1549-5469 . - doi : 10.1101/gr.219394.116 .
  29. ↑ 1 2 3 Paul A. Ginno, Paul L. Lott, Holly C. Christensen, Ian Korf, Frédéric Chédin. Az R-hurok képződése a metilálatlan humán CpG-szigeti promóterek megkülönböztető jellemzője  //  Molekuláris sejt. — 2012-3. — Vol. 45 , iss. 6 . — P. 814–825 . - doi : 10.1016/j.molcel.2012.01.017 . Az eredetiből archiválva : 2019. április 20.
  30. Daniel Savic, E. Christopher Partridge, Kimberly M. Newberry, Sophia B. Smith, Sarah K. Meadows. CETCh-seq: CRISPR epitóp tagging ChIP-seq of DNA-binding proteins  (angol)  // Genome Research. — 2015-10. — Vol. 25 , iss. 10 . - P. 1581-1589 . — ISSN 1549-5469 1088-9051, 1549-5469 . - doi : 10.1101/gr.193540.115 .
  31. Peter J Skene, Steven Henikoff. Hatékony célzott nukleáz stratégia a DNS-kötő helyek nagy felbontású térképezéséhez   //eLife . — 2017-01-16. — Vol. 6 . — P. e21856 . — ISSN 2050-084X . - doi : 10.7554/eLife.21856 . Archiválva : 2020. május 13.
  32. M. Robyn Andersen, Kelsey Afdem, Marcia Gaul, Shelly Hager, Erin Sweet. Családtörténet, genetikai és egyéb okokkal kapcsolatos hiedelmek a mellrák túlélői körében  // OBM Genetics. — 2019-02-27. - T. 3 , sz. 3 . – S. 1–1 . — ISSN 2577-5790 . - doi : 10.21926/obm.genet.1903087 .
  33. ↑ 1 2 ChIP szekvenálás áttekintése . epigenie.com. Letöltve: 2019. április 22. Az eredetiből archiválva : 2019. április 22.
  34. ↑ 1 2 3 Kevin S. Myers, Dan M. Park, Nicole A. Beauchene, Patricia J. Kiley. Bakteriális regulonok meghatározása ChIP-seq segítségével   // Módszerek . — 2015-9. — Vol. 86 . — P. 80–88 . - doi : 10.1016/j.ymeth.2015.05.022 . Archiválva : 2019. május 2.
  35. Michael I Love, Wolfgang Huber, Simon Anders. Az RNS-seq adatok szeres változásának és diszperziójának moderált becslése a DESeq2-vel  // Genome Biology. — 2014-12. - T. 15 , sz. 12 . — ISSN 1474-760X . - doi : 10.1186/s13059-014-0550-8 .
  36. MD Robinson, DJ McCarthy, GK Smyth. edgeR: a Bioconductor csomag digitális génexpressziós adatok differenciális expressziós elemzéséhez  // Bioinformatika. — 2009-11-11. - T. 26 , sz. 1 . – S. 139–140 . - ISSN 1460-2059 1367-4803, 1460-2059 . - doi : 10.1093/bioinformatika/btp616 .
  37. Anais Bardet. Csúcshívás  // Gyakorlati útmutató a ChIP-seq adatelemzéshez. — CRC Press, 2018.10.26. – S. 41–52 . — ISBN 9780429487590 .
  38. Li Chen, Chi Wang, Zhaohui S. Qin, Hao Wu. Új statisztikai módszer több ChIP-seq adatkészlet kvantitatív összehasonlítására  // Bioinformatika. — 2015-02-13. - T. 31 , sz. 12 . – S. 1889–1896 . - ISSN 1460-2059 1367-4803, 1460-2059 . - doi : 10.1093/bioinformatika/btv094 .
  39. Kun Liang, Sundüz Keleş. Transzkripciós faktorok differenciális kötődésének kimutatása ChIP-seq segítségével  // Bioinformatika. — 2011-11-03. - T. 28 , sz. 1 . – S. 121–122 . - ISSN 1367-4803 1460-2059, 1367-4803 . - doi : 10.1093/bioinformatika/btr605 .
  40. ↑ 1 2 Yanxiao Zhang, Yu-Hsuan Lin, Timothy D. Johnson, Laura S. Rozek, Maureen A. Sartor. PePr: csúcshívási prioritási folyamat, amely konzisztens vagy eltérő csúcsokat azonosít a replikált ChIP-Seq adatokból  // Bioinformatika. — 2014-06-03. - T. 30 , sz. 18 . – S. 2568–2575 . - ISSN 1367-4803 1460-2059, 1367-4803 . - doi : 10.1093/bioinformatics/btu372 .
  41. Bradley E Bernstein, John A Stamatoyannopoulos, Joseph F Costello, Bing Ren, Aleksandar Milosavljevic. The NIH Roadmap Epigenomics Mapping Consortium  // Természet biotechnológia. — 2010-10. - T. 28 , sz. 10 . – S. 1045–1048 . — ISSN 1087-0156 . - doi : 10.1038/nbt1010-1045 . Archiválva az eredetiből 2016. május 22-én.
  42. ↑ 1 2 3 Qi Zhang, Sündüz Keleş. Empirikus Bayes-teszt allél-egyensúlyhiány kimutatására a ChIP-seq-ben  // Biostatisztika. — 2017-11-03. - T. 19 , sz. 4 . – S. 546–561 . — ISSN 1468-4357 1465-4644, 1468-4357 . - doi : 10.1093/biostatistics/kxx060 .
  43. Qi Zhang. A ChIP-Seq kísérletek adatelemzése  //  Számítógépes epigenetika és betegségek. — Elsevier, 2019. — P. 67–77 . — ISBN 9780128145135 . - doi : 10.1016/b978-0-12-814513-5.00005-2 . Archiválva : 2019. május 5.
  44. Christopher Gregg. 1000 fős kiértékelés az allélspecifikus kötődés és expresszió egységes felméréséhez 1000 genom-projekt egyeden. . F1000 – Az orvosbiológiai irodalom publikáció utáni szakértői értékelése (2016. július 11.). Letöltve: 2019. május 5.
  45. Bryce van de Geijn, Graham McVicker, Yoav Gilad, Jonathan K Pritchard. WASP: allél-specifikus szoftver robusztus molekuláris kvantitatív tulajdonságok lokusz felfedezéséhez  // Nature Methods. — 2015-09-14. - T. 12 , sz. 11 . – S. 1061–1063 . - ISSN 1548-7105 1548-7091, 1548-7105 . - doi : 10.1038/nmeth.3582 .
  46. ↑ 1 2 Susan E. Celniker, Laura AL Dillon, Mark B. Gerstein, Kristin C. Gunsalus, Steven Henikoff. A genom titkainak feltárása   // Természet . — 2009-06-18. — Vol. 459 , iss. 7249 . — P. 927–930 . — ISSN 1476-4687 . - doi : 10.1038/459927a . Archiválva az eredetiből 2017. április 29-én.
  47. Hongzhu Qu, Xiangdong Fang. Rövid áttekintés a Human Encyclopedia of DNA Elements (ENCODE ) projektről   // Genomics, Proteomics & Bioinformatics. — 2013-06-01. — Vol. 11 , iss. 3 . — P. 135–141 . — ISSN 2210-3244 . - doi : 10.1016/j.gpb.2013.05.001 . Archiválva az eredetiből 2017. május 5-én.
  48. Oki, S; Ohta, T. ChIP-Atlas . - 2015. - doi : 10.18908/lsdba.nbdc01558-000 .
  49. modENCODE Konzorcium, Sushmita Roy, Jason Ernst, Peter V. Kharchenko, Pouya Kheradpour. Funkcionális elemek és szabályozó áramkörök azonosítása Drosophila modENCODE segítségével  (angol)  // Science (New York, NY). — 2010-12-24. — Vol. 330 , iss. 6012 . — P. 1787–1797 . — ISSN 1095-9203 . - doi : 10.1126/tudomány.1198374 . Archiválva az eredetiből 2017. május 5-én.
  50. Jie Wang, Jiali Zhuang, Sowmya Iyer, Xin-Ying Lin, Melissa C. Greven. Factorbook.org: az ENCODE konzorcium //  Nucleic Acids Research által generált transzkripciós faktor-kötő adatok Wiki-alapú adatbázisa .  — 2013-01-01. — Vol. 41 , iss. Adatbázis probléma . — P. D171–176 . — ISSN 1362-4962 . - doi : 10.1093/nar/gks1221 . Archiválva az eredetiből 2017. május 5-én.
  51. Jian-Hua Yang, Jun-Hao Li, Shan Jiang, Hui Zhou, Liang-Hu Qu. ChIPBase: hosszú, nem kódoló RNS- és mikroRNS-gének transzkripciós szabályozásának dekódolására szolgáló adatbázis a ChIP-Seq adatokból  //  Nucleic Acids Research. — 2013-01-01. — Vol. 41 , iss. Adatbázis probléma . — P. D177–187 . — ISSN 1362-4962 . doi : 10.1093 / nar/gks1060 . Archiválva az eredetiből 2017. május 5-én.
  52. Alexander Lachmann, Huilei Xu, Jayanth Krishnan, Seth I. Berger, Amin R. Mazloom. ChEA: a transzkripciós faktor szabályozása a genom-szerte kiterjedő ChIP-X kísérletekből  (angol)  // Bioinformatika (Oxford, Anglia). — 2010-10-01. — Vol. 26 , iss. 19 . — P. 2438–2444 . — ISSN 1367-4811 . - doi : 10.1093/bioinformatika/btq466 . Archiválva az eredetiből 2017. május 5-én.
  53. Jesse D. Ziebarth, Anindya Bhattacharya, Yan Cui. CTCFBSDB 2.0: adatbázis a CTCF-kötő helyekhez és a genom szerveződéséhez  //  Nucleic Acids Research. — 2013-01-01. — Vol. 41 , iss. Adatbázis probléma . — P. D188–194 . — ISSN 1362-4962 . - doi : 10.1093/nar/gks1165 . Archiválva az eredetiből 2017. május 5-én.
  54. Li Chen, George Wu, Hongkai Ji. hmChIP: adatbázis és webszerver nyilvánosan elérhető emberi és egér ChIP-seq és ChIP-chip adatok feltárására   // Bioinformatics (Oxford, Anglia) . — 2011-05-15. — Vol. 27 , iss. 10 . - P. 1447-1448 . — ISSN 1367-4811 . - doi : 10.1093/bioinformatika/btr156 . Archiválva az eredetiből 2017. május 5-én.
  55. Ivan V. Kulakovskiy, Ilja E. Voroncov, Ivan S. Jevsin, Anastasia V. Soboleva, Artem S. Kasianov. HOCOMOCO: a transzkripciós faktor kötőhely modellek gyűjteményének bővítése és javítása  //  Nucleic Acids Research. — 2016-01-04. — Vol. 44 , iss. D1 . — P. D116–125 . — ISSN 1362-4962 . - doi : 10.1093/nar/gkv1249 . Archiválva az eredetiből 2017. május 5-én.
  56. Albin Sandelin, Wynand Alkema, Pär Engström, Wyeth W. Wasserman, Boris Lenhard. JASPAR: nyílt hozzáférésű adatbázis az eukarióta transzkripciós faktor kötőprofilokhoz  //  Nucleic Acids Research. - 2004-01-01. — Vol. 32 , iss. Adatbázis probléma . — P.D91–94 . — ISSN 1362-4962 . - doi : 10.1093/nar/gkh012 . Archiválva az eredetiből 2017. május 5-én.
  57. Mihail Pacskov, Piotr J. Balwierz, Phil Arnold, Jevgenyij Ozonov, Erik van Nimwegen. SwissRegulon, a szabályozó helyek genomszintű annotációinak adatbázisa: legújabb frissítések  //  Nucleic Acids Research. — 2013-01-01. — Vol. 41 , iss. Adatbázis probléma . — P. D214–220 . — ISSN 1362-4962 . - doi : 10.1093/nar/gks1145 . Archiválva az eredetiből 2017. május 5-én.
  58. Bo Qin, Meng Zhou, Ying Ge, Len Taing, Tao Liu. CistromeMap: tudásbázis és webszerver ChIP-Seq és DNase-Seq vizsgálatokhoz egérben és emberben   // Bioinformatika (Oxford, Anglia) . — 2012-05-15. — Vol. 28 , iss. 10 . — P. 1411–1412 . — ISSN 1367-4811 . - doi : 10.1093/bioinformatika/bts157 . Archiválva az eredetiből 2017. május 5-én.
  59. Qixuan Wang, Jinyan Huang, Hanfei Sun, Jing Liu, Juan Wang. CR Cistrome: ChIP-Seq adatbázis kromatin szabályozókhoz és hisztonmódosítási kapcsolatokhoz emberben és egérben  //  Nucleic Acids Research. — 2014-01-01. — Vol. 42 , iss. Adatbázis probléma . — P. D450–458 . — ISSN 1362-4962 . - doi : 10.1093/nar/gkt1151 . Archiválva az eredetiből 2017. május 5-én.
  60. Christoph D. Schmid, Philipp Bucher. A ChIP-Seq adatok humán promóterek nukleoszóma architektúráját tárják fel  (angol)  // Cell. — 2007-11-30. — Vol. 131 , iss. 5 . – 831–832. o.; szerző válaszol 832–833 . — ISSN 0092-8674 . - doi : 10.1016/j.cell.2007.11.017 . Archiválva az eredetiből 2017. május 5-én.
  61. Wei Niu, Zhi John Lu, Mei Zhong, Mihail Sarov, John I. Murray. Változatos transzkripciós faktor kötési jellemzők, amelyeket a genomszintű ChIP-seq tár fel C. elegansban  //  Genome Research. — 2011-02-01. — Vol. 21 , iss. 2 . — P. 245–254 . — ISSN 1549-5469 . - doi : 10.1101/gr.114587.110 . Archiválva az eredetiből 2017. május 5-én.
  62. Xiong Ji, Daniel B. Dadon, Brian J. Abraham, Tong Ihn Lee, Rudolf Jaenisch. A kromatin proteomikus profilozása hisztonnal jelölt genomi régiókhoz kapcsolódó új fehérjéket tár fel  // Proceedings of the National Academy of Sciences. — 2015-03-09. - S. 201502971 . - ISSN 1091-6490 0027-8424, 1091-6490 . - doi : 10.1073/pnas.1502971112 .
  63. Huihuang Yan, Shulan Tian, ​​Susan L Slager, Zhifu Sun. ChIP-seq a betegségek epigenetikai mechanizmusainak tanulmányozásában és a precíziós orvoslás elősegítésében: előrelépések és jövőbeli irányok   // Epigenomika . — 2016-9. — Vol. 8 , iss. 9 . — P. 1239–1258 . - ISSN 1750-192X 1750-1911, 1750-192X . - doi : 10.2217/epi-2016-0053 .
  64. Henriette O'Geen, Lorigail Echipare, Peggy J. Farnham. ChIP-Seq technológia használata hisztonmódosítások nagyfelbontású profiljának generálására  // Molekuláris biológiai módszerek (Clifton, NJ). - 2011. - T. 791 . – S. 265–286 . — ISSN 1064-3745 . - doi : 10.1007/978-1-61779-316-5_20 .
  65. Tarjei S. Mikkelsen, Manching Ku, David B. Jaffe, Biju Issac, Erez Lieberman. A kromatin állapotának genomra kiterjedő térképei pluripotens és vonallal elkötelezett sejtekben  // Természet. - 2007-08-02. - T. 448 , sz. 7153 . – S. 553–560 . — ISSN 0028-0836 . - doi : 10.1038/nature06008 . Archiválva az eredetiből 2016. május 22-én.
  66. Douglas F. Browning, Stephen JW Busby. A bakteriális transzkripció iniciációjának szabályozása  // Nature Reviews Microbiology. - 2004-01. - T. 2 , sz. 1 . – 57–65 . - ISSN 1740-1534 1740-1526, 1740-1534 . - doi : 10.1038/nrmicro787 .
  67. Dongjun Chung, Dan Park, Kevin Myers, Jeffrey Grass, Patricia Kiley. dPeak: A transzkripciós faktort kötő helyek nagy felbontású azonosítása PET és SET ChIP-Seq adatokból  // PLoS Computational Biology. — 2013-10-17. - T. 9 , sz. 10 . — S. e1003246 . — ISSN 1553-7358 . - doi : 10.1371/journal.pcbi.1003246 .
  68. Antonio LC Gomes, Thomas Abeel, Matthew Peterson, Elham Azizi, Anna Lyubetskaya. A ChIP-seq dekódolása kettős kötőjellel finomítja a kötődési csúcsokat egy nukleotidhoz, és előrejelzi a kooperatív kölcsönhatást  //  Genome Research. — 2014-10. — Vol. 24 , iss. 10 . - P. 1686-1697 . — ISSN 1549-5469 1088-9051, 1549-5469 . - doi : 10.1101/gr.161711.113 .
  69. Yuchun Guo, Shaun Mahony, David K. Gifford. A nagy felbontású genom-széles kötési esemény megtalálása és a motívumfelfedezés felfedi a transzkripciós faktor térbeli kötési korlátait  //  PLoS számítási biológia / Stein Aerts. — 2012-08-09. — Vol. 8 , iss. 8 . — P.e1002638 . — ISSN 1553-7358 . - doi : 10.1371/journal.pcbi.1002638 .
  70. Xuekui Zhang, Gordon Robertson, Martin Krzywinski, Kaida Ning, Arnaud Droit. PICS: Probabilistic Inference for ChIP-seq  (angol)  // Biometria. — 2011-3. — Vol. 67 , iss. 1 . — P. 151–163 . - doi : 10.1111/j.1541-0420.2010.01441.x .
  71. Dongjun Chung, Dan Park, Kevin Myers, Jeffrey Grass, Patricia Kiley. dPeak: A transzkripciós faktort kötő helyek nagy felbontású azonosítása PET és SET ChIP-Seq adatokból  //  PLoS Computational Biology / Roderic Guigo. — 2013-10-17. — Vol. 9 , iss. 10 . — P.e1003246 . — ISSN 1553-7358 . - doi : 10.1371/journal.pcbi.1003246 .
  72. Jason Ernst, Manolis Kellis. A kromatinállapotok felfedezése és jellemzése az emberi genom szisztematikus annotációjához  // Nature Biotechnology. — 2010-07-25. - T. 28 , sz. 8 . – S. 817–825 . - ISSN 1546-1696 1087-0156, 1546-1696 . - doi : 10.1038/nbt.1662 .
  73. Jason Ernst, Pouya Kheradpour, Tarjei S. Mikkelsen, Noam Shoresh, Lucas D. Ward. A kromatin állapot dinamikájának feltérképezése és elemzése kilenc emberi sejttípusban  // Természet. — 2011-03-23. - T. 473 , sz. 7345 . – 43–49 . — ISSN 1476-4687 0028-0836, 1476-4687 . - doi : 10.1038/nature09906 .
  74. Shirley Pepke, Barbara Wold, Ali Mortazavi. Számítás ChIP-seq és RNA-seq vizsgálatokhoz  // Nature Methods. — 2009-11. - T. 6 , sz. 11 . — S. S22–S32 . - ISSN 1548-7105 1548-7091, 1548-7105 . - doi : 10.1038/nmeth.1371 .