A következő generációs szekvenálás (NGS ) a DNS és az RNS nukleotidszekvenciájának meghatározására szolgáló módszerek egy csoportja, amelynek célja annak elsődleges szerkezetének formális leírása . Az új generációs szekvenálási módszerek technológiája lehetővé teszi a genom több szakaszának egyidejű "olvasását" , ami a fő különbség a korábbi szekvenálási módszerekhez képest. Az NGS polimeráz által indukált lánchosszabbítás vagy oligonukleotidok többszörös ligálása ismételt ciklusaival valósul meg . Az NGS során egy munkaciklus alatt akár több száz megabázis és gigabázis nukleotidszekvencia is előállítható [1] .
A szekvenálás első koncepcióját Senger javasolta 1977-ben [2] . A technológiát "láncszakítási módszernek" nevezik . Ugyanebben az évben Maxam és Gilbert egy alternatív módszert javasoltak, az úgynevezett " kémiai lebontási módszert " - amely az egyik végén jelölt DNS-fragmens hasításán alapul, specifikus reagensek hatására. A nukleotidszekvencia meghatározása poliakrilamid gélelektroforézissel , majd autoradiográfiával történik . A tömeges, jó minőségű és gyors szekvenálás iránti igény számos módosítást és mindenféle fejlesztést ösztönzött ezekben a módszerekben. Különböző mértékben ennek a folyamatnak szinte minden összetevője változáson ment keresztül. A technológia fejlődésében a fordulópontot a PCR megjelenése (az 1980-as évek közepe) és a DNS „olvasás” fő szakaszainak automatizálása jelentette, ami új generációs szekvenálási módszereket eredményezett. A következő generációs módszerek platformjai a DNS "olvasási" folyamatának párhuzamosításán alapulnak, így a szekvenáló egy futtatásával lehetőség nyílik a genom több szakaszának elsődleges szerkezetének meghatározására. Az új generációs szekvenszerek sokkal olcsóbbak és sokkal hatékonyabbak lettek, mint elődeik. A mai napig egyes szekvenátorok teljesítményét már több százmilliárd bázispárban mérik , ami például lehetővé teszi az ilyen eszközök számára, hogy néhány nap alatt átvizsgálják az egyedi emberi genomot [3] .
Az alábbiakban az NGS-módszereket mutatjuk be időrendi sorrendben. Az első módszerek, például a piroszekvenáláson alapuló NGS kifejlesztéséhez vezettek, de jelenleg gyakorlatilag nem használják őket. A többi alább tárgyalt módszert jelenleg széles körben alkalmazzák, mindegyik módszernek megvannak a maga előnyei és alkalmazási sajátosságai [4] [5] [6] .
módszer | elv | maximális olvasási hossz, bázispárok | a szekvenálás költsége 1 Mbp | szekvenszer költség | ciklusidő | az olvasások száma ciklusonként | Előnyök | korlátozások |
---|---|---|---|---|---|---|---|---|
454 Élettudományok | piroszekvenálás és luciferáz | 1000 | 10 dollár | 500 000 dollár | 7 óra | 1 000 000 | a leolvasott genomiális régiók hossza; sebesség | ár; hiba |
Illumina SOLEXA | fluoroforral és eltávolítható terminátorokkal rendelkező nukleotidok | 300 | 0,05-0,15 USD | 1 000 000 USD (NovaSeq 6000)
100 000 USD (MiSeq) |
4 óra - 55 óra | 5 000 000 000-ig | hatékonyság, költség | sebesség |
Szilárd | oligonukleotid próbák ligálása fluoroforral | 75 | 0,13 USD | 595 000 dollár | legfeljebb 10 napig | 2 400 000 000-ig | ár | sebesség |
Helicos | fluoroforral és eltávolítható terminátorokkal rendelkező nukleotidok | 2900 | 2 dollár | 1 350 000 dollár | 1 óra | 35.000-75.000 | a leolvasott genomiális régiók hossza; sebesség | alacsony termelékenység a kívánt kis hibával; ár |
IonTorrent | pH változás a nukleotidok hozzáadása során | 600 | 1 dollár | 100 000 dollár | 3 óra | 5 000 000-ig | ár; sebesség | hiba |
Pac Bio folytatása [9] | nukleotidokat fluoroforral | 20 000 | 2 dollár | 600 000 dollár | 20-30 óra | Akár 500.000 | olvasási hossz, pontosság | anyagmennyiség, ár |
MinION Mk1B [10] [11] | az áramerősség változása, ahogy az áramkör áthalad a nanopóruson | a teljes NK hossza, 2 000 000-ig | 0,47-0,90 USD | 1000 dollár | 1 perc - 2 nap | — | olvasási hossz, költség, erősítés hiánya és összetett kémiai átalakulások | hiba |
A szekvenálási módszerek rohamos fejlődése miatt változhatnak a módszerek paraméterei, így a szekvenálók és munkájuk költsége, az olvasási szakaszok ideje és hossza [5] .
A Massively parallel signature szekvenálás (MPSS ) az egyik első NGS-technológia, amelyet az 1990-es években a Lynx Therapeutics fejlesztett ki mRNS - transzkriptum -szekvenálásra és génexpressziós értékelésre egyetlen sejtben lévő egyedi mRNS-szintek alapján [12] . Az MPSS-módszerben a transzkriptumokat egyedi mikrogyöngyökön rögzítik DNS-templáttal; Az mRNS-eket fluoreszcens jelöléssel történő hibridizációval olvassák le, majd eltávolítják, és így tovább egymás után többször is. Az eredmény 17-20 bázispár (bp) hosszúságú szekvenciák. Az expressziós szintet jelző transzkriptumok számát az egymillió molekulára jutó transzkriptumok száma határozza meg. Ez a módszer nem igényli a gének azonosítását az elemzés megkezdése előtt, érzékenysége sejtenként több mRNS molekula [13] .
Az első kereskedelmileg hatékony NGS platform. A 454 Life Sciences-t 2000-ben alapította Jonathan Rothberg (2005-ben indult). Ez a technológia emulziós PCR és piroszekvenálási módszerek szekvenciális szintézise [14] .
A DNS- amplifikáció olajos emulzióban lévő vízcseppekben megy végbe. Minden csepp víz egy szálú DNS-templátot tartalmaz egy gyöngyön lévő primerhez kötve. Ezután minden gyöngyöt egy chipre helyezünk, amely egy optikai szál . A szekvenáláshoz szükséges enzimeket is ott helyezik el: DNS polimeráz, luciferáz , ATP-szulfuriláz . Az utolsó összeállításban a szekvenálási reakció 3,4·10 6 pl térfogatú cellákban megy végbe, amelyek falán speciális, zajkiegyenlítő fémbevonat található [15] .
A módszer szerzői Shankar Balasubramanian és David Klenerman brit kémikusok. Ez a szekvenálási módszer egyetlen DNS-molekulát használ, amelyek mikrogömbökhöz kapcsolódnak. 2006-ban megjelent a Solexa Genome Analyzer 1G, az első platform, amely rövid genomszegmenseket generál. Mióta az Illumina megszerezte, a Genome Analyzer optikailag tiszta sejteket használ 8 egyedi felülettel (néha kevesebb: 4, 2 vagy akár 1), ahol az oligonukleotidok kötődnek . A piroszekvenálással ellentétben a szekvencia megnyúlása fokozatosan megy végbe, ami lehetővé teszi a nagy DNS chipek egyidejű eltávolítását egy kamera segítségével [16] .
Az Applied Biosystems által kifejlesztett SOLiD (Supported Oligonucleotide Ligation and Detection System 2.0) platform egy ligáláson alapuló, rövid leolvasású szekvenálási technológia . A módszert George Church laboratóriumában javasolták, és 2005-ben publikálták. A módszer lényege, hogy meghatározzuk a genomiális DNS kis fragmentumainak (25-75 bp) nukleotidszekvenciáját; adapterek az előfragmentált DNS mindkét végéhez vannak ligálva , amelyek szükségesek a mágneses gyöngyökön lévő emulziós PCR-hez és az azt követő szekvenáláshoz áramlási cellán [17] .
NGS technológia elektroforetikus elválasztás nélkül, amely lehetővé teszi több millió rövid immobilizált DNS- szekvencia leolvasását . A módszer fő ötlete nagyszámú egyedi "polónia" (polimeráz által generált molekuláris kolóniák) létrehozása, amelyeket véletlenszerű sorrendben szekvenálnak. A polónia szekvenálást páros végtagok (páros végű címkék) könyvtárára hajtják végre: minden DNS-molekula 135 bázispár hosszúságú, két 17-18 bp hosszúságú címkét tartalmaz, amelyeket egy közös szekvencia szegélyez . 18 ] [19] .
A HeliScope (Helicos BioSciences) által kifejlesztett első egymolekulás szekvenálási módszer körülbelül 1 Gb/nap áteresztőképességű. Működési elve: a minta klonális amplifikációja után DNS-fragmentáció következik be, majd a 3'-végen poliadeniláció , majd szekvenálás következik a minták fluoreszcensen jelölt nukleotidokkal történő mosásával váltakozva [20] . 2012-ben a cég csődöt jelentett és megszűnt [21] , de a 2013-ban alapított SeqLL cég licencet kapott a technológiára [22] .
Ennél a módszernél 4 adaptert helyeznek be egymás után a szekvenálandó DNS-fragmensbe, aminek köszönhetően a Phi29 további replikációja során a DNS polimeráz ( rolling circle replikáció ) során a szintetizált DNS-molekula DNS-nanogolyókká hajtódik. Ezután a nanoballonokat egy olyan szubsztrátumra helyezik, amely számos ~300 nm-es DNS-kötő mezővel rendelkezik, rácsban elrendezve. Ezeknek a mezőknek a szerveződése lehetővé teszi több DNS illesztését a szubsztrátumra, és növeli a képen lévő információsűrűséget a DNS szubsztrátumra történő véletlenszerű alkalmazásához képest (például a polon szekvenálásnál) [23] .
A kombinatorikus próbahorgony ligálás egy kombinált szekvenálási módszer, amely a próbakészlet hibridizáció és a ligálás kombinációját használja. Mindegyik szonda kilenc bázisból áll, amelyek degeneráltak (vagyis a négy közül bármelyik lehet) egy leolvasás előtt álló pozíció kivételével. A kívánt pozíciót az egyes nitrogénbázisoknak megfelelő négy színezék egyikével jelöljük. Az adapterrel és a próbákkal komplementer horgonyszekvenciát hibridizálunk a templátra. A horgonyszekvencia egyik végével szemben hibridizált próbákat ezután ligáljuk. A hibridizáció és a ligálás után a felesleges próbákat lemossuk, és képet készítünk. Ezután a teljes horgony-szonda komplexumot lemossák, és a folyamatot megismételjük más pozíciók szondáival. 5 összefüggő bázis leolvasása után a folyamatot megismételjük horgonyok segítségével öt további degenerált bázissal, lehetővé téve akár 10 bázis szekvenálását az adapter mindkét oldalán. Az eredeti fragmentumból összesen 70 bázist szekvenálunk, 35 bázist az adapter mindkét végén. Az adapterek közötti távolság miatt ezek a 35 bázisszekvenciák nem összefüggőek, mert tartalmaznak egy két és egy öt bázisú rést [24] .
A módszer a kémiai és a digitális információ kapcsolatán alapul; ezt a technológiát pH - indukált szekvenálásnak is nevezik . Az eljárás azon protonok kimutatásán alapul, amelyek egy DNS-lánc szintézise során keletkeznek melléktermékként. Ennek következtében az oldat pH-ja megváltozik, ami kimutatható [25] .
Az Ion Torrent platform abban különbözik a többi szekvenálási technológiától, hogy nem használ módosított nukleotidokat vagy optikai módszereket. Az Ion Torrent módszer lehetővé teszi transzkriptomok , kis RNS-ek tanulmányozását és ChIP-seq lebonyolítását . Sőt, mikrobiális közösségek genomjának tanulmányozására is használható [25] .
Az egymolekulás valós idejű szekvenálás (SMRT) módszerének megjelenése lehetővé tette a szintetizált láncot felépítő DNS-polimeráz munkájának valós időben történő megfigyelését. A módszer lényege, hogy meghatározzuk a genomiális DNS-fragmensek nukleotidszekvenciáját a végükhöz ligált specifikus DNS-adapterekkel, amelyek a későbbi szekvenáláshoz szükségesek. Az SMRT szekvenálás jelentése hasonló a korábban ismertetett NGS módszerekhez - a DNS polimeráz a vizsgált DNS molekula második szálát különböző fluoreszcens jelölésekkel jelölt nukleotidok segítségével egészíti ki, amelyeket nagy felbontású konfokális mikroszkóppal rögzítenek [26] .
A módszer az ionok áramának mérésén alapul egy nem vezető membrán egyetlen nanopórusán keresztül . Ahogy a nukleotidok áthaladnak ezen a póruson, az áram csökken. Az az idő, ameddig az ionáram változik, és ennek a cseppnek a nagysága attól függ, hogy éppen melyik nukleotid van a póruson belül [27] .
A korábban nem elérhető NGS-módszerek gyorsasága és alacsony költsége fellendülést váltott ki a genomikai kutatási ágazatban. Az NGS-nek köszönhetően lehetővé vált olyan kísérletek elvégzése, amelyek korábban technikailag elérhetetlenek voltak [28] [29] . Az NGS alkalmazása nem korlátozódik a genomiális szekvenciák meghatározására, hanem kiterjed a transzkriptom, a kromatin szerkezetének és a molekuláris és sejtbiológia egyéb területeinek vizsgálatára is. Az alábbiakban az NGS-módszerek alkalmazási területeire mutatunk be főbb példákat [30] .
Az NGS olcsóbbá válása és elterjedése lehetővé tette fehérje-DNS kötőhelyek ( ChIP-seq ), kölcsönhatásba lépő DNS-régiók ( kromoszómakonformáció meghatározása ), nyitott kromatin régiók meghatározását a genomban, valamint az ENCODE és modENCODE projektek megvalósítását. [31] .
A ChiP-seq a DNS-kötő fehérjék kötőhelyeinek feltérképezésére szolgál, amit korábban kromatin immunprecipitációval és microarray szekvenálás nélküli hibridizációval értek el [32] .
A mikroorganizmusoktól az emberekig változó összetettségű élő rendszerek genomja vált elérhetővé, beleértve a citogenetikailag normális mieloid leukémia sejtek genomját is . A leolvasások hosszának növelése felgyorsította a teljes genomok összeállítását [33] .
A genomokban bizonyos régiók szekvenálását a polimorfizmusok (különösen az egynukleotidos polimorfizmusok ) és a tumorok és más betegségek kialakulásában szerepet játszó gének mutációinak azonosítására használják. Egy ilyen nagyszabású munkára példa az 1000 genom projekt [34] .
Az NGS-t széles körben használják a különböző mintákban található mikroorganizmusok diverzitásának vizsgálatára (például mikrobapopulációk az óceánban és a talajban, új vírusok azonosítása átültethető szervekben, a gyomor-bél traktusra jellemző mikroflóra jellemzése stb.) [35] .
Az NGS alapján új RNS-szekvenálási (RNA-seq) megközelítést fejlesztettek ki a biológiai mintákban található transzkriptumok feltérképezésére és számbavételére. Ennek a módszernek vannak előnyei a korábban alkalmazott DNS microarray módszerrel szemben . Például a DNS-tömbök a genomiális szekvenciák átfedésétől függenek, míg az RNS-seq lehetővé teszi a transzkripció jellemzését a transzkripció kezdőhelyének előzetes ismerete nélkül [36] .
A közeljövőben a szekvenálási technológiák gyorsabbak és olcsóbbak lesznek, lehetővé téve őket a rákos betegek gyógyszeres terápia célpontjainak azonosítására. Már 2013-ban a következő generációs szekvenálási elemzés kevesebb mint 100 napig tartott a biopsziától az NGS befejezéséig. A teljes genom szekvenálás (WGS) és a teljes transzkriptom szekvenálás (WTS) ugyanannyi időt vesz igénybe [37] .