Rejtett Markov-modell

A Rejtett Markov-modell ( HMM ) egy statisztikai modell , amely egy Markov -folyamathoz hasonló folyamat működését szimulálja ismeretlen paraméterekkel, és a feladat az ismeretlen paraméterek kitalálása a megfigyeltek alapján. A kapott paraméterek felhasználhatók további elemzésekhez, például mintafelismeréshez. A HMM a legegyszerűbb bayesi hithálózatnak tekinthető .

A rejtett Markov-modellekről az első feljegyzéseket Baum tette közzé az 1960-as években, és már a 70-es években használták először a beszédfelismerésben. Az 1980-as évek közepe óta az SMM-eket biológiai szekvenciák, különösen DNS elemzésére használják.

A HMM fő alkalmazása a beszédfelismerés, az írás, a mozgások és a bioinformatika területén érkezett. Ezenkívül a HMM-eket kriptoanalízisben , gépi fordításban használják .

Példa

Képzeljük el, hogy két barát minden este telefonon megbeszéli, mit csinált napközben. A barátod csak három dolgot tehet: sétálni a parkban, vásárolni, vagy kitakarítani a szobát. Választását csak a döntés időpontjában fennálló időjárás határozza meg. Semmit sem tud az időjárásról azon a vidéken, ahol barátja él, de az ő döntései alapján megpróbálhatja kitalálni, milyen volt az időjárás.

Az időjárást Markov-láncként ábrázolják, két állapota van: napos vagy esős, de te magad nem láthatod, ezért rejtve van előled. Barátod minden nap meghoz egyet a három lehetséges döntés közül: sétál, vásárol vagy takarít. Megismerheti barátja döntését, tehát ez egy megfigyelhető érték. Általában SMM-et kapunk.

Egy rejtett Markov-modell szerkezete

A hagyományos Markov-modellben az állapot látható a megfigyelő számára, így az átmenet valószínűsége az egyetlen paraméter. A rejtett Markov-modellben csak azokat a változókat tudjuk nyomon követni, amelyeket egy adott állapot érint. Minden állapotnak van egy valószínűségi eloszlása az összes lehetséges kimeneti érték között. Ezért a HMM által generált karaktersorozat információt nyújt az állapotok sorrendjéről.

Az alábbi diagram a HMM általános felépítését mutatja. Az oválisok véletlenszerű értékű változókat jelölnek. A valószínűségi változó a rejtett változó időpontbeli értéke . A valószínűségi változó egy megfigyelt változó időpontbeli értéke . A diagram nyilai feltételes függőséget jelölnek. $x(t)$ $t$ $y(t)$ $t$

A diagramból világossá válik, hogy a rejtett változó értéke (at time ) csak a rejtett változó értékétől ( at time ) függ . Ezt Markov-tulajdonságnak hívják. Bár ugyanakkor a megfigyelt változó értéke csak a látens változó értékétől függ (mindkettő időpontban ). $x(t)$ $t$ $x(t-1)$ $t-1$ $y(t)$ $x(t)$ $t$

Egy hosszúságú sorozat látásának valószínűsége az $Y=y(0),y(1),\pontok,y(L-1)$ $L$

P(Y)=\sum _{{X}}P(Y\mid X)P(X),

itt az összeg a rejtett csomópontok összes lehetséges szekvenciáján fut át. A nyers erő számítási módszer nagyon időigényes sok valós probléma esetén, mivel a rejtett csomópontok lehetséges sorozatainak száma nagyon nagy. De az előre-hátra eljárás [1] alkalmazása jelentősen megnövelheti a számítások sebességét. $X=x(0),x(1),\dots ,x(L-1).$ $P(Y)$

Alapvető algoritmusok

Az SMM-hez három fő feladat kapcsolódik:

Forward-reverse algoritmus : a modell és a sorozat paraméterei alapján ki kell számítani ennek a sorozatnak a valószínűségét (lehetővé teszi a probléma megoldását).
Viterbi algoritmus : a modell paraméterei alapján meg kell határozni a rejtett csomópontok legmegfelelőbb sorozatát, amely a legpontosabban írja le az adott modellt (segít a probléma megoldásában).
Baum-Welsh algoritmus : adott kimeneti sorozat (vagy több) diszkrét értékekkel, a HMM-t ezen a kimeneten kell betanítani.

Lásd még

Marellier tétele

Jegyzetek

↑ Rabiner, p. 262

Linkek

Rejtett Markov modellek
Szergej Nikolenko. 6. és 7. sz. előadások (diák) a Rejtett Markov-modellekről a Valószínűségi Tanulás kurzusból

Grafikon valószínűségi modellek
Bayesi hálózat Oksági Bayes-hálózat Markov hálózat Rejtett Markov-modell

Gépi tanulás és adatbányászat
Feladatok	Osztályozási feladat Tanulás tanár nélkül Tanár által segített tanulás Regresszió analízis AutoML Egyesületi szabályzat Funkció kivonás Tulajdonságok képzése Rangsorképzés Nyelvtani levezetés Online tanulás
Tanulás tanárral	k-legközelebbi szomszéd módszer Naiv Bayes osztályozó döntési fa Támogatja a vektoros gépet Lineáris regresszió Logisztikus regresszió perceptron Modellegyüttesek Zsákolás fellendítése véletlenszerű erdő Releváns vektoros módszer
klaszteranalízis	k-módszer Fuzzy klaszterezési módszer Hierarchikus klaszterezés EM algoritmus NYÍR GYÓGYMÓD DBSCAN OPTIKA Átlageltolás
Dimenziócsökkentés	Faktoranalízis Főkomponens módszer CCA ICA LDA Nem negatív mátrix kiterjesztése t-SNE
Strukturális előrejelzés	Grafikon valószínűségi modell Bayesi hálózat Rejtett Markov-modell CRF
Anomália észlelése	k-legközelebbi szomszéd módszer Helyi kibocsátási szint
Grafikon valószínűségi modellek	Bayesi hálózat Markov hálózat Rejtett Markov-modell
Neurális hálózatok	Limitált Boltzmann gép önszerveződő térkép Aktiválási funkció Szigma alakú softmax Radiális bázisfüggvény Hátsó szaporítási módszer Mély tanulás Többrétegű perceptron Ismétlődő neurális hálózat hosszú távú rövid távú memória Ellenőrzött visszatérő blokk Konvolúciós Neurális Hálózat U-háló Autoencoder
Megerősítő tanulás	Markov folyamat Bellman egyenlet Mohó algoritmus Q-learning SARSA Időbeli különbség (TD)
Elmélet	Vapnik-Chervonenkis elmélet Elfogultság-diszperziós dilemma Számítógépes tanuláselmélet Empirikus kockázatminimalizálás Occam tanul PAC tanulás Statisztikai tanuláselmélet
Folyóiratok és konferenciák	NeurIPS ICML ML JMLR ArXiv:cs.LG