Rejtett Markov-modell

A Rejtett Markov-modell ( HMM ) egy statisztikai modell , amely egy Markov -folyamathoz hasonló folyamat működését szimulálja ismeretlen paraméterekkel, és a feladat az ismeretlen paraméterek kitalálása a megfigyeltek alapján. A kapott paraméterek felhasználhatók további elemzésekhez, például mintafelismeréshez. A HMM a legegyszerűbb bayesi hithálózatnak tekinthető .

A rejtett Markov-modellekről az első feljegyzéseket Baum tette közzé az 1960-as években, és már a 70-es években használták először a beszédfelismerésben. Az 1980-as évek közepe óta az SMM-eket biológiai szekvenciák, különösen DNS elemzésére használják.

A HMM fő alkalmazása a beszédfelismerés, az írás, a mozgások és a bioinformatika területén érkezett. Ezenkívül a HMM-eket kriptoanalízisben , gépi fordításban használják .

Példa

Képzeljük el, hogy két barát minden este telefonon megbeszéli, mit csinált napközben. A barátod csak három dolgot tehet: sétálni a parkban, vásárolni, vagy kitakarítani a szobát. Választását csak a döntés időpontjában fennálló időjárás határozza meg. Semmit sem tud az időjárásról azon a vidéken, ahol barátja él, de az ő döntései alapján megpróbálhatja kitalálni, milyen volt az időjárás.

Az időjárást Markov-láncként ábrázolják, két állapota van: napos vagy esős, de te magad nem láthatod, ezért rejtve van előled. Barátod minden nap meghoz egyet a három lehetséges döntés közül: sétál, vásárol vagy takarít. Megismerheti barátja döntését, tehát ez egy megfigyelhető érték. Általában SMM-et kapunk.

Egy rejtett Markov-modell szerkezete

A hagyományos Markov-modellben az állapot látható a megfigyelő számára, így az átmenet valószínűsége az egyetlen paraméter. A rejtett Markov-modellben csak azokat a változókat tudjuk nyomon követni, amelyeket egy adott állapot érint. Minden állapotnak van egy valószínűségi eloszlása ​​az összes lehetséges kimeneti érték között. Ezért a HMM által generált karaktersorozat információt nyújt az állapotok sorrendjéről.

Az alábbi diagram a HMM általános felépítését mutatja. Az oválisok véletlenszerű értékű változókat jelölnek. A valószínűségi változó a rejtett változó időpontbeli értéke . A valószínűségi változó  egy megfigyelt változó időpontbeli értéke . A diagram nyilai feltételes függőséget jelölnek.

A diagramból világossá válik, hogy a rejtett változó értéke (at time ) csak a rejtett változó értékétől ( at time ) függ . Ezt Markov-tulajdonságnak hívják. Bár ugyanakkor a megfigyelt változó értéke csak a látens változó értékétől függ (mindkettő időpontban ).

Egy hosszúságú sorozat látásának valószínűsége az

itt az összeg a rejtett csomópontok összes lehetséges szekvenciáján fut át. A nyers erő számítási módszer  nagyon időigényes sok valós probléma esetén, mivel a rejtett csomópontok lehetséges sorozatainak száma nagyon nagy. De az előre-hátra eljárás [1] alkalmazása jelentősen megnövelheti a számítások sebességét.

Alapvető algoritmusok

Az SMM-hez három fő feladat kapcsolódik:

Lásd még

Jegyzetek

  1. Rabiner, p. 262

Linkek