Markov lánc
Az oldal jelenlegi verzióját még nem ellenőrizték tapasztalt közreműködők, és jelentősen eltérhet a 2019. december 28-án felülvizsgált
verziótól ; az ellenőrzések 9 szerkesztést igényelnek .
A Markov-lánc véletlenszerű események sorozata, véges vagy megszámlálható számú kimenetelű , ahol az egyes események bekövetkezésének valószínűsége csak az előző eseményben elért állapottól függ [1] . Az a tulajdonsága jellemzi, hogy lazán szólva, rögzített jelen mellett a jövő független a múlttól. A. A. Markov (idősebb) tiszteletére nevezték el , aki először vezette be ezt a fogalmat 1906-ban. [2]
Diszkrét idejű Markov-lánc
Definíció
A diszkrét valószínűségi változók sorozatát egyszerű Markov-láncnak nevezzük (diszkrét idejű), ha


.
Így a legegyszerűbb esetben a Markov-lánc következő állapotának feltételes eloszlása csak az aktuális állapottól függ, és nem függ minden korábbi állapottól (ellentétben a magasabb rendű Markov-láncokkal).
A valószínűségi változók tartományát a lánc állapotterének nevezzük , a számot pedig a lépésszámnak.


Átmeneti mátrix és homogén láncok
Mátrix , hol

az átmenet valószínűségeinek mátrixát a -edik lépésben, a vektort pedig, ahol

— a Markov-lánc kezdeti eloszlása .
Nyilvánvaló, hogy az átmenet valószínűségi mátrix helyes sztochasztikus , azaz.

.
Egy Markov-láncot homogénnek nevezünk, ha az átmenet valószínűségi mátrixa nem függ a lépésszámtól, azaz

.
Ellenkező esetben a Markov-láncot inhomogénnek nevezzük. A következőkben feltételezzük, hogy homogén Markov-láncokról van szó.
Véges dimenziós eloszlások és az n-lépéses átmeneti mátrix
A feltételes valószínűség tulajdonságaiból és a homogén Markov-lánc definíciójából kapjuk:

,
ahonnan a Kolmogorov-Chapman egyenlet speciális esete következik:

,
vagyis egy homogén Markov-lánc lépésenkénti átmeneti valószínűségeinek mátrixa az 1 lépésenkénti átmeneti valószínűségek mátrixának -edik foka. Végül,



.
Állapottípusok
Példák
Markov lánc folyamatos idővel
Definíció
A diszkrét valószínűségi változók családját Markov-láncnak nevezzük (folyamatos idővel), ha


.
Egy folytonos idejű Markov-láncot homogénnek mondunk, ha

.
Az átmeneti függvények mátrixa és a Kolmogorov-Chapman egyenlet
A diszkrét időhöz hasonlóan a folytonos idejű homogén Markov-lánc véges dimenziós eloszlását is teljesen meghatározza a kezdeti eloszlás
és az átmeneti függvények mátrixa ( átmeneti valószínűségek )

.
Az átmeneti valószínűségek mátrixa kielégíti a Kolmogorov-Chapman egyenletet : vagy

Az intenzitásmátrix és a Kolmogorov-féle differenciálegyenletek
Definíció szerint az intenzitásmátrix , vagy ezzel egyenértékűen


.
A Kolmogorov-Chapman egyenletből két egyenlet következik:
Mindkét egyenlethez a kezdeti feltételt választjuk . Megfelelő megoldás
A P és Q mátrixok tulajdonságai
Bármely mátrix a következő tulajdonságokkal rendelkezik:


- A mátrixelemek nem negatívak: (valószínűségek nem-negatívitása).


- Az egyes sorok elemeinek összege 1: (teljes valószínűség), vagyis a mátrix jobb -sztochasztikus (vagy soronkénti).



- Az összes mátrix sajátértéke nem haladja meg az 1-et abszolút értékben: . Ha , akkor .





- A mátrix sajátértéke legalább egy nem negatív bal oldali sajátvektor - sornak (egyensúlynak) felel meg: .



- Egy mátrix sajátértékéhez minden gyökérvektor sajátvektor, azaz a megfelelő Jordan-cellák triviálisak.


A mátrix a következő tulajdonságokkal rendelkezik:

- Az átlón kívüli mátrixelemek nem negatívak: .


- Az átlós mátrix elemei nem pozitívak: .


- Az egyes sorok elemeinek összege 0:


- Az összes mátrix sajátértékének valós része nem pozitív: . Ha , akkor





- A mátrix sajátértéke legalább egy nem negatív bal sori sajátvektornak felel meg (egyensúly):



- Egy mátrix sajátértékéhez minden gyökérvektor sajátvektor, azaz a megfelelő Jordan-cellák triviálisak.


Átmeneti gráf, konnektivitás és ergodikus Markov-láncok
Egy folytonos idejű Markov-lánchoz egy irányított átmeneti gráfot (röviden: átmeneti gráfot) készítünk a következő szabályok szerint:
- A gráf csúcsainak halmaza egybeesik a láncállapotok halmazával.
- A csúcsokat egy orientált él köti össze, ha (azaz a -edik állapotból a -edikbe irányuló áramlás intenzitása pozitív).





Az átmeneti gráf topológiai tulajdonságai összefüggenek a mátrix spektrális tulajdonságaival . Konkrétan a következő tételek igazak véges Markov-láncokra:

- Egy véges Markov-lánc következő három tulajdonsága: A, B, C ekvivalens (az ezekkel rendelkező láncokat néha gyengén ergodikusnak nevezik ):
V. Az átmeneti gráf bármely két különböző csúcsához van a gráfnak egy olyan csúcsa ("közös lefolyó"), hogy vannak orientált utak a csúcstól a csúcsig és a csúcstól a csúcsig . Megjegyzés : lehetséges eset vagy ; ebben az esetben irányított útnak számít egy triviális (üres) út odáig vagy odáig .












B. Egy mátrix nulla sajátértéke nem degenerált.

C. A mátrix egy olyan mátrixra törekszik, amelyben minden sor egybeesik (és nyilvánvalóan egybeesik az egyensúlyi eloszlással).

- Egy véges Markov-lánc következő öt tulajdonsága A, B, C, D, D ekvivalens (az ilyen láncokat ergodikusnak nevezzük ):
A. Egy lánc átmeneti gráfja irányfüggő.
B. A mátrix nulla sajátértéke nem degenerált, és szigorúan pozitív bal oldali sajátvektornak felel meg (egyensúlyi eloszlás).

B. Egyesek számára a mátrix szigorúan pozitív (vagyis mindenki számára ).




D. Minden esetben a mátrix szigorúan pozitív.


E. A mátrix szigorúan pozitív mátrixra hajlamos, amelyben minden sor egybeesik (és nyilvánvalóan egybeesik az egyensúlyi eloszlással).

Példák
Tekintsünk háromállapotú Markov-láncokat folyamatos idejű, az ábrán látható átmeneti grafikonoknak megfelelően. Az (a) esetben az intenzitásmátrixnak csak az alábbi átlón kívüli elemei nem nullák , a (b) esetben csak a nullától eltérőek , a (c) esetben pedig . A fennmaradó elemeket a mátrix tulajdonságai határozzák meg (az egyes sorok elemeinek összege 0). Ennek eredményeként az (a), (b), (c) grafikonok intenzitásmátrixai így néznek ki:




Kinetikai alapegyenlet
Az alapvető kinetikai egyenlet a valószínűség-eloszlás alakulását írja le egy folyamatos idejű Markov-láncban. Az „alapegyenlet” itt nem jelző, hanem az angol kifejezés fordítása. mester egyenlet . A valószínűségi eloszlás sorvektora esetében az alapvető kinetikai egyenlet a következőképpen alakul:

és lényegében egybeesik a közvetlen Kolmogorov-egyenlettel . A fizikai irodalomban gyakrabban használják a valószínűségek oszlopvektorait, és az alapvető kinetikai egyenletet olyan formában írják le, amely kifejezetten használja a teljes valószínűség fennmaradásának törvényét:
ahol
Ha a kinetikai alapegyenletnek pozitív egyensúlya van , akkor az alakba írható fel

Ljapunov függvények az alapvető kinetikai egyenlethez
A fő kinetikai egyenlethez a konvex Ljapunov -függvények gazdag családja tartozik – olyan valószínűség-eloszlási függvények, amelyek az időben monoton módon változnak. Legyen egy változó konvex függvénye . Bármilyen pozitív valószínűségi eloszláshoz ( ) definiáljuk a Morimoto-függvényt :



.
Az idő derivált, ha kielégíti a kinetikai alapegyenletet, az


![{\frac {dH_{h}(p(t))}{dt}}=\sum _{{i,j\,i\neq j}}T_{{ij}}p_{j}^{*} \left[h\left({\frac {p_{i}}{p_{i}^{*}}}\right)-h\left({\frac {p_{j}}{p_{j}^ {*}}}\jobbra)+h'\left({\frac {p_{i}}{p_{i}^{*}}}\jobbra)\bal({\frac {p_{j}}{ p_{j}^{*}}}-{\frac {p_{i}}{p_{i}^{*}}}\right)\right]\leqslant 0](https://wikimedia.org/api/rest_v1/media/math/render/svg/32674e5488b65ab4b87325258845e0fcefe03298)
.
Az utolsó egyenlőtlenség a konvexitás miatt érvényes .

Példák Morimoto függvényeire
, ;
ez a függvény az aktuális valószínűségi eloszlás és az egyensúlyi egy in -
norm közötti távolság . Az időeltolódás ebben a normában a valószínűségi eloszlások terének összehúzódása. (Az összehúzódások tulajdonságairól lásd a
Banach-féle fixpont tételt .)
, ;
ez a függvény a (mínusz) Kullback
entrópia (lásd
Kullback-Leibler távolság ). A fizikában ez megfelel a
szabad energia osztva (ahol a
Boltzmann-állandó , az abszolút
hőmérséklet ):



ha (
Boltzmann eloszlás ) akkor

.
, ;
ez a funkció a Burg entrópia szabad energiájú analógja, amelyet széles körben használnak a jelfeldolgozásban:
, ;
ez a (mínusz) Kullback entrópia másodfokú közelítése az egyensúlyi pont közelében. Egy időben állandó tagig ez a függvény megegyezik a következő választással adott (mínusz) Fisher-entrópiával:
, ;
ez a (mínusz)
Fisher entrópia .
, ;![H_{h}(p)={\frac {1}{q-1}}\left[\sum _{i}p_{i}^{*}\left({\frac {p_{i}}{ p_{i}^{*}}}\jobbra)^{q}-1\jobbra]](https://wikimedia.org/api/rest_v1/media/math/render/svg/037533b5c98e32bb459afe8ad6f8156a16289390)
ez a szabad energia egyik analógja a
Tsallis entrópiához .

nem extenzív mennyiségek statisztikai fizikájának alapjául szolgál. A -nál a klasszikus Boltzmann-Gibbs-Shannon entrópiára, a megfelelő Morimoto-függvény pedig a (mínusz) Kullback entrópiára hajlik.
Gyakorlati alkalmazás
Az egyik első tudományos tudományág, amelyben a Markov-láncok gyakorlati alkalmazásra találtak, a nyelvészet volt (különösen a szövegkritika ). Eredményeinek illusztrálására maga Markov tanulmányozta a magánhangzók és mássalhangzók váltakozásának függőségét az „ Jevgenyij Onegin ” és a „Bagrov-unoka gyermekkori évei ” [3] első fejezeteiben .
Jegyzetek
- ↑ "Markov-lánc | A Markov-lánc meghatározása az amerikai angol nyelven az Oxford Dictionaries által" . Oxfordi szótárak | Angol. . Lexico szótárak | angol (2017. december 14.). Letöltve: 2020. április 1.
- ↑ Gagniuc, Paul A. Markov Láncok: Az elmélettől a megvalósításig és a kísérletezésig . - USA, NJ: John Wiley & Sons , 2017. - 2-8. o. — ISBN 978-1-119-38755-8 .
- ↑ Maistrov, L. E. A valószínűség fogalmának fejlesztése . - Nauka, 1980. - S. 188. - 269 p.
Irodalom
- Kelbert M. Ya., Sukhov Yu. M. Valószínűség és statisztika példákban és problémákban. II. kötet: Markov-láncok, mint a véletlenszerű folyamatok elméletének kiindulópontja és alkalmazásaik. - M. : MTSNMO, 2010. - 295 p. — ISBN 978-5-94057-252-7 .
- Markov A. A. , A nagy számok törvényének kiterjesztése az egymástól függő mennyiségekre. - A Kazany Egyetem Fizikai és Matematikai Társaságának hírei. - 2. sorozat. - 15. kötet (1906) - S. 135-156.
- Markov-lánc / A. V. Prohorov // Nagy Orosz Enciklopédia : [35 kötetben] / ch. szerk. Yu. S. Osipov . - M . : Nagy orosz enciklopédia, 2004-2017.
- Kemeny JG, Snell JL , Finite Markov láncok. — Az egyetemi matematikai sorozat. Princeton: Van Nostrand, 1960
- Fordítás: Kemeny J.J. , Snell J.L. Véges Markov-láncok. — M.: Nauka. 1970. - 272 p.
- Zhong Kai-lai homogén Markov láncok. Ford. angolról. — M.: Mir, 1964. — 425 p.
- E. Nummelin , Általános irreducibilis Markov-láncok és nemnegatív operátorok. — M.: Mir, 1989. — 207 p.
- Morimoto T. , Markov-folyamatok és a H-tétel. – J. Phys. szoc. Jap. 12, 328-331 (1963)].
- Yaglom A.M. , Yaglom I.M. , Valószínűség és információ . - M., Nauka, 1973. - 512 p.
- Kullback S. , Információelmélet és statisztika. Wiley, New York, 1959.
- Burg JP , The Relationship Between Maximum Entropy Spectra and Maximum Likelihood Spectra, Geophysics 37(2) (1972), 375-376.
- Tsallis C. , A Boltzmann-Gibbs statisztika lehetséges általánosítása. J. Stat. Phys. 52 (1988), 479-487.
- Rudoy Yu. G. , Általános információs entrópia és nem kanonikus eloszlás az egyensúlyi statisztikai mechanikában , TMF, 135:1 (2003), 3-54.
- Gorban, Alexander N.; Gorban, Pavel A.; Bíró, George. Entrópia: A Markov-rendező megközelítés . 12. entrópia , sz. 5 (2010), 1145-1193.
Linkek
Szótárak és enciklopédiák |
|
---|
Bibliográfiai katalógusokban |
|
---|
A mesterséges neurális hálózatok típusai |
---|
|