Gauss-folyamat

Az oldal jelenlegi verzióját még nem ellenőrizték tapasztalt közreműködők, és jelentősen eltérhet a 2017. augusztus 23-án áttekintett verziótól ; az ellenőrzések 28 szerkesztést igényelnek .

A valószínűségszámításban és a statisztikában a Gauss-folyamat egy sztochasztikus folyamat (valamilyen paraméterrel, leggyakrabban idővel vagy koordinátákkal indexelt valószínűségi változók halmaza), amely szerint ezen valószínűségi változók bármely véges halmazának többváltozós normális eloszlása ​​van , azaz bármilyen véges lineáris kombináció. ezek közül normál eloszlású . Egy Gauss-folyamat eloszlása ​​az összes valószínűségi változó együttes eloszlása, és ezért a függvények eloszlása ​​folytonos definíciós tartományban.

Ha a Gauss-folyamatot a gépi tanulási problémák megoldásának egyik módjának tekintjük, akkor a lusta tanulást és a pontok közötti hasonlóság mértékét ( kernelfüggvény ) használjuk arra, hogy a betanítási mintából egy láthatatlan pont értékét előre jelezzük. Az előrejelzés fogalma magán a pontbecslésen kívül a bizonytalanságra vonatkozó információkat is tartalmaz – ez egy egydimenziós Gauss-eloszlás. [egy]

Egyes kernelfüggvények előrejelzésének kiszámításához egy mátrixalgebrai módszert, a kriginget használjuk .

A Gauss-folyamatot Carl Friedrich Gaussról nevezték el , mivel a Gauss-eloszlás ( normál eloszlás ) koncepcióján alapul . A Gauss-folyamat a többváltozós normális eloszlások végtelen dimenziós általánosításaként fogható fel. Ezeket a folyamatokat a statisztikai modellezésben alkalmazzák ; különösen a normalitási tulajdonságokat használják. Például, ha egy véletlenszerű folyamatot Gauss-féle módon modelleznek, akkor különféle származtatott mennyiségek eloszlásai, mint például a folyamat átlagos értéke egy bizonyos időtartam alatt és a becslés hibája egy minta értékével, megkapható. kifejezetten.

Definíció

Egy folytonos idejű véletlenszerű folyamat akkor és csak akkor Gauss-féle az indexhalmaz bármely véges indexhalmazára .

egy többdimenziós Gauss -féle valószínűségi változó . [2] Ugyanúgy, mint bármely lineáris kombinációnak van egydimenziós normál (Gauss) eloszlása. Valószínűségi változók karakterisztikus függvényeinek felhasználásával a Gauss-tulajdonság a következőképpen fogalmazható meg: - Gauss akkor és csak akkor, ha bármely véges indexhalmazhoz vannak valós értékek , ahol olyan, hogy minden egyenlőségre

Hol van a képzeletbeli egység .

A számok és a változók kovarianciai és átlagértékei a folyamatokban, ill. [3]

Kovarianciafüggvények

A Gauss-folyamatok fő jellemzője, hogy teljesen meghatározhatók másodrendű statisztikákkal. [4] Ezért a kovarianciafüggvény teljes mértékben meghatározza a folyamat viselkedését, ha a Gauss-folyamat matematikai elvárása nullával egyenlő. Fontos megjegyezni, hogy egy függvény nem-negatív meghatározottsága lehetővé teszi a Karhunen-Loeve kiterjesztéssel történő spektrális felbontását . A kovarianciafüggvényen keresztül meghatározható a folyamat stacionaritása , izotrópiája , simasága és periodicitása . [4] [5]

A stacionaritás a folyamat viselkedését fejezi ki bármely két pont és a távolság tekintetében . Ha a folyamat stacionárius, akkor függ a pontjainak egymáshoz viszonyított helyzetétől, a köztük lévő távolságtól , egyébként nem stacionárius, vagyis a pontok és a pontok tényleges helyzetétől függ . Példa erre az Ornstein-Uhlenbeck folyamat egy speciális esete, a Brown-mozgás folyamata : stacionárius.

Ha egy folyamat csak a és közötti euklideszi távolságtól függ (nem iránytól) , akkor a folyamatot izotrópnak mondjuk. Az álló és izotróp folyamatot homogénnek nevezzük; [6] a gyakorlatban a stacionaritás és az izotrópia tulajdonságai a folyamat viselkedésében mutatkozó különbségeket (vagy inkább ezek hiányát) tükrözik, figyelembe véve a megfigyelő helyzetét.

A Gauss-folyamatok lényege, hogy a priori valószínűségi eloszlásokat kapjunk, amelyek simasága a felvett kovarianciafüggvénytől függ. [4] Ha azt várjuk, hogy a "közel fekvő" bemeneti pontok és a hozzájuk tartozó kimeneti pontok , valamint a "közel fekszenek", akkor a függvény folytonosságát feltételezzük. Ha jelentős torzítást akarunk megengedni, akkor durvább kovarianciafüggvényt kell választanunk. Az extrém viselkedésre példa az Ornstein-Uhlenbeck kovarianciafüggvény és a másodfokú exponenciális függvény, ahol az előbbi sehol nem differenciálható, az utóbbi pedig végtelenül differenciálható.

A periodicitás alatt periodikus minták indukálását értjük a folyamat viselkedésében. Formálisan ezt úgy érik el, hogy a bemeneti értéket egy kétdimenziós vektorra képezik le

Közönséges kovarianciafüggvények

Számos közös kovarianciafüggvény létezik: [5]

itt . A paraméter a folyamat hosszskálájának jellemzője (gyakorlatilag "milyen közel" kell lennie két pontnak ahhoz, hogy jelentősen befolyásolják egymást), a Kronecker szimbólum és a zajingadozások szórása . Ezenkívül egy módosított Bessel-függvény , és egy gamma-függvény, amely -ből számítható ki . Fontos megjegyezni, hogy egy komplex kovarianciafüggvény más egyszerűbb kovarianciafüggvények lineáris kombinációjaként definiálható, hogy a rendelkezésre álló adatkészletekre vonatkozó különböző információkat kombinálhassunk.

Nyilvánvaló, hogy a kapott eredmények a hiperparaméterek (például és ) értékétől függenek, amelyek meghatározzák a modell viselkedését.

A Brown-mozgás mint a Gauss-folyamatok integrálja

A Wiener-folyamat (az úgynevezett Brown-mozgás) a Gauss-féle fehérzaj folyamat szerves része. Nem áll , de vannak stacionárius lépései .

Az Ornstein-Uhlenbeck folyamat egy stacionárius Gauss-folyamat.

A Brown-híd (hasonlóan az Ornstein-Uhlenbeck folyamathoz) egy olyan Gauss-folyamat példa, amelynek lépései nem függetlenek .

A tört Brown-mozgás egy Gauss-folyamat, amelynek kovarianciafüggvénye a Wiener-folyamat függvényének általánosítása.

Alkalmazások

A Gauss-folyamat a függvények előzetes valószínűségi eloszlásaként használható Bayes-következtetésben . [5] [8] A kívánt függvénytartomány bármely N pont halmazához vegyünk egy többváltozós Gauss-eloszlást , amelynek kovarianciamátrix paramétere a kívánt kernellel vett N pont Gram-determinánsa , és egy mintát ebből az eloszlásból.

Az előző kovariancia által meghatározott Gauss-folyamat alapján a folytonos értékek származtatását krigingnek (Gauss-folyamaton alapuló regresszió) nevezzük. Ezért a Gauss-folyamatok hatékony nemlineáris többdimenziós interpolációs eszközként használhatók . A Gauss-folyamat regressziója tovább terjeszthető felügyelt és nem felügyelt tanulási problémák megoldására ( öntanulás ) .

Gauss-folyamat előrejelzése vagy kriging

Amikor a Gauss-folyamaton ( kriging ) alapuló regresszió alapproblémájáról van szó , akkor feltételezzük, hogy a koordinátákban megfigyelt Gauss-folyamat esetén az értékvektor csak egy olyan többváltozós Gauss-eloszlás mintája, amelynek mérete megegyezik a megfigyelt koordináták száma . Ezért a nulla eloszlási feltevés mellett , ahol a kovariancia mátrix az összes lehetséges pár között egy adott hiperparaméterhalmazhoz . [5] Így a határvalószínűség logaritmusa egyenlő:

és ennek a határvalószínűségnek a maximalizálása a -hoz képest a Gauss-folyamat teljes jellemzését adja . Megjegyezhető, hogy az első kifejezés attól függ, hogy a modell nem tud megfelelni a megfigyelt értékeknek, a második kifejezés pedig egyenesen arányos a modell összetettségével. Miután jeleztük és előre jeleztük a koordinátákban nem megfigyelt értékeket , hátra van a prediktív eloszlásból minták diagramjának felrajzolása , ahol az ezt követő átlagos becslést a következőképpen határozzuk meg:

és a B variancia utólagos becslését a következőképpen definiáljuk

ahol az új koordinátabecslés és az összes többi megfigyelt koordináta közötti kovariancia az adott hiperparametrikus vektorhoz , és a fentiek szerint vannak definiálva, és a variancia a vektor által diktált pontban . Fontos megjegyezni, hogy az ezt követő átlagbecslés (a "pontbecslés") a megfigyelések lineáris kombinációja ; hasonlóképpen a variancia gyakorlatilag független a megfigyelésektől . A Gauss-folyamat előrejelzésének ismert szűk keresztmetszete, hogy az előrejelzés számítási összetettsége köbös a pontok számában , azaz előfordulhat, hogy a számítás nem lehetséges nagy adatkészletek esetén. [4] A probléma megkerülése érdekében ritka Gauss-folyamatokon dolgoznak, amelyek általában egy adott folyamat reprezentatív halmazának felépítésén alapulnak . [9] [10]

Lásd még

Jegyzetek

  1. Platypus Innovation: A Gauss-folyamatok egyszerű bemutatása (nagyszerű adatmodellező eszköz) . Letöltve: 2018. január 15. Az eredetiből archiválva : 2018. május 1..
  2. MacKay, David, J.C. Információelmélet, következtetések és tanulási  algoritmusok . - Cambridge University Press , 2003. - P. 540. - ISBN 9780521642989 . . — ""Egy függvény valószínűségi eloszlása​​Gauss-folyamat, ha bármely véges pontválasztásnála sűrűségGauss-féle"".
  3. Dudley, R. M. Valós elemzés és valószínűség. – Wadsworth és Brooks/Cole, 1989.
  4. 1 2 3 4 Borbély, David. Bayesi érvelés és gépi tanulás . - Cambridge University Press , 2012. - ISBN 978-0-521-51814-7 .
  5. 1 2 3 4 Rasmussen, CE; Williams, CKI Gaussian Processes for Machine Learning . - MIT Press , 2006. - ISBN 0-262-18253-X .
  6. Grimmett, Geoffrey; David Stirzaker. Valószínűségi és véletlenszerű folyamatok  . - Oxford University Press , 2001. - ISBN 0198572220 .
  7. A scikit-learn dokumentációja is tartalmaz hasonló példákat . Archiválva : 2021. április 19. a Wayback Machine -nél .
  8. Liu, W.; Principe, JC; Haykin, S. Kernel Adaptive Filtering: A Comprehensive Introduction  . - John Wiley , 2010. - ISBN 0-470-44753-2 . Archivált másolat (nem elérhető link) . Letöltve: 2018. január 15. Az eredetiből archiválva : 2016. március 4. 
  9. Smola, AJ; Schoellkopf, B. Sparse greedy matrix approximation for machine learning  //  Proceedings of the Seventeenth International Conference on Machine Learning : Journal. - 2000. - P. 911-918 .
  10. Csato, L.; Opper, M. Sparse on-line Gauss-folyamatok  //  Neural Computation. - 2002. - 20. évf. 14 . - P. 641-668 . - doi : 10.1162/089976602317250933 .

Külső linkek

Szoftver