Bayesi statisztika

A bayesi statisztika a valószínűség Bayes-féle értelmezésén alapuló elmélet a statisztika területén , ahol a valószínűség egy esemény megbízhatósági fokát tükrözi , amely új információ gyűjtése esetén változhat, szemben a gyakorisági megközelítésen alapuló rögzített értékkel. [1] . A bizalom mértéke alapulhat az eseménnyel kapcsolatos előzetes ismereteken, például a korábbi kísérletek eredményein vagy az eseménybe vetett személyes bizalomon. Ez eltér a valószínűség számos más értelmezésétől , például a gyakorisági értelmezéstől, amely a valószínűséget egy nagyszámú kísérlet után bekövetkező esemény relatív gyakoriságának korlátjaként tekinti [2] .

Bevezetés

A Bayes-féle statisztikai módszerek a Bayes-tételt használják a valószínűségek kiszámítására és frissítésére új adatok érkezésekor. A Bayes-tétel egy esemény feltételes valószínűségét írja le mind adatok, mind a priori információk, vagy az eseménybe vetett bizalom vagy az eseménnyel kapcsolatos feltételek alapján. Például a Bayes -következtetésben a Bayes-tétel felhasználható egy valószínűségi eloszlás vagy egy statisztikai modell paraméterének becslésére . Mivel a Bayes-statisztika a valószínűséget megbízhatósági fokként kezeli, Bayes tétele közvetlenül hozzárendelhet egy valószínűségi eloszlást, amely számszerűsít egy paramétert vagy paraméterkészletet [2] .

A bayesi statisztika Thomas Bayesről kapta a nevét , aki 1763-ban megjelent cikkében megfogalmazta Bayes-tételének egy speciális esetét . Az 1700-as évek végétől az 1800-as évek elejéig számos közleményben Pierre-Simon Laplace kidolgozta a valószínűség Bayes-féle értelmezését. . Laplace a ma Bayes-féle módszereket használta számos statisztikai probléma megoldására. Sok bayesi módszert későbbi szerzők fejlesztettek ki, de ezt a kifejezést csak az 1950-es években használták az ilyen módszerek leírására. A 20. század nagy részében a bayesi módszerek filozófiai és gyakorlati okokból nem voltak kívánatosak a legtöbb statisztikus számára. Sok Bayes-féle módszer számításigényes, és a több mint egy évszázada használt módszerek többsége frekvenciaértelmezésen alapul. Azonban a nagy teljesítményű számítógépek és az új algoritmusok , például a Markov-láncok Monte Carlo-módszere megjelenésével a 21. század megjelenésével egyre intenzitással kezdik alkalmazni a Bayes-féle módszereket [2] [3] .

Bayes-tétel

A Bayes-tétel a Bayes-féle statisztika alapvető tétele, mivel a Bayes-módszerek a valószínűségek frissítésére használják, amelyek a megbízhatósági fokok új adatok érkezésekor. Adott két esemény és , a feltételes valószínűséget , feltéve, hogy igaz, a [4] képlettel fejezzük ki :

ahol . Bár Bayes tétele a valószínűségszámítás alapvető eredménye, a Bayes-statisztikában sajátos értelmezése van. A fenti egyenletben általában egy állítást jelent (például azt az állítást, hogy egy érme az esetek ötven százalékában feljön), és egy indoklást vagy egy figyelembe veendő új adatot (például egy sorozat eredménye érmefeldobások). az esemény előzetes valószínűsége , amely az eseménybe vetett bizalmat fejezi ki, mielőtt az indoklást figyelembe vennénk. Az előzetes valószínűség számszerűsítheti az eseménnyel kapcsolatos ismereteket vagy információkat . a valószínűségi függvény , amely a bizonyíték valószínűségeként értelmezhető, tekintettel arra , hogy az esemény megtörtént . A valószínűség számszerűsíti, hogy a bizonyítékok milyen mértékben támasztják alá az állítást . az utólagos valószínűség , az állítás valószínűsége a bizonyítékok mérlegelése után . Lényegében Bayes tétele a priori bizonyosságot frissíti az új bizonyítékok figyelembevétele után [2] .

A bizonyíték valószínűsége kiszámítható a teljes valószínűségi képlet segítségével . Ha az elemi események terének egy partíciója , amely a kísérlet összes eredményének halmaza, akkor [2] [4]

Ha végtelen számú eredmény van, akkor az összes eredményt integrálni kell a teljes valószínűségi képlet segítségével történő kiszámításhoz. Gyakran nehéz kiszámítani, mert összegezni vagy integrálni kell, ami időigényes, így gyakran csak a prior és a valószínűség szorzatát veszik figyelembe. A posterior valószínűség ezzel a szorzattal arányos [2] :

A maximális utólagos becslés , amely az utólagos becslés módja , és amelyet a Bayes-statisztikában gyakran matematikai optimalizálási módszerekkel számítanak ki , változatlan marad. Az utólagos valószínűség az érték pontos kiszámítása nélkül is közelíthető olyan módszerekkel, mint a Monte Carlo a Markov-láncokra vagy a variációs Bayes-módszer [2] .

Bayesi módszerek

A statisztikai technikák általános halmaza számos ágra osztható, amelyek közül soknak van speciális Bayes-féle változata.

Bayesi következtetés

A Bayes-i következtetés statisztikai következtetésre utal , amelyben a következtetés bizonytalanságát a valószínűség segítségével számszerűsítik. A klasszikus frekvenciakövetkeztetésben a modell- és hipotézisparamétereket rögzítettnek feltételezzük, és a frekvenciakövetkeztetésben a paraméterekhez vagy hipotézisekhez nem rendelnek valószínűségeket. Például a frekvenciakövetkeztetésben nincs értelme annak, hogy explicit módon megadjuk egy olyan esemény valószínűségét, amely csak egyszer történhet meg, például egy szimmetrikus érme következő feldobásának kimenetelét. Ésszerű lenne azonban azt mondani, hogy az érmefeldobások számának növekedésével a felfelé tartó fejek aránya a felére konvergál [5] .

A statisztikai modellek statisztikai feltételezések és folyamatok halmazát határozzák meg, amelyek reprezentálják a mintaadatok előállítását. A statisztikai modelleknek van egy sor paramétere, amely megváltoztatható. Például egy érme Bernoulli-eloszlású próbaként ábrázolható, amely két lehetséges eredményt szimulál. A Bernoulli-eloszlásnak van egy paramétere, amely egyenlő egy eredmény valószínűségével, ami a legtöbb esetben megegyezik a fejek megszerzésének valószínűségével [6] . A Bayes-féle következtetés központi eleme egy jó modell felépítése az adatokhoz. A legtöbb esetben a modellek csak közelítik a valós folyamatokat, és előfordulhat, hogy nem vesznek figyelembe néhány, az adatokat befolyásoló tényezőt [2] . A Bayes-i következtetésben a modellparaméterekhez valószínűségek rendelhetők. A paraméterek valószínűségi változókként ábrázolhatók . A Bayes-i következtetés a Bayes-tételt használja a valószínűségek frissítésére, miután több adatot kapott [2] [7] .

Statisztikai modellezés

A bayesi statisztikát használó statisztikai modellezésnek az a sajátossága, hogy minden ismeretlen paraméterhez előzetes valószínűségeket kell megadni. Ezenkívül az előzetes valószínűségi paraméterek maguk is rendelkezhetnek előzetes valószínűségekkel, ami Bayes-féle hierarchikus modellezést eredményez [8] , vagy függhetnek egymástól, ami Bayes-hálózatokat eredményez .

Kísérletek tervezése

A kísérletek bayesi tervezése magában foglalja az "előzetes bizalmi befolyásolás" nevű fogalmat. Ez a megközelítés statisztikai elemzési technikákat használ , hogy a korábbi kísérletek eredményeit beépítse a következő kísérlet tervezésébe. Ez a "bizalom" frissítésével érhető el korábbi és utólagos disztribúciók használatával . Ez lehetővé teszi, hogy mindenféle erőforrást felhasználjon a kísérletek tervezése során. Példa erre a többkarú bandita probléma .

Statisztikai diagramok

A statisztikai diagramok tartalmaznak módszereket az adatok feltárására, a modell megfelelőségének validálására stb. Egyes modern számítógépes technikák Bayes-féle következtetésekhez, különösen a Markov-láncok különféle Monte Carlo-technikáinak alkalmazása , ahhoz vezetett, hogy gyakran grafikusan ellenőrizni kell az ilyen számítások megfelelőségét, tükrözve a szükséges utólagos valószínűséget.

Jegyzetek

  1. Mi az a Bayes-statisztika? . deepai.org . Letöltve: 2019. január 11. Az eredetiből archiválva : 2019. február 12.
  2. 1 2 3 4 5 6 7 8 9 Gelman, Carlin, Stern et al., 2013 .
  3. Fienberg, 2006 , p. 1–40.
  4. 1 2 Grinstead, Snell, 2006 .
  5. Wakefield, 2013 .
  6. Ez az érme oldalára vonatkozik, a másik oldala a farok
  7. Kongó, 2014 .
  8. Hajiramezanali, Dadaneh et al., 2018 .

Irodalom

Olvasás további olvasáshoz

Linkek