Bayesi hierarchikus modellezés

A Bayes-féle hierarchikus modellezés több szint  formájában (hierarchikus formában) megírt statisztikai modell , amely a bayesi módszerrel [ 1] becsüli meg a posterior eloszlás paramétereit ] . Az almodelleket hierarchikus modellben egyesítik, és Bayes tételét használják a megfigyelt adatokkal való kombinálásra, és figyelembe veszik az esetleges bizonytalanságokat. Ennek az uniónak az eredménye a utólagos eloszlás, amelyet finomított valószínűségi becslésnek is neveznek, miután több információt szereztünk az előzetes valószínűségről .

Bevezetés

A gyakorisági statisztika , a statisztika legnépszerűbb alapja , látszólag nem konzisztens következtetést adhat a Bayes-statisztika következtetéseivel, mivel a Bayes-féle megközelítés a paramétereket valószínűségi változóként kezeli, és szubjektív információkat használ fel e paraméterekre vonatkozó feltételezések megállapítására. [2] . Mivel a megközelítések különböző kérdésekre válaszolnak, a formális eredmények technikailag nem inkonzisztensek, de a két megközelítés nem egyezik abban, hogy melyik válasz vonatkozik az adott alkalmazásokra. A Bayes-pártiak azzal érvelnek, hogy a döntés szempontjából releváns információkat és a bizalomfrissítéseket nem lehet figyelmen kívül hagyni, és hogy a hierarchikus modellezés elsőbbséget élvezhet a klasszikus módszerekkel szemben olyan alkalmazásokban, ahol a válaszadó többféle megfigyelési adatot ad meg. Ezenkívül a modell robusztusnak bizonyult, mivel a posterior eloszlás kevésbé érzékeny a változó hierarchikus prioritásokra.

A hierarchikus modellezést akkor alkalmazzák, ha a megfigyelt mennyiségek több különböző szintjén áll rendelkezésre információ. A hierarchikus típusú elemzés és reprezentáció segít a többparaméteres problémák megértésében, és fontos szerepet játszik a számítási stratégiák kidolgozásában [3] .

Filozófia

Számos statisztikai alkalmazás több olyan paramétert használ, amelyek függőnek vagy összefüggőnek tekinthetők oly módon, hogy a probléma feltételezi, hogy e paraméterek együttes valószínűségi modellje függő [4] .

A valószínűségek formájában kifejezett egyéni megbízhatósági fokoknak megvan a maga bizonytalansága [5] . Ezenkívül a bizonyosság mértéke idővel változhat. Ahogy José M. Bernardo professzor és Adrian F. Smith professzor kijelentette: "A tanulási folyamat jelentősége a valóságba vetett egyéni és szubjektív bizalom fejlődésében rejlik." Ezek a szubjektív valószínűségek közvetlenül érintettek az elmében, mint a fizikai valószínűségek [6] . Ezért ehhez a bizalom frissítésére van szükség, és a Bayesianisták egy alternatív statisztikai modellt fogalmaztak meg, amely figyelembe veszi egy adott esemény a priori előfordulását [7] .

Bayes-tétel

Egy valós esemény feltételezett fogadása általában megváltoztatja a preferenciákat bizonyos lehetőségek között. Ez az opciókat meghatározó események bizalmi fokának megváltoztatásával történik [8] .

Tételezzük fel, hogy a j kórházi betegek szívterápia hatékonyságának tanulmányozásakor, akiknek túlélési valószínűsége van, a túlélési valószínűség frissül abban az y eseményben , amely egy hipotetikus megkérdőjelezhető szérumot generál, amely egyesek szerint növeli a szívproblémákkal küzdő betegek túlélését.

Ahhoz, hogy frissített állításokat adjunk az y esemény bekövetkezésének valószínűségéről, egy olyan modellel kell kezdenünk, amely közös valószínűségi eloszlást ad y és y esetén . Ez két eloszlás szorzataként írható fel, amelyeket gyakran előzetes és mintavételi eloszlásnak neveznek :

Ha a feltételes valószínűség alapvető tulajdonságát használjuk , az utólagos eloszlás a következőket adja:

A feltételes valószínűség és az egyedi események közötti kapcsolatot mutató egyenlőség Bayes-tételként ismert. Ez az egyszerű kifejezés a Bayes-i következtetés technikai magját testesíti meg, amelynek célja a frissített bizalom releváns és feloldható módon történő bevonása [8] .

Permutability

A statisztikai elemzés általános kiindulópontja az, hogy feltételezzük, hogy n érték permutál. Ha az y adaton kívül nem áll rendelkezésre olyan információ, amely megkülönbözteti a többitől, és a paraméterek rendezése vagy csoportosítása nem végezhető el, akkor a paraméterek szimmetriáját az előzetes valószínűségükhöz képest [9] kell feltételezni . Ezt a szimmetriát a valószínűségi permutáció reprezentálja. Általában hasznos és elfogadható a permutációs eloszlásból származó adatok független és egyenlő eloszlású modellezése, adott néhány ismeretlen eloszlású paramétervektor .

Véges permutáció

Fix n szám esetén egy halmaz permutálható, ha a közös eloszlás invariáns az index - permutációk alatt. Vagyis bármely permutációra vagy indexekre (1, 2, …, n ), [10]

Az alábbiakban egy permutálható, de nem független és azonos eloszlású sorozatra mutatunk be egy példát: Tekintsünk egy urnát piros és kék golyókkal, golyók rajzolásának valószínűségével. A golyókat anélkül húzzuk ki, hogy visszakerülnének az urnába, vagyis az n golyó egyikének kihúzása után n − 1 golyó marad az urnában  a következő húzáshoz.

Hadd ha a -edik golyó piros
másképp.

Mivel annak a valószínűsége, hogy az első húzásnál piros golyót, a másodiknál ​​kéket húzunk, egyenlő annak a valószínűségével, hogy az első húzásnál kék golyót, a másodiknál ​​pedig piros labdát húzunk, amelyek mindkettő egyenlő 1/2 (azaz ), akkor ingáznak .

Ennek a valószínűsége azonban, hogy a második sorsolásnál piros labdát választanak, már nem lesz 1/2. Így, és nem függetlenek.

Ha függetlenek és egyenlő eloszlásúak, akkor permutálhatók, de ennek fordítva nem feltétlenül igaz [11] .

Végtelen permutáció

A végtelen permutáció olyan tulajdonság, hogy egy végtelen sorozat bármely véges részhalmaza permutálható . Vagyis bármely n esetén a sorozat permutál [11] .

Hierarchikus modellek

Összetevők

A Bayes-féle hierarchikus modellezés két fontos fogalmat használ az utólagos eloszlás származtatására [1] , nevezetesen:

  1. Hiperparaméter : korábbi eloszlási paraméterek
  2. Hiperprior eloszlások : hiperparaméter-eloszlások

Tegyük fel, hogy az Y valószínűségi változó normális eloszlású θ paraméterrel az átlaggal és az 1 paraméterrel a variancia , azaz . Tegyük fel, hogy a paraméternek normális eloszlása ​​van , amelynek átlaga és varianciája 1, azaz . Ezen kívül van egy másik eloszlás, amelyet például a szabványos normál eloszlás ad meg . A paramétert hiperparaméternek nevezzük, míg eloszlása, amelyet adunk meg , egy példa egy hiperprior eloszlásra. Az Y jelölése megváltozik egy másik paraméter hozzáadásával, azaz . Ha van egy másik szint, mondjuk egy másik normális eloszlás átlaggal és szórással , ami azt jelenti , , akkor és nevezhetjük hiperparamétereknek is, és ezek eloszlásai hiperprior eloszlások [4] .

Rendszer

Legyen megfigyelések és egy paraméter, amely a generálási folyamatot vezérli . Tegyük fel továbbá, hogy a paramétereket a fősokaság permutációi generálják a hiperparaméter által szabályozott eloszlással .

A Bayes-féle hierarchikus modell a következő szinteket tartalmazza:

I. szint: II. szint: III. szint:

A valószínűség az I. szintről nézve , c , mint az előzetes eloszlása. Vegye figyelembe, hogy a valószínűség csak a -tól függ .

Az I. szint korábbi disztribúciója a következőkre bontható:

[a feltételes valószínűség definíciójából]

ahol egy hiperprioritáseloszlású hiperparaméter .

Ekkor a posterior eloszlás arányos ezzel a mennyiséggel:

[Bayes tételét használva] [12]

Példa

Szemléltetésképpen nézzünk meg egy példát: Egy tanár azt szeretné értékelni, hogy egy diák milyen jól teljesített a SAT tesztjén ( Scholastic Assessment Test [13] ) .  Az osztályzat megszerzéséhez a középiskolás diákról és az aktuális osztályzati átlagáról (GPA) vonatkozó információkat használ fel . Az aktuális GPA- nak van egy valószínűsége, amelyet valamilyen valószínűségi függvény ad meg paraméterrel , azaz . Ez a paraméter a hallgató SAT-pontszáma. A SAT pontszámot az általános sokaság eloszlásából származó teljes mintából vett mintaegységnek tekintjük, amelyet egy másik paraméterrel indexelünk , amely a tanuló középiskolai pontszáma [14] . Azaz ,. Ezenkívül a hiperparaméternek saját eloszlása ​​van a függvénnyel , amelyet hiperprior eloszlásnak nevezünk.  

Ha SAT-pontszámot szeretne kapni a GPA információkból,

A feladatban szereplő összes információt felhasználjuk az utólagos eloszlás megszerzésére. Ahelyett, hogy csak a prior és likelihood függvényt használnánk, a hiperprior eloszlások használata több információt szolgáltat, ami nagyobb bizalomhoz vezet a paraméter viselkedésében [15] .

Kétszintű hierarchikus modell

Általános esetben a számunkra érdekes kétszintű hierarchikus modellek közös utólagos eloszlása ​​a következő:

[tizenöt]

Háromszintű hierarchikus modell

A 3-szintű hierarchikus modelleknél az utólagos eloszlás a következő:

[tizenöt]

Jegyzetek

  1. 1 2 Allenby, Rossi, McCulloch, 2005 , p. 3.
  2. Gelman, Carlin, Stern, Rubin, 2004 , p. 4–5.
  3. Gelman, Carlin, Stern, Rubin, 2004 , p. 6.
  4. 1 2 Gelman, Carlin, Stern, Rubin, 2004 , p. 117.
  5. Jó, 1980 , p. 480.
  6. Jó, 1980 , p. 489-490.
  7. Bernardo és Smith, 1994 , p. 23.
  8. 1 2 Gelman, Carlin, Stern, Rubin, 2004 , p. 6-8.
  9. Dickey és Chen 1983 , p. 167–168.
  10. Gelman, Carlin, Stern, Rubin, 2004 , p. 121-125.
  11. 1 2 Diaconis, Freedman, 1980 , p. 745–747.
  12. Kadane és Wasilkowski 1983 , p. 371–372.
  13. "Academic Assessment Test" - szabványos teszt az Egyesült Államok felsőoktatási intézményeibe való felvételhez
  14. Gelman, Carlin, Stern, Rubin, 2004 , p. 120-121.
  15. 1 2 3 Box, Tiao, 1965 .

Irodalom