A Bayes-féle hierarchikus modellezés több szint formájában (hierarchikus formában) megírt statisztikai modell , amely a bayesi módszerrel [ 1] becsüli meg a posterior eloszlás paramétereit ] . Az almodelleket hierarchikus modellben egyesítik, és Bayes tételét használják a megfigyelt adatokkal való kombinálásra, és figyelembe veszik az esetleges bizonytalanságokat. Ennek az uniónak az eredménye a utólagos eloszlás, amelyet finomított valószínűségi becslésnek is neveznek, miután több információt szereztünk az előzetes valószínűségről .
A gyakorisági statisztika , a statisztika legnépszerűbb alapja , látszólag nem konzisztens következtetést adhat a Bayes-statisztika következtetéseivel, mivel a Bayes-féle megközelítés a paramétereket valószínűségi változóként kezeli, és szubjektív információkat használ fel e paraméterekre vonatkozó feltételezések megállapítására. [2] . Mivel a megközelítések különböző kérdésekre válaszolnak, a formális eredmények technikailag nem inkonzisztensek, de a két megközelítés nem egyezik abban, hogy melyik válasz vonatkozik az adott alkalmazásokra. A Bayes-pártiak azzal érvelnek, hogy a döntés szempontjából releváns információkat és a bizalomfrissítéseket nem lehet figyelmen kívül hagyni, és hogy a hierarchikus modellezés elsőbbséget élvezhet a klasszikus módszerekkel szemben olyan alkalmazásokban, ahol a válaszadó többféle megfigyelési adatot ad meg. Ezenkívül a modell robusztusnak bizonyult, mivel a posterior eloszlás kevésbé érzékeny a változó hierarchikus prioritásokra.
A hierarchikus modellezést akkor alkalmazzák, ha a megfigyelt mennyiségek több különböző szintjén áll rendelkezésre információ. A hierarchikus típusú elemzés és reprezentáció segít a többparaméteres problémák megértésében, és fontos szerepet játszik a számítási stratégiák kidolgozásában [3] .
Számos statisztikai alkalmazás több olyan paramétert használ, amelyek függőnek vagy összefüggőnek tekinthetők oly módon, hogy a probléma feltételezi, hogy e paraméterek együttes valószínűségi modellje függő [4] .
A valószínűségek formájában kifejezett egyéni megbízhatósági fokoknak megvan a maga bizonytalansága [5] . Ezenkívül a bizonyosság mértéke idővel változhat. Ahogy José M. Bernardo professzor és Adrian F. Smith professzor kijelentette: "A tanulási folyamat jelentősége a valóságba vetett egyéni és szubjektív bizalom fejlődésében rejlik." Ezek a szubjektív valószínűségek közvetlenül érintettek az elmében, mint a fizikai valószínűségek [6] . Ezért ehhez a bizalom frissítésére van szükség, és a Bayesianisták egy alternatív statisztikai modellt fogalmaztak meg, amely figyelembe veszi egy adott esemény a priori előfordulását [7] .
Egy valós esemény feltételezett fogadása általában megváltoztatja a preferenciákat bizonyos lehetőségek között. Ez az opciókat meghatározó események bizalmi fokának megváltoztatásával történik [8] .
Tételezzük fel, hogy a j kórházi betegek szívterápia hatékonyságának tanulmányozásakor, akiknek túlélési valószínűsége van, a túlélési valószínűség frissül abban az y eseményben , amely egy hipotetikus megkérdőjelezhető szérumot generál, amely egyesek szerint növeli a szívproblémákkal küzdő betegek túlélését.
Ahhoz, hogy frissített állításokat adjunk az y esemény bekövetkezésének valószínűségéről, egy olyan modellel kell kezdenünk, amely közös valószínűségi eloszlást ad y és y esetén . Ez két eloszlás szorzataként írható fel, amelyeket gyakran előzetes és mintavételi eloszlásnak neveznek :
Ha a feltételes valószínűség alapvető tulajdonságát használjuk , az utólagos eloszlás a következőket adja:
A feltételes valószínűség és az egyedi események közötti kapcsolatot mutató egyenlőség Bayes-tételként ismert. Ez az egyszerű kifejezés a Bayes-i következtetés technikai magját testesíti meg, amelynek célja a frissített bizalom releváns és feloldható módon történő bevonása [8] .
A statisztikai elemzés általános kiindulópontja az, hogy feltételezzük, hogy n érték permutál. Ha az y adaton kívül nem áll rendelkezésre olyan információ, amely megkülönbözteti a többitől, és a paraméterek rendezése vagy csoportosítása nem végezhető el, akkor a paraméterek szimmetriáját az előzetes valószínűségükhöz képest [9] kell feltételezni . Ezt a szimmetriát a valószínűségi permutáció reprezentálja. Általában hasznos és elfogadható a permutációs eloszlásból származó adatok független és egyenlő eloszlású modellezése, adott néhány ismeretlen eloszlású paramétervektor .
Fix n szám esetén egy halmaz permutálható, ha a közös eloszlás invariáns az index - permutációk alatt. Vagyis bármely permutációra vagy indexekre (1, 2, …, n ), [10]
Az alábbiakban egy permutálható, de nem független és azonos eloszlású sorozatra mutatunk be egy példát: Tekintsünk egy urnát piros és kék golyókkal, golyók rajzolásának valószínűségével. A golyókat anélkül húzzuk ki, hogy visszakerülnének az urnába, vagyis az n golyó egyikének kihúzása után n − 1 golyó marad az urnában a következő húzáshoz.
Hadd | ha a -edik golyó piros |
másképp. |
Mivel annak a valószínűsége, hogy az első húzásnál piros golyót, a másodiknál kéket húzunk, egyenlő annak a valószínűségével, hogy az első húzásnál kék golyót, a másodiknál pedig piros labdát húzunk, amelyek mindkettő egyenlő 1/2 (azaz ), akkor ingáznak .
Ennek a valószínűsége azonban, hogy a második sorsolásnál piros labdát választanak, már nem lesz 1/2. Így, és nem függetlenek.
Ha függetlenek és egyenlő eloszlásúak, akkor permutálhatók, de ennek fordítva nem feltétlenül igaz [11] .
A végtelen permutáció olyan tulajdonság, hogy egy végtelen sorozat bármely véges részhalmaza permutálható . Vagyis bármely n esetén a sorozat permutál [11] .
A Bayes-féle hierarchikus modellezés két fontos fogalmat használ az utólagos eloszlás származtatására [1] , nevezetesen:
Tegyük fel, hogy az Y valószínűségi változó normális eloszlású θ paraméterrel az átlaggal és az 1 paraméterrel a variancia , azaz . Tegyük fel, hogy a paraméternek normális eloszlása van , amelynek átlaga és varianciája 1, azaz . Ezen kívül van egy másik eloszlás, amelyet például a szabványos normál eloszlás ad meg . A paramétert hiperparaméternek nevezzük, míg eloszlása, amelyet adunk meg , egy példa egy hiperprior eloszlásra. Az Y jelölése megváltozik egy másik paraméter hozzáadásával, azaz . Ha van egy másik szint, mondjuk egy másik normális eloszlás átlaggal és szórással , ami azt jelenti , , akkor és nevezhetjük hiperparamétereknek is, és ezek eloszlásai hiperprior eloszlások [4] .
Legyen megfigyelések és egy paraméter, amely a generálási folyamatot vezérli . Tegyük fel továbbá, hogy a paramétereket a fősokaság permutációi generálják a hiperparaméter által szabályozott eloszlással .
A Bayes-féle hierarchikus modell a következő szinteket tartalmazza:
I. szint: II. szint: III. szint:A valószínűség az I. szintről nézve , c , mint az előzetes eloszlása. Vegye figyelembe, hogy a valószínűség csak a -tól függ .
Az I. szint korábbi disztribúciója a következőkre bontható:
[a feltételes valószínűség definíciójából]ahol egy hiperprioritáseloszlású hiperparaméter .
Ekkor a posterior eloszlás arányos ezzel a mennyiséggel:
[Bayes tételét használva] [12]Szemléltetésképpen nézzünk meg egy példát: Egy tanár azt szeretné értékelni, hogy egy diák milyen jól teljesített a SAT tesztjén ( Scholastic Assessment Test [13] ) . Az osztályzat megszerzéséhez a középiskolás diákról és az aktuális osztályzati átlagáról (GPA) vonatkozó információkat használ fel . Az aktuális GPA- nak van egy valószínűsége, amelyet valamilyen valószínűségi függvény ad meg paraméterrel , azaz . Ez a paraméter a hallgató SAT-pontszáma. A SAT pontszámot az általános sokaság eloszlásából származó teljes mintából vett mintaegységnek tekintjük, amelyet egy másik paraméterrel indexelünk , amely a tanuló középiskolai pontszáma [14] . Azaz ,. Ezenkívül a hiperparaméternek saját eloszlása van a függvénnyel , amelyet hiperprior eloszlásnak nevezünk.
Ha SAT-pontszámot szeretne kapni a GPA információkból,
A feladatban szereplő összes információt felhasználjuk az utólagos eloszlás megszerzésére. Ahelyett, hogy csak a prior és likelihood függvényt használnánk, a hiperprior eloszlások használata több információt szolgáltat, ami nagyobb bizalomhoz vezet a paraméter viselkedésében [15] .
Általános esetben a számunkra érdekes kétszintű hierarchikus modellek közös utólagos eloszlása a következő:
[tizenöt]A 3-szintű hierarchikus modelleknél az utólagos eloszlás a következő:
[tizenöt]