Bayes-hálózat (vagy Bayes-hálózat , Bayesi hithálózat , angol Bayes-hálózat, hithálózat ) - valószínűségi modell gráfja , amely változók halmaza és azok valószínűségi függőségei Bayes szerint . Például egy Bayes-hálózat segítségével a tünetek és a betegségek közötti kapcsolatra vonatkozó adatok alapján kiszámítható annak valószínűsége, hogy egy betegnek betegsége van, a tünetegyüttes megléte vagy hiánya alapján. A Bayes-hálózatok matematikai apparátusát Judah Pearl amerikai tudós , a Turing-díjas (2011) alkotta meg .
Formálisan a Bayes-hálózat egy irányított aciklikus gráf , amelynek minden csúcsa egy valószínűségi változónak felel meg, és a gráf ívei feltételes függetlenségi viszonyokat kódolnak ezen változók között. A csúcsok bármilyen típusú változót képviselhetnek, lehetnek súlyozott paraméterek, látens változók vagy hipotézisek. Vannak hatékony módszerek, amelyeket a Bayes-hálózatok kiszámítására és betanítására használnak. Ha a Bayes-féle hálózati változók diszkrét valószínűségi változók, akkor egy ilyen hálózatot diszkrét Bayes-hálózatnak nevezünk. A változók sorozatát modellező Bayes- hálózatokat dinamikus Bayes-hálózatoknak nevezzük . Azokat a Bayes-hálózatokat, amelyek diszkrét és folytonos változókkal is rendelkezhetnek, hibrid Bayes-hálózatoknak nevezzük . Egy Bayes-hálózatot, amelyben az ívek a feltételes függetlenségi viszonyok mellett oksági összefüggéseket is kódolnak , kauzális bayesi hálózatoknak nevezzük [ 1] ) .
Ha egy ív egy csúcsból egy csúcsba megy , akkor azt szülőnek , és gyermeknek nevezzük . Ha van egy irányított út a csúcstól a csúcsig , akkor azt ősnek , és leszármazottnak nevezzük .
Egy csúcs vertex-szülőinek halmazát a következőképpen jelöljük .
Az irányított aciklikus gráfot Bayes-hálózatnak nevezzük a valószínűségi változók halmazán definiált valószínűségi eloszlás esetén , ha a gráf minden csúcsa egy -ből származó valószínűségi változóhoz van társítva , és a gráf ívei teljesítik a feltételt (Markov-feltétel [1] ): bármely változónak feltételesen függetlennek kell lennie minden olyan csúcstól, amely nem leszármazottja, ha minden közvetlen szülője adott a gráfban , azaz.
becsületes:
hol az érték ; - konfiguráció[ meghatározza ] ; az összes olyan csúcs halmaza, amelyek nem leszármazottai a ; - konfiguráció .
Ezután az értékek teljes közös eloszlása a csúcsokban kényelmesen felírható a helyi eloszlások dekompozíciójaként (szorzataként):
Ha egy csúcsnak nincsenek elődei, akkor a helyi valószínűségi eloszlását unconditional , egyébként feltételesnek nevezzük . Ha egy csúcs - egy valószínűségi változó értéket kapott (például megfigyelés eredményeként), akkor ezt az értéket bizonyítéknak nevezik . Ha a változó értékét kívülről állítottuk be (és nem figyeltük meg), akkor az ilyen értéket intervenciónak ( angol beavatkozás ) vagy intervenciónak ( angol intervenció ) nevezzük [1] .
A Bayes-hálózatban a feltételes függetlenséget a d-szétválasztás grafikus tulajdonsága képviseli.
Egy útvonalat akkor és csak akkor nevezünk d - vel elválasztott vagy blokkolt csúcskészletnek
Legyenek csúcsok nem metsző részhalmazai egy aciklikus irányított gráfban . A csúcsok halmazát akkor és csak akkor mondjuk d-elválasztónak , ha blokkolja az összes útvonalat bármely olyan csúcsból, amely a -hoz tartozó bármely csúcshoz tartozik , és amelyet jelöl . Az útvonal a gráf [1] egymást követő (bármilyen irányú) éleinek sorozata .
Egy aciklikus irányított gráf csúcsainak bármely három nem átfedő részhalmazára és minden valószínűségi eloszlásra a következő igaz:
Más szóval, ha a csúcsok d-vel vannak elválasztva, akkor feltételesen függetlenek; és ha a csúcsok feltételesen függetlenek a gráfgal kompatibilis minden valószínűségi eloszlásban , akkor d-vel elválasztva vannak [1] .
( azt jelenti, hogy a és a változók halmazai feltételesen függetlenek egy adott halmazhoz .)
Bizonyíték - „esemény történt az x csomóponton” formájú kijelentések. Például: "a számítógép nem indul el" .
A Bayes-hálózat lehetővé teszi, hogy a következő típusú valószínűségi lekérdezésekre kapjon választ [2] :
Tegyük fel, hogy két oka lehet annak, hogy a fű nedvessé válhat (GRASS WET): működött a locsológép, vagy esett az eső. Tételezzük fel azt is, hogy az eső befolyásolja a sprinkler működését (esőben a készülék nem kapcsol be). Ekkor a helyzet az illusztrált Bayes-hálózattal modellezhető. A három változó mindegyike két lehetséges érték közül csak egyet vehet fel: T (igaz - igaz) és F (hamis - hamis), az ábra táblázataiban feltüntetett valószínűségekkel.
Együttes valószínűségi függvény:
ahol a három változónév jelentése: G = nedves fű , S = locsoló és R = eső .
A modell válaszolni tud olyan kérdésekre, mint például: "Mekkora a valószínűsége annak, hogy esett az eső, ha a fű nedves?" a feltételes valószínűségi képlet felhasználásával és a változók összegzésével:
Mivel a Bayes-hálózat a változók és kapcsolataik teljes modellje, alkalmas a valószínűségi kérdések megválaszolására. Például a hálózat felhasználható arra, hogy új ismereteket szerezzen a változók egy részhalmazának állapotáról más változók ( bizonyíték változók ) megfigyelésével. Ezt a folyamatot, amely során kiszámítják a változók utólagos eloszlását a bizonyítékok változói között , valószínűségi következtetésnek nevezik. Ez a következmény univerzális becslést ad az olyan alkalmazásokhoz, ahol meg kell választanunk a változók olyan részhalmazának értékeit, amelyek minimalizálják a veszteségfüggvényt, például a hibás döntés valószínűségét. A Bayes-hálózatot úgy is felfoghatjuk, mint egy olyan mechanizmust, amely automatikusan felépíti a Bayes-tétel kiterjesztését bonyolultabb problémákra.
Bayes-hálózatokban való valószínűségi következtetések levonásához a következő algoritmusokat használják [1] [3] :
A Bayes-hálózatokat modellezésre használják a bioinformatikában ( genetikai hálózatok , fehérjeszerkezet ), az orvostudományban , a dokumentumosztályozásban , a képfeldolgozásban , az adatfeldolgozásban , a gépi tanulásban és a döntéstámogató rendszerekben .
Szótárak és enciklopédiák |
---|
Grafikon valószínűségi modellek | |
---|---|
|
Gépi tanulás és adatbányászat | |
---|---|
Feladatok | |
Tanulás tanárral | |
klaszteranalízis | |
Dimenziócsökkentés | |
Strukturális előrejelzés | |
Anomália észlelése | |
Grafikon valószínűségi modellek | |
Neurális hálózatok | |
Megerősítő tanulás |
|
Elmélet | |
Folyóiratok és konferenciák |
|