Bayesi hálózat

Az oldal jelenlegi verzióját még nem ellenőrizték tapasztalt közreműködők, és jelentősen eltérhet a 2021. december 29-én felülvizsgált verziótól ; az ellenőrzések 4 szerkesztést igényelnek .

Bayes-hálózat (vagy Bayes-hálózat , Bayesi hithálózat , angol  Bayes-hálózat, hithálózat ) - valószínűségi modell gráfja , amely változók halmaza és azok valószínűségi függőségei Bayes szerint . Például egy Bayes-hálózat segítségével a tünetek és a betegségek közötti kapcsolatra vonatkozó adatok alapján kiszámítható annak valószínűsége, hogy egy betegnek betegsége van, a tünetegyüttes megléte vagy hiánya alapján. A Bayes-hálózatok matematikai apparátusát Judah Pearl amerikai tudós , a Turing-díjas (2011) alkotta meg .

Formálisan a Bayes-hálózat egy irányított aciklikus gráf , amelynek minden csúcsa egy valószínűségi változónak felel meg, és a gráf ívei feltételes függetlenségi viszonyokat kódolnak ezen változók között. A csúcsok bármilyen típusú változót képviselhetnek, lehetnek súlyozott paraméterek, látens változók vagy hipotézisek. Vannak hatékony módszerek, amelyeket a Bayes-hálózatok kiszámítására és betanítására használnak. Ha a Bayes-féle hálózati változók diszkrét valószínűségi változók, akkor egy ilyen hálózatot diszkrét Bayes-hálózatnak nevezünk. A változók sorozatát modellező Bayes- hálózatokat dinamikus Bayes-hálózatoknak nevezzük . Azokat a Bayes-hálózatokat, amelyek diszkrét és folytonos változókkal is rendelkezhetnek, hibrid Bayes-hálózatoknak nevezzük . Egy Bayes-hálózatot, amelyben az ívek a feltételes függetlenségi viszonyok mellett oksági összefüggéseket is kódolnak , kauzális bayesi hálózatoknak nevezzük [ 1] ) . 

Definíciók és működési elvek

Ha egy ív egy csúcsból egy csúcsba megy , akkor azt szülőnek , és gyermeknek nevezzük . Ha van egy irányított út a csúcstól a csúcsig , akkor azt ősnek , és leszármazottnak nevezzük .

Egy csúcs vertex-szülőinek halmazát a következőképpen jelöljük .

Az irányított aciklikus gráfot Bayes-hálózatnak nevezzük a valószínűségi változók halmazán definiált valószínűségi eloszlás esetén , ha a gráf minden csúcsa egy -ből származó valószínűségi változóhoz van társítva , és a gráf ívei teljesítik a feltételt (Markov-feltétel [1] ): bármely változónak feltételesen függetlennek kell lennie minden olyan csúcstól, amely nem leszármazottja, ha minden közvetlen szülője adott a gráfban , azaz.

becsületes:

hol  az érték ;  - konfiguráció[ meghatározza ] ;  az összes olyan csúcs halmaza, amelyek nem leszármazottai a ;  - konfiguráció .

Ezután az értékek teljes közös eloszlása ​​a csúcsokban kényelmesen felírható a helyi eloszlások dekompozíciójaként (szorzataként):

Ha egy csúcsnak nincsenek elődei, akkor a helyi valószínűségi eloszlását unconditional , egyébként feltételesnek nevezzük . Ha egy csúcs - egy valószínűségi változó értéket kapott (például megfigyelés eredményeként), akkor ezt az értéket bizonyítéknak nevezik . Ha a változó értékét kívülről állítottuk be (és nem figyeltük meg), akkor az ilyen értéket intervenciónak ( angol beavatkozás ) vagy intervenciónak ( angol intervenció ) nevezzük [1] .    

A Bayes-hálózatban a feltételes függetlenséget a d-szétválasztás grafikus tulajdonsága képviseli.

d-elválasztás

Egy útvonalat akkor és csak akkor nevezünk d - vel elválasztott vagy blokkolt csúcskészletnek  

  1. olyan láncot vagy ágat tartalmaz , amely a , vagy
  2. fordított villát (ütközőt) tartalmaz , így nem tartozik hozzá , és a csúcsnak nincsenek gyermekei, amelyek a -hoz tartoznak .

Legyenek  csúcsok nem metsző részhalmazai egy aciklikus irányított gráfban . A csúcsok halmazát akkor és csak akkor mondjuk d-elválasztónak , ha blokkolja az összes útvonalat bármely olyan csúcsból, amely a -hoz tartozó bármely csúcshoz tartozik , és amelyet jelöl . Az útvonal a gráf [1] egymást követő (bármilyen irányú) éleinek sorozata .

A d-elválasztási tétel

Egy aciklikus irányított gráf csúcsainak bármely három nem átfedő részhalmazára és minden valószínűségi eloszlásra a következő igaz:

  1. ha , akkor , ha és Markov-kompatibilisek, és
  2. ha a feltételes függetlenség relációja minden olyan valószínűség-eloszlásra érvényes, amely Markov-kompatibilis -vel , akkor ez azt jelenti, hogy .

Más szóval, ha a csúcsok d-vel vannak elválasztva, akkor feltételesen függetlenek; és ha a csúcsok feltételesen függetlenek a gráfgal kompatibilis minden valószínűségi eloszlásban , akkor d-vel elválasztva vannak [1] .

( azt jelenti, hogy a és a változók halmazai feltételesen függetlenek egy adott halmazhoz .)

Bizonyíték

Bizonyíték  - „esemény történt az x csomóponton” formájú kijelentések. Például: "a számítógép nem indul el" .

Valószínűségi lekérdezések

A Bayes-hálózat lehetővé teszi, hogy a következő típusú valószínűségi lekérdezésekre kapjon választ [2] :

előrejelzés , vagy közvetlen következtetés , - egy esemény valószínűségének meghatározása megfigyelhető okokból, diagnosztizálás , vagy fordított következtetés ( abdukció ), - megfigyelt következményekkel járó ok valószínűségének meghatározása, intercausal (vegyes) következtetés ( angolul  intercausal inference ) vagy transzdukció , - egy esemény egyik okának valószínűségének meghatározása, feltéve, hogy ennek az eseménynek egy vagy több egyéb oka is előfordul.

Példa

Tegyük fel, hogy két oka lehet annak, hogy a fű nedvessé válhat (GRASS WET): működött a locsológép, vagy esett az eső. Tételezzük fel azt is, hogy az eső befolyásolja a sprinkler működését (esőben a készülék nem kapcsol be). Ekkor a helyzet az illusztrált Bayes-hálózattal modellezhető. A három változó mindegyike két lehetséges érték közül csak egyet vehet fel: T (igaz - igaz) és F (hamis - hamis), az ábra táblázataiban feltüntetett valószínűségekkel.

Együttes valószínűségi függvény:

ahol a három változónév jelentése: G = nedves fű , S = locsoló és R = eső .

A modell válaszolni tud olyan kérdésekre, mint például: "Mekkora a valószínűsége annak, hogy esett az eső, ha a fű nedves?" a feltételes valószínűségi képlet felhasználásával és a változók összegzésével:

Valószínűségi következtetés

Mivel a Bayes-hálózat a változók és kapcsolataik teljes modellje, alkalmas a valószínűségi kérdések megválaszolására. Például a hálózat felhasználható arra, hogy új ismereteket szerezzen a változók egy részhalmazának állapotáról más változók ( bizonyíték változók ) megfigyelésével. Ezt a folyamatot, amely során kiszámítják a változók utólagos eloszlását a bizonyítékok változói között , valószínűségi következtetésnek nevezik. Ez a következmény univerzális becslést ad az olyan alkalmazásokhoz, ahol meg kell választanunk a változók olyan részhalmazának értékeit, amelyek minimalizálják a veszteségfüggvényt, például a hibás döntés valószínűségét. A Bayes-hálózatot úgy is felfoghatjuk, mint egy olyan mechanizmust, amely automatikusan felépíti a Bayes-tétel kiterjesztését bonyolultabb problémákra.

Bayes-hálózatokban való valószínűségi következtetések levonásához a következő algoritmusokat használják [1] [3] :

Alkalmazások

A Bayes-hálózatokat modellezésre használják a bioinformatikában ( genetikai hálózatok , fehérjeszerkezet ), az orvostudományban , a dokumentumosztályozásban , a képfeldolgozásban , az adatfeldolgozásban , a gépi tanulásban és a döntéstámogató rendszerekben .

További információk

Ingyenes és nyílt forráskódú szoftver

Kereskedelmi szoftvertermékek

Lásd még

Jegyzetek

  1. 1 2 3 4 5 6 Judea Pearl. Ok-okozati összefüggés: modellek, érvelés és következtetés. - 2. kiadás. - Cambridge University Press, 2009. - 464 p. — ISBN 9780521895606 .
  2. Adnan Darwiche. Modellezés és érvelés Bayes-hálózatokkal. - Cambridge University Press, 2009. - 526 p. — ISBN 978-0521884389 .
  3. Stuart Russell, Peter Norvig. Mesterséges intelligencia: Modern megközelítés (AIMA): [ford. angolról]. - 2. kiadás - M .: Williams, 2005. - 1424 p.

Linkek