Dempster-Schafer elmélet

A Dempster-Schafer-elmélet  a bizonyítékok matematikai elmélete ([SH76]), amely hiedelmi függvényeken és elfogadható érvelésen alapul , és amelyet arra használnak, hogy különálló információkat (bizonyítékokat) kombináljanak egy esemény valószínűségének kiszámításához. Az elméletet Arthur P. Dempster és Glenn Schafer dolgozta ki .

Vegyünk két lehetséges játékost

Az első játék egy érmefeldobás, ahol arra tétet kötnek, hogy fej vagy farok fog-e feljönni. Most képzelj el egy második játékot, amelyben a világ legjobb ökölvívója és a világ legjobb bunyósa közötti küzdelem kimenetelére tesznek fogadásokat. Tegyük fel, hogy nem ismerjük a harcművészeteket, és nagyon nehéz eldöntenünk, hogy kire fogadjunk.

Sokan kevésbé lesznek magabiztosak a második játszma helyzetében, amelyben a valószínűségek ismeretlenek, mint az elsőben, ahol könnyen belátható, hogy az egyes kimenetelek valószínűsége fele. A második játszma esetében a Bayes-elmélet minden kimenetelhez a valószínűség felét rendeli, függetlenül attól, hogy az egyik eredmény valószínűbb, mint a másik. A Dempster-Schafer elmélet lehetővé teszi, hogy meghatározza a játékos magabiztossági fokát a különböző kimenetelekhez rendelt valószínűségek tekintetében.

Formalizálás

Legyen  az univerzális halmaz , az összes figyelembe vett állítás halmaza. Az exponenciális halmaz a halmaz összes részhalmazának gyűjteménye , beleértve az üres halmazt is . Például, ha:

akkor

Definíció szerint az üres halmaz tömege nulla:

Az exponenciális halmaz többi elemének tömegét egységösszegre normalizáljuk:

Az exponenciális halmaz egy elemének tömege az összes releváns és rendelkezésre álló bizonyíték arányát fejezi ki, amely alátámasztja azt az állítást, hogy egy adott elem tartozik , de nem tartozik egyik részhalmazához sem . A mennyiség csak a halmazra vonatkozik , és nem hoz létre további állításokat a többi részhalmazról , amelyek definíció szerint mindegyiknek megvan a maga tömege.

A hozzárendelt tömegek alapján meg lehet határozni a lehetőségek tartományának felső és alsó határát. Ez az intervallum tartalmazza a szóban forgó részhalmaz valószínűségének pontos értékét (a klasszikus értelemben), és két, nem összeadódó folytonos mértékkel, az úgynevezett hittel ( vagy támogatással ) és a plauzibilitással ( hihetőség ) korlátozza :

A halmaz konfidencia meghatározása a vizsgált halmaz megfelelő részhalmazainak összes tömegének összege:

A valószínűség  az összes olyan halmaz tömegeinek összege, amelyek metszik a vizsgált halmazt :

Ez a két intézkedés a következőképpen kapcsolódik egymáshoz:

A fentiekből következik, hogy a fennmaradó kettő kiszámításához elegendő legalább egy mérőszám (tömeg, konfidencia vagy valószínűség) ismerete.

Tekintsük a hozzárendelt tömegek két független halmazának kombinálásának problémáját. Az eredeti összekapcsolási szabály, amely Dempster kombinációs szabályaként ismert, Bayes szabályának általánosítása. Ez a szabály a több forrás közötti megegyezést hangsúlyozza, és a normalizálás révén figyelmen kívül hagy minden ellentmondó bizonyítékot. E szabály alkalmazásának jogszerűsége komolyan megkérdőjelezhető az információforrások közötti jelentős ellentmondások esetén.

Valójában az egyesülést (amelyet hozzáadott tömegnek neveznek ) két tömegkészletből számítják ki a következőképpen:

ahol:

a két tömegcsoport közötti konfliktus mértéke. A normalizáló tényező, , az inkonzisztenciák teljes figyelmen kívül hagyásának és egy üres halmaz hozzárendelésének felel meg bármely konfliktusnak megfelelő tömeghez. Ezért ez a művelet bizonyos körülmények között jelentős konfliktus esetén ellentmondó eredményekhez vezet.

Vita

Hitelesség és hitelesség

Shafer megközelítése lehetővé teszi, hogy a bizalmat és a valószínűséget úgy értelmezzük, mint a hipotézis igazságának lehetséges értékének intervallumának határait:

bizalom ≤ az igazság bizonyos mértéke ≤ elfogadhatóság .

Feltételezhető, hogy:

A hipotézisbe vetett bizalom = {a hipotézist egyértelműen alátámasztó bizonyítékok tömegének összege}. Valószínűség = 1 − {a hipotézisnek ellentmondó bizonyítékok tömegének összege}.

Tegyük fel például, hogy a „macska a dobozban halott” hipotézisünk van. Ha nála a bizalom 0,5, a valószínűség pedig 0,8, akkor ez azt jelenti, hogy bizonyítékaink vannak (0,5 összsúllyal), amelyek egyértelműen azt jelzik, hogy a macska meghalt; de vannak olyan bizonyítékok is (0,2 össztömeggel), amelyek egyértelműen azt jelzik, hogy a macska életben van (valószínűsége, hogy „a macska meghalt” = 1 - 0,2 = 0,8). A fennmaradó tömeg (kiegészítve a 0,5-öt és a 0,2-től 1,0-ig), amely egyben a 0,8-as valószínűség és a 0,5-ös konfidencia közötti különbség is, megfelel a "bizonytalanságnak" ("univerzális" hipotézis), annak a bizonyítéknak a meglétének, hogy biztosan létezik egy macska a dobozban, de nem mond semmit arról, hogy él-e vagy halott.

Összességében a [0,5; 0,8] jellemzi a kiinduló hipotézis igazságának bizonytalanságát a rendelkezésre álló bizonyítékok alapján.

Hipotézis Súly Bizalom Elfogadhatóság
Nulla (nincs macska) 0 0 0
Élő 0.2 0.2 0.5
Halott 0.5 0.5 0.8
Univerzális (élő vagy halott) 0.3 1.0 1.0

A „null” hipotézis súlya definíció szerint 0 (a „nincs döntés” eseteinek vagy a bizonyítékok közötti feloldhatatlan ellentmondásnak felel meg). Ez oda vezet, hogy a „null” hipotézis megbízhatósága 0, az „univerzális” hipotézis valószínűsége pedig 1. Mivel az „univerzális” hipotézis tömegét az „élő” és a „ halott” hipotéziseket, akkor a konfidencia automatikusan egyenlő 1-gyel, a nullhipotézis valószínűsége pedig 0.

Vegyünk egy kicsit összetettebb példát, amely bemutatja a bizalom és a hihetőség jellemzőit. Tegyük fel, hogy egy érzékelőkészletet használunk egyetlen távoli tüzet regisztrálására, amely lehet három szín egyike (piros, sárga vagy zöld):

Hipotézis Súly Bizalom Elfogadhatóság
Nulla 0 0 0
Piros 0,35 0,35 0,56
Sárga 0,25 0,25 0,45
Zöld 0,15 0,15 0,34
Piros vagy Sárga 0,06 0,66 0,85
Piros vagy zöld 0,05 0,55 0,75
Sárga vagy zöld 0,04 0,44 0,65
Egyetemes 0.10 1.00 1.00

ahol például:

Magabiztosság (piros vagy sárga) = tömeg (null hipotézis) + tömeg (piros) + tömeg (sárga) + tömeg (piros vagy sárga) = 0 + 0,35 + 0,25 + 0,06 = 0,66 Valószínűség (piros vagy sárga) = 1 − Bizalom (piros vagy sárga tagadás) = 1 − Magabiztosság (zöld) = 1 − Tömeg (Null hipotézis) − Tömeg (zöld) = 1 − 0 − 0,15 = 0,85

Ennek a halmaznak az eseményeit nem szabad a valószínűségi tér eseményeinek metszetének tekinteni, mivel a tömegtérben adottak. Helyesebb a "Piros vagy Sárga" eseményt a "Piros" és a "Sárga" események egyesülésének tekinteni, és (lásd a valószínűségszámítás axiómáit) P(piros vagy sárga) ≥ P(sárga), és P (Univerzális) = 1, ahol az "Univerzális" hipotézis a "piros", "sárga" vagy "zöld" színnek felel meg. A TDS-ben az "univerzális" hipotézis tömege egy olyan bizonyítéknak felel meg, amely semmilyen más hipotézisnek nem tulajdonítható; vagyis olyan bizonyíték, amely azt állítja, hogy volt valamilyen jel, de egyáltalán nem beszél a színéről.

Ebben a példában a „Piros vagy Zöld” bizonyíték tömege 0,05. Ilyen bizonyítékokat lehet szerezni például vörös/zöld vakságban szenvedőktől. A TDS lehetővé teszi, hogy ezeket a bizonyítékokat kiegyensúlyozottan mérlegeljük.

Irodalom

Lásd még