F-divergencia

Az f -divergencia ( f -divergencia ) a funkcionálisok egy osztálya,amely általában meghatározza az eltérés aszimmetrikus mértékét két valószínűségi eloszlás és. Általánosan alkalmazott információelméletben és valószínűségszámításban . A függvényt egybizonyos feltételeket kielégítő függvény egyedileg határozza meg (generálja).

Az eltérések ezen osztályát Csiszár (1963 ), Morimoto (1963 ) és Ali és Silvey (1966 ) önállóan vezették be és tanulmányozták. Ezért néha megtalálhatók az f -Chisara divergence , Chisara-Morimoto divergence vagy Ali-Silvi távolság nevek.

Definíció

Legyenek és olyan valószínűségi eloszlások, amelyek a halmazra vonatkoztatva abszolút folytonosak . Legyen a függvény konvex és esetén . Ezután a függvény a következő módon határozza meg az f -divergenciát :

Ha bármely mérték -on , és mindkét eloszlás és folytonos a -hoz képest , azaz, vannak és függvények , akkor az f -divergencia így írható fel

A Lebesgue-mérték esetén az eloszlások sűrűsége és , ekkor az f -divergencia alakot ölt

Diszkrét eloszlásokhoz és ahol ,

Meg kell jegyezni, hogy a függvény a kifejezésig van definiálva , ahol egy tetszőleges állandó. Valójában az f -divergencia formája nem függ a választásától , mivel a függvény tagja nulla hozzájárulást ad az integrál értékéhez. Ezenkívül a függvény tartalmazhat egy pozitív szorzóállandót , amely megadja a divergencia mértékegységét. Ezzel kapcsolatban néhány szerző (például Basseville (2010 )) további korlátozásokat jelez a funkcióval kapcsolatban :

A megszorítások közül az első az állandót , a második pedig az állandót rögzíti . A feltétel hasznos lehet abban az esetben , ha egy ponton minimum van (lásd Liese & Vajda (2006 )), az f -divergencia kifejezése intuitív módon könnyebben érthető. A függvény konkretizálásának ez a módja azonban nem mindig kényelmes: például az f -entrópia egy adott f -divergenciához társított folytonos változatának létezéséhez a konstans eltérő értékére lehet szükség .

Az f -divergencia egy Taylor -sorozatban bővíthető és χ - típusú távolságok súlyozott összegeként írható fel (lásd Nielsen & Nock (2013 )).

Az f -divergencia speciális esetei

Sok jól ismert divergencia, mint például a Kullback-Leibler-divergencia , a Hellinger-távolság négyzete , a chi-négyzet távolság és számos más, az f -divergencia speciális esetei , amelyek egy bizonyos függvényválasztásnak felelnek meg . Az alábbi táblázat a valószínűségi eloszlások és a hozzájuk tartozó függvények közötti eltérések néhány gyakori típusát sorolja fel (lásd Liese & Vajda (2006 )).

Eltérés Generatív funkció
Kullback-Leibler eltérés
Fordított Kullback-Leibler eltérés
Hellinger távolság négyzetben
Teljes variációs távolság
Pearson távolság
Neumann távolság
Alfa eltérés
Alfa divergencia (más jelölés)

Tulajdonságok

Az utolsó tulajdonságot figyelembe véve az f -divergencia osztálya ekvivalens módon definiálható . Hasonló meghatározást találunk például Zhangnál (2004 ). Így az eloszlás igaznak való értelmezése, ami az f -divergencia definíciójából következik, nem alapvető tulajdonsága, hanem csak a definícióban szereplő érvek sorrendjében való megegyezés következménye. Más szóval, az érvek és fogalmilag azonosak.

Azt is érdemes megjegyezni, hogy az f -divergencia egy dimenzió nélküli mennyiség , függetlenül a halmaz dimenziójától .

Kapcsolódó fogalmak

Az f -divergencia mellett I. Chisar meghatározta az f -entrópia kapcsolódó fogalmát ( Csiszár (1972 )).

Linkek