Az f -divergencia ( f -divergencia ) a funkcionálisok egy osztálya,amely általában meghatározza az eltérés aszimmetrikus mértékét két valószínűségi eloszlás és. Általánosan alkalmazott információelméletben és valószínűségszámításban . A függvényt egybizonyos feltételeket kielégítő függvény egyedileg határozza meg (generálja).
Az eltérések ezen osztályát Csiszár (1963 ), Morimoto (1963 ) és Ali és Silvey (1966 ) önállóan vezették be és tanulmányozták. Ezért néha megtalálhatók az f -Chisara divergence , Chisara-Morimoto divergence vagy Ali-Silvi távolság nevek.
Legyenek és olyan valószínűségi eloszlások, amelyek a halmazra vonatkoztatva abszolút folytonosak . Legyen a függvény konvex és esetén . Ezután a függvény a következő módon határozza meg az f -divergenciát :
Ha bármely mérték -on , és mindkét eloszlás és folytonos a -hoz képest , azaz, vannak és függvények , akkor az f -divergencia így írható fel
A Lebesgue-mérték esetén az eloszlások sűrűsége és , ekkor az f -divergencia alakot ölt
Diszkrét eloszlásokhoz és ahol ,
Meg kell jegyezni, hogy a függvény a kifejezésig van definiálva , ahol egy tetszőleges állandó. Valójában az f -divergencia formája nem függ a választásától , mivel a függvény tagja nulla hozzájárulást ad az integrál értékéhez. Ezenkívül a függvény tartalmazhat egy pozitív szorzóállandót , amely megadja a divergencia mértékegységét. Ezzel kapcsolatban néhány szerző (például Basseville (2010 )) további korlátozásokat jelez a funkcióval kapcsolatban :
A megszorítások közül az első az állandót , a második pedig az állandót rögzíti . A feltétel hasznos lehet abban az esetben , ha egy ponton minimum van (lásd Liese & Vajda (2006 )), az f -divergencia kifejezése intuitív módon könnyebben érthető. A függvény konkretizálásának ez a módja azonban nem mindig kényelmes: például az f -entrópia egy adott f -divergenciához társított folytonos változatának létezéséhez a konstans eltérő értékére lehet szükség .
Az f -divergencia egy Taylor -sorozatban bővíthető és χ - típusú távolságok súlyozott összegeként írható fel (lásd Nielsen & Nock (2013 )).
Sok jól ismert divergencia, mint például a Kullback-Leibler-divergencia , a Hellinger-távolság négyzete , a chi-négyzet távolság és számos más, az f -divergencia speciális esetei , amelyek egy bizonyos függvényválasztásnak felelnek meg . Az alábbi táblázat a valószínűségi eloszlások és a hozzájuk tartozó függvények közötti eltérések néhány gyakori típusát sorolja fel (lásd Liese & Vajda (2006 )).
Eltérés | Generatív funkció |
---|---|
Kullback-Leibler eltérés | |
Fordított Kullback-Leibler eltérés | |
Hellinger távolság négyzetben | |
Teljes variációs távolság | |
Pearson távolság | |
Neumann távolság | |
Alfa eltérés | |
Alfa divergencia (más jelölés) |
Az utolsó tulajdonságot figyelembe véve az f -divergencia osztálya ekvivalens módon definiálható . Hasonló meghatározást találunk például Zhangnál (2004 ). Így az eloszlás igaznak való értelmezése, ami az f -divergencia definíciójából következik, nem alapvető tulajdonsága, hanem csak a definícióban szereplő érvek sorrendjében való megegyezés következménye. Más szóval, az érvek és fogalmilag azonosak.
Azt is érdemes megjegyezni, hogy az f -divergencia egy dimenzió nélküli mennyiség , függetlenül a halmaz dimenziójától .
Az f -divergencia mellett I. Chisar meghatározta az f -entrópia kapcsolódó fogalmát ( Csiszár (1972 )).