Az átlagos eltolás egy nem paraméteres jellemzőtér - elemzési technika a maximális valószínűségi sűrűség meghatározására, az úgynevezett módkeresési algoritmus [1] . A technika hatóköre a klaszteranalízis a számítógépes látásban és képfeldolgozásban [2] .
Az átlagos eltolási eljárást 1975-ben vezette be Fukunaga és Hostetler [3] .
Az átlagos eltolás egy eljárás, amely egy diszkrét minta által adott valószínűségi sűrűség maximumát ( módusait ) határozza meg ezen a függvényen [1] . A módszer iteratív, és a kezdeti becsléssel kezdjük . Legyen adott a kernel függvény . Ez a függvény meghatározza a legközelebbi pontok súlyát az átlag újrabecsléséhez. Általában a Gauss-kernelt a távolságtól az aktuális becslésig használják . A függvény által meghatározott ablakban a sűrűség súlyozott átlaga a
ahol a pont szomszédsága , azaz olyan ponthalmaz, amelyre .
Fukunaga és Hostetler papírjának különbségét átlagos eltolódásnak nevezzük [3] .
Az átlagos eltolási algoritmus most hozzárendeli és addig iterálja a becslést, amíg az konvergál.
Bár az átlagos eltolási algoritmust széles körben használják számos alkalmazásban, nincs szigorú bizonyíték egy általános kernelt használó algoritmus konvergenciájára nagy dimenziós terekben [4] . Aliyari Gassabeh differenciálható, konvex és szigorúan csökkenő profilfüggvénnyel mutatta meg az átlageltolási algoritmus konvergenciáját egydimenziós térben [5] . Az egyik dimenzió esete azonban csak korlátozottan használható valós problémák esetén. Az algoritmus konvergenciáját véges számú (vagy izolált) stacionárius pontú, nagydimenziós esetekre igazoltuk [4] [6] . Azonban nem adottak elegendő feltételeket ahhoz, hogy a kernelfüggvénynek véges számú (vagy izolált) stacionárius pontja legyen.
Legyen az adat egy véges ponthalmaz egy n-dimenziós X euklideszi térben. Legyen K egy lapos kernel, amely a karakterisztikus függvény a -ballon X-ben,
Az algoritmus minden iterációja során az összesre egyszerre kerül végrehajtásra . Az első kérdés tehát az, hogy egy adott térbeli ponthalmazból hogyan becsüljük meg a valószínűségi sűrűséget. A legegyszerűbb megközelítés az adatok egyszerű lapítása, azaz konvolválás egy fix szélességű kernellel ,
,
hol vannak a bemeneti pontok és a kernel függvény (vagy Parzen ablak ). A h paraméter az egyetlen paraméter az algoritmusban, és sávszélességnek hívják. Ez a megközelítés Kernel sűrűségbecslési technikának vagy Parzen Window néven ismert. Ha a fenti egyenletből kiszámoltuk, gradiens süllyedés vagy más optimalizálási technikák segítségével megtalálhatjuk a függvény lokális maximumát. A probléma ezzel a brute-force megközelítéssel az, hogy nagy dimenziók esetén számításilag lehetetlenné válik a teljes térre kiterjedő számítás. Ehelyett az átlagos eltolási algoritmus egy olyan változatot használ, amely az optimalizálási szakirodalomban több újraindítású gradiens süllyedés néven ismert . A lokális maximum helyére vonatkozó feltételezésből kiindulva , amely lehet egy véletlen bemeneti adatpont is , az átlageltolás kiszámítja a sűrűséggradiens becslését a pontban , és abba az irányba lép (növekszik) [7] .
Kerneldefiníció: Legyen X egy n-dimenziós euklideszi tér . Jelölje x i-edik komponensét . Az x vektor normája egy nem negatív szám . A K: függvényt kernelnek mondjuk, ha létezik olyan profil , amelyre
és
Két általánosan használt kernelprofil az átlagos eltolódáshoz:
lapos magGauss kernel
ahol a szórás paraméter szolgál sávszélesség paraméterként .
Tekintsünk egy ponthalmazt a kétdimenziós térben. Tekintsünk egy kör alakú ablakot, amelynek középpontja C, r sugarú kernel. Az átlagos eltolási módszer egy szélsőséges keresési algoritmus, amely iteratív módon tolja el ezt a kernelt egy nagyobb sűrűségű régióba, amíg a folyamat konvergál. Bármely eltolódást az átlag eltolási vektora határoz meg. Az átlagos eltolási vektor mindig a maximális sűrűségnövekedés irányába mutat. Minden iterációnál a kernel a súlypont vagy a benne lévő pontok átlagértéke felé tolódik el. Ennek az átlagnak a kiszámításának módja a kernel megválasztásától függ. Ha egy Gauss-kernelt választunk ki a lapos kernel helyett, akkor minden ponthoz hozzárendel egy súlyt, amely exponenciálisan csökken a kernel középpontjától való távolság növekedésével. Amikor a folyamat konvergál, nem lesz olyan irány, amelyben az eltolódás több pontot tudna befogadni a mag belsejében.
Az átlagos eltolás algoritmus használható vizuális követésre. Az ilyen típusú legegyszerűbb algoritmus konzisztenciatérképet hozna létre egy új képen az objektum előző képen szereplő színhisztogramja alapján, és egy átlagos eltolást használna a konzisztenciatérkép csúcsának megtalálásához az objektum régi pozíciójához közel. A konzisztenciatérkép egy valószínűségi sűrűség az új képen, amely az új kép minden pontjához olyan valószínűséget rendel, amely megegyezik az előző kép tárgypontjának színvalószínűségével. Számos algoritmus, mint például a kernel alapú követés [8] , az ensemble tracking [9] , a CAMshift [10] [11] kiterjeszti ezt az elképzelést.
Legyen a d-dimenziós bemenet és a szűrt képpixelek a térbeli tartományokban. Minden pixelhez
Az algoritmus változatai megtalálhatók a gépi tanulási és képfeldolgozó csomagokban:
Gépi tanulás és adatbányászat | |
---|---|
Feladatok | |
Tanulás tanárral | |
klaszteranalízis | |
Dimenziócsökkentés | |
Strukturális előrejelzés | |
Anomália észlelése | |
Grafikon valószínűségi modellek | |
Neurális hálózatok | |
Megerősítő tanulás |
|
Elmélet | |
Folyóiratok és konferenciák |
|