Átlagos váltás

Az átlagos eltolás egy nem paraméteres jellemzőtér - elemzési technika a maximális valószínűségi sűrűség meghatározására, az úgynevezett módkeresési algoritmus [1] . A technika hatóköre a klaszteranalízis a számítógépes látásban és képfeldolgozásban [2] .

Történelem

Az átlagos eltolási eljárást 1975-ben vezette be Fukunaga és Hostetler [3] .

Áttekintés

Az átlagos eltolás egy eljárás, amely egy diszkrét minta által adott valószínűségi sűrűség maximumát ( módusait ) határozza meg ezen a függvényen [1] . A módszer iteratív, és a kezdeti becsléssel kezdjük . Legyen adott a kernel függvény . Ez a függvény meghatározza a legközelebbi pontok súlyát az átlag újrabecsléséhez. Általában a Gauss-kernelt a távolságtól az aktuális becslésig használják . A függvény által meghatározott ablakban a sűrűség súlyozott átlaga a

ahol a pont szomszédsága , azaz olyan ponthalmaz, amelyre .

Fukunaga és Hostetler papírjának különbségét átlagos eltolódásnak nevezzük [3] .

Az átlagos eltolási algoritmus most hozzárendeli és addig iterálja a becslést, amíg az konvergál.

Bár az átlagos eltolási algoritmust széles körben használják számos alkalmazásban, nincs szigorú bizonyíték egy általános kernelt használó algoritmus konvergenciájára nagy dimenziós terekben [4] . Aliyari Gassabeh differenciálható, konvex és szigorúan csökkenő profilfüggvénnyel mutatta meg az átlageltolási algoritmus konvergenciáját egydimenziós térben [5] . Az egyik dimenzió esete azonban csak korlátozottan használható valós problémák esetén. Az algoritmus konvergenciáját véges számú (vagy izolált) stacionárius pontú, nagydimenziós esetekre igazoltuk [4] [6] . Azonban nem adottak elegendő feltételeket ahhoz, hogy a kernelfüggvénynek véges számú (vagy izolált) stacionárius pontja legyen.

Részletek

Legyen az adat egy véges ponthalmaz egy n-dimenziós X euklideszi térben. Legyen K egy lapos kernel, amely a karakterisztikus függvény a -ballon X-ben,

Az algoritmus minden iterációja során az összesre egyszerre kerül végrehajtásra . Az első kérdés tehát az, hogy egy adott térbeli ponthalmazból hogyan becsüljük meg a valószínűségi sűrűséget. A legegyszerűbb megközelítés az adatok egyszerű lapítása, azaz konvolválás egy fix szélességű kernellel ,

,

hol vannak a bemeneti pontok és a kernel függvény (vagy Parzen ablak ). A h paraméter az egyetlen paraméter az algoritmusban, és sávszélességnek hívják. Ez a megközelítés Kernel sűrűségbecslési technikának vagy Parzen Window néven ismert. Ha a fenti egyenletből kiszámoltuk, gradiens süllyedés vagy más optimalizálási technikák segítségével megtalálhatjuk a függvény lokális maximumát. A probléma ezzel a brute-force megközelítéssel az, hogy nagy dimenziók esetén számításilag lehetetlenné válik a teljes térre kiterjedő számítás. Ehelyett az átlagos eltolási algoritmus egy olyan változatot használ, amely az optimalizálási szakirodalomban több újraindítású gradiens süllyedés néven ismert . A lokális maximum helyére vonatkozó feltételezésből kiindulva , amely lehet egy véletlen bemeneti adatpont is , az átlageltolás kiszámítja a sűrűséggradiens becslését a pontban , és abba az irányba lép (növekszik) [7] .

Kernelek típusai

Kerneldefiníció: Legyen X egy n-dimenziós euklideszi tér . Jelölje x i-edik komponensét . Az x vektor normája egy nem negatív szám . A K: függvényt kernelnek mondjuk, ha létezik olyan profil , amelyre

és

Két általánosan használt kernelprofil az átlagos eltolódáshoz:

lapos mag

Gauss kernel

ahol a szórás paraméter szolgál sávszélesség paraméterként .

Alkalmazások

Klaszterezés

Tekintsünk egy ponthalmazt a kétdimenziós térben. Tekintsünk egy kör alakú ablakot, amelynek középpontja C, r sugarú kernel. Az átlagos eltolási módszer egy szélsőséges keresési algoritmus, amely iteratív módon tolja el ezt a kernelt egy nagyobb sűrűségű régióba, amíg a folyamat konvergál. Bármely eltolódást az átlag eltolási vektora határoz meg. Az átlagos eltolási vektor mindig a maximális sűrűségnövekedés irányába mutat. Minden iterációnál a kernel a súlypont vagy a benne lévő pontok átlagértéke felé tolódik el. Ennek az átlagnak a kiszámításának módja a kernel megválasztásától függ. Ha egy Gauss-kernelt választunk ki a lapos kernel helyett, akkor minden ponthoz hozzárendel egy súlyt, amely exponenciálisan csökken a kernel középpontjától való távolság növekedésével. Amikor a folyamat konvergál, nem lesz olyan irány, amelyben az eltolódás több pontot tudna befogadni a mag belsejében.

Követés

Az átlagos eltolás algoritmus használható vizuális követésre. Az ilyen típusú legegyszerűbb algoritmus konzisztenciatérképet hozna létre egy új képen az objektum előző képen szereplő színhisztogramja alapján, és egy átlagos eltolást használna a konzisztenciatérkép csúcsának megtalálásához az objektum régi pozíciójához közel. A konzisztenciatérkép egy valószínűségi sűrűség az új képen, amely az új kép minden pontjához olyan valószínűséget rendel, amely megegyezik az előző kép tárgypontjának színvalószínűségével. Számos algoritmus, mint például a kernel alapú követés [8] , az ensemble tracking [9] , a CAMshift [10] [11] kiterjeszti ezt az elképzelést.

Simítás

Legyen a d-dimenziós bemenet és a szűrt képpixelek a térbeli tartományokban. Minden pixelhez

Erősségek

  1. A Mean shift egy alkalmazásfüggetlen eszköz, amely alkalmas valós adatelemzésre.
  2. A módszer nem feltételezi a klaszterek alakjának előzetes beállítását.
  3. Az algoritmus tetszőleges jellemzőterek feldolgozására képes.
  4. Az eljárás egyetlen paraméter, a sávszélesség kiválasztásán alapul.
  5. A h sávszélesség/ablakméret fizikai jelentése nem ugyanaz, mint a k -mean .

Hátrányok

  1. Az ablakméret megválasztása nem triviális.
  2. A nem megfelelő ablakméret a módok összeolvadásához vagy további "árnyék" módok kialakulásához vezethet.
  3. Gyakran szükség van önbeálló ablakméret használatára.

Elérhetőség

Az algoritmus változatai megtalálhatók a gépi tanulási és képfeldolgozó csomagokban:

Lásd még

Jegyzetek

  1. 12. Cheng , 1995 , p. 790–799.
  2. Comaniciu, Meer, 2002 , p. 603–619.
  3. 1 2 Fukunaga, Hostetler, 1975 , p. 32–40.
  4. Ghassabeh 12. , 2015 , p. 1–10.
  5. Ghassabeh, 2013 , p. 1423–1427
  6. Li, Hu, Wu, 2007 , p. 1756–1762
  7. Szeliski, 2011 .
  8. Comaniciu, Ramesh, Meer, 2003 , p. 564–575.
  9. Avidan, 2005 .
  10. Bradski, 1998 .
  11. Emami, 2013 , p. 180–183.

Irodalom