Haar jelei

Az oldal jelenlegi verzióját még nem ellenőrizték tapasztalt közreműködők, és jelentősen eltérhet a 2020. december 27-én felülvizsgált verziótól ; az ellenőrzéshez 1 szerkesztés szükséges .

A Haar  funkciók a mintafelismeréshez használt digitális képjellemzők . Nevüket a Haar waveletekkel való intuitív hasonlóságnak köszönhetik . A Haar funkciókat használták az első valós idejű arcdetektorban.

A történelem során az olyan algoritmusok, amelyek csak a kép intenzitásával (pl. az egyes pixelekben az RGB-értékkel) működnek, nagy számítási bonyolultságúak. Papageorgiou [1] munkájában a Haar-hullámokon alapuló jellemzőkészlettel végzett munkát vették figyelembe . Viola és Jones [2] adaptálta a Haar-hullámok használatának ötletét, és kifejlesztette az úgynevezett Haar-jellemzőket. A Haar jel szomszédos téglalap alakú területekből áll. Elhelyezkednek a képen, majd a régiókban a pixelintenzitást összegzik, ami után kiszámítják az összegek közötti különbséget. Ez a különbség egy bizonyos jellemző, egy bizonyos méret értéke lesz, bizonyos módon elhelyezve a képen.

Vegyünk például egy emberi arcokat tartalmazó adatbázist. Minden képre jellemző, hogy a szem körüli terület sötétebb, mint az arc körül. Ezért a Haar közös jellemzője az arcok számára, hogy 2 szomszédos téglalap alakú terület a szemeken és az arcokon fekszik.

A Viola-Jones módszer észlelési lépése során egy rögzített méretű ablak mozog a képen, és a kép minden olyan területére, amelyen az ablak áthalad, a Haar előjelet számítják ki. Egy objektum jelenlétét vagy hiányát az ablakban a jellemző értéke és a tanulási küszöb közötti különbség határozza meg. Mivel a Haar-jellemzők nem nagyon alkalmasak tanulásra vagy osztályozásra (a minőség valamivel magasabb, mint egy véletlenszerű, normális eloszlású értéké ), nagyobb számú jellemző szükséges egy objektum megfelelő pontosságú leírásához. Ezért a Viola-Jones módszerben a Haar jellemzők kaszkád osztályozóba vannak rendezve.

A Haar táblák fő jellemzője a többi táblához képest a legnagyobb sebesség. A kép integrált ábrázolása esetén a Haar-jellemzők konstans időben számíthatók (körülbelül 60 processzorutasítás jellemzőnként két területről).

Haar négyszögletes jelei

A legegyszerűbb téglalap alakú Haar-jellemző úgy definiálható, mint egy téglalapon belüli két szomszédos terület pixelösszege közötti különbség, amely a képen különböző pozíciókat és léptékeket foglalhat el. Az ilyen típusú elemeket 2-téglalap alakúnak nevezik. Viola és Jones 3 téglalap és 4 téglalap alakú jellemzőket is azonosított. Mindegyik jellemző jelezheti egy adott képjellemző jelenlétét (vagy hiányát), például szegélyeket vagy textúraváltozásokat. Például egy 2 téglalap alakú elem megmutathatja, hol van a határ a sötét és a világos területek között.

Haar ferde jelei

Linhart és Maid [3] bevezette a ferde (45 fokos) Haar-vonások ötletét. Ez a funkciótér méretének növelése érdekében történt. A módszer sikeresnek bizonyult, és néhány ferde jel jobban le tudta írni az objektumot. Például egy 2 téglalap alakú ferde Haar-tábla 45 fokos ferde él jelenlétét jelezheti.

Messom és Barzak [4] kiterjesztette Haar ferde jelek fogalmát. Bár az ötlet matematikailag helyes, a gyakorlatban problémák adódhatnak a funkciók különböző szögekből történő használatakor. A számítások felgyorsítása érdekében a detektor kis felbontású képeket használ, ami kerekítési hibához vezet. Ennek alapján a ferde Haar jeleket nem szokták használni.

Jegyzetek

  1. Papageorgiou, Oren és Poggio, "A tárgyfelismerés általános keretrendszere", Nemzetközi Számítógépes Látáskonferencia, 1998.
  2. Viola és Jones, "Gyors objektumészlelés egyszerű funkciók megnövelt kaszkádjával", Computer Vision and Pattern Recognition, 2001
  3. Lienhart, R. és Maydt, J., "Haar-szerű jellemzők kiterjesztett készlete a gyors objektumfelismeréshez", ICIP02, pp. I: 900-903, 2002
  4. Messom, CH és Barczak, ALC, "Fast and Efficient Rotated Haar-like Features Using Rotated Integral Images", Australian Conference on Robotics and Automation (ACRA2006), pp. 2006. 1-6

Linkek