Az automatikus képannotáció (más néven automatikus képcímkézés vagy nyelvi indexelés ) az a folyamat, amelynek során a számítógépes rendszer automatikusan metaadatokat rendel egy digitális képhez feliratok vagy kulcsszavak formájában . A számítógépes látástechnikák ezen alkalmazását képvisszakereső rendszerekben használják a képek rendezésére és lekérésére egy érdekes adatbázisból.
Ez a módszer a többosztályos képbesorolás egy típusának tekinthető, nagyon sok osztályú - mérete a szókincséhez hasonlítható. A gépi tanulási technikák jellemzően a kivont jellemzővektorok és a megjegyzéstanító szavak formájában végzett képelemzést használják arra, hogy megpróbálják automatikusan alkalmazni a megjegyzéseket az új képekre. Az első módszerek a képjellemzők és a képzési annotációk közötti összefüggéseket tanulmányozták, majd gépi fordítást használó módszereket dolgoztak ki, hogy megpróbáljanak lefordítani egy szövegszótárt "vizuális szókinccsel" vagy blob-ként ismert fürtözött régiókkal. Az ezen erőfeszítéseket követő munka osztályozási megközelítéseket, relevanciamodelleket stb.
Az automatikus képannotáció előnye a tartalom-képkereséssel (CBIR) szemben, hogy a lekérdezéseket természetesebben tudja megadni a felhasználó. [1] A CBIR általában (jelenleg) megköveteli a felhasználóktól, hogy olyan képfogalmakra keressenek, mint a szín és a textúra, vagy mintalekérdezéseket találjanak. A mintaképek egyes képelemei felülírhatják azt a koncepciót, amelyre a felhasználó valójában összpontosít. A hagyományos képkeresési módszerek manuálisan felcímkézett képeken alapulnak, ami költséges és időigényes folyamat, különösen a létező nagy és folyamatosan bővülő képadatbázisok miatt.
Számos motor csatlakozik az internethez, köztük egy valós idejű jelölőmotor [2] , amelyet a Pennsylvania State University and Behold kutatói fejlesztettek ki . Az olyan cégek, mint a Playment, az Edgecase.ai, a Microsoft VOTT.ai és a dataloop.ai beépített automatizált videoannotációs motorokat hoztak létre. Az olyan cégek, mint az Alegion.com, az Infolks, a DataPure.co, a Scaleapi.com, a Diffgram.com, a Figure-eight.com az automatikus képannotáció és a kézi ellenőrzés kombinációját kínálják, ha az automatizálás meghiúsul.