Az ImageNet adatbázis egy olyan projekt, amely egy hatalmas, annotált képek adatbázisának létrehozására és karbantartására szolgál, és a képfelismerési és gépi látási módszerek fejlesztésére és tesztelésére szolgál . 2016-ig mintegy tízmillió URL-t rögzítettek az adatbázisban képekkel, amelyeket manuálisan kommentáltak az ImageNet számára, a megjegyzések felsorolták a képre eső objektumokat és a téglalapokat azok koordinátáival. [1] A harmadik felektől származó megjegyzésekkel ellátott és URL-képek adatbázisa közvetlenül elérhető az ImageNeten keresztül, de maguk a képek nem a projekt tulajdonában [2] . 2010 óta zajlik az ILSVRC ( ImageNet Large Scale Visual Recognition Challenge ) projekt , amelyben évente különböző szoftvertermékek versenyeznek az ImageNet adatbázisban található objektumok és jelenetek osztályozásában és felismerésében.
Az ImageNet crowdsourcing -ot használ a képannotációhoz.
Maguk a képek szintjén található megjegyzések egy ebbe az osztályba tartozó objektum jelenlétét vagy hiányát mutatják (például „tigris van a képen” vagy „nincs tigris a képen”). Az objektum szintjén a megjegyzés tartalmaz egy téglalapot az objektum látható részének koordinátáival. Az ImageNet a WordNet szemantikai hálózat egy változatát használja az objektumok kategorizálására, ami meglehetősen részletes, például a kutyafajtákat 120 osztály képviseli. Minden WordNet csomóponthoz több száz vagy több ezer kép tartozik, de 2016-ban az átlag körülbelül 500 kép [3] .
2017 augusztusában az ImageNet 14 197 122 képpel rendelkezik, 21 841 kategóriába sorolva .
Az ILSVRC projekt keretében 2010 óta szerveznek versenyeket kutatócsoportok között a tárgyak osztályozásában. Az ILSVCR-t a kis 2005-ös PASCAL VOC kampány ihlette, amely 20 000 képből és 20 jellemzőosztályból állt [3] . 2010-ben jelentős előrelépés történt a mintafelismerés terén. 2011-ben a 25%-os besorolási hiba jó eredménynek számított. 2012-ben egy konvolúciós neurális hálózaton alapuló mély tanulási rendszer 16%-os hibát tudott elérni; és a következő években a hiba néhány százalékra csökkent [4] . 2015-ben a kutatók megállapították, hogy az ILSVRC projekt egyes feladataiban a programok felülmúlták az emberi képességeket [5] . Amint azonban Olga Ruszkovszkaja, a kampány egyik szervezője rámutatott, a programoknak továbbra is objektumokat kell meghatározniuk az ezer kategória valamelyikéhez, és az emberek több kategóriát tudnak felismerni, illetve (a programokkal ellentétben) a képek kontextusát is jelezhetik [6 ] .
2014-ben több mint 50 szervezet csatlakozott a kampányhoz [3] . 2015-ben a Baidu projekt kutatóit egy évre felfüggesztették, mert a kéthetes korlát megkerülése érdekében több különböző néven léptek be a projektbe [7] [8] . Baidu később kijelentette, hogy a csoportvezetőt elbocsátották, és egy speciális tudományos tanácsadó csoportot állítanak össze [9] .