A WordNet egy angol nyelvű lexikai adatbázis , amelyet a Princeton Egyetemen fejlesztettek ki, és a hozzá tartozó szoftverrel nem copyleft ingyenes licenc alatt adták ki . Ez egy elektronikus szótár – tezaurusz és szemantikai hálózatok halmaza az angol nyelv számára.
A szótár négy hálózatból áll a beszéd főbb jelentős részeihez: főnevek, igék, melléknevek és határozószók. A WordNet alapvető szókincsegysége nem egyetlen szó, hanem egy szinonim sorozat, az úgynevezett " synset " , amely a hálózat hasonló jelentésű szavait egyesíti a szemantikai hálózat egy csomópontjává. A szótár egy személy általi használatának megkönnyítése érdekében minden szintkészletet kiegészítenek a szavak kontextusban való használatára vonatkozó meghatározással és példákkal. Egy szó vagy kifejezés egynél több szintkészletben is megjelenhet, és egynél több szófaji kategóriát tartalmazhat . Minden szintkészlet tartalmaz egy listát szinonimákról vagy szinonim kifejezésekről és mutatókról, amelyek leírják a kapcsolatát más szintkészletekkel. A többféle jelentésű szavak több szintaktikai csoportba is beletartoznak, és különféle szintaktikai és lexikai osztályokhoz rendelhetők.
A WordNet szinkronkészleteit különféle szemantikai kapcsolatok kapcsolják össze:
A WordNet más típusú hivatkozásokat is leír. Közülük a hiponímia különleges szerepet játszik: lehetővé teszi a szinsetek szemantikai hálózatok formájában történő szervezését. A beszéd különböző részei esetében az általános relációk további jellemzőkkel rendelkezhetnek, és eltérőek lehetnek a terjedelemben.
A WordNet ingyenesen használható kereskedelmi és tudományos célokra. A munkavégzéshez számos program, számos interfész és API van implementálva a legtöbb lehetséges nyelven, valamint a DICT protokollt , a GoldenDict programot és másokat használja. Ezenkívül WordNet-csomagok is megtalálhatók néhány GNU- és Linux - szoftvertárban , valamint ezek disztribúcióiban.