Zajszavak

A stop szavak vagy zajszavak a kulcsszavak alapján történő információkeresés elméletéből származó kifejezés .

A stop szavak általános és függő szavakra oszthatók .

A gyakoriak közé tartoznak a prepozíciók , utótagok , részecskék , közbeszólások , számok , részecskék stb. A gyakori zajszavak mindig ki vannak zárva a keresési lekérdezésből (kivéve a keresési kifejezés szigorú egyezése alapján történő keresést), a fordított index felépítésekor is figyelmen kívül hagyják őket . Úgy tartják, hogy a gyakori stopszavak mindegyike megtalálható a gyűjtemény szinte minden dokumentumában .

A függő stopszavak a keresett kifejezéstől függenek. Az ötlet az, hogy a talált dokumentumban más módon vegyük figyelembe az egyszerű szavak hiányát a lekérdezésből és a lekérdezésből származó függő leállításokat.

Például, amikor a Puskin Alekszandr Szergejevics kifejezést keresi , célszerű minden olyan dokumentumot megjeleníteni, amely tartalmazza:

De aligha van értelme olyan dokumentumokat megjeleníteni, amelyek csak a következőket tartalmazzák:

Vagyis ebben a lekérdezésben a zajszavak Alexander és Sergeevich .

A függő stopszavak abban különböznek egymástól, hogy csak akkor kell őket figyelembe venni a keresési lekérdezésben, ha a keresett dokumentumban jelentős kulcsszavak vannak.

Lásd még

Irodalom