Címke (metaadatok)

A címke  egy kapcsolódó kulcsszó , amely egy információra hivatkozik (ezek lehetnek böngésző könyvjelzői , digitális képek, videók és egyéb fájlok ). Az ilyen metaadatok segítenek leírni ezeket az információkat és gyorsan megtalálni őket egy keresési lekérdezés segítségével . A használt rendszertől függ, de általában a címkéket szigorú szabályok nélkül használja az adatokat létrehozó vagy megtekintő személy.

A címkézés a Web 2.0 webhelyeknek és az ott használt szolgáltatásoknak köszönhetően vált népszerűvé . Mostanra egyes számítógépes programok részévé is vált.

Történelem

A címkézést vagy címkézést olyan eszközként hozták létre, amely segíti az osztályozást , az összetartozás megjelölését, a határok kijelölését és az identitás meghatározását . Lehet szó, kép vagy bármilyen más azonosító címke. A való világban analóg a topográfiai leltárak és a múzeumi kiállítások tudományos referencia-kártyamutatói. A tárgyak és információk szavakkal történő azonosítása és osztályozása már jóval a számítógépek megjelenése előtt felmerült. A keresési lekérdezések azonban jelentősen felgyorsítják a rekordok tanulmányozását.

A webes és internetes adatbázisok, valamint a korai internetes oldalak címkéket használnak az adatok közzétételekor, hogy segítsék a végfelhasználókat a tartalom megtalálásában. A Web 1.0 napjai óta a felhasználók elfogadják a címke fogalmát bármely betű vagy szó leírásaként , és már nem finomítják.

2003-ban a közösségi könyvjelzőkkel foglalkozó Delicious webhely arra ösztönözte felhasználóit, hogy a későbbi keresések felgyorsítása érdekében adjanak hozzá címkéket könyvjelzőikhez. Lehetővé vált az is, hogy egy adott címkével kapcsolatos összes információ egy helyen látható legyen. A Flickr arra biztatta a felhasználókat, hogy minden fotójukhoz saját szöveges címkéket adjanak, így rugalmas és egyszerű metaadatrendszert hoznak létre a képkeresés felgyorsítása érdekében. A Flickr sikeres fejlesztése és a Delicious hatása széles körben ismertté tette az ötletet, és más közösségi hálózatok és szoftverek  - YouTube , Technorati , Last.fm  - támogatták. Más számítógépes és internetes alkalmazások is átvették az ötletet a Gmail "címkéi" formájában , vagy címkék hozzáadásának és szerkesztésének lehetősége az iTunes vagy a Winamp alkalmazásban .

A weboldalak korai verzióiban a tervezők címkéket használtak arra, hogy tájékoztassák a keresőmotorokat az oldalak tartalmáról. Ma metacímkéket használnak erre a célra .

A kulcsszócímkéket először a Jumper Networks Jumper 2.0 platformján használták, amelyet 2008 szeptemberében indítottak el . Ez volt az első kollaboratív keresőmotor , amely a tudásmenedzsmentben a gazdag címkézési módszert alkalmazta .

A címkéket használó webhelyek gyakran népszerű címkéket jelenítenek meg címkefelhőkben . Az egyéni címkék egyaránt hasznosak maguknak a felhasználóknak és a webhely többi látogatójának.

A címkék besorolása „alulról felfelé” lehet, szemben a „felülről lefelé” hierarchikus besorolással . A hagyományos taxonómia alapú hierarchikus rendszerekben korlátozott számú kifejezést használnak az egyes entitások helyes azonosítására. A címkézés korlátlan számú címkét tesz lehetővé az osztályozáshoz. Ahelyett, hogy egy kategóriába tartozna, egy objektumnak több különböző címkéje is lehet. Egyes kutatók a hierarchikus szerkezet és a "lapos" címkék kombinálásával kísérleteznek információkereséskor [1] .

Példák

Sok blogplatform lehetővé teszi a szerzők számára, hogy szabadon megcímkézzék bejegyzéseiket a kategória hozzárendelése mellett (vagy ahelyett). Előfordulhat például, hogy egy cikk „hoki” és „jegyek” címkével rendelkezik. Ezen címkék mindegyike hiperhivatkozássá válik, amely az adott címkével rendelkező cikkek listájához vezet. Egy blognak lehet egy oldalsávja az adott webhelyen található összes címkét tartalmazó listával, amelyek mindegyike egy kapcsolódó gyűjteményhez vezet. A címkék átdolgozásához a szerző szerkesztheti a címkék listáját. A cikkek és listák közötti összes hivatkozást a blogmotor automatikusan frissíti, így nincs szükség a cikkek manuális áthelyezésére kategóriák között.

A rendezvényekhez és konferenciákhoz szokás rendelni a kiadványokban, például blogokban, fotóriportokban és prezentációkban használt címkéket. A keresőmotorok indexelhetik őket a kapcsolódó témák gyűjteményeihez, amikor találatokat jelenítenek meg.

A kutatók nagyszámú tárggyal (idézetek, bibliográfiák, képek) dolgozhatnak digitális formában. Szükség esetén a kívánt címkékhez vagy címkecsoportokhoz kapcsolhatók.

Speciális típusú címkék

Tripla címkék

A speciális hármas címkék vagy gépi címkék egy adott szintaxist használnak a címkékkel kapcsolatos további szemantikai információk megadására, így a feldolgozandó számítógépes programok számára egyértelműbbé vagy informatívabbá teszik azokat. Az ilyen címkék három részből állnak - névtérből , állítmányból és értékből. Például a "geo:long=50.123456" egy földrajzi hosszúsági címke 50.123456 koordinátával. Ez a hármas konstrukció megfelel az erőforrásleíró keretrendszer adatmodelljének .

A hármas címkéket a geolicious [2] számára 2004 novemberében vezették be, hogy a Delicious könyvjelzőket jelenítsék meg a térképen . Később használatba vették, miután a Mappr-t és a GeoBloggers-t [3] átdolgozták fényképekhez a Flickr -ben .

A földrajzi azonosításhoz használt speciális metaadatokat ma földrajzi címkézésnek nevezik . A gépi címkéket más célokra is használják, például bizonyos események fényképeinek azonosítására vagy a biológiai nómenklatúra típusainak elnevezésére .

Hashtagek

A hashtagek olyan metaadatok, amelyek bejegyzése karakterrel kezdődik #(hash). Ez a típusú címke gyakori a mikroblogban és a közösségi hálózatokban  - Twitter , Facebook , Google+ , VKontakte és Instagram . A fő különbség a hagyományos címkéktől az, hogy magának a tartalomnak a részét képezik, nem a leírásnak.

Tudáscímkék

A tudáscímkék egyfajta metainformáció , amely leírja vagy meghatározza az információs források (például dokumentumok , digitális képek , tudásbázis - táblázatok vagy weboldalak ) bizonyos aspektusait. A tudáscímkék valamivel tágabban írják le az objektumokat, mint a hagyományos, nem hierarchikus kulcsszavak . Ez egyfajta metaadat, amely leírást, kategóriát, osztályt, szemantikát, megjegyzéseket, megjegyzéseket, megjegyzéseket, hiperhivatkozásokat vagy hivatkozásokat tartalmazó speciális űrlapok-profilok formájában jeleníti meg a tudást. Az ilyen profilok egy harmadik féltől származó, gyakran heterogén tárolási erőforráson található leltárinformációkat tartalmaznak. A tudáscímkék az Enterprise 2.0 tudáskezelési eszközei az információs adatokkal kapcsolatos betekintések , tapasztalatok, tulajdonságok, függőségek vagy kapcsolatok rögzítésére. A címkék általában rugalmasabbak, mint más tudásmenedzsment-osztályozási rendszerek.

A címkézett tudásleltár számos különböző formát foglal magában, például: tényszerű tudás (könyvekben és adatokban), fogalmi tudás (perspektívákban és fogalmakban), értékelő tudás (ítéleteket és feltételezéseket igényel), módszertani ismeretek (okoskodásból és stratégiákból származnak) . [4] A tudás ilyen formái gyakran túlmutatnak az adatokon, és személyes tapasztalatokon, meglátásokon vagy ítéleteken alapulnak. A tudás az egyén elméjében lévő információ – tények, műveletek, fogalmak, magyarázatok, ötletek, áttekintések és ítéletek személyes szubjektív megértése, amelyek lehetnek egyediek, hasznosak, igazak vagy strukturáltak, vagy nem. A tudáscímkék kiterjesztik az információ határait, és új jelentéseket, összefüggéseket, magyarázatokat adnak hozzá. [5] A tudáscímkék értékesek a szervezeti intelligencia védelme érdekében, amely gyakran elveszik az átalakulás miatt, az egyének elméjében tárolt, a szervezet által jellemzően elszigetelt és kihasználatlan tudás megosztásához, valamint a gyakran elveszett vagy megszakadt tudás összekapcsolásához. információs forrásból. [6]

Előnyök és hátrányok

Egy tipikus címkéző rendszerben nincs rögzített információ az egyes címkék jelentéséről vagy szemantikájáról ; a felhasználók könnyen használhatják az új címkéket a régiekkel együtt. A kultúrában vagy a teremtés idejében gyökerező hierarchikus rendszer nehezen vagy lassan változik. [7] A címkézés rugalmassága lehetővé teszi a felhasználók számára, hogy a gyűjteményeiket olyan módon kategorizálják, ahogyan jónak látják, de a személyes ábrázolások sokfélesége problémákat okoz a keresési és feltárási folyamatokban.

Amikor a felhasználók szabadon választhatnak címkéket ( a népszonómia , ahelyett, hogy ellenőrzött szókincsből választanak ki kifejezéseket), akkor homonimák (azonos címkék eltérő jelentéssel) és szinonimák (több azonos jelentésű címke) jelennek meg a metaadatokban , ami nem megfelelő asszociációkhoz vezethet tárgyakat és hiábavaló információkeresést.a tárgyról. [8] Például a "lock" címke egy buildet vagy mechanizmust eredményezhet, míg a Linux kernel verziójára utaló objektumok a "Linux", "kernel", "Penguin" vagy más szavakkal vannak megcímkézve. A felhasználók beírhatják a címkéket módosított szavakban , például egyes vagy többes számban [9] , ami megnehezíti a navigációt olyan rendszerekben, ahol nincs szótő . A népszonómia nagyszabású problémái arra kényszerítik a felhasználókat, hogy részmegállapodások elfogadásával gondoskodjanak rendszerük feltételeinek egységes megértéséről, és ezzel egyszerűsítsék az információhoz való hozzáférést. További hátránya a processzor bizonyos lassulása, ami abból adódik, hogy az utasítás típusa és az adattípus közötti megfelelés létrehozása, amelyet a hagyományos számítógépeknél a fordítási szakaszban hajtanak végre, használatkor átkerül a programvégrehajtási szakaszba. címkéket. [tíz]


Spam

A rendelkezésre álló címkézési rendszerek hajlamosak a rendetlenségre. A látogatók vonzásának reményében (például a YouTube -on ) az emberek túl sok címkével vagy olyan címkével jelölik meg az információkat, amelyeknek semmi közük az információ tárgyához. Ez a jelenség emberi ellenőrzéssel vagy a spam azonosításának statisztikai módszereivel küzd. [11] Egy másik módszer a címkék számának korlátozása.

Szintaxis

Egyes címkézőrendszerek egyetlen szövegmezővel rendelkeznek a szavak bevitelére, ezért a lexikális elemzéshez el kell őket választani egymástól . A legnépszerűbb határolók a szóköz és a vessző . Ezeknek a karaktereknek a használatához a rendszernek támogatnia kell a magas szintű elválasztójeleket, például az idézőjeleket vagy a karakterek feloldását . Egyes rendszerek teljesen elkerülik a határolójeleket, így csak egy szót lehet beírni, ezáltal megnövelve a több címke beírásához szükséges időt.

A HTML - lel való szintaxis-kompatibilitás mikroformátumú rel címkék használatával érhető el , amelyek szemantikai kapcsolatban állnak egy "tag" értékkel ( ), ami azt jelenti, hogy a hivatkozott oldalak egy adott információ címkéi. [12]rel="tag"

Lásd még

Egyéb

Jegyzetek

  1. Címkehierarchiák archiválva 2016. június 25-én a Wayback Machine -nél, Paul Heymann kutatási jegyzetei.
  2. Maron, Mikel geo.lici.us: geotagging hosted services (2004. november 5.). Hozzáférés dátuma: 2016. május 22. Az eredetiből archiválva : 2007. április 28.
  3. Speciális címkézés és hármas címkék – Dan Catt tiszteletes, Geobloggers , 2006. január 11.
  4. Wiig, KM (1997), Knowledge Management: An Introduction and Perspective , Journal of Knowledge Management , 1. kötet (1): 6–14, doi : 10.1108/13673279710800682 , < http://www.mendeley.com/c/ 67997727/Wiig-1997-Knowledge-Management-An-Introduction-and-Perspective/ >  
  5. Cambria, Erik és Hussain, Amir (2012), Sentic album: Tartalom-, koncepció- és kontextus-alapú online személyes fényképkezelő rendszer , Cognitive Computation 4. kötet (4): 477-496 , DOI 10.1007/s12559-012 -9145-4 
  6. Alavi, Maryam és Leidner (1999), Knowledge Management Systems: Issues, Challenges and Benefits , Az Információs Rendszerek Szövetségének közleményei, 1. kötet (7) , < http://www.belkcollege.uncc.edu/jpfoley/ Readings/artic07.pdf > Archivált : 2010. december 25. a Wayback Machine -nél 
  7. Smith, Gene (2008). Címkézés: Emberek által vezérelt metaadatok a közösségi hálóhoz. Berkeley, CA: New Riders. ISBN 0-321-52917-0
  8. Golder, Scott A. Huberman, Bernardo A. (2005). " Az együttműködésen alapuló címkézési rendszerek szerkezete archiválva 2014. november 1-én a Wayback Machine -nél ". Information Dynamics Lab, HP Labs. 2005. november 24-én járt itt.
  9. Egyes vs. többes számú címkék címke alapú kategorizációs rendszerben Archiválva az eredetiből 2007. május 24-én. Írta: Keith Devens, 2004. december 24.
  10. Címkék és leírók. Ön által meghatározott adatok. . Az eredetiből archiválva : 2022. március 31.
  11. Címkelevélszemét archiválva : 2016. augusztus 6. a Wayback Machine -nél, Paul Heymann kutatási jegyzetei.
  12. rel tag mikroformátumspecifikáció Archiválva : 2010. január 20., a Wayback Machine , Microformats Wiki, 2005. január 10.

Linkek