Szemantikus web

Az oldal jelenlegi verzióját még nem ellenőrizték tapasztalt közreműködők, és jelentősen eltérhet a 2022. március 22-én felülvizsgált verziótól ; az ellenőrzések 2 szerkesztést igényelnek .

A szemantikai hálózat  a témakör információs modellje, irányított gráf formájú . A gráf csúcsai a tárgyterület objektumainak felelnek meg, az ívek (élek) pedig a köztük lévő kapcsolatot. Az objektumok lehetnek: fogalmak , események , tulajdonságok, folyamatok [1] . Így a szemantikus web a tudás megjelenítésének egyik módja .

A név két tudomány kifejezéseit egyesíti: a nyelvészetben a szemantika a nyelvi egységek jelentését tanulmányozza, a matematikai hálózat pedig egyfajta gráf  - ívekkel (élekkel) összekapcsolt csúcsok halmaza, amelyekhez egy bizonyos szám van hozzárendelve. A szemantikai hálózatban a csomópontok szerepét a tudásbázis fogalmai töltik be, az ívek (sőt, irányítottak) pedig meghatározzák a köztük lévő kapcsolatot . A szemantikai hálózat tehát a tárgykör szemantikáját tükrözi fogalmak és kapcsolatok formájában.

Helytelen egyenlőségjelet tenni a "szemantikus hálózat" ( magyar szemantikus hálózat ) és a " szemantikus web " ( angol  szemantikus web ) fogalmai között . Bár ezek a fogalmak nem ekvivalensek, mégis összefüggenek (lásd alább ).  

Történelem

A szemantikai kapcsolatok alapján történő rendszerezés ötletét a korai tudomány tudósai javasolták. Példa erre Carl Linnaeus 1735 -ös biológiai osztályozása , amely szemantikai hálózatnak tekinthető, és egy részhalmaz-relációt használ, a modern AKO -t (az angol „A Kind Of”, „variety” szóból).

A modern szemantikai hálózatok elődjei Charles Pierce által 1909 -ben javasolt egzisztenciális gráfoknak tekinthetők . Logikai állítások ábrázolására szolgáltak speciális diagramok formájában. Peirce ezt a módszert "a jövő logikájának" nevezte.

A hálózatok vizsgálatának fontos iránya Otto Selz német pszichológus 1913-ban és 1922-ben végzett munkája volt. Ezekben a fogalmak és asszociációk szerkezetének rendezésére, valamint a tulajdonságok öröklődési módszereinek tanulmányozására gráfokat és szemantikai kapcsolatokat alkalmazott. M. Anderson (1973), D. Norman (1975) és mások ezeket a munkákat használták fel az emberi memória és az intellektuális tulajdonságok modellezésére.

A számítógépes szemantikus hálózatokat Richard Richens  fejlesztette ki részletesen 1956 - ban a Cambridge- i Nyelvtanulási Központ gépi fordítási projektjének részeként . A gépi fordítás folyamata 2 részre oszlik: a forrásszöveg lefordítása egy köztes ábrázolási formára, majd ezt a köztes formát fordítják le a kívánt nyelvre. A szemantikus hálózatok csak ilyen köztes formák voltak. 1961-ben jelent meg Masterman, amelyben többek között 15 000 fogalom alapszókincsét határozta meg. Ezeket a vizsgálatokat Robert Simmons (1966), J. Wilkes (1972) és más tudósok folytatták.  

A szemantikai hálózatokkal foglalkozó munkák gyakran hivatkoznak Ross Quillian amerikai pszichológus „ szemantikus emlékezet ” című munkájára [2] .

Szerkezet

A matematika lehetővé teszi, hogy a körülötted lévő világ legtöbb jelenségét logikai állítások formájában írja le. A szemantikai hálózatok matematikai képletek megjelenítésére tett kísérletként jöttek létre. A szemantikus web fő reprezentációja a gráf . Azonban ne felejtsük el, hogy a grafikus kép mögött minden bizonnyal szigorú matematikai jelölések rejlenek, és hogy mindkét forma ugyanazt jeleníti meg.

Grafikus ábrázolás

A szemantikai hálózat fő ábrázolási formája a gráf. A szemantikai hálózat fogalmai ovális vagy téglalap alakúak, és nyilakkal vannak összekötve feliratokkal - ívekkel (lásd az ábrát). Ez a személy által érzékelt legkényelmesebb forma. Hiányosságai akkor mutatkoznak meg, amikor elkezdünk bonyolultabb hálózatokat építeni, vagy megpróbáljuk figyelembe venni a természetes nyelv sajátosságait. A szemantikai hálózatok sémáit, amelyeken a navigációs viszonyok irányai fel vannak tüntetve, tudástérképeknek, a szemantikai hálózat nagy szakaszainak lefedését lehetővé tevő összességét pedig tudásatlasznak nevezzük.

Matematikai jelölés

A matematikában a gráfot V csúcsok halmaza és a köztük lévő E kapcsolatok halmaza ábrázolja. A matematikai logika apparátusával arra a következtetésre jutunk, hogy minden csúcs megfelel az objektumhalmaz egy elemének, az ív pedig egy predikátumnak . .

Nyelvi jelölés

A nyelvészetben a kapcsolatokat szótárak és tezauruszok rögzítik . A szótárakban, a nemzetségen és a konkrét különbségen keresztüli definíciókban az általános fogalom bizonyos helyet foglal el. A tezauruszban az egyes kifejezések cikkében minden lehetséges összefüggés feltüntethető más kapcsolódó kifejezésekkel. Az ilyen szinonimaszótáraktól meg kell különböztetni az információ-visszakereső tezauruszokat olyan cikkekben található kulcsszavak listájával, amelyek a leíró keresőmotorok működtetésére szolgálnak.

Szemantikai hálózatok osztályozása

Valamennyi szemantikai hálózat esetében igazságos az aritás és a relációtípusok száma szerinti felosztás.

A fogalmi gráfokon kívül a szemantikai hálózatoknak más módosításai is vannak, ez egy másik osztályozási alap ( implementáció szerint ). További részletekért lásd a vonatkozó részt alább .

Szemantikai relációk

A szemantikai hálózatban a kapcsolattípusok számát annak létrehozója határozza meg, konkrét célok alapján. A való világban számuk a végtelenségig terjed. Valójában mindegyik reláció egy állítmány, egyszerű vagy összetett. A tudásbázissal való munka sebessége attól függ, hogy milyen hatékonyan valósulnak meg a szükséges kapcsolatok feldolgozására szolgáló programok.

Hierarchikus

Leggyakrabban az elemek, halmazok és objektumok részei közötti kapcsolatok leírására van szükség. Az objektum és egy halmaz közötti kapcsolatot, amely azt jelzi, hogy az objektum ehhez a halmazhoz tartozik, osztályozási relációnak ( ISA ) nevezzük. Egy halmazról (osztályról) azt mondják , hogy osztályozza a példányait . [3] (példa: "Balloon is a dog" = A léggömb kutya típusú objektum ). Néha ezt a relációt MemberOf-nak, InstanceOf-nak vagy hasonlónak is nevezik. Az ISA kommunikáció feltételezi, hogy egy objektum tulajdonságait egy halmazból öröklik . Az ISA-val fordított összefüggést a példák jelölésére használják, ezért nevezik „Példa”, vagy oroszul „Példa”. A hierarchikus kapcsolatok fastruktúrát alkotnak .

A szemantikai hálózatokban gyakran meg kell határozni a szinonímia és az antonímia kapcsolatát . Ezek a kapcsolatok vagy kifejezetten megkettőződnek magában a hálózatban, vagy az algoritmikus összetevő határozza meg őket.

Kisegítő

A szemantikai hálózatokban gyakran használják a következő kapcsolatokat is :

Ez a lista a végtelenségig folytatható: a való világban óriási a kapcsolatok száma. Például a „teljesen más dolgok” vagy hasonló reláció használható a fogalmak között: Не_имеют_отношения_друг_к_другу(Солнце, Кухонный_чайник).

Bizonyos típusú relációk használatának jellemzői

A szemantikai hálózatban a fogalmak lehetnek objektumok és halmazaik példányai is. Ha ugyanazokat a kapcsolatokat használja mind az elemekhez, mind a gyűjteményekhez, az zavart okozhat. Hasonló hibákat ír le néhány korai rendszer működésében Drew McDermottmesterséges intelligencia szembesül a természetes ostobasággal című cikkében

Nézzünk meg négy mondatot:

  1. Pavelnek van egy apja, akit Alekszejnek hívnak.
  2. Pálnak sok emberből van apja.
  3. Van egy személy, akinek Alekszej apja.
  4. Minden embernek sok férfiú apja van.

Egy személy számára ezeknek a kifejezéseknek a jelentése egyértelmű, és sokan habozás nélkül mind a négy esetben azt mondanák, hogy a kapcsolat apa . Ez azonban tévedés: az első esetben valóban két példány közötti kapcsolat van leírva, de a másodikban és a harmadikban - egy példány és egy halmaz között, a negyedikben pedig - két halmaz képviselői közötti kapcsolat. Matematikai jelölésben ez így néz ki az 1-4 mondatoknál:

I. ∃ pavel & ∃ alexey: apa (alexey, paul); IIa. ∃ pál → ∃ x ∈ férfiak : apa(x, paul); IIb. ∃ alexey → ∃ y ∈ emberek : apa(alexey, y); III. ∀ y ∈ emberek → ∃ x ∈ férfiak : apa(x, y);

Azt látjuk, hogy a IIa és IIb esetek csak a predikátum változóinak sorrendjében térnek el egymástól, de ez fontos szerepet játszhat a hálózat helyességében. A példában csak 4 típusú reláció szerepel, de egy bináris hálózathoz kilenc van. Eltérnek a ∃ és ∀ kvantorokban , valamint a változók sorrendjében.

Grafikailag mindezen esetek megkülönböztetésére a relációk grafikonon való jelölésének speciális formáit használjuk: például az első típusú kapcsolatokat változatlanul hagyjuk, a második fajtát egy téglalap alakú pontkerettel, a harmadikat egy kötőjellel körvonalazzuk, és a negyedik egy kötőjel-pont. Vagy csak írd mellé a relációtípus indexet.

A leggyakoribb zavar az ISA -rel kapcsolatban merül fel . Ezért sok modern műben elfogadott, hogy az ISA egy példány és egy halmaz közötti kapcsolatot jelöli (a fenti IIb eset): Murka ISA kat . Ebben az esetben nem használunk egyetlen keretet. Ha szükség van egy ekvivalencia reláció definiálására (I. eset), akkor erre egy speciális relációt is be lehet vezetni (bár a szemantikai hálónál erre alig van szükség). Az ISA felhasználható az egyik halmaz elemeinek egy másikban való előfordulásának jelzésére (III. eset), de ez nem ajánlott. A részhalmazok jelölésére egy másik speciális relációt használnak - AKO . Az a különbség a dobozban lévő ISA és az AKO között, hogy az utóbbi felelős a halmazok tulajdonságainak örökléséért is, nem csak az elemekért.

Szemantikai hálózatok használata

Szemantika

A szemantizáció a szövegek megváltoztatásának folyamata, amelyben a szemantikai kapcsolatokat tartalmuk megváltoztatása nélkül különböztetjük meg. A Wikipédiának vannak projektjei a cikkek és a kategóriafa szemantizálására.

A szemantikus web

A hipertext szerveződés fogalma egy homogén bináris szemantikai hálózatra hasonlít , de van egy jelentős különbség:

  1. A hiperhivatkozás által létrehozott kapcsolatnak nincs szemantikája, vagyis nem írja le ennek a kapcsolatnak a jelentését. A szemantikai hálózat célja az objektumok kapcsolatainak leírása , nem pedig a tárgykörre vonatkozó további információk. Egy személy kitalálhatja, miért van szükség erre vagy arra a hivatkozásra, de ez a kapcsolat nem egyértelmű a számítógép számára.
  2. A hiperhivatkozással ellátott oldalak olyan dokumentumok , amelyek általában a problémahelyzet egészét írják le. A szemantikus webben a csúcsok (milyen kapcsolatok kapcsolódnak egymáshoz) valós világbeli fogalmakat vagy objektumokat képviselnek .

A világhálón alapuló szemantikus web létrehozására tett kísérletet Szemantikus Webnek nevezték el . Ez a koncepció az RDF (XML-alapú jelölőnyelv ) használatát foglalja magában, és célja, hogy a hivatkozásoknak olyan jelentést adjon, amelyet a számítógépes rendszerek megértenek. Ezáltal az Internet globális szinten elosztott tudásbázissá válik.

Szoftver

Lásd még

Jegyzetek

  1. Roussopoulos ND Adatbázisok szemantikai hálózati modellje.  — TR No 104, Torontói Egyetem Számítástechnikai Tanszék, 1976.
  2. Quillian, M. R. (1968). szemantikai memória. Szemantikai információfeldolgozás, 227-270.
  3. Alapfogalmak . Letöltve: 2007. április 15. Az eredetiből archiválva : 2007. január 25..