Szemantikus web

Az oldal jelenlegi verzióját még nem ellenőrizték tapasztalt közreműködők, és jelentősen eltérhet a 2022. március 22-én felülvizsgált verziótól ; az ellenőrzések 2 szerkesztést igényelnek .

A szemantikai hálózat a témakör információs modellje, irányított gráf formájú . A gráf csúcsai a tárgyterület objektumainak felelnek meg, az ívek (élek) pedig a köztük lévő kapcsolatot. Az objektumok lehetnek: fogalmak , események , tulajdonságok, folyamatok [1] . Így a szemantikus web a tudás megjelenítésének egyik módja .

A név két tudomány kifejezéseit egyesíti: a nyelvészetben a szemantika a nyelvi egységek jelentését tanulmányozza, a matematikai hálózat pedig egyfajta gráf - ívekkel (élekkel) összekapcsolt csúcsok halmaza, amelyekhez egy bizonyos szám van hozzárendelve. A szemantikai hálózatban a csomópontok szerepét a tudásbázis fogalmai töltik be, az ívek (sőt, irányítottak) pedig meghatározzák a köztük lévő kapcsolatot . A szemantikai hálózat tehát a tárgykör szemantikáját tükrözi fogalmak és kapcsolatok formájában.

Helytelen egyenlőségjelet tenni a "szemantikus hálózat" ( magyar szemantikus hálózat ) és a " szemantikus web " ( angol szemantikus web ) fogalmai között . Bár ezek a fogalmak nem ekvivalensek, mégis összefüggenek (lásd alább ).

Történelem

A szemantikai kapcsolatok alapján történő rendszerezés ötletét a korai tudomány tudósai javasolták. Példa erre Carl Linnaeus 1735 -ös biológiai osztályozása , amely szemantikai hálózatnak tekinthető, és egy részhalmaz-relációt használ, a modern AKO -t (az angol „A Kind Of”, „variety” szóból).

A modern szemantikai hálózatok elődjei Charles Pierce által 1909 -ben javasolt egzisztenciális gráfoknak tekinthetők . Logikai állítások ábrázolására szolgáltak speciális diagramok formájában. Peirce ezt a módszert "a jövő logikájának" nevezte.

A hálózatok vizsgálatának fontos iránya Otto Selz német pszichológus 1913-ban és 1922-ben végzett munkája volt. Ezekben a fogalmak és asszociációk szerkezetének rendezésére, valamint a tulajdonságok öröklődési módszereinek tanulmányozására gráfokat és szemantikai kapcsolatokat alkalmazott. M. Anderson (1973), D. Norman (1975) és mások ezeket a munkákat használták fel az emberi memória és az intellektuális tulajdonságok modellezésére.

A számítógépes szemantikus hálózatokat Richard Richens fejlesztette ki részletesen 1956 - ban a Cambridge- i Nyelvtanulási Központ gépi fordítási projektjének részeként . A gépi fordítás folyamata 2 részre oszlik: a forrásszöveg lefordítása egy köztes ábrázolási formára, majd ezt a köztes formát fordítják le a kívánt nyelvre. A szemantikus hálózatok csak ilyen köztes formák voltak. 1961-ben jelent meg Masterman, amelyben többek között 15 000 fogalom alapszókincsét határozta meg. Ezeket a vizsgálatokat Robert Simmons (1966), J. Wilkes (1972) és más tudósok folytatták.

A szemantikai hálózatokkal foglalkozó munkák gyakran hivatkoznak Ross Quillian amerikai pszichológus „ szemantikus emlékezet ” című munkájára [2] .

Szerkezet

A matematika lehetővé teszi, hogy a körülötted lévő világ legtöbb jelenségét logikai állítások formájában írja le. A szemantikai hálózatok matematikai képletek megjelenítésére tett kísérletként jöttek létre. A szemantikus web fő reprezentációja a gráf . Azonban ne felejtsük el, hogy a grafikus kép mögött minden bizonnyal szigorú matematikai jelölések rejlenek, és hogy mindkét forma ugyanazt jeleníti meg.

Grafikus ábrázolás

A szemantikai hálózat fő ábrázolási formája a gráf. A szemantikai hálózat fogalmai ovális vagy téglalap alakúak, és nyilakkal vannak összekötve feliratokkal - ívekkel (lásd az ábrát). Ez a személy által érzékelt legkényelmesebb forma. Hiányosságai akkor mutatkoznak meg, amikor elkezdünk bonyolultabb hálózatokat építeni, vagy megpróbáljuk figyelembe venni a természetes nyelv sajátosságait. A szemantikai hálózatok sémáit, amelyeken a navigációs viszonyok irányai fel vannak tüntetve, tudástérképeknek, a szemantikai hálózat nagy szakaszainak lefedését lehetővé tevő összességét pedig tudásatlasznak nevezzük.

Matematikai jelölés

A matematikában a gráfot V csúcsok halmaza és a köztük lévő E kapcsolatok halmaza ábrázolja. A matematikai logika apparátusával arra a következtetésre jutunk, hogy minden csúcs megfelel az objektumhalmaz egy elemének, az ív pedig egy predikátumnak . .

Nyelvi jelölés

A nyelvészetben a kapcsolatokat szótárak és tezauruszok rögzítik . A szótárakban, a nemzetségen és a konkrét különbségen keresztüli definíciókban az általános fogalom bizonyos helyet foglal el. A tezauruszban az egyes kifejezések cikkében minden lehetséges összefüggés feltüntethető más kapcsolódó kifejezésekkel. Az ilyen szinonimaszótáraktól meg kell különböztetni az információ-visszakereső tezauruszokat olyan cikkekben található kulcsszavak listájával, amelyek a leíró keresőmotorok működtetésére szolgálnak.

Szemantikai hálózatok osztályozása

Valamennyi szemantikai hálózat esetében igazságos az aritás és a relációtípusok száma szerinti felosztás.

A kapcsolattípusok száma szerint a hálózatok homogének és heterogének lehetnek .
- A homogén hálózatoknak csak egyfajta kapcsolatuk van (nyilak), mint például a fent említett fajosztályozás (egyetlen kapcsolattal AKO ).
- A heterogén hálózatokban a kapcsolattípusok száma egynél több. A tudásreprezentáció ezen modelljének klasszikus illusztrációi éppen ilyen hálózatokat képviselnek. A heterogén hálózatok gyakorlati szempontból érdekesebbek, de a kutatás szempontjából is nehezebbek. A heterogén hálózatok faszerű többrétegű struktúrák összefonódásaként ábrázolhatók. Ilyen hálózat például a Wikipédia szemantikus hálózata.
Arity szerint:
- tipikusak a bináris relációkkal rendelkező hálózatok (pontosan két fogalmat kapcsolnak össze) . A bináris relációk nagyon egyszerűek, és kényelmesen ábrázolhatók a grafikonon két fogalom közötti nyílként. Emellett kivételes szerepet töltenek be a matematikában.
- A gyakorlatban azonban szükség lehet olyan kapcsolatokra, amelyek kettőnél több objektumot kötnek össze - N-ary . Ebben az esetben nehézségek merülnek fel - hogyan kell egy ilyen kapcsolatot ábrázolni a grafikonon, hogy ne keveredjen össze. A fogalmi gráfok (lásd alább ) kiküszöbölik ezt a nehézséget azáltal, hogy minden kapcsolatot külön csomópontként ábrázolnak.
Mérethez:
- Konkrét problémák megoldására, például olyanokra, amelyeket mesterséges intelligenciarendszerek oldanak meg.
- Egy iparági léptékű szemantikus webnek konkrét rendszerek létrehozásának alapjául kell szolgálnia, anélkül, hogy egyetemes jelentőségű lenne.
- Globális szemantikai hálózat. Elméletileg egy ilyen hálózatnak léteznie kell, mivel a világon minden összefügg egymással . Talán egyszer a World Wide Web is ilyen hálózattá válik .

A fogalmi gráfokon kívül a szemantikai hálózatoknak más módosításai is vannak, ez egy másik osztályozási alap ( implementáció szerint ). További részletekért lásd a vonatkozó részt alább .

Szemantikai relációk

A szemantikai hálózatban a kapcsolattípusok számát annak létrehozója határozza meg, konkrét célok alapján. A való világban számuk a végtelenségig terjed. Valójában mindegyik reláció egy állítmány, egyszerű vagy összetett. A tudásbázissal való munka sebessége attól függ, hogy milyen hatékonyan valósulnak meg a szükséges kapcsolatok feldolgozására szolgáló programok.

Hierarchikus

Leggyakrabban az elemek, halmazok és objektumok részei közötti kapcsolatok leírására van szükség. Az objektum és egy halmaz közötti kapcsolatot, amely azt jelzi, hogy az objektum ehhez a halmazhoz tartozik, osztályozási relációnak ( ISA ) nevezzük. Egy halmazról (osztályról) azt mondják , hogy osztályozza a példányait . [3] (példa: "Balloon is a dog" = A léggömb kutya típusú objektum ). Néha ezt a relációt MemberOf-nak, InstanceOf-nak vagy hasonlónak is nevezik. Az ISA kommunikáció feltételezi, hogy egy objektum tulajdonságait egy halmazból öröklik . Az ISA-val fordított összefüggést a példák jelölésére használják, ezért nevezik „Példa”, vagy oroszul „Példa”. A hierarchikus kapcsolatok fastruktúrát alkotnak .

A szuperhalmaz és egy részhalmaz közötti kapcsolat ( AKO - "A Kind Of", "változat"). (Példa: "a kutya egy állat" = a kutya nevű típus az állatok típus altípusa ). Egy részhalmaz egy elemét hiponimnak ( kutya ), a szuperhalmazt pedig hipernimának ( állat ) nevezzük, magát a relációt pedig hiponim relációnak . Alternatív nevek: "SubsetOf" és "Subset". Ez az összefüggés határozza meg, hogy az első halmaz minden eleme benne legyen a másodikban (az ISA-t minden elemre végrehajtják), valamint logikai kapcsolatot a részhalmazok között: hogy az első nem nagyobb, mint a második és az első tulajdonságai. halmaz a másodiktól öröklődik. Az információs térben való navigációhoz gyakran használják az AKO relációt (Rod-View).

Egy objektum általában több részből vagy elemből áll. Például egy számítógép rendszeregységből, monitorból, billentyűzetből, egérből stb. áll. Fontos kapcsolat a HasPart , amely leírja a részek és az egész közötti kapcsolatot - a meronímia relációt . Ebben az esetben az első halmaz tulajdonságait a második nem örökli. A meronim és a holonim ellentétes fogalmak:
- A meronim olyan tárgy, amely egy másik része. ( A motor az autó meronimája .)
- A holonim olyan tárgy, amely mást is tartalmaz. (Például egy háznak van teteje. A ház a tető holonimája . A számítógép a monitor holonimája .)

A szemantikai hálózatokban gyakran meg kell határozni a szinonímia és az antonímia kapcsolatát . Ezek a kapcsolatok vagy kifejezetten megkettőződnek magában a hálózatban, vagy az algoritmikus összetevő határozza meg őket.

Kisegítő

A szemantikai hálózatokban gyakran használják a következő kapcsolatokat is :

funkcionális kapcsolatok (általában a „termel”, „befolyásol” ... igék határozzák meg);
mennyiségi (nagyobb, kisebb, egyenlő…);
térbeli (távol, közel, mögött, alatt, fölött ...);
ideiglenes (korábban, később, alatt...);
attributív (tulajdonsággal bírni, értékkel bírni);
logikai (ÉS, VAGY, NEM);
nyelvi.

Ez a lista a végtelenségig folytatható: a való világban óriási a kapcsolatok száma. Például a „teljesen más dolgok” vagy hasonló reláció használható a fogalmak között: Не_имеют_отношения_друг_к_другу(Солнце, Кухонный_чайник).

Bizonyos típusú relációk használatának jellemzői

A szemantikai hálózatban a fogalmak lehetnek objektumok és halmazaik példányai is. Ha ugyanazokat a kapcsolatokat használja mind az elemekhez, mind a gyűjteményekhez, az zavart okozhat. Hasonló hibákat ír le néhány korai rendszer működésében Drew McDermottmesterséges intelligencia szembesül a természetes ostobasággal című cikkében

Nézzünk meg négy mondatot:

Pavelnek van egy apja, akit Alekszejnek hívnak.
Pálnak sok emberből van apja.
Van egy személy, akinek Alekszej apja.
Minden embernek sok férfiú apja van.

Egy személy számára ezeknek a kifejezéseknek a jelentése egyértelmű, és sokan habozás nélkül mind a négy esetben azt mondanák, hogy a kapcsolat apa . Ez azonban tévedés: az első esetben valóban két példány közötti kapcsolat van leírva, de a másodikban és a harmadikban - egy példány és egy halmaz között, a negyedikben pedig - két halmaz képviselői közötti kapcsolat. Matematikai jelölésben ez így néz ki az 1-4 mondatoknál:

I. ∃ pavel & ∃ alexey: apa (alexey, paul); IIa. ∃ pál → ∃ x ∈ férfiak : apa(x, paul); IIb. ∃ alexey → ∃ y ∈ emberek : apa(alexey, y); III. ∀ y ∈ emberek → ∃ x ∈ férfiak : apa(x, y);

Azt látjuk, hogy a IIa és IIb esetek csak a predikátum változóinak sorrendjében térnek el egymástól, de ez fontos szerepet játszhat a hálózat helyességében. A példában csak 4 típusú reláció szerepel, de egy bináris hálózathoz kilenc van. Eltérnek a ∃ és ∀ kvantorokban , valamint a változók sorrendjében.

Grafikailag mindezen esetek megkülönböztetésére a relációk grafikonon való jelölésének speciális formáit használjuk: például az első típusú kapcsolatokat változatlanul hagyjuk, a második fajtát egy téglalap alakú pontkerettel, a harmadikat egy kötőjellel körvonalazzuk, és a negyedik egy kötőjel-pont. Vagy csak írd mellé a relációtípus indexet.

A leggyakoribb zavar az ISA -rel kapcsolatban merül fel . Ezért sok modern műben elfogadott, hogy az ISA egy példány és egy halmaz közötti kapcsolatot jelöli (a fenti IIb eset): Murka ISA kat . Ebben az esetben nem használunk egyetlen keretet. Ha szükség van egy ekvivalencia reláció definiálására (I. eset), akkor erre egy speciális relációt is be lehet vezetni (bár a szemantikai hálónál erre alig van szükség). Az ISA felhasználható az egyik halmaz elemeinek egy másikban való előfordulásának jelzésére (III. eset), de ez nem ajánlott. A részhalmazok jelölésére egy másik speciális relációt használnak - AKO . Az a különbség a dobozban lévő ISA és az AKO között, hogy az utóbbi felelős a halmazok tulajdonságainak örökléséért is, nem csak az elemekért.

Szemantikai hálózatok használata

Szemantika

A szemantizáció a szövegek megváltoztatásának folyamata, amelyben a szemantikai kapcsolatokat tartalmuk megváltoztatása nélkül különböztetjük meg. A Wikipédiának vannak projektjei a cikkek és a kategóriafa szemantizálására.

A cikkek szemantizálása főként sablonok segítségével történik, néhány kategória automatikusan jön létre.
A kategóriafa szemantizálása a tranzitivitás megfigyeléséből , metakategóriák létrehozásából és az alkategóriák szerkezetének értelmes kritériumok segítségével történő rendszerezéséből áll.

A szemantikus web

A hipertext szerveződés fogalma egy homogén bináris szemantikai hálózatra hasonlít , de van egy jelentős különbség:

A hiperhivatkozás által létrehozott kapcsolatnak nincs szemantikája, vagyis nem írja le ennek a kapcsolatnak a jelentését. A szemantikai hálózat célja az objektumok kapcsolatainak leírása , nem pedig a tárgykörre vonatkozó további információk. Egy személy kitalálhatja, miért van szükség erre vagy arra a hivatkozásra, de ez a kapcsolat nem egyértelmű a számítógép számára.
A hiperhivatkozással ellátott oldalak olyan dokumentumok , amelyek általában a problémahelyzet egészét írják le. A szemantikus webben a csúcsok (milyen kapcsolatok kapcsolódnak egymáshoz) valós világbeli fogalmakat vagy objektumokat képviselnek .

A világhálón alapuló szemantikus web létrehozására tett kísérletet Szemantikus Webnek nevezték el . Ez a koncepció az RDF (XML-alapú jelölőnyelv ) használatát foglalja magában, és célja, hogy a hivatkozásoknak olyan jelentést adjon, amelyet a számítógépes rendszerek megértenek. Ezáltal az Internet globális szinten elosztott tudásbázissá válik.

Szoftver

Lásd még

Jegyzetek

↑ Roussopoulos ND Adatbázisok szemantikai hálózati modellje. — TR No 104, Torontói Egyetem Számítástechnikai Tanszék, 1976.
↑ Quillian, M. R. (1968). szemantikai memória. Szemantikai információfeldolgozás, 227-270.
↑ Alapfogalmak . Letöltve: 2007. április 15. Az eredetiből archiválva : 2007. január 25.. (határozatlan)

Tudásmérnöki
Általános fogalmak	Adat metaadatokat Tudás metatudás Tudásábrázolás Tudásbázis Ontológia szemantikus web
Merev modellek	Termékek Szemantikus hálózatok Keretek Logikai modell
Lágy módszerek	Neurális hálózat evolúciós modellezés zavaros logika
Alkalmazások	Szakértői rendszerek Adatbányászat Információ kinyerése Virtuális beszélgetőpartnerek Hibrid intelligens rendszerek
Mesterséges intelligencia Gépi tanulás természetes nyelvi feldolgozás

szemantikus web
Alapok	A világháló Internet Hipertext Adatbázis Szemantikus hálózatok Ontológiák Leírás logika
alszakaszok	Kapcsolt adatok adatháló Hiperadatok Üzleti szabály-végrehajtási kiszolgáló Adatterek
Alkalmazások	Szemantikus Wiki Szemantikus publikálás Szemantikus keresés Szemantikus számítástechnika szemantikus reklámozás Szemantikus érvelési mechanizmus szemantikai illesztés szemantikai leképező szemantikai bróker szemantikai elemzés szemantikus szolgáltatásorientált architektúra
Kapcsolódó témák	Folksonomia Könyvtár 2.0 Web 2.0 Linkek Információs architektúra Tudásmenedzsment kollektív intelligencia Tematikus térképek Gondolattérképezés metaadatokat Geocímkézés webtudomány
Szabványok	Szintaxis : RDF RDF/XML 3. jelölés Teknősbéka N-hármas JSON-LD SPARQL URI http XML Sémák, ontológiák : RDFS BAGOLY Szabálycsere formátuma Szemantikus webszabály nyelve közös logika Schema.org Szemantikai megjegyzés : RDFa erDF GRDDL Mikroformátumok Mikroadatok Szótárak : DOAP FOAF SIOC Dublin mag SKOS ERNYŐVIRÁGZAT Előzmények : Egyszerű régi szemantikus HTML DAML+OLAJ