Cyc

Az oldal jelenlegi verzióját még nem ellenőrizték tapasztalt hozzászólók, és jelentősen eltérhet a 2018. augusztus 26-án felülvizsgált verziótól ; az ellenőrzések 12 szerkesztést igényelnek .
Cyc
Típusú tudásbázis , következtetési motor , számítógépes program , magasabb ontológia és kutatási projekt [d]
Fejlesztő Lenat, Douglas
Beírva Lisp , CycL [ d] és SubL [d]
Első kiadás 1984
Weboldal cyc.com

A Cyc ( latinul írva, ejtsd: Cyc ) egy terjedelmes ontológiai tudásbázis létrehozására irányuló projekt, amely lehetővé teszi a programok számára, hogy a mesterséges intelligencia területéről bonyolult problémákat oldjanak meg logikai következtetések és a józan ész használata alapján .

Áttekintés

A projektet Douglas Lenat indította el 1984 - ben a Microelectronics and Computer Technology Corporationnél . A "Cyc" név (az angol  enciklopédiából származik: "cyc") az austini Cycorp, Inc. bejegyzett védjegye, amelyet a Lenat üzemeltet, és a Cyc fejlesztésére hozták létre. A tudásbázis a cég tulajdona, de az alap egy kis része, amely az automatikus gondolkodási programok közös szókincsének kialakítására szolgál, nyílt licenc alatt nyílt meg OpenCyc néven. A Cyc-et később a ResearchCyc speciális kutatási engedélye alapján az AI-kutatók rendelkezésére bocsátották .

Tipikus példák az adatbázisban szereplő tudásra: „Minden fa növény” és „A növények halandók”. Ha azt kérdezi, hogy "halnak-e a fák?", a következtetési motor levonhatja a nyilvánvaló következtetést, és megadhatja a helyes választ. A Tudásbázis ( angol  Knowledge Base vagy KB) több mint egymillió állítást, szabályt és gyakran használt ötletet tartalmaz, amelyeket az emberek írnak be. A CycL nyelven vannak megfogalmazva, amely predikátumszámításon alapul, és Lisp -szerű szintaxissal rendelkezik . Az angolul beszélő felhasználók azzal viccelődnek, hogy "kerékpárosok" (az angol  kerékpáros  - kerékpáros szóból).

A Cyc projektben a mai munka nagy része továbbra is a tudásmérnöki tevékenységről szól  – a minket körülvevő világ tényeinek manuális leírása és hatékony következtetési mechanizmusok megvalósítása ezen ismeretek alapján. Folyamatban van azonban a munka annak érdekében, hogy a Cyc rendszer önállóan kommunikálhasson a felhasználókkal természetes nyelven , és hogy felgyorsuljon az alap feltöltésének folyamata gépi tanulás segítségével .

A tudásbázis leírása, terminológia

A Cyc-ben lévő fogalmakat konstansoknak nevezzük . Az állandó nevek opcionális "#$" karakterekkel kezdődnek, és megkülönböztetik a kis- és nagybetűket. Vannak állandók a következőkhöz:

A legfontosabb predikátumok az #$isa és a #$genls. Az első egy kijelentés, hogy egy elem egy gyűjtemény példánya, a második pedig az, hogy a gyűjtemény egy másik gyűjtemény algyűjteménye. A fogalmakkal kapcsolatos tények deklarálása speciális CycL utasításokkal történik . A predikátumokat zárójelben írjuk argumentumaik elé:

(#$isa #$BillClinton #$Egyesült Államok elnöke)

azt jelenti, hogy "Bill Clinton az Egyesült Államok egyik elnöke", és a nyilatkozat

(#$genls #$Tree-ThePlant #$Plant)

így szól: "Minden fa növény."

(#$capitalCity #$Franciaország #$Párizs)

azt jelenti: "Párizs Franciaország fővárosa".

Az utasítások is tartalmazhatnak változókat, "?"-vel kezdődő sorokat. Ezeket az állításokat "szabályoknak" nevezik. Az #$isa predikátummal kapcsolatos egyik legfontosabb szabály a következő:

(#$ azt jelenti (#$és (#$isa ?OBJ ?SUBSET) (#$genls ?SUBSET ?SUPERSET)) (#$isa ?OBJ ?SUPERSET))

ami azt jelenti, hogy "ha az OBJ a SUBSET gyűjtemény példánya, az SUBSET pedig a SUPERSET algyűjteménye, akkor az OBJ a SUPERSET gyűjtemény példánya is." Egy másik tipikus példa:

(#$relationAllExists #$biologicalMother #$ChordataPhylum #$FemaleAnimal)

ami azt jelenti, hogy a #$ChordataPhylum gyűjtemény bármely példánya (vagyis bármely akkord ) egy nőstény állathoz (a #$ FemaleAnimal egy példánya) van társítva, amely az anyja (amint azt a #$BiologicalMother predikátum írja le).

A Cyc tudásbázis mikroelméletekre (Mt), fogalmak és tények gyűjteményeire oszlik, amelyek egy adott tudásterülethez tartoznak. A teljes tudásbázistól eltérően minden mikroelméletnek mentesnek kell lennie az ellentmondásoktól. Minden mikroelméletnek van egy neve, amely egy közönséges állandó; megegyezés szerint a mikroelméleti állandók az "Mt" karakterláncot tartalmazzák. Példa erre a #$MathMt, egy matematikai ismereteket tartalmazó mikroelmélet. A mikroelméletek örökölhetők egymástól, és hierarchiába szerveződnek: a #$MathMt egyik specializációja a #$GeometryGMt – a geometriáról szóló mikroelmélet.

opencyc

Az OpenCyc legújabb, 1.0-s verziója 2006 júliusában jelent meg. Az OpenCyc 1.0 egy teljes Cyc ontológiát tartalmaz, amely kifejezések százezreit, kifejezések millióit összekapcsoló utasításokat tartalmaz. A tudásbázis 47 000 fogalmat és 306 000 tényt tartalmaz, és megtekinthető az OpenCyc weboldalán. Az OpenCyc első verziója 2001 májusában jelent meg, mindössze 6000 koncepcióval és 60000 ténnyel. A tudásbázis az Apache licenc alatt jelenik meg . A Cycorp az OpenCyc-et párhuzamos, kevésbé korlátozó licencek alatt kívánja kiadni, hogy megfeleljen felhasználói igényeinek. A CycL és SubL interpreter (az adatbázis megtekintését, módosítását és következtetések levonását lehetővé tevő program) ingyenesen, de csak bináris formában, forráskód nélkül jelenik meg. GNU/Linux és Microsoft Windows alatt is fut .

ResearchCyc

2006 júliusában a Cycorp kiadta a ResearchCyc 1.0-t, a Cyc ingyenes (de zárt forráskódú) változatát, amelyet a kutatói közösségnek szántak. (A ResearchCyc 2004-ben béta állapotban volt, és 2005 februárjában béta tesztelésre került.) Az OpenCyc taxonómiai információi mellett a ResearchCyc lényegesen több szemantikai ismeretet (vagyis további tényeket) tartalmaz a fogalmakról a tudásbázisában, és magában foglalja egy nagy lexikon, eszközök az angol nyelv elemzéséhez és generálásához, Java felületeken írva az ismeretek szerkesztéséhez és az adatbázis lekérdezéseinek létrehozásához.

A Cycorp nyilvánosan kifejezte szándékát, hogy az OpenCyc részeként kiadja a ResearchCycben található összes kifejezést és taxonómiai kapcsolatot , és ez megtörtént az 1.0-s verzióban. Az egyik kitűzött cél egy teljesen ingyenes és korlátlan szemantikai szókincs létrehozása a szemantikus weben való használatra . Az OpenCyc taxonómia Owl formátumban érhető el az OpenCyc projekt weboldaláról.

A Cyc projekt kritikája

A Cyc-et "a mesterséges intelligencia történetének egyik legvitatottabb törekvéseként" jellemezték (Bertino et al., 275. o.), ezért elkerülhetetlenül ki is bírálta a maga részét.

Ezeket a kérdéseket a projekt elindítása óta számos helyen megvitatták. Doug Lenat és mások számos érvet tettek közzé projektjük védelmében.

Lásd még

Bibliográfia

Jegyzetek

  1. Volkel M., Krotzsch M., Vrandecic D., Haller H., Studer R. Szemantikus Wikipédia archiválva : 2019. december 31., a Wayback Machine -nél . In Proceedings of the 15. International Conference on the World Wide Web. WWW '06. ACM Press, New York, NY. Edinburgh, Skócia, 2006. május 23-26. - pp. 585-594

Linkek