Cyc
Az oldal jelenlegi verzióját még nem ellenőrizték tapasztalt hozzászólók, és jelentősen eltérhet a 2018. augusztus 26-án felülvizsgált
verziótól ; az ellenőrzések 12 szerkesztést igényelnek .
A Cyc ( latinul írva, ejtsd: Cyc ) egy terjedelmes ontológiai tudásbázis létrehozására irányuló projekt, amely lehetővé teszi a programok számára, hogy a mesterséges intelligencia területéről bonyolult problémákat oldjanak meg logikai következtetések és a józan ész használata alapján .
Áttekintés
A projektet Douglas Lenat indította el 1984 - ben a Microelectronics and Computer Technology Corporationnél . A "Cyc" név (az angol enciklopédiából származik: "cyc") az austini Cycorp, Inc. bejegyzett védjegye, amelyet a Lenat üzemeltet, és a Cyc fejlesztésére hozták létre. A tudásbázis a cég tulajdona, de az alap egy kis része, amely az automatikus gondolkodási programok közös szókincsének kialakítására szolgál, nyílt licenc alatt nyílt meg OpenCyc néven. A Cyc-et később a ResearchCyc speciális kutatási engedélye alapján az AI-kutatók rendelkezésére bocsátották .
Tipikus példák az adatbázisban szereplő tudásra: „Minden fa növény” és „A növények halandók”. Ha azt kérdezi, hogy "halnak-e a fák?", a következtetési motor levonhatja a nyilvánvaló következtetést, és megadhatja a helyes választ. A Tudásbázis ( angol Knowledge Base vagy KB) több mint egymillió állítást, szabályt és gyakran használt ötletet tartalmaz, amelyeket az emberek írnak be. A CycL nyelven vannak megfogalmazva, amely predikátumszámításon alapul, és Lisp -szerű szintaxissal rendelkezik . Az angolul beszélő felhasználók azzal viccelődnek, hogy "kerékpárosok" (az angol kerékpáros - kerékpáros szóból).
A Cyc projektben a mai munka nagy része továbbra is a tudásmérnöki tevékenységről szól – a minket körülvevő világ tényeinek manuális leírása és hatékony következtetési mechanizmusok megvalósítása ezen ismeretek alapján. Folyamatban van azonban a munka annak érdekében, hogy a Cyc rendszer önállóan kommunikálhasson a felhasználókkal természetes nyelven , és hogy felgyorsuljon az alap feltöltésének folyamata gépi tanulás segítségével .
A tudásbázis leírása, terminológia
A Cyc-ben lévő fogalmakat konstansoknak nevezzük . Az állandó nevek opcionális "#$" karakterekkel kezdődnek, és megkülönböztetik a kis- és nagybetűket. Vannak állandók a következőkhöz:
- egyedi elemeket, amelyeket egyéninek neveznek , például #$BillClinton vagy #$France.
- gyűjtemények ( Collections ), például a #$Tree-ThePlant (amely az összes fát tartalmazza) vagy a #$EquivalenceRelation (amely tartalmazza az összes ekvivalencia relációt ). Egy gyűjtemény egy tagját a gyűjtemény példányának nevezzük .
- Igazság Függvények , amelyek egy vagy több fogalomra alkalmazhatók, és igaz vagy hamis értéket adnak vissza . Például a #$siblings olyan testvérkapcsolat, amely csak akkor igaz, ha két érve testvér. Megállapodás szerint az igazságfüggvény állandói kisbetűvel kezdődnek. Az igazságfüggvények logikai konnektívákra (például #$és, #$vagy, #$nem, #$implies), kvantorokra (#$forAll, #$thereExists stb.) és predikátumokra bonthatók .
- Függvények , amelyek az adatokból új kifejezéseket alkotnak. Ha például egy növénytípust (vagy gyűjteményt) ad át argumentumként a #$FruitFn függvénynek, akkor az a gyümölcsök gyűjteményét adja vissza. Megállapodás szerint a függvényállandó nevek nagybetűvel kezdődnek, és az "Fn" karakterlánccal végződnek.
A legfontosabb predikátumok az #$isa és a #$genls. Az első egy kijelentés, hogy egy elem egy gyűjtemény példánya, a második pedig az, hogy a gyűjtemény egy másik gyűjtemény algyűjteménye. A fogalmakkal kapcsolatos tények deklarálása speciális CycL utasításokkal történik . A predikátumokat zárójelben írjuk argumentumaik elé:
(#$isa #$BillClinton #$Egyesült Államok elnöke)
azt jelenti, hogy "Bill Clinton az Egyesült Államok egyik elnöke", és a nyilatkozat
(#$genls #$Tree-ThePlant #$Plant)
így szól: "Minden fa növény."
(#$capitalCity #$Franciaország #$Párizs)
azt jelenti: "Párizs Franciaország fővárosa".
Az utasítások is tartalmazhatnak változókat, "?"-vel kezdődő sorokat. Ezeket az állításokat "szabályoknak" nevezik. Az #$isa predikátummal kapcsolatos egyik legfontosabb szabály a következő:
(#$ azt jelenti
(#$és
(#$isa ?OBJ ?SUBSET)
(#$genls ?SUBSET ?SUPERSET))
(#$isa ?OBJ ?SUPERSET))
ami azt jelenti, hogy "ha az OBJ a SUBSET gyűjtemény példánya, az SUBSET pedig a SUPERSET algyűjteménye, akkor az OBJ a SUPERSET gyűjtemény példánya is." Egy másik tipikus példa:
(#$relationAllExists #$biologicalMother #$ChordataPhylum #$FemaleAnimal)
ami azt jelenti, hogy a #$ChordataPhylum gyűjtemény bármely példánya (vagyis bármely akkord ) egy nőstény állathoz (a #$ FemaleAnimal egy példánya) van társítva, amely az anyja (amint azt a #$BiologicalMother predikátum írja le).
A Cyc tudásbázis mikroelméletekre (Mt), fogalmak és tények gyűjteményeire oszlik, amelyek egy adott tudásterülethez tartoznak. A teljes tudásbázistól eltérően minden mikroelméletnek mentesnek kell lennie az ellentmondásoktól. Minden mikroelméletnek van egy neve, amely egy közönséges állandó; megegyezés szerint a mikroelméleti állandók az "Mt" karakterláncot tartalmazzák. Példa erre a #$MathMt, egy matematikai ismereteket tartalmazó mikroelmélet. A mikroelméletek örökölhetők egymástól, és hierarchiába szerveződnek: a #$MathMt egyik specializációja a #$GeometryGMt – a geometriáról szóló mikroelmélet.
opencyc
Az OpenCyc legújabb, 1.0-s verziója 2006 júliusában jelent meg. Az OpenCyc 1.0 egy teljes Cyc ontológiát tartalmaz, amely kifejezések százezreit, kifejezések millióit összekapcsoló utasításokat tartalmaz. A tudásbázis 47 000 fogalmat és 306 000 tényt tartalmaz, és megtekinthető az OpenCyc weboldalán. Az OpenCyc első verziója 2001 májusában jelent meg, mindössze 6000 koncepcióval és 60000 ténnyel. A tudásbázis az Apache licenc alatt jelenik meg . A Cycorp az OpenCyc-et párhuzamos, kevésbé korlátozó licencek alatt kívánja kiadni, hogy megfeleljen felhasználói igényeinek. A CycL és SubL interpreter (az adatbázis megtekintését, módosítását és következtetések levonását lehetővé tevő program) ingyenesen, de csak bináris formában, forráskód nélkül jelenik meg. GNU/Linux és Microsoft Windows alatt is fut .
ResearchCyc
2006 júliusában a Cycorp kiadta a ResearchCyc 1.0-t, a Cyc ingyenes (de zárt forráskódú) változatát, amelyet a kutatói közösségnek szántak. (A ResearchCyc 2004-ben béta állapotban volt, és 2005 februárjában béta tesztelésre került.) Az OpenCyc taxonómiai információi mellett a ResearchCyc lényegesen több szemantikai ismeretet (vagyis további tényeket) tartalmaz a fogalmakról a tudásbázisában, és magában foglalja egy nagy lexikon, eszközök az angol nyelv elemzéséhez és generálásához, Java felületeken írva az ismeretek szerkesztéséhez és az adatbázis lekérdezéseinek létrehozásához.
A Cycorp nyilvánosan kifejezte szándékát, hogy az OpenCyc részeként kiadja a ResearchCycben található összes kifejezést és taxonómiai kapcsolatot , és ez megtörtént az 1.0-s verzióban. Az egyik kitűzött cél egy teljesen ingyenes és korlátlan szemantikai szókincs létrehozása a szemantikus weben való használatra . Az OpenCyc taxonómia Owl formátumban érhető el az OpenCyc projekt weboldaláról.
A Cyc projekt kritikája
A Cyc-et "a mesterséges intelligencia történetének egyik legvitatottabb törekvéseként" jellemezték (Bertino et al., 275. o.), ezért elkerülhetetlenül ki is bírálta a maga részét.
- A rendszer túlzott bonyolultsága - kétségtelenül az enciklopédikus ambíciók miatt szükséges -, és ennek megfelelően az adatok (manuális) rendszerhez való hozzáadásának bonyolultsága;
- Skálázhatósági problémák a széles körben elterjedt reifikációból, különösen konstansként;
- Az anyag fogalmának nem kielégítő használata, és az ezzel kapcsolatos különbségtétel a belső és külső tulajdonságok között;
- Hiányzik a józan teljesítménymérés vagy a Cyc következtetési motor hatékonyságának összehasonlítása;
- A rendszer jelenlegi hiányossága mind szélességben, mind mélységben, és az ezzel járó nehézség a teljességének mérésében;
- a dokumentáció hiánya;
- A naprakész online képzési anyagok hiánya megnehezíti a rendszer elsajátítását az újoncok számára;
- Az OpenCyc rendszer a neve ellenére sem teljesen nyitott: az adatokat a felhasználók szerkeszthetik, a kódot viszont a fejlesztők nem bővíthetik. [egy]
Ezeket a kérdéseket a projekt elindítása óta számos helyen megvitatták. Doug Lenat és mások számos érvet tettek közzé projektjük védelmében.
Lásd még
Bibliográfia
- Elisa Bertino, Gian Piero Zarri, Barbara Catania, Gian Pierro Zarri. Intelligens adatbázisrendszerek (neopr.) . – Addison-Wesley Professional , 2001.
- Matuszek , Cynthia, M. Witbrock , R. Kahlert, J. Cabral, D. Schneider, P. Shah és D. Lenat . A józan ész keresése: Cyc feltöltése az internetről . In Proceedings of the Twentieth National Conference on Artificial Intelligence, Pittsburgh, Pennsylvania, 2005. július [1]
- Shepard, Blake, C. Matuszek, C. B. Fraser, W. Wechtenhiser, D. Crabbe, Z. Gungordu, J. Jantos, T. Hughes, L. Lefkowitz, M. Witbrock, D. Lenat, E. Larson. A hálózati biztonság tudásalapú megközelítése: A Cyc alkalmazása a hálózati kockázatértékelés területén . In Proceedings of the Seventeenth Innovative Applications of Artificial Intelligence Conference, Pittsburgh, Pennsylvania, 2005. július [2]
- Ramachandran, Deepak, P. Reagan, K. Goolsbey. Elsőrendű ResearchCyc: Expresszivitás és hatékonyság a józan ész ontológiájában . In Papers from the AAAI Workshop on Contexts and Ontologies: Theory, Practice and Applications. Pittsburgh, Pennsylvania, 2005. július [3]
- Cabral, John, R. C. Kahlert, C. Matuszek, M. Witbrock, B. Summers. A szemantikus metaismeret átalakítása induktív torzítássá . In Proceedings of the 15. International Conference on Inductive Logic Programming, Bonn, Germany, 2005. augusztus [4]
- Schneider, Dave, C. Matuszek, P. Shah, R. Kahlert, D. Baxter, J. Cabral, M. Witbrock, D. Lenat. Tények gyűjtése és kezelése az intelligenciaelemzéshez . In Proceedings of the 2005 International Conference on Intelligence Analysis, McLean, Virginia, 2005. május [5]
- Forbus, Kenneth, L. Birnbaum, E. Wagner, J. Baker és M. Witbrock . Az analógia, az intelligens információkeresés és a tudásintegráció kombinálása az elemzéshez: Előzetes jelentés . In Proceedings of the 2005 International Conference on Intelligence Analysis, McLean, Virginia, 2005. május [6]
- Deaton, Chris, B. Shepard, C. Klein, C. Mayans, B. Summers, A. Brusseau, M. Witbrock . The Comprehensive Terrorism Knowledge Base in Cyc. In Proceedings of the 2005 International Conference on Intelligence Analysis, McLean, Virginia, 2005. május [7]
- Rode, Benjamin. A minta-helyreállítás modellje felé a relációs adatokban . In Proceedings of the 2005 International Conference on Intelligence Analysis, McLean, Virginia, 2005. május [8]
- Siegel, Nick, B. Shepard, J. Cabral, M. Witbrock. Hipotézisgenerálás és bizonyítékok összeállítása az intelligenciaelemzéshez: Cycorp Nooscape alkalmazása . In Proceedings of the 2005 International Conference on Intelligence Analysis, McLean, Virginia, 2005. május [9]
- Curtis, Jon, G. Matthews, D. Baxter. A Cyc hatékony felhasználásáról egy kérdésmegválaszoló rendszerben az IJCAI Workshop on Knowledge and Reasoning for Answering Questions, Edinburgh, Skócia, 2005. évi dokumentumaiban. [10]
- Witbrock, Michael, C. Matuszek, A. Brusseau, R. C. Kahlert, C. B. Fraser, D. Lenat. A tudás tudást szül: Lépések a támogatott tudásszerzés felé a Cyc -ben a 2005-ös AAAI tavaszi szimpóziumon az önkéntes közreműködők tudásgyűjtéséről (KCVC), pp. 99–105. Stanford, Kalifornia, 2005. március [11]
- Belasco, Alan, J. Curtis, R. C. Kahlert, C. Klein, C. Mayans, R. Reagan. A tudáshiányok hatékony képviselete . In D. Karagiannis, U. Reimer (szerk.): Practical Aspects of Knowledge Management, Proceedings of PAKM 2004, Bécs, Ausztria, 2004. december 2-3., Springer-Verlag, Berlin Heidelberg. [12]
- Siegel, Nick, G. Matthews, J. Masters, R. Kahlert, M. Witbrock és K. Pittman. Agent Architectures: Combining the Strengths of Software Engineering and Cognitive Systems in Papers from the AAAI Workshop on Intelligent Agent Architectures: Combining the Strengths of Software Engineering and Cognitive Systems, Technical Report WS-04-07, pp. 74–79. Menlo Park, Kalifornia: AAAI Press, 2004. [13]
- Witbrock, Michael, K. Panton, S. L. Reed, D. Schneider, B. Aldag, M. Reimers és S. Bertolo. Automatizált OWL-annotáció, amelyet egy nagy tudásbázis segített a 2004. évi tudásjelöléssel és szemantikus annotációval foglalkozó műhelyfeljegyzésekben a 3. Nemzetközi Szemantikus Webkonferencián, ISWC2004, Hirosima, Japán, 2004. november, pp. 71–80. [tizennégy]
- Mesterek, James és Z. Gungordu. Strukturált tudásforrás integráció: Előrehaladási jelentés . In Integration of Knowledge Intensive Multiagent Systems, Cambridge, Massachusetts, USA, 2003. [15]
- O'Hara, Tom, N. Salay, M. Witbrock és mtsai. Kritériumok előidézése tömeges főnévlexikális leképezésekhez a Cyc Tudásbázis és annak WordNetre való kiterjesztése segítségével . In Proceedings of the Fifth International Workshop on Computational Semantics, Tilburg, 2003. [16]
- Witbrock, Michael, D. Baxter, J. Curtis és mtsai. Interaktív párbeszédrendszer a tudásszerzéshez a Cyc . In Proceedings of the Eightenth International Joint Conference on Artificial Intelligence, Acapulco, Mexico, 2003. [17]
- Panton, Kathy, P. Miraglia, N. Salay és mtsai. Tudásformálás és párbeszéd a KRAKEN eszközkészlet használatával . A tizennyolcadik nemzeti konferencián a mesterséges intelligenciáról, Edmonton, Kanada, 2002. [18]
- Mesterek, James. A strukturált tudásforrás integráció és alkalmazásai az információfúzióban . In Proceedings of the Fifth International Conference on Information Fusion, Annapolis, MD, 2002. július [19]
- Reed, Stephen és D. Lenat. Ontológiák leképezése Cyc-be . Az AAAI 2002 Conference Workshop on ontologies for The Semantic Web, Edmonton, Kanada, 2002 júliusában. [20]
- D. Lenat és R. V. Guha. Nagy tudásalapú rendszerek építése: ábrázolás és következtetés a Cyc projektben . - Addison-Wesley , 1990.
- A kitalált SAL 9000 gondolkodógép kifejezetten hivatkozik egy enciklopédikus adatbázisra, hogy megértse, miért használta létrehozója a "Phoenix" nevet egy diagnosztikai szimulációhoz, amely elősegítené az ikereszköz, a HAL 9000 újraindítását a 2001 -es sagában .
- A KARR (Knight Rider) kitalált gondolkodó gépezet kifejezetten hozzáfér egy adatbázishoz az alapvető emberi vágyak tesztelése során ("A bizalom nem rozsdásodik" epizód).
Jegyzetek
- ↑ Volkel M., Krotzsch M., Vrandecic D., Haller H., Studer R. Szemantikus Wikipédia archiválva : 2019. december 31., a Wayback Machine -nél . In Proceedings of the 15. International Conference on the World Wide Web. WWW '06. ACM Press, New York, NY. Edinburgh, Skócia, 2006. május 23-26. - pp. 585-594
Linkek
Szótárak és enciklopédiák |
|
---|