Nyelvtani levezetés

Az oldal jelenlegi verzióját még nem ellenőrizték tapasztalt közreműködők, és jelentősen eltérhet a 2021. október 27-én felülvizsgált verziótól ; az ellenőrzéshez 1 szerkesztés szükséges .

A nyelvtani indukció (vagy grammatikai következtetés [1] ) egy olyan gépi tanulási eljárás, amely megfigyelések (példák) halmaza alapján állítja vissza egy nyelv formális nyelvtanát egy ismert ehhez a nyelvhez tartozóval. Az eljárás eredményeként megfigyelhető objektumok modellje épül fel következtetési szabályok halmaza vagy generáló szabályok , véges automata vagy más típusú automata formájában. Általánosabban, a grammatikai következtetés a gépi tanulás egyik olyan területe, ahol a példatér diszkrét kombinatorikus objektumokból áll, mint például karakterláncok, fák, gráfok.

Nyelvtan órák

A nyelvtani következtetés gyakran a különböző típusú véges automaták tanulásának problémájára összpontosít (a megközelítések részleteit lásd a Regular Language Induction cikkben ), mivel az 1980-as évek óta léteznek hatékony algoritmusok a probléma megoldására.

A 2000-es évek eleje óta ezeket a megközelítéseket kiterjesztették a kontextusmentes nyelvtanok és gazdagabb formalizmusok, például a többszörös kontextusmentes nyelvtanok és a párhuzamos többszörös kontextusmentes nyelvtanok következtetésére. A nyelvtani következtetések más osztályait is tanulmányozták más nyelvtani osztályokhoz – kontextuális nyelvtanokhoz és mintanyelvekhez . 

Tanulási modellek

A tanulás legegyszerűbb fajtája az, amikor a tanulási algoritmus csak egy sor példát, néha pedig ellenpéldákat kap a szóban forgó nyelv szavaira. Vannak más tanulási modellek is. Az egyik gyakran vizsgált alternatíva az az eset, amikor a tanuló rákérdezhet a szó nyelvhez való tartozására, mint például az egzakt tanulási modellben vagy az Angluin által  bevezetett minimálisan adekvát tanári modellben [2] .

Módszertanok

A nyelvtani következtetésre sokféle módszert fejlesztettek ki. A két klasszikus forrás Fu 1977-es [3] és 1982 -es [4] cikkei . Duda, Hart és Stork [5] is szentelt egy kis részt ennek a problémának, és számos forrást idéz. Az alábbiakban ismertetjük az általuk bemutatott alapvető próba és hiba módszert. A reguláris nyelvek alosztályozásának megközelítéseiért lásd : Reguláris nyelvek indukciója . Egy újabb könyv de la Higuera (2010) [1] , amely a reguláris nyelvek és véges automaták grammatikai következtetéseinek elméletét fedi le. D'Ulisia, Ferri és Grifoni [6] áttekintette a természetes nyelvekre vonatkozó következtetési módszerekkel kapcsolatos kutatásokat.

Nyelvtani levezetés próbálkozással és hibával

A Dowd, Hart és Stork [5] 8.7. szakaszában javasolt módszer a nyelvtani szabályok szekvenciális kitalálását és tesztelését javasolja a pozitív és negatív megfigyelések alapján. A szabálykészlet kibővül, így minden pozitív példa generálható, de ha egy adott szabálykészlet negatív példát generál, akkor azt el kell vetni. Ez a sajátos megközelítés "hipotézis tesztelésnek" nevezhető, és némileg hasonlít a verziótér Mitchell algoritmusához . Dowd, Hart és Storck cikkének [5] szövege egy egyszerű példát ad, amely jól szemlélteti a folyamatot, de az ilyen irányítatlan próbálkozás és hiba megközelítés megvalósíthatósága nagyobb problémák esetén megkérdőjelezhető.

Nyelvtani következtetés genetikai algoritmusok segítségével

Az evolúciós algoritmusok segítségével történő grammatikai következtetés az a folyamat, amely során a célnyelv nyelvtanának reprezentációja valamilyen evolúciós folyamaton keresztül fejlődik. A formális nyelvtanok könnyen ábrázolhatók következtetési szabályok fájaként , amelyekre evolúciós operátorokat lehet alkalmazni. Az ilyen típusú algoritmusok a genetikai programozásból származnak , amelynek úttörője John Koza volt . Az egyszerű formális nyelveken végzett más korai munkák a genetikai algoritmusok bináris karakterlánc-reprezentációját használták, de a nyelvtanok belső hierarchikus struktúrája, amely a Backus-Naur kiterjesztett formanyelv alapja , rugalmasabb megközelítést tesz lehetővé a fák számára.

Koza fákként mutatta be a Lisp programokat. Sikerült analógiákat találnia a genetikai operátorok és a fák standard operátorai között. Például a részfa cseréje egyenértékű a megfelelő genetikai keresztezési folyamattal , ahol a genetikai kód részsztringjei a következő generáció egyéniségévé alakulnak. egy Lisp függvény kimeneti kódjának kiértékelésével mérjük . A Lisp-féle reprezentációk fastruktúrái és a nyelvtanok faábrázolásai közötti hasonló analógiák lehetővé teszik a genetikai programozás alkalmazásának technikáját a nyelvtani indukcióhoz.

Nyelvtani indukció esetén a részfák átvitele megfelel a következtetési szabályok cseréjének, ami lehetővé teszi egy bizonyos nyelv frázisainak elemzését. A nyelvtan érvényességi operátora azon alapul, hogy mennyire jól értelmezi a célnyelv bizonyos mondatcsoportjait. A nyelvtan faábrázolásában a generáló szabály terminális szimbóluma a fa levelének felel meg. Szülőcsomópontja megegyezik egy nem terminális karakterrel (például főnévi kifejezéssel vagy igei kifejezéssel ) a szabálykészletben. Végül is a gyökércsomópont megfelelhet nem terminálisok sorozatának.

Nyelvtani levezetés mohó algoritmusokkal

Mint minden mohó algoritmus , a mohó következtetési algoritmusok is iteratív módon hozzák meg azt a döntést, amely abban a szakaszban a legjobbnak tűnik. Döntés alatt általában új szabály létrehozását, meglévő szabály törlését, alkalmazandó szabály kiválasztását, meglévő szabályok összevonását értjük. Mivel a "színpad" és a "legjobb" fogalmak különbözőképpen definiálhatók, számos mohó következtetési algoritmust hoztak létre.

A kontextusmentes nyelvtanok létrehozására szolgáló alábbi algoritmusok minden karakter beolvasása után döntenek:

A következő algoritmusok a környezetmentes nyelvtanok generálására először beolvassák a teljes karaktersorozatot, majd elkezdenek döntéseket hozni:

Distributív tanulás

Az újabb megközelítések a disztributív tanuláson alapulnak . Az ezeket a megközelítéseket használó algoritmusokat kontextusmentes nyelvtanok és enyhén kontextusérzékeny nyelvek tanítására alkalmazták , és helyesnek és hatékonynak bizonyultak e nyelvtanok nagy alosztályaiban [7] [8]

Mintanyelvek tanítása

Angluin a mintát a következőképpen definiálta : "az Σ ábécé állandó karakterei és egy diszjunkt halmaz változó karakterei ". Az ilyen minták nyelve az összes nem üres alappélda halmaza, vagyis minden olyan karakterlánc, amelyet úgy kapunk, hogy a változó karaktereket megfelelően helyettesítjük állandó karakterekből álló nem üres karakterláncokkal [1. megjegyzés] . Egy mintát akkor mondunk leírónak egy véges karakterlánchalmazt, ha a nyelve minimális (adott halmazba foglalva) az összes mintanyelv között, beleértve a bemeneti halmazt is.

Angluin adott egy polinomiális algoritmust , amely egy adott bemeneti sorkészletből az összes leíró mintát egyetlen változóból számítja ki x[2. megjegyzés] . Ebből a célból egy automatát épít, amely az összes lehetséges releváns mintát reprezentálja. A szóhosszúságra vonatkozó kifinomult argumentumokkal, amelyek csak egyetlen változótól függenek x, az állapotok száma jelentősen csökkenthető [9] .

Erlebach és munkatársai megadták az Angluin-féle minta-tanuló algoritmus egy hatékonyabb változatát, valamint az algoritmus párhuzamos változatát [10] .

Arimura és munkatársai kimutatták, hogy a korlátozott mintákból nyert nyelvek egy osztálya polinomiális időben tanítható [11] .

Mintaelmélet

( eng.  pattern theory ) , amelyet Ulf Grenander [12] fogalmazott meg , egy matematikai formalizmus a világgal kapcsolatos ismeretek minták formájában történő leírására. A mesterséges intelligencia javasolt megközelítésének különbsége atöbbitől az, hogy nem a mintafelismerésre és osztályozásra szolgáló algoritmusok és gépek meghatározásával kezdődik. A módszer inkább egy szókincset ír elő a minták pontos nyelvezetű megfogalmazásához és átírásához.

Az új algebrai nyelv mellett egy új statisztikai megközelítést vezettek be, amelynek célja:

Alkalmazások

A nyelvtani indukció elveit alkalmazták a természetes nyelvi feldolgozás más aspektusaiban , és (sok más feladat mellett) a természetes nyelvészlelésben [13] , a példaalapú gépi fordításban [14] , a morfémaelemzésben és a helynevek eredete. A nyelvtani indukciót veszteségmentes tömörítésre [15] és statisztikai következtetésekre is használták a minimális hosszúságú üzenetek és a minimális hosszúságú leírások elvein keresztül . A nyelvtani indukciót a nyelvelsajátítás néhány valószínűségi modelljében is alkalmazták [16] .

Lásd még

Jegyzetek

  1. Az a mintanyelv, amelyben ugyanaz a változó legalább kétszer előfordul, a pumpálási lemma miatt nem szabályos .
  2. A ↑ x többször előfordulhat, de nem lehet más változóy
  1. Higuera 12. , 2010 .
  2. Angluin, 1987 , p. 87–106.
  3. Fu, 1977 .
  4. Fu, 1982 .
  5. 1 2 3 Duda, Hart, Stork, 2001 .
  6. D'Ulizia, Ferri, Grifoni, 2011 , p. 1–27.
  7. Clark, Eyraud, 2007 .
  8. Yoshinaka, 2011 , p. 1821-183.
  9. Angluin, 1980 , p. 46–62.
  10. Erlebach, Rossmanith, Stadtherr, Steger, Zeugmann, 1997 , p. 260–276.
  11. Arimura, Shinohara, Otsuki, 1994 , p. 649–660.
  12. Grenander, Miller, 2007 .
  13. Miller, Bobrow, Schwartz, 1994 .
  14. Barna, 2001 .
  15. Csernyavszkij, Ladner, 2004 .
  16. Chater, Manning, 2006 , p. 335-344.

Irodalom