Felületi elemzés

A felületi elemzés ( angol. sekély parsing, chunking, light parsing ) egy mondatelemzési módszer , amelyben a mondat alkotórészeit (főnevek, igék, melléknevek stb.) először azonosítják, majd magasabb rendű elemekké kapcsolják amelyek nyelvtani jelentéssel bírnak ( névi csoportok vagy kifejezések, igecsoportok stb.).

Míg az egyszerű felületelemző algoritmusok elemi keresési mintákat (pl. reguláris kifejezéseket ) használva kapcsolják össze az alkotóelemeket , addig a gépi tanuláson alapuló megközelítések ( osztályozók , témamodellezés stb.) figyelembe vehetik a kontextuális információkat, és olyan töredékeket tudnak alkotni, amelyek jobban tükrözik a szemantikai kapcsolatokat főszavak [1] . Így ezek a továbbfejlesztett módszerek azt a problémát oldják meg, hogy az elemi összetevők kombinációja a legmagasabb szinten különböző jelentéssel bírhat a mondat kontextusától függően.

A számítógépes nyelvek lexikális elemzéséhez hasonlóan ezt a technikát széles körben használják a természetes nyelvi feldolgozásban .

Sekély szerkezeti hipotézisnek nevezett , arra szolgál, hogy megmagyarázza, miért nem sikerül a második nyelvet tanulóknak gyakran helyesen elemeznie az összetett mondatokat [2] .

Lásd még

elemzése
Szemantikai szerepek jelölése
Elnevezett entitás felismerés

Jegyzetek

↑ Jurafsky, Daniel. Beszéd és nyelvi feldolgozás / Daniel Jurafsky, James H. Martin. - Szingapúr: Pearson Education Inc., 2000. - P. 577-586.
↑ Clahsen, Felser, Harald, Claudia (2006). „Nyelvtani feldolgozás nyelvtanulókban” . Alkalmazott pszicholingvisztika . 27 , 3-42. DOI : 10.1017/S0142716406060024 .

Irodalom

NP Chunking (a technika állása) . Számítógépes Nyelvészeti Egyesület . Hozzáférés dátuma: 2016. január 30. Az eredetiből archiválva : 2016. március 4. (határozatlan) (Angol)
Parsing By Chunks , Kluwer Academic Publishers, 1991, p. 257–278 , < http://www.vinartus.net/spa/90e.pdf > Archiválva: 2020. november 6. aWayback Machine. (Angol)

Linkek

Apache OpenNLP archiválva : 2012. április 13. a Wayback Machine -nél Az OpenNLP egy sekély értelmező megvalósítását tartalmazza.
GATE általános architektúra szövegszerkesztéshez Archiválva : 2012. május 2. a Wayback Machine -nél A GATE felületelemző megvalósítását
Felületelemzés archiválva : 2021. március 14. a Wayback Machine NLTK -nál
A bemutató archiválva : 2015. október 31. az Illinois Shallow Parser Wayback Machine -jében

természetes nyelvi feldolgozás
Általános meghatározások	Szövegkorpusz beszédkorpusz Hagyd abba a szavakat zsák szavakat AI teljesség N-gramm Biggram titkosítás trigram
Szövegelemzés	Szöveg szegmentálása Részleges jelölés Felületi elemzés Összetett szövegszerkesztés Kollokációk kibontása eredő Lemmatizálás Elnevezett entitás felismerés Koreferencia felbontás Szöveges hangulatelemzés Fogalom kinyerése elemzése A lexikális poliszémia feloldása terminológia kivonat Információ kinyerése Nyelvi azonosítás Esetmeghatározás
Hivatkozás	Mondatok kibontása Absztrakt generáció Több dokumentumra való hivatkozás Szöveg egyszerűsítés
Gépi fordítás	automatizált Hibrid nyelvközi Szabály alapú Példák alapján Szótár alapú Átalakulás alapján idegi Statisztikai Szinkron
Azonosítás és adatgyűjtés	Beszédfelismerés beszédszintézis Optikai karakter felismerés Szöveggenerálás
Tematikus modell	Pachinko elhelyezés Látens Dirichlet elhelyezés Látens szemantikai elemzés
Peer review	Az esszék automatizált értékelése Concordancer Prediktív szövegbevitel Nyelvtan-ellenőrző Helyesírás-ellenőrző Szintaxis találgatás
Természetes nyelvű felület	virtuális asszisztens Virtuális beszélgetőpartner Kérdés-felelet rendszer Hang interfész Interaktív irodalom