A felületi elemzés ( angol. sekély parsing, chunking, light parsing ) egy mondatelemzési módszer , amelyben a mondat alkotórészeit (főnevek, igék, melléknevek stb.) először azonosítják, majd magasabb rendű elemekké kapcsolják amelyek nyelvtani jelentéssel bírnak ( névi csoportok vagy kifejezések, igecsoportok stb.).
Míg az egyszerű felületelemző algoritmusok elemi keresési mintákat (pl. reguláris kifejezéseket ) használva kapcsolják össze az alkotóelemeket , addig a gépi tanuláson alapuló megközelítések ( osztályozók , témamodellezés stb.) figyelembe vehetik a kontextuális információkat, és olyan töredékeket tudnak alkotni, amelyek jobban tükrözik a szemantikai kapcsolatokat főszavak [1] . Így ezek a továbbfejlesztett módszerek azt a problémát oldják meg, hogy az elemi összetevők kombinációja a legmagasabb szinten különböző jelentéssel bírhat a mondat kontextusától függően.
A számítógépes nyelvek lexikális elemzéséhez hasonlóan ezt a technikát széles körben használják a természetes nyelvi feldolgozásban .
Sekély szerkezeti hipotézisnek nevezett , arra szolgál, hogy megmagyarázza, miért nem sikerül a második nyelvet tanulóknak gyakran helyesen elemeznie az összetett mondatokat [2] .
természetes nyelvi feldolgozás | |
---|---|
Általános meghatározások | |
Szövegelemzés |
|
Hivatkozás |
|
Gépi fordítás |
|
Azonosítás és adatgyűjtés | |
Tematikus modell | |
Peer review |
|
Természetes nyelvű felület |