Természetes nyelvi feldolgozás
Az oldal jelenlegi verzióját még nem ellenőrizték tapasztalt közreműködők, és jelentősen eltérhet a 2019. december 23-án felülvizsgált
verziótól ; az ellenőrzések 15 szerkesztést igényelnek .
A Natural Language Processing ( NLP ) a mesterséges intelligencia és a matematikai nyelvészet általános területe . A természetes nyelvű szövegek számítógépes elemzésének és szintézisének problémáit tanulmányozza . A mesterséges intelligenciával kapcsolatban az elemzés a nyelv megértését, a szintézis pedig az írástudó szöveg generálását jelenti .
Feladatok és korlátozások
Elméletileg egy természetes nyelvű interfész felépítése a számítógépek számára nagyon vonzó cél. Az olyan korai rendszerek, mint az SHRDLU , amelyek korlátozott "blokkok világával" dolgoztak, és korlátozott szókincset használtak, rendkívül jól néztek ki, és inspirálták alkotóikat. Az optimizmus azonban gyorsan elhalványult, amikor ezek a rendszerek szembesültek a való világ összetettségével és kétértelműségével.
Néha a természetes nyelv megértését is figyelembe veszik[ ki? ] A mesterséges intelligencia egy teljes feladat, mert egy élő nyelv felismeréséhez a minket körülvevő világ rendszerének hatalmas ismerete és a vele való interakció képessége szükséges. A „ megért ” szó jelentésének meghatározása a mesterséges intelligencia egyik fő feladata. .
Megértési nehézségek
Oroszul
A megértés minősége sok tényezőtől függ: nyelvtől, nemzeti kultúrától, magától a beszélgetőpartnertől stb. Íme néhány példa azokra a nehézségekre, amelyekkel a szövegértési rendszerek szembesülnek.
- Az anaforák megnyitásának nehézségei (a névmások használatánál a jelentés felismerése): a "A banánt a majmoknak adtuk, mert éhesek" és a "A banánt a majmoknak adtuk, mert túlérettek" mondatok szintaktikai felépítése hasonló. Az egyikben a névmás a majmokra, a másikban a banánra vonatkozik. A helyes megértés attól függ, hogy a számítógép tud-e arról, hogy milyenek lehetnek a banánok és a majmok.
- A szabad szórend a mondat egészen más értelmezéséhez vezethet: „A lét határozza meg a tudatot” – mi mit határoz meg?
- Az orosz nyelvben a szabad sorrendet ellensúlyozza a fejlett morfológia , a funkciószavak és az írásjelek , de a legtöbb esetben ez további problémát jelent a számítógép számára.
- A neologizmusok megtalálhatók a beszédben , például az "Ötven rubel" ige - azaz küldjön 50 rubelt. A rendszernek képesnek kell lennie arra, hogy megkülönböztesse az ilyen eseteket a gépelési hibáktól , és helyesen értelmezze azokat.
- A homonimák helyes értelmezése egy másik probléma. A beszédfelismerésben többek között felmerül a fonetikus homonimák problémája. A "Szürke farkas találkozott egy vörös rókával egy mély erdőben " kifejezésben a kiemelt szavak ugyanúgy hallatszanak, és anélkül, hogy tudnánk, ki a süket és ki a vörös, nem teheti meg (azon túl, hogy a róka lehet vörös és az erdő lehet süket, az erdő vörös is (jellemző, jelen esetben az erdőben a lombozat uralkodó színét jelöli), míg a róka lehet süket, ami az előzőből adódó további problémát okoz, bár részben kompenzálja a morfológia - a melléknevek ebben a mondatban egyértelműen eltérő neműek).
Feladatok osztályozása
Népszerű problémák: [1] [2] [3]
- Beszédfelismerés
- Szövegelemzés
- Szöveggenerálás
- beszédszintézis
Elemzési és szintézis feladatai a komplexumban:
Általános besorolás:
- Szöveg kategorizálása
- Karaktersorozatok osztályozása
- Elnevezésű entitásfelismerés
- A szó beszédrészeinek meghatározása
- Kifejezés felismerés
- Információ kinyerése szövegből
- Szintaxis annotáció
- Szemantikai annotáció
- Szöveggenerálás
- Szöveggenerálás felismert beszéd alapján
- Gépi fordítás
- A szöveg általánosítása
Szoftver
Lásd még
Jegyzetek
- ↑ Shervin Minaee, Nal Kalchbrenner, Erik Cambria, Narjes Nikzad, Meysam Chenaghlu. Deep Learning Based Text Classification: A Comprehensive Review // arXiv:2004.03705 [cs, stat]. — 2020-04-05. Archiválva az eredetiből: 2020. június 24.
- ↑ Tom Young, Devamanyu Hazarika, Soujanya Poria, Erik Cambria. A mélytanuláson alapuló természetes nyelvi feldolgozás legújabb trendjei // arXiv:1708.02709 [cs]. — 2018-11-24. Archiválva : 2020. május 6.
- ↑ Prof. Jason Eisner. Automatikus szövegfeldolgozási tanfolyam (angol) ? . Letöltve: 2020. május 7. Az eredetiből archiválva : 2020. május 13. (határozatlan)
Linkek
Szótárak és enciklopédiák |
|
---|
Bibliográfiai katalógusokban |
|
---|