A szavak vektoros ábrázolása
A vektoros ábrázolás a nyelvi modellezés és a reprezentációs képzés különféle megközelítéseinek általános elnevezése a természetes nyelvi feldolgozásban, amelyek célja, hogy a szótárban sokkal kisebb számú szót tartalmazó vektorszótárból származó szavakat (és esetleg kifejezéseket) párosítsanak. A vektoros reprezentációk elméleti alapja a disztributív szemantika .
Számos módszer létezik egy ilyen leképezés elkészítésére. Így neurális hálózatokat [1] , szóko-előfordulási mátrixokra alkalmazott dimenziócsökkentési módszereket [2] és szóemlítések kontextusán tanult explicit reprezentációkat (explicit reprezentációkat) [3] használnak .
Igazolták[ kitől? ] , hogy a szavak és kifejezések vektoros ábrázolása jelentősen javíthatja az automatikus természetes nyelvi feldolgozás egyes módszereinek (például az elemzés [4] és a hangulatelemzés [5] ) minőségét.
Linkek
- ↑ Mikolov, Tomas; Sutskever, Ilja; Chen, Kai; Corrado, Greg & Dean, Jeffrey (2013), Szavak és kifejezések elosztott ábrázolásai és kompozíciói, arΧiv : 1310.4546 [cs.CL].
- ↑ Lebret, Rémi & Collobert, Ronan (2013), Word Emdeddings Hellinger PCA-n keresztül, arΧiv : 1312.5542 [cs.CL].
- ↑ Levy, Omer; Goldberg, Yoav. Linguistic Regularitys in Sparse and Explicit Word Representations // Proceedings of the Eighteenth Conference on Computational Natural Language Learning, Baltimore, Maryland, USA, június. Számítógépes Nyelvészeti Egyesület. 2014: folyóirat.
- ↑ Socher, Richard; Bauer, John; Manning, Christopher; Ng, Andrew. Elemzés kompozíciós vektoros nyelvtanokkal (határozatlan) // Az ACL konferencia előadásai. 2013.
- ↑ Socher, Richard; Perelygin, Alex; Wu, Jean; Chuang, Jason; Manning, Chris; Ng, András; Potts, Chris. Rekurzív mély modellek a szemantikai kompozícióhoz egy érzelemfabank felett // Konferencia az empirikus módszerekről a természetes nyelvi feldolgozásban : folyóirat.