A szavak vektoros ábrázolása

A vektoros ábrázolás a nyelvi modellezés és a reprezentációs képzés  különféle megközelítéseinek általános elnevezése a természetes nyelvi feldolgozásban, amelyek célja, hogy a szótárban sokkal kisebb számú szót tartalmazó vektorszótárból származó szavakat (és esetleg kifejezéseket) párosítsanak. A vektoros reprezentációk elméleti alapja a disztributív szemantika .

Számos módszer létezik egy ilyen leképezés elkészítésére. Így neurális hálózatokat [1] , szóko-előfordulási mátrixokra alkalmazott dimenziócsökkentési módszereket [2] és szóemlítések kontextusán tanult explicit reprezentációkat (explicit reprezentációkat) [3] használnak .

Igazolták[ kitől? ] , hogy a szavak és kifejezések vektoros ábrázolása jelentősen javíthatja az automatikus természetes nyelvi feldolgozás egyes módszereinek (például az elemzés [4] és a hangulatelemzés [5] ) minőségét.

Linkek

  1. Mikolov, Tomas; Sutskever, Ilja; Chen, Kai; Corrado, Greg & Dean, Jeffrey (2013), Szavak és kifejezések elosztott ábrázolásai és kompozíciói, arΧiv : 1310.4546 [cs.CL]. 
  2. Lebret, Rémi & Collobert, Ronan (2013), Word Emdeddings Hellinger PCA-n keresztül, arΧiv : 1312.5542 [cs.CL]. 
  3. Levy, Omer; Goldberg, Yoav. Linguistic Regularitys in Sparse and Explicit Word Representations  //  Proceedings of the Eighteenth Conference on Computational Natural Language Learning, Baltimore, Maryland, USA, június. Számítógépes Nyelvészeti Egyesület. 2014: folyóirat.
  4. Socher, Richard; Bauer, John; Manning, Christopher; Ng, Andrew. Elemzés kompozíciós vektoros nyelvtanokkal  (határozatlan)  // Az ACL konferencia előadásai. 2013.
  5. Socher, Richard; Perelygin, Alex; Wu, Jean; Chuang, Jason; Manning, Chris; Ng, András; Potts, Chris. Rekurzív mély modellek a szemantikai kompozícióhoz egy érzelemfabank felett  //  Konferencia az empirikus módszerekről a természetes nyelvi feldolgozásban : folyóirat.