Számítógépes nyelvészet

Az oldal jelenlegi verzióját még nem ellenőrizték tapasztalt közreműködők, és jelentősen eltérhet a 2021. december 21-én felülvizsgált verziótól ; az ellenőrzések 2 szerkesztést igényelnek .

A számítógépes nyelvészet (más néven: matematikai vagy számítógépes nyelvészet , angol  computational linguistics ) egy tudományos irányzat az emberekben és állatokban zajló intellektuális folyamatok matematikai és számítógépes modellezése területén mesterséges intelligencia -rendszerek létrehozásakor , amelynek célja matematikai modellek használata a természetes nyelvek leírására .

A számítógépes nyelvészet átfedésben van a természetes nyelvi feldolgozással . Ez utóbbiban azonban nem az absztrakt modelleken van a hangsúly, hanem a számítógépes rendszerek nyelvének leírására és feldolgozására alkalmazott módszereken.

A számítástechnikai nyelvészek tevékenységi területe a nyelvi információk feldolgozására szolgáló algoritmusok és alkalmazási programok fejlesztése.

Eredet

A matematikai nyelvészet a mesterséges intelligencia tudományának egyik ága . Története az Amerikai Egyesült Államokban kezdődött az 1950-es években. A tranzisztor feltalálásával és a számítógépek új generációjának megjelenésével, valamint az első programozási nyelvekkel megkezdődtek a gépi fordítással kapcsolatos kísérletek , különösen az orosz tudományos folyóiratok esetében. Az 1960-as években hasonló tanulmányokat végeztek a Szovjetunióban (például egy cikk az oroszról örményre fordításról a "Kibernetika problémái" című gyűjteményben 1964 -ben ). A gépi fordítás minősége azonban még mindig messze elmarad az emberi fordítás minőségétől. 2021-ben a Google fordító gépi fordításának minősége már nem volt rosszabb, mint az emberi fordítás minősége. .

1958. május 15. és május 21. között az I. Moszkvai Állami Idegennyelvi Intézetben rendezték meg az első szövetségi gépi fordítási konferenciát . A Szervező Bizottságot V. Yu. Rozentsveig és a Szervező Bizottság ügyvezető titkára, G. V. Chernov vezette . A konferencia teljes programja a „Gépi fordítás és alkalmazott nyelvészet” című gyűjteményben található. 1, 1959 (más néven Bulletin of the Machine Translation Association 8. sz.). Amint V. Yu. Rozentsweig visszaemlékezik , a konferenciakivonatok megjelent gyűjteménye az Egyesült Államokba került, és ott nagy benyomást tett.

1959 áprilisában Leningrádban megtartották az első szövetségi matematikai nyelvészeti konferenciát, amelyet a Leningrádi Egyetem és az Alkalmazott Nyelvészeti Bizottság hívott össze. A konferencia főszervezője N. D. Andreev volt . Számos kiemelkedő matematikus vett részt a találkozón, különösen S. L. Sobolev , L. V. Kantorovich (később Nobel-díjas) és A. A. Markov (az utolsó kettő beszélt a vitában). A konferencia nyitónapján V. Yu. Rozentsveig vitaindító beszédet tartott: „A fordítás általános nyelvelmélete és a matematikai nyelvészet”.

A számítógépes nyelvészet irányai

A számítógépes nyelvészet feladatai és irányai a következők:

  1. Korpusznyelvészet , elektronikus szövegkorpusok létrehozása és használata.
  2. Elektronikus szótárak , tezauruszok , ontológiák készítése . Például a Lingvo . A szótárakat például automatikus fordításra, helyesírás-ellenőrzésre használják.
  3. Szövegek automatikus fordítása . A Promt népszerű az orosz fordítók körében . Az ingyenesek között ismert a Google fordító fordítója .
  4. Tények automatikus kinyerése szövegből (információ kinyerése) ( angol  fact extraction, text mining )
  5. Automatikus hivatkozás ( eng.  automatikus szövegösszegzés ). Ezt a funkciót például a Microsoft Word tartalmazza .
  6. Tudásmenedzsment rendszerek kiépítése . Lásd a szakértői rendszereket .
  7. Kérdés-felelet rendszerek készítése ( angol  question answering systems ).

Főbb egyesületek és konferenciák

Lásd még

Jegyzetek

  1. ACL (lefelé irányuló kapcsolat) . Letöltve: 2010. szeptember 15. Az eredetiből archiválva : 2010. szeptember 4.. 
  2. Párbeszéd 2020 / Számítógépes Nyelvészeti Konferencia . www.dialog-21.ru Letöltve: 2019. december 27. Az eredetiből archiválva : 2019. december 26..

Linkek