Az orosz nyelv gépalapja

Az orosz nyelv  gépalapja egy projekt az orosz nyelv nagy reprezentatív korpuszának létrehozására . Az MFRL tapasztalatait 2004 óta használják fel az Orosz Nyelv Nemzeti Korpuszának fejlesztésében .

Az MFRN létrehozásának programja

Az Orosz Nyelv Gépalapjának Osztályát 1985-ben hozták létre A. P. Ershov akadémikus kezdeményezésére egy 1983-ban megtartott különleges szövetségi konferencia után [1] A Szovjetunió Tudományos Akadémia levelező tagja, Yu.N. tudományos kutatások és alkalmazott fejlesztések az Orosz Nyelv Gépi Alapjának létrehozásáról 1996-2000-re és a kutatás informatizálására.

Az Orosz Nyelv Gépalapjának létrehozásában (1986-1990) több mint 40 együttműködő szervezet vett részt, köztük Moszkva , Leningrád , Harkov , Grodno , Sziktivkar és Szaratov egyetem.

A tudományos kutatás és az alkalmazott fejlesztések komplex informatizálását az orosz tudományban a következőképpen értelmezték:

A program megvalósítása (1985-1992)

Az Orosz Nyelv Gépi Alapjának Osztálya (részben a társvégrehajtók részvételével) 8 éves munkája során a következőket végezte:

 — UNILEX-T gyakorisági szótárak, szóindexek (szövegekhez tartozó szavak indexei) és konkordanciák készítéséhez és ezekkel való munkához [5]  - UNILEX-D szótári adatbázisok létrehozásához és kezeléséhez. [6] Az orosz nyelv automatikus szintaxisszótára Automatikus szótár orosz szinonimák Az orosz nyelv szótárának automatikus változata , S. I. Ozhegov Automatikus szótár az igevezérlés oroszul. [7]

Az Orosz Nyelvi Pénzügyminisztérium Osztályának tevékenysége (1992-1998)

Az UNILEX nyelvi adatfeldolgozó rendszerek teljes körű tesztelése a 20. századi Helyesírási Szótár és Versszótár elkészítésében való részvétel révén.

Új források felgyorsult felhalmozódása az újságok elektronikus kiadásain és az orosz klasszikus irodalom szkennelésén alapulva. Az orosz nyelv Gépi Alap forrásainak teljes archívuma ma már több mint 100 millió szóhasználatból áll;

Munka F. M. Dosztojevszkij nyelvének szótárán [8] .

Forrásfelhalmozás az orosz próza széleskörű elosztási-statisztikai vizsgálata céljából a 19. század utolsó harmadában. és a 20. század végi újságok.

Distributív-statisztikai adatok gyűjtése, elemzése, összefoglaló adatok publikációinak elkészítése [9] .

Az orosz nyelvi MF fejlesztésére irányuló tevékenységek elemzése

Az orosz nyelv MF fejlesztési koncepciója (1983)

Az MFRN létrehozásának modern feladatai

Lásd még

Jegyzetek

  1. A könyvben megjelent anyagok: Az orosz nyelv gépi alapja: Ötletek és ítéletek, M .: Nauka , 1989
  2. Megjelent V. M. Andryushchenko könyvében Az orosz nyelvi gépalap koncepciója és felépítése, M .: 1989
  3. Megjelent az Orosz nyelvi Gépalap terminológiai adatbankjának nyelvi koncepciója (projekt) című könyvben, szerk. A. S. Gerda, M.: 1989
  4. a Forrásarchívum tartalmát az Orosz Nyelv Gépalap Értesítője 2009. évf. egy; mára nagyon elavult, és az archívum jelenlegi állapotát itt tükrözi a legjobban: [ 1] Archiválva : 2007. szeptember 13. a Machine  Wayback Wayback Machine -nél
  5. Fejlesztő Zh. G. Anoshkina
  6. L. I. Kolodyazhnaya fejlesztő
  7. Leírások az Orosz Nyelv Gépalap Értesítőjében, 1. köt. 1-3).
  8. Yu. N. Karaulov irányítása alatt
  9. Egy ilyen publikáció első eredménye A. Ya. Shaikevich, V. M. Andryushchenko és N. A. Rebetskaya „F. M. Dosztojevszkij nyelvének statisztikai szótára” című könyve.
  10. ilyen feldolgozásra mutat be példát a Dosztojevszkij nyelvének statisztikai szótára). V. M. Andryuscsenko

Irodalom

Linkek