Lemma (nyelvészet)

A lemma ( angolul  lemma ) a szó kezdeti, szótári alakja [1] . Az orosz nyelvben a főnevek és melléknevek esetében ez a névelő egyes szám alakja, az igék és igealakok esetében ez a főnévi alak. Alapfogalom a korpusznyelvészet és az automatikus természetes nyelvi feldolgozás területén . A szövegszavak lemmákká történő automatikus redukálásának folyamatát lemmatizációnak nevezzük .

Például a „ Kora reggel Mila anyja szappannal mosta a keretet ” kifejezés a lemmatizálás után így fog kinézni: reggel, korán, anya, Mila, mosás, keret, szappan .

Lemma a korpusznyelvészetben

A korpusznyelvészetben a lemma szerinti keresés összefüggéseket ad egy adott lexéma összes szóalakjának említésével . Például, ha a lemma cat kifejezésre keres , olyan kontextusokat ad vissza, amelyek tartalmazzák a cat , cat, cat, cats, cats stb. pontosan ez a nyelvtani alakja a datuvus eset egyes számának [2] .

Lemma az információkeresésben és a SEO-ban

Jegyzetek

  1. Bolshakova E. I., Vorontsov K. V., Efremova N. E., Klyshinsky E. S., Lukashevich N. V., Sapin A. S. Automatikus természetes nyelvi szövegfeldolgozás és adatelemzés: tankönyv. juttatás . - M. : NRU HSE, 2017. 2022. január 21-i archivált példány a Wayback Machine -nél
  2. Lemma keresési leírás  (angol)  ? . vázlatos motor . Letöltve: 2021. március 31. Az eredetiből archiválva : 2021. március 3.
  3. Lemmatizáció a SEO-ban  (orosz)  ? .

Irodalom