A lemma ( angolul lemma ) a szó kezdeti, szótári alakja [1] . Az orosz nyelvben a főnevek és melléknevek esetében ez a névelő egyes szám alakja, az igék és igealakok esetében ez a főnévi alak. Alapfogalom a korpusznyelvészet és az automatikus természetes nyelvi feldolgozás területén . A szövegszavak lemmákká történő automatikus redukálásának folyamatát lemmatizációnak nevezzük .
Például a „ Kora reggel Mila anyja szappannal mosta a keretet ” kifejezés a lemmatizálás után így fog kinézni: reggel, korán, anya, Mila, mosás, keret, szappan .
A korpusznyelvészetben a lemma szerinti keresés összefüggéseket ad egy adott lexéma összes szóalakjának említésével . Például, ha a lemma cat kifejezésre keres , olyan kontextusokat ad vissza, amelyek tartalmazzák a cat , cat, cat, cats, cats stb. pontosan ez a nyelvtani alakja a datuvus eset egyes számának [2] .