A beszédkorpusz ( hangkorpusz ) hangfájlok és szövegek átiratainak adatbázisa , egyfajta szövegkorpusz . A beszédtechnológiákban a beszédkorpusokat többek között akusztikus modellek létrehozására használják (amelyek aztán beszédfelismerő motorokban használhatók ). A nyelvészetben a beszédkorpusokat a fonetika , a dialektológia , a társalgási elemzés és más területek kutatására használják .
A beszédkorpusoknak két típusa van:
1. A jól olvasható szövegek alapjai, beleértve:
2. A spontán beszéd hangfelvételeinek alapjai – beleértve:
A beszédkorpusok egy speciális fajtája a nem anyanyelvi beszélők által elmondott szövegek adatbázisa, amelyek idegen akcentusú beszédet tartalmaznak .
természetes nyelvi feldolgozás | |
---|---|
Általános meghatározások | |
Szövegelemzés |
|
Hivatkozás |
|
Gépi fordítás |
|
Azonosítás és adatgyűjtés | |
Tematikus modell | |
Peer review |
|
Természetes nyelvű felület |