A Speech Application Programming Interface (SAPI) egy COM - alapú alkalmazásprogramozási interfész beszédfelismerésre és -szintézisre.
A beszédfelismerés a kimondott szavak nyomtatott szöveggé alakításának folyamata. A beszédfelismerés a következőket tartalmazza:
A felismerő (szövegfelismerő motor) iteratív módon összehasonlítja a felismert szöveget az alkalmazás nyelvtani szabályaival, és ha a szöveg egy sor szabálynak egyezik, létrehoz egy XML kimeneti adatfolyamot a Semantic Markup Language (SML) segítségével . A kimeneti adatfolyam tartalmazza a felismert szöveget, a helyes felismerési valószínűségeket, és tartalmazhat szemantikai értelmezési jelöléssel hozzárendelt szemantikai értékeket . A felismert szöveget gyakran használják adatbevitelre diktálás segítségével, valamint alkalmazások beszédparancsokkal történő vezérlésére.
A nyelvtani szabályok mérete korlátozza a szövegfelismerési képességet. A legtöbb diktálást támogató program egy adott felhasználó beszédmintáira van hangolva a legpontosabb felismerés érdekében. A beszédparancs vezérlési mód könnyebben megvalósítható, mivel a nyelvtani szabályok tartalma az elérhető parancsokra korlátozódik [1] .
A beszédszintézis a szöveg kimondott szavakká alakításának folyamata. A beszédszintézis a következőket tartalmazza:
A szövegfelolvasó motorok a két hangszintézis módszer egyikét használhatják:
Bemutatkozik a Computer Speech Technology (angol) (nem elérhető link) . MSDN könyvtár . Microsoft (2012). Letöltve: 2012. július 24. Az eredetiből archiválva : 2012. szeptember 29..
beszédszintézis | |
---|---|
Saját szoftver |
|
ingyenes szoftver |
|
Autó |
|
Alkalmazások |
|
Protokollok | Beszédszintézis jelölőnyelv |
Fejlesztők / Kutatók |
|
Folyamat |
|