A beszédképzés akusztikai elmélete az akusztikus fonetika egy része , amely a hangcsatornában előforduló aerodinamikai és akusztikai folyamatokat vizsgálja . E folyamatok megértése fordított következtetések lehetőségét teremti meg: az akusztikától az artikulációs képig. A beszédprodukció akusztikájának ismerete is szükséges a fizikai adatok helyes értelmezéséhez, mivel ez lehetővé teszi a beszédjel artikuláció által előrejelzett akusztikai tulajdonságainak elkülönítését a váratlanoktól, ami viszont elgondolkodtat az ilyen jelenségek okain. akusztikus meglepetések. A fonetikai tudomány számára fontos, hogy a beszédprodukció akusztikai elmélete magyarázó, tudományos státuszt adjon a fizikai beszédadatok értelmezésének. Az akusztikus beszédelmélet alapjait a 19. században Hermann von Helmholtz német fizikus fektette le . A 20. században ezen a területen Gunnar Fant és James Flanagan a legfontosabb munkái .
A gerjesztési függvény beszédjel-konvolúciója lineáris szűrők válaszaival. A gerjesztési funkció lehet zaj, amely lamináris, turbulens folyamatként vagy hangként jelentkezik. Az emberi beszéd hangmagassági frekvenciája 90 Hz-ig terjed. 300 Hz-ig, és meghatározza a dallamát. Az alaphangfrekvencia átlagértéke minden beszélőnél eltérő, a férfihangok általában 90-180 Hz, míg a női és gyermekhangok 185-300 Hz-esek. A glottis kattanását olyan harmonikusok jelentik, amelyek az alaphang többszörösei. A felharmonikusok energiaszintje a frekvencia növekedésével exponenciálisan csökken. A beszédjel felső határfrekvenciája, körülbelül 18 kHz. Az információátviteli útvonalakhoz azonban a felső határfrekvencia 3500 Hz-ig elegendő, bár ilyen frekvenciasávban számos fonéma nem hallható. Amikor a hanghártya kattanása kölcsönhatásba lép a hangcsatorna rezonáns üregeivel, az alaptónus többszörösei felharmonikusok rezonálnak, és a spektrumban kialakuló lokális maximumok a Flanagan-modell szerint energiakoncentrációs területeket képeznek, melyek ún. formánsok. Általánosan elfogadott, hogy négy formáns magánhangzó fonémákat alkot, dinamikus időbeli változásaikat (formánssávok), amplitúdójukat és frekvenciájukat pedig mássalhangzókat alkotnak, mindkettőt fonémáknak nevezzük. A formánsok minőségi tényezője a beszéd egyik statikus jellemzője, és jellemezheti a beszélőt. A zaj által gerjesztett fonémák nem énekelhetők, míg a hanggal gerjesztett fonémák énekelhetők. A beszédinformáció zajálló kódolásának egyik egyedi mechanizmusa a magánhangzó fonémák allofoninizációja, valójában ezek a formánssávok pályáinak változásai, figyelembe véve a magánhangzó utáni előző és következő fonémákat. Az orosz beszédben 43 fonéma van, és csak két "Ж" és "З" keletkezik egyszerre hang és zaj hatására.
Fonetika és fonológia | |||||
---|---|---|---|---|---|
Alapfogalmak |
| ||||
Szekciók és tudományágak |
| ||||
Fonológiai fogalmak | |||||
Személyiségek | |||||
|