A pszichoakusztika egy tudományos tudományág , amely az emberi hangérzékelés pszichológiai és fiziológiai jellemzőit vizsgálja .
Pusztán zenei szempontból a pszichoakusztika fő feladatai a következők:
Számos akusztikai és audiojel-feldolgozó alkalmazásban tudni kell, mit hallanak az emberek . A légnyomáshullámok által keltett hang korszerű berendezésekkel pontosan mérhető. Azonban nem könnyű megérteni, hogyan fogadják és jelenítik meg ezeket a hullámokat az agyunkban. A hang egy folyamatos analóg jel , amely (feltételezve, hogy a levegőmolekulák végtelenül kicsik) elméletileg végtelen mennyiségű információt hordozhat (mivel végtelen számú rezgés létezik, amelyek amplitúdó- és fázisinformációt tartalmaznak).
Az észlelési folyamatok megértése lehetővé teszi a tudósok és mérnökök számára, hogy a hallás képességeire összpontosítsanak, és figyelmen kívül hagyják más rendszerek kevésbé fontos képességeit. Azt is fontos megjegyezni, hogy a „mit hall az ember” kérdés nemcsak a fül fiziológiai képességeinek kérdése , hanem sok tekintetben az észlelés pszichológiájának kérdése is .
Egy személy névlegesen 16 és 20 000 Hz közötti hangokat hall . A felső határ, az alsó határhoz hasonlóan, az életkorral csökken. A legtöbb felnőtt nem hallja a 16 kHz feletti hangot. Maga a fül nem reagál a 20 Hz alatti frekvenciákra, de ezek a tapintáson keresztül érzékelhetők .
Az érzékelt hangok köre hatalmas. De a fül dobhártyája csak a nyomásváltozásokra érzékeny . A hangnyomásszintet általában decibelben (dB) mérik. A hallhatóság alsó küszöbe 0 dB (20 mikropascal), a hallhatóság felső határának meghatározása pedig inkább a kellemetlen érzés küszöbére, majd a halláskárosodásra , agyrázkódásra stb. vonatkozik. Ez a határ attól függ, hogy mennyi ideig hallgatjuk a a hang. A fül akár 120 dB-es rövid távú hangerőnövekedést is elvisel következmények nélkül, de a 80 dB feletti hangok hosszú távú kitettsége halláskárosodást okozhat. [egy]
A hallás alsó határának alaposabb vizsgálatai kimutatták, hogy a minimális küszöb, amelynél a hang hallható marad, a frekvenciától függ. Ennek a függőségnek a grafikonját abszolút hallásküszöbnek nevezzük . Átlagosan a legnagyobb érzékenységű tartománya az 1 kHz és 5 kHz közötti tartományban van, bár az érzékenység a korral csökken a 2 kHz feletti tartományban.
Az abszolút hallásküszöb görbéje az általánosabb, azonos hangerősségű görbék speciális esete, izofonok : különböző frekvenciájú hangnyomásértékek , amelyeknél az ember a hangokat egyformán hangosnak érzi. A görbéket először H. Fletcher és W. A. Munson szerezte meg, és 1933 -ban publikálták a Loudness, annak meghatározása, mérése és számítása című folyóiratban [2 ] . Később pontosabb méréseket végzett DW Robinson és RS Dadson [3 ] . A kapott görbék jelentősen eltérnek, de ez nem hiba, hanem eltérő mérési feltételek. Fletcher és Munson fejhallgatót használt hanghullámforrásként , míg Robinson és Dutson előlapi hangszórót használt egy visszhangtalan szobában.
Robinson és Dutson mérései képezték az ISO 226 alapját 1986 - ban. 2003 -ban az ISO 226-ot frissítették, hogy tükrözze 12 új nemzetközi tanulmány mérési adatait.
Létezik egy módja a hang érzékelésének a dobhártya részvétele nélkül is - az úgynevezett mikrohullámú hallási hatás , amikor a mikrohullámú tartományban lévő pulzáló vagy modulált sugárzás hatással van a fülkagyló körüli szövetekre , és arra kényszeríti az embert, hogy különféle hangokat érzékeljen. [négy]
Bizonyos esetekben egy hang elrejthető egy másik hanggal. Például lehet, hogy a vasúti sínek mellett beszélni teljesen lehetetlen, ha egy vonat elhalad mellette. Ezt a hatást maszkolásnak nevezik. A gyenge hangot elfedjük, ha az erősebb hang jelenlétében megkülönböztethetetlenné válik.
Többféle álcázás létezik:
Bármely két hang egyidejű hallgatása befolyásolja a köztük lévő relatív hangerő érzékelését. A hangosabb hang csökkenti a gyengébb érzékelését, egészen a hallhatóság megszűnéséig. Minél közelebb van a maszkolt hang frekvenciája a maszkoló hang frekvenciájához, annál jobban el lesz rejtve. A maszkolási hatás nem ugyanaz, ha a maszkolt hang frekvenciáját alacsonyabbra vagy magasabbra tolják el a maszkolthoz képest.
A hangszín szomszédos frekvenciákra gyakorolt hatásának határainak matematikai leírására a szakirodalom [5] a szórási függvény fogalmát használja , amely beállítja a maszkolási küszöböt [6] :
hol a távolság a Barkov-skála két kritikus tartománya között .
A szórásfüggvény alapján az i kritikus tartomány j kritikus tartománnyal való maszkolása [7] [8] kiszámítható :
hol van a jelteljesítmény az i-edik kritikus tartományban.
A maszkolás mértékének meghatározásához olyan helyzetben, amikor sok maszkolási hang van, a globális maszkolási küszöb fogalmát használják
ahol a jelszint és a maszkolási küszöb közötti eltolás [9] , az audiojel periodicitásának mértékét mutató hangindex (zajszerű jeleknél [10] ), a maszkolási index [11] , és a frekvencia kilohertzben. A maszkolási indexet gyakran 5,5 dB állandóval helyettesítik [7] [8] .
Egyidejű maszkolási adatokat használnak például az audiofájlok kvantálási szakaszban történő tömörítésekor [12] .
Az alacsony frekvenciájú hangok elfedik a magas frekvenciákat. Fontos megjegyezni, hogy a magas frekvenciájú hangok nem tudják elfedni az alacsony frekvenciájú hangokat.
Ez a jelenség hasonlít a frekvencia-maszkoláshoz, de itt van időbeli maszkolás. Amikor a maszkoló hangot leállítják, a maszkolt hang egy ideig nem hallható. A maszkolási idő a jel frekvenciájától és amplitúdójától függ, és akár 100 ms is lehet. Normál körülmények között az ideiglenes maszkolás hatása sokkal kevésbé tart.
Abban az esetben, ha a maszkoló tónus később jelenik meg, mint a maszkolt tónus, a hatást utómaszkolásnak nevezzük. Ha a maszkoló tónus a maszkolt előtt jelenik meg (és ez is lehetséges), a hatást előmaszkolásnak nevezzük.
Gyakran a nagy intenzitású hangos hangoknak való kitettség után az ember hallási érzékenysége meredeken csökken. A normál küszöbértékek visszaállítása akár 16 órát is igénybe vehet. Ezt a folyamatot "átmeneti küszöbeltolódásnak" vagy "ingerlés utáni fáradtságnak" nevezik. A küszöbeltolódás 75 dB feletti hangnyomásszinteknél kezd megjelenni, és ennek megfelelően növekszik a jelszint növekedésével. Ezen túlmenően a jel nagyfrekvenciás összetevői befolyásolják a legnagyobb mértékben az érzékenységi küszöb eltolódását.
Lásd: Hiányzó alapelem
Néha egy személy hallhat hangokat az alacsony frekvenciájú tartományban, bár a valóságban nem voltak ilyen frekvenciájú hangok. Ennek az az oka, hogy a cochleában a basilaris membrán oszcillációi nem lineárisak, és abban két magasabb frekvencia közötti frekvenciakülönbségű oszcillációk léphetnek fel.
Ezt a hatást néhány kereskedelmi audiorendszerben használják az alacsony frekvencia-válasz kiterjesztésére, amikor az ilyen frekvenciák közvetlenül nem reprodukálhatók megfelelően, például fejhallgatókban, mobiltelefonokban, olcsó hangszórókban (hangszórókban) stb.
A pszichoakusztikus hallásmodellek kiváló minőségű jeltömörítést tesznek lehetővé információvesztéssel (amikor a visszaállított jel nem egyezik az eredetivel), mivel lehetővé teszik, hogy pontosan leírják, mi távolítható el biztonságosan az eredeti jelből - vagyis anélkül a hangminőség jelentős romlása. Első pillantásra úgy tűnhet, hogy ez valószínűleg nem biztosít erős jeltömörítést, azonban a pszichoakusztikus modelleket használó programok 10-12-szeresére csökkenthetik a zenei fájlok hangerejét.[ bizonytalanság ] , és a minőségbeli különbség nem lesz túl jelentős.
Az ilyen típusú tömörítés magában foglalja az összes modern veszteséges hangtömörítési formátumot :