MPEG-1/MPEG-2 Audio Layer 2 | |
---|---|
Kiterjesztés | .mp2 |
MIME típusú | audio/mpeg, video/mpeg |
Fejlesztő | ISO , IEC |
Formátum típusa | hang, videó, konténer |
Kibontva innen | MUSICAM |
ben fejlődött | MPEG-2 |
Szabvány(ok) |
ISO/IEC 11172-3 [1] , ISO/IEC 13818-3 [2] |
Az MPEG-1 Audio Layer II (rövidítve MP2 , néha Musicam néven) az MPEG-1 [3] szabványban meghatározott három veszteséges hangtömörítési formátum (2. szint) egyike . Használták a DAB digitális műsorszórásban és az örökölt Video CD szabványban, amelyet az 1990-es években optikai CD -n lévő filmek terjesztésére használtak, és megelőzte a DVD széles körű használatát .
Az MPEG-1 Audio Layer 2 kódoló a CCETT , a Philips és az IRT által 1989-ben az EUREKA 147 európai tanulmány részeként kifejlesztett MUSICAM (Maszkolási mintázattal adaptált Universal Subband Integrated Coding And Multiplexing ) audiokodekből fejlődött ki . vezetékes, hordozható és mobil vevőkészülékek (alapítva 1987). Az MPEG-1 Audio fő paramétereit a MUSICAM örökölte, beleértve a szűrőbankot, az időtartomány feldolgozást, a hangkockák méretét stb. További fejlesztések után azonban a MUSICAM algoritmust nem használták az MPEG-1 Layer végső verziójában. II szabvány [4] .
A bemeneti digitális audiojel keretekre (frame) van osztva, amelyek mindegyikét a többi képkockától függetlenül kódolják és dekódolják. A II. réteg keretmérete 1152 minta.
Az audiojelsáv 32 részsávra van osztva digitális sávszűrők segítségével. Minden részsáv azonos szélességű, ami a bemeneti jel mintavételezési gyakoriságától függ. A felosztás után a mintavételezési frekvencia 32-szeresére csökken, így az egyes alsávokban a keretenkénti minták száma 36 lesz.
Ezután az adatok kvantálásra kerülnek. A léptéktényezőket előzetesen meghatározzák, amelyek a jel maximális értékétől függenek. Ebben az esetben a léptéktényezőt minden altartományban 12 leolvasási csoportra határozzák meg, és a tényező két vagy három csoport esetében lehet közös. Így egy keretben minden egyes részsávhoz legfeljebb három skálafaktor kerül meghatározásra. A kvantálás előtt a jelértékeket elosztjuk a megfelelő skálafaktorokkal.
Ezután az adatok kvantálása történik a kvantálási és kódolási blokkban. A hanginformáció tömörítése a II. réteg szintjén az adaptív bitallokációnak nevezett módszeren alapul. Ez a módszer abból áll, hogy a kvantálást különböző számú kvantálási bittel hajtják végre a különböző frekvencia alsávokhoz. Ebben az esetben egységes kvantálást alkalmazunk. Egy adott keretben az összes részsávhoz allokált bitek teljes száma a bemeneti jel mintavételezési sebességétől és az adott kimeneti bitsebességtől, azaz az audioinformáció szükséges tömörítési fokától függ. A bitek részsávok közötti elosztását a pszichoakusztikus modellblokk végzi .
A kvantálás után a kapott adatok kódolásra kerülnek. Az egyes részsávokban lévő kvantált jelmintákat hárommal kombinálják, és a kapott bitsorozatokat változó hosszúságú kódtáblázatok segítségével kódolják. Ezenkívül a bitek részsávok közötti eloszlására vonatkozó adatok és a skálázási tényezőkre vonatkozó adatok a megfelelő táblázatok segítségével kódolásra kerülnek.
A pszichoakusztikus modellblokkban a bitek elosztásának végrehajtásához az eredeti hangjel spektrumát elemzik (nem részsávokra bontva). Ehhez a jel szakaszainak gyors Fourier-transzformációját hajtják végre 1024 számlálásra, majd kiszámítják a hangjel teljesítményspektrumát és a hangnyomás nagyságát az egyes frekvencia-alsávokban.
Ezután elemzik az audiojel tónusos (szinuszos) és nem tónusú összetevőit, meghatározzák a lokális és globális maszkolási küszöbértékeket, és kiszámítják az összes részsáv jel/maszk arányát, amely alapján a biteket allokálják az alsávokhoz.
Azokban az alsávokban, amelyekben a kvantálás okozta hangtorzítás kevésbé észrevehető a hallgató számára, vagy más részsávokban nagyobb jelszint takarja el, a kvantálást durvábbá teszik, vagyis ezekhez az alsávokhoz kevesebb bitet allokálnak. A teljesen maszkolt részsávok esetében a rendszer egyáltalán nem foglal biteket. Ennek köszönhetően jelentősen csökkenthető a továbbított információ mennyisége a kellően magas hangminőség megőrzése mellett.
A keretben lévő adatok dekódolása a dekódoló munkaprogramban található sorrendnek és kódtáblázatoknak megfelelően történik. A dekódolt biteloszlás és léptéktényező adatok az audio adatok dekódolására és dekvantálására szolgálnak. A dekvantálás után az alsávjelek mintáit megszorozzuk a megfelelő skálafaktorokkal.
A dekódolás és a dekvantálás után az összes alsáv jelmintái egy kimenő digitális audiojellé egyesülnek.
Digitális hangtömörítés: pszichoakusztikus alapok és algoritmusok. Jurij Kovalgin
MPEG (Moving Picture Experts Group) | |
---|---|
MPEG-1 szakaszok | |
MPEG-2 szakaszok |
|
MPEG-4 szakaszok |
|
MPEG-7 szakaszok |
|
MPEG-21 szakaszok |
|
MPEG-D szakaszok |
|
Hangtömörítés | |
---|---|
Kodekek | |
Beszéd/hang |
|
Veszteségmentes |
|
Szabványok és formátumok | |
médiatárolók | |
---|---|
Videó/Hang | |
Hang | |
Zene |
|
Raszter | |
Vektor | |
Összetett |