MPEG-1 Audio Layer II

MPEG-1/MPEG-2 Audio Layer 2
Kiterjesztés .mp2
MIME típusú audio/mpeg, video/mpeg
Fejlesztő ISO , IEC
Formátum típusa hang, videó, konténer
Kibontva innen MUSICAM
ben fejlődött MPEG-2
Szabvány(ok) ISO/IEC 11172-3 [1] ,
ISO/IEC 13818-3 [2]

Az MPEG-1 Audio Layer II (rövidítve MP2 , néha Musicam néven) az MPEG-1 [3] szabványban meghatározott három veszteséges hangtömörítési formátum (2. szint) egyike . Használták a DAB digitális műsorszórásban és az örökölt Video CD szabványban, amelyet az 1990-es években optikai CD -n lévő filmek terjesztésére használtak, és megelőzte a DVD széles körű használatát .

Az MPEG-1 Audio Layer 2 kódoló a CCETT , a Philips és az IRT által 1989-ben az EUREKA 147 európai tanulmány részeként kifejlesztett MUSICAM (Maszkolási mintázattal adaptált Universal Subband  Integrated Coding And Multiplexing  ) audiokodekből fejlődött ki . vezetékes, hordozható és mobil vevőkészülékek (alapítva 1987). Az MPEG-1 Audio fő paramétereit a MUSICAM örökölte, beleértve a szűrőbankot, az időtartomány feldolgozást, a hangkockák méretét stb. További fejlesztések után azonban a MUSICAM algoritmust nem használták az MPEG-1 Layer végső verziójában. II szabvány [4] .

Alapparaméterek

MPEG-1 Layer II hangkódolás és dekódolás

Kódolási módszer

A bemeneti digitális audiojel keretekre (frame) van osztva, amelyek mindegyikét a többi képkockától függetlenül kódolják és dekódolják. A II. réteg keretmérete 1152 minta.

Az audiojelsáv 32 részsávra van osztva digitális sávszűrők segítségével. Minden részsáv azonos szélességű, ami a bemeneti jel mintavételezési gyakoriságától függ. A felosztás után a mintavételezési frekvencia 32-szeresére csökken, így az egyes alsávokban a keretenkénti minták száma 36 lesz.

Ezután az adatok kvantálásra kerülnek. A léptéktényezőket előzetesen meghatározzák, amelyek a jel maximális értékétől függenek. Ebben az esetben a léptéktényezőt minden altartományban 12 leolvasási csoportra határozzák meg, és a tényező két vagy három csoport esetében lehet közös. Így egy keretben minden egyes részsávhoz legfeljebb három skálafaktor kerül meghatározásra. A kvantálás előtt a jelértékeket elosztjuk a megfelelő skálafaktorokkal.

Ezután az adatok kvantálása történik a kvantálási és kódolási blokkban. A hanginformáció tömörítése a II. réteg szintjén az adaptív bitallokációnak nevezett módszeren alapul. Ez a módszer abból áll, hogy a kvantálást különböző számú kvantálási bittel hajtják végre a különböző frekvencia alsávokhoz. Ebben az esetben egységes kvantálást alkalmazunk. Egy adott keretben az összes részsávhoz allokált bitek teljes száma a bemeneti jel mintavételezési sebességétől és az adott kimeneti bitsebességtől, azaz az audioinformáció szükséges tömörítési fokától függ. A bitek részsávok közötti elosztását a pszichoakusztikus modellblokk végzi .

A kvantálás után a kapott adatok kódolásra kerülnek. Az egyes részsávokban lévő kvantált jelmintákat hárommal kombinálják, és a kapott bitsorozatokat változó hosszúságú kódtáblázatok segítségével kódolják. Ezenkívül a bitek részsávok közötti eloszlására vonatkozó adatok és a skálázási tényezőkre vonatkozó adatok a megfelelő táblázatok segítségével kódolásra kerülnek.

A pszichoakusztikus modellblokkban a bitek elosztásának végrehajtásához az eredeti hangjel spektrumát elemzik (nem részsávokra bontva). Ehhez a jel szakaszainak gyors Fourier-transzformációját hajtják végre 1024 számlálásra, majd kiszámítják a hangjel teljesítményspektrumát és a hangnyomás nagyságát az egyes frekvencia-alsávokban.

Ezután elemzik az audiojel tónusos (szinuszos) és nem tónusú összetevőit, meghatározzák a lokális és globális maszkolási küszöbértékeket, és kiszámítják az összes részsáv jel/maszk arányát, amely alapján a biteket allokálják az alsávokhoz.

Azokban az alsávokban, amelyekben a kvantálás okozta hangtorzítás kevésbé észrevehető a hallgató számára, vagy más részsávokban nagyobb jelszint takarja el, a kvantálást durvábbá teszik, vagyis ezekhez az alsávokhoz kevesebb bitet allokálnak. A teljesen maszkolt részsávok esetében a rendszer egyáltalán nem foglal biteket. Ennek köszönhetően jelentősen csökkenthető a továbbított információ mennyisége a kellően magas hangminőség megőrzése mellett.

Dekódolás

A keretben lévő adatok dekódolása a dekódoló munkaprogramban található sorrendnek és kódtáblázatoknak megfelelően történik. A dekódolt biteloszlás és léptéktényező adatok az audio adatok dekódolására és dekvantálására szolgálnak. A dekvantálás után az alsávjelek mintáit megszorozzuk a megfelelő skálafaktorokkal.

A dekódolás és a dekvantálás után az összes alsáv jelmintái egy kimenő digitális audiojellé egyesülnek.

Jegyzetek

  1. ISO/IEC 11172-3:1993 – Információtechnológia – Mozgóképek és kapcsolódó hangok kódolása digitális adathordozókhoz kb. 1,5 Mbit/s-ig – 3. rész: Hang (lefelé irányuló kapcsolat) . ISO (1993). Letöltve: 2011. március 15. Az eredetiből archiválva : 2012. március 23.. 
  2. ISO/IEC 13818-3:1995 - Információtechnológia - Mozgóképek és kapcsolódó hanginformációk általános kódolása - 3. rész: Hang (lefelé irányuló kapcsolat) . ISO (1995). Letöltve: 2011. március 15. Az eredetiből archiválva : 2012. március 23.. 
  3. ISO/IEC 11172-3:1993 Információtechnológia – Mozgóképek és kapcsolódó hangok kódolása digitális adathordozókhoz kb. 1,5 Mbit/s-ig – 3. rész: Hang . Letöltve: 2011. március 14. Az eredetiből archiválva : 2012. március 23..
  4. Tények az MPEG tömörítésről Archiválva : 2001. május 8.
  5. MPEG-2 Audio Layer I/II . Letöltve: 2011. március 14. Az eredetiből archiválva : 2010. április 30.
  6. MPEG Audio Frame Header archiválva : 2015. február 8.

Irodalom

Linkek

Digitális hangtömörítés: pszichoakusztikus alapok és algoritmusok. Jurij Kovalgin

Lásd még