MPEG-1 Audio Layer II

MPEG-1/MPEG-2 Audio Layer 2
Kiterjesztés	.mp2
MIME típusú	audio/mpeg, video/mpeg
Fejlesztő	ISO , IEC
Formátum típusa	hang, videó, konténer
Kibontva innen	MUSICAM
ben fejlődött	MPEG-2
Szabvány(ok)	ISO/IEC 11172-3 [1] , ISO/IEC 13818-3 [2]

Az MPEG-1 Audio Layer II (rövidítve MP2 , néha Musicam néven) az MPEG-1 [3] szabványban meghatározott három veszteséges hangtömörítési formátum (2. szint) egyike . Használták a DAB digitális műsorszórásban és az örökölt Video CD szabványban, amelyet az 1990-es években optikai CD -n lévő filmek terjesztésére használtak, és megelőzte a DVD széles körű használatát .

Az MPEG-1 Audio Layer 2 kódoló a CCETT , a Philips és az IRT által 1989-ben az EUREKA 147 európai tanulmány részeként kifejlesztett MUSICAM (Maszkolási mintázattal adaptált Universal Subband Integrated Coding And Multiplexing ) audiokodekből fejlődött ki . vezetékes, hordozható és mobil vevőkészülékek (alapítva 1987). Az MPEG-1 Audio fő paramétereit a MUSICAM örökölte, beleértve a szűrőbankot, az időtartomány feldolgozást, a hangkockák méretét stb. További fejlesztések után azonban a MUSICAM algoritmust nem használták az MPEG-1 Layer végső verziójában. II szabvány [4] .

Alapparaméterek

Az MPEG-1 Audio Layer II szabványt az ISO/IEC 11172-3 (MPEG-1 3. rész) határozza meg.
- Mintavételi frekvencia: 32, 44,1 és 48 kHz
- Bitráta: 32, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256, 320 és 384 kbps.
A formátumbővítést az MPEG-2 Audio Layer II-ben vezették be, és az ISO/IEC 13818-3 (MPEG-2 Part 3) szabványban határozták meg [5] [6]
- további mintavételi frekvencia: 16, 22,05 és 24 kHz
- további bitsebességek: 8, 16, 24, 40 és 144 kbps, 5.1 formátumhoz - körülbelül 1 Mbps.
- többcsatornás támogatás - akár 5 teljes csatorna és egy csatorna alacsony frekvenciájú effektusokhoz.
Változó bitráta (VBR) támogatott

MPEG-1 Layer II hangkódolás és dekódolás

Kódolási módszer

A bemeneti digitális audiojel keretekre (frame) van osztva, amelyek mindegyikét a többi képkockától függetlenül kódolják és dekódolják. A II. réteg keretmérete 1152 minta.

Az audiojelsáv 32 részsávra van osztva digitális sávszűrők segítségével. Minden részsáv azonos szélességű, ami a bemeneti jel mintavételezési gyakoriságától függ. A felosztás után a mintavételezési frekvencia 32-szeresére csökken, így az egyes alsávokban a keretenkénti minták száma 36 lesz.

Ezután az adatok kvantálásra kerülnek. A léptéktényezőket előzetesen meghatározzák, amelyek a jel maximális értékétől függenek. Ebben az esetben a léptéktényezőt minden altartományban 12 leolvasási csoportra határozzák meg, és a tényező két vagy három csoport esetében lehet közös. Így egy keretben minden egyes részsávhoz legfeljebb három skálafaktor kerül meghatározásra. A kvantálás előtt a jelértékeket elosztjuk a megfelelő skálafaktorokkal.

Ezután az adatok kvantálása történik a kvantálási és kódolási blokkban. A hanginformáció tömörítése a II. réteg szintjén az adaptív bitallokációnak nevezett módszeren alapul. Ez a módszer abból áll, hogy a kvantálást különböző számú kvantálási bittel hajtják végre a különböző frekvencia alsávokhoz. Ebben az esetben egységes kvantálást alkalmazunk. Egy adott keretben az összes részsávhoz allokált bitek teljes száma a bemeneti jel mintavételezési sebességétől és az adott kimeneti bitsebességtől, azaz az audioinformáció szükséges tömörítési fokától függ. A bitek részsávok közötti elosztását a pszichoakusztikus modellblokk végzi .

A kvantálás után a kapott adatok kódolásra kerülnek. Az egyes részsávokban lévő kvantált jelmintákat hárommal kombinálják, és a kapott bitsorozatokat változó hosszúságú kódtáblázatok segítségével kódolják. Ezenkívül a bitek részsávok közötti eloszlására vonatkozó adatok és a skálázási tényezőkre vonatkozó adatok a megfelelő táblázatok segítségével kódolásra kerülnek.

A pszichoakusztikus modellblokkban a bitek elosztásának végrehajtásához az eredeti hangjel spektrumát elemzik (nem részsávokra bontva). Ehhez a jel szakaszainak gyors Fourier-transzformációját hajtják végre 1024 számlálásra, majd kiszámítják a hangjel teljesítményspektrumát és a hangnyomás nagyságát az egyes frekvencia-alsávokban.

Ezután elemzik az audiojel tónusos (szinuszos) és nem tónusú összetevőit, meghatározzák a lokális és globális maszkolási küszöbértékeket, és kiszámítják az összes részsáv jel/maszk arányát, amely alapján a biteket allokálják az alsávokhoz.

Azokban az alsávokban, amelyekben a kvantálás okozta hangtorzítás kevésbé észrevehető a hallgató számára, vagy más részsávokban nagyobb jelszint takarja el, a kvantálást durvábbá teszik, vagyis ezekhez az alsávokhoz kevesebb bitet allokálnak. A teljesen maszkolt részsávok esetében a rendszer egyáltalán nem foglal biteket. Ennek köszönhetően jelentősen csökkenthető a továbbított információ mennyisége a kellően magas hangminőség megőrzése mellett.

Dekódolás

A keretben lévő adatok dekódolása a dekódoló munkaprogramban található sorrendnek és kódtáblázatoknak megfelelően történik. A dekódolt biteloszlás és léptéktényező adatok az audio adatok dekódolására és dekvantálására szolgálnak. A dekvantálás után az alsávjelek mintáit megszorozzuk a megfelelő skálafaktorokkal.

A dekódolás és a dekvantálás után az összes alsáv jelmintái egy kimenő digitális audiojellé egyesülnek.

Jegyzetek

↑ ISO/IEC 11172-3:1993 – Információtechnológia – Mozgóképek és kapcsolódó hangok kódolása digitális adathordozókhoz kb. 1,5 Mbit/s-ig – 3. rész: Hang (lefelé irányuló kapcsolat) . ISO (1993). Letöltve: 2011. március 15. Az eredetiből archiválva : 2012. március 23.. (határozatlan)
↑ ISO/IEC 13818-3:1995 - Információtechnológia - Mozgóképek és kapcsolódó hanginformációk általános kódolása - 3. rész: Hang (lefelé irányuló kapcsolat) . ISO (1995). Letöltve: 2011. március 15. Az eredetiből archiválva : 2012. március 23.. (határozatlan)
↑ ISO/IEC 11172-3:1993 Információtechnológia – Mozgóképek és kapcsolódó hangok kódolása digitális adathordozókhoz kb. 1,5 Mbit/s-ig – 3. rész: Hang . Letöltve: 2011. március 14. Az eredetiből archiválva : 2012. március 23.. (határozatlan)
↑ Tények az MPEG tömörítésről Archiválva : 2001. május 8.
↑ MPEG-2 Audio Layer I/II . Letöltve: 2011. március 14. Az eredetiből archiválva : 2010. április 30. (határozatlan)
↑ MPEG Audio Frame Header archiválva : 2015. február 8.

Irodalom

Smirnov A.V. A digitális televíziózás alapjai: Tankönyv. - M .: Hotline-Telecom, 2001. - 224 p.: ill.

Linkek

Digitális hangtömörítés: pszichoakusztikus alapok és algoritmusok. Jurij Kovalgin

Lásd még

MPEG-1
- MPEG-1 Audio Layer I
- MPEG-1 Layer III (MP3)
MPEG-2
- AAC (MPEG-2 7. rész) – 1999-ben frissítve és az MPEG-4 3. részében található
MPEG-4
- AAC (MPEG-4, 3. rész)

MPEG (Moving Picture Experts Group)
MPEG-1 2 3 négy 7 21 A B C D E V M U
MPEG-1 szakaszok	3. rész: Hang ( I. réteg II. réteg réteg III )
MPEG-2 szakaszok	1. rész: Rendszerek ( Traffic flow programfolyamat ) 2. rész: Videó (H.262) 3. rész: Hang ( I. réteg II. réteg réteg III Többcsatornás MPEG ) 6. rész: DSM CC 7. rész: AAC
MPEG-4 szakaszok	2. rész: Videó 3. rész: HE-AAC 6. rész: DMIF 10. rész: H.264 11. rész: A jelenet leírása 12. rész: ISO médiafájl formátum 14. rész: MP4 fájlformátum 17. rész: Streaming szövegformátum 20. rész: Lightweight Scene Playback Application (LASeR)
MPEG-7 szakaszok	2. rész: Definícióleíró nyelv (DDL)
MPEG-21 szakaszok	2., 3. és 9. rész: Digitális objektum 5. rész: Jogleíró nyelv (REL)
MPEG-D szakaszok	1. rész: MPEG Spatial Audio

Hangtömörítés
Kodekek	ATRAC Dolby Digital /AC3 DTS Musepack Opus TwinVQ (VQF) Vorbis WMA
Beszéd/hang	AMBE iLBC IMBE iSAC Nellymoser QCELP RTAudio SELYEM Sziréna Speex SVOPC Igaz beszéd
Veszteségmentes	Apple veszteség FLAC La Monkey's Audio OptimFROG TAK True Audio/ TTA wav csomag WMA veszteségmentes
Szabványok és formátumok	AAC AMR G. 711 718 719 722 723 723.1 726 728 729 729.1 729A HE-AAC MLP MPEG-1 hang I. réteg II. réteg réteg III MT9 RealMedia SHN
Digitális hangformátumok Digitális hangformátumok összehasonlítása

médiatárolók
Videó/Hang	3gp ASF AVI Bink DMF DPX EVO FLV MP4 MPEG MPEG-PS MPEG-TS MXF Matroska (MKV) Ogg Media Ogg Gyors idő RIFF RealMedia Cuppanós csók VOB WebM WMV tömörítés összehasonlítás
Hang	AIFF EMBERSZABÁSÚ MAJOM A.U. DSD DXD FLAC MLP MP3 SHN_ WAV WMA tömörítés összehasonlítás
Zene	MIDI ( KAR ) tracker zene
Raszter	DNG FPX FLIF HEIF ICER ICO ILBM JBIG2 JBIG JPEG XR (HD fotó) JPEG / JP2 / JPEG-LS MNG EXR PCX PNG PSD PNM Nyers TIFF TGA WBMP WebP XCF PGF Animált: APNG , GIF Veszteségmentes: BMP Beleértve a veszteséges tömörítést: BPG
Vektor	SWF AI CDR EPS PS SVG VRML EMF WMF X3D XPS 3D: 3DS Animált: SVG
Összetett	CGM DjVu PDF