Módosított diszkrét koszinusz transzformáció

Az oldal jelenlegi verzióját még nem ellenőrizték tapasztalt közreműködők, és jelentősen eltérhet a 2019. június 24-én felülvizsgált verziótól ; az ellenőrzéshez 1 szerkesztés szükséges .

A módosított diszkrét koszinusz transzformáció (MDCT) egy Fourier transzformáció , és a diszkrét koszinusz transzformáción (DCT-IV) alapul. Ez egy átfedő átalakítás. Nagy adatkészletek egymást követő blokkjain hajtják végre, a következő blokkok mindegyike átfedi egymást. Ez a következőképpen történik: az előző blokk második fele megegyezik a következő blokk első felével. Ez az átfedés a DCT funkcionalitáson túlmenően az MDCT-t különösen hasznossá teszi a jelek tömörítésére olyan alkalmazásokban, ahol el kell kerülni az olyan műtermékeket , amelyek jellemzően túllépnek a blokkhatárokon.

Így az MDCT MP3 , AC-3 , Vorbis és AAC formátumokban működik például hangtömörítéshez. A Polycom Siren kodekjében is használják .

Az MDCT-t Princeton, Johnson és Bradley fejlesztette ki 1987-ben [1] , és 1986-ban Princeton és Bradley munkája előzte meg [2] .

Ezt követően kidolgozták az alapvető időbeli interferencia kiküszöbölési elvet (TCP), amelyet alább ismertetünk. (Itt is van egy hasonló transzformáció, az MDCT, amely a diszkrét szinusztranszformáción alapul. Valamint az MDCT egyéb, ritkábban használt változatai, amelyek a DCT és a DCT különféle kombinációin alapulnak).

Az MP3-ban az MDCT-t nem közvetlenül az audiojelre alkalmazzák, hanem egy 32 sávos többfázisú kvadratúra szűrő (MPF) kimenetén. Ennek az MDCT-nek a kimenetét egy időbeli zajszűrési képlet kezeli az MCF-szűrők tipikus zajának csökkentése érdekében. A szűrőbank és az MDCT kombinációját hibrid (i) szűrőbanknak vagy MDCT alzónának (i) nevezik. Ezzel szemben az AAC jellemzően tiszta MDCT-t használ; csak a (korábban használt) MPEG-4 AAC-SSR (a Sony-tól) dolgozza fel az MCDP-ből származó 4 sávos MKF készlet. Az ATRAC halmozott kvadratúratükör szűrőket (QSF), majd MDCT-t használ.

Definíció

Mivel az MDCT átlapolt transzformáció, kissé eltér a többi Fourier-transzformációtól. Az MDCT-ben kétszer kevesebb a kimenet, mint a bemenet (ellentétben más transzformációkkal, ahol pontosan ugyanannyi kimenet van, mint bemenet).

Konkrétan ez egy lineáris függvény : (ahol  a valós számok halmaza) 2 N  - x 0 , ..., x 2 N -1 valós számok X 0 , ..., X N - valós számokká alakulnak. 1 a következő képlet szerint: (Normalizációs együttható itt a transzformáció elején, és a halmaz tetszőleges és a feltételek különböző változataiban különbözik. Az MDCT és az OMDCT normalizálásának eredménye az alábbiakban látható.)





Fordított transzformáció

A fordított MDCT OMDCT néven ismert. Mivel a bemenetek és kimenetek számában különböznek, első pillantásra úgy tűnhet, hogy az MDCT nem fordítható vissza. Az átalakítás legjobb visszafordíthatóságát azonban az (i) OMDCT átfedő blokkokra történő alkalmazása éri el, és ez az oka a hibakeresésnek az eredeti adatok kinyerése előtt. Ez a módszer az időbeli interferencia kiküszöbölési elv (TCIP) néven ismert.

Az OMDCT az N halmaz X 0 , …, X N -1 valós számait a 2N halmaz y 0 , …, y 2 N -1 valós számává alakítja a következő képlet szerint:



(Ami a DCT-IV-t illeti, az ortogonális transzformációban ugyanezt az alakot használják inverzben is).

Abban az esetben, ha az MDCT-t intervallumnormalizálással használjuk (lásd alább), ennek a normalizálásnak az együtthatóját az OMDT-képlet elején meg kell szorozni 2-vel (azaz 2/N-t kapunk).

Számítás

Bár az MDCT képlet közvetlen alkalmazása O(N²) műveleteket igényelne, lehetséges csak az O(N log N)-komplexitás kiszámítása a számítások rekurzív faktorálásával, mint a gyors Fourier transzformációnál (FFT). Lehetőség van MDCT végrehajtására más transzformációk, például FFT vagy DCT használatával is, emellett a bemeneti és kimeneti adatokat O(N) komplexitási algoritmusokkal dolgozza fel.

Továbbá, amint azt már leírtuk, a DCT-IV bármely algoritmusa azonnal módszert ad az MDCT vagy az OMDCT kiszámítására bármilyen méretben.

Jegyzetek

  1. JP Princen, A.W. Johnson és A.B. Bradley: Alsáv/transzformáció kódolás szűrőbank-tervek használatával, az időtartomány aliasing törlése alapján, IEEE Proc. Intl. Akusztikai, beszéd- és jelfeldolgozási konferencia (ICASSP), 2161-2164, 1987. Az MDCT kezdeti leírása.
  2. John P. Princen, Alan B. Bradley: Elemzés/szintézis szűrőbank tervezése időtartomány aliasing cancellation alapján, IEEE Trans. Akusztikus. Speech Signal Processing, ASSP-34 (5), 1153-1161, 1986. Leírta az MDCT prekurzorát diszkrét koszinusz és szinusz transzformációk kombinációjával.