Hangkódolás

Az oldal jelenlegi verzióját még nem ellenőrizték tapasztalt közreműködők, és jelentősen eltérhet a 2018. március 19-én felülvizsgált verziótól ; az ellenőrzések 30 szerkesztést igényelnek .

A számítógépes hangkódolás középpontjában a levegő rezgésének elektromos áram rezgéseivé történő átalakítása és az ezt követő analóg elektromos jel mintavétele áll . A hanginformációk kódolása és lejátszása speciális programok ( hangszerkesztő ) segítségével történik. A kódolt hang lejátszásának minősége a mintavételi frekvenciától és annak felbontásától függ (a hangkódolási mélység - a szintek száma)

A hangdigitalizálás elvei

A digitális hang  egy analóg hangjel, amelyet amplitúdójának diszkrét számértékei képviselnek [1] .

A hang digitalizálása egy olyan technológia, amely egy hangjel amplitúdóját egy bizonyos időlépéssel méri, majd a kapott értékeket numerikus formában rögzíti [1] . A hangdigitalizálás másik neve az analóg-digitális hangátalakítás.

A hang digitalizálása két folyamatból áll:

Idődiszkretizálás

Az időmintavételi folyamat a jelértékek megszerzésének folyamata, amelyeket egy bizonyos időlépéssel - mintavételezési lépéssel - konvertálnak . A jel nagyságának egységnyi idő alatt végrehajtott mérési számát mintavételezési frekvenciának vagy mintavételezési frekvenciának , vagy mintavételi frekvenciának nevezzük (az angol "sampling" - "sample" szóból). Minél kisebb a mintavételezési lépés, annál nagyobb a mintavételezési frekvencia, és annál pontosabb jelábrázolást kapunk.

Ezt erősíti meg a Kotelnyikov-tétel (a külföldi szakirodalomban Nyquist-Shannon tételként találjuk). Eszerint a korlátozott spektrumú analóg jelet pontosan leírják amplitúdójának diszkrét értéksorával, ha ezeket az értékeket olyan frekvencián veszik, amely legalább kétszerese a jelspektrum legmagasabb frekvenciájának. Vagyis egy F m -nek megfelelő spektrumfrekvenciát tartalmazó analóg jel pontosan ábrázolható diszkrét amplitúdóértékek sorozatával, ha az F d mintavételi frekvencia : F d >2F m .

Ez a gyakorlatban azt jelenti, hogy ahhoz, hogy a digitalizált jel információt tartalmazzon az eredeti analóg jel teljes hallható frekvenciájáról (20 Hz - 20 kHz), szükséges, hogy a kiválasztott mintavételezési frekvencia legalább 40 kHz legyen. A másodpercenkénti amplitúdóminták számát mintavételezési frekvenciának nevezzük ( ha a mintavételi sebesség állandó).

A digitalizálás fő nehézsége a mért jelértékek tökéletes pontosságú rögzítésének lehetetlensége (bár ez lehetséges a Shenon és Kotelnikov tétel alapján).

Lineáris (homogén) amplitúdó kvantálás

Rendeljünk N bitet a jelamplitúdó egy értékének a számítógép memóriájába való rögzítésére. Ez azt jelenti, hogy egy N bites szó segítségével 2 N különböző pozíció írható le. Legyen a digitalizált jel amplitúdója –1 és néhány hagyományos mértékegység 1 között. Ábrázoljuk ezt az amplitúdóváltozás tartományát - a jel dinamikus tartományát - 2 N −1 egyenlő intervallum formájában, 2 N szintre - kvantumokra osztva . Most az egyes amplitúdóértékek rögzítéséhez a legközelebbi kvantálási szintre kell kerekíteni. Ezt a folyamatot amplitúdó kvantálásnak nevezik. Az amplitúdó kvantálás a jelamplitúdó valós értékeinek bizonyos pontossággal közelített értékekkel való helyettesítésének folyamata. A 2 N lehetséges szint mindegyikét kvantálási szintnek, a két legközelebbi kvantálási szint közötti távolságot pedig kvantálási lépésnek nevezzük. Ha az amplitúdóskálát lineárisan szintekre osztjuk, akkor a kvantálást lineárisnak (homogénnek) nevezzük.

A kerekítési pontosság a kvantálási szintek kiválasztott számától (2 N ), amely viszont az amplitúdóérték rögzítéséhez hozzárendelt bitek számától (N) függ. Az N számot kvantálási bitmélységnek nevezzük (az egyes szavakban lévő számjegyek, azaz bitek számát jelenti), az amplitúdóértékek kerekítése eredményeként kapott számok pedig minták, vagy minták (az angol nyelvből). minta” – „mérés”). Feltételezzük, hogy a 16 bites kvantálásból származó kvantálási hibák szinte észrevehetetlenek maradnak a hallgató számára.

Ezt a jeldigitalizálási módszert - a jelek időben történő mintavételezését a homogén kvantálási módszerrel együtt - impulzuskód-modulációnak (Eng. Pulse Code Modulation - PCM) nevezik. A digitalizált jel, mint egymást követő amplitúdóértékek halmaza, már eltárolható a számítógép memóriájában. Abban az esetben, ha abszolút amplitúdóértékeket rögzítenek, ezt a rögzítési formátumot PCM-nek nevezik. Az 1980-as évek eleje óta használatos szabványos audio kompakt lemez ( CD-DA ) PCM formátumban tárolja az információkat 44,1 kHz-es mintavételezési frekvenciával és 16 bites kvantálással.

A digitalizálás egyéb módjai

Analóg-digitális átalakítók (ADC-k)

A fenti hangdigitalizálási folyamatot analóg-digitális konverterek (ADC-k) hajtják végre . Ez az átalakítás a következő műveleteket tartalmazza:

  1. A sávkorlátozást aluláteresztő szűrővel hajtják végre, hogy elnyomják azokat a spektrális összetevőket, amelyek frekvenciája meghaladja a mintavételi frekvencia felét.
  2. Időbeli diszkretizálás , vagyis egy folyamatos analóg jel helyettesítése értékeinek sorozatával diszkrét időpontokban - minták. Ezt a problémát az ADC bemenetén lévő speciális áramkör segítségével oldják meg - egy minta- és tartási eszközt .
  3. A szintkvantálás a jelminta értékének a fix értékek - kvantálási szintek - halmazából a legközelebbi értékkel való helyettesítése.
  4. Kódolás vagy digitalizálás, melynek eredményeként minden kvantált minta értéke a kvantálási szint sorszámának megfelelő számként jelenik meg.

Ez a következőképpen történik: egy folyamatos analóg jelet szakaszokra „vágunk”, mintavételezési frekvenciával, digitális diszkrét jelet kapunk, amely bizonyos bitmélységgel megy át a kvantálási folyamaton, majd kódolódik, azaz kicserélődik. kódszimbólumok sorozatával. A 20 Hz - 20 kHz frekvenciasávban történő hang rögzítéséhez 44,1 kHz vagy magasabb mintavételi frekvencia szükséges. A jó minőségű felvétel készítéséhez elegendő 16 bites bitmélység, azonban a dinamikatartomány bővítéséhez és a hangrögzítés minőségének javításához 24 és 32 bites bitmélységet használnak.

A digitalizált hang kódolása az adathordozóra való rögzítés előtt

A digitális hang tárolásának sokféle módja van. A digitalizált hang bizonyos időközönként felvett jelamplitúdó-értékek halmaza.

Terminológia
  • kódoló  - olyan program (vagy eszköz), amely egy meghatározott adatkódoló algoritmust valósít meg (például egy archiválót vagy egy MP 3 kódolót), amely bemenetként fogadja a forrásinformációkat, és kimenetként adja vissza a kódolt információt meghatározott formátumban.
  • dekódoló  - olyan program (vagy eszköz), amely végrehajtja a kódolt jel inverz átalakítását dekódolt jellé.
  • A kodek  egy szoftver- vagy hardveregység, amelyet adatok kódolására/dekódolására terveztek.
Néhány audio digitalizálási formátum összehasonlítása
Formátumnév Kvantálás, kicsit Mintavételi frekvencia, kHz Csatornák száma Lemez adatfolyam, kbit/s Tömörítés/csomagolás arány
CD 16 44.1 2 1411.2 1:1 veszteség nélkül
Dolby Digital (AC3) 16-24 48 6 640-ig ~12:1 veszteséges
DTS 20-24 48; 96 8-ig 1536 előtt ~3:1 veszteséges
DVD Audio 16; húsz; 24 44,1; 48; 88,2; 96 6 6912 2:1 veszteség nélkül
DVD Audio 16; húsz; 24 176,4; 192 2 4608 2:1 veszteség nélkül
MP3 úszó 48-ig 2 320-ig ~11:1 veszteséges
AAC úszó 96-ig 48-ig 529-ig veszteségekkel
AAC+ ( SBR ) úszó 48-ig 2 320-ig veszteségekkel
Ogg Vorbis 32-ig 192-ig 255-ig 1000-ig veszteségekkel
WMA 24-ig 96-ig 8-ig 768-ig 2:1, van veszteségmentes verzió

Teljes hangátalakítási ciklus: a digitalizálástól a fogyasztói lejátszásig

Zajjavító és csatornakódolás

A zajjavító kódolás lehetővé teszi a jellejátszás során az adathordozó olvasási hibáinak azonosítását és kiküszöbölését (vagy előfordulásuk gyakoriságának csökkentését). Ehhez az ADC kimenetén vett jelre írva mesterséges redundanciát (vezérlőbitet) adunk hozzá, amely utólag segít a sérült számlálás helyreállításában. A hangrögzítő eszközök általában két vagy három hibajavító kód kombinációját használják. Az interleavelést is alkalmazzák a burst hibák elleni jobb védelem érdekében .

A csatornakódolás a digitális jelek és az átviteli csatorna (felvétel/lejátszás) paramétereihez való igazítását szolgálja. A hasznos jelhez kiegészítő adatokat adnak a későbbi dekódolás megkönnyítése érdekében. Ezek lehetnek időkód jelek, szervizjelek, szinkronizációs jelek.

A digitális jellejátszó eszközökben a csatornadekóder órajeleket von ki az általános adatfolyamból, és a bejövő csatornajelet digitális adatfolyammá alakítja. A hibajavítás után a jel a DAC-hoz kerül.

A DAC működési elve

A dekódertől kapott digitális jel analógká alakul. Ez az átalakítás a következőképpen történik:

  1. A DAC dekóder a számsorozatot diszkrét kvantált jellé alakítja
  2. Az időtartomány simításával diszkrét mintákból időfolytonos jelet állítunk elő
  3. A végső jelvisszanyerés az oldalsó spektrumok elnyomásával történik egy analóg aluláteresztő szűrőben.

Paraméterek, amelyek befolyásolják a hang minőségét a teljes cikluson

A főbb paraméterek, amelyek ebben az esetben befolyásolják a hangminőséget:

Szintén fontosak a digitális kódoló és dekódoló eszközök analóg útvonalának paraméterei:

Kódolási módszerek

A hanginformáció bináris kóddal való kódolására különféle módszerek léteznek, amelyek között két fő irány van: az FM módszer és a Wave-Table módszer.

Az FM (Frequency Modulation) módszer azon a tényen alapul, hogy elméletileg bármilyen összetett hang felbontható különböző frekvenciájú egyszerű harmonikus jelek sorozatára, amelyek mindegyike szabályos szinuszos lesz, ami azt jelenti, hogy kóddal leírható. . Az audiojelek harmonikus sorozatokra bontásának és diszkrét digitális jelek formájában történő megjelenítésének folyamata speciális eszközökben, az úgynevezett "analóg-digitális konverterekben" (ADC) történik.

A hullámtábla módszer (Wave-Table) azon alapul, hogy a környező világ hangjainak, hangszereknek, stb. mintáit előre elkészített táblázatokban tárolják, számkódok fejezik ki a hang magasságát, időtartamát és intenzitását. , és egyéb paraméterek, amelyek a hang jellemzőit jellemzik. Mivel mintaként „igazi” hangokat használnak, a szintézis eredményeként kapott hang minősége nagyon magas, és megközelíti a valódi hangszerek hangminőségét.

Jegyzetek

  1. 1 2 A hangkódolás megértése . Letöltve: 2011. június 27. Az eredetiből archiválva : 2011. október 13..
  2. Hang: egy kis elmélet . Letöltve: 2011. június 27. Az eredetiből archiválva : 2011. június 28..
  3. Digitális hang: mindenekelőtt . Letöltve: 2011. június 27. Az eredetiből archiválva : 2011. október 14..

Lásd még