A számítógépes hangkódolás középpontjában a levegő rezgésének elektromos áram rezgéseivé történő átalakítása és az ezt követő analóg elektromos jel mintavétele áll . A hanginformációk kódolása és lejátszása speciális programok ( hangszerkesztő ) segítségével történik. A kódolt hang lejátszásának minősége a mintavételi frekvenciától és annak felbontásától függ (a hangkódolási mélység - a szintek száma)
A digitális hang egy analóg hangjel, amelyet amplitúdójának diszkrét számértékei képviselnek [1] .
A hang digitalizálása egy olyan technológia, amely egy hangjel amplitúdóját egy bizonyos időlépéssel méri, majd a kapott értékeket numerikus formában rögzíti [1] . A hangdigitalizálás másik neve az analóg-digitális hangátalakítás.
A hang digitalizálása két folyamatból áll:
Az időmintavételi folyamat a jelértékek megszerzésének folyamata, amelyeket egy bizonyos időlépéssel - mintavételezési lépéssel - konvertálnak . A jel nagyságának egységnyi idő alatt végrehajtott mérési számát mintavételezési frekvenciának vagy mintavételezési frekvenciának , vagy mintavételi frekvenciának nevezzük (az angol "sampling" - "sample" szóból). Minél kisebb a mintavételezési lépés, annál nagyobb a mintavételezési frekvencia, és annál pontosabb jelábrázolást kapunk.
Ezt erősíti meg a Kotelnyikov-tétel (a külföldi szakirodalomban Nyquist-Shannon tételként találjuk). Eszerint a korlátozott spektrumú analóg jelet pontosan leírják amplitúdójának diszkrét értéksorával, ha ezeket az értékeket olyan frekvencián veszik, amely legalább kétszerese a jelspektrum legmagasabb frekvenciájának. Vagyis egy F m -nek megfelelő spektrumfrekvenciát tartalmazó analóg jel pontosan ábrázolható diszkrét amplitúdóértékek sorozatával, ha az F d mintavételi frekvencia : F d >2F m .
Ez a gyakorlatban azt jelenti, hogy ahhoz, hogy a digitalizált jel információt tartalmazzon az eredeti analóg jel teljes hallható frekvenciájáról (20 Hz - 20 kHz), szükséges, hogy a kiválasztott mintavételezési frekvencia legalább 40 kHz legyen. A másodpercenkénti amplitúdóminták számát mintavételezési frekvenciának nevezzük ( ha a mintavételi sebesség állandó).
A digitalizálás fő nehézsége a mért jelértékek tökéletes pontosságú rögzítésének lehetetlensége (bár ez lehetséges a Shenon és Kotelnikov tétel alapján).
Rendeljünk N bitet a jelamplitúdó egy értékének a számítógép memóriájába való rögzítésére. Ez azt jelenti, hogy egy N bites szó segítségével 2 N különböző pozíció írható le. Legyen a digitalizált jel amplitúdója –1 és néhány hagyományos mértékegység 1 között. Ábrázoljuk ezt az amplitúdóváltozás tartományát - a jel dinamikus tartományát - 2 N −1 egyenlő intervallum formájában, 2 N szintre - kvantumokra osztva . Most az egyes amplitúdóértékek rögzítéséhez a legközelebbi kvantálási szintre kell kerekíteni. Ezt a folyamatot amplitúdó kvantálásnak nevezik. Az amplitúdó kvantálás a jelamplitúdó valós értékeinek bizonyos pontossággal közelített értékekkel való helyettesítésének folyamata. A 2 N lehetséges szint mindegyikét kvantálási szintnek, a két legközelebbi kvantálási szint közötti távolságot pedig kvantálási lépésnek nevezzük. Ha az amplitúdóskálát lineárisan szintekre osztjuk, akkor a kvantálást lineárisnak (homogénnek) nevezzük.
A kerekítési pontosság a kvantálási szintek kiválasztott számától (2 N ), amely viszont az amplitúdóérték rögzítéséhez hozzárendelt bitek számától (N) függ. Az N számot kvantálási bitmélységnek nevezzük (az egyes szavakban lévő számjegyek, azaz bitek számát jelenti), az amplitúdóértékek kerekítése eredményeként kapott számok pedig minták, vagy minták (az angol nyelvből). minta” – „mérés”). Feltételezzük, hogy a 16 bites kvantálásból származó kvantálási hibák szinte észrevehetetlenek maradnak a hallgató számára.
Ezt a jeldigitalizálási módszert - a jelek időben történő mintavételezését a homogén kvantálási módszerrel együtt - impulzuskód-modulációnak (Eng. Pulse Code Modulation - PCM) nevezik. A digitalizált jel, mint egymást követő amplitúdóértékek halmaza, már eltárolható a számítógép memóriájában. Abban az esetben, ha abszolút amplitúdóértékeket rögzítenek, ezt a rögzítési formátumot PCM-nek nevezik. Az 1980-as évek eleje óta használatos szabványos audio kompakt lemez ( CD-DA ) PCM formátumban tárolja az információkat 44,1 kHz-es mintavételezési frekvenciával és 16 bites kvantálással.
A fenti hangdigitalizálási folyamatot analóg-digitális konverterek (ADC-k) hajtják végre . Ez az átalakítás a következő műveleteket tartalmazza:
Ez a következőképpen történik: egy folyamatos analóg jelet szakaszokra „vágunk”, mintavételezési frekvenciával, digitális diszkrét jelet kapunk, amely bizonyos bitmélységgel megy át a kvantálási folyamaton, majd kódolódik, azaz kicserélődik. kódszimbólumok sorozatával. A 20 Hz - 20 kHz frekvenciasávban történő hang rögzítéséhez 44,1 kHz vagy magasabb mintavételi frekvencia szükséges. A jó minőségű felvétel készítéséhez elegendő 16 bites bitmélység, azonban a dinamikatartomány bővítéséhez és a hangrögzítés minőségének javításához 24 és 32 bites bitmélységet használnak.
A digitális hang tárolásának sokféle módja van. A digitalizált hang bizonyos időközönként felvett jelamplitúdó-értékek halmaza.
Formátumnév | Kvantálás, kicsit | Mintavételi frekvencia, kHz | Csatornák száma | Lemez adatfolyam, kbit/s | Tömörítés/csomagolás arány |
---|---|---|---|---|---|
CD | 16 | 44.1 | 2 | 1411.2 | 1:1 veszteség nélkül |
Dolby Digital (AC3) | 16-24 | 48 | 6 | 640-ig | ~12:1 veszteséges |
DTS | 20-24 | 48; 96 | 8-ig | 1536 előtt | ~3:1 veszteséges |
DVD Audio | 16; húsz; 24 | 44,1; 48; 88,2; 96 | 6 | 6912 | 2:1 veszteség nélkül |
DVD Audio | 16; húsz; 24 | 176,4; 192 | 2 | 4608 | 2:1 veszteség nélkül |
MP3 | úszó | 48-ig | 2 | 320-ig | ~11:1 veszteséges |
AAC | úszó | 96-ig | 48-ig | 529-ig | veszteségekkel |
AAC+ ( SBR ) | úszó | 48-ig | 2 | 320-ig | veszteségekkel |
Ogg Vorbis | 32-ig | 192-ig | 255-ig | 1000-ig | veszteségekkel |
WMA | 24-ig | 96-ig | 8-ig | 768-ig | 2:1, van veszteségmentes verzió |
A zajjavító kódolás lehetővé teszi a jellejátszás során az adathordozó olvasási hibáinak azonosítását és kiküszöbölését (vagy előfordulásuk gyakoriságának csökkentését). Ehhez az ADC kimenetén vett jelre írva mesterséges redundanciát (vezérlőbitet) adunk hozzá, amely utólag segít a sérült számlálás helyreállításában. A hangrögzítő eszközök általában két vagy három hibajavító kód kombinációját használják. Az interleavelést is alkalmazzák a burst hibák elleni jobb védelem érdekében .
A csatornakódolás a digitális jelek és az átviteli csatorna (felvétel/lejátszás) paramétereihez való igazítását szolgálja. A hasznos jelhez kiegészítő adatokat adnak a későbbi dekódolás megkönnyítése érdekében. Ezek lehetnek időkód jelek, szervizjelek, szinkronizációs jelek.
A digitális jellejátszó eszközökben a csatornadekóder órajeleket von ki az általános adatfolyamból, és a bejövő csatornajelet digitális adatfolyammá alakítja. A hibajavítás után a jel a DAC-hoz kerül.
A dekódertől kapott digitális jel analógká alakul. Ez az átalakítás a következőképpen történik:
A főbb paraméterek, amelyek ebben az esetben befolyásolják a hangminőséget:
Szintén fontosak a digitális kódoló és dekódoló eszközök analóg útvonalának paraméterei:
A hanginformáció bináris kóddal való kódolására különféle módszerek léteznek, amelyek között két fő irány van: az FM módszer és a Wave-Table módszer.
Az FM (Frequency Modulation) módszer azon a tényen alapul, hogy elméletileg bármilyen összetett hang felbontható különböző frekvenciájú egyszerű harmonikus jelek sorozatára, amelyek mindegyike szabályos szinuszos lesz, ami azt jelenti, hogy kóddal leírható. . Az audiojelek harmonikus sorozatokra bontásának és diszkrét digitális jelek formájában történő megjelenítésének folyamata speciális eszközökben, az úgynevezett "analóg-digitális konverterekben" (ADC) történik.
A hullámtábla módszer (Wave-Table) azon alapul, hogy a környező világ hangjainak, hangszereknek, stb. mintáit előre elkészített táblázatokban tárolják, számkódok fejezik ki a hang magasságát, időtartamát és intenzitását. , és egyéb paraméterek, amelyek a hang jellemzőit jellemzik. Mivel mintaként „igazi” hangokat használnak, a szintézis eredményeként kapott hang minősége nagyon magas, és megközelíti a valódi hangszerek hangminőségét.