Visszhang kioltás

Az oldal jelenlegi verzióját még nem ellenőrizték tapasztalt közreműködők, és jelentősen eltérhet a 2017. január 4-én felülvizsgált verziótól ; az ellenőrzések 7 szerkesztést igényelnek .

A visszhang megszüntetése a telefonálásban használt kifejezés . Ez a folyamat a visszhang eltávolítására az átvitt hangokból a telefonos hangminőség javítása érdekében. A szubjektív minőség javítása mellett a visszhangszűrés növeli a kommunikációs csatorna átviteli sebességét azáltal, hogy elnyomja a csendet , megakadályozva a visszhangok terjedését a hálózaton.

A telefonálás területén a visszhangnak két típusát különböztetjük meg: az akusztikus visszhangot és a hibrid ( elektromos ) visszhangot [1] .

A visszhang kioltása először magában foglalja az eredetileg továbbított jel felismerését, bizonyos késleltetéssel megismétlve a továbbított vagy vett jelben. Az ismétlődő jel felismerése után eltávolítható úgy, hogy kivonja a továbbított vagy vett jelből. Ezt a technikát jellemzően digitális jelfeldolgozó (DSP) segítségével valósítják meg, de megvalósítható a számítógépes szoftver részeként vagy egészeként is. A visszhang kioltását visszhangszűrők vagy visszhangszűrők , vagy bizonyos esetekben mindkettő hajtja végre .

Terminológia

A visszhang elnyomása a visszhang hatásának csökkentésére szolgáló egyszerűbb eljárás a jel egyik átviteli irányában történő mesterséges csillapításával.

A visszhang kioltása ( echo cancellation ) a modern műszaki dokumentációban használt kifejezés, amely egy összetettebb és pontosabb eljárásra utal a visszhang eltávolítására a vett jelből úgy, hogy levonja a továbbított jelet a vett jelből.

A könyvben [2] a „visszhang-kioltás” (166. o.) helyett a „visszhang-kioltás”, a „visszhang-kioltás” kifejezés pedig a „visszhang-blokkolás” jelentésében szerepel.

Különböző forrásokban a "visszhang kioltás" kifejezés megtalálható mind a "visszhang elnyomás" és a "visszhang blokkolás" jelentésében.

A visszhangcsillapító [3]  egy egyszerűbb eszköz a visszhangcsillapítóhoz képest , mivel ideiglenes (másodperc töredéke) jelentős (akár 55 dB) csillapítás elvén működik az átviteli csatornában a visszhanghullám érkezésének pillanatában. ( a jelvezeték elektronikus kulccsal történő tolatásával ), anélkül, hogy bonyolultabb, a visszhangot a jelből "kivonó" funkciót végezne.

Történelem

A telefonálásban a visszhang nagyon hasonlít ahhoz, amit akkor hallunk, amikor egy erdőben vagy egy kanyonban „igen”-t kiáltunk. A visszhang egy másolat, egy visszaverődés, amely valamivel az eredeti elhangzás után hallható. Telefonbeszélgetéskor, ha jelentős a késés (több mint néhány száz milliszekundum), a visszhang bosszantja a beszélgetőpartnereket. Ha a várakozási idő nagyon alacsony (10 ezredmásodperc vagy kevesebb), ezt a jelenséget "mellékhatásnak" nevezik, és bár ez alig észrevehető egy személy számára, meghiúsíthatja a modemek közötti kommunikációt.

A távközlés korszakának kezdetén visszhangszűrőket (visszhangcsillapítókat) alkalmaztak a nem kívánt visszhang csökkentésére. Ezek az eszközök alapvetően arra a tényre támaszkodnak, hogy a telefonbeszélgetések többsége félduplex, vagyis amikor az egyik személy beszél, a másik hallgat. A visszhangcsillapító megpróbálja meghatározni, hogy a hangátvitel jelenleg melyik iránya az elsődleges, és lehetővé teszi a hangátvitelt ebben az irányban. Ellenkező irányban a visszhangcsillapító a jel erős csillapítását okozza, feltételezve, hogy visszhangjelről van szó. Természetesen egy ilyen eszköz tökéletlen. Például abban az esetben, ha mindkét előfizető egyszerre beszél, vagy ha az egyik gyorsabban válaszol, mint a visszhangcsillapító átkapcsolja a jel csillapításának irányát.

A visszhangszűrők helyettesítik a korábbi visszhangszűrőket, amelyeket eredetileg az 1950-es években fejlesztettek ki, hogy kompenzálják a műholdas távközlési kapcsolatok hosszú késései által okozott visszhangokat. A visszhangkioltás mögött meghúzódó elméletet az AT&T Bell Labs dolgozta ki az 1960-as években, és az első kereskedelmi visszhangszűrőket csak az 1970-es évek végén vezették be az akkori elektronikai korlátok miatt. A visszhangszűrő koncepció a várt visszhang szintetizálását jelenti az átvitt jelből, és a szintetizált jel kivonását a vett jelből – ahelyett, hogy előre vagy hátra csillapítást tartalmazna. Ez a módszer adaptív jelfeldolgozást igényel, hogy kellően pontos jelet kapjunk a visszhang hatékony eltávolításához, és a visszhang eltérhet az eredetitől a jel különböző módosulásai miatt, amikor az áthalad a hálózaton.

A digitális jelfeldolgozás gyors fejlődésének köszönhetően a visszhangszűrők kisebbek és költséghatékonyabbak lettek. Az 1990-es években a visszhangszűrőket először a Northern Telecom DMS-250 kapcsolóiba építették be, nem pedig önálló eszközökbe. Az 1990-es évek végén megjelentek a számítógépes telefonkártyák beépített visszhangszűrő egységekkel (például Dialogic termékek).

A visszhangszűrők közvetlenül a kapcsolóba történő integrálása azt jelenti, hogy a visszhangszűrés be- vagy kikapcsolható az egyes hívásoknál, így nincs szükség külön fővonalak fenntartására a hang- és adathívásokhoz. A modern kisméretű és hordozható kommunikációs eszközök gyakran alkalmaznak szoftveres visszhang-kioltást, ami a távoli előfizető által keltett akusztikus vagy maradék visszhang elnyomását jelenti; az ilyen rendszerek általában kompenzálják az akár 64 ezredmásodperces késleltetéssel megjelenő visszhangokat.

Azok a hangposta- és beszédfelismerő rendszerek , amelyek üzeneteket fogadnak az előfizetők számára vagy az előfizetőktől, visszhangszűrést alkalmaznak, hogy megakadályozzák, hogy a saját felszólításuk visszhangja („beszéljen a sípszó után…”) üzenetként kerüljön rögzítésre az előfizetőnek.

Akusztikus visszhang

Akusztikus visszhang akkor lép fel, ha egy hangszóróból, például egy kihangosított telefon hangszórójából érkező hang megüt egy mikrofont ugyanabban a helyiségben, például ugyanannak a kihangosított telefonnak a mikrofonját. Ez a probléma minden olyan kommunikációs lehetőségnél fennáll, ahol van hangszóró és mikrofon. Az akusztikus visszhangot okozó rendszerekre könnyű példákat találni körülöttünk:

A legtöbb ilyen esetben a hangszóró hangja csekély változással vagy egyáltalán nem lép be a mikrofonba. Ezt nevezzük közvetlen akusztikus visszhangnak. A hang azonban nem mindig változatlanul jut be a mikrofonba, és az akusztikus visszhang elnyomásának nehézsége abból adódik, hogy a környező tér megváltoztatja az eredeti hangot. Például a kárpitozott bútorok bizonyos frekvenciákat nyelnek el, és a helyiségben vagy az autóban lévő tárgyakról különböző erősségű különböző frekvenciájú hangok verődnek vissza. Ezek a másodlagos reflexiók szigorúan véve nem visszhang, hanem inkább "zengés".

Az akusztikus visszhangot az előfizető a kommunikációs vonal túlsó végén hallja beszélgetés közben. Tehát ha egy személy az A szobában beszél, akkor hallani fogja a hangját visszajönni a B szobából. Ezt a hangot el kell nyomni, különben visszaküldik.

Akusztikus visszhang kioltása

Amióta az AT&T Bell Labs feltalálta a visszhangszűrést, az algoritmusait továbbfejlesztették és finomították. Mint minden visszhangtörlési folyamatot, ezeket a korai algoritmusokat úgy tervezték, hogy várjanak egy jelre, amely elkerülhetetlenül belép az átviteli útvonalba, és megszakítja azt.

Az Acoustic Echo Cancellation (AEC) a következőképpen működik:

  1. A távoli végről érkező jel bejut a rendszerbe.
  2. A túlsó végről érkező jelet a szoba hangszórója játssza le.
  3. Az ugyanabban a helyiségben lévő mikrofon ezt a közvetlen jelet és az azt követő visszhangot a helyiség hangjaként veszi fel.
  4. A távoli végről kapott jelet szűrjük és késlelteti, hogy hasonlítson a közeli végből érkező jelre.
  5. A távoli végről érkező szűrt jelet kivonjuk a közeli végből érkező jelből.
  6. Az eredményül kapott jel a szobában lévő hangok, kivéve a helyiség hangszórója által reprodukált közvetlen vagy visszavert hangokat.

Akusztikus visszhang kioltási problémák

A visszhangszűrő fő feladata annak meghatározása, hogy a vonal túlsó végéről érkező jelre milyen szűrést kell alkalmazni, hogy az hasonló legyen a közeli végjelhez. A szűrő lényegében a hangszóró, a mikrofon és a szobaakusztika modellje.

A szűrő hangolásához a korai visszhangszűrő rendszerek professzionális impulzus- vagy rózsaszín zajos hangolást igényeltek , és néhányan ezeket a zajokat használták egyedüli akusztikus térmodellként. A későbbi rendszerek ezt a beállítást csak alapként használták, majd a visszhangszűrő az aktuális akusztikus képhez igazodott. A vett jelet vezető jelként használva a modern rendszerek körülbelül 200 ms alatt képesek nulláról 55 dB-re konvergálni.

A visszhangszűrők jellemzői mobil eszközökhöz

A mobileszközök piacának széles körű fejlődése és számítási teljesítményük növekedése olyan új lehetőségek megjelenéséhez vezetett, mint a több előfizető közötti audio- és videokonferencia. Az ilyen kommunikációs platformok egyik kulcseleme az akusztikus visszhangszűrő . A modern terminológiában valószínűleg nem csak visszhangcsillapító, hanem a beszéd előfeldolgozásának fő egysége , beleértve a visszhang- és zajcsökkentést , az automatikus beszédszint-beállítást és a mikrofonbemenetről érkező beszédjel általános kiegyenlítését.

Az akusztikus visszhangszűrők használata a mobil eszközökben jelentős tulajdonságokkal rendelkezik a klasszikus esetekhez képest:

A visszhang és a torzítás forrásai

A visszhang egy része a hangszóró és a mikrofon közötti mechanikus kapcsolatnak köszönhető. Bár a gyártók intézkedéseket tesznek mind a hangszórók, mind a mikrofonok csillapítására, egy kis mobileszköz tokban meglehetősen nehéz alacsony szintű jeláthatolást közvetlenül a karosszériaelemeken keresztül elérni. Az ilyen jel meglehetősen magas szintje mellett meglehetősen magas szintű nemlineáris torzítás, és bizonyos esetekben kifejezett rezonanciacsúcsok jelenléte jellemzi.

A visszhang második forrása az eszköz környezetének elemeiről származó tényleges visszaverődés. A szóródás ebben az esetben a visszhangút teljes hosszában szórt komponensekből és koncentrált visszaverődésekből áll. Ebben az esetben a visszhang fázisának és amplitúdójának gyors ingadozása meglehetősen jellemző. Maga a teljes visszhangút elég nagynak bizonyul még kis helyiségekhez is. A legtöbb helyiségben a működéshez elegendő általánosan elfogadott paraméterek 256 ms-nak tekinthetők, nagy vagy hosszúkás helyiségeknél pedig a visszhang eléri az 512 ms-t vagy még ennél is többet.

Ezenkívül a mobil eszközöket magas szintű intermoduláció és nemlineáris torzítás jellemzi. Ez egyrészt a mikrofonok és hangszórók rejlő tulajdonságainak, másrészt a nemlineáris kimeneti erősítőknek az energiafogyasztás minimalizálása érdekében történő használatának, a házelemek rezonanciáinak és így tovább. Általánosságban elmondható, hogy a -10 dB nagyságrendű nemlineáris torzítás és -15 dB közötti intermoduláció inkább norma, mint hiba.

Szélessávú támogatás

Néhány évvel ezelőtt a telefoncsatorna sávszélességű (300-3400 Hz) kodekek által biztosított kommunikáció minőségét a legtöbb alkalmazásnál elfogadhatónak tartották. A fejlődés azonban nem áll meg. Az ITU új kodekeinek szabványosítása (G.711.1, G.722.2 (AMR-WB), G.729.1 stb.), amelyek jobb hangminőséget biztosítanak az 50-7000 Hz-es sávban, elősegíti a szélessávú technológiák alkalmazását a különböző eszközökben . De facto a 16 kHz-es szélessávú mód támogatása a szabványos 8 kHz-es keskenysávú mód mellett a modern visszhangszűrők egyik kötelező követelménye. A nagyobb mintavételezési gyakoriság a visszhang törléséhez szükséges számítási műveletek számának jelentős növekedését is jelenti, ezért a szélessávú üzemmód visszhangszűrő algoritmusait úgy alakították ki, hogy a processzor feldolgozási terhelése a keskeny sávú móddal összehasonlítható maradjon.

Hang késleltetés

A késleltetés az audio alrendszer legfontosabb jellemzője. Ismeretes, hogy a beszéd szubjektív minősége és az észlelés összetettsége a kétirányú kommunikációban nagymértékben romlik a késleltetés 200-250 ms értékre történő növekedésével. Meg kell azonban jegyezni, hogy a teljes késleltetés az emberi fül visszhangra való érzékenységét is befolyásolja. Konkrétan, az ITU-T G.131 hozzávetőleges összefüggést ad a visszhangszűrés szükséges szintje és a késleltetés között, ami azt mutatja, hogy ha a késleltetést 50 ms-ról 250 ms-ra növelik, további 20 dB visszhangszűrésre van szükség.

A mobileszközök általában Linuxot, Androidot, Symbian OS-t használnak, amelyek teljes duplex módban nem biztosítanak alacsony I/O késést. A teljes késleltetés a hangútban jelentős lehet - akár 200-300 ms is lehet -, ezért az ilyen platformok visszhangszűrőinek fokozott visszhangelnyomással kell rendelkezniük.

Közös visszhang- és zajcsökkentés

A mobileszközök használatának sajátossága, hogy magas szintű külső zaj és meglehetősen gyorsan változó zajkörnyezet mellett használják őket. Ugyanakkor a zajok változatos természetűek, lehetnek szélessávúak és frekvenciaszelektívek is. Úgy tűnik, hogy az irodahelyiségekben kevés zajnak kell lennie, de további zajok keletkeznek, amelyek a fénycsövek és az energiatakarékos lámpák által keltett hálózati frekvenciák harmonikusai. Spektrumuk 1 kHz feletti frekvenciákon is eléggé észrevehető. Általában egy tipikus zajszint a beszédszint 10-15 dB nagyságrendje lehet. Ilyen körülmények között a visszhangszűrőnek kombinált visszhang- és zajelnyomást kell biztosítania, különben különböző negatív hatások léphetnek fel, mint például: lassú konvergencia sebesség, rossz beszédminőség, rosszabb kettős beszéd elnyomás, a zajzár lassabb alkalmazkodása a külső zaj változásaihoz. jelentős visszhang vagy kettős beszélgetés jelenléte, az úgynevezett zenei zaj megjelenése szünetekben, a beszéd metallizálódása, hangszínének megváltozása.

Erőforrás korlátok

Az erőforrás-korlátozás a legfontosabb korlátozó tényező a mobileszközök számára. Az erőforrás-felhasználás minimalizálása az energiamegtakarítás és az akkumulátor üzemidejének legfontosabb forrása. Újabban úgy vélték, hogy a mobileszközök szegmensében a leggyakoribb ARM-osztályú processzorok nem képesek megoldani a visszhang kioltásának problémáját. Azonban az ilyen processzorok új generációjának megjelenése, amely támogatja a jelfeldolgozási utasításokat (ARM9e, ARM11, WMMX kiterjesztések, Neon stb.) és megnövelt órajel-frekvenciákat, valamint az új visszhangszűrő algoritmusok megjelenése ezt valósággá tette.

Természetesen a visszhang kiszűrése, különösen szélessávú módban, továbbra is nagyon erőforrás-igényes feladat marad az ilyen processzoroknál - az ARM11 osztályú processzorok tipikus erőforrás-fogyasztása 50...100 MIPS, ami 8...17%-os terhelésnek felel meg 600 MHz órajel. Fokozatosan a gyártók többmagos architektúrákat és speciális gyorsítókat vezetnek be , amelyekben az erőforrás-igényes algoritmusok, például a visszhang kioltása, a beszédkódolás és egyebek átkerülnek egy speciális, ilyen számításokra optimalizált magba. Ugyanakkor az energiafogyasztás jelentősen csökken.

Így a mobileszközök szolgáltatásai követelményeket támasztanak a visszhangszűrővel szemben. Meg kell:

  • alacsony érzékenységgel rendelkeznek a nemlineáris és intermodulációs torzításokra;
  • támogatja a visszhang utat 512 ms-ig;
  • rendelkeznek a különböző jel-mintavételezési frekvenciákon való működéshez szükséges eszközökkel;
  • mind a visszhang-, mind a zajcsillapító alkalmazkodási aránya magas;
  • javított visszhangszűrést biztosít hosszú késések esetén;
  • rendelkezzenek a nem kívánt rezonanciák kezelésére szolgáló eszközökkel, valamint képesek legyenek korrigálni a mikrofonút frekvenciamenetét;
  • elfogadható erőforrás-felhasználással rendelkezik.

Hibrid visszhang

A hibrid visszhang a "hibrid" kifejezésről kapta a nevét, amelyet a nyilvános telefonhálózatokban használt eszköznek (differenciálrendszernek) neveznek, amely a telefonközponttól az előfizetőhöz vezető kétvezetékes vonalat a hagyományosan használt négyvezetékes vonalhoz illesztette. telefonhálózatok a telefonközpontok közötti kommunikációhoz [1] .

A hibrid vagy elektromos visszhang kialakulásának természete az, hogy elektromos jelet nem szándékosan továbbítanak az adatvonalról a vevővonalra.

A modern hálózatokban számos séma használható az előfizetői vonalnak a telefonközpontok közötti hangátviteli berendezéshez való csatlakoztatására; továbbá a különböző országok távközlési szolgáltatói eltérő módszereket alkalmazhatnak az előfizetők összekapcsolására. Ezenkívül a modern hálózatokban a hangjel gyakran több heterogén kapcsolón keresztül jut el egyik előfizetőtől a másikhoz, amelyek között lehetnek új digitális és régebbi analógok is.

Ezek az átalakítások visszhangot keltenek, és a legtöbb esetben az előfizetők csak azért nem hallják, mert a szolgáltatókapcsolók visszhangszűrő berendezéssel vannak felszerelve.

PC megvalósítások

A személyi számítógépeken visszhangszűrő algoritmusok vannak beépítve a Skype -ba , a Flash Playerbe (a 10.3-as verzió óta) és néhány hangkártya- illesztőprogramba .

Linkek

  1. Akusztikus visszhangszűrők mobil eszközökhöz, Nazarov A.G., Ph.D.
  2. Hogyan válasszunk akusztikus visszhangszűrőt, Polycom
  3. Nemlineáris maradék akusztikus visszhangelnyomás a magas szintű harmonikus torzítás érdekében, Bendersky, DA Stokes, JW Malvar, HS Buenos Aires Univ., Buenos Aires
  4. Hibrid akusztikus visszhang- és visszhangcsillapító, Fredric Lindström, Christian Schüldt, Ingvar Claesson, 2007  (nem elérhető link)
  5. Nemlineáris visszhangelnyomó technológia, amely minőségi kihangosító beszélgetést tesz lehetővé kompakt berendezésekhez, Hoshuyama Osama

Jegyzetek

  1. ↑ Kr.e. 1 2 Goldstein, Pinchuk A.V., Sukhovitsky A.L. IP telefonálás . - Moszkva: Rádió és Kommunikáció, 2001. - S. 336.
  2. Davidson J., Peters J., Bhatia M., Kalidindi S., Mukherjee S. Az IP-hálózatokon keresztüli hangátvitel alapjai . - 2. - Moszkva: Williams, 2007. - S. 396.
  3. Visszhangcsillapítók KEZ-A.Ts02. Műszaki leírás és használati utasítás . - Moszkva, 2002.