A visszhang megszüntetése a telefonálásban használt kifejezés . Ez a folyamat a visszhang eltávolítására az átvitt hangokból a telefonos hangminőség javítása érdekében. A szubjektív minőség javítása mellett a visszhangszűrés növeli a kommunikációs csatorna átviteli sebességét azáltal, hogy elnyomja a csendet , megakadályozva a visszhangok terjedését a hálózaton.
A telefonálás területén a visszhangnak két típusát különböztetjük meg: az akusztikus visszhangot és a hibrid ( elektromos ) visszhangot [1] .
A visszhang kioltása először magában foglalja az eredetileg továbbított jel felismerését, bizonyos késleltetéssel megismétlve a továbbított vagy vett jelben. Az ismétlődő jel felismerése után eltávolítható úgy, hogy kivonja a továbbított vagy vett jelből. Ezt a technikát jellemzően digitális jelfeldolgozó (DSP) segítségével valósítják meg, de megvalósítható a számítógépes szoftver részeként vagy egészeként is. A visszhang kioltását visszhangszűrők vagy visszhangszűrők , vagy bizonyos esetekben mindkettő hajtja végre .
A visszhang elnyomása a visszhang hatásának csökkentésére szolgáló egyszerűbb eljárás a jel egyik átviteli irányában történő mesterséges csillapításával.
A visszhang kioltása ( echo cancellation ) a modern műszaki dokumentációban használt kifejezés, amely egy összetettebb és pontosabb eljárásra utal a visszhang eltávolítására a vett jelből úgy, hogy levonja a továbbított jelet a vett jelből.
A könyvben [2] a „visszhang-kioltás” (166. o.) helyett a „visszhang-kioltás”, a „visszhang-kioltás” kifejezés pedig a „visszhang-blokkolás” jelentésében szerepel.
Különböző forrásokban a "visszhang kioltás" kifejezés megtalálható mind a "visszhang elnyomás" és a "visszhang blokkolás" jelentésében.
A visszhangcsillapító [3] egy egyszerűbb eszköz a visszhangcsillapítóhoz képest , mivel ideiglenes (másodperc töredéke) jelentős (akár 55 dB) csillapítás elvén működik az átviteli csatornában a visszhanghullám érkezésének pillanatában. ( a jelvezeték elektronikus kulccsal történő tolatásával ), anélkül, hogy bonyolultabb, a visszhangot a jelből "kivonó" funkciót végezne.
A telefonálásban a visszhang nagyon hasonlít ahhoz, amit akkor hallunk, amikor egy erdőben vagy egy kanyonban „igen”-t kiáltunk. A visszhang egy másolat, egy visszaverődés, amely valamivel az eredeti elhangzás után hallható. Telefonbeszélgetéskor, ha jelentős a késés (több mint néhány száz milliszekundum), a visszhang bosszantja a beszélgetőpartnereket. Ha a várakozási idő nagyon alacsony (10 ezredmásodperc vagy kevesebb), ezt a jelenséget "mellékhatásnak" nevezik, és bár ez alig észrevehető egy személy számára, meghiúsíthatja a modemek közötti kommunikációt.
A távközlés korszakának kezdetén visszhangszűrőket (visszhangcsillapítókat) alkalmaztak a nem kívánt visszhang csökkentésére. Ezek az eszközök alapvetően arra a tényre támaszkodnak, hogy a telefonbeszélgetések többsége félduplex, vagyis amikor az egyik személy beszél, a másik hallgat. A visszhangcsillapító megpróbálja meghatározni, hogy a hangátvitel jelenleg melyik iránya az elsődleges, és lehetővé teszi a hangátvitelt ebben az irányban. Ellenkező irányban a visszhangcsillapító a jel erős csillapítását okozza, feltételezve, hogy visszhangjelről van szó. Természetesen egy ilyen eszköz tökéletlen. Például abban az esetben, ha mindkét előfizető egyszerre beszél, vagy ha az egyik gyorsabban válaszol, mint a visszhangcsillapító átkapcsolja a jel csillapításának irányát.
A visszhangszűrők helyettesítik a korábbi visszhangszűrőket, amelyeket eredetileg az 1950-es években fejlesztettek ki, hogy kompenzálják a műholdas távközlési kapcsolatok hosszú késései által okozott visszhangokat. A visszhangkioltás mögött meghúzódó elméletet az AT&T Bell Labs dolgozta ki az 1960-as években, és az első kereskedelmi visszhangszűrőket csak az 1970-es évek végén vezették be az akkori elektronikai korlátok miatt. A visszhangszűrő koncepció a várt visszhang szintetizálását jelenti az átvitt jelből, és a szintetizált jel kivonását a vett jelből – ahelyett, hogy előre vagy hátra csillapítást tartalmazna. Ez a módszer adaptív jelfeldolgozást igényel, hogy kellően pontos jelet kapjunk a visszhang hatékony eltávolításához, és a visszhang eltérhet az eredetitől a jel különböző módosulásai miatt, amikor az áthalad a hálózaton.
A digitális jelfeldolgozás gyors fejlődésének köszönhetően a visszhangszűrők kisebbek és költséghatékonyabbak lettek. Az 1990-es években a visszhangszűrőket először a Northern Telecom DMS-250 kapcsolóiba építették be, nem pedig önálló eszközökbe. Az 1990-es évek végén megjelentek a számítógépes telefonkártyák beépített visszhangszűrő egységekkel (például Dialogic termékek).
A visszhangszűrők közvetlenül a kapcsolóba történő integrálása azt jelenti, hogy a visszhangszűrés be- vagy kikapcsolható az egyes hívásoknál, így nincs szükség külön fővonalak fenntartására a hang- és adathívásokhoz. A modern kisméretű és hordozható kommunikációs eszközök gyakran alkalmaznak szoftveres visszhang-kioltást, ami a távoli előfizető által keltett akusztikus vagy maradék visszhang elnyomását jelenti; az ilyen rendszerek általában kompenzálják az akár 64 ezredmásodperces késleltetéssel megjelenő visszhangokat.
Azok a hangposta- és beszédfelismerő rendszerek , amelyek üzeneteket fogadnak az előfizetők számára vagy az előfizetőktől, visszhangszűrést alkalmaznak, hogy megakadályozzák, hogy a saját felszólításuk visszhangja („beszéljen a sípszó után…”) üzenetként kerüljön rögzítésre az előfizetőnek.
Akusztikus visszhang akkor lép fel, ha egy hangszóróból, például egy kihangosított telefon hangszórójából érkező hang megüt egy mikrofont ugyanabban a helyiségben, például ugyanannak a kihangosított telefonnak a mikrofonját. Ez a probléma minden olyan kommunikációs lehetőségnél fennáll, ahol van hangszóró és mikrofon. Az akusztikus visszhangot okozó rendszerekre könnyű példákat találni körülöttünk:
A legtöbb ilyen esetben a hangszóró hangja csekély változással vagy egyáltalán nem lép be a mikrofonba. Ezt nevezzük közvetlen akusztikus visszhangnak. A hang azonban nem mindig változatlanul jut be a mikrofonba, és az akusztikus visszhang elnyomásának nehézsége abból adódik, hogy a környező tér megváltoztatja az eredeti hangot. Például a kárpitozott bútorok bizonyos frekvenciákat nyelnek el, és a helyiségben vagy az autóban lévő tárgyakról különböző erősségű különböző frekvenciájú hangok verődnek vissza. Ezek a másodlagos reflexiók szigorúan véve nem visszhang, hanem inkább "zengés".
Az akusztikus visszhangot az előfizető a kommunikációs vonal túlsó végén hallja beszélgetés közben. Tehát ha egy személy az A szobában beszél, akkor hallani fogja a hangját visszajönni a B szobából. Ezt a hangot el kell nyomni, különben visszaküldik.
Amióta az AT&T Bell Labs feltalálta a visszhangszűrést, az algoritmusait továbbfejlesztették és finomították. Mint minden visszhangtörlési folyamatot, ezeket a korai algoritmusokat úgy tervezték, hogy várjanak egy jelre, amely elkerülhetetlenül belép az átviteli útvonalba, és megszakítja azt.
Az Acoustic Echo Cancellation (AEC) a következőképpen működik:
A visszhangszűrő fő feladata annak meghatározása, hogy a vonal túlsó végéről érkező jelre milyen szűrést kell alkalmazni, hogy az hasonló legyen a közeli végjelhez. A szűrő lényegében a hangszóró, a mikrofon és a szobaakusztika modellje.
A szűrő hangolásához a korai visszhangszűrő rendszerek professzionális impulzus- vagy rózsaszín zajos hangolást igényeltek , és néhányan ezeket a zajokat használták egyedüli akusztikus térmodellként. A későbbi rendszerek ezt a beállítást csak alapként használták, majd a visszhangszűrő az aktuális akusztikus képhez igazodott. A vett jelet vezető jelként használva a modern rendszerek körülbelül 200 ms alatt képesek nulláról 55 dB-re konvergálni.
A mobileszközök piacának széles körű fejlődése és számítási teljesítményük növekedése olyan új lehetőségek megjelenéséhez vezetett, mint a több előfizető közötti audio- és videokonferencia. Az ilyen kommunikációs platformok egyik kulcseleme az akusztikus visszhangszűrő . A modern terminológiában valószínűleg nem csak visszhangcsillapító, hanem a beszéd előfeldolgozásának fő egysége , beleértve a visszhang- és zajcsökkentést , az automatikus beszédszint-beállítást és a mikrofonbemenetről érkező beszédjel általános kiegyenlítését.
Az akusztikus visszhangszűrők használata a mobil eszközökben jelentős tulajdonságokkal rendelkezik a klasszikus esetekhez képest:
A visszhang egy része a hangszóró és a mikrofon közötti mechanikus kapcsolatnak köszönhető. Bár a gyártók intézkedéseket tesznek mind a hangszórók, mind a mikrofonok csillapítására, egy kis mobileszköz tokban meglehetősen nehéz alacsony szintű jeláthatolást közvetlenül a karosszériaelemeken keresztül elérni. Az ilyen jel meglehetősen magas szintje mellett meglehetősen magas szintű nemlineáris torzítás, és bizonyos esetekben kifejezett rezonanciacsúcsok jelenléte jellemzi.
A visszhang második forrása az eszköz környezetének elemeiről származó tényleges visszaverődés. A szóródás ebben az esetben a visszhangút teljes hosszában szórt komponensekből és koncentrált visszaverődésekből áll. Ebben az esetben a visszhang fázisának és amplitúdójának gyors ingadozása meglehetősen jellemző. Maga a teljes visszhangút elég nagynak bizonyul még kis helyiségekhez is. A legtöbb helyiségben a működéshez elegendő általánosan elfogadott paraméterek 256 ms-nak tekinthetők, nagy vagy hosszúkás helyiségeknél pedig a visszhang eléri az 512 ms-t vagy még ennél is többet.
Ezenkívül a mobil eszközöket magas szintű intermoduláció és nemlineáris torzítás jellemzi. Ez egyrészt a mikrofonok és hangszórók rejlő tulajdonságainak, másrészt a nemlineáris kimeneti erősítőknek az energiafogyasztás minimalizálása érdekében történő használatának, a házelemek rezonanciáinak és így tovább. Általánosságban elmondható, hogy a -10 dB nagyságrendű nemlineáris torzítás és -15 dB közötti intermoduláció inkább norma, mint hiba.
Szélessávú támogatásNéhány évvel ezelőtt a telefoncsatorna sávszélességű (300-3400 Hz) kodekek által biztosított kommunikáció minőségét a legtöbb alkalmazásnál elfogadhatónak tartották. A fejlődés azonban nem áll meg. Az ITU új kodekeinek szabványosítása (G.711.1, G.722.2 (AMR-WB), G.729.1 stb.), amelyek jobb hangminőséget biztosítanak az 50-7000 Hz-es sávban, elősegíti a szélessávú technológiák alkalmazását a különböző eszközökben . De facto a 16 kHz-es szélessávú mód támogatása a szabványos 8 kHz-es keskenysávú mód mellett a modern visszhangszűrők egyik kötelező követelménye. A nagyobb mintavételezési gyakoriság a visszhang törléséhez szükséges számítási műveletek számának jelentős növekedését is jelenti, ezért a szélessávú üzemmód visszhangszűrő algoritmusait úgy alakították ki, hogy a processzor feldolgozási terhelése a keskeny sávú móddal összehasonlítható maradjon.
Hang késleltetésA késleltetés az audio alrendszer legfontosabb jellemzője. Ismeretes, hogy a beszéd szubjektív minősége és az észlelés összetettsége a kétirányú kommunikációban nagymértékben romlik a késleltetés 200-250 ms értékre történő növekedésével. Meg kell azonban jegyezni, hogy a teljes késleltetés az emberi fül visszhangra való érzékenységét is befolyásolja. Konkrétan, az ITU-T G.131 hozzávetőleges összefüggést ad a visszhangszűrés szükséges szintje és a késleltetés között, ami azt mutatja, hogy ha a késleltetést 50 ms-ról 250 ms-ra növelik, további 20 dB visszhangszűrésre van szükség.
A mobileszközök általában Linuxot, Androidot, Symbian OS-t használnak, amelyek teljes duplex módban nem biztosítanak alacsony I/O késést. A teljes késleltetés a hangútban jelentős lehet - akár 200-300 ms is lehet -, ezért az ilyen platformok visszhangszűrőinek fokozott visszhangelnyomással kell rendelkezniük.
Közös visszhang- és zajcsökkentésA mobileszközök használatának sajátossága, hogy magas szintű külső zaj és meglehetősen gyorsan változó zajkörnyezet mellett használják őket. Ugyanakkor a zajok változatos természetűek, lehetnek szélessávúak és frekvenciaszelektívek is. Úgy tűnik, hogy az irodahelyiségekben kevés zajnak kell lennie, de további zajok keletkeznek, amelyek a fénycsövek és az energiatakarékos lámpák által keltett hálózati frekvenciák harmonikusai. Spektrumuk 1 kHz feletti frekvenciákon is eléggé észrevehető. Általában egy tipikus zajszint a beszédszint 10-15 dB nagyságrendje lehet. Ilyen körülmények között a visszhangszűrőnek kombinált visszhang- és zajelnyomást kell biztosítania, különben különböző negatív hatások léphetnek fel, mint például: lassú konvergencia sebesség, rossz beszédminőség, rosszabb kettős beszéd elnyomás, a zajzár lassabb alkalmazkodása a külső zaj változásaihoz. jelentős visszhang vagy kettős beszélgetés jelenléte, az úgynevezett zenei zaj megjelenése szünetekben, a beszéd metallizálódása, hangszínének megváltozása.
Erőforrás korlátokAz erőforrás-korlátozás a legfontosabb korlátozó tényező a mobileszközök számára. Az erőforrás-felhasználás minimalizálása az energiamegtakarítás és az akkumulátor üzemidejének legfontosabb forrása. Újabban úgy vélték, hogy a mobileszközök szegmensében a leggyakoribb ARM-osztályú processzorok nem képesek megoldani a visszhang kioltásának problémáját. Azonban az ilyen processzorok új generációjának megjelenése, amely támogatja a jelfeldolgozási utasításokat (ARM9e, ARM11, WMMX kiterjesztések, Neon stb.) és megnövelt órajel-frekvenciákat, valamint az új visszhangszűrő algoritmusok megjelenése ezt valósággá tette.
Természetesen a visszhang kiszűrése, különösen szélessávú módban, továbbra is nagyon erőforrás-igényes feladat marad az ilyen processzoroknál - az ARM11 osztályú processzorok tipikus erőforrás-fogyasztása 50...100 MIPS, ami 8...17%-os terhelésnek felel meg 600 MHz órajel. Fokozatosan a gyártók többmagos architektúrákat és speciális gyorsítókat vezetnek be , amelyekben az erőforrás-igényes algoritmusok, például a visszhang kioltása, a beszédkódolás és egyebek átkerülnek egy speciális, ilyen számításokra optimalizált magba. Ugyanakkor az energiafogyasztás jelentősen csökken.
Így a mobileszközök szolgáltatásai követelményeket támasztanak a visszhangszűrővel szemben. Meg kell:
A hibrid visszhang a "hibrid" kifejezésről kapta a nevét, amelyet a nyilvános telefonhálózatokban használt eszköznek (differenciálrendszernek) neveznek, amely a telefonközponttól az előfizetőhöz vezető kétvezetékes vonalat a hagyományosan használt négyvezetékes vonalhoz illesztette. telefonhálózatok a telefonközpontok közötti kommunikációhoz [1] .
A hibrid vagy elektromos visszhang kialakulásának természete az, hogy elektromos jelet nem szándékosan továbbítanak az adatvonalról a vevővonalra.
A modern hálózatokban számos séma használható az előfizetői vonalnak a telefonközpontok közötti hangátviteli berendezéshez való csatlakoztatására; továbbá a különböző országok távközlési szolgáltatói eltérő módszereket alkalmazhatnak az előfizetők összekapcsolására. Ezenkívül a modern hálózatokban a hangjel gyakran több heterogén kapcsolón keresztül jut el egyik előfizetőtől a másikhoz, amelyek között lehetnek új digitális és régebbi analógok is.
Ezek az átalakítások visszhangot keltenek, és a legtöbb esetben az előfizetők csak azért nem hallják, mert a szolgáltatókapcsolók visszhangszűrő berendezéssel vannak felszerelve.
A személyi számítógépeken visszhangszűrő algoritmusok vannak beépítve a Skype -ba , a Flash Playerbe (a 10.3-as verzió óta) és néhány hangkártya- illesztőprogramba .