Kódování dílčího pásma - Sub-band coding

Vývojový diagram kódování a dekódování dílčího pásma

Při zpracování signálu je subpásmové kódování ( SBC ) jakákoli forma transformačního kódování, která rozděluje signál na řadu různých frekvenčních pásem , obvykle pomocí rychlé Fourierovy transformace , a každé z nich samostatně kóduje. Tento rozklad je často prvním krokem v kompresi dat pro audio a video signály.

SBC je základní technika používaná v mnoha populárních algoritmech ztrátové komprese zvuku včetně MP3 .

Kódování zvukových signálů

Nejjednodušší způsob digitálního kódování zvukových signálů je pulzní kódová modulace (PCM), která se používá na zvukových discích CD , záznamech DAT atd. Digitalizace transformuje spojité signály na diskrétní vzorkováním amplitudy signálu v jednotných intervalech a zaokrouhlením na nejbližší hodnotu, která je reprezentovatelná dostupným počtem bitů . Tento proces je v podstatě nepřesné, a zahrnuje dvě chyby: Chyba discretization , ze vzorkování v pravidelných intervalech, a chyba kvantování , z zaokrouhlování.

Čím více bitů se používá k reprezentaci každého vzorku, tím jemnější je granularita v digitální reprezentaci, a tím menší je chyba kvantování. Takové chyby kvantizace lze považovat za typ šumu, protože jsou účinně rozdílem mezi původním zdrojem a jeho binární reprezentací. S PCM lze zvukové účinky těchto chyb zmírnit chvěním a použitím dostatečného počtu bitů, aby bylo zajištěno, že šum je dostatečně nízký, aby byl maskován buď samotným signálem, nebo jinými zdroji šumu. Vysoce kvalitní signál je možný, ale za cenu vysokého datového toku (např. Více než 700 kbit / s pro jeden kanál zvuku CD). Ve skutečnosti je mnoho bitů zbytečných při kódování maskovaných částí signálu, protože PCM nedává žádné předpoklady o tom, jak lidské ucho slyší.

Techniky kódování snižují přenosovou rychlost využitím známých charakteristik sluchového systému. Klasickou metodou je nelineární PCM, například algoritmus μ-law . Malé signály jsou digitalizovány s jemnější zrnitostí než velké; účinek spočívá v přidání šumu, který je úměrný síle signálu. Formát zvuku Sunu Au pro zvuk je oblíbeným příkladem kódování mu-law. Použití 8bitového kódování mu-law by snížilo přenosovou rychlost CD zvuku na kanál na přibližně 350 kbit / s, což je polovina standardní rychlosti. Protože tato jednoduchá metoda využívá maskovací efekty pouze minimálně, vytváří výsledky, které jsou ve srovnání s originálem často slyšitelně horší.

Základní principy

Užitečnost SBC je možná nejlépe ilustrována konkrétním příkladem. Při použití pro kompresi zvuku využívá SBC sluchové maskování ve sluchovém systému . Lidské uši jsou obvykle citlivé na široký rozsah frekvencí, ale když je na jedné frekvenci přítomen dostatečně hlasitý signál, ucho nebude slyšet slabší signály na blízkých frekvencích. Říkáme, že hlasitější signál maskuje měkčí.

Základní myšlenkou SBC je umožnit redukci dat vyřazením informací o frekvencích, které jsou maskované. Výsledek se liší od původního signálu, ale pokud je vyřazená informace zvolena pečlivě, nebude rozdíl znatelný, nebo co je důležitější, nežádoucí.

Nejprve banka digitálních filtrů rozdělí spektrum vstupního signálu na určitý počet (např. 32) dílčích pásem. Psychoakustický model zkoumá energii v každém z těchto dílčích pásem i v původním signálu a pomocí psychoakustických informací vypočítává prahové hodnoty maskování. Každý ze vzorků dílčích pásem je kvantován a kódován tak, aby udržoval kvantovací šum pod dynamicky vypočítanou prahovou hodnotou maskování. Posledním krokem je formátování všech těchto kvantovaných vzorků do skupin dat zvaných rámce, aby se usnadnilo případné přehrávání dekodérem.

Dekódování je mnohem jednodušší než kódování, protože se nejedná o žádný psychoakustický model. Rámečky se rozbalí, vzorky subpásem se dekódují a mapování frekvence a času rekonstruuje výstupní zvukový signál.

Aplikace

Od konce 80. let 20. století vyvinul normalizační orgán nazvaný Motion Picture Experts Group (MPEG) obecné standardy pro kódování zvuku i videa. Například kódování subpásem je jádrem populárního formátu MP3 (přesněji známého jako MPEG-1 Audio Layer III ).

Kódování dílčího pásma se používá v kodeku G.722, který využívá dílčí pásmo adaptivní diferenční pulzní kódové modulace (SB- ADPCM ) v bitové rychlosti 64 kbit / s. V technice SB-ADPCM je frekvenční pásmo rozděleno do dvou dílčích pásem (vyšší a nižší) a signály v každém dílčím pásmu jsou kódovány pomocí ADPCM.

Reference

Tento článek je založen na materiálu převzatém z Free On-line Dictionary of Computing před 1. listopadem 2008 a začleněného za podmínek „relicensing“ GFDL , verze 1.3 nebo novější.

externí odkazy