Artefakt komprese - Compression artifact

Originální obrázek s dobrým stupněm barev
Ztráta ostrosti hran a „neostrosti“ tónu při těžké kompresi JPEG

Kompresní artefakty (nebo artefakt ) je patrné zkreslení médií (včetně obrázků , zvuku a videa ), způsobené použitím komprese ztrátové . Komprese ztrátových dat zahrnuje zahození některých dat média tak, aby byla dostatečně malá na to, aby mohla být uložena v požadovaném prostoru na disku nebo přenášena ( streamována ) v rámci dostupné šířky pásma (známé jako datová rychlost nebo přenosová rychlost ). Pokud kompresor nemůže uložit dostatek dat v komprimované verzi, výsledkem je ztráta kvality nebo zavedení artefaktů. Kompresní algoritmus nemusí být inteligentní dostatečně rozlišovat mezi narušení malého subjektivního významu a ty nežádoucí pro uživatele.

Nejběžnějšími artefakty digitální komprese jsou bloky DCT způsobené kompresním algoritmem diskrétní kosinové transformace (DCT) používaným v mnoha standardech digitálních médií , jako jsou formáty video souborů JPEG , MP3 a MPEG . Tyto artefakty komprese se objevují při použití silné komprese a často se vyskytují v běžných digitálních médiích, jako jsou DVD , běžné počítačové formáty souborů, jako jsou soubory JPEG, MP3 a MPEG, a v některých alternativách k kompaktním diskům , jako je formát MiniDisc od společnosti Sony . Nekomprimovaná média (jako jsou soubory Laserdiscs , Audio CD a WAV ) nebo bezztrátově komprimovaná média (například FLAC nebo PNG ) netrpí kompresními artefakty.

Minimalizace vnímatelných artefaktů je klíčovým cílem při implementaci algoritmu ztrátové komprese. Artefakty jsou však příležitostně záměrně vyráběny pro umělecké účely, styl známý jako glitch art nebo datamoshing.

Technicky vzato je kompresní artefakt zvláštní třídou chyb dat, která je obvykle důsledkem kvantizace ztrátové komprese dat. Kde se používá transformační kódování , obvykle předpokládá formu jedné ze základních funkcí transformačního prostoru kodéru.

snímky

Ilustrace vlivu komprese JPEG na mírně zašuměný obrázek se směsí textu a mezer. Text je snímek obrazovky z konverzace na Wikipedii s přidaným šumem (intenzita 10 v Paint.NET). Jeden snímek animace byl uložen jako JPEG (kvalita 90) a znovu načten. Oba snímky byly poté přiblíženy faktorem 4 (interpolace nejbližšího souseda).

Při provádění blokového kódování diskrétní kosinové transformace (DCT) pro kvantování , jako u obrázků komprimovaných ve formátu JPEG , se může objevit několik typů artefaktů.

  • Zvonění
  • Konturování
  • Posterizace
  • Hluk schodiště ( aliasing ) podél zakřivených hran
  • Blokovitost v „zaneprázdněných“ oblastech (artefakty hraničních bloků, někdy se jim říká makroblokování, prošívání nebo šachovnice)

Jiné ztrátové algoritmy, které používají shodu vzorů k deduplikaci podobných symbolů, jsou náchylné k zavádění těžko detekovatelných chyb v tištěném textu. Například mohou být nahrazena čísla „6“ a „8“. To bylo pozorováno, že se to stalo s JBIG2 u určitých kopírovacích strojů.

Blokujte hraniční artefakty

Artefakty blokového kódování v obrázku JPEG. Ploché bloky jsou způsobeny hrubým kvantováním. Diskontinuity na hranicích transformačních bloků jsou viditelné.

Při nízkých bitových rychlostech jakékoli ztrátové blokové kódovací schéma zavádí viditelné artefakty v pixelových blocích a na hranicích bloků. Tyto hranice mohou transformovat hranice bloků, hranice predikčních bloků nebo obojí a mohou se shodovat s hranicemi makrobloků . Pojem makroblokování se běžně používá bez ohledu na příčinu artefaktu. Mezi další názvy patří obklady, mozaiky, pixelování, prošívání a šachovnice.

Blokové artefakty jsou výsledkem samotného principu kódování blokové transformace . Transformace (například diskrétní kosinová transformace) je aplikována na blok pixelů a pro dosažení ztrátové komprese jsou transformační koeficienty každého bloku kvantovány . Čím nižší je přenosová rychlost, tím hrubší jsou koeficienty zastoupeny a čím více koeficientů je kvantováno na nulu. Statisticky mají obrázky více nízkofrekvenčního než vysokofrekvenčního obsahu, takže je to nízkofrekvenční obsah, který zůstává po kvantování, což má za následek rozmazané bloky s nízkým rozlišením. V nejextrémnějším případě je zachován pouze koeficient DC, tj. Koeficient, který představuje průměrnou barvu bloku, a transformační blok je po rekonstrukci pouze jednou barvou.

Protože je tento kvantizační proces aplikován individuálně v každém bloku, sousední bloky kvantifikují koeficienty odlišně. To vede k nespojitostem na hranicích bloků. Ty jsou nejviditelnější v plochých oblastech, kde je jen málo detailů k maskování efektu.

Redukce artefaktu obrazu

Byly navrženy různé přístupy ke snížení efektů komprese obrazu, ale pro použití standardizovaných technik komprese/dekomprese a zachování výhod komprese (například nižší náklady na přenos a skladování) se mnoho z těchto metod zaměřuje na „následné zpracování“-to je , zpracování obrázků při přijetí nebo prohlížení. Nebyla prokázána žádná technika následného zpracování, která by zlepšovala kvalitu obrazu ve všech případech; v důsledku toho nikdo nezískal široké přijetí, i když některé byly implementovány a používají se v proprietárních systémech. Mnoho programů pro úpravu fotografií má například vestavěné vlastní algoritmy redukce artefaktů JPEG. Spotřebitelské vybavení často nazývá toto následné zpracování „Redukce šumu MPEG“.

Hraniční artefakt v JPEG může být přeměněn na příjemnější „zrna“ ne nepodobná těm ve fotografických filmech s vysokým ISO. Místo pouhého vynásobení kvantovaných koeficientů kvantovacím krokem Q vztahujícím se k 2D frekvenci, inteligentní šum ve formě náhodného čísla v intervalu [- Q /2; Q /2] lze přidat k dekvantizovanému koeficientu. Tuto metodu lze přidat jako nedílnou součást dekompresorů JPEG pracujících na bilionech stávajících i budoucích obrázků JPEG. Nejedná se tedy o techniku ​​„postprocesingu“.

Problém s vyzváněním lze v době kódování omezit překročením hodnot DCT a sejmutím prstenů.

Posterizace se obecně děje pouze při nízké kvalitě, když je hodnotám DC přikládána příliš malá důležitost. Pomáhá ladění kvantizační tabulky.

Video

Příklad obrázku s artefakty kvůli chybě přenosu

Když se používá predikce pohybu, jako v MPEG-1 , MPEG-2 nebo MPEG-4 , artefakty komprese obvykle zůstávají na několika generacích dekomprimovaných snímků a pohybují se s optickým tokem obrazu, což vede ke zvláštnímu efektu, částečnému mezi malířským efektem a „špínou“, která se pohybuje s objekty ve scéně.

Chyby dat v komprimovaném bitovém toku, pravděpodobně v důsledku chyb přenosu, mohou vést k chybám podobným velkým chybám kvantování nebo mohou na krátkou dobu zcela narušit analýzu datového proudu, což vede k „rozpadu“ obrazu . Tam, kde v bitovém proudu došlo k hrubým chybám, dekodéry pokračují v používání aktualizací poškozeného obrazu na krátký interval, čímž vytvářejí efekt „duchového obrazu“, dokud neobdrží další nezávisle komprimovaný rámec. V kódování obrazu MPEG jsou tyto známé jako „ I-snímky “, přičemž „I“ znamená „intra“. Dokud nepřijde další I-rámec, dekodér může provádět skrytí chyb .

Artefakty hraničního bloku kompenzace pohybu

Na hranách bloků predikce kompenzace pohybu může dojít k nespojitostem hranic bloku. Při kompresi videa s kompenzací pohybu je aktuální obraz předpovídán přesouváním bloků (makrobloky, oddíly nebo predikční jednotky) pixelů z dříve dekódovaných rámců. Pokud dva sousední bloky používají různé pohybové vektory, dojde k přerušení na okraji mezi bloky.

Hluk komárů

Artefakty komprese videa zahrnují kumulativní výsledky komprese obsahujících statických obrazů, například vyzvánění nebo jiné zaneprázdnění okrajů v postupných statických obrázcích se objevují v sekvenci jako třpytivé rozmazání bodů kolem okrajů, nazývané komáří šum , protože připomínají komáry rojící se kolem objektu. Takzvaný „šum komárů“ je způsoben kompresním algoritmem diskrétní kosinové transformace (DCT) založeným na blocích, který se používá ve většině standardů kódování videa , jako jsou formáty MPEG .

Redukce video artefaktu

Artefakty na hranicích bloků lze snížit použitím filtru pro odblokování . Stejně jako v kódování statických obrázků je možné na výstup dekodéru použít post-processing filtr pro odblokování.

Při kódování videa předpovídaného pohybem s uzavřenou predikční smyčkou kodér používá výstup dekodéru jako predikční referenci, ze které se předpovídají budoucí snímky. Za tímto účelem kodér koncepčně integruje dekodér. Pokud tento „dekodér“ provádí odblokování, potom se odblokovaný obraz použije jako referenční obraz pro kompenzaci pohybu, což zlepšuje účinnost kódování tím, že se brání šíření blokových artefaktů mezi snímky. Toto se označuje jako filtr pro odblokování ve smyčce. Standardy, které specifikují filtr pro odblokování ve smyčce, zahrnují VC-1 , H.263 Annex J, H.264/AVC a H.265/HEVC .

Zvuk

Ztrátová komprese zvuku obvykle funguje s psychoakustickým modelem - modelem vnímání lidského sluchu. Ztrátové zvukové formáty obvykle zahrnují použití transformace časově/frekvenční domény, jako je například modifikovaná diskrétní kosinová transformace . U psychoakustického modelu jsou využívány maskovací efekty, jako je frekvenční maskování a časové maskování, takže zvuky, které by měly být nepostřehnutelné, nejsou zaznamenávány. Například obecně lidé nejsou schopni vnímat tichý tón hraný současně s podobným, ale hlasitějším tónem. Technika ztrátové komprese může tento tichý tón identifikovat a pokusit se jej odstranit. Kvantovací šum lze také „skrýt“ tam, kde by byl maskován výraznějšími zvuky. Při nízké kompresi se používá konzervativní psy-model s malými velikostmi bloků.

Když je psychoakustický model nepřesný, když je velikost transformačního bloku omezena nebo když je použita agresivní komprese, může to mít za následek kompresní artefakty. Kompresní artefakty v komprimovaném zvuku se typicky projevují jako vyzvánění, pre-echo , „artefakty ptáčků“, výpadky, chrastící, křiklavé, kovové vyzvánění, pocit pod vodou, syčení nebo „zrnitost“.

Příkladem kompresních artefaktů ve zvuku je potlesk v relativně vysoce komprimovaném zvukovém souboru (např. 96 kbit/s MP3). Obecně platí, že hudební tóny mají opakující se průběhy a předvídatelnější variace hlasitosti, zatímco potlesk je v zásadě náhodný, a proto je těžké jej komprimovat. Vysoce komprimovaný potlesk může mít „kovové vyzvánění“ a další kompresní artefakty.

Umělecké využití

Video závada umění

Artefakty komprese mohou být záměrně použity jako vizuální styl, někdy známý jako glitch art . Závada umění Rosy Menkman využívá kompresní artefakty , zejména bloky diskrétní kosinové transformace (bloky DCT), které se nacházejí ve většině formátů pro kompresi dat digitálních médií, jako jsou digitální obrázky JPEG a digitální zvuk MP3 . Na statických obrázcích je příkladem Jpegs od německého fotografa Thomase Ruffa , který používá záměrné artefakty JPEG jako základ stylu obrázku.

Ve videoartu se používá jedna technika datamoshingu , kde se prokládají dvě videa, takže se interpolují mezilehlé snímky ze dvou samostatných zdrojů. Další technika zahrnuje jednoduché překódování z jednoho ztrátového video formátu do druhého, který využívá rozdíl v tom, jak jednotlivé video kodeky zpracovávají pohybové a barevné informace. Tuto techniku ​​propagovali umělci Bertrand Planes ve spolupráci s Christianem Jacqueminem v roce 2006 s DivXPrime, Svenem Königem, Takeshi Muratou , Jacquesem Percontem a Paulem B. Davisem ve spolupráci s Paperradem a v poslední době ji použil David OReilly a v hudebních videích pro lanovky a od Nabila Elderkina v hudebním videu „ Welcome to Heartbreak “ pro Kanye West .

Existuje také žánr internetových memů, kde jsou často nesmyslné obrázky účelově silně komprimovány, někdy vícekrát, pro komediální efekt. Obrázky vytvořené touto technikou jsou často označovány jako „smažené“.

Viz také

Reference

externí odkazy