Špičkový poměr signálu k šumu - Peak signal-to-noise ratio

Špičkový poměr signálu k šumu ( PSNR ) je technický termín pro poměr mezi maximálním možným výkonem signálu a výkonem rušivého šumu, který ovlivňuje věrnost jeho reprezentace. Protože mnoho signálů má velmi široký dynamický rozsah , PSNR se obvykle vyjadřuje jako logaritmická veličina pomocí decibelové stupnice.

PSNR se běžně používá ke kvantifikaci kvality rekonstrukce obrázků a videa podléhajících ztrátové kompresi .

Definice

PSNR se nejsnadněji definuje pomocí střední kvadratické chyby ( MSE ). Vzhledem k bezhlučnému monochromatickému obrazu m × n I a jeho hlučné aproximaci K je MSE definována jako:

PSNR (v dB ) je definována jako:

Zde MAX I je maximální možná pixelová hodnota obrazu. Když jsou pixely reprezentovány pomocí 8 bitů na vzorek, je to 255. Obecněji, když jsou vzorky reprezentovány pomocí lineárního PCM s B bity na vzorek, MAX I je 2 B -1.

Aplikace v barevných obrázcích

U barevných obrazů se třemi hodnotami RGB na pixel je definice PSNR stejná, kromě toho, že MSE je součet všech rozdílů hodnot na druhou (nyní pro každou barvu, tj. Třikrát tolik rozdílů než u černobílého obrazu) děleno velikostí obrazu a tři. Alternativně je u barevných obrazů obraz převeden do jiného barevného prostoru a PSNR je hlášeno proti každému kanálu daného barevného prostoru, např. YCbCr nebo HSL .

Odhad kvality pomocí PSNR

PSNR se nejčastěji používá k měření kvality rekonstrukce ztrátových kompresních kodeků (např. Pro kompresi obrazu ). Signál v tomto případě jsou původní data a šum je chyba způsobená kompresí. Při porovnávání kompresních kodeků je PSNR přiblížením lidského vnímání kvality rekonstrukce.

Typické hodnoty pro PSNR ve ztrátové kompresi obrazu a videa jsou mezi 30 a 50 dB, za předpokladu, že bitová hloubka je 8  bitů , kde vyšší je lepší. Kvalita zpracování 12bitových obrazů je považována za vysokou, když je hodnota PSNR 60 dB nebo vyšší. Pro 16bitová data jsou typické hodnoty pro PSNR mezi 60 a 80 dB. Přijatelné hodnoty pro ztrátu kvality bezdrátového přenosu jsou považovány za přibližně 20 dB až 25 dB.

Při absenci šumu jsou dva obrazy I a K identické, a tedy MSE je nula. V tomto případě je PSNR nekonečný (nebo nedefinovaný, viz dělení nulou ).

Originální nekomprimovaný obrázek
Q = 90, PSNR 45,53 dB
Q = 30, PSNR 36,81 dB
Q = 10, PSNR 31,45 dB
Příklad hodnot luma PSNR pro komprimovaný obraz cjpeg na různých úrovních kvality.

Porovnání výkonu

Ačkoli vyšší PSNR obecně naznačuje, že rekonstrukce má vyšší kvalitu, v některých případech nemusí. S rozsahem platnosti této metriky je třeba být velmi opatrní; je pouze přesvědčivě platný, pokud se používá k porovnání výsledků ze stejného kodeku (nebo typu kodeku) a stejného obsahu.

Obecně se ukázalo, že PSNR vykazuje špatný výkon ve srovnání s jinými metrikami kvality, pokud jde o odhad kvality obrázků a zejména videí vnímaných lidmi.

Varianty

PSNR-HVS je rozšíření PSNR, které zahrnuje vlastnosti lidského vizuálního systému, jako je vnímání kontrastu .

PSNR-HVS-M vylepšuje PSNR-HVS dodatečným zohledněním vizuálního maskování . Ve studii z roku 2007 poskytl s velkým náskokem lepší aproximaci hodnocení lidské vizuální kvality než PSNR a SSIM . Bylo také prokázáno, že má výraznou výhodu oproti DCTune a PSNR-HVS.

Viz také

Reference