Odchylka kořenové střední hodnoty- Root-mean-square deviation

Root-mean-square odchylka ( RMSD ) nebo root-mean-square error ( RMSE ) je často používá pro měření rozdílů mezi hodnotami (vzorek nebo hodnoty populace), předpovězených modelem nebo odhadu a zjištěných hodnot. RMSD představuje druhou odmocninu druhého výběrového momentu rozdílů mezi predikovanými hodnotami a pozorovanými hodnotami nebo kvadratický průměr těchto rozdílů. Tyto odchylky se nazývají rezidua, pokud jsou výpočty prováděny na vzorku dat, který byl použit pro odhad, a nazývají se chyby (nebo chyby predikce) při výpočtu mimo vzorek. RMSD slouží k agregaci velikostí chyb v predikcích pro různé datové body do jediné míry prediktivní síly. RMSD je mírou přesnosti , která porovnává chyby předpovídání různých modelů pro konkrétní datovou sadu a nikoli mezi datovými sadami, protože závisí na měřítku.

RMSD je vždy nezáporné a hodnota 0 (v praxi téměř nikdy nedosažena) by naznačovala dokonalé přizpůsobení datům. Obecně platí, že nižší RMSD je lepší než vyšší. Srovnání mezi různými typy dat by však bylo neplatné, protože míra závisí na rozsahu použitých čísel.

RMSD je druhá odmocnina průměru čtvercových chyb. Účinek každé chyby na RMSD je úměrný velikosti čtvercové chyby; tedy větší chyby mají na RMSD nepřiměřeně velký vliv. V důsledku toho je RMSD citlivý na odlehlé hodnoty.

Vzorec

RMSD odhadu s ohledem na odhadovaný parametr je definován jako druhá odmocnina střední odmocniny :

Pro nezaujatý odhad je RMSD druhá odmocnina rozptylu, známá jako standardní odchylka .

RMSD predikovaných hodnot pro časy t z a regrese je závislé proměnné s proměnnými pozorovaných přes T- krát, je vypočítán pro T různých predikce jako druhá odmocnina střední hodnoty druhých mocnin odchylek:

(Pro regrese na průřezových datech je dolní index t nahrazen i a T je nahrazen n .)

V některých oborech se RMSD používá ke srovnání rozdílů mezi dvěma věcmi, které se mohou lišit, přičemž ani jedna není přijímána jako „standard“. Například při měření průměrného rozdílu mezi dvěma časovými řadami a se vzorec stává

Normalizace

Normalizace RMSD usnadňuje srovnání mezi datovými sadami nebo modely s různými měřítky. Ačkoli v literatuře neexistují konzistentní způsoby normalizace, běžnými možnostmi jsou průměr nebo rozsah (definovaný jako maximální hodnota minus minimální hodnota) naměřených dat:

nebo .

Tato hodnota se běžně označuje jako normalizovaná odchylka nebo chyba odmocniny (NRMSD nebo NRMSE) a často se vyjadřuje v procentech, kde nižší hodnoty označují menší reziduální rozptyl. V mnoha případech, zejména u menších vzorků, je rozsah vzorku pravděpodobně ovlivněn velikostí vzorku, což by bránilo srovnávání.

Další možnou metodou, jak z RMSD udělat užitečnější srovnávací opatření, je rozdělit RMSD na mezikvartilní rozsah . Při dělení RMSD s IQR se normalizovaná hodnota stane méně citlivou na extrémní hodnoty v cílové proměnné.

kde

s a kde CDF −1 je kvantilová funkce .

Při normalizaci střední hodnotou měření lze použít termín variační koeficient RMSD, CV (RMSD), aby se zabránilo nejednoznačnosti. To je analogické variačnímu koeficientu, když místo standardní odchylky zaujímá RMSD .

Znamená absolutní chyba

Někteří vědci doporučili použít střední absolutní chybu (MAE) namísto Root Mean Square Deviation. MAE má výhody v interpretovatelnosti oproti RMSD. MAE je průměr absolutních hodnot chyb. MAE je v zásadě snáze pochopitelný než druhá odmocnina průměru čtvercových chyb. Kromě toho každá chyba ovlivňuje MAE přímo úměrně k absolutní hodnotě chyby, což není případ RMSD.

Aplikace

Viz také

Reference

  1. ^ Hyndman, Rob J .; Koehler, Anne B. (2006). „Další pohled na míry přesnosti předpovědi“. International Journal of Forecasting . 22 (4): 679–688. CiteSeerX  10.1.1.154.9771 . doi : 10,1016/j.ijforecast.2006.03.001 .
  2. ^ a b Pontius, Robert; Thontteh, Olufunmilayo; Chen, Hao (2008). „Součásti informací pro porovnání více rozlišení mezi mapami, které sdílejí skutečnou proměnnou“. Environmentální ekologická statistika . 15 (2): 111–142. doi : 10,1007/s10651-007-0043-r .
  3. ^ Willmott, Cort; Matsuura, Kenji (2006). „O použití dimenzovaných opatření chyby k vyhodnocení výkonu prostorových interpolátorů“. International Journal of Geographic Information Science . 20 : 89–102. doi : 10,1080/13658810500286976 .
  4. ^ "Wiki - Pobřežní Inlets Research Program (CIRP) - Statistiky" . Citováno 4. února 2015 .
  5. ^ "FAQ: Jaký je variační koeficient?" . Citováno 19. února 2019 .
  6. ^ Armstrong, J. Scott; Collopy, Fred (1992). „Chybová opatření pro zobecnění metod předpovědí: empirická srovnání“ (PDF) . International Journal of Forecasting . 8 (1): 69–80. CiteSeerX  10.1.1.423.508 . doi : 10,1016/0169-2070 (92) 90008-w .
  7. ^ Anderson, MP; Woessner, WW (1992). Applied Groundwater Modeling: Simulation of Flow and Advective Transport (2. vyd.). Akademický tisk.
  8. ^ Ensemble Neural Network Model
  9. ^ ANSI/BPI-2400-S-2012: Standard Practice for Standardized Qualification of Whole-House Energy Savings Predictions by Calibration to Energy Use History