Odchylka kořenové střední hodnoty- Root-mean-square deviation
Statistika |
---|
Root-mean-square odchylka ( RMSD ) nebo root-mean-square error ( RMSE ) je často používá pro měření rozdílů mezi hodnotami (vzorek nebo hodnoty populace), předpovězených modelem nebo odhadu a zjištěných hodnot. RMSD představuje druhou odmocninu druhého výběrového momentu rozdílů mezi predikovanými hodnotami a pozorovanými hodnotami nebo kvadratický průměr těchto rozdílů. Tyto odchylky se nazývají rezidua, pokud jsou výpočty prováděny na vzorku dat, který byl použit pro odhad, a nazývají se chyby (nebo chyby predikce) při výpočtu mimo vzorek. RMSD slouží k agregaci velikostí chyb v predikcích pro různé datové body do jediné míry prediktivní síly. RMSD je mírou přesnosti , která porovnává chyby předpovídání různých modelů pro konkrétní datovou sadu a nikoli mezi datovými sadami, protože závisí na měřítku.
RMSD je vždy nezáporné a hodnota 0 (v praxi téměř nikdy nedosažena) by naznačovala dokonalé přizpůsobení datům. Obecně platí, že nižší RMSD je lepší než vyšší. Srovnání mezi různými typy dat by však bylo neplatné, protože míra závisí na rozsahu použitých čísel.
RMSD je druhá odmocnina průměru čtvercových chyb. Účinek každé chyby na RMSD je úměrný velikosti čtvercové chyby; tedy větší chyby mají na RMSD nepřiměřeně velký vliv. V důsledku toho je RMSD citlivý na odlehlé hodnoty.
Vzorec
RMSD odhadu s ohledem na odhadovaný parametr je definován jako druhá odmocnina střední odmocniny :
Pro nezaujatý odhad je RMSD druhá odmocnina rozptylu, známá jako standardní odchylka .
RMSD predikovaných hodnot pro časy t z a regrese je závislé proměnné s proměnnými pozorovaných přes T- krát, je vypočítán pro T různých predikce jako druhá odmocnina střední hodnoty druhých mocnin odchylek:
(Pro regrese na průřezových datech je dolní index t nahrazen i a T je nahrazen n .)
V některých oborech se RMSD používá ke srovnání rozdílů mezi dvěma věcmi, které se mohou lišit, přičemž ani jedna není přijímána jako „standard“. Například při měření průměrného rozdílu mezi dvěma časovými řadami a se vzorec stává
Normalizace
Normalizace RMSD usnadňuje srovnání mezi datovými sadami nebo modely s různými měřítky. Ačkoli v literatuře neexistují konzistentní způsoby normalizace, běžnými možnostmi jsou průměr nebo rozsah (definovaný jako maximální hodnota minus minimální hodnota) naměřených dat:
- nebo .
Tato hodnota se běžně označuje jako normalizovaná odchylka nebo chyba odmocniny (NRMSD nebo NRMSE) a často se vyjadřuje v procentech, kde nižší hodnoty označují menší reziduální rozptyl. V mnoha případech, zejména u menších vzorků, je rozsah vzorku pravděpodobně ovlivněn velikostí vzorku, což by bránilo srovnávání.
Další možnou metodou, jak z RMSD udělat užitečnější srovnávací opatření, je rozdělit RMSD na mezikvartilní rozsah . Při dělení RMSD s IQR se normalizovaná hodnota stane méně citlivou na extrémní hodnoty v cílové proměnné.
- kde
s a kde CDF −1 je kvantilová funkce .
Při normalizaci střední hodnotou měření lze použít termín variační koeficient RMSD, CV (RMSD), aby se zabránilo nejednoznačnosti. To je analogické variačnímu koeficientu, když místo standardní odchylky zaujímá RMSD .
Znamená absolutní chyba
Někteří vědci doporučili použít střední absolutní chybu (MAE) namísto Root Mean Square Deviation. MAE má výhody v interpretovatelnosti oproti RMSD. MAE je průměr absolutních hodnot chyb. MAE je v zásadě snáze pochopitelný než druhá odmocnina průměru čtvercových chyb. Kromě toho každá chyba ovlivňuje MAE přímo úměrně k absolutní hodnotě chyby, což není případ RMSD.
Aplikace
- V meteorologii vidět, jak efektivně matematický model předpovídá chování atmosféry .
- V bioinformatice je odchylka kořenových průměrů atomových poloh měřítkem průměrné vzdálenosti mezi atomy superponovaných proteinů .
- Při konstrukci léčiva založeného na struktuře je RMSD měřítkem rozdílu mezi krystalickou konformací ligandové konformace a dokovací predikcí.
- V ekonomii se RMSD používá k určení, zda ekonomický model odpovídá ekonomickým ukazatelům . Někteří odborníci tvrdili, že RMSD je méně spolehlivý než relativní absolutní chyba.
- V experimentální psychologii se RMSD používá k posouzení, jak dobře matematické nebo výpočetní modely chování vysvětlují empiricky pozorované chování.
- V GIS je RMSD jedním z opatření používaných k posouzení přesnosti prostorové analýzy a dálkového průzkumu.
- V hydrogeologii se k vyhodnocení kalibrace modelu podzemní vody používají RMSD a NRMSD.
- V zobrazovací vědě je RMSD součástí špičkového poměru signálu k šumu , což je měřítko používané k posouzení, jak dobře metoda rekonstrukce obrazu funguje vzhledem k původnímu obrazu.
- Ve výpočetní neurovědě se RMSD používá k posouzení, jak dobře se systém daný model naučí.
- V proteinové nukleární magnetické rezonanční spektroskopii se RMSD používá jako měřítko pro odhad kvality získaného svazku struktur.
- Přihlášky k ceně Netflix byly posouzeny pomocí RMSD z nezveřejněných „skutečných“ hodnot testovací datové sady.
- Při simulaci spotřeby energie budov se pomocí RMSE a CV (RMSE) kalibrují modely pro měření výkonu budov.
- V rentgenové krystalografii se RMSD (a RMSZ) používá k měření odchylky molekulárních vnitřních souřadnic odchylujících se od hodnot knihovny omezení.
Viz také
- Střední kvadratická
- Znamená absolutní chyba
- Průměrná absolutní odchylka
- Znamená podepsaná odchylka
- Střední kvadratická odchylka
- Čtvercové odchylky
- Chyby a zbytky ve statistikách
Reference
- ^ Hyndman, Rob J .; Koehler, Anne B. (2006). „Další pohled na míry přesnosti předpovědi“. International Journal of Forecasting . 22 (4): 679–688. CiteSeerX 10.1.1.154.9771 . doi : 10,1016/j.ijforecast.2006.03.001 .
- ^ a b Pontius, Robert; Thontteh, Olufunmilayo; Chen, Hao (2008). „Součásti informací pro porovnání více rozlišení mezi mapami, které sdílejí skutečnou proměnnou“. Environmentální ekologická statistika . 15 (2): 111–142. doi : 10,1007/s10651-007-0043-r .
- ^ Willmott, Cort; Matsuura, Kenji (2006). „O použití dimenzovaných opatření chyby k vyhodnocení výkonu prostorových interpolátorů“. International Journal of Geographic Information Science . 20 : 89–102. doi : 10,1080/13658810500286976 .
- ^ "Wiki - Pobřežní Inlets Research Program (CIRP) - Statistiky" . Citováno 4. února 2015 .
- ^ "FAQ: Jaký je variační koeficient?" . Citováno 19. února 2019 .
- ^ Armstrong, J. Scott; Collopy, Fred (1992). „Chybová opatření pro zobecnění metod předpovědí: empirická srovnání“ (PDF) . International Journal of Forecasting . 8 (1): 69–80. CiteSeerX 10.1.1.423.508 . doi : 10,1016/0169-2070 (92) 90008-w .
- ^ Anderson, MP; Woessner, WW (1992). Applied Groundwater Modeling: Simulation of Flow and Advective Transport (2. vyd.). Akademický tisk.
- ^ Ensemble Neural Network Model
- ^ ANSI/BPI-2400-S-2012: Standard Practice for Standardized Qualification of Whole-House Energy Savings Predictions by Calibration to Energy Use History