Statistická disperze - Statistical dispersion

Příklad vzorků ze dvou populací se stejným průměrem, ale odlišnou disperzí. Modrá populace je mnohem rozptýlenější než červená populace.

Ve statistikách je rozptyl (nazývaný také variabilita , rozptyl nebo rozpětí ) rozsah, v jakém je distribuce natažená nebo stlačená. Běžnými příklady opatření statistické disperze jsou rozptyl , standardní odchylka a mezikvartilní rozsah .

Rozptyl je v kontrastu s polohou nebo centrální tendencí a společně jsou nejpoužívanějšími vlastnostmi distribucí.

Opatření

Míra statistické disperze je nezáporné reálné číslo, které je nulové, pokud jsou všechna data stejná, a zvyšuje se s tím, jak jsou data různorodější.

Většina měr disperze má stejné jednotky jako měřené množství . Jinými slovy, pokud jsou měření v metrech nebo sekundách, je to také míra rozptylu. Mezi příklady disperzních opatření patří:

Ty jsou často používány (spolu s měřítek ) podle odhadů z parametrů měřítku , ve které funkci se nazývají odhady měřítku. Robustní měřítka jsou ta, která nejsou ovlivněna malým počtem odlehlých hodnot , a zahrnují IQR a MAD.

Všechny výše uvedené míry statistické disperze mají tu užitečnou vlastnost, že jsou místně invariantní a lineární v měřítku . To znamená, že pokud má náhodná proměnná X rozptyl S X, pak lineární transformace Y  =  aX  +  b pro reálné a a b by měla mít rozptyl S Y  = | a | S X , kde | a | je absolutní hodnota z , to znamená, že ignoruje předcházející záporné znaménko - .

Ostatní míry disperze jsou bezrozměrné . Jinými slovy, nemají žádné jednotky, i když samotná proměnná má jednotky. Tyto zahrnují:

Existují další míry rozptylu:

Některá opatření rozptylu mají speciální účely. Allan rozptyl může být použit pro aplikace, kde je hluk rozrušuje konvergence. Hadamardova rozptyl může být použita k vyrovnání lineárního citlivosti frekvence posunu.

U kategorických proměnných je méně běžné měřit rozptyl jediným číslem; viz kvalitativní variace . Jedním z opatření, které tak činí, je diskrétní entropie .

Prameny

Ve fyzikálních vědách může taková variabilita vyplývat z náhodných chyb měření: přístrojová měření často nejsou zcela přesná, tj. Reprodukovatelná , a při interpretaci a vykazování naměřených výsledků existuje další variabilita mezi hodnotiteli . Lze předpokládat, že měřená veličina je stabilní a že rozdíly mezi měřeními jsou způsobeny pozorovací chybou . Systém velkého počtu částic je charakterizován průměrnými hodnotami relativně malého počtu makroskopických veličin, jako je teplota, energie a hustota. Standardní odchylka je důležitým opatřením v teorii fluktuace, která vysvětluje mnoho fyzikálních jevů, včetně toho, proč je obloha modrá.

V biologických vědách je měřená veličina jen málokdy neměnná a stabilní a pozorovaná odchylka může být navíc vlastní tomuto jevu: Může to být způsobeno interindividuální variabilitou , tj. Odlišnými členy populace, které se navzájem liší. Také to může být způsobeno intraindividuální variabilitou , to znamená, že jeden a tentýž subjekt se liší v testech prováděných v různých časech nebo v jiných odlišných podmínkách. Takové typy variability jsou také vidět v aréně vyráběných produktů; i tam pečlivý vědec nachází variace.

V ekonomii , financích a dalších oborech se regresní analýza pokouší vysvětlit rozptyl závislé proměnné , obecně měřený její odchylkou, pomocí jedné nebo více nezávislých proměnných, z nichž každá má pozitivní rozptyl. Vysvětlený zlomek rozptylu se nazývá koeficient determinace .

Částečné uspořádání disperze

Střední konzervaci rozpětí (MPS) je změna z jedné rozdělení pravděpodobnosti A na jiné rozdělení pravděpodobnosti B, kde B je tvořena rozložení jednoho nebo více částech funkci, kterou má hustoty pravděpodobnosti, přičemž ponechává střední (očekávaná hodnota) beze změny. Koncept rozpětí zachovávajícího průměr poskytuje částečné uspořádání rozdělení pravděpodobnosti podle jejich rozptylů: ze dvou rozdělení pravděpodobnosti může být jedno hodnoceno tak, že má větší rozptyl než druhé, nebo alternativně ani jedno nemůže být hodnoceno jako mající větší rozptyl.

Viz také

Reference