Statistická disperze - Statistical dispersion
Ve statistikách je rozptyl (nazývaný také variabilita , rozptyl nebo rozpětí ) rozsah, v jakém je distribuce natažená nebo stlačená. Běžnými příklady opatření statistické disperze jsou rozptyl , standardní odchylka a mezikvartilní rozsah .
Rozptyl je v kontrastu s polohou nebo centrální tendencí a společně jsou nejpoužívanějšími vlastnostmi distribucí.
Opatření
Míra statistické disperze je nezáporné reálné číslo, které je nulové, pokud jsou všechna data stejná, a zvyšuje se s tím, jak jsou data různorodější.
Většina měr disperze má stejné jednotky jako měřené množství . Jinými slovy, pokud jsou měření v metrech nebo sekundách, je to také míra rozptylu. Mezi příklady disperzních opatření patří:
- Standardní odchylka
- Mezikvartilní rozsah (IQR)
- Rozsah
- Průměrný absolutní rozdíl (také známý jako Giniho průměrný absolutní rozdíl)
- Medián absolutní odchylky (MAD)
- Průměrná absolutní odchylka (nebo jednoduše nazývaná průměrná odchylka)
- Standardní odchylka vzdálenosti
Ty jsou často používány (spolu s měřítek ) podle odhadů z parametrů měřítku , ve které funkci se nazývají odhady měřítku. Robustní měřítka jsou ta, která nejsou ovlivněna malým počtem odlehlých hodnot , a zahrnují IQR a MAD.
Všechny výše uvedené míry statistické disperze mají tu užitečnou vlastnost, že jsou místně invariantní a lineární v měřítku . To znamená, že pokud má náhodná proměnná X rozptyl S X, pak lineární transformace Y = aX + b pro reálné a a b by měla mít rozptyl S Y = | a | S X , kde | a | je absolutní hodnota z , to znamená, že ignoruje předcházející záporné znaménko - .
Ostatní míry disperze jsou bezrozměrné . Jinými slovy, nemají žádné jednotky, i když samotná proměnná má jednotky. Tyto zahrnují:
- Variační koeficient
- Kvartilní koeficient disperze
- Relativní průměrný rozdíl rovnající se dvojnásobku Giniho koeficientu
- Entropie : Zatímco entropie diskrétní proměnné je na místě invariantní a nezávislá na měřítku, a proto není měřítkem disperze ve výše uvedeném smyslu, entropie spojité proměnné je na místě invariantní a aditivní v měřítku: Pokud je Hz entropie spojitá proměnná z a z = ax+b , pak Hz = Hx+log (a) .
Existují další míry rozptylu:
- Variance (druhá mocnina směrodatné odchylky)-umístění neměnné, ale ne lineární v měřítku.
- Poměr rozptylu k průměru -většinou se používá pro počítání dat, když se používá termín koeficient disperze a když je tento poměr bezrozměrný , protože údaje o počtu jsou samy bezrozměrné, jinak ne.
Některá opatření rozptylu mají speciální účely. Allan rozptyl může být použit pro aplikace, kde je hluk rozrušuje konvergence. Hadamardova rozptyl může být použita k vyrovnání lineárního citlivosti frekvence posunu.
U kategorických proměnných je méně běžné měřit rozptyl jediným číslem; viz kvalitativní variace . Jedním z opatření, které tak činí, je diskrétní entropie .
Prameny
Ve fyzikálních vědách může taková variabilita vyplývat z náhodných chyb měření: přístrojová měření často nejsou zcela přesná, tj. Reprodukovatelná , a při interpretaci a vykazování naměřených výsledků existuje další variabilita mezi hodnotiteli . Lze předpokládat, že měřená veličina je stabilní a že rozdíly mezi měřeními jsou způsobeny pozorovací chybou . Systém velkého počtu částic je charakterizován průměrnými hodnotami relativně malého počtu makroskopických veličin, jako je teplota, energie a hustota. Standardní odchylka je důležitým opatřením v teorii fluktuace, která vysvětluje mnoho fyzikálních jevů, včetně toho, proč je obloha modrá.
V biologických vědách je měřená veličina jen málokdy neměnná a stabilní a pozorovaná odchylka může být navíc vlastní tomuto jevu: Může to být způsobeno interindividuální variabilitou , tj. Odlišnými členy populace, které se navzájem liší. Také to může být způsobeno intraindividuální variabilitou , to znamená, že jeden a tentýž subjekt se liší v testech prováděných v různých časech nebo v jiných odlišných podmínkách. Takové typy variability jsou také vidět v aréně vyráběných produktů; i tam pečlivý vědec nachází variace.
V ekonomii , financích a dalších oborech se regresní analýza pokouší vysvětlit rozptyl závislé proměnné , obecně měřený její odchylkou, pomocí jedné nebo více nezávislých proměnných, z nichž každá má pozitivní rozptyl. Vysvětlený zlomek rozptylu se nazývá koeficient determinace .
Částečné uspořádání disperze
Střední konzervaci rozpětí (MPS) je změna z jedné rozdělení pravděpodobnosti A na jiné rozdělení pravděpodobnosti B, kde B je tvořena rozložení jednoho nebo více částech funkci, kterou má hustoty pravděpodobnosti, přičemž ponechává střední (očekávaná hodnota) beze změny. Koncept rozpětí zachovávajícího průměr poskytuje částečné uspořádání rozdělení pravděpodobnosti podle jejich rozptylů: ze dvou rozdělení pravděpodobnosti může být jedno hodnoceno tak, že má větší rozptyl než druhé, nebo alternativně ani jedno nemůže být hodnoceno jako mající větší rozptyl.
Viz také
- Průměrný
- Kruhová disperze
- Kvalitativní variace
- Nejistota měření
- Robustní měřítko
- Souhrnné statistiky