Střední absolutní rozdíl - Mean absolute difference

Průměrná absolutní rozdíl (jednorozměrný) je měřítkem statistické disperze , která se rovná průměru absolutní rozdíl dvou nezávislých hodnot vycházejících z rozdělení pravděpodobnosti . Související statistikou je relativní průměrný absolutní rozdíl , který je průměrným absolutním rozdílem děleným aritmetickým průměrem a roven dvojnásobku Giniho koeficientu . Průměrná absolutní rozdíl je také známý jako absolutní průměrným rozdílem (nezaměňovat s absolutní hodnotou na střední podepsané rozdílu ) a Giniho průměrným rozdílem (GMD). Střední absolutní rozdíl je někdy označen Δ nebo jako MD.

Definice

Průměrná absolutní rozdíl je definována jako „průměrný“ nebo „střední“, formálně očekávanou hodnotou , absolutního rozdílu dvou náhodných proměnných X a Y nezávisle na sobě a stejně rozdělené se stejnou (neznámé) distribuce se dále nazývají Q .

Výpočet

Konkrétně v diskrétním případě

  • Pro náhodný vzorek velikosti n populace rovnoměrně rozdělené podle Q lze podle zákona o celkovém očekávání (empirický) průměrný absolutní rozdíl posloupnosti hodnot vzorku y i , i = 1 až n vypočítat jako aritmetický průměr absolutní hodnoty všech možných rozdílů:

V souvislém případě

Relativní průměr absolutní rozdíl

Když má rozdělení pravděpodobnosti konečný a nenulový aritmetický průměr AM, relativní průměrný absolutní rozdíl, někdy označovaný Δ nebo RMD, je definován vztahem

Relativní průměrný absolutní rozdíl kvantifikuje střední absolutní rozdíl ve srovnání s velikostí průměru a je bezrozměrnou veličinou. Relativní průměrný absolutní rozdíl se rovná dvojnásobku Giniho koeficientu, který je definován pomocí Lorenzovy křivky . Tento vztah dává komplementární perspektivy jak relativnímu průměrnému absolutnímu rozdílu, tak Giniho koeficientu, včetně alternativních způsobů výpočtu jejich hodnot.

Vlastnosti

Průměrný absolutní rozdíl je neměnný vůči překladům a negaci a mění se úměrně pozitivnímu škálování. To znamená, že pokud X je náhodná proměnná a c je konstanta:

  • MD ( X + c ) = MD ( X ),
  • MD ( - X ) = MD ( X ), a
  • MD ( c X ) = | c | MD ( X ).

Relativní průměrný absolutní rozdíl je neměnný vůči pozitivnímu škálování, dojíždí s negací a při překladu se mění v poměru k poměru původního a přeloženého aritmetického prostředku. To znamená, že pokud X je náhodná proměnná a c je konstanta:

  • RMD ( X + c ) = RMD ( X ) · průměr ( X ) / (průměr ( X ) + c ) = RMD ( X ) / (1 + c / průměr ( X )) pro c m - průměr ( X ),
  • RMD ( - X ) = −RMD ( X ), a
  • RMD ( c X ) = RMD ( X ) pro c > 0.

Pokud má náhodná proměnná kladný průměr, pak její relativní průměrný absolutní rozdíl bude vždy větší nebo roven nule. Pokud navíc může náhodná proměnná nabývat pouze hodnot, které jsou větší nebo rovny nule, pak její relativní průměrný absolutní rozdíl bude menší než 2.

Ve srovnání se standardní odchylkou

Průměrný absolutní rozdíl je dvojnásobek stupnice L (druhý L-moment ), zatímco standardní odchylka je druhá odmocnina rozptylu kolem průměru (druhý konvenční centrální moment). Rozdíly mezi L-momenty a konvenčními momenty jsou nejprve vidět při porovnání průměrného absolutního rozdílu a standardní odchylky (první L-moment a první konvenční moment jsou průměr).

Jak standardní odchylky a střední míra absolutní rozdíl disperze, jak rozprostřené jsou hodnoty populace nebo pravděpodobnosti rozdělení. Průměrný absolutní rozdíl není definován z hlediska konkrétní míry centrální tendence, zatímco standardní odchylka je definována z hlediska odchylky od aritmetického průměru. Protože standardní odchylka umocňuje její rozdíly, má tendenci dávat větší váhu větším rozdílům a menší váhu menším rozdílům ve srovnání se středním absolutním rozdílem. Když je aritmetický průměr konečný, bude průměrný absolutní rozdíl také konečný, i když je standardní odchylka nekonečná. Některá konkrétní srovnání najdete v příkladech .

Nedávno představená standardní odchylka vzdálenosti hraje podobnou roli jako střední absolutní rozdíl, ale standardní odchylka vzdálenosti pracuje se středovými vzdálenostmi. Viz také E-statistika .

Odhady vzorků

Pro náhodný vzorek S z náhodné veličiny X , sestávající z n hodnot y i , statistika

je konzistentní a nezaujatý odhad MD ( X ). Statistiky:

je konzistentní odhad RMD ( X ), ale není obecně nezaujatý .

Intervaly spolehlivosti pro RMD ( X ) lze vypočítat pomocí technik vzorkování bootstrapu.

Obecně neexistuje nestranný odhad pro RMD ( X ), částečně kvůli obtížnosti nalezení nezaujatého odhadu pro vynásobení inverzní hodnotou průměru. Například i když je známo, že vzorek je odebrán z náhodné proměnné X ( p ) pro neznámé p a X ( p ) - 1Bernoulliho rozdělení , takže Pr ( X ( p ) = 1) = 1 -  p a Pr ( X ( p ) = 2) = p , pak

RMD ( X ( p )) = 2 p (1 -  p )/(1 +  p ) .

Ale očekávaná hodnota jakéhokoli odhadu R ( S ) RMD ( X ( p )) bude mít tvar:

kde r i jsou konstanty. Takže E ( R ( S )) se nikdy nemůže rovnat RMD ( X ( p )) pro všechny p mezi 0 a 1.

Příklady

Příklady průměrného absolutního rozdílu a relativního průměrného absolutního rozdílu
Rozdělení Parametry Znamenat Standardní odchylka Znamená absolutní rozdíl Relativní průměr absolutní rozdíl
Nepřetržitá uniforma
Normální ;
Exponenciální
Pareto ;
Gama ; † † † †
Gama ;
Gama ;
Gama ;
Gama ;
Bernoulli
Student's t , 2 df nedefinováno
† je regulovaná neúplná funkce Beta

Viz také

Reference