Aritmetický průměr - Arithmetic mean


z Wikipedie, otevřené encyklopedie

V matematiky a statistiky , je aritmetický průměr ( / ˌ æ r ɪ t Vstup m ɛ t ɪ k m jsem n / , napětí na třetí slabiky „aritmetiky“), nebo jednoduše střední nebo průměrná když kontext je jasný, je součet kolekce čísel děleno počet čísel ve sbírce. Sbírka je často sada výsledků hodnocení pokusu nebo observační studie , nebo často soubor výsledky z průzkumu . Termín „aritmetický průměr“ je výhodné v některých kontextech matematiky a statistiky, protože pomáhá odlišit od jiných prostředků , jako je geometrický průměr a harmonický průměr .

Kromě matematiky a statistiky, je aritmetický průměr je často používán v mnoha různých oblastech, jako je ekonomie , antropologie a historie , a používá se téměř ve všech akademické pole, do určité míry. Například, příjem na obyvatele je aritmetický průměrný příjem národa populace.

Zatímco aritmetický průměr se často používá k vykazování centrální tendence , že se nejedná o robustní statistika , což znamená, že je do značné míry ovlivněn tím, odlehlých hodnot (hodnoty, které jsou mnohem větší nebo menší, než většina z hodnot). Je pozoruhodné, že na nerovnoměrné rozdělení , jako je rozdělení příjmů , u nichž příjmy málo lidí, jsou podstatně větší než u většiny lidové, je aritmetickým průměrem nemusí shodovat s něčí ponětí o „střední“ a robustní statistiku, jako je medián , může být lepší popis centrální tendence.

Definice

Aritmetický průměr (nebo znamená nebo průměr ), (číst bar ), je průměr hodnot .

Aritmetický průměr je nejčastěji používané a snadno srozumitelný míra centrální tendence v souboru dat . Ve statistikách, termín průměrná odkazuje na některého z opatření centrální tendence. Aritmetický průměr z řady pozorovaných dat je definována jako rovná součtu numerických hodnot každé pozorování děleno celkovým počtem pozorování. Symbolicky, máme-li soubor dat se skládá z hodnot , pak se aritmetický průměr je definována vzorcem:

(Viz shrnutí pro vysvětlení provozovatele sčítacího ).

Například uvažujme měsíční plat 10 zaměstnanců firmy: 2500, 2700, 2400, 2300, 2550, 2650, 2750, 2450, 2600, 2400. Aritmetický průměr je

V případě, že soubor dat je statistická populace (tj, se skládá z každé možné pozorování a ne jen jejich podmnožinu), pak je průměr této populace se nazývá populace znamená . V případě, že soubor dat je statistický vzorek (podmnožina populace), nazýváme statistika vyplývající z této výpočet je výběrový průměr .

motivační vlastnosti

Aritmetický průměr má několik vlastností, které dělají to užitečné, zvláště pokud míra centrální tendence. Tyto zahrnují:

  • Pokud čísla mít na mysli , potom . Vzhledem k tomu, je vzdálenost od daného počtu k průměru, jeden způsob, jak interpretovat tuto vlastnost je, jak říká, že čísla vlevo od střední hodnoty jsou vyváženy čísel napravo od střední hodnoty. Střední hodnota je pouze jediné číslo, pro které jsou zbytky (odchylky od odhadu) součet na nulu.
  • Je-li nutné použít jediné číslo jako „typický“ hodnoty pro sadu známých čísel , pak je aritmetický průměr čísel dělá to nejlepší, v tom smyslu, že minimalizuje součet čtverců odchylek od typické hodnoty: součet z . (Z toho vyplývá, že výběrový průměr je také nejlepší singl ukazatelem v tom smyslu, že nejmenší efektivní hodnota chyby .) Pokud je žádoucí aritmetický průměr populace čísel, pak je odhad toho, že je nestranný je aritmetický průměr vzorku vedoucí od obyvatelstva.

Kontrastují s mediánem

Aritmetický průměr může být porovnáno s mediánem. Medián je definován tak, že ne více než polovina hodnoty jsou větší než, a ne více než polovinu menší než medián. Pokud prvky v datech zvýšení aritmeticky , když je umístěn v nějakém pořadí, pak střední a aritmetický průměr jsou si rovny. Zvažte například vzorek dat . Průměr je , stejně jako medián. Nicméně, když vezmeme v úvahu vzorek, který nemůže být uspořádány tak, aby se zvýšila aritmeticky, jako je střední a aritmetický průměr může výrazně lišit. V tomto případě se aritmetický průměr je 6,2 a medián je 4. Obecně platí, že průměrná hodnota může výrazně lišit od většiny hodnot ve vzorku, a může být větší nebo menší, než většina z nich.

Existují aplikace tohoto jevu v mnoha oblastech. Například od roku 1980, střední příjem ve Spojených státech rostly pomaleji než aritmetický průměr výnosů.

zobecnění

vážený průměr

Vážený průměr nebo vážený průměr, je v průměru, ve kterém má smysl těžce některé datové body než jiné, v tom, že jsou dány větší váhu při výpočtu. Například, aritmetický průměr a je , nebo ekvivalentně . V kontrastu, vážený průměr, ve kterém první číslo obdrží, například dvakrát váhu jako druhá (možná proto, že se předpokládá, že se objeví dvakrát častěji v obecné populaci, z nichž byly odebrány vzorky těchto čísel) se vypočte . Zde závaží, které nutně částky, která má hodnotu jedna, jsou a , bývalé bytí dvakrát druhé. Všimněte si, že střední hodnota (někdy označován jako „nevážený průměr“ nebo „stejně vážený průměr“), může být interpretován jako speciální případ vážený průměr, ve kterém jsou všechny hmotnosti jsou navzájem rovné (rovnající se ve výše uvedeném příkladu, a rovnající se v takové situaci se čísla jsou v průměru).

Spojitá rozdělení pravděpodobnosti

Srovnání dvou log-normální rozdělení se stejnou střední ale odlišné šikmosti , což má za následek různé mediány a režimech .

Pokud číselnou vlastnost, a jakéhokoli vzorku dat z něj mohl vzít na jakoukoli hodnotu ze souvislého rozsahu, namísto, například, jen celá čísla, pak je pravděpodobnost řady spadající do nějakého rozsahu možných hodnot lze popsat integrací spojité rozdělení pravděpodobnosti po tomto rozmezí, i když je naivní pravděpodobnost pro množství vzorku se bere v jedné určité hodnoty z nekonečně mnoho, je nulová. Analogová váženého průměru v tomto kontextu, ve kterém existuje nekonečné množství možností pro přesné hodnoty proměnné v každém rozmezí, se nazývá střední hodnota rozdělení pravděpodobnosti . Nejvíce široce narazil rozdělení pravděpodobnosti se nazývá normální rozdělení ; má tu vlastnost, že všechna opatření své centrální tendence, zahrnující nejen střední, ale i zmíněnou medián a režim (tři M je), jsou navzájem stejné. Tato rovnost neplatí pro jiné rozdělení pravděpodobnosti, jak je znázorněno na lognormálního distribuci zde.

úhly

Zejména je třeba dbát při použití cyklických dat, například fází nebo úhlů . Naivně přičemž aritmetický průměr 1 ° a 359 ° dává výsledek 180 °. Toto je nesprávné ze dvou důvodů:

  • Za prvé, měření úhlové jsou definovány pouze do aditivní konstantou 360 ° (nebo 2n v případě měření v radiánech ). Tak by se dalo jako snadno volat tyto 1 ° a -1 ° nebo 361 ° a 719 °, z nichž každý poskytuje různý průměr.
  • Za druhé, v této situaci, 0 ° (ekvivalentně, 360 °) je geometricky lepší průměrná hodnota: je nižší disperze o tom (body jsou oba 1 ° od něj a 179 ° od 180 °, předpokládaný průměr).

Obecně aplikace, bude takové přehlédnutí vedlo k průměrné hodnoty uměle pohybující se směrem ke středu číselné řady. Řešením tohoto problému je použití formulace optimalizace ( viz. , Definuje průměr jako centrální bod: bod, v němž jeden má nejnižší disperze), a předefinovat rozdíl jako modulární vzdálenosti (tj, vzdálenost na kružnici : tak modulární vzdálenost mezi 1 ° a 359 ° je 2 °, a to 358 ° C).

Symboly a kódování

Aritmetický průměr je často označován bar, například jako v (čtení bar ).

Některé software ( textové procesory , webové prohlížeče ) se nemusí správně zobrazovat symbol X. Například, symbol X v HTML je vlastně kombinací dvou kódů - základna písmeno x plus kód řádku nad (a # 772: nebo ¯).

V některých textech, jako například soubory PDF , symbol X může být nahrazen cent symbolem (¢) ( Unicode & # 162), když zkopírovány do textového procesoru, jako je Microsoft Word .

viz též

Reference

Další čtení

externí odkazy