Předpokládaný průměr - Assumed mean

Ve statistice je předpokládaným průměrem metoda výpočtu aritmetického průměru a standardní odchylky souboru dat. Zjednodušuje ruční výpočet přesných hodnot. Jeho zájem je dnes hlavně historický, ale lze jej použít k rychlému odhadu těchto statistik. Existují i ​​jiné metody rychlého výpočtu, které jsou vhodnější pro počítače, které také zajišťují přesnější výsledky než běžné metody.

Příklad

Za prvé: Hledá se průměr následujících čísel:

219, 223, 226, 228, 231, 234, 235, 236, 240, 241, 244, 247, 249, 255, 262

Předpokládejme, že začneme s věrohodným počátečním odhadem, že průměr je asi 240. Potom jsou odchylky od tohoto „předpokládaného“ průměru následující:

−21, −17, −14, −12, −9, −6, −5, −4, 0, 1, 4, 7, 9, 15, 22

Při sčítání zjistíte, že:

22 a −21 téměř zrušeno, ponecháno +1,
15 a −17 téměř zruší, takže −2,
9 a −9 zrušit,
7 + 4 zruší −6 - 5,

a tak dále. Zůstane nám součet −30. Průměr z těchto 15 odchylky od uvažovaného průměru je tedy -30/15 = -2. Proto je třeba přidat předpokládaný průměr, abychom získali správný průměr:

správný průměr = 240 - 2 = 238.

Metoda

Metoda závisí na odhadu průměru a zaokrouhlování na snadnou hodnotu, se kterou lze vypočítat. Tato hodnota se poté odečte od všech hodnot vzorku. Když jsou vzorky klasifikovány do stejných rozsahů velikostí, je vybrána centrální třída a počet rozsahů z toho je použit ve výpočtech. Například pro výšky lidí může být jako předpokládaná střední hodnota použita hodnota 1,75 m.

Pro soubor dat s předpokládaným průměrem x 0 předpokládejme:

Pak

nebo pro standardní směrodatnou odchylku pomocí Besselovy korekce :

Příklad použití rozsahů tříd

Tam, kde existuje velký počet vzorků, lze získat rychlý rozumný odhad střední a standardní odchylky seskupením vzorků do tříd pomocí stejných rozsahů velikostí. To zavádí chybu kvantování, ale je obvykle dostatečně přesná pro většinu účelů, pokud se používá 10 nebo více tříd.

Například s výjimkou,

167,8 175,4 176,1 166 174,7 170,2 178,9 180,4 174,6 174,5 182,4 173,4 167,4 170,7 180,6 169,6 176,2 176,3 175,1 178,7 167,2 180,2 180,3 164,7 167,9 179,6 164,9 173,2 180,3 168 175,5 172,9 182,2 166,7 172,4 181,9 175,6 17,6 176 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,6 17,17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 18 17 163,3 172,5 163,4 165,9 178,2 174,6 174,3 170,5 169,7 176,2 175,1 177 173,5 173,6 174,3 174,4 171,1 173,3 164,6 173 177,9 166,5 159,6 170,5 174,7 182 172,7 175,9 171,5 167,1 176,9 181,7 170,7 177,5 170,9 178,1 174,3 173,3 169,2 178,2 179,4 187,6 186,4 178,1 174 177,1 163,3 178,1 179,1 175,6

Minimum a maximum jsou 159,6 a 187,6, můžeme je seskupit následujícím způsobem zaokrouhlením čísel dolů. Velikost třídy (CS) je 3. Předpokládaný průměr je střed rozsahu od 174 do 177, což je 175,5. Rozdíly se počítají ve třídách.

Pozorovaná čísla v rozmezí
Rozsah počítat frekvence třída rozdíl frekvence × rozdíl frekvence × rozdíl 2
159—161 / 1 -5 -5 25
162—164 //// / 6 -4 -24 96
165—167 //// //// 10 -3 -30 90
168—170 //// //// /// 13 -2 -26 52
171—173 //// //// //// / 16 -1 -16 16
174—176 //// //// //// //// //// 25 0 0 0
177—179 //// //// //// / 16 1 16 16
180—182 //// //// / 11 2 22 44
183—185 0 3 0 0
186—188 // 2 4 8 32
Součet N = 100 A = -55 B = 371

Průměr se pak odhaduje na

což je velmi blízko skutečnému průměru 173,846.

Směrodatná odchylka se odhaduje na

Reference