Na druhou odchylky od průměru - Squared deviations from the mean

Čtvercové odchylky od průměru (SDM) jsou zahrnuty v různých výpočtech. V teorii a statistice pravděpodobnosti je definicí rozptylu buď očekávaná hodnota SDM (při uvažování teoretického rozdělení ), nebo jeho průměrná hodnota (pro skutečná experimentální data). Výpočty pro analýzu rozptylu zahrnují rozdělení součtu SDM.

Úvod

Porozumění použitým výpočtům je výrazně zlepšeno studiem statistické hodnoty

{\ displaystyle \ operatorname {E} (X ^ {2})}

, kde je operátor očekávané hodnoty.

{\ displaystyle \ operatorname {E}}

Pro náhodné veličiny se střední hodnota a rozptyl , ${\ displaystyle X}$ ${\ displaystyle \ mu}$ ${\ displaystyle \ sigma ^ {2}}$

{\ displaystyle \ sigma ^ {2} = \ operatorname {E} (X ^ {2}) - \ mu ^ {2}.}

Proto,

{\ displaystyle \ operatorname {E} (X ^ {2}) = \ sigma ^ {2} + \ mu ^ {2}.}

Z výše uvedeného lze odvodit následující:

{\ displaystyle \ operatorname {E} \ left (\ sum \ left (X ^ {2} \ right) \ right) = n \ sigma ^ {2} + n \ mu ^ {2},}

{\ displaystyle \ operatorname {E} \ left (\ left (\ sum X \ right) ^ {2} \ right) = n \ sigma ^ {2} + n ^ {2} \ mu ^ {2}.}

Rozptyl vzorku

Součet čtverců odchylek potřebných k výpočtu rozptylu vzorku (před rozhodnutím, zda vydělit n nebo n - 1) se nejsnadněji vypočítá jako

{\ displaystyle S = \ součet x ^ {2} - {\ frac {\ doleva (\ součet x \ doprava) ^ {2}} {n}}}

Ze dvou odvozených očekávání je nad očekávanou hodnotou této částky

{\ displaystyle \ operatorname {E} (S) = n \ sigma ^ {2} + n \ mu ^ {2} - {\ frac {n \ sigma ^ {2} + n ^ {2} \ mu ^ {2 }} {n}}}

z čehož vyplývá

{\ displaystyle \ operatorname {E} (S) = (n-1) \ sigma ^ {2}.}

To účinně dokazuje použití dělitele n - 1 při výpočtu objektivního odhadu vzorku σ ² .

Přepážka - analýza rozptylu

V situaci, kdy jsou k dispozici údaje pro k různých léčených skupin majících velikost n _i, kde i se pohybuje od 1 do k , se předpokládá, že očekávaný průměr každé skupiny je

{\ displaystyle \ operatorname {E} (\ mu _ {i}) = \ mu + T_ {i}}

a rozptyl každé léčené skupiny se nezměnil od rozptylu populace . ${\ displaystyle \ sigma ^ {2}}$

Podle nulové hypotézy, že léčba nemá žádný účinek, bude každá z nich nulová. ${\ displaystyle T_ {i}}$

Nyní je možné vypočítat tři součty čtverců:

Individuální

{\ displaystyle I = \ součet x ^ {2}}

{\ displaystyle \ operatorname {E} (I) = n \ sigma ^ {2} + n \ mu ^ {2}}

Ošetření

{\ displaystyle T = \ sum _ {i = 1} ^ {k} \ left (\ left (\ sum x \ right) ^ {2} / n_ {i} \ right)}

{\ displaystyle \ operatorname {E} (T) = k \ sigma ^ {2} + \ součet _ {i = 1} ^ {k} n_ {i} (\ mu + T_ {i}) ^ {2}}

{\ displaystyle \ operatorname {E} (T) = k \ sigma ^ {2} + n \ mu ^ {2} +2 \ mu \ sum _ {i = 1} ^ {k} (n_ {i} T_ { i}) + \ sum _ {i = 1} ^ {k} n_ {i} (T_ {i}) ^ {2}}

Při nulové hypotéze, že léčba nezpůsobuje žádné rozdíly a všechny jsou nulové, se očekávání zjednodušuje ${\ displaystyle T_ {i}}$

{\ displaystyle \ operatorname {E} (T) = k \ sigma ^ {2} + n \ mu ^ {2}.}

Kombinace

{\ displaystyle C = \ left (\ sum x \ right) ^ {2} / n}

{\ displaystyle \ operatorname {E} (C) = \ sigma ^ {2} + n \ mu ^ {2}}

Součty čtverců odchylek

Podle nulové hypotézy rozdíl jakékoli dvojice I , T a C neobsahuje pouze závislost na . ${\ displaystyle \ mu}$ ${\ displaystyle \ sigma ^ {2}}$

{\ displaystyle \ operatorname {E} (IC) = (n-1) \ sigma ^ {2}}

celkové čtvercové odchylky aka celkový součet čtverců

{\ displaystyle \ operatorname {E} (TC) = (k-1) \ sigma ^ {2}}

léčba na druhou odchylky aka vysvětlený součet čtverců

{\ displaystyle \ operatorname {E} (IT) = (nk) \ sigma ^ {2}}

zbytkové čtvercové odchylky aka zbytkový součet čtverců

Konstanty ( n - 1), ( k - 1) a ( n - k ) se obvykle označují jako počet stupňů volnosti .

Příklad

Ve velmi jednoduchém příkladu vychází 5 pozorování ze dvou ošetření. První léčba dává tři hodnoty 1, 2 a 3 a druhá léčba dává dvě hodnoty 4 a 6.

{\ displaystyle I = {\ frac {1 ^ {2}} {1}} + {\ frac {2 ^ {2}} {1}} + {\ frac {3 ^ {2}} {1}} + {\ frac {4 ^ {2}} {1}} + {\ frac {6 ^ {2}} {1}} = 66}

{\ displaystyle T = {\ frac {(1 + 2 + 3) ^ {2}} {3}} + {\ frac {(4 + 6) ^ {2}} {2}} = 12 + 50 = 62 }

{\ displaystyle C = {\ frac {(1 + 2 + 3 + 4 + 6) ^ {2}} {5}} = 256/5 = 51,2}

Dávat

Celková kvadratická odchylka = 66 - 51,2 = 14,8 se 4 stupni volnosti.

Odchylky léčby na druhou = 62 - 51,2 = 10,8 s 1 stupněm volnosti.

Zbytkové čtvercové odchylky = 66 - 62 = 4 se 3 stupni volnosti.

Obousměrná analýza rozptylu

Následující hypotetický příklad uvádí výnosy 15 rostlin, na které se vztahují dvě různé variace prostředí a tři různá hnojiva.

	Extra CO ₂	Extra vlhkost
Žádné hnojivo	7, 2, 1	7, 6
Dusičnan	11, 6	10, 7, 3
Fosfát	5, 3, 4	11, 4

Vypočítá se pět součtů čtverců:

Faktor	Výpočet	Součet	${\ displaystyle \ sigma ^ {2}}$
Individuální	${\ displaystyle 7 ^ {2} + 2 ^ {2} + 1 ^ {2} + 7 ^ {2} + 6 ^ {2} + 11 ^ {2} + 6 ^ {2} + 10 ^ {2} + 7 ^ {2} + 3 ^ {2} + 5 ^ {2} + 3 ^ {2} + 4 ^ {2} + 11 ^ {2} + 4 ^ {2}}$	641	15
Hnojivo × životní prostředí	${\ displaystyle {\ frac {(7 + 2 + 1) ^ {2}} {3}} + {\ frac {(7 + 6) ^ {2}} {2}} + {\ frac {(11+ 6) ^ {2}} {2}} + {\ frac {(10 + 7 + 3) ^ {2}} {3}} + {\ frac {(5 + 3 + 4) ^ {2}} { 3}} + {\ frac {(11 + 4) ^ {2}} {2}}}$	556,1667	6
Hnojivo	${\ displaystyle {\ frac {(7 + 2 + 1 + 7 + 6) ^ {2}} {5}} + {\ frac {(11 + 6 + 10 + 7 + 3) ^ {2}} {5 }} + {\ frac {(5 + 3 + 4 + 11 + 4) ^ {2}} {5}}}$	525.4	3
životní prostředí	${\ displaystyle {\ frac {(7 + 2 + 1 + 11 + 6 + 5 + 3 + 4) ^ {2}} {8}} + {\ frac {(7 + 6 + 10 + 7 + 3 + 11 +4) ^ {2}} {7}}}$	519,2679	2
Složený	${\ displaystyle {\ frac {(7 + 2 + 1 + 11 + 6 + 5 + 3 + 4 + 7 + 6 + 10 + 7 + 3 + 11 + 4) ^ {2}} {15}}}$	504,6	1

Nakonec lze vypočítat součet čtverců odchylek potřebných pro analýzu rozptylu .

Faktor	Součet	${\ displaystyle \ sigma ^ {2}}$	Celkový	životní prostředí	Hnojivo	Hnojivo × životní prostředí	Reziduální
Individuální	641	15	1				1
Hnojivo × životní prostředí	556,1667	6				1	-1
Hnojivo	525.4	3			1	-1
životní prostředí	519,2679	2		1		-1
Složený	504,6	1	-1	-1	-1	1

Na druhou odchylky			136,4	14,668	20.8	16,099	84,833
Stupně svobody			14	1	2	2	9

Viz také

Reference

^ Mood & Graybill: Úvod do teorie statistiky (McGraw Hill)

[1] Mood & Graybill: Úvod do teorie statistiky (McGraw Hill)

Languages

In other projects