Čtvercové odchylky od průměru (SDM) jsou zahrnuty v různých výpočtech. V teorii a statistice pravděpodobnosti je definicí rozptylu buď očekávaná hodnota SDM (při uvažování teoretického rozdělení ), nebo jeho průměrná hodnota (pro skutečná experimentální data). Výpočty pro analýzu rozptylu zahrnují rozdělení součtu SDM.
Úvod
Porozumění použitým výpočtům je výrazně zlepšeno studiem statistické hodnoty
E
(
X
2
)
{\ displaystyle \ operatorname {E} (X ^ {2})}
, kde je operátor očekávané hodnoty.
E
{\ displaystyle \ operatorname {E}}
Pro náhodné veličiny se střední hodnota a rozptyl ,
X
{\ displaystyle X}
μ
{\ displaystyle \ mu}
σ
2
{\ displaystyle \ sigma ^ {2}}
σ
2
=
E
(
X
2
)
-
μ
2
.
{\ displaystyle \ sigma ^ {2} = \ operatorname {E} (X ^ {2}) - \ mu ^ {2}.}
Proto,
E
(
X
2
)
=
σ
2
+
μ
2
.
{\ displaystyle \ operatorname {E} (X ^ {2}) = \ sigma ^ {2} + \ mu ^ {2}.}
Z výše uvedeného lze odvodit následující:
E
(
∑
(
X
2
)
)
=
n
σ
2
+
n
μ
2
,
{\ displaystyle \ operatorname {E} \ left (\ sum \ left (X ^ {2} \ right) \ right) = n \ sigma ^ {2} + n \ mu ^ {2},}
E
(
(
∑
X
)
2
)
=
n
σ
2
+
n
2
μ
2
.
{\ displaystyle \ operatorname {E} \ left (\ left (\ sum X \ right) ^ {2} \ right) = n \ sigma ^ {2} + n ^ {2} \ mu ^ {2}.}
Rozptyl vzorku
Součet čtverců odchylek potřebných k výpočtu rozptylu vzorku (před rozhodnutím, zda vydělit n nebo n - 1) se nejsnadněji vypočítá jako
S
=
∑
X
2
-
(
∑
X
)
2
n
{\ displaystyle S = \ součet x ^ {2} - {\ frac {\ doleva (\ součet x \ doprava) ^ {2}} {n}}}
Ze dvou odvozených očekávání je nad očekávanou hodnotou této částky
E
(
S
)
=
n
σ
2
+
n
μ
2
-
n
σ
2
+
n
2
μ
2
n
{\ displaystyle \ operatorname {E} (S) = n \ sigma ^ {2} + n \ mu ^ {2} - {\ frac {n \ sigma ^ {2} + n ^ {2} \ mu ^ {2 }} {n}}}
z čehož vyplývá
E
(
S
)
=
(
n
-
1
)
σ
2
.
{\ displaystyle \ operatorname {E} (S) = (n-1) \ sigma ^ {2}.}
To účinně dokazuje použití dělitele n - 1 při výpočtu objektivního odhadu vzorku σ 2 .
Přepážka - analýza rozptylu
V situaci, kdy jsou k dispozici údaje pro k různých léčených skupin majících velikost n i, kde i se pohybuje od 1 do k , se předpokládá, že očekávaný průměr každé skupiny je
E
(
μ
i
)
=
μ
+
T
i
{\ displaystyle \ operatorname {E} (\ mu _ {i}) = \ mu + T_ {i}}
a rozptyl každé léčené skupiny se nezměnil od rozptylu populace .
σ
2
{\ displaystyle \ sigma ^ {2}}
Podle nulové hypotézy, že léčba nemá žádný účinek, bude každá z nich nulová.
T
i
{\ displaystyle T_ {i}}
Nyní je možné vypočítat tři součty čtverců:
Individuální
Já
=
∑
X
2
{\ displaystyle I = \ součet x ^ {2}}
E
(
Já
)
=
n
σ
2
+
n
μ
2
{\ displaystyle \ operatorname {E} (I) = n \ sigma ^ {2} + n \ mu ^ {2}}
Ošetření
T
=
∑
i
=
1
k
(
(
∑
X
)
2
/
n
i
)
{\ displaystyle T = \ sum _ {i = 1} ^ {k} \ left (\ left (\ sum x \ right) ^ {2} / n_ {i} \ right)}
E
(
T
)
=
k
σ
2
+
∑
i
=
1
k
n
i
(
μ
+
T
i
)
2
{\ displaystyle \ operatorname {E} (T) = k \ sigma ^ {2} + \ součet _ {i = 1} ^ {k} n_ {i} (\ mu + T_ {i}) ^ {2}}
E
(
T
)
=
k
σ
2
+
n
μ
2
+
2
μ
∑
i
=
1
k
(
n
i
T
i
)
+
∑
i
=
1
k
n
i
(
T
i
)
2
{\ displaystyle \ operatorname {E} (T) = k \ sigma ^ {2} + n \ mu ^ {2} +2 \ mu \ sum _ {i = 1} ^ {k} (n_ {i} T_ { i}) + \ sum _ {i = 1} ^ {k} n_ {i} (T_ {i}) ^ {2}}
Při nulové hypotéze, že léčba nezpůsobuje žádné rozdíly a všechny jsou nulové, se očekávání zjednodušuje
T
i
{\ displaystyle T_ {i}}
E
(
T
)
=
k
σ
2
+
n
μ
2
.
{\ displaystyle \ operatorname {E} (T) = k \ sigma ^ {2} + n \ mu ^ {2}.}
Kombinace
C
=
(
∑
X
)
2
/
n
{\ displaystyle C = \ left (\ sum x \ right) ^ {2} / n}
E
(
C
)
=
σ
2
+
n
μ
2
{\ displaystyle \ operatorname {E} (C) = \ sigma ^ {2} + n \ mu ^ {2}}
Součty čtverců odchylek
Podle nulové hypotézy rozdíl jakékoli dvojice I , T a C neobsahuje pouze závislost na .
μ
{\ displaystyle \ mu}
σ
2
{\ displaystyle \ sigma ^ {2}}
E
(
Já
-
C
)
=
(
n
-
1
)
σ
2
{\ displaystyle \ operatorname {E} (IC) = (n-1) \ sigma ^ {2}}
celkové čtvercové odchylky aka celkový součet čtverců
E
(
T
-
C
)
=
(
k
-
1
)
σ
2
{\ displaystyle \ operatorname {E} (TC) = (k-1) \ sigma ^ {2}}
léčba na druhou odchylky aka vysvětlený součet čtverců
E
(
Já
-
T
)
=
(
n
-
k
)
σ
2
{\ displaystyle \ operatorname {E} (IT) = (nk) \ sigma ^ {2}}
zbytkové čtvercové odchylky aka zbytkový součet čtverců
Konstanty ( n - 1), ( k - 1) a ( n - k ) se obvykle označují jako počet stupňů volnosti .
Příklad
Ve velmi jednoduchém příkladu vychází 5 pozorování ze dvou ošetření. První léčba dává tři hodnoty 1, 2 a 3 a druhá léčba dává dvě hodnoty 4 a 6.
Já
=
1
2
1
+
2
2
1
+
3
2
1
+
4
2
1
+
6
2
1
=
66
{\ displaystyle I = {\ frac {1 ^ {2}} {1}} + {\ frac {2 ^ {2}} {1}} + {\ frac {3 ^ {2}} {1}} + {\ frac {4 ^ {2}} {1}} + {\ frac {6 ^ {2}} {1}} = 66}
T
=
(
1
+
2
+
3
)
2
3
+
(
4
+
6
)
2
2
=
12
+
50
=
62
{\ displaystyle T = {\ frac {(1 + 2 + 3) ^ {2}} {3}} + {\ frac {(4 + 6) ^ {2}} {2}} = 12 + 50 = 62 }
C
=
(
1
+
2
+
3
+
4
+
6
)
2
5
=
256
/
5
=
51.2
{\ displaystyle C = {\ frac {(1 + 2 + 3 + 4 + 6) ^ {2}} {5}} = 256/5 = 51,2}
Dávat
Celková kvadratická odchylka = 66 - 51,2 = 14,8 se 4 stupni volnosti.
Odchylky léčby na druhou = 62 - 51,2 = 10,8 s 1 stupněm volnosti.
Zbytkové čtvercové odchylky = 66 - 62 = 4 se 3 stupni volnosti.
Obousměrná analýza rozptylu
Následující hypotetický příklad uvádí výnosy 15 rostlin, na které se vztahují dvě různé variace prostředí a tři různá hnojiva.
Extra CO 2
Extra vlhkost
Žádné hnojivo
7, 2, 1
7, 6
Dusičnan
11, 6
10, 7, 3
Fosfát
5, 3, 4
11, 4
Vypočítá se pět součtů čtverců:
Faktor
Výpočet
Součet
σ
2
{\ displaystyle \ sigma ^ {2}}
Individuální
7
2
+
2
2
+
1
2
+
7
2
+
6
2
+
11
2
+
6
2
+
10
2
+
7
2
+
3
2
+
5
2
+
3
2
+
4
2
+
11
2
+
4
2
{\ displaystyle 7 ^ {2} + 2 ^ {2} + 1 ^ {2} + 7 ^ {2} + 6 ^ {2} + 11 ^ {2} + 6 ^ {2} + 10 ^ {2} + 7 ^ {2} + 3 ^ {2} + 5 ^ {2} + 3 ^ {2} + 4 ^ {2} + 11 ^ {2} + 4 ^ {2}}
641
15
Hnojivo × životní prostředí
(
7
+
2
+
1
)
2
3
+
(
7
+
6
)
2
2
+
(
11
+
6
)
2
2
+
(
10
+
7
+
3
)
2
3
+
(
5
+
3
+
4
)
2
3
+
(
11
+
4
)
2
2
{\ displaystyle {\ frac {(7 + 2 + 1) ^ {2}} {3}} + {\ frac {(7 + 6) ^ {2}} {2}} + {\ frac {(11+ 6) ^ {2}} {2}} + {\ frac {(10 + 7 + 3) ^ {2}} {3}} + {\ frac {(5 + 3 + 4) ^ {2}} { 3}} + {\ frac {(11 + 4) ^ {2}} {2}}}
556,1667
6
Hnojivo
(
7
+
2
+
1
+
7
+
6
)
2
5
+
(
11
+
6
+
10
+
7
+
3
)
2
5
+
(
5
+
3
+
4
+
11
+
4
)
2
5
{\ displaystyle {\ frac {(7 + 2 + 1 + 7 + 6) ^ {2}} {5}} + {\ frac {(11 + 6 + 10 + 7 + 3) ^ {2}} {5 }} + {\ frac {(5 + 3 + 4 + 11 + 4) ^ {2}} {5}}}
525.4
3
životní prostředí
(
7
+
2
+
1
+
11
+
6
+
5
+
3
+
4
)
2
8
+
(
7
+
6
+
10
+
7
+
3
+
11
+
4
)
2
7
{\ displaystyle {\ frac {(7 + 2 + 1 + 11 + 6 + 5 + 3 + 4) ^ {2}} {8}} + {\ frac {(7 + 6 + 10 + 7 + 3 + 11 +4) ^ {2}} {7}}}
519,2679
2
Složený
(
7
+
2
+
1
+
11
+
6
+
5
+
3
+
4
+
7
+
6
+
10
+
7
+
3
+
11
+
4
)
2
15
{\ displaystyle {\ frac {(7 + 2 + 1 + 11 + 6 + 5 + 3 + 4 + 7 + 6 + 10 + 7 + 3 + 11 + 4) ^ {2}} {15}}}
504,6
1
Nakonec lze vypočítat součet čtverců odchylek potřebných pro analýzu rozptylu .
Faktor
Součet
σ
2
{\ displaystyle \ sigma ^ {2}}
Celkový
životní prostředí
Hnojivo
Hnojivo × životní prostředí
Reziduální
Individuální
641
15
1
1
Hnojivo × životní prostředí
556,1667
6
1
-1
Hnojivo
525.4
3
1
-1
životní prostředí
519,2679
2
1
-1
Složený
504,6
1
-1
-1
-1
1
Na druhou odchylky
136,4
14,668
20.8
16,099
84,833
Stupně svobody
14
1
2
2
9
Viz také
Reference
^ Mood & Graybill: Úvod do teorie statistiky (McGraw Hill)
<img src="https://en.wikipedia.org/wiki/Special:CentralAutoLogin/start?type=1x1" alt="" title="" width="1" height="1" style="border: none; position: absolute;">