Okraj chyby - Margin of error

Hustoty pravděpodobnosti hlasování různých velikostí, z nichž každá je barevně odlišena na 95% interval spolehlivosti (níže), rozpětí chyby (vlevo) a velikost vzorku (vpravo). Každý interval odráží rozsah, ve kterém je možné mít 95% jistotu, že lze nalézt skutečné procento, vzhledem k uvedenému procentu 50%. Tolerance chyb je polovina je interval spolehlivosti (také je poloměr intervalu). Čím větší je vzorek, tím menší je chyba. Také, čím dále od 50% hlášeného procenta, tím menší je chybovost.

Tolerance chyb je statistika, vyjadřující množství náhodné výběrové chyby ve výsledcích průzkumu . Čím větší je chybovost, tím menší jistotu by měl mít člověk, že výsledek hlasování bude odrážet výsledek průzkumu celé populace . Hranice chyby bude kladná, kdykoli je populace neúplně odebrána a výsledná míra má pozitivní rozptyl , to znamená, že se míra liší .

Termín mez chyby se často používá v kontextech bez průzkumu k označení pozorovací chyby při vykazování měřených veličin. To je také používáno v hovorové řeči se odkazovat na množství prostoru nebo množství flexibility jeden mohl mít při dosahování cíle. Například jej ve sportu často používají komentátoři při popisu, jak velká přesnost je zapotřebí k dosažení cíle, bodů nebo výsledku. Bowling pin používá ve Spojených státech je 4,75 palce široký, a míč je 8,5 palce široký, takže by se dalo říci, nadhazovač má 21,75 palce toleranci chyb při pokusu zasáhnout konkrétní pin vydělat extra (například 1 pin zbývající na jízdním pruhu).

Pojem

Vezměme si jednoduchý ano / ne hlasování jako vzorek respondentů čerpaných z populace vykazujících procento z ano odpovědí. Chtěli bychom vědět, jak blízko je skutečný výsledek průzkumu celé populace , aniž bychom jej museli provádět. Pokud bychom hypoteticky provedli průzkum nad následujícími vzorky respondentů (nově získanými od ), očekávali bychom, že tyto následné výsledky budou normálně distribuovány . Tolerance chyb popisuje vzdálenost, ve které se očekává, že specifikované procento těchto výsledků, které se liší od . ${\ displaystyle P}$ ${\ displaystyle n}$ ${\ displaystyle N {\ text {,}} (n << N)}$ ${\ displaystyle p}$ ${\ displaystyle p}$ ${\ displaystyle N}$ ${\ displaystyle P}$ ${\ displaystyle n}$ ${\ displaystyle N}$ ${\ displaystyle p_ {1}, p_ {2}, \ ldots}$ ${\ displaystyle {\ overline {p}}}$ ${\ displaystyle {\ overline {p}}}$

Podle pravidla 68-95-99.7 bychom očekávali, že 95% výsledků bude spadat do přibližně dvou standardních odchylek ( ) na obě strany skutečného průměru . Tento interval se nazývá interval spolehlivosti a poloměr (polovina intervalu) se nazývá okraj chyby , což odpovídá 95% úrovni spolehlivosti . ${\ displaystyle p_ {1}, p_ {2}, \ ldots}$ ${\ Displaystyle \ pm 2 \ sigma _ {P}}$ ${\ displaystyle {\ overline {p}}}$

Obecně platí, že na úrovni spolehlivosti má vzorek velikosti populace s očekávanou standardní odchylkou rezervu chyb ${\ displaystyle \ gamma}$ ${\ displaystyle n}$ ${\ Displaystyle \ sigma}$

{\ Displaystyle MOE _ {\ gamma} = z _ {\ gamma} \ times {\ sqrt {\ frac {\ sigma ^{2}} {n}}}}

kde označuje kvantil (obvykle také z-skóre ) a je standardní chybou . ${\ displaystyle z _ {\ gamma}}$ ${\ Displaystyle {\ sqrt {\ frac {\ sigma ^{2}} {n}}}}$

Standardní odchylka a standardní chyba

Očekávali bychom, že normálně distribuované hodnoty budou mít standardní odchylku, která se nějak mění s . Čím menší , tím širší okraj. Tomu se říká standardní chyba . ${\ displaystyle p_ {1}, p_ {2}, \ ldots}$ ${\ displaystyle n}$ ${\ displaystyle n}$ ${\ displaystyle \ sigma _ {\ overline {p}}}$

U jediného výsledku našeho průzkumu předpokládáme, že a že všechny následující výsledky společně budou mít odchylku . ${\ displaystyle p = {\ overline {p}}}$ ${\ displaystyle p_ {1}, p_ {2}, \ ldots}$ ${\ Displaystyle \ sigma _ {P}^{2} = P (1-P)}$

{\ Displaystyle {\ text {Standardní chyba}} = \ sigma _ {\ overline {p}} \ cca {\ sqrt {\ frac {\ sigma _ {P}^{2}} {n}}} \ cca { \ sqrt {\ frac {p (1-p)} {n}}}}

Všimněte si, že to odpovídá rozptylu Bernoulliho distribuce . ${\ displaystyle p (1-p)}$

Maximální chybovost při různých úrovních spolehlivosti

Pro úroveň spolehlivosti existuje odpovídající interval spolehlivosti o průměru , tj. Interval, ve kterém by měly hodnoty s pravděpodobností klesat . Přesné hodnoty jsou dány kvantilovou funkcí normálního rozdělení (které pravidlo 68-95-99.7 přibližuje). ${\ displaystyle \ gamma}$ ${\ Displaystyle \ mu \ pm z _ {\ gamma} \ sigma}$ ${\ Displaystyle [\ mu -z _ {\ gamma} \ sigma, \ mu +z _ {\ gamma} \ sigma]}$ ${\ displaystyle P}$ ${\ displaystyle \ gamma}$ ${\ displaystyle z _ {\ gamma}}$

Všimněte si, že je undefined for , to znamená, je undefined, as is . ${\ displaystyle z _ {\ gamma}}$ ${\ displaystyle | \ gamma | \ geq 1}$ ${\ displaystyle z_ {1.00}}$ ${\ displaystyle z_ {1.10}}$

${\ displaystyle \ gamma}$	${\ displaystyle z _ {\ gamma}}$	${\ displaystyle \ gamma}$	${\ displaystyle z _ {\ gamma}}$
0,68	0,994 457 883 210	0,999	3,290 526 731 492
0,90	1,644 853 626 951	0,9999	3,890 591 886 413
0,95	1.959963984540	0,99999	4,417 173 413 469
0,98	2,326 347 874 041	0,999999	4,891 638 475 699
0,99	2,575 829 303 549	0,9999999	5,326 723 886 384
0,995	2,807 033 768 344	0,99999999	5,730 728 868 236
0,997	2,967 737 925 342	0,999999999	6,109 410 204 869

Protokolovejte grafy velikosti vs vzorku n a úrovně spolehlivosti γ . Šipky ukazují, že maximální chyba okraje pro velikost vzorku 1000 je ± 3,1% při 95% úrovni spolehlivosti a ± 4,1% při 99%. Vložená parabola ilustruje vztah mezi at a at . V tomto případě MOE ₉₅ (0,71) ≈ 0,9 × ± 3,1% ≈ ± 2,8%.

{\ displaystyle MOE _ {\ gamma} (0,5)}

{\ Displaystyle \ sigma _ {p}^{2} = pp^{2}}

{\ Displaystyle \ sigma _ {p}^{2}}

{\ displaystyle p = 0,71}

{\ displaystyle \ sigma _ {max}^{2}}

{\ displaystyle p = 0,5}

Vzhledem k tomu, v , můžeme libovolně nastavit , spočítat , a získat maximální toleranci chyb pro v dané hladině spolehlivosti a vzorkovací velikostí , a to i před tím, než se skutečné výsledky. S ${\ Displaystyle \ max \ sigma _ {P}^{2} = \ max P (1-P) = 0,25}$ ${\ displaystyle p = 0,5}$ ${\ displaystyle p = {\ overline {p}} = 0,5}$ ${\ displaystyle \ sigma _ {P}}$ ${\ displaystyle \ sigma _ {\ overline {p}}}$ ${\ displaystyle z _ {\ gamma} \ sigma _ {\ overline {p}}}$ ${\ displaystyle P}$ ${\ displaystyle \ gamma}$ ${\ displaystyle n}$ ${\ displaystyle p = 0,5, n = 1013}$

{\ Displaystyle MOE_ {95} (0,5) = z_ {0,95} \ sigma _ {\ overline {p}} \ zhruba z_ {0,95} {\ sqrt {\ frac {\ sigma _ {P}^{2}} { n}}} = 1,96 {\ sqrt {\ frac {.25} {n}}} = 0,98/{\ sqrt {n}} = \ pm 3,1 \%}

{\ Displaystyle MOE_ {99} (0,5) = z_ {0,99} \ sigma _ {\ overline {p}} \ zhruba z_ {0,99} {\ sqrt {\ frac {\ sigma _ {P}^{2}} { n}}} = 2,58 {\ sqrt {\ frac {.25} {n}}} = 1,29/{\ sqrt {n}} = \ pm 4,1 \%}

Také užitečné pro všechny hlášené ${\ displaystyle MOE_ {95}}$

{\ displaystyle MOE_ {99} = {\ frac {z_ {0,99}} {z_ {0,95}}} MOE_ {95} \ cca 1,3 \ krát MOE_ {95}}

Specifické chyby

Pokud má hlasování více procentních výsledků (například hlasování měřící jednu preferenci s více možnostmi výběru), bude mít výsledek nejblíže 50% nejvyšší chybovost. Obvykle je to toto číslo, které je vykazováno jako rezerva chyby pro celý průzkum. Představte si, že ankety zprávy jsou ${\ displaystyle P}$ ${\ displaystyle p_ {a}, p_ {b}, p_ {c}}$ ${\ Displaystyle 71 \%, 27 \%, 2 \%, n = 1013}$

{\ Displaystyle MOE_ {95} (P_ {a}) = z_ {0,95} \ sigma _ {\ overline {p_ {a}}} \ cca 1,96 {\ sqrt {\ frac {p_ {a} (1-p_ { a})} {n}}} = 0,89/{\ sqrt {n}} = \ pm 2,8 \%}

(jako na obrázku výše)

{\ Displaystyle MOE_ {95} (P_ {b}) = z_ {0,95} \ sigma _ {\ overline {p_ {b}}} \ cca 1,96 {\ sqrt {\ frac {p_ {b} (1-p_ { b})} {n}}} = 0,87/{\ sqrt {n}} = \ pm 2,7 \%}

{\ displaystyle MOE_ {95} (P_ {c}) = z_ {0,95} \ sigma _ {\ overline {p_ {c}}} \ cca 1,96 {\ sqrt {\ frac {p_ {c} (1-p_ { c})} {n}}} = 0,27/{\ sqrt {n}} = \ pm 0,8 \%}

Jak se dané procento blíží extrémům 0%nebo 100%, jeho chyba se blíží ± 0%.

Srovnání procent

Představte si, že multiple-choice poll zprávy jsou . Jak je popsáno výše, tolerance chyb hlášeny pro hlasování by obvykle bylo , jak je nejblíže k 50%. Populární pojem statistické kravaty nebo statistického mrtvého tepla se však netýká přesnosti jednotlivých výsledků, ale pořadí výsledků. Který je v prvním? ${\ displaystyle P}$ ${\ displaystyle p_ {a}, p_ {b}, p_ {c}}$ ${\ Displaystyle 46 \%, 42 \%, 12 \%, n = 1013}$ ${\ displaystyle MOE_ {95} (P_ {a})}$ ${\ displaystyle p_ {a}}$

Pokud bychom hypoteticky provedli průzkum nad následujícími vzorky respondentů (nově získanými od ) a oznámili výsledek , mohli bychom použít standardní chybu rozdílu, abychom pochopili, jak se očekává pokles . K tomu musíme použít součet rozptylů, abychom získali novou rozptyl , ${\ displaystyle P}$ ${\ displaystyle n}$ ${\ displaystyle N}$ ${\ displaystyle p_ {w} = p_ {a} -p_ {b}}$ ${\ displaystyle p_ {w_ {1}}, p_ {w_ {2}}, p_ {w_ {3}}, \ ldots}$ ${\ displaystyle {\ overline {p_ {w}}}}$ ${\ Displaystyle \ sigma _ {P_ {w}}^{2}}$

{\ Displaystyle \ sigma _ {P_ {w}}^{2} = \ sigma _ {P_ {a} -P_ {b}}^{2} = \ sigma _ {P_ {a}}^{2}+ \ sigma _ {P_ {b}}^{2} -2 \ sigma _ {P_ {a}, P_ {b}} = p_ {a} (1-p_ {a})+p_ {b} (1- p_ {b})+2p_ {a} p_ {b}}

kde je kovariance o a . ${\ Displaystyle \ sigma _ {P_ {a}, P_ {b}} =-P_ {a} P_ {b}}$ ${\ displaystyle P_ {a}}$ ${\ displaystyle P_ {b}}$

Po zjednodušení tedy

{\ Displaystyle {\ text {Standardní chyba rozdílu}} = \ sigma _ {\ overline {w}} \ cca {\ sqrt {\ frac {\ sigma _ {P_ {w}}^{2}} {n} }} = {\ sqrt {\ frac {p_ {a}+p_ {b}-(p_ {a} -p_ {b})^{2}} {n}}} = 0,029, P_ {w} = P_ {a} -P_ {b}}

{\ Displaystyle MOE_ {95} (P_ {a}) = z_ {0,95} \ sigma _ {\ overline {p_ {a}}} \ cca \ pm {3,1 \%}}

{\ displaystyle MOE_ {95} (P_ {w}) = z_ {0,95} \ sigma _ {\ overline {w}} \ cca \ pm {5,8 \%}}

Všimněte si, že to předpokládá, že se blíží k konstantě, to znamená, že respondenti si vybírá buď A nebo B se téměř nikdy vybral C (takže i v blízkém okolí je dokonale záporně koreloval ). Se třemi nebo více možnostmi v těsnějším souboji se stává výběr správného vzorce pro složitější. ${\ displaystyle P_ {c}}$ ${\ displaystyle P_ {a}}$ ${\ displaystyle P_ {b}}$ ${\ Displaystyle \ sigma _ {P_ {w}}^{2}}$

Vliv konečné velikosti populace

Vzorce výše pro okraj chyby předpokládají, že existuje nekonečně velká populace, a proto nezávisí na velikosti populace , ale pouze na velikosti vzorku . Podle teorie odběru vzorků je tento předpoklad rozumný, když je odběrová frakce malá. Tolerance chyb pro určité metody odběru vzorků je v podstatě stejná bez ohledu na to, zda zkoumané populace je velikost školy, město, stát, nebo země, pokud je odběr frakce je malý. ${\ displaystyle N}$ ${\ displaystyle n}$

V případech, kdy je část vzorku větší (v praxi větší než 5%), mohou analytici upravit rozpětí chyb pomocí konečné korekce populace, aby se zohlednila přidaná přesnost získaná vzorkováním mnohem většího procenta populace. FPC lze vypočítat pomocí vzorce

{\ displaystyle \ operatorname {FPC} = {\ sqrt {\ frac {Nn} {N-1}}}}}

... a pokud by bylo provedeno hlasování více než 24%, řekněme, voličů s 300 000 voliči ${\ displaystyle P}$

{\ Displaystyle MOE_ {95} (0,5) = z_ {0,95} \ sigma _ {\ overline {p}} \ cca {\ frac {0,98} {\ sqrt {72 000}}} = \ pm 0,4 \%}

{\ Displaystyle MOE_ {95_ {FPC}} (0,5) = z_ {0,95} \ sigma _ {\ overline {p}} {\ sqrt {\ frac {Nn} {N-1}}} \ cca {\ frac { 0,98} {\ sqrt {72 000}}} {\ sqrt {\ frac {300 000-72 000} {300 000-1}}} = \ pm 0,3 \%}

Intuitivně, pro dostatečně velké , ${\ displaystyle N}$

{\ Displaystyle \ lim _ {n \ to 0} {\ sqrt {\ frac {Nn} {N-1}}} \ cca 1}

{\ Displaystyle \ lim _ {n \ to N} {\ sqrt {\ frac {Nn} {N-1}}} = 0}

V prvním případě je tak malý, že nevyžaduje žádnou opravu. V druhém případě se hlasování skutečně stane sčítáním lidu a chyba vzorkování bude diskutabilní. ${\ displaystyle n}$

Viz také

Poznámky

Reference

Sudman, Seymour a Bradburn, Norman (1982). Kladení otázek: Praktický průvodce návrhem dotazníku . San Francisco: Jossey Bass. ISBN 0-87589-546-8
Wonnacott, TH a RJ Wonnacott (1990). Úvodní statistika (5. vyd.). Wiley. ISBN 0-471-61518-8.

externí odkazy

„Chyby, teorie“ , Encyclopedia of Mathematics , EMS Press , 2001 [1994]
Weisstein, Eric W. „Okraj chyby“ . MathWorld .

Languages

In other projects