Z -test - Z-test

Null-hypothesis-reigon-eng.png

Z -test je jakýkoli statistický test , pro které je rozdělení na testovací statistiky na základě nulové hypotézy lze aproximovat pomocí normálního rozdělení . Z-testy testují průměr distribuce. Pro každou úroveň významnosti v intervalu spolehlivostiZ -test jedinou kritickou hodnotu (například 1,96 pro 5% dvoustranných), což je výhodnější než Studentův t -test, jehož kritické hodnoty jsou definovány velikostí vzorku ( prostřednictvím odpovídajících stupňů volnosti ).

Použitelnost

Vzhledem k centrální limitní větě je mnoho statistik testů přibližně normálně distribuováno pro velké vzorky. Proto je možné pohodlně provádět mnoho statistických testů jako přibližné Z -testy, pokud je velikost vzorku velká nebo je znám rozptyl populace. Pokud je rozptyl populace neznámý (a proto musí být odhadnut ze samotného vzorku) a velikost vzorku není velká ( n <30), může být vhodnější Studentův t -test.

Postup

Jak provést Z test, když T je statistika, která je přibližně normálně rozdělena podle nulové hypotézy, je následující:

Za prvé, odhad očekávané hodnoty u Stabilizátory z T na základě nulové hypotézy, a získat odhad je o standardní odchylky z T .

Za druhé, určete vlastnosti T  : jednoocasý nebo dvouocasý.

Pro nulovou hypotézu H 0 : μ≥μ 0 vs. alternativní hypotézu H 1 : μ <μ 0 je nižší/levý (jednostranný).

Pro nulovou hypotézu H 0 : μ≤μ 0 vs. alternativní hypotézu H 1 : μ> μ 0 je horní/pravá (jednostranná).

Pro nulovou hypotézu H 0 : μ = μ 0 vs. alternativní hypotézu H 1 : μ ≠ μ 0 je dvoustranná.

Za třetí, vypočítejte standardní skóre  :

,

které jednostranné a dvoustranné hodnoty p lze vypočítat jako Φ ( Z ) (pro zkoušky s dolním/levým ocasem), Φ ( -Z ) (pro testy s horním/pravým ocasem) a 2Φ (-| Z | ) (pro dvoustranné testy) kde Φ je standardní normální kumulativní distribuční funkce .

Použití při testování polohy

  1. Termín " Z -test" se často používá k označení specifického testu umístění jednoho vzorku, který porovnává průměr sady měření s danou konstantou, když je znám rozptyl vzorku. Pokud například pozorovaná data X 1 , ..., X n jsou (i) nezávislá, (ii) mají společný průměr μ a (iii) mají společný rozptyl σ 2 , pak průměr vzorku X má průměr μ a rozptyl .
  2. Nulová hypotéza je, že střední hodnota X je dané číslo μ 0 . Můžeme použít X   jako testovací statistiku, odmítající nulovou hypotézu, pokud X  -μ 0 je velká.
  3. K výpočtu standardizované statistiky potřebujeme buď vědět, nebo mít přibližnou hodnotu pro σ 2 , ze které můžeme vypočítat . V některých aplikacích je znám σ 2 , ale to není neobvyklé.
  4. Pokud je velikost vzorku střední nebo velká, můžeme nahradit rozptyl vzorku za σ 2 a provést test plug-in . Výsledný test nebude přesný Z -test, protože se nepočítá s nejistotou rozptylu vzorku -bude to však dobrá aproximace, pokud velikost vzorku není malá.
  5. T -test může být použit na účet pro nejistotu ve vzorku rozptylu, pokud jsou data přesně normální .
  6. Rozdíl mezi Z-testem a t-testem: Z-test se používá, když je velikost vzorku velká (n> 50) nebo je znám rozptyl populace. t-test se používá, pokud je velikost vzorku malá (n <50) a populační rozptyl není znám.
  7. Neexistuje žádná univerzální konstanta, při které by byla velikost vzorku obecně považována za dostatečně velkou, aby odůvodnila použití testu zásuvného modulu. Typická pravidla: velikost vzorku by měla být 50 pozorování nebo více.
  8. Pro velké velikosti vzorků poskytuje postup t -test téměř identické hodnoty p jako postup Z -test.
  9. Další testy polohy, které lze provést jako Z -testy, jsou test umístění dvou vzorků a test párového rozdílu .

Podmínky

Aby byl Z -test použitelný, musí být splněny určité podmínky.

  • Obtěžující parametry by měly být známy nebo by měly být odhadovány s vysokou přesností (příkladem rušivého parametru by byla standardní odchylka v testu umístění jednoho vzorku). Z -testy se zaměřují na jeden parametr a všechny ostatní neznámé parametry považují za opravené na svých skutečných hodnotách. V praxi lze díky Slutského teorémě „zapojení“ konzistentních odhadů parametrů obtěžování ospravedlnit. Pokud však velikost vzorku není dostatečně velká, aby byly tyto odhady přiměřeně přesné, Z -test nemusí fungovat dobře.
  • Statistika testu by měla sledovat normální rozdělení . Obecně se člověk odvolává na centrální limitní větu, aby odůvodnil předpoklad, že se statistika testu normálně mění. Existuje velké množství statistických výzkumů na otázku, kdy se statistika testu mění přibližně normálně. Pokud je odchylka statistiky testu silně neobvyklá, test Z by neměl být použit.

Pokud jsou zapojeny odhady obtěžujících parametrů, jak je uvedeno výše, je důležité použít odhady vhodné pro způsob, jakým byla data vzorkována . Ve zvláštním případě Z -testů pro problém umístění jednoho nebo dvou vzorků je obvyklá standardní odchylka vzorku vhodná pouze tehdy, pokud byla data shromážděna jako nezávislý vzorek.

V některých situacích je možné navrhnout test, který řádně zohlední odchylky v odhadech parametrů obtěžování modulů plug-in. V případě problémů s umístěním jednoho a dvou vzorků to provede t -test .

Příklad

Předpokládejme, že v konkrétní geografické oblasti je průměr a standardní odchylka skóre v testu čtení 100 bodů, respektive 12 bodů. Náš zájem je o skóre 55 studentů v konkrétní škole, kteří získali průměrné skóre 96. Můžeme se zeptat, zda je toto průměrné skóre výrazně nižší než regionální průměr - to znamená, jsou studenti této školy srovnatelní s jednoduchým náhodným vzorek 55 studentů z regionu jako celku, nebo jsou jejich skóre překvapivě nízké?

Nejprve vypočítejte standardní chybu průměru:

kde je standardní odchylka populace.

Dále vypočítejte z -score , což je vzdálenost od průměru vzorku k průměru populace v jednotkách standardní chyby:

V tomto případě považujeme průměr a rozptyl populace za známé, což by bylo vhodné, kdyby byli testováni všichni studenti v regionu. Pokud nejsou známy parametry populace, měl by být místo toho proveden Studentův t-test .

Průměrné skóre ve třídě je 96, což je −2,47 jednotek standardní chyby od průměru populace 100. Při pohledu na z -score v tabulce kumulativní pravděpodobnosti standardní normální distribuce zjistíme, že pravděpodobnost pozorování standardní normální hodnoty níže −2,47 je přibližně 0,5 - 0,4932 = 0,0068. Toto je jednostranná hodnota p pro nulovou hypotézu, že 55 studentů je srovnatelných s jednoduchým náhodným vzorkem z populace všech testujících. Oboustranná hodnota p je přibližně 0,014 (dvojnásobek jednostranné hodnoty p ).

Dalším způsobem, jak uvést věci, je, že s pravděpodobností 1 - 0,014 = 0,986 by jednoduchý náhodný vzorek 55 studentů měl průměrné skóre testu do 4 jednotek průměru populace. Mohli bychom také říci, že s 98,6% jistotou odmítáme nulovou hypotézu , že 55 testovaných osob je srovnatelných s jednoduchým náhodným vzorkem z populace testovaných.

Z -test nám říká, že 55 studentů zájmu mají neobvykle nízké průměrné test skóre ve srovnání s většinou jednoduchých náhodných vzorků stejné velikosti z populace zkušebních odběrateli. Nedostatek této analýzy spočívá v tom, že nezohledňuje, zda velikost efektu 4 bodů má smysl. Pokud bychom místo třídy uvažovali o podoblasti obsahující 900 studentů, jejichž průměrné skóre bylo 99, bylo by pozorováno téměř stejné z -score a p -value. To ukazuje, že pokud je velikost vzorku dostatečně velká, velmi malé rozdíly od nulové hodnoty mohou být vysoce statisticky významné. Další diskusi o tomto problému najdete v testování statistických hypotéz .

Z -testy jiné než testy polohy

Lokální testy jsou nejznámější Z -testy. Další třída Z -testů vzniká v odhadu maximální pravděpodobnosti parametrů v parametrickém statistickém modelu . Odhady maximální pravděpodobnosti jsou za určitých podmínek přibližně normální a jejich asymptotický rozptyl lze vypočítat z informací Fishera. Odhad maximální pravděpodobnosti dělený jeho standardní chybou lze použít jako testovací statistiku pro nulovou hypotézu, že populační hodnota parametru se rovná nule. Obecněji řečeno, pokud je maximální odhad pravděpodobnosti parametru θ a θ 0 je hodnota θ podle nulové hypotézy,

lze použít jako statistiku Z -testu.

Při použití Z -testu pro odhady maximální pravděpodobnosti je důležité si uvědomit, že normální aproximace může být špatná, pokud velikost vzorku není dostatečně velká. Ačkoli neexistuje jednoduché, univerzální pravidlo, které by stanovovalo, jak velká velikost vzorku musí být pro použití Z -testu, simulace může poskytnout dobrou představu o tom, zda je Z -test v dané situaci vhodný.

Z -testy se používají vždy, když lze tvrdit, že statistika testu sleduje normální rozdělení podle nulové hypotézy zájmu. Mnoho neparametrických testovacích statistik, jako je statistika U , je pro dostatečně velké velikosti vzorků přibližně normální, a proto se často provádějí jako Z -testy.

Viz také

Reference

  • Sprinthall, RC (2011). Základní statistická analýza (9. vydání). Pearson Education. ISBN 978-0-205-05217-2.
  • Casella, G. , Berger, RL (2002). Statistické závěry . Duxbury Press. ISBN  0-534-24312-6 .
  • Douglas C. Montgomery, George C. Runger. (2014). Aplikovaná statistika a pravděpodobnost pro inženýry . (6. vydání.). John Wiley & Sons, vč. ISBN  9781118539712 , 9781118645062 .