Analýza rozptylu - Analysis of variance


z Wikipedie, otevřené encyklopedie

Analýza rozptylu ( ANOVA ) je sbírka statistických modelů a jejich související postupy pro odhad (jako je například „varianta“ mezi a mezi skupinami) použity k analýze rozdílů mezi skupinou se rozumí ve vzorku . ANOVA byla vyvinuta statistik a evoluční biolog Ronald Fisher . V nastavení ANOVA, pozorovaná odchylka v určité proměnné se rozdělí na složky připadající na různých zdrojů variací. Ve své nejjednodušší formě, ANOVA poskytuje statistického testu , zda je populace prostředky několika skupin jsou stejné, a proto zobecňuje t -test na více než dvě skupiny. ANOVA je užitečné pro srovnání (testování) tři nebo více skupinou se rozumí statistické významnosti . To je koncepčně podobný více dvouvýběrový t-testy , ale je více konzervativní, což má za následek menší počet , typ I chyby , a proto je vhodný pro širokou škálu praktických problémů.

Dějiny

Zatímco analýza rozptylu dosáhly uskutečnění v 20. století, předchůdci rozšířit staletí do minulosti, podle Stigler. Mezi ně patří testování hypotézy, rozdělování součtů čtverců, experimentální techniky a model aditivní. Laplaceova se provádí testování hypotéz v 1770s. Vývoj nejmenších čtverců metodami Laplaceovy a Gaussovy cca 1800 zlepšený způsob spojení vyjádření (nad stávajícími postupy pak použity v astronomii a geodézii). To také zahájeno mnoho studii příspěvků součtů čtverců. Laplace věděl, jak odhadnout rozptyl od reziduální (spíše než celková) součet čtverců. Od roku 1827, Laplaceova byl pomocí nejmenších čtverců způsoby řešit problémy týkající se měření ANOVA atmosférických přílivy. Před 1800, astronomové izolovaných pozorovacích chyby vyplývající z reakčních dobách (dále jen „ osobní rovnice “) a vyvinul metody snížení chyb. Experimentální metody používané ve studii osobního rovnice byly později přijaty vznikající oblasti psychologie která se vyvinula silná (plný faktoriál) experimentální metody, na které randomizace a zaslepení brzy přidány. Výmluvný non-matematické vysvětlení modelu aditivním účinkům byla k dispozici v roce 1885.

Ronald Fisher představil termín rozptyl a navrhla jeho formální analýzu v roce 1918 článek korelaci mezi příbuznými na předpokladu Mendelian dědičnosti . Jeho první aplikací analýzy variance byl publikován v roce 1921. Analýza rozptylu stal se široce známý poté, co byla zahrnuta do Fisherova 1925 kniha statistické metody pro výzkumné pracovníky .

Randomizace modely byly vyvinuty v několika výzkumných pracovníků. První byl publikován v polském od Jerzy Neyman v roce 1923.

Jedním z atributů ANOVA, které zajistily jeho předčasné popularitu byl výpočetní elegance. Struktura modelu aditivního umožňuje řešení pro aditivní koeficientů jednoduchým algebře, spíše než od maticové výpočty. V éře mechanických kalkulátorů tato jednoduchost byl kritický. Stanovení statistické významnosti také požaduje přístup k tabulkách funkcí F, které byly dodány od počátku statistik textů.

motivující příklad

No fit.
Fair fit
Velmi dobrou volbou

Analýza rozptylu mohou být použity v rámci výzkumného nástroje vysvětlit pozorování. Výstavě poskytuje příklad. Výstavě není náhodný výběr plemene: to je typicky omezena na psy, kteří jsou pro dospělé, čistokrevných, a příkladné. Histogram psích hmotnostech show může věrohodně být poměrně složité, stejně jako distribuce žluto-oranžové, znázorněné na obrázku. Předpokládejme, že chceme předpovědět hmotnosti psa na základě určitého souboru charakteristik každého psa. Jeden způsob, jak to udělat, je vysvětlit rozložení hmotností rozdělením populace psů do skupin na základě těchto vlastností. Úspěšná seskupení rozdělí psy tak, že (a) každá skupina má nízký rozptyl psích závaží (což znamená, že skupina je relativně homogenní) a (b) střední hodnoty každé skupiny je odlišný (je-li dvě skupiny mají stejný průměr, pak se není důvodné se domnívat, že tyto skupiny jsou ve skutečnosti oddělit jakýmkoli smysluplným způsobem).

Na obrázcích vpravo, skupiny jsou označeny jako X 1 , X 2 , atd V první ilustraci, psi jsou rozděleny v závislosti na produktu (interakce) ze dvou binárních skupin: mladých vs staré, a krátké vlasy vs dlouho -haired (např skupina 1 je mladá, krátké vlasy psi, skupina 2 je mladá, dlouhé vlasy-psy, atd.) Vzhledem k tomu, distribucí hmotnosti psa v každé ze skupin (zobrazena modře), má relativně velký rozptyl, a jelikož prostředky jsou velmi podobné mezi skupinami, seskupení psů těmito charakteristikami neprodukuje efektivní způsob, jak vysvětlit rozdíly v psích hmotností vědouce, přičemž tato skupina je pes v nám neumožňuje předpovědět svou váhu mnohem lepší, než jen znát psa je ve výstavě. Tak toto seskupení nedokáže vysvětlit rozdíly v celkové distribuce (žluto-oranžová).

Pokus o vysvětlení rozložení hmotnosti seskupením psy jako domácího mazlíčka vs pracovní plemeno a méně atletické vs více atletické bude pravděpodobně o něco úspěšnější (fair fit). Nejtěžší přehlídky psi jsou pravděpodobně velké silné pracovní plemena, zatímco plemena držen jako domácí zvířata mají tendenci být menší a tudíž lehčí. Jak je vidět z druhé ilustraci distribuce mají odchylky, které jsou podstatně menší než v prvním případě, a prostředky jsou rozlišitelné. Výrazný překrytí rozvodů, například znamená, že nelze rozlišit X 1 a X 2 spolehlivě. Seskupení psy podle hodu mincí by mohl produkovat rozložení, které vypadají podobně.

Pokus o vysvětlení váhu plemeno je pravděpodobně produkovat velmi dobré kondici. Všechny Čivavy jsou lehké a všechny bernardýnům jsou těžké. Rozdíl v hmotnosti mezi aktivní hráči a ukazateli neopravňuje samostatná plemena. Analýza rozptylu poskytuje formální nástroje ospravedlnit tyto intuitivní soudy. Běžné použití této metody je analýza experimentálních dat nebo vývoj modelů. Tato metoda má několik výhod oproti korelace: ne všechna data musí být číselné a jedním z výsledků této metody je rozsudek v důvěře v vysvětlující vztah.

Pozadí a terminologie

ANOVA je forma statistické testování hypotéz těžce použity v analýze experimentálních dat. Výsledek testu (počítáno od nulové hypotézy a vzorek) se nazývá statisticky významný v případě, že je považováno za pravděpodobné, že by došlo náhodou, za předpokladu, že pravdu o nulové hypotézy . Statisticky významný výsledek, když je pravděpodobnost ( p-hodnota ) je menší než předem stanovený práh (hladina významnosti), odůvodňuje odmítnutí nulové hypotézy , ale pouze v případě, že a priori pravděpodobnost nulové hypotézy není vysoká.

V typickém použití ANOVA, nulová hypotéza je, že všechny skupiny jsou náhodné vzorky ze stejné populace. Například při studiu účinku různých ošetření na podobných vzorcích pacientů, nulová hypotéza by bylo, že všechny procedury mít stejný účinek (možná žádný). Odmítnutí nulové hypotézy, se rozumí, že rozdíly v pozorovaných účinků mezi léčenými skupinami je nepravděpodobné, že by v důsledku náhody.

Podle konstrukce, testování hypotéz omezuje rychlost chyby typu I (falešně pozitivní) na hladině významnosti. Experimentátoři také chtějí omezit Type chyby II (falešně negativní). Míra chyb typu II do značné míry závisí na velikosti vzorku (rychlost je větší u menších vzorků), na hladině významnosti (pokud standard důkazu je vysoká pravděpodobnost, s výhledem na objevu jsou rovněž vysoké) a velikosti účinku (menší velikosti efektu je náchylnější k typu II chyby).

Terminologie ANOVA je do značné míry ze statistického navrhování experimentů . Experimentátor upravuje faktorů a měří reakce ve snaze určit účinek. Faktory, jsou přiřazeny k experimentální jednotky kombinací randomizace a blokování pro zajištění platnosti výsledků. Zaslepení udržuje vážení nestranný. Odpovědi ukazují variabilitu, která je částečně výsledkem účinku a je částečně náhodná chyba.

ANOVA je syntéza několika myšlenek, a používá se pro různé účely. V důsledku toho, že je obtížné definovat výstižně nebo přesně.

„Klasická“ ANOVA pro vyváženou údajů činí tři věci najednou:

  1. Jako průzkumnou analýzu dat , An ANOVA využívá datové rozkladu aditiv, a jeho sumy čtverců ukazují rozptyl každé složky rozkladu (nebo ekvivalentně každou sadu podmínek lineárního modelu).
  2. Srovnání průměrných čtverců, spolu s F -testu  ... umožňují testování vnořené sekvence modelů.
  3. Úzce souvisí s analýzou rozptylu je lineární model fit s odhady koeficientů a standardní chyby.

Stručně řečeno, ANOVA je statistický nástroj používaný v několika způsobů, jak vytvořit a potvrdit vysvětlení pozorovaných dat.

Dodatečně:

  1. Je výpočetně elegantní a poměrně robustní proti porušování svých předpokladů.
  2. ANOVA poskytuje silné (vícenásobný srovnávací vzorek) statistické analýzy.
  3. To byl přizpůsoben k analýze různých experimentálních vzorů.

V důsledku toho: ANOVA „již dlouho těší stav bytí nejpoužívanější (někteří by řekli zneužívány) statistická metoda, v psychologickém výzkumu.“ ANOVA „je pravděpodobně nejužitečnější technika v oblasti statistických závěru.“

ANOVA je obtížné učit, zejména pro složité experimenty, s děleným-plot vzory jsou notoricky známé. V některých případech je správná aplikace metody je nejlépe určena problém rozpoznávání následuje vyhledávání v klasické autoritativní testu.

Design-of-experimentů termíny

(Kondenzované z "NIST Inženýrské Statistics Handbook":. § 5.7 Glosář DOE terminologie).

vyvážený design
Experimentální konstrukce, kde všechny buňky (tj kombinovaná léčba) mají stejný počet pozorování.
blokování
Plán pro provádění léčebných kombinací v experimentální studie tak, že žádný vliv na experimentálních výsledků v důsledku známé změny surovin, operátory, strojů, apod, stát se soustředěný v úrovních blokovací proměnné. Důvodem pro blokování je izolovat systematický vliv a zabránit jejímu zatemňovat hlavních vlivů. Blokování se dosáhne omezením randomizaci.
Design
Soubor experimentálních běhů, které umožňuje nošení určitého modelu a odhad účinků.
SRNA
Design experimentů. Přístup k řešení problémů zahrnující sběr dat, která bude podporovat platné, obhajitelné a doložitelných závěry.
Účinek
Jak měnit nastavení faktor změní odpověď. Účinek jediným faktorem je také nazýván hlavní účinek.
Chyba
Nevysvětlená odchylka ve sbírce pozorování. DOE je obvykle vyžadují znalost obou náhodných chyb a nedostatku fit chyby.
experimentální jednotkou
Subjekt, na který se aplikuje specifická kombinace léčby.
faktory
Procesní vstupy, které vyšetřovatel manipuluje způsobit změnu na výstupu.
Nedostatek-of-fit error
Chyba, která nastane, když se analýza vynechá jeden nebo více důležité termíny nebo faktory z procesního modelu. Včetně replikace v DOE umožňuje separaci experimentální chyby do svých složek: nedostatek nošení a náhodném pořadí (čistý) chyby.
Modelka
Matematický vztah, který se týká změny v dané reakci na změny jednoho nebo více faktorů.
náhodná chyba
Chyba, která se vyskytuje v důsledku přirozené odchylky v procesu. Náhodná chyba se obvykle předpokládá, že se normální rozdělení s nulovou střední hodnotou a konstantní rozptylu. Náhodná chyba je také nazýván experimentální chyby.
randomizace
Plán pro přidělování látky pro chemické zpracování a pro provádění léčebných kombinací v laně tak, že podmínky v jednom běhu ani závisí na podmínkách z předchozího běhu ani předvídat podmínky v následujících běhů.
replikace
Vykonávající stejnou kombinovaná léčba více než jednou. Včetně replikace umožňuje odhad náhodné chyby nezávislý na jakémkoli nedostatku fit chyby.
Odpovědi
Výstup (y) z procesu. Někdy se nazývá závislá proměnná (y).
Léčba
Ošetření je specifická kombinace úrovní faktorů, jejichž účinek má být ve srovnání s jinými způsoby léčby.

ANOVA tabulka

One-way ANOVA
Prameny df SS MSS F -ratio
mezi léčbou K-1 SST MST (SST / (k-1)) MST / MSE
Chyba N-k SSE MSE (SSE / (N-k))
Celkový N-1
  • SSE - Sum-of-Square kvůli chybě
  • SST - Sum-of-náměstí Léčba
  • MST - Mean Sum-of-čtvereční Léčba
  • MSE - Mean Sum-of-čtvereční Chyba
  • df - Stupně volnosti
Obousměrná ANOVA
Zdroj df SS MSS F -ratio
mezi léčbou K-1 SSR MST (SSR / (k-1)) MST / MSE ( F -ratio řádek)
mezi blokem h-1 SSC MSV (SSC / (h-1)) MSV / MSE ( F -ratio sloupec)
Chyba (H-1), (k-1) SSE MSE (SSE / ((h-1), (k-1)))
Celkový N-1
  • SSR - Sum-of-Square léčby v řádcích (SST)
  • SSC - Sum-of-náměstí mezi sloupci
  • MSV - Mean Součet rozptylu

Třídy modelů

Existují tři třídy modelů používaných v analýze rozptylu, a ty jsou zde popsány.

Pevné účinky modely

Model s fixními účinky (třída I) analýzy rozptylu se vztahuje na situace, v nichž experimentátor platí jedno nebo více ošetření s předměty experimentu, zda je proměnná odezvy hodnoty měnit. To umožňuje, aby experimentátor odhadnout rozsahy hodnot proměnných reakce, že léčba by vytvářela v populaci jako celku.

Náhodné účinky modely

Náhodné účinky model (třída II), se používá, když se ošetření není stanovena. K tomu dochází, když jsou různé úrovně faktoru vzorky z většího počtu. Vzhledem k tomu, že samotné úrovně jsou náhodné veličiny , některé předpoklady a způsob kontrastní léčbu, (multi-variabilní zobecnění jednoduchých rozdílů) se liší od modelu s fixními účinky.

Smíšené účinky modely

Smíšené účinky model (třída III) obsahuje experimentální faktory pevných i náhodné účinky typů, s odpovídajícím způsobem různé interpretace a analýzy těchto dvou typů.

Příklad: Školní experimenty by mohly být prováděny prostřednictvím školy nebo univerzity oddělení najít dobrý úvodní učebnice, s všechna znění považována za léčbu. Tento model s fixními efekty by srovnat seznam kandidátských textů. Model náhodné účinky by se zjistit, zda existují významné rozdíly mezi seznamu náhodně vybraných textů. Model smíšené účinky by porovnat (pevné) etablované texty náhodně vybrané alternativy.

Vymezení pevných a náhodných efektů ukázalo nepolapitelný s soupeřící definice pravděpodobně vede k jazykové bažiny.

předpoklady

Analýza rozptylu byly studovány z několika přístupů, z nichž nejběžnější používá lineární model , který se vztahuje na reakci na léčbu a bloky. Všimněte si, že tento model je lineární v parametrech, ale může být nelineární napříč různými úrovněmi faktoru. Výklad je snadné, když jsou data rozložena mezi faktory, ale mnohem hlubší porozumění je potřeba pro nevyvážené dat.

Analýza učebnice použití normální rozdělení

Analýza rozptylu mohou být prezentovány v podmínkách lineární model , který dělá tyto předpoklady o rozdělení pravděpodobnosti odpovědí:

  • Nezávislost pozorování - to je předpoklad modelu, který zjednodušuje statistické analýzy.
  • Normalita - a rozložení těchto zbytků jsou normální .
  • Žen a mužů (neboli „homogenita“) odchylek, nazvaný homoskedasticita - rozptyl dat ve skupinách by měla být stejná.

Jednotlivé předpoklady modelu učebnice neznamená, že chyby jsou nezávisle na sobě, stejné, a normální rozdělení pro pevné účinky modely, to znamená, že chyby ( ) jsou nezávislé a

Analýza Randomizace založené

V randomizované kontrolované experimentu , ošetření jsou náhodně rozděleny do experimentální jednotky, podle experimentálního protokolu. Tento náhodný výběr je objektivní a prohlásil před experiment probíhá. Cílem náhodné přiřazení se používá k testování významnosti nulové hypotézy, které vychází z myšlenek v CS Peirce a Ronald Fisher . Tato analýza konstrukce na bázi byl projednán a vyvinut Francis J. Anscombe na Rothamsted experimentální stanice a Oscar Kempthorne na Iowa State University . Kempthorne a jeho studenti učinit předpoklad jednotka léčby aditivity , která je popsána v knihách Kempthorne a David R. Cox .

Jednotka zpracování aditivní

Ve své nejjednodušší formě je předpoklad jednotka léčby aditivity uvádí, že pozorovaná reakce z experimentální jednotky , kdy léčby může být psáno jako součet odezvy jednotky a léčebného efektu , který je

Předpoklad Jednotka léčby aditivnosti znamená, že pro každé ošetření se th léčba má přesně stejný účinek na každém experimentu jednotky.

Předpoklad jednotka zpracování aditivity obvykle nemohou být přímo padělané , podle Cox a Kempthorne. Nicméně, mnoho následky léčby jiné jednotkami aditivnosti mohou být zfalšovány. Pro randomizované experimentu předpoklad jednotka léčby aditivity znamená, že rozptyl je konstantní pro všechny procedury. Tím, že kontrapozici , nezbytnou podmínkou pro jednotku ošetření aditivity je, že rozptyl je konstantní.

Použití jednotky léčby aditivity a randomizace je podobný závěr konstrukce na bázi, která je standardní v konečných populace vzorkování průzkumu .

Odvozen lineární model

Kempthorne používá randomizace-distribuce, a předpokladu jednotka zpracování aditivity produkovat odvozený lineárního modelu , velmi podobný modelu učebnici je pojednáno výše. Testované Statistika na této odvozené lineárního modelu jsou úzce aproximována statistika testu vhodného běžného lineárního modelu, podle přibližného vět a simulační studie. Nicméně, existují rozdíly. Například výsledky analýzy Randomizace bázi v malé, ale (přísně) negativní korelace mezi pozorování. V analýze na bázi náhodného neexistuje žádný předpoklad o normálním rozdělení a rozhodně žádný předpoklad o nezávislosti . Naopak pozorování jsou závislé !

Analýza Randomizace bázi má tu nevýhodu, že jeho expozice zahrnuje zdlouhavé algebry a delší čas. Vzhledem k tomu, analýza randomizace bázi je složitý a je úzce aproximovat přístupu pomocí běžného lineárního modelu, většina učitelů zdůraznit normální lineární modelový přístup. Několik statistici námitky proti modelové analýze vyvážených randomizovaných experimentů.

Statistické modely pozorovacích dat

Nicméně, když je aplikován na data ze nerandomizovaných experimentů nebo pozorovací studie , analýza založená na modelu postrádá příkaz randomizace. Pro pozorovacích dat, odvození intervalu spolehlivosti je nutné použít subjektivní modely, jak zdůraznil Ronald Fisher a jeho následovníků. V praxi odhady léčebných účinků z pozorovacích studií obecně jsou často v rozporu. V praxi, „statistické modely“ a observační údaje jsou užitečné pro navrhnout hypotézy, které by měly být léčeny velice opatrně ze strany veřejnosti.

Shrnutí předpokladů

Normální model založený ANOVA analýza předpokládá nezávislost, normality a homogenity rozptylů residuí. Analýza Randomizace bázi předpokládá pouze homogenitu rozptylů reziduí (jako důsledek jednotka léčby aditivitu) a používá postup randomizace experimentu. Obě tyto analýzy vyžadují homoskedasticita , jako předpoklad pro analýzu normální modelu a jako důsledek randomizace a aditivity pro analýzu na bázi náhodného.

Nicméně studie procesů, které se mění odchylky, spíše než prostředky (nazývané disperzní účinky) byly úspěšně provedeny za použití ANOVA. Existuje žádné nezbytné předpoklady pro ANOVA ve své zcela obecně, ale F -test byl použit ke zkouškám ANOVA hypotéz má předpoklady a praktické omezení, která pokračování zájem.

Problémy, které nesplňují předpoklady ANOVA lze často transformovány tak, aby splňovaly předpoklady. Vlastnost Jednotka ošetření aditivnosti není neměnná pod „změna měřítka“, takže často používají statistici transformace k dosažení jednotka léčbou aditivní. Pokud se očekává, že proměnná odezvy následovat parametrickou rodinu rozdělení pravděpodobnosti, pak statistik může určit (v protokolu pro experiment nebo observační studie), že reakce se převedou na stabilizaci rozptylu. Také statistik může určit, že logaritmické transformace je aplikována na základě odpovědí, které se předpokládá, že následovat multiplikativní model. Podle Cauchyho funkční rovnice teorém je logaritmus je jediný kontinuální transformace, která transformuje skutečnou násobení přidáním.

charakteristika

ANOVA se používá v analýze srovnávacích pokusů, ty, ve kterých pouze rozdíl ve výsledcích je předmětem zájmu. Statistická významnost experimentu je určena poměrem dvou odchylek. Tento poměr je nezávislý na několika možných změn na experimentální pozorování: Přidání konstantní na všech pozorování nemění význam. Vynásobením všechny připomínky konstantou nemění význam. Tak ANOVA statistická významnost výsledek je nezávislý na konstantní chyby zkreslení a měřítka, jakož i jednotek používaných v vyjadřovat pozorování. V době mechanického výpočtu bylo běžné odečíst konstantní ze všech pozorování (při ekvivalentní upuštění vedoucí číslice) zjednodušit zadávání dat. Toto je příklad datového kódování .

Logika

Výpočty ANOVA mohou být charakterizovány jako výpočetní řadu prostředků a odchylek, oddělující dvě odchylky a porovnání poměru na hodnotu příručky pro stanovení statistické významnosti. Výpočet léčebný účinek je pak triviální, „účinek jakékoliv léčby se odhaduje, že se vezme rozdíl mezi průměrem vyjádření, které dostávají léčbu a širokou střední“.

Dělení součtu čtverců

ANOVA používá tradiční standardizované terminologie. Definiční rovnice vzorku rozptylu je , kde je dělitel nazývá stupně volnosti (DF), shrnutí se nazývá součet čtverců (SS), výsledek se nazývá střední kvadratická (MS) a druhou mocninou termíny jsou odchylky od výběrový průměr. ANOVA odhadů 3 vzorkové odchylky: celkový rozptyl na základě všech pozorování odchylek od velkého průměru, chybové variance na základě všech pozorování odchylek od svých příslušných léčebných prostředků a léčba rozptylu. Rozptyl léčba je založena na odchylky zacházení se rozumí, z velkého průměru, je výsledek vynásobí počet pozorování v každé ošetření vysvětlit rozdíl mezi rozptylu pozorování a rozptylu prostředky.

Základní technika je rozdělení celkového součtu čtverců SS do složek týkajících se účinků použité v modelu. Například model pro zjednodušené ANOVA s jedním typem léčby na různých úrovních.

Počet stupňů volnosti DF může být rozdělena podobným způsobem: jedna z těchto složek (to chyby) určuje distribuci chi-kvadrát , který popisuje související součet čtverců, přičemž totéž platí pro „léčení“ v případě, že je žádný léčebný efekt.

Viz také Nedostatek-of-fit součet čtverců .

F -test

F -test se používá pro porovnání faktorů celkové odchylky. Například v jedné cestě nebo jednofaktorová ANOVA, statistická významnost je testována porovnáním testovací statistika F

kde MS je střední kvadratická, = počet procedur a = celkový počet případů

na F -distribution s , stupni volnosti. Použití F -distribution je přirozený kandidát protože testovací statistika je poměr dvou zmenšen součtů čtverců, z nichž každý sleduje zmenšen chí-kvadrát rozdělení .

Očekávaná hodnota F je (kde n je velikost vzorku léčba), která je 1 bez léčebného účinku. Jako hodnoty F nárůstem nad 1, je důkazem je stále v rozporu s nulové hypotézy. Dva zjevné experimentální metody zvyšování F se zvětšením velikosti vzorku a snížení chyb rozptylu těsných experimentálních kontrol.

Existují dva způsoby uzavření hypotézu testu ANOVA, oba stejný výsledek:

  • Metoda učebnice je srovnat zjištěné hodnoty F kritické hodnoty F stanovenou z tabulek. Kritická hodnota F je funkcí stupňů volnosti čitatele a jmenovatele a hladině významnosti (a). Jestliže F ≥ F kritické , nulová hypotéza je zamítnuta.
  • Způsob počítač vypočítá pravděpodobnost (p-hodnota) o hodnotě F větší než nebo rovnající se hodnotě pozorované. Nulová hypotéza neplatí pokud tato pravděpodobnost je menší než nebo rovna hladině významnosti (a).

ANOVA F -test je známo, že téměř optimální v tom smyslu, že se minimalizuje falešně negativní chyb za pevnou rychlostí falešně pozitivních chyb (tj maximalizovat výkon pro pevnou úroveň významnosti). Například, k testování hypotézy, že různé léčebné postupy, které mají přesně stejný účinek, F -testu s p -hodnoty těsně sbližují permutačního testu je p-hodnoty : Aproximace je zvláště v blízkosti, když je konstrukce je vyvážený. Tyto permutační testy charakterizovat testy s maximálním výkonem proti všem alternativní hypotézy , jak je pozorováno Rosenbaum. ANOVA F -test (z nulové-hypotéze, že všechny procedury mají přesně stejný účinek) se doporučuje jako praktické zkoušky, protože jeho odolnost proti mnoha alternativních distribucí.

rozšířená logika

ANOVA se skládá z oddělitelných částí; dělení zdroje rozptylu a testování hypotéz mohou být použity samostatně. ANOVA se používá pro podporu jiných statistických nástrojů. Regrese je nejdříve použit, aby se vešly složitější modely na data, pak ANOVA se používá k porovnání modelů s cílem výběru jednoduchých (r) modelů, které odpovídajícím způsobem popisují data. „Takové modely by mohly být fit bez jakéhokoliv odkazu na ANOVA, ale ANOVA nástroje by pak mohly být použity pro nějaký smysl z vhodných modelů, a testovat hypotézy o dávkách koeficientů.“ „[W] e myslet na analýze rozptylu jako způsob pochopení a strukturování víceúrovňových modelů ne jako alternativa k regresi, ale jako nástroj pro shrnutí složitých vysoce-rozměrná závěry ...“

Pro jednoho faktoru

Nejjednodušší Experiment vhodné pro ANOVA analýzy je zcela randomizované experiment s jediným faktorem. Složitější experimenty s jedním faktorem zahrnovat omezení na randomizace a zahrnují zcela randomizované bloky a latinských čtverců (a varianty: řecko-latinských čtverců, atd). Složitější experimenty sdílejí mnoho složitosti mnoha faktorech. Relativně kompletní diskuze o analýzy (modely, souhrnné údaje, ANOVA tabulky) zcela randomizované experimentu je k dispozici .

Pro více faktorů

ANOVA zobecňuje ke studiu účinků různých faktorů. Pokud je pokus zahrnuje pozorování na všechny kombinace úrovní každý faktor, to je nazývané faktoriální . Faktoriální experimenty jsou účinnější než série jednotlivých pokusů faktor a účinnost roste s rostoucím počtem faktorů. V důsledku toho, faktoriální designy jsou často používají.

Využití analýzy rozptylu ke studiu účinků různých faktorů má komplikaci. V 3-ANOVA s faktory X, Y a Z, model ANOVA obsahuje podmínky pro hlavní účinky (x, y, z) a podmínky pro interakce (XY, XZ, YZ, XYZ). Všechny podmínky vyžadují hypotéz testy. Proliferace interakce podmínek zvyšuje riziko, že některé hypotéza test bude produkovat falešně pozitivní náhodou. Naštěstí zkušenost říká, že vysoké interakce pořadí jsou vzácné. Schopnost detekci interakcí je hlavní výhodou násobek ANOVA. Testování jeden faktor v době skrývá interakcí, ale produkuje zřejmě nekonzistentní výsledky experimentů.

Opatrnost se doporučuje při výskytu interakcí; Zkušební interakce termíny první a rozšířit analýzu mimo ANOVA, jsou-li nalezeny interakce. Texty se liší v jejich doporučení ohledně pokračování postupu ANOVA po setkání interakci. Interakce komplikovat interpretaci experimentálních dat. Ani výpočty významu ani odhadnuté léčebné účinky mohou být přijata v nominální hodnotě. „Významná interakce se často maskují význam hlavních efektů.“ Grafické metody se doporučuje, aby v zájmu lepšího pochopení. Regresní je často užitečné. Zdlouhavé diskuse interakcí je k dispozici v Cox (1958). Některé interakce může být odstraněn (transformacemi), zatímco jiné ne.

Různé techniky jsou používány s násobek ANOVA ke snížení nákladů. Jedna technika používaná v faktorových provedeních je minimalizovat replikace (možná žádná replikace s podporou analytické podvod ) a kombinovat skupiny, pokud jsou účinky bylo zjištěno, že statisticky (nebo téměř) nevýznamný. Experiment s mnoha nevýznamných faktorů se může sbalit do jednoho s několika faktory, podporovaných mnoha replikacemi.

Opracované číselné příklady

Několik plně spolupracoval číselné příklady jsou k dispozici. Jednoduchý případ používá jednosměrný (jeden faktor) analýzy. Složitější případ použití dvoucestné (dvoufaktorové) analýzy.

spojená analýza

Některé analýzy je zapotřebí na podporu návrhu experimentu, zatímco další analýza se provádí po změně ve faktorech, jsou formálně zjištěno statisticky významné změny v odpovědích. Vzhledem k tomu, experimentování je iterativní, výsledky jednoho experimentu měnit plány pro následující experimenty.

přípravná analýza

Počet pokusných jednotek

V návrhu experimentu, počet pokusných jednotek se plánuje tak, aby splňovaly cíle experimentu. Experimenty se často sekvenční.

Rané pokusy jsou často navrženy tak, aby střední-nestranné odhady účinků léčby a experimentální chyby. Pozdější pokusy jsou často určeny k testování hypotézy, že léčebný efekt má významnou velikost; V tomto případě je počet pokusných jednotek je zvolena tak, že experiment je v rámci rozpočtu a má dostatečnou sílu, mezi jinými cíli.

Přehled Analýza velikost vzorku je obecně zapotřebí v psychologii. „Poskytuje informace o velikosti vzorku a procesu, který vedl k rozhodnutí ochutnat velikosti.“ Analýza, která je zapsána v experimentálním protokolu předtím, než experiment probíhá, je zkoumána v žádostech o grant a správních kontrolních desek.

Kromě analýzy výkonu, existují méně formální postupy pro výběr počtu pokusných jednotek. Ty zahrnují grafické metody založené na omezení pravděpodobnost falešných negativních chyb, grafické metody na základě očekávané zvýšení variační (nad zbytků) a metody založené na dosažení požadované jistý interval.

analýza Power

Analýza síla je často aplikován v rámci ANOVA s cílem posoudit pravděpodobnost úspěšné odmítnutím hypotéz null, pokud budeme předpokládat určitý návrh ANOVA, velikost efektu v populaci, velikost vzorku a významu úrovni. Analýza Power může pomoci při návrhu studie by určení toho, co velikost vzorku by bylo zapotřebí, aby měli rozumnou šanci na zamítnutí nulové hypotézy, kdy se alternativní hypotéza je pravdivá.

velikost účinku

Bylo navrženo několik standardizovaných opatření účinkem pro ANOVA shrnout pevnost spojení mezi prediktor (y) a závislé proměnné nebo celkové standardizované rozdílu kompletního modelu. Odhady standardizované vliv velikosti usnadnit srovnání nálezů napříč studií a oborů. Nicméně, zatímco standardizované velikosti efektu se běžně používají ve velké části odborné literatury, non-standardizovaná míra velikosti účinku, který má okamžitě „smysluplné“ jednotky mohou být vhodnější pro účely přehledů.

Navazující analýza

Vždy je třeba pečlivě zvážit odlehlých hodnot. Mají nepřiměřený dopad na statistické závěry a jsou často důsledkem chyb.

potvrzení Model

Je rozumné ověřit, zda byly splněny předpoklady ANOVA. Zbytky jsou zkoumány a analyzovány s cílem potvrdit homoskedasticita a hrubé normality. Zbytky by měly mít podobu (nulová střední normální rozdělení) šumu při vynesena jako funkce cokoliv, včetně času a modelovaných hodnot dat. Trendy narážet na interakcí mezi faktory, nebo mezi pozorování. Jeden pravidlo „Je-li největší směrodatná odchylka je menší než dvojnásobek nejmenší směrodatná odchylka, můžeme použít metody založené na předpokladu rovného směrodatných odchylek a naše výsledky budou stále přibližně správný“

Follow-up testy

Statisticky významný účinek na ANOVA často následuje s jedním nebo více různých následných testů. To lze provést s cílem posoudit, které skupiny jsou odlišné od kterého jiných skupin nebo testovat různé jiné zaměřené hypotézy. Následné testy se často vyznačují tím, pokud jde o to, zda jsou plánovány ( a priori ) nebo post hoc . Plánované testy jsou určeny, než se podíváme na data a post hoc testy se provádějí po pohledu na data.

Často jeden z „ošetření“, není, tak léčená skupina může působit jako kontrola. Dunnettovým testem (modifikace t-testu) testuje, zda každá z dalších léčebných skupin má stejný průměr jako ovládací prvek.

Post testy hoc, jako jsou zkoušky rozmezí Tukeyova nejčastěji srovnat každá skupina znamená s každou jinou skupinou na mysli a obvykle obsahují nějaký způsob kontroly chyb typu I. Srovnání, které jsou nejčastěji plánované, může být buď jednoduché, nebo složené. Jednoduché srovnání porovnat jedna skupina znamená s jedním dalším průměru skupiny. Složené srovnání typicky porovnat dvě sady skupin, se rozumí kde jedna sada obsahuje dvě nebo více skupin (například, porovnání průměrnou skupinu prostřednictvím skupiny A, B a C se skupina D). Srovnání se také podívat na zkoušky trendu, jako jsou lineární a kvadratické vztahy, kdy nezávislá proměnná zahrnuje objednaného množství.

Následující ANOVA s více srovnávacích testech párových byl kritizován z několika důvodů. Existuje mnoho takových testů (10 v jedné tabulce) a doporučení týkající se jejich použití jsou nejasné nebo konfliktní.

Studijní vzory

Existuje několik typů ANOVA. Mnoho statistiků založit ANOVA na návrh experimentu , zejména pokud jde o protokol, který určuje náhodné přiřazení procedur do předmětů; Popis o protokolu mechanismu přiřazení by měla zahrnovat specifikaci struktury ošetření a jakékoliv blokování . To je také obyčejné aplikovat ANOVA na pozorovacích dat pomocí vhodného statistického modelu.

Některé populární designy používají následující typy ANOVA:

  • Jednocestná ANOVA se používá k testování rozdílů mezi dvěma nebo více nezávislých skupin (prostředky), např různých úrovních aplikaci močoviny na plodiny, nebo různých úrovních antibiotické působení na několika různých bakteriálních druhů, nebo různých úrovních účinek některých léků na skupiny pacientů. Pokud by však tyto skupiny nesmí být nezávislá, a tam je pořadí, ve skupinách (jako je mírné, středně těžkou a těžkou chorobou), nebo v dávce léčiva (jako je například 5 mg / ml, 10 mg / ml, 20 mg / ml), s ohledem na stejné skupiny pacientů, pak lineární odhad tendence by měla být použita. Typicky se však, jednosměrná ANOVA se používá k testování rozdílů mezi alespoň třemi skupinami, protože v případě dvou-skupina může být pokryta t-testem . Pokud existují pouze dva prostředky pro porovnání je t-test a ANOVA F -test jsou ekvivalentní; vztah mezi ANOVA a t je dána vztahem F  =  t 2 .
  • Faktoriální ANOVA se používá, když experimentátor chce studovat účinky interakce mezi ošetření.
  • Opakovaná měření ANOVA se používá, když jsou stejné předměty používá pro každé ošetření (např, v podélném studii ).
  • Vícerozměrná analýza rozptylu (MANOVA) se používá v případě, že je více než jedna proměnná odezvy .

Upozornění

Vyvážené experimenty (ty se stejným velikost vzorku pro každé ošetření) jsou poměrně snadno interpretovat; Nevyvážené experimenty nabízejí větší složitost. Pro single-faktoru (jednosměrné) ANOVA, úprava pro nevyvážené dat je jednoduché, ale nevyvážený analýza postrádá jak robustnost a sílu. U složitějších konstrukcí nedostatek rovnováhy vede k dalším komplikacím. „Ortogonalita vlastnost hlavních účinků a interakcí přítomných ve vyváženém dat nepřenáší na nevyvážené případu. To znamená, že se nepoužijí obvyklá analýza rozptylu technik. V důsledku toho, analýza nevyvážených faktoriálů je mnohem obtížnější, než je pro vyvážený návrhy.“ V obecném případě, „Analýza rozptylu může být použita i na nevyvážené dat, ale pak se sumy čtverců, střední čtverců, a F -ratios bude záviset na pořadí, ve kterém jsou považovány za zdroje odchylek.“ Nejjednodušší techniky pro manipulaci s nevyvážené dat obnovit rovnováhu buď vyhazovali údaje nebo syntézou chybějící údaje. Složitější techniky používají regrese.

ANOVA je (částečně) testu významnosti. Americká psychologická asociace zastává názor, že prostě hlášení význam je nedostatečná a že hlášení meze spolehlivosti je preferovaný.

Zatímco ANOVA je konzervativní (při udržování hladiny významnosti) proti vícenásobné porovnávání v jedné dimenzi, není konzervativní proti srovnání v několika dimenzích.

zobecnění

ANOVA je považován za zvláštní případ lineární regresí což je zvláštní případ obecného lineárního modelu . All zvážit vyjádření je součtem z modelu (FIT) a zbytkového (chyba), které mají být minimalizován.

Kruskal-Wallisův test a zkouška Friedman jsou neparametrické testy, které se nespoléhají na předpokladu normality.

Napojení na lineární regrese

Níže uděláme zrušte spojení mezi multi-way ANOVA a lineární regrese. Lineárně změnit pořadí dat tak, že pozorování je spojené s odpovědí a faktory, kde označuje různé faktory a je celkový počet faktorů. V jednocestné ANOVA a dvoucestným ANOVA . Dále budeme předpokládat, že faktor má úrovně, a to . Nyní můžeme jeden-hot kódování faktory do trojrozměrného vektoru .

Funkce jedné horké kódování je definován tak, že vstup je

Vektor je zřetězením všech výše uvedených vektorů pro všechny . Tak . Za účelem získání zcela obecný směrného interakce ANOVA musíme také spojovat každý další interakce výrazu do vektoru a pak přidat intercept termín. Dopustit, aby vektor byl .

S tímto zápisem na místě, nyní máme přesné spojení s lineární regresí. My prostě ustoupí odezvu proti vektoru . Existuje však obava o rozlišování. Aby se překonaly tyto problémy, domníváme se, že součet parametrů v každé sadě interakcí se rovná nule. Odtud se může použít F -statistics nebo jiné metody pro stanovení významu jednotlivých faktorů.

Příklad

Můžeme uvažovat o 2-way interakce příklad, kdy předpokládáme, že první faktor má 2 podlaží a druhý faktor má 3 úrovně.

Definuje -li a v případě , tedy je jeden horký kódování prvního faktoru a je jedno-horký kódování druhého faktoru.

S tím,

kde poslední termín je zachytit termín. Pro konkrétnější příklad předpokládejme, že
Pak,

viz též

poznámky pod čarou

Poznámky

Reference

Další čtení

externí odkazy