F -test - F-test

F -test je jakýkoli statistický test , ve které testovací statistika F -distribution pod nulové hypotézy . Nejčastěji se používá při porovnávání statistických modelů , které byly přizpůsobeny datové sadě, aby bylo možné identifikovat model, který nejlépe odpovídá populaci, ze které byly údaje odebrány. Přesné „ F- testy“ vznikají hlavně tehdy, když byly modely přizpůsobeny datům s použitím nejmenších čtverců . Název vymyslel George W. Snedecor na počest sira Ronalda A. Fishera . Fisher původně vytvořil statistiku jako rozptylový poměr ve 20. letech 20. století.

Běžné příklady

Mezi běžné příklady použití F- testů patří studium následujících případů:

Kromě toho některé statistické postupy, jako je Scheffého metoda pro úpravu více srovnání v lineárních modelech, také používají F- testy.

F -test rovnosti dvou odchylek

F -test je citlivý na anomálie . V analýze rozptylu (ANOVA) zahrnují alternativní testy Levenův test , Bartlettův test a Brown-Forsytheův test . Pokud se však některý z těchto testů provádí za účelem testování základního předpokladu homoscedasticity ( tj. Homogenity odchylky), jako předběžného kroku k testování středních účinků, dochází ke zvýšení míry chyb experimentu typu I.

Vzorec a výpočet

Většina F- testů vzniká zvážením rozkladu variability ve sbírce dat, pokud jde o součty čtverců . Statistický údaj zkoušek v F -test je poměr dvou zmenšen součtů čtverců odrážejících různé zdroje variability. Tyto součty čtverců jsou konstruovány tak, že statistika má tendenci být větší, když nulová hypotéza není pravdivá. Aby statistika sledovala F -distribuci podle nulové hypotézy, měly by být součty čtverců statisticky nezávislé a každý by měl následovat škálované χ² rozdělení . Druhá podmínka je zaručena, pokud jsou hodnoty dat nezávislé a normálně distribuované se společnou odchylkou .

Vícenásobné srovnání problémů ANOVA

F -test na jednosměrnou analýzou rozptylu se používá pro zjištění, zda očekávané hodnoty o kvantitativní proměnné v několika předem definovaných skupin, se od sebe liší. Předpokládejme například, že lékařská studie srovnává čtyři léčby. Test ANOVA F lze použít k posouzení, zda je některá léčba průměrně lepší nebo nižší než ostatní oproti nulové hypotéze, že všechna čtyři ošetření poskytují stejnou střední odpověď. Toto je příklad „souhrnného“ testu, což znamená, že je proveden jediný test, aby se zjistil některý z několika možných rozdílů. Alternativně bychom mohli provést párové testy mezi ošetřeními (například v příkladu lékařské studie se čtyřmi ošetřeními jsme mohli provést šest testů mezi páry ošetření). Výhodou testu ANOVA F je, že nepotřebujeme předem specifikovat, které léčby mají být srovnávány, a nemusíme se přizpůsobovat provedení více srovnání . Nevýhodou ANOVA F- testu je, že pokud odmítneme nulovou hypotézu , nevíme, o kterých léčbách lze říci, že se významně liší od ostatních, ani pokud se F- test provádí na úrovni α, můžeme uvést že léčebný pár s největším průměrným rozdílem je významně odlišný na úrovni α.

Vzorec pro jednosměrnou statistiku ANOVA F -test je

nebo

„Vysvětlená odchylka“ nebo „variabilita mezi skupinami“ je

kde označuje průměr vzorku v i - té skupině, je počet pozorování v i - té skupině, označuje celkový průměr dat a označuje počet skupin.

„Nevysvětlená odchylka“ nebo „variabilita uvnitř skupiny“ je

kde je j th pozorování v i -tého ze skupin a je celková velikost vzorku. Tato F- statistika sleduje F -distribuci se stupni volnosti a za nulové hypotézy. Statistika bude velká, pokud je variabilita mezi skupinami velká vzhledem k variabilitě uvnitř skupiny, což je nepravděpodobné, pokud mají populační prostředky skupin stejnou hodnotu.

Všimněte si, že pokud existují pouze dvě skupiny pro jednosměrný test ANOVA F , kde t je statistika Studenta .

Regresní problémy

Zvažte dva modely, 1 a 2, kde model 1 je „vnořený“ do modelu 2. Model 1 je omezený model a model 2 je neomezený. To znamená, že model 1 má parametry p 1 a model 2 má parametry p 2 , kde p 1  <  p 2 , a pro jakýkoli výběr parametrů v modelu 1 lze stejnou regresní křivku dosáhnout výběrem parametrů modelu 2.

Jeden společný kontext v tomto ohledu spočívá v rozhodování, zda model zapadá do dat výrazně lépe než naivní model, ve kterém je jediným vysvětlujícím termínem intercept, takže všechny předpokládané hodnoty závislé proměnné jsou nastaveny na stejnou hodnotu jako proměnná průměr vzorku. Naivní model je omezeným modelem, protože koeficienty všech potenciálních vysvětlujících proměnných jsou omezeny na nulu.

Dalším běžným kontextem je rozhodování o tom, zda existuje strukturální zlom v datech: zde omezený model používá všechna data v jedné regresi, zatímco neomezený model používá oddělené regrese pro dvě různé podmnožiny dat. Toto použití F-testu je známé jako Chowův test .

Model s více parametry bude vždy schopen přizpůsobit data minimálně stejně jako model s menším počtem parametrů. Typicky tedy model 2 poskytne lepší (tj. Nižší chybu) přizpůsobení datům než model 1. Člověk však často chce zjistit, zda model 2 poskytuje podstatně lepší přizpůsobení datům. Jedním z přístupů k tomuto problému je použití F- testu.

Pokud existuje n datových bodů pro odhad parametrů obou modelů, pak lze vypočítat statistiku F danou

kde RSS i je zbytkový součet čtverců modelu i . Pokud byl regresní model vypočítán s váhami, pak nahraďte RSS i za χ 2 , vážený součet čtverců reziduí. Pod nulové hypotézy, že model 2 neposkytuje výrazně lepší kondici než modelu 1, F bude mít F distribuci, s ( P 2 - p 1 n - p 2 ) stupně volnosti . Nulová hypotéza je odmítnuta, pokud F vypočtená z dat je větší než kritická hodnota F -distribuce pro určitou požadovanou pravděpodobnost falešného odmítnutí (např. 0,05). F -test je zkouška Wald .

Viz také

Reference

Další čtení

externí odkazy