Rovnoměrně nejvýkonnější test - Uniformly most powerful test

Ve statistickém testování hypotéz , je stejnoměrně nejsilnější ( UMP ), zkouška je zkouška hypotéza , která má největší sílu mezi všemi možnými testy dané velikosti alfa . Například, v závislosti na Neyman-Pearson lemmatu je pravděpodobnost-poměr test UMP pro zkoušení jednoduchých (bod) hypotézy.

Nastavení

Nechť značí náhodný vektor (odpovídající měření), převzato z parametrické rodiny z funkcí hustota pravděpodobnosti nebo masových funkce pravděpodobnosti , která závisí na neznámé deterministické parametru . Prostor parametrů je rozdělen na dvě disjunktní sady a . Nechť označují hypotézu, že , ať označují hypotézu, že . Binární test hypotéz se provádí pomocí testovací funkce .

což znamená, že je v platnosti, pokud je měření, a že je v platnosti, pokud je měření . Všimněte si, že jde o disjunktní pokrytí prostoru měření.

Formální definice

Testovací funkce má velikost UMP, pokud vyhovuje jakékoli jiné testovací funkci

my máme

Karlin – Rubinova věta

Karlin – Rubinův teorém lze považovat za rozšíření Neymanova – Pearsonova lematu pro složené hypotézy. Zvažte skalární měření, které má funkci hustoty pravděpodobnosti parametrizovanou skalárním parametrem θ , a definujte poměr pravděpodobnosti . Pokud je monotónní neklesající, pro jakýkoli pár (což znamená, že čím větší je, tím pravděpodobnější je), pak test prahové hodnoty:

kde je vybrán tak, že

je UMP test velikosti α pro testování

Všimněte si, že přesně stejný test je také UMP pro testování

Důležitý případ: exponenciální rodina

Ačkoli se Karlin-Rubinova věta může zdát slabá kvůli jejímu omezení na skalární parametry a skalární měření, ukazuje se, že existuje celá řada problémů, pro které věta platí. Zejména jednorozměrný exponenciální rodina z funkcí hustoty pravděpodobnosti nebo pravděpodobnostní funkce s

má monotónní neklesající poměr pravděpodobnosti v dostatečné statistice za předpokladu, že neklesá.

Příklad

Nechť značí iid normálně distribuované rozměrný náhodných vektorů se střední a kovarianční matice . Pak máme

což je přesně ve formě exponenciální rodiny zobrazené v předchozí části, s dostatečným statistickým bytím

Takže jsme dospěli k závěru, že test

je UMP test velikosti pro testování vs.

Další diskuse

Nakonec si všimneme, že obecně neexistují testy UMP pro vektorové parametry ani pro dvoustranné testy (test, ve kterém jedna hypotéza leží na obou stranách alternativy). Důvodem je, že v těchto situacích se nejvýkonnější test dané velikosti pro jednu možnou hodnotu parametru (např. Kde ) liší od nejvýkonnějšího testu stejné velikosti pro jinou hodnotu parametru (např. Kde ). Výsledkem je, že žádný test není v těchto situacích jednotně nejsilnější.

Reference

Další čtení

  • Ferguson, TS (1967). „Kapitola 5.2: Rovnoměrně nejvýkonnější testy “. Matematická statistika: Rozhodovací teoretický přístup . New York: Academic Press.
  • Nálada, AM; Graybill, FA; Boes, DC (1974). „Sec. IX.3.2: Uniformly most powerful tests “. Úvod do teorie statistiky (3. vyd.). New York: McGraw-Hill.
  • LL Scharf, Statistické zpracování signálu , Addison-Wesley, 1991, oddíl 4.7.