Efektivní odhad - Efficient estimator

Ve statistikách , An účinný odhadce je odhadce , který odhaduje množství zájmu v nějakém „nejlepším možným“ způsobem. Pojem „nejlepší možný“ se opírá o volbu konkrétní ztrátové funkce - funkce, která kvantifikuje relativní stupeň nežádoucího výskytu chyb v odhadu různých velikostí. Nejběžnější volba funkce ztráty je kvadratická , což má za následek kritérium střední kvadratické chyby optimality.

Účinnost konečných vzorků

Předpokládejme { P θ | θ ∈ Θ } je parametrický model a X = ( X 1 ,…, X n ) jsou data vzorkovaná z tohoto modelu. Nechť T = T ( X ) je odhad parametru θ . Pokud je tento odhad nestranný (tj. E [  T  ] = θ ), potom nerovnost Cramér – Rao uvádí, že rozptyl tohoto odhadu je omezen zespodu:

kde je Fisherova informační matice modelu v bodě θ . Obecně variance měří stupeň rozptylu náhodné proměnné kolem jejího průměru. Odhady s malými odchylkami jsou tedy koncentrovanější, přesněji odhadují parametry. Říkáme, že odhad je efektivním odhadcem konečných vzorků (ve třídě nestranných odhadů), pokud dosáhne spodní hranice výše uvedené nerovnosti Cramér – Rao pro všechny θ ∈ Θ . Efektivní odhady jsou vždy minimální odchylky nezaujaté odhady . Konverzace je však nepravdivá: Existují problémy s odhadem bodů, pro které je průměrný objektivní odhad minimální variance neefektivní.

Historicky byla účinnost konečných vzorků časným kritériem optimality. Toto kritérium má však určitá omezení:

  • Efektivní odhady konečných vzorků jsou extrémně vzácné. Ve skutečnosti se ukázalo, že efektivní odhad je možný pouze v exponenciální rodině a pouze pro přirozené parametry této rodiny.
  • Tento pojem účinnosti je někdy omezen na třídu nestranných odhadů. (Často tomu tak není.) Protože neexistují žádné dobré teoretické důvody, které by vyžadovaly, aby byly odhady nestranné, je toto omezení nepohodlné. Ve skutečnosti, pokud jako kritérium výběru použijeme střední kvadratickou chybu , mnoho zkreslených odhadů mírně překoná ty „nejlepší“ nezaujaté. Například ve statistice s více proměnnými pro dimenzi tři nebo více je průměrný objektivní odhad, průměr vzorku , nepřípustný : Bez ohledu na výsledek je jeho výkon horší než například odhad James-Stein .
  • Účinnost konečných vzorků je založena na rozptylu jako kritériu, podle něhož se odhadují odhady. Obecnějším přístupem je použití jiných ztrátových funkcí než kvadratických, v takovém případě už nelze formulovat účinnost konečných vzorků.

Příklad

Mezi modely se vyskytují v praxi, existují účinné odhady pro: průměrná μ z normální distribuce (ale ne rozptyl å 2 ), parametr λ z Poissonova rozdělení , pravděpodobnost p v binomické nebo multinomiálního distribuci .

Uvažujme model normálního rozdělení s neznámým průměrem, ale známým rozptylem: { P θ = N ( θ , σ 2 ) | θR }. Data se skládají z n nezávislých a identicky rozložených pozorování z tohoto modelu: X = ( x 1 ,…, x n ) . Odhadujeme parametr θ pomocí průměrné hodnoty vzorků ze všech pozorování:

Tento odhad má průměr θ a rozptyl σ 2  /  n , který se rovná převrácené hodnotě Fisherovy informace ze vzorku. Průměr vzorku je tedy efektivní odhad konečného vzorku pro průměr normálního rozdělení.

Relativní účinnost

Pokud a jsou odhady parametru , pak se říká, že dominuje, pokud:

  1. jeho střední kvadratická chyba (MSE) je menší alespoň pro nějakou hodnotu
  2. MSE nepřekračuje MSE pro žádnou hodnotu θ.

Formálně dominuje, pokud

platí pro všechny , s přísnou nerovností, která někde drží.

Relativní účinnost je definována jako

Ačkoli je obecně funkcí , v mnoha případech závislost odpadá; pokud je to tak, větší než jeden by naznačoval, že je to lepší, bez ohledu na skutečnou hodnotu .

Asymptotická účinnost

U některých odhadů mohou dosáhnout účinnosti asymptoticky, a proto se jim říká asymptoticky efektivní odhady. To může být případ některých odhadů maximální pravděpodobnosti nebo jakýchkoli odhadů, které dosáhnou rovnosti Cramér-Rao vázaných asymptoticky.

Viz také

Poznámky

Reference

  • Everitt, BS (2002). Statistický slovník Cambridge (2. vydání). New York, Cambridge University Press. ISBN  0-521-81099-X .
  • Romano, Joseph P .; Siegel, Andrew F. (1986). Protiklady v pravděpodobnosti a statistice . Chapman a Hall.

Další čtení