Berry – Esseenova věta - Berry–Esseen theorem

V teorii pravděpodobnosti je centrální limitní věta uvádí, že za určitých okolností je rozdělení pravděpodobnosti z zmenšen průměr náhodného vzorku konverguje k normálnímu rozdělení , jak se zvětšuje velikost vzorku do nekonečna. Za silnějších předpokladů dává Berry-Esseenova věta nebo Berry-Esseenova nerovnost kvantitativnější výsledek, protože také specifikuje rychlost, s jakou k této konvergenci dochází, tím, že stanoví vazbu na maximální chybu aproximace mezi normálním rozdělením a skutečné rozdělení střední velikosti měřítka. Aproximace se měří vzdáleností Kolmogorov – Smirnov . V případě nezávislých vzorků je míra konvergence n −1/2 , kde n je velikost vzorku a konstanta se odhaduje z hlediska třetích absolutních normalizovaných momentů .

Výrok věty

Výroky věty se liší, protože to nezávisle objevili dva matematici , Andrew C. Berry (v roce 1941) a Carl-Gustav Esseen (1942), kteří jej poté spolu s dalšími autory během následujících desetiletí opakovaně vylepšovali.

Stejně rozdělené sčítání

Jedna verze, která kvůli jasnosti poněkud obětuje obecnost, je následující:

Existuje kladná konstanta C taková, že pokud X 1 , X 2 , ..., jsou iid náhodné proměnné s E ( X 1 ) = 0, E ( X 1 2 ) = σ 2 > 0 a E (| X 1 | 3 ) = ρ <∞, a pokud definujeme
vzorek střední , s F n na kumulativní distribuční funkce z
a Φ kumulativní distribuční funkce standardního normálního rozdělení , pak pro všechna x a n ,
Ilustrace rozdílu v kumulativních distribučních funkcích zmiňovaných ve větě.

To znamená: vzhledem k tomu, posloupnost nezávislých a stejně rozdělené náhodné proměnné , z nichž každá má průměr nula a pozitivní rozptyl , je-li navíc třetí absolutní moment je konečný, pak kumulativní distribuční funkce z standardizovaný vzorek střední hodnota a standardní normální distribuce se liší (ve svislém směru, v grafu) nejvýše o stanovenou částku. Všimněte si, že chybová aproximace pro všechna n (a tedy omezuje rychlost konvergence na neurčitou n dostatečně velký) je ohraničen pořadí z n -1/2 .

Vypočtené hodnoty konstanty C se v průběhu let výrazně snížily, z původní hodnoty 7,59 Esseen (1942) , na 0,7882 van Beek (1972) , poté 0,7655 Shiganov (1986) , poté 0,7056 Ševtsova (2007) , poté 0,7005 Ševtsové (2008) , poté 0,5894 Tyurina (2009) , poté 0,5129 Koroleva a Ševtsové (2010a) , poté 0,4785 Tyurina (2010) . Podrobný přehled lze najít v příspěvcích Korolev & Ševtsová (2010a) a Korolev & Ševtsova (2010b) . Nejlepší odhad z roku 2012, C  <0,4748, vyplývá z nerovnosti

kvůli Shevtsové (2011) , protože σ 3  ≤ ρ a 0,33554 · 1,415 <0,4748. Pokud však ρ ≥ 1,286σ 3 , pak odhad

což dokazuje i Shevtsova (2011) , poskytuje ještě přísnější horní odhad.

Esseen (1956) dokázal, že konstanta uspokojuje i dolní mez

Neidenticky distribuované sčítání

Nechť X 1 , X 2 , ..., jsou nezávislé náhodné proměnné s E ( X i ) = 0, E ( X i 2 ) = σ i 2 > 0 a E (| X i | 3 ) = ρ i < ∞. Také nechte
být normalizovaný n -tý dílčí součet. Označme F n CDF z S n a Φ CDF z normovaného normálního rozdělení . Kvůli pohodlí označte
V roce 1941 Andrew C. Berry dokázal, že pro všechna n existuje absolutní konstanta C 1 taková
kde
Nezávisle v roce 1942 Carl-Gustav Esseen dokázal, že pro všechna n existuje absolutní konstanta C 0 taková
kde

Je snadné zajistit, aby ψ 0 ≤ψ 1 . Kvůli této okolnosti se nerovnost (3) běžně nazývá nerovnost Berry – Esseen a veličina ψ 0 se nazývá Lyapunovův zlomek třetího řádu. Navíc v případě, že sčítání X 1 , ..., X n mají identické rozdělení

a tedy hranice stanovené nerovnostmi (1), (2) a (3) se shodují odděleně od konstanty.

Pokud jde o C 0 , dolní mez stanovená Esseenem (1956) samozřejmě zůstává v platnosti:

Horní hranice pro C 0 byla následně snížena z původního odhadu 7,59 kvůli Esseenovi (1942) na (pouze s ohledem na nedávné výsledky) 0,9051 kvůli Zolotarevovi (1967) , 0,7975 kvůli van Beekovi (1972) , 0,7915 kvůli Shiganovovi (1986) ) , 0,6379 a 0,5606 kvůli Tyurinu (2009) a Tyurinu (2010) . Od roku 2011 je nejlepší odhad 0,5600, který získala Shevtsova (2010) .

Multidimenzionální verze

Stejně jako u vícerozměrné centrální limitní věty existuje vícerozměrná verze věty Berry – Esseen.

Nechť jsou nezávislé náhodné vektory, z nichž každý má střední nulu. Napište a předpokládejte, že je invertibilní. Dovolit být -dimenzionální Gaussian se stejnou střední a kovarianční maticí jako . Pak pro všechny konvexních množin ,

,

kde je univerzální konstanta a (třetí síla normy L 2 ).

Závislost na se předpokládá jako optimální, ale nemusí být.

Viz také

Poznámky

  1. ^ Jelikož náhodné proměnné jsou shodně rozloženy, X 2 , X 3 , ... všechny mají stejné momenty jako X 1 .

Reference

externí odkazy