Zobecněná distribuce chí -kvadrát - Generalized chi-squared distribution

Zobecněná distribuce chí-kvadrát
Funkce hustoty pravděpodobnosti
Zobecněná funkce hustoty pravděpodobnosti chí-kvadrát
Kumulativní distribuční funkce
Zobecněná kumulativní distribuční funkce chí-kvadrát
Zápis
Parametry , vektor vah necentrálních chi-kvadrátových komponent , vektor stupňů volnosti necentrálních chi-square komponent , vektor necentrálních parametrů chi-square komponent , průměr normálního členu , sd normálního členu



Podpěra, podpora
Znamenat
Variance
CF

V teorii pravděpodobnosti a statistiky je zobecněný Chi-kvadrát rozdělení (nebo generalizované chí-kvadrát rozdělení ) je distribuce a kvadratické formy jednoho multinormal proměnné (normální vektoru) , nebo lineární kombinace různých normálních proměnných a náměstích normálních proměnných. Ekvivalentně je to také lineární součet nezávislých necentrálních proměnných chí-kvadrát a normální proměnná . Existuje několik dalších takových generalizací, pro které se někdy používá stejný termín; některé z nich jsou speciálními případy rodiny, o nichž se zde diskutuje, například distribuce gama .

Definice

Zobecněnou proměnnou chí-kvadrát lze popsat několika způsoby. Jedním z nich je napsat to jako lineární součet nezávislých necentrálních proměnných chi-square a normální proměnné:

Zde jsou parametry hmotnosti , stupně volnosti a necentrálnosti jednotlivých chi-čtverců a normální parametry a . Některé důležité zvláštní případy mají všechny váhy stejného znaménka, nebo mají centrální chí-kvadrátové komponenty, nebo vynechávají normální výraz.

Protože necentrální proměnná chí-kvadrát je součtem druhých mocnin normálních proměnných s různými prostředky, je zobecněná proměnná chi-square také definována jako součet čtverců nezávislých normálních proměnných plus nezávislá normální proměnná: tj. kvadratický v normálních proměnných.

Dalším ekvivalentním způsobem je formulovat to jako kvadratickou formu normálního vektoru :

.

Zde je matice, je vektor a je skalární. Ty spolu se střední a kovarianční maticí normálního vektoru parametrizují rozdělení. Parametry dřívějšího výrazu (pokud jde o necentrální chi-čtverce, normální a konstantu) lze vypočítat pomocí parametrů posledního výrazu (kvadratická forma normálního vektoru). Je-li (a pouze pokud) v této formulaci pozitivní-definitivní , pak všechny v první formulaci budou mít stejné znaménko.

V nejobecnějším případě lze redukci na běžný standardní formulář provést pomocí znázornění následujícího formuláře:

kde D je diagonální matice a kde x představuje vektor nekorelovaných standardních normálních náhodných proměnných.

Výpočet pdf/cdf/inverzních cdf/náhodných čísel

Hustota pravděpodobnosti, kumulativní distribuce a inverzní kumulativní distribuční funkce zobecněné proměnné chí-kvadrát nemají jednoduché výrazy v uzavřené formě. Byly však publikovány numerické algoritmy a počítačový kód ( Fortran a C , Matlab , R ) za účelem vyhodnocení některých z nich a generování náhodných vzorků.

Aplikace

Zobecněná chí-kvadrát je distribuce statistických odhadů v případech, kdy obvyklá statistická teorie neplatí, jako v příkladech níže.

Při montáži a výběru modelu

Pokud je prediktivní model vybaven nejmenšími čtverci , ale zbytky mají buď autokorelaci, nebo heteroscedasticitu , pak lze alternativní modely porovnat (při výběru modelu ) vztahem změn v součtu čtverců k asymptoticky platné generalizované distribuci chí-kvadrát.

Klasifikace normálních vektorů pomocí Gaussovy diskriminační analýzy

Pokud je normálový vektor, jeho log pravděpodobnosti je kvadratická forma z , a je tudíž distribuovány jako generalizované chi-kvadrát. Poměr pravděpodobnosti logů, který vyplývá z jedné normální distribuce oproti druhé, je také kvadratickou formou , takže je distribuován jako generalizovaný chí-kvadrát.

V Gaussově diskriminační analýze jsou vzorky z multinormálních distribucí optimálně odděleny pomocí kvadratického klasifikátoru , hranice, která je kvadratickou funkcí (např. Křivka definovaná nastavením poměru pravděpodobnosti mezi dvěma Gaussy na 1). Chyby klasifikace různých typů (falešně pozitivní a falešně negativní) jsou integrály normálních distribucí v kvadratických oblastech definovaných tímto klasifikátorem. Protože toto je matematicky ekvivalentní integraci kvadratické formy normálního vektoru, výsledkem je integrál proměnné generalizované chí-kvadrát.

Při zpracování signálu

Následující aplikace vzniká v souvislosti s Fourierovy analýzy na zpracování signálu , teorie obnovy v teorii pravděpodobnosti , a více anténních systémů v bezdrátové komunikaci . Společným faktorem těchto oblastí je, že součet exponenciálně rozložených proměnných je důležitý (nebo shodně součet čtvercových velikostí kruhově symetrických centrovaných komplexních gaussovských proměnných).

Pokud jsou k nezávislé , kruhově symetricky centrované komplexní gaussovské náhodné proměnné se střední hodnotou 0 a rozptylem , pak náhodná proměnná

má generalizovanou chi-kvadrátovou distribuci určité formy. Rozdíl oproti standardní distribuci chí-kvadrát je ten, že jsou složité a mohou mít různé odchylky, a rozdíl od obecnější generalizované distribuce chí-kvadrát je v tom, že relevantní škálovací matice A je diagonální. Pokud je pro všechny I , pak , zmenšen o (tj vynásobí ), má distribuci chi-kvadrát , , také známý jako distribuce Erlang . Pokud mají odlišné hodnoty pro všechna i , pak má pdf

Pokud mezi nimi existují sady opakovaných odchylek , předpokládejme, že jsou rozděleny do M sad, z nichž každá představuje určitou hodnotu rozptylu. Označte jako počet opakování v každé skupině. To znamená, že m th sada obsahuje proměnné, které mají rozptyl. Představuje libovolnou lineární kombinaci nezávislých distribuovaných náhodných proměnných s různými stupni volnosti:

Soubor pdf je

kde

se ze sady všech oddílů (s ) definovaných jako

Viz také

Reference

  1. ^ Davies, RB (1973) Numerická inverze charakteristické funkce. Biometrika , 60 (2), 415–417
  2. ^ a b Davies, R, B. (1980) „Algoritmus AS155: Distribuce lineární kombinace χ 2 náhodných proměnných“, Applied Statistics , 29, 323–333
  3. ^ a b Jones, DA (1983) „Statistická analýza empirických modelů vybavených optimalizací“, Biometrika , 70 (1), 67–88
  4. ^ a b c d e Das, Abhranil (2020). „Metoda integrace a klasifikace normálních distribucí“. arXiv : 2012.14331 .
  5. ^ a b Sheil, J., O'Muircheartaigh, I. (1977) „Algoritmus AS106: Distribuce nezáporných kvadratických forem v normálních proměnných“, Applied Statistics , 26, 92–98
  6. ^ Imhof, JP (1961). „Výpočet distribuce kvadratických forem v normálních proměnných“ (PDF) . Biometrika . 48 (3/4): 419–426. doi : 10,2307/2332763 . JSTOR  2332763 .
  7. ^ D. Hammarwall, M. Bengtsson, B. Ottersten (2008) „Získání částečné CSI pro prostorově selektivní přenos okamžitou zpětnouvazbou normálníhokanálu“, Transakce IEEE při zpracování signálu , 56, 1188–1204
  8. ^ E. Björnson, D. Hammarwall, B. Ottersten (2009) „Využití zpětné vazby normovaného kvantovaného kanálu prostřednictvím podmíněných statistik v arbitrárně korelovaných systémech MIMO“ , Transakce IEEE při zpracování signálu , 57, 4027–4041

externí odkazy