Autoregresní model - Autoregressive model

Ve statistikách, ekonometrii a zpracování signálu je autoregresivní ( AR ) model reprezentací typu náhodného procesu; jako takový se používá k popisu určitých časově proměnných procesů v přírodě, ekonomii atd. Autoregresní model určuje, že výstupní proměnná závisí lineárně na vlastních předchozích hodnotách a na stochastickém termínu (nedokonale předvídatelném členu); model je tedy ve formě stochastické diferenciální rovnice (nebo relačního vztahu, který by neměl být zaměňován s diferenciální rovnicí). Spolu s modelem klouzavého průměru (MA) je to speciální případ a klíčová součást obecnějších modelů autoregresivního – klouzavého průměru (ARMA) a autoregresních integrovaných klouzavých průměrů (ARIMA) časových řad, které mají složitější stochastické struktura; je to také speciální případ vektorového autoregresivního modelu (VAR), který se skládá ze systému více než jedné do sebe zapadající stochastické rozdílové rovnice ve více než jedné vyvíjející se náhodné proměnné.

Na rozdíl od modelu s klouzavým průměrem (MA) není autoregresní model vždy stacionární, protože může obsahovat jednotkový kořen.

Definice

Zápis označuje autoregresivní model řádu p . Model AR ( p ) je definován jako

kde jsou parametry modelu, je konstanta a je bílý šum . To lze ekvivalentně zapsat pomocí operátoru zpětného řazení B as

takže pohybem součtového členu na levou stranu a pomocí polynomického zápisu máme

Autoregresního model může tedy být považován za výstup s all- pólového nekonečnou impulzní odezvy filtru, jehož vstup je bílý šum.

Aby model zůstal nehybný v širokém smyslu, jsou nutná určitá omezení parametrů . Například procesy v modelu AR (1) s nejsou stacionární. Obecněji řečeno, aby byl model AR ( p ) stacionární v širokém smyslu, musí kořeny polynomu ležet mimo jednotkový kruh , tj. Každý (komplexní) kořen musí splňovat (viz strany 88,90).

Intertemporal effect of shocks

V procesu AR ovlivňuje jednorázový šok hodnoty vyvíjející se proměnné nekonečně daleko do budoucnosti. Zvažte například model AR (1) . Nenulová hodnota pro řekněme čas t = 1 ovlivňuje částkou . Pak podle rovnice AR pro, pokud jde o , to ovlivňuje částkou . Pak podle rovnice AR pro, pokud jde o , to ovlivňuje částkou . Pokračování v tomto procesu ukazuje, že účinek nikdy nekončí, ačkoli pokud je proces nehybný, účinek se v limitu zmenšuje směrem k nule.

Protože každý šok ovlivňuje hodnoty X nekonečně daleko do budoucnosti, než k nim dojde, jakákoli daná hodnota X t je ovlivněna šoky, které se vyskytují nekonečně daleko do minulosti. To je také vidět přepsáním autoregrese

(kde byl konstantní člen potlačen za předpokladu, že proměnná byla měřena jako odchylky od jejího průměru) jako

Když je provedeno dělení polynomu na pravé straně, polynom v operátoru zpětného posunu, na který se vztahuje, má nekonečné pořadí - to znamená, že na pravé straně rovnice se objeví nekonečný počet zpožděných hodnot .

Charakteristický polynom

Funkce autokorelace procesu AR ( p ) může být vyjádřena jako

kde jsou kořeny polynomu

kde B je operátor zpětného posunu , kde je funkce definující autoregrese a kde jsou koeficienty v automatické regresi.

Funkce autokorelace procesu AR ( p ) je součtem rozpadajících se exponenciálů.

  • Každý skutečný kořen přispívá k funkci autokorelace, která se exponenciálně rozpadá.
  • Podobně každý pár komplexních kořenů konjugátu přispívá exponenciálně tlumenou oscilací.

Grafy procesů AR ( p )

"Obrázek má 5 grafů procesů AR. AR (0) a AR (0,3) jsou bílý šum nebo vypadají jako bílý šum. AR (0,9) má oscilační strukturu ve velkém měřítku."
AR (0); AR (1) s parametrem AR 0,3; AR (1) s parametrem AR 0,9; AR (2) s parametry AR 0,3 a 0,3; a AR (2) s parametry AR 0,9 a -0,8

Nejjednodušším procesem AR je AR (0), který mezi podmínkami není nijak závislý. K výstupu procesu přispívá pouze termín chyba/inovace/šum, takže na obrázku odpovídá AR (0) bílému šumu.

U procesu AR (1) s kladem přispívá k výstupu pouze předchozí člen procesu a hlukový člen. Pokud se blíží 0, pak proces stále vypadá jako bílý šum, ale jak se blíží k 1, výstup získá větší příspěvek z předchozího termínu vzhledem k šumu. Výsledkem je „vyhlazení“ nebo integrace výstupu, podobně jako dolní propust.

U procesu AR (2) přispívají k výstupu předchozí dva termíny a termín šumu. Pokud jsou obě a kladné, bude výstup připomínat dolní propust se sníženou vysokofrekvenční částí šumu. Pokud je kladný, zatímco je záporný, pak proces upřednostňuje změny znaménka mezi podmínkami procesu. Výstup osciluje. To lze přirovnat k detekci hran nebo detekci změny směru.

Příklad: Proces AR (1)

Proces AR (1) je dán:

kde je proces bílého šumu s nulovým průměrem a konstantním rozptylem . (Poznámka: Dolní index byl vypuštěn.) Proces je nehybný, pokud je získán jako výstup stabilního filtru, jehož vstupem je bílý šum. (Je-li pak rozptyl závisí na zpožděním t, aby se rozptyl série rozchází do nekonečna t jde do nekonečna, a proto není širokém smyslu pohybu.) Za předpokladu, že je střední je shodný pro všechny hodnoty t ukládané samotná definice široké smyslové stacionarity. Pokud je průměr označen , vyplývá z

že

a proto

Zejména pokud , pak průměr je 0.

Rozptyl je

kde je standardní odchylka . To lze ukázat tím, že si toho všimneme

a poté tím, že si všimneme, že výše uvedené množství je stabilním pevným bodem tohoto vztahu.

Autokovarianční je dán

Je vidět, že funkce autocovariance se rozpadá s časem rozpadu (také nazývaným časová konstanta ) [aby to bylo vidět, napište, kde je nezávislý na . Pak si toho všimněte a přiřaďte to k zákonu exponenciálního rozpadu ].

Funkce spektrální hustoty je Fourierova transformace funkce autokoviance. V diskrétních termínech to bude diskrétní Fourierova transformace:

Tento výraz je periodický kvůli diskrétní povaze , která se ve jmenovateli projevuje jako kosinový výraz. Pokud předpokládáme, že doba vzorkování ( ) je mnohem menší než doba rozpadu ( ), pak můžeme použít aproximaci kontinua k :

který poskytuje Lorentzianův profil pro spektrální hustotu:

kde je úhlová frekvence spojená s dobou rozpadu .

Alternativní výraz pro lze odvodit nejprve nahrazením za v definující rovnici. Pokračováním tohoto procesu se N krát získá

Pro N blížící se nekonečnu se přiblíží k nule a:

Je vidět, že je to bílý šum spletený s jádrem plus konstantní průměr. V případě, že bílý šum je Gaussian proces pak je také Gaussian proces. V ostatních případech centrální limitní věta naznačuje, že bude přibližně normálně distribuováno, když je blízko jedné.

Explicitní průměr/rozdíl procesu AR (1)

Model AR (1) je diskrétní časovou analogií spojitého Ornstein-Uhlenbeckova procesu . Někdy je proto užitečné porozumět vlastnostem modelu AR (1) obsazeného v ekvivalentní podobě. V této podobě je model AR (1) s parametrem procesu dán vztahem:

, kde a je model průměr.

Tím, že to vložíte do formuláře a poté rozšíříte sérii pro , můžete ukázat, že:

, a
.

Volba maximálního zpoždění

Částečná autokorelace procesu AR (p) se rovná nule při zpoždění, které není větší než řád p a poskytuje dobrý model pro korelaci mezi a , takže příslušné maximální zpoždění je takové, za kterým jsou částečné autokorelace nulové.

Výpočet parametrů AR

Existuje mnoho způsobů, jak odhadnout koeficienty, například obyčejný postup nejmenších čtverců nebo metoda momentů (prostřednictvím Yule -Walkerových rovnic).

Model AR ( p ) je dán rovnicí

Je založen na parametrech, kde i = 1, ..., s . Mezi těmito parametry a kovarianční funkcí procesu existuje přímá shoda a tuto korespondenci je možné převrátit za účelem určení parametrů z autokorelační funkce (která je sama získána z kovariancí). To se provádí pomocí Yule -Walkerových rovnic.

Yule -Walkerovy rovnice

Rovnice Yule -Walker , pojmenované pro Udny Yule a Gilberta Walkera , jsou následující sadou rovnic.

kde m  = 0,…,  p , čímž se získají rovnice p  + 1 . Zde je funkce autokoviance X t , je standardní odchylkou procesu vstupního šumu a je funkcí Kroneckerova delta .

Protože poslední část individuální rovnice je nenulová, pouze pokud m  = 0 , sadu rovnic lze vyřešit reprezentací rovnic pro m  > 0 ve formě matice, čímž dostaneme rovnici

což lze vyřešit pro všechny Zbývající rovnice pro m = 0 je

které, jakmile jsou známy, lze vyřešit

Alternativní formulace je z hlediska autokorelační funkce . Parametry AR jsou určeny prvními prvky p +1 funkce autokorelace. Plnou autokorelační funkci pak lze odvodit rekurzivním výpočtem

Příklady některých procesů AR ( p ) nižšího řádu

  • p = 1
    • Proto
  • p = 2
    • Yule -Walkerovy rovnice pro proces AR (2) jsou
      • Pamatuj si to
      • Pomocí výtěžků první rovnice
      • Pomocí výtěžku rekurzního vzorce

Odhad parametrů AR

Výše uvedené rovnice (Yule -Walkerovy rovnice) poskytují několik cest k odhadu parametrů modelu AR ( p ) nahrazením teoretických kovariancí odhadovanými hodnotami. Některé z těchto variant lze popsat následovně:

  • Odhad autocovariancí nebo autokorelací. Zde se každý z těchto výrazů odhaduje samostatně pomocí konvenčních odhadů. Existují různé způsoby, jak toho dosáhnout, a volba mezi nimi ovlivňuje vlastnosti odhadovacího schématu. Některé volby mohou například vytvářet negativní odhady rozptylu.
  • Formulace jako regresní problém nejmenších čtverců, ve kterém je konstruován obyčejný problém predikce nejmenších čtverců, založený na predikci hodnot X t na p předchozích hodnotách stejné řady. To lze považovat za schéma předpovědi vpřed. V normální rovnice tohoto problému je možné vidět, aby odpovídaly aproximaci maticovém tvaru rovnic Yule-Walker, ve kterém je každý výskyt z autokovarianční stejného zpoždění nahrazen mírně odlišným odhadu.
  • Formulace jako rozšířená forma obyčejného problému predikce nejmenších čtverců. Zde jsou dvě sady predikčních rovnic sloučeny do jednoho odhadovacího schématu a jedné sady normálních rovnic. Jedna sada je sada rovnic předpovědi vpřed a druhá je odpovídající sadou rovnic zpětné predikce, které se týkají zpětné reprezentace modelu AR:
Zde by predikované hodnoty X t vycházely z p budoucích hodnot stejné řady. Tento způsob odhadu parametrů AR je způsoben Burgem a nazývá se Burgova metoda: Burg a novější autoři nazývali tyto konkrétní odhady „odhady maximální entropie“, ale zdůvodnění za tím platí pro použití jakékoli sady odhadovaných parametrů AR. Ve srovnání se schématem odhadu používajícím pouze rovnice předpovědi vpřed jsou vytvářeny různé odhady autocovariancí a odhady mají různé vlastnosti stability. Burg odhady jsou zvláště spojené s maximálním entropickým spektrálním odhadem .

Mezi další možné přístupy k odhadu patří odhad maximální pravděpodobnosti . K dispozici jsou dvě odlišné varianty maximální pravděpodobnosti: v jedné (široce ekvivalentní schématu nejmenších čtverců s dopřednou predikcí) je uvažována funkce pravděpodobnosti, která odpovídá podmíněné distribuci pozdějších hodnot v řadě vzhledem k počátečním hodnotám p v řadě; ve druhém uvažovaná funkce pravděpodobnosti je ta, která odpovídá bezpodmínečnému společnému rozdělení všech hodnot v sledované řadě. K podstatným rozdílům ve výsledcích těchto přístupů může dojít, pokud je sledovaná řada krátká, nebo pokud se proces blíží nestacionaritě.

Spektrum

AutocorrTimeAr.svg
AutoCorrAR.svg

Spektrální hustota výkonu (PSD) z (AR p ) procesu se rozptylu šumu je

AR (0)

Pro bílý šum (AR (0))

AR (1)

Pro AR (1)

  • Pokud existuje jeden spektrální vrchol při f = 0, často označovaný jako červený šum . Jak se blíží 1, je silnější výkon na nízkých frekvencích, tj. Větší časové zpoždění. Jedná se pak o nízkoprůchodový filtr, při aplikaci na světlo celého spektra bude filtrováno vše kromě červeného světla.
  • Pokud existuje minimum při f = 0, často označované jako modrý šum . Podobně to funguje jako horní propust, filtrováno bude vše kromě modrého světla.

AR (2)

Procesy AR (2) lze rozdělit do tří skupin v závislosti na charakteristikách jejich kořenů:

  • Když má tento proces dvojici komplexně sdružených kořenů, vytváří vrchol střední frekvence při:

Jinak má tento proces skutečné kořeny a:

  • Když funguje jako dolní propust na bílý šum se spektrálním vrcholem při
  • Když funguje jako horní propust na bílý šum se spektrálním vrcholem při .

Proces je nestacionární, když jsou kořeny mimo jednotkový kruh. Tento proces je stabilní, když jsou kořeny v jednotkovém kruhu, nebo ekvivalentně, když jsou koeficienty v trojúhelníku .

Plnou funkci PSD lze vyjádřit ve skutečné podobě jako:

Implementace v balíčcích statistik

  • R , balíček statistik obsahuje funkci ar .
  • Nástroje MATLAB Econometrics Toolbox a System Identification Toolbox obsahují autoregresivní modely
  • Matlab a Octave : Sada nástrojů TSA obsahuje několik funkcí odhadu pro jednovariantní, vícerozměrné a adaptivní autoregresivní modely.
  • PyMC3 : bayesianského statistika a pravděpodobnostní programový rámec podpěry autoregresní režimy s p zaostává.
  • bayesloop podporuje odvozování parametrů a výběr modelu pro proces AR-1 s časově proměnnými parametry.
  • Python : implementace ve statistických modelech.

Impulsní reakce

Impulsní odezva systému je změna ve vyvíjejícím se měnit v odezvě na změnu hodnoty šok období k- období dříve, jako funkce k . Protože model AR je zvláštním případem vektorového autoregresivního modelu, platí zde výpočet impulzní odezvy ve vektorové autoregresní#impulzní odpovědi .

n -krokové předpovídání

Jednou parametry autoregrese

byly odhadnuty, autoregrese může být použita k předpovědi libovolného počtu období do budoucnosti. První použití t se vztahuje k prvnímu období, pro které ještě nejsou data k dispozici; dosadit známé předchozí hodnoty X t-i za i = 1, ..., p do autoregresivní rovnice při nastavení chybového členu na nulu (protože předpovídáme, že X t se rovná jeho očekávané hodnotě a očekávané hodnotě nepozorovaného chybového členu je nula). Výstupem autoregresivní rovnice je předpověď pro první nepozorované období. Dále použijte t k označení dalšího období, pro které ještě nejsou data k dispozici; k předpovědi se opět používá autoregresivní rovnice s jedním rozdílem: hodnota X jednoho období před tím, které je nyní předpovídáno, není známa, takže se místo toho použije jeho očekávaná hodnota - předpokládaná hodnota vyplývající z předchozího kroku prognózy - . Pak se pro budoucí období použije stejný postup, pokaždé s použitím jedné další předpovědní hodnoty na pravé straně prediktivní rovnice, dokud po p predikcích nebudou všechny hodnoty p pravé strany předpovězeny z předchozích kroků.

Existují čtyři zdroje nejistoty ohledně předpovědí získaných tímto způsobem: (1) nejistota, zda je autoregresní model správným modelem; (2) nejistota ohledně přesnosti předpovídaných hodnot, které jsou použity jako zpožděné hodnoty na pravé straně autoregresivní rovnice; (3) nejistota ohledně skutečných hodnot autoregresivních koeficientů; a (4) nejistota ohledně hodnoty chybového termínu pro předpovídané období. Každá z posledních tří lze kvantifikovat a spojí na interval spolehlivosti pro n -Step napřed předpovědi; interval spolehlivosti se bude rozšiřovat, protože n se bude zvyšovat, protože se použije rostoucí počet odhadovaných hodnot pro proměnné na pravé straně.

Hodnocení kvality prognóz

Prediktivní výkon autoregresivního modelu lze posoudit, jakmile byl proveden odhad, pokud je použita křížová validace . V tomto přístupu byla některá původně dostupná data použita pro účely odhadu parametrů a část (z dostupných pozorování později v datové sadě) byla zadržena pro testování mimo vzorek. Alternativně po uplynutí určité doby po provedení odhadu parametrů bude k dispozici více dat a bude možné vyhodnotit prediktivní výkon a poté použít nová data.

V každém případě existují dva aspekty prediktivního výkonu, které lze vyhodnotit: výkon o jeden krok vpřed a n -krok vpřed. Pro jednokrokový výkon vpřed jsou odhadované parametry použity v autoregresivní rovnici spolu s pozorovanými hodnotami X pro všechna období před tím, které je předpovídáno, a výstupem rovnice je jednostupňová předpověď; tento postup se používá k získání předpovědí pro každé pozorování mimo vzorek. K vyhodnocení kvality n -krokových předpovědí se k získání predikcí používá postup předpovídání v předchozí části.

Vzhledem k sadě predikovaných hodnot a odpovídající sadě skutečných hodnot pro X pro různá časová období je běžnou vyhodnocovací technikou použití střední kvadratické predikční chyby ; jsou k dispozici i další opatření (viz předpovědi#přesnost předpovědí ).

Nabízí se otázka, jak interpretovat naměřenou přesnost předpovědí - například, co je „vysoká“ (špatná) nebo „nízká“ (dobrá) hodnota střední chyby predikce na druhou? Existují dva možné body srovnání. Za prvé, pro účely srovnání lze použít předpovědní přesnost alternativního modelu, odhadovanou podle různých předpokladů modelování nebo různých odhadovacích technik. Za druhé, míru přesnosti mimo vzorek lze porovnat se stejným měřítkem vypočítaným pro datové body ve vzorku (které byly použity pro odhad parametrů), pro které je k dispozici dostatek předchozích hodnot dat (tj. Vynechání prvních p dat body, pro které p předchozí datové body nejsou k dispozici). Vzhledem k tomu, že model byl specificky odhadnut tak, aby co nejlépe odpovídal bodům ve vzorku, bude obvykle platit, že prediktivní výkon mimo vzorek bude horší než prediktivní výkon ve vzorku. Pokud se ale prediktivní kvalita zhorší mimo vzorek „ne moc“ (což není přesně definovatelné), pak může být prognostik s výkonem spokojen.

Viz také

Poznámky

Reference

  • Mills, Terence C. (1990). Techniky časové řady pro ekonomy . Cambridge University Press.
  • Percival, Donald B .; Walden, Andrew T. (1993). Spektrální analýza pro fyzické aplikace . Cambridge University Press.
  • Pandit, Sudhakar M .; Wu, Shien-Ming (1983). Časová řada a systémová analýza s aplikacemi . John Wiley & Sons.

externí odkazy