Lee – Carterův model - Lee–Carter model
Lee-Carterův model je numerický algoritmus používaný při předpovídání úmrtnosti a předpovídání délky života . Vstupem do modelu je matice věkově specifických úmrtností seřazených monotónně podle času, obvykle s věky ve sloupcích a roky v řádcích. Výstupem je prognózovaná matice míry úmrtnosti ve stejném formátu jako vstup.
Model používá dekompozici singulární hodnoty (SVD) k nalezení:
- Jednorozměrný časové řady vektoru , který zachytí 80-90% trendu úmrtnosti (zde dolní index označuje čas),
- Vektor, který popisuje relativní úmrtnost v každém věku (index se zde vztahuje na věk) a
- Konstanta změny měřítka ( v literatuře se zde označuje jako, ale nejmenovaná).
Překvapivě je obvykle lineární, z čehož vyplývá, že přírůstky průměrné délky života jsou u většiny populací rok od roku poměrně konstantní. Před výpočtem SVD se věkově specifická úmrtnost nejprve transformuje pomocí logaritmů a jejich centrováním odečtením jejich věkově specifických prostředků v průběhu času. Věkově specifický průměr v čase je označen . Dolní index odkazuje na skutečnost, že zahrnuje věk i čas.
Mnoho vědců upravuje vektor tak, že jej přizpůsobuje empirickým očekávaným délkám života pro každý rok, pomocí a generovaných pomocí SVD. Při úpravě pomocí tohoto přístupu jsou změny obvykle malé.
Pro predikci úmrtnosti se pomocí modelu ARIMA promítá (upravená či nikoli) do budoucích let . Odpovídající očekávané se získá vynásobením pomocí a první diagonální prvek S (když ). Skutečná úmrtnost se získá exponenciály tohoto vektoru.
Z důvodu linearity se obvykle modeluje jako náhodná procházka s trendem. Očekávanou délku života a další opatření v tabulce životnosti lze vypočítat z této prognózované matice po sečtení průměrů a exponenciálu k získání pravidelné míry úmrtnosti.
Ve většině implementací jsou intervaly spolehlivosti pro prognózy generovány simulací více předpovědí úmrtnosti pomocí metod Monte Carlo . Pásmo úmrtnosti mezi 5% a 95% percentilů simulovaných výsledků je považováno za platnou předpověď. Tyto simulace se provádí tím, že rozšiřuje do budoucnosti pomocí randomizace na základě standardní chyby z odvozené ze vstupních dat.
Algoritmus
Algoritmus se snaží najít řešení nejmenších čtverců rovnice:
kde je matice míry úmrtnosti pro každý věk v každém roce .
- Výpočet, který je průměrem v čase pro každý věk:
- Výpočet, který bude použit v SVD:
- Vypočítejte rozklad singulární hodnoty :
- Odvodit , (měřítko vlastní číslo), a z , a :
- Předpověď pomocí standardního jednorozměrného modelu ARIMA na další roky:
- Použijte předpovídanou s originálem a pro výpočet předpokládané míry úmrtnosti pro každý věk:
Diskuse
Bez použití SVD nebo jiné metody zmenšení dimenze je tabulka údajů o úmrtnosti vysoce korelovanou mnohorozměrnou datovou řadou a složitost těchto vícerozměrných časových řad ztěžuje jejich předvídání. SVD se široce používá jako metoda redukce dimenzí v mnoha různých oblastech, včetně Googlu v jejich algoritmu hodnocení stránek .
Model Lee – Carter představili Ronald D. Lee a Lawrence Carter v roce 1992 v článku „Modeling and Forecasting the Time Series of US Mortality“ (Journal of the American Statistical Association 87 (září): 659–671). Model vyrostl z jejich práce na konci 80. a na počátku 90. let a pokoušel se použít inverzní projekci k odvození sazeb v historické demografii . Tento model používá Americká správa sociálního zabezpečení , Úřad pro sčítání lidu USA a OSN. Stala se nejrozšířenější technikou předpovídání úmrtnosti v dnešním světě.
Došlo k rozšíření Lee-Carterova modelu, zejména kvůli chybějícím letům, korelovaným populacím mužů a žen a velké koherenci populací sdílejících režim úmrtnosti (například západní Evropa). Mnoho souvisejících článků lze nalézt na webových stránkách profesora Ronalda Lee .
Implementace
Existuje překvapivě málo softwarových balíčků pro předpovědi s modelem Lee – Carter.
- LCFIT je webový balíček s interaktivními formuláři.
- Profesor Rob J. Hyndman poskytuje balíček R pro demografii, který zahrnuje rutiny pro vytváření a předpovídání modelu Lee – Carter.
- Alternativy v R zahrnují balíček StMoMo od Villegase, Millossoviče a Kaisheva (2015).
- Profesor German Rodriguez poskytuje kód pro Lee – Carterův model pomocí Stata .
- Pomocí Matlabu sestavili profesor Eric Jondeau a profesor Michael Rockinger Longevity Toolbox pro odhad parametrů.