Lee – Carterův model - Lee–Carter model

Lee-Carterův model je numerický algoritmus používaný při předpovídání úmrtnosti a předpovídání délky života . Vstupem do modelu je matice věkově specifických úmrtností seřazených monotónně podle času, obvykle s věky ve sloupcích a roky v řádcích. Výstupem je prognózovaná matice míry úmrtnosti ve stejném formátu jako vstup.

Model používá dekompozici singulární hodnoty (SVD) k nalezení:

  • Jednorozměrný časové řady vektoru , který zachytí 80-90% trendu úmrtnosti (zde dolní index označuje čas),
  • Vektor, který popisuje relativní úmrtnost v každém věku (index se zde vztahuje na věk) a
  • Konstanta změny měřítka ( v literatuře se zde označuje jako, ale nejmenovaná).

Překvapivě je obvykle lineární, z čehož vyplývá, že přírůstky průměrné délky života jsou u většiny populací rok od roku poměrně konstantní. Před výpočtem SVD se věkově specifická úmrtnost nejprve transformuje pomocí logaritmů a jejich centrováním odečtením jejich věkově specifických prostředků v průběhu času. Věkově specifický průměr v čase je označen . Dolní index odkazuje na skutečnost, že zahrnuje věk i čas.

Mnoho vědců upravuje vektor tak, že jej přizpůsobuje empirickým očekávaným délkám života pro každý rok, pomocí a generovaných pomocí SVD. Při úpravě pomocí tohoto přístupu jsou změny obvykle malé.

Pro predikci úmrtnosti se pomocí modelu ARIMA promítá (upravená či nikoli) do budoucích let . Odpovídající očekávané se získá vynásobením pomocí a první diagonální prvek S (když ). Skutečná úmrtnost se získá exponenciály tohoto vektoru.

Z důvodu linearity se obvykle modeluje jako náhodná procházka s trendem. Očekávanou délku života a další opatření v tabulce životnosti lze vypočítat z této prognózované matice po sečtení průměrů a exponenciálu k získání pravidelné míry úmrtnosti.

Ve většině implementací jsou intervaly spolehlivosti pro prognózy generovány simulací více předpovědí úmrtnosti pomocí metod Monte Carlo . Pásmo úmrtnosti mezi 5% a 95% percentilů simulovaných výsledků je považováno za platnou předpověď. Tyto simulace se provádí tím, že rozšiřuje do budoucnosti pomocí randomizace na základě standardní chyby z odvozené ze vstupních dat.

Algoritmus

Algoritmus se snaží najít řešení nejmenších čtverců rovnice:

kde je matice míry úmrtnosti pro každý věk v každém roce .

  1. Výpočet, který je průměrem v čase pro každý věk:
  2. Výpočet, který bude použit v SVD:
  3. Vypočítejte rozklad singulární hodnoty :
  4. Odvodit , (měřítko vlastní číslo), a z , a :
  5. Předpověď pomocí standardního jednorozměrného modelu ARIMA na další roky:
  6. Použijte předpovídanou s originálem a pro výpočet předpokládané míry úmrtnosti pro každý věk:

Diskuse

Bez použití SVD nebo jiné metody zmenšení dimenze je tabulka údajů o úmrtnosti vysoce korelovanou mnohorozměrnou datovou řadou a složitost těchto vícerozměrných časových řad ztěžuje jejich předvídání. SVD se široce používá jako metoda redukce dimenzí v mnoha různých oblastech, včetně Googlu v jejich algoritmu hodnocení stránek .

Model Lee – Carter představili Ronald D. Lee a Lawrence Carter v roce 1992 v článku „Modeling and Forecasting the Time Series of US Mortality“ (Journal of the American Statistical Association 87 (září): 659–671). Model vyrostl z jejich práce na konci 80. a na počátku 90. let a pokoušel se použít inverzní projekci k odvození sazeb v historické demografii . Tento model používá Americká správa sociálního zabezpečení , Úřad pro sčítání lidu USA a OSN. Stala se nejrozšířenější technikou předpovídání úmrtnosti v dnešním světě.

Došlo k rozšíření Lee-Carterova modelu, zejména kvůli chybějícím letům, korelovaným populacím mužů a žen a velké koherenci populací sdílejících režim úmrtnosti (například západní Evropa). Mnoho souvisejících článků lze nalézt na webových stránkách profesora Ronalda Lee .

Implementace

Existuje překvapivě málo softwarových balíčků pro předpovědi s modelem Lee – Carter.

Reference