Multinomiální probit - Multinomial probit

Ve statistice a ekonometrii je multinomiální probitový model zobecněním použitého probitového modelu, když existuje několik možných kategorií, do kterých může závislá proměnná spadat. Jako takový je alternativou k modelu multinomiální logit jako jedné metodě klasifikace více tříd . Nesmí být zaměňována s vícerozměrným probitovým modelem , který se používá k modelování korelovaných binárních výsledků pro více než jednu nezávislou proměnnou.

Obecná specifikace

Předpokládá se, že máme řadu pozorování Y i , pro i = 1 ... n , výsledků vícecestných voleb z kategorického rozdělení velikosti m (existuje m možných voleb). Spolu s každým pozorováním Y i je množina k pozorovaných hodnot x 1, i , ..., x k, i vysvětlujících proměnných (také známých jako nezávislé proměnné , predikční proměnné, vlastnosti atd.). Nějaké příklady:

  • Pozorované výsledky mohou být „má nemoc A, má nemoc B, má nemoc C, nemá žádnou z nemocí“ pro soubor vzácných onemocnění s podobnými příznaky a vysvětlující proměnné mohou být charakteristikami pacientů považovaných za relevantní (pohlaví rasa, věk, krevní tlak , index tělesné hmotnosti , přítomnost nebo nepřítomnost různých příznaků atd.).
  • Zjištěnými výsledky jsou hlasy lidí pro danou stranu nebo kandidáta v mnohostranných volbách a vysvětlujícími proměnnými jsou demografické charakteristiky každé osoby (např. Pohlaví, rasa, věk, příjem atd.).

Model multinomiální probit je statistický model, který lze použít k předpovědi pravděpodobného výsledku nepozorovaného vícecestného pokusu s ohledem na související vysvětlující proměnné. V tomto procesu se model pokouší vysvětlit relativní účinek různých vysvětlujících proměnných na různé výsledky.

Formálně jsou výsledky Y i popsány jako kategoricky distribuovaná data, kde každá výsledná hodnota h pro pozorování i nastává s nepozorovanou pravděpodobností p i, h, která je specifická pro pozorování i po ruce, protože je určena hodnotami vysvětlující proměnné spojené s tímto pozorováním. To je:

nebo ekvivalentně

pro každou z m možných hodnot h .

Latentní variabilní model

Multinomiální probit je často psán v podmínkách modelu latentní proměnné :

kde

Pak

To znamená

Všimněte si, že tento model umožňuje libovolnou korelaci mezi chybovými proměnnými , takže nemusí nutně respektovat nezávislost irelevantních alternativ .

Když je matice identity (tak, že neexistuje žádná korelace nebo heteroscedasticita ), model se nazývá nezávislý probit .

Odhad

Podrobnosti o tom, jak se rovnice odhadují, najdete v článku Probitův model .

Reference

  • Greene, William H. (2012). Ekonometrická analýza (sedmé vydání). Boston: Pearson Education. 810–811. ISBN   978-0-273-75356-8 .