Multinomiální probit - Multinomial probit
Část série na |
Regresní analýza |
---|
Modely |
Odhad |
Pozadí |
Ve statistice a ekonometrii je multinomiální probitový model zobecněním použitého probitového modelu, když existuje několik možných kategorií, do kterých může závislá proměnná spadat. Jako takový je alternativou k modelu multinomiální logit jako jedné metodě klasifikace více tříd . Nesmí být zaměňována s vícerozměrným probitovým modelem , který se používá k modelování korelovaných binárních výsledků pro více než jednu nezávislou proměnnou.
Obecná specifikace
Předpokládá se, že máme řadu pozorování Y i , pro i = 1 ... n , výsledků vícecestných voleb z kategorického rozdělení velikosti m (existuje m možných voleb). Spolu s každým pozorováním Y i je množina k pozorovaných hodnot x 1, i , ..., x k, i vysvětlujících proměnných (také známých jako nezávislé proměnné , predikční proměnné, vlastnosti atd.). Nějaké příklady:
- Pozorované výsledky mohou být „má nemoc A, má nemoc B, má nemoc C, nemá žádnou z nemocí“ pro soubor vzácných onemocnění s podobnými příznaky a vysvětlující proměnné mohou být charakteristikami pacientů považovaných za relevantní (pohlaví rasa, věk, krevní tlak , index tělesné hmotnosti , přítomnost nebo nepřítomnost různých příznaků atd.).
- Zjištěnými výsledky jsou hlasy lidí pro danou stranu nebo kandidáta v mnohostranných volbách a vysvětlujícími proměnnými jsou demografické charakteristiky každé osoby (např. Pohlaví, rasa, věk, příjem atd.).
Model multinomiální probit je statistický model, který lze použít k předpovědi pravděpodobného výsledku nepozorovaného vícecestného pokusu s ohledem na související vysvětlující proměnné. V tomto procesu se model pokouší vysvětlit relativní účinek různých vysvětlujících proměnných na různé výsledky.
Formálně jsou výsledky Y i popsány jako kategoricky distribuovaná data, kde každá výsledná hodnota h pro pozorování i nastává s nepozorovanou pravděpodobností p i, h, která je specifická pro pozorování i po ruce, protože je určena hodnotami vysvětlující proměnné spojené s tímto pozorováním. To je:
nebo ekvivalentně
pro každou z m možných hodnot h .
Latentní variabilní model
Multinomiální probit je často psán v podmínkách modelu latentní proměnné :
kde
Pak
To znamená
Všimněte si, že tento model umožňuje libovolnou korelaci mezi chybovými proměnnými , takže nemusí nutně respektovat nezávislost irelevantních alternativ .
Když je matice identity (tak, že neexistuje žádná korelace nebo heteroscedasticita ), model se nazývá nezávislý probit .
Odhad
Podrobnosti o tom, jak se rovnice odhadují, najdete v článku Probitův model .
Reference
- Greene, William H. (2012). Ekonometrická analýza (sedmé vydání). Boston: Pearson Education. 810–811. ISBN 978-0-273-75356-8 .