Podmíněná nezávislost - Conditional independence

V teorii pravděpodobnosti , podmíněná nezávislost popisuje situace, kde pozorování je irelevantní, nebo nadbytečné při hodnocení jistotu hypotéza. Podmíněná nezávislost je obvykle formulována z hlediska podmíněné pravděpodobnosti , jako speciální případ, kdy pravděpodobnost hypotézy daná neinformativním pozorováním je rovna pravděpodobnosti bez. Pokud je hypotéza a jsou pozorování, podmíněná nezávislost může být uvedena jako rovnost:

kde je pravděpodobnost daných obou a . Protože pravděpodobnost daného je stejná jako pravděpodobnost daných obou a , tato rovnost vyjadřuje, že nic nepřispívá k jistotě . V takovém případě, a jsou řekl, aby byl podmínečně nezávislý daný , psaný symbolicky jako: .

Koncept podmíněné nezávislosti je zásadní pro teorie založené na grafech statistických závěrů, protože vytváří matematický vztah mezi souborem podmíněných příkazů a grafem .

Podmíněná nezávislost událostí

Nechť , a být události . a je řekl, aby byl podmíněně nezávislý daný právě tehdy, když a:

Tato vlastnost je často napsáno: .

Ekvivalentně může být podmíněná nezávislost uvedena jako:

kde je společná pravděpodobnost of a vzhledem . Tento alternativní formulace uvádí, že a jsou nezávislé jevy , vzhledem k tomu .

Důkaz ekvivalentní definice

iff      (definice podmíněné pravděpodobnosti )
iff       (vynásobte obě strany )
iff       (rozdělte obě strany )
iff       (definice podmíněné pravděpodobnosti)

Příklady

Diskuse o StackExchange poskytuje několik užitečných příkladů. Viz. níže.

Barevné boxy

Každá buňka představuje možný výsledek. Události , a jsou reprezentovány oblastech zastíněných červené , modré a žluté v daném pořadí. Překrývání mezi událostmi a je stínováno purpurově .

Toto jsou dva příklady ilustrující podmíněnou nezávislost.

Pravděpodobnosti těchto událostí jsou stínované oblasti vzhledem k celkové ploše. V obou příkladech a jsou podmíněně nezávislé uvedeny proto, že:

ale není podmíněně nezávislý, protože:

Počasí a zpoždění

Nechť jsou obě události pravděpodobností, že se osoby A a B dostanou domů včas na večeři, a třetí událostí je skutečnost, že město zasáhla sněhová bouře. Zatímco A i B mají nižší pravděpodobnost, že se dostanou domů včas na večeři, nižší pravděpodobnosti budou na sobě stále nezávislé. To znamená, že znalost, že A má zpoždění, vám neřekne, zda B bude pozdě. (Možná žijí v různých čtvrtích, cestují na různé vzdálenosti a používají různé způsoby dopravy.) Pokud však máte informace, že žijí ve stejné čtvrti, využívejte stejnou dopravu a pracujte na stejném místě, pak události NEJSOU podmíněně nezávislé.

Házení kostkami

Podmíněná nezávislost závisí na povaze třetí události. Pokud hodíte dvěma kostkami, můžete předpokládat, že se tyto dvě kostky chovají nezávisle na sobě. Pohled na výsledky jedné kostky vám neřekne o výsledku druhé kostky. (To znamená, že dvě kostky jsou nezávislé.) Pokud je však výsledek první kostky 3 a někdo vám řekne o třetí události - že součet dvou výsledků je sudý - pak tato další jednotka informací omezuje možnosti pro 2. výsledek na liché číslo. Jinými slovy, dvě události mohou být nezávislé, ale NE podmíněně nezávislé.

Výška a slovní zásoba

Výška a slovní zásoba jsou závislé, protože velmi malí lidé bývají dětmi a jsou známí svými základními slovníky. Ale s vědomím, že dvěma lidem je 19 let (tj. Podmíněno věkem), není důvod si myslet, že slovní zásoba jedné osoby je větší, pokud nám řeknou, že jsou vyšší.

Podmíněná nezávislost náhodných proměnných

Dvě náhodné proměnné a jsou podmíněně nezávislý daný třetiny diskrétní náhodná veličina tehdy a jen tehdy, pokud jsou nezávislé na jejich podmíněného rozdělení pravděpodobnosti dané . To znamená, že i podmíněně nezávislý daný tehdy a jen tehdy, pokud daný nějaké hodnoty , rozdělení pravděpodobnosti je stejný pro všechny hodnoty a rozdělení pravděpodobnosti je stejný pro všechny hodnoty . Formálně:

 

 

 

 

( Rovnice 2 )

kde je podmíněno kumulativní distribuční funkce of a vzhledem .

Dvě události a jsou podmíněně nezávislé vzhledem k σ-algebře if

kde označuje podmíněnou očekávání o funkci indikátoru události , vzhledem k sigma algebry . To znamená,

Dvě náhodné veličiny a jsou podmíněně nezávislé vzhledem k σ-algebře, pokud výše uvedená rovnice platí pro všechny in a in .

Dvě náhodné proměnné a jsou podmíněně nezávislé vzhledem k náhodné proměnné, pokud jsou nezávislé na σ ( W ): σ-algebra generovaná . Běžně se píše:

nebo

Toto se čte „ je nezávislé na , dané “; podmiňování platí pro celé tvrzení: „( je nezávislé na ) dané “.

Pokud předpokládá počitatelnou sadu hodnot, je to ekvivalentní podmíněné nezávislosti X a Y pro události ve formuláři . Podmíněná nezávislost více než dvou událostí nebo více než dvou náhodných proměnných je definována analogicky.

Následující dva příklady ukazují, že to neznamená ani neznamená . Předpokládejme nejprve 0 s pravděpodobností 0,5 a 1 jinak. Když W  = 0 vezměte a buďte nezávislí, každý má hodnotu 0 s pravděpodobností 0,99 a jinak hodnotu 1. Kdy , a jsou opět nezávislí, ale tentokrát nabývají hodnoty 1 s pravděpodobností 0,99. Potom . Ale i jsou závislé, protože Pr ( X  = 0) <Pr ( X  = 0 | Y  = 0). Důvodem je, že Pr ( X  = 0) = 0,5, ale pokud Y  = 0, pak je velmi pravděpodobné, že W  = 0 a tedy i X  = 0, takže Pr ( X  = 0 | Y  = 0)> 0,5. U druhého příkladu předpokládejme, že každý nabývá hodnot 0 a 1 s pravděpodobností 0,5. Nechť je produkt . Když pak , Pr ( X  = 0) = 2/3, ale Pr ( X  = 0 | Y  = 0) = 1/2, je tedy false. Toto je také příklad Vysvětlení. Podívejte se na tutoriál Kevina Murphyho a vezměte hodnoty „chytrý“ a „sportovní“.

Podmíněná nezávislost náhodných vektorů

Dva náhodné vektory a jsou podmíněně nezávislé vzhledem k třetímu náhodnému vektoru právě tehdy, pokud jsou nezávislé na dané podmíněné kumulativní distribuci . Formálně:

 

 

 

 

( Rovnice 3 )

kde , a a podmíněné kumulativní distribuce jsou definovány následujícím způsobem.

Využití v Bayesovské dedukci

Nechť p je podíl voličů, kteří budou v nadcházejícím referendu hlasovat „ano“ . Při průzkumu veřejného mínění si člověk náhodně vybere n voličů z populace. Pro i  = 1,…,  n , nechť X i  = 1 nebo 0 odpovídá tomu, zda i zvolený volič bude nebo nebude hlasovat „ano“.

Ve frekventistickém přístupu ke statistickým závěrům by člověk nepřisuzoval žádné rozdělení pravděpodobnosti p (pokud by pravděpodobnosti nebylo možné nějak interpretovat jako relativní četnost výskytu nějaké události nebo jako podíl nějaké populace) a dalo by se říci, že X 1 ,…, X n jsou nezávislé náhodné proměnné.

Naproti tomu v bayesovském přístupu ke statistické inferenci by bylo přiřazeno rozdělení pravděpodobnosti k p bez ohledu na neexistenci jakékoli takové interpretace „frekvence“ a pravděpodobnosti by byly konstruovány jako stupně přesvědčení, že p je v jakémkoli intervalu kterým je přiřazena pravděpodobnost. V tomto modelu jsou náhodné veličiny Xa 1 , ...,  X n jsou to nezávislé, ale jsou podmíněně nezávislé vzhledem k hodnotě p . Zejména pokud je pozorováno , že velký počet X je roven 1, znamenalo by to vysokou podmíněnou pravděpodobnost , vzhledem k tomuto pozorování, že p je blízko 1, a tedy vysokou podmíněnou pravděpodobnost , vzhledem k tomuto pozorování, že další X k pozorování se bude rovnat 1.

Pravidla podmíněné nezávislosti

Ze základní definice byl odvozen soubor pravidel upravujících prohlášení o podmíněné nezávislosti.

Tato pravidla byla Pearlem a Pazem označována jako „ Graphoid Axioms “, protože drží v grafech, kde je interpretováno tak, že znamená: „Všechny cesty od X do A jsou zachyceny množinou B “.

Symetrie

Rozklad

Důkaz

  •      (význam )
  •      (ignorujte proměnnou B její integrací)
  •     

Podobný důkaz ukazuje nezávislost X a B .

Slabá unie

Důkaz

  • Podle předpokladu, .
  • Vzhledem k majetku rozkladu , .
  • Kombinace výše uvedených dvou rovností dává , což stanoví .

Druhou podmínku lze dokázat obdobně.

Kontrakce

Důkaz

Tuto vlastnost lze prokázat povšimnutím , přičemž každá rovnost je prosazována a .

Průsečík

Pro striktně pozitivní rozdělení pravděpodobnosti platí také následující:

Důkaz

Podle předpokladu:

Pomocí této rovnosti spolu se zákonem celkové pravděpodobnosti platí pro :

Od a z toho plyne .


Technická poznámka: jelikož tyto důsledky držet jakéhokoli prostoru pravděpodobnosti, budou i nadále držet, pokud vezmeme v úvahu dílčí vesmíru klimatizace všechno na jiné proměnné, řekněme  K . Například by to také znamenalo .

Viz také

Reference

externí odkazy