Evolučně stabilní strategie - Evolutionarily stable strategy

Evolučně stabilní strategie
Koncepce řešení v teorii her
Vztah
Podmnožina Nashova rovnováha
Nadmnožina Stochasticky stabilní rovnováha , stabilní silná Nashova rovnováha
Protíná se Dokonalá rovnováha podhry , třesoucí se dokonalá rovnováha ruky , dokonalá Bayesova rovnováha
Význam
Navrhl John Maynard Smith a George R. Price
Používá Biologické modelování a evoluční teorie her
Příklad Holubice

Evolučně stabilní strategie ( ESS ) je strategie (nebo sada strategie), která je nepropustná , když přijatá populace v adaptaci na specifické prostředí, to znamená, že nemůže být přemístěn alternativní strategie (nebo soubor strategií), které mohou být nové nebo zpočátku vzácné. Představený Johnem Maynardem Smithem a Georgem R. Priceem v letech 1972/3, je to důležitý koncept v behaviorální ekologii , evoluční psychologii , matematické teorii her a ekonomii s aplikacemi v jiných oblastech, jako je antropologie , filozofie a politologie .

Ve hře-teoretická hlediska ESS je rovnováha zjemnění na Nash rovnováhy , který je Nash rovnováha, která je také „evolučně stabilní .“ Jakmile je tedy v populaci fixován , stačí pouze přirozený výběr, aby se zabránilo nahrazení alternativních ( mutantních ) strategií (i když to nevylučuje možnost, že v reakci na selektivní tlaky vyplývající z změna životního prostředí).

Dějiny

Evolučně stabilní strategie byly definovány a zavedeny Johnem Maynardem Smithem a Georgem R. Priceem v 1973 Nature paper. Takový byl čas potřebný při recenzování článku pro Nature , kterému předcházela esej z roku 1972 Maynard Smith v knize esejů s názvem O evoluci . Esej z roku 1972 je někdy uváděna namísto článku z roku 1973, ale u univerzitních knihoven je mnohem pravděpodobnější, že budou mít kopie Nature . Příspěvky v přírodě jsou obvykle krátké; v roce 1974 publikoval Maynard Smith delší článek v časopise Journal of Theoretical Biology . Maynard Smith dále vysvětluje ve své knize Evoluce a teorie her z roku 1982 . Někdy jsou místo toho citovány. Ve skutečnosti se ESS stal tak důležitým pro teorii her, že často není uvedena žádná citace, protože se o ní předpokládá, že ji čtenář dobře zná.

Maynard Smith matematicky formalizoval slovní argument Price, který si přečetl při recenzování Priceova článku. Když si Maynard Smith uvědomil, že poněkud neuspořádaný Price nebyl připraven revidovat svůj článek ke zveřejnění, nabídl přidání Price jako spoluautora.

Koncept byl odvozen z práce RH MacArthura a WD Hamiltona na poměrech pohlaví , odvozeného z Fisherova principu , zejména Hamiltonova (1967) koncepce bezkonkurenční strategie . Maynard Smith byl společně oceněn Crafoordovou cenou za rok 1999 za rozvoj koncepce evolučně stabilních strategií a aplikace teorie her na vývoj chování.

Použití ESS:

Motivace

Nashova rovnováha je tradiční koncepce řešení v teorii her . Záleží na kognitivních schopnostech hráčů. Předpokládá se, že hráči jsou si vědomi struktury hry a vědomě se snaží předvídat pohyby svých protivníků a maximalizovat své vlastní výplaty . Kromě toho se předpokládá, že to všichni hráči vědí (viz obecné znalosti ). Tyto předpoklady se pak používají k vysvětlení, proč hráči volí Nashovy rovnovážné strategie.

Evolučně stabilní strategie jsou motivovány zcela odlišně. Zde se předpokládá, že strategie hráčů jsou biologicky kódované a dědičné . Jednotlivci nemají nad svou strategií žádnou kontrolu a nemusí si hru uvědomovat. Rozmnožují se a podléhají silám přirozeného výběru , přičemž výplaty hry představují reprodukční úspěch (biologická zdatnost ). Je možné si představit, že alternativní strategie hry se občas vyskytnou prostřednictvím procesu, jako je mutace . Aby mohla být ESS, musí být strategie odolná vůči těmto alternativám.

Vzhledem k radikálně odlišným motivačním předpokladům může být překvapením, že rovnováhy ESS a Nash se často shodují. Ve skutečnosti každý ESS odpovídá Nashově rovnováze, ale některé Nashovy rovnováhy nejsou ESS.

Nashova rovnováha

ESS je rafinovaná nebo upravená forma Nashovy rovnováhy . (V následující části najdete příklady, které tyto dva kontrastují.) V Nashově rovnováze, pokud si všichni hráči osvojí své příslušné části, žádný hráč nemůže těžit z přechodu na jinou alternativní strategii. Ve hře pro dva hráče jde o strategický pár. Nechť E ( S , T ) představují přínos pro hraní strategie S proti strategie T . Strategický pár ( S , S ) je Nashova rovnováha ve hře pro dva hráče právě tehdy, když pro oba hráče, pro jakoukoli strategii T :

E ( S , S ) ≥ E ( T , S )

V této definici může být strategie T S neutrální alternativou k S (bodování stejně dobře, ale ne lépe). Nash rovnováha se předpokládá, že je stabilní i v případě T- skóre stejně, za předpokladu, že neexistuje žádná dlouhodobá pobídka pro hráče přijmout T místo S . Tato skutečnost představuje výchozí bod ESS.

Maynard Smith a Price specifikují dvě podmínky, aby strategie S byla ESS. Pro všechny T S , a to buď

  1. E ( S , S )> E ( T , S ) nebo
  2. E ( S , S ) = E ( T , S ) a E ( S , T )> E ( T , T )

První podmínka se někdy nazývá přísná Nashova rovnováha. Druhá se někdy nazývá „druhá podmínka Maynarda Smitha“. Druhá podmínka znamená, že ačkoli strategie T je neutrální s ohledem na splacení proti strategii S , populace hráčů, kteří i nadále hrát strategickou S má tu výhodu, když hrajete proti T .

Kvůli Thomasovi existuje také alternativní, silnější definice ESS. To klade jiný důraz na roli Nashova rovnovážného konceptu v konceptu ESS. V návaznosti na terminologii uvedenou v první definici výše vyžaduje tato definice to pro všechny T S

  1. E ( S , S ) ≥ E ( T , S ) a
  2. E ( S , T )> E ( T , T )

V této formulaci první podmínka určuje, že strategie je Nashova rovnováha, a druhá určuje, že je splněna druhá podmínka Maynarda Smitha. Všimněte si, že tyto dvě definice nejsou přesně ekvivalentní: například každá čistá strategie v koordinační hře níže je ESS podle první definice, ale nikoli druhé.

Slovy, tato definice vypadá takto: Výplata prvního hráče, když oba hráči hrají strategii S, je vyšší než (nebo stejná) výplata prvního hráče, když přechází na jinou strategii T a druhý hráč si zachovává svoji strategii S a výplata prvního hráče, když pouze jeho soupeř změní svou strategii na T, je vyšší než jeho výplata v případě, že oba hráči změní svou strategii na T.

Tato formulace jasněji zdůrazňuje úlohu Nashova rovnovážného stavu v ESS. Umožňuje také přirozenou definici souvisejících konceptů, jako je slabý ESS nebo evolučně stabilní soubor .

Příklady rozdílů mezi Nashovými rovnováhami a ESSes

Spolupracovat Přeběhnout
Spolupracovat 3, 3 1, 4
Přeběhnout 4, 1 2, 2
Vězňovo dilema
A B
A 2, 2 1, 2
B 2, 1 2, 2
Poškozuj bližního svého

Ve většině jednoduchých her se rovnováhy ESS a Nash dokonale shodují. Například v dilematu vězně existuje pouze jedna Nashova rovnováha a jeho strategie ( Defekt ) je také ESS.

Některé hry mohou mít Nashovy rovnováhy, které nejsou ESS. Například v poškození svého souseda (jehož výplatní matice je zde zobrazena) jsou jak ( A , A ), tak i ( B , B ) Nashovy rovnováhy, protože hráči si nemohou udělat lépe tím, že odejdou od obou. Pouze B je však ESS (a silný Nash). Není ESS, takže B může neutrálně napadnout populaci A stratégů a převládá, protože B skóre vyšší proti B než A dělá proti B . Tuto dynamiku zachycuje druhá podmínka Maynarda Smitha, protože E ( A , A ) = E ( B , A ), ale neplatí to pro E ( A , B )> E ( B , B ).

C D
C 2, 2 1, 2
D 2, 1 0, 0
Uškodit všem
Říznout Pobyt
Říznout 0,0 -1, +1
Pobyt + 1, -1 −20, −20
Kuře

Nashovy rovnováhy se stejně bodujícími alternativami mohou být ESSes. Například ve hře Harm everyone je C ESS, protože splňuje druhou podmínku Maynarda Smitha. Stratégové D mohou dočasně napadnout populaci stratégů C skórováním stejně dobře proti C , ale platí cenu, když začnou hrát proti sobě; C dává lepší proti D , než dělá D . Tady tedy, ačkoli E ( C , C ) = E ( D , C ), je také případ, že E ( C , D )> E ( D , D ). Výsledkem je, že C je ESS.

I když hra má čistou strategii Nashovy rovnováhy, je možné, že žádná z těchto čistých strategií není ESS. Zvažte hru kuřete . V této hře jsou dvě čisté strategické Nashovy rovnováhy ( Swerve , Stay ) a ( Stay , Swerve ). Avšak při absenci nekorelované asymetrie nejsou ani Swerve, ani Stay ESS. Existuje třetí Nashova rovnováha, smíšená strategie, která je pro tuto hru ESS (viz vysvětlení hry Hawk-dove a Best response ).

Tento poslední příklad ukazuje na důležitý rozdíl mezi Nashovými rovnováhami a ESS. Nashovy rovnováhy jsou definovány na sadách strategií (specifikace strategie pro každého hráče), zatímco ESS jsou definovány z hlediska samotných strategií. Rovnováhy definované v ESS musí být vždy symetrické , a proto musí mít méně bodů rovnováhy.

Vs. evolučně stabilní stav

V populační biologii jsou dva koncepty evolučně stabilní strategie (ESS) a evolučně stabilního stavu úzce propojeny, ale popisují různé situace.

V evolučně stabilní strategii, pokud ji přijmou všichni členové populace, nemůže napadnout žádná mutantní strategie. Jakmile tuto strategii využijí prakticky všichni členové populace, neexistuje žádná „racionální“ alternativa. ESS je součástí klasické teorie her .

V evolučně stabilním stavu se genetické složení populace obnoví selekcí po narušení, pokud narušení není příliš velké. Evolučně stabilní stav je dynamická vlastnost populace, která se vrací k používání strategie nebo kombinace strategií, pokud je z tohoto počátečního stavu narušena. Je součástí populační genetiky , dynamického systému nebo evoluční teorie her . Tomu se nyní říká konvergentní stabilita.

B. Thomas (1984) aplikuje termín ESS na individuální strategii, která může být smíšená, a evolučně stabilní stav populace na populační směs čistých strategií, které mohou být formálně ekvivalentní smíšené ESS.

To, zda je populace evolučně stabilní, nesouvisí s její genetickou rozmanitostí: může být geneticky monomorfní nebo polymorfní .

Stochastický ESS

V klasické definici ESS nemůže napadnout žádná strategie mutantů. V konečných populacích mohl jakýkoli mutant v zásadě napadnout, i když s nízkou pravděpodobností, z čehož vyplývá, že nemůže existovat žádný ESS. V nekonečné populaci lze ESS místo toho definovat jako strategii, která by v případě, že by byla napadena novou strategií mutantů s pravděpodobností p, dokázala čelit invazi od jediného výchozího jedince s pravděpodobností> p, jak dokládá vývoj zajištění sázek .

Vězňovo dilema

Spolupracovat Přeběhnout
Spolupracovat 3, 3 1, 4
Přeběhnout 4, 1 2, 2
Vězňovo dilema

Společným modelem altruismu a sociální spolupráce je Vězeňovo dilema . Zde by se skupině hráčů kolektivně lépe dařilo, kdyby mohli hrát Cooperate , ale protože se Defektovi daří lépe, každý jednotlivý hráč má motivaci hrát Defect . Jedním z řešení tohoto problému je zavedení možnosti odvetných opatření tím, že jednotlivci budou hrát hru opakovaně proti stejnému hráči. V takzvaném iterovaném vězňově dilematu hrají stejní dva jednotlivci vězňovo dilema znovu a znovu. Zatímco dilema vězně má pouze dvě strategie ( spolupráce a defekt ), iterované dilema vězně má obrovské množství možných strategií. Jelikož jednotlivec může mít pro každou historii odlišný pohotovostní plán a hra se může opakovat neomezeně mnohokrát, může ve skutečnosti existovat nekonečný počet těchto pohotovostních plánů.

Tři jednoduché pohotovostní plány, jimž byla věnována značná pozornost, jsou Vždy vadný , Vždy spolupracujte a Tit for Tat . První dvě strategie dělají totéž bez ohledu na akce druhého hráče, zatímco druhý reaguje v dalším kole tím, co udělal s ním v předchozím kole - reaguje na Spolupráce s Spolupráce a Defekt s Defektem .

Pokud celá populace hraje Tit-for-Tat a vznikne mutant, který hraje Always Defect , Tit-for-Tat překoná Always Defect . Pokud se populace mutanta stane příliš velkou - procento mutanta bude udržováno malé. Půjčka za oplátku je tedy ESS, pokud jde o pouze těchto dvou strategií . Na druhou stranu, ostrov hráčů Always Defect bude stabilní proti invazi několika hráčů Tit-for-Tat , ale ne proti velkému počtu z nich. Pokud zavedeme funkci Vždy spolupracovat , populace Tit-for-Tat již není ESS. Protože populace hráčů Tit-for-Tat vždy spolupracuje, chová se strategie Always Cooperate v této populaci stejně. Výsledkem je, že mutant, který hraje Always Cooperate, nebude vyloučen. Přestože může populace kooperovat a Tit-for-Tat koexistovat, pokud existuje malé procento populace, která je vždy vadná , je selektivní tlak proti Always Cooperate a ve prospěch Tit-for-Tat . To je způsobeno nižšími výnosy ze spolupráce než výplatami za přeběhnutí v případě, že se oponent vadí.

To demonstruje obtíže při uplatňování formální definice ESS na hry s velkými strategickými prostory a některé motivovalo k zvažování alternativ.

Lidské chování

Obory sociobiologie a evoluční psychologie se pokoušejí vysvětlit chování zvířat a lidí a sociální struktury, převážně z hlediska evolučně stabilních strategií. Sociopatie (chronické antisociální nebo kriminální chování) může být výsledkem kombinace dvou takových strategií.

O evolučně stabilních strategiích se původně uvažovalo pro biologickou evoluci, ale lze je použít i v jiných kontextech. Ve skutečnosti existují stabilní stavy pro velkou třídu adaptivní dynamiky . Ve výsledku je lze použít k vysvětlení lidského chování bez genetických vlivů.

Viz také

Reference

Další čtení

externí odkazy