Sýkorka na tat - Tit for tat

V západních obchodních kulturách je podání ruky při setkání s někým signálem počáteční spolupráce.

Tit for tat je anglické rčení, které znamená „ekvivalentní odvetu “. Vyvinul se z „tipu pro kohoutek“, poprvé zaznamenaného v roce 1558.

Je to také vysoce účinná strategie v teorii her . Činidlo použití této strategie se nejprve spolupracovat, a poté se replikovat sebe v předchozí akci. Pokud byl soupeř dříve kooperativní, je agent kooperativní. Pokud ne, agent není.

Herní teorie

Tit-for-tat byl velmi úspěšně používán jako strategie pro iterované dilema vězně . Tuto strategii poprvé představil Anatol Rapoport na dvou turnajích Roberta Axelroda , které se konaly kolem roku 1980. Zejména to byla (v obou případech) nejjednodušší strategie a nejúspěšnější v přímé konkurenci.

Agent využívající tuto strategii bude nejprve spolupracovat a poté replikovat předchozí akci soupeře. Pokud byl soupeř dříve kooperativní, je agent kooperativní. Pokud ne, agent není. To je podobné jako v biologii vzájemný altruismus .

Dopady

Úspěch strategie „tit-for-tat“, která je do značné míry kooperativní, navzdory tomu, že její název zdůrazňuje spornou povahu, mnohé překvapil. Na základě strategií vytvořených různými týmy zvítězil ve dvou soutěžích. Po první soutěži selhaly nové strategie formulované speciálně pro boj s tit-for-tat kvůli jejich vzájemným negativním interakcím; úspěšná strategie jiná než tit-for-tat by musela být formulována s ohledem na tit-for-tat i na sebe.

Tento výsledek může poskytnout náhled na to, jak skupiny zvířat (a zejména lidské společnosti) začaly žít převážně (nebo úplně) ve spolupracujících společnostech, spíše než individualistický způsob „ rudých zubů a drápů “, který lze očekávat od jednotlivců zapojených do Hobbesiánský přírodní stav. To, a zvláště jeho použití na lidské společnosti a politice, je předmět Robert Axelrod ‚s knihou Evoluce spolupráce .

Strategie tit-for-tat byla navíc prospěšná pro sociální psychology a sociology při studiu účinných technik snižování konfliktů. Výzkum ukázal, že když si jednotlivci, kteří po určitou dobu soutěží, navzájem nedůvěřují, je nejúčinnějším zvratem soutěže použití strategie „tit-for-tat“. Jednotlivci se běžně zapojují do behaviorální asimilace, což je proces, při kterém mají tendenci přiřadit své vlastní chování k chování, které projevují spolupracující nebo konkurenční členové skupiny. Pokud tedy strategie „tit-for-tat“ začíná spoluprací, následuje spolupráce. Na druhou stranu, pokud druhá strana soutěží, pak strategie tit-for-tat povede alternativní stranu také k soutěžení. Každá akce druhého člena je nakonec potlačena odpovídající reakcí, konkurencí s konkurencí a spoluprací se spoluprací.

V případě řešení konfliktu je strategie tit-for-tat účinná z několika důvodů: technika je uznávána jako jasná , pěkná , provokativní a odpouštějící . Za prvé je to jasná a rozeznatelná strategie. Ti, kteří jej používají, rychle rozpoznají jeho nepředvídané události a podle toho upraví své chování. Navíc je to považováno za hezké, protože začíná spoluprací a pouze závadami v následujícím konkurenčním tahu. Tato strategie je také provokativní, protože poskytuje okamžitou odvetu těm, kteří soutěží. Nakonec je to odpouštějící, protože okamžitě vytváří spolupráci, pokud by konkurent udělal kooperativní tah.

Důsledky strategie tit-for-tat byly relevantní pro výzkum konfliktů, řešení a mnoho aspektů aplikované sociální vědy.

Matematika

Vezměme si například následující nekonečně opakovanou hru dilematu s vězni:

C D
C 6, 6 2, 9
D 9, 2 3, 3

Strategie Tit for Tat kopíruje to, co si předtím vybral druhý hráč. Pokud hráči spolupracují hraním strategie (C, C), spolupracují navždy.

1 2 3 4 ...
p1 C C C C ...
p2 C C C C ...

Spolupráce přináší následující výplatu (kde je faktor slevy):

A geometrické řady součet činí

Pokud se hráč odchýlí od přeřazení (D), bude v dalším kole potrestán. Střídejte výsledky, kde p1 spolupracuje a p2 se odchyluje, a naopak.

1 2 3 4 ...
p1 C D C D ...
p2 D C D C ...

Odchylka poskytuje následující výplatu:

součet dvou geometrických řad, ke kterým dojde

Očekávejte spolupráci, pokud výplata odchylky není lepší než spolupráce.

Pokračujte ve spolupráci, pokud

Pokračujte v defektu, pokud

Problémy

Zatímco Axelrod empiricky prokázal, že strategie je v některých případech přímé konkurence optimální, dva agenti hrající si za tat zůstávají zranitelní. Jednorázová, jednobitová chyba v interpretaci událostí jednoho z hráčů může vést k nekonečné „spirále smrti“: pokud jeden agent defektuje a soupeř spolupracuje, pak oba agenti skončí střídáním spolupráce a defektu, což povede k nižší výplatě než pokud by oba agenti měli neustále spolupracovat. Tato situace často nastává v konfliktech v reálném světě, od bojů na školních dvorech po občanské a regionální války. Důvodem těchto problémů je, že tit for tat není subgame dokonalá rovnováha , kromě podmínek nože na diskontní sazbě . I když tato dílčí hra není přímo dosažitelná dvěma agenty hrajícími tit pro strategie tat, strategie musí být Nashova rovnováha ve všech dílčích hrách, aby byla dílčí hra dokonalá. Dále lze této dílčí hry dosáhnout, pokud je v signalizaci agentů povolen jakýkoli šum. Dokonalá varianta hry pro tat s podhrou známá jako „zklamaná tit pro tat“ může být vytvořena použitím základního mechanismu reputace.

Ostří nože je „rovnováha, která existuje pouze pro přesné hodnoty exogenních proměnných. Pokud proměnné změníte i sebemenším způsobem, rovnováha ostří zmizí.“

Může to být Nashova rovnováha i rovnováha na ostří nože. Známá jako rovnováha na ostří nože, protože rovnováha „nejistě spočívá na“ přesné hodnotě.

Příklad:

Vlevo, odjet Že jo
Nahoru (X, X) (0, 0)
Dolů (0, 0) (−X, −X)

Předpokládejme, že X = 0. Neexistuje žádná výnosná odchylka od (Dolů, Vlevo) nebo od (Nahoru, Vpravo). Pokud se však hodnota X odchýlí o jakoukoli částku, bez ohledu na to, jak malá, pak rovnováha již nebude platit. Stane se výnosným odchýlit se nahoru, například když X má hodnotu 0,000001 místo 0. Rovnováha je tedy velmi nejistá. Ve svém použití v článku na Wikipedii, podmínky nože se odkazují na skutečnost, že velmi zřídka, pouze když je splněna určitá podmínka a například X, se rovná konkrétní hodnotě, existuje rovnováha.

Ke zmírnění tohoto problému lze použít sýkorku pro dvě tetování; viz popis níže. „Tit for tat with odpuštění“ je podobný pokus o útěk ze spirály smrti. Když se soupeř porouchá, hráč využívající tuto strategii bude i tak občas spolupracovat na dalším tahu. Přesná pravděpodobnost, že hráč odpoví spoluprací, závisí na sestavě soupeřů.

Strategie tit-for-tat se navíc neukázala jako optimální v situacích, kdy chybí celková konkurence. Například, když jsou večírky přátelé, může být pro přátelství nejlepší, když hráč spolupracuje na každém kroku navzdory občasným odchylkám druhého hráče. Většina situací v reálném světě je méně konkurenceschopná než celková soutěž, ve které strategie tit-for-tat zvítězila v soutěži.

Sýkorka pro tat se velmi liší od pochmurné spouště , protože je v přírodě odpouštějící, protože okamžitě vyvolává spolupráci, pokud se soutěžící rozhodne spolupracovat. Grim trigger na druhé straně je nejnepříjemnější strategií, v tom smyslu, že i jediná vada by způsobila, že by hráč hrající pomocí grim trigger defect po zbytek hry.

Sýkorka pro dvě tetování

Sýkorka pro dvě tetování je podobná sýkorce pro tetování, ale umožňuje protivníkovi defekt z dohodnuté strategie dvakrát, než se mu hráč pomstí. Díky tomuto aspektu se hráč, který používá strategii tit for tat, jeví jako „odpouštějící“ soupeři.

Ve strategii tit for tat, jakmile protivník defektuje, hráč tit for tat okamžitě reaguje defektem v dalším tahu. To má neblahý důsledek toho, že dvě odvetné strategie se neustále navzájem protiví, což má za následek špatný výsledek pro oba hráče. Sýkora pro hráče dvou tetování nechá první zběhnutí bez povšimnutí, aby se vyhnula „spirále smrti“ z předchozího příkladu. Pokud soupeř defektuje dvakrát za sebou, sýkorka pro hráče se dvěma tetováními odpoví defektem.

Tuto strategii navrhl Robert Axelrod během svého druhého kola počítačových simulací na RAND . Po analýze výsledků prvního experimentu zjistil, že pokud by účastník vstoupil do tit pro strategii dvou tetování, ukázalo by se s vyšším kumulativním skóre než jakýkoli jiný program. Výsledkem bylo, že do druhého turnaje vstoupil sám s velkými očekáváními. Bohužel kvůli agresivnější povaze programů zadaných do druhého kola, které dokázaly využít své vysoce odpouštějící povahy, se tit pro dvě tetování výrazně zhoršila (ve smyslu teorie her) než tit pro tat.

Skutečné použití

Sdílení souborů peer-to-peer

Partneři BitTorrent používají strategii tit-for-tat k optimalizaci rychlosti stahování. Přesněji řečeno, většina vrstevníků BitTorrentu používá variantu sýkorky pro dvě tetování, která se v terminologii BitTorrentu nazývá pravidelné uvolnění . Partneři BitTorrent mají omezený počet slotů pro nahrávání, které mohou přidělit ostatním kolegům. V důsledku toho, když je šířka pásma uploadu peerů nasycena, použije strategii tit-for-tat. Spolupráce je dosažena, když je šířka pásma nahrávání vyměněna za šířku pásma stahování. Když tedy peer nenahraje na oplátku náš vlastní peer upload, program BitTorrent udusí spojení s nespolupracujícím peerem a přidělí tento slot pro nahrávání snad více spolupracujícímu peer. Pravidelné nekouření koreluje s tím, že vždy spolupracujeme na prvním tahu v dilematu vězně. Partner bude pravidelně přidělovat slot pro nahrávání náhodně vybranému nespolupracujícímu partnerovi ( zrušit kouzlo ). Tomu se říká optimistické nekouření . Toto chování umožňuje hledat další spolupracující partnery a dává druhou šanci dříve nespolupracujícím kolegům. Optimální prahové hodnoty této strategie jsou stále předmětem výzkumu.

Vysvětlení vzájemného altruismu ve zvířecích komunitách

Studie prosociálního chování zvířat vedly mnoho etologů a evolučních psychologů k uplatnění strategií tit-for-tat k vysvětlení, proč se altruismus vyvíjí v mnoha zvířecích komunitách. Evoluční teorie her, odvozená z matematických teorií formalizovaných von Neumannem a Morgensternem (1953), byla poprvé navržena Maynardem Smithem (1972) a dále zkoumána chováním ptáků Robertem Hindem . Jejich aplikace teorie her na vývoj zvířecích strategií zahájila zcela nový způsob analýzy chování zvířat.

Reciproční altruismus funguje ve zvířecích komunitách, kde jsou náklady pro dobrodince v jakékoli transakci s potravinami, právy na páření, hnízděním nebo územím menší než zisky pro příjemce. Tato teorie také tvrdí, že akt altruismu by měl být oplácen, pokud se rovnováha potřeb obrátí. Mechanismy pro identifikaci a potrestání „podvodníků“, kteří nedokáží oplácet, ve skutečnosti forma sýkorky za tat, jsou důležité pro regulaci vzájemného altruismu. Například tit-for-tat je navržen jako mechanismus kooperativního chování při kontrole predátorů u guppies .

Válka

Obrovská neschopnost kterékoli strany ustoupit od konfliktu ze strachu, že bude vnímána jako slabá nebo že bude spolupracovat s nepřítelem, byla příčinou mnoha dlouhotrvajících konfliktů v celé historii.

Titul pro strategii tetování však také zjistili analytici v spontánním nenásilném chování zvaném „ žít a nechat žít “, které vzniklo během zákopové války v první světové válce . Vojska zakopaná jen několik set stop od sebe by vyvinuly nevyslovené porozumění. Pokud odstřelovač zabil vojáka na jedné straně, druhá očekávala stejnou odvetu. Naopak, pokud nikdo nebyl nějaký čas zabit, druhá strana by toto implicitní „příměří“ uznala a podle toho by jednala. Tak vznikl „samostatný mír“ mezi příkopy.

Viz také

Reference

externí odkazy