Co je zpětná indukce?
Zpětná indukce v teorii her je iterativní proces uvažování zpětně v čase, od konce problému nebo situace, k vyřešení konečné rozsáhlé formy a sekvenčních her a odvození posloupnosti optimálních akcí.
Vysvětlení zpětné indukce
Zpětná indukce se používá k řešení her od doby, kdy John von Neumann a Oskar Morgenstern založili teorii her jako akademický předmět, když v roce 1944 publikovali svou knihu Teorie her a hospodářské chování .
V každé fázi hry zpětná indukce určuje optimální strategii hráče, který ve hře provede poslední tah. Poté je stanovena optimální akce dalšího pohybujícího se hráče, přičemž akce posledního hráče je stanovena. Tento proces pokračuje zpět, dokud nebyla stanovena nejlepší akce pro každý okamžik. Ve skutečnosti je určování Nashovy rovnováhy každé dílčí hry původní hry.
Výsledky odvozené z zpětné indukce však často nedokážou předpovědět skutečnou lidskou hru. Experimentální studie ukázaly, že „racionální“ chování (jak předpovídá teorie her) se málokdy projevuje v reálném životě. Iracionální hráči mohou ve skutečnosti nakonec získat vyšší výplaty, než předpovídá zpětná indukce, jak je znázorněno ve stonožkové hře.
Ve hře stonožky mají dva hráči střídavě šanci vzít větší podíl na rostoucím hrnci peněz nebo předat bank jinému hráči. Výplaty jsou uspořádány tak, že pokud je bank předán soupeřovi a soupeř vezme banku v dalším kole, dostane jeden mírně méně, než kdyby v tomto kole jeden bank vzal. Hra končí, jakmile hráč vezme skrýš, přičemž tento hráč získává větší část a druhý hráč získává menší část.
Příklad zpětné indukce
Předpokládejme například, že hráč A jde jako první a musí se rozhodnout, zda má „vzít“ nebo „projít“ skrýš, což v současné době činí 2 $. Pokud tak vezme, pak A a B dostanou po 1 $, ale pokud A projde, musí nyní učinit rozhodnutí o přijetí nebo průchodu hráčem B. Pokud to B vezme, dostane 3 $ (tj. Předchozí skrýš 2 $ + 1 $) a A dostane 0 $. Pokud ale B přejde, A se nyní rozhodne, zda se má vzít nebo projít, a tak dále. Pokud se oba hráči vždy rozhodnou projít, obdrží každý na konci hry výplatu 100 $.
Smyslem hry je, že pokud A a B spolupracují a pokračují až do konce hry, dostanou maximální výplatu 100 $ za každou. Pokud však nedůvěřují druhému hráči a očekávají, že se při první příležitosti „vezmou“, Nashova rovnováha předpovídá, že hráči uplatní nejnižší možný nárok (v tomto případě $ 1).
Nashova rovnováha této hry, kde žádný hráč nemá motivaci odchýlit se od zvolené strategie po zvážení soupeřovy volby, navrhuje, aby první hráč vzal bank v prvním kole hry. Ve skutečnosti to však dělá jen relativně málo hráčů. Výsledkem je, že získají vyšší návratnost, než předpovídá analýza rovnováhy.
Řešení sekvenčních her pomocí zpětné indukce
Níže je uvedena jednoduchá sekvenční hra mezi dvěma hráči. Štítky s hráčem 1 a hráčem 2 v nich jsou informační sady pro hráče jeden, respektive dva. Čísla v závorkách ve spodní části stromu jsou výplaty v každém příslušném bodě. Hra je také sekvenční, takže hráč 1 učiní první rozhodnutí (vlevo nebo vpravo) a hráč 2 učiní rozhodnutí po hráči 1 (nahoru nebo dolů).
Obrázek 1
Zpětná indukce, stejně jako celá herní teorie, používá předpoklady racionality a maximalizace, což znamená, že Player 2 maximalizuje svoji návratnost v dané situaci. V každé informační sadě máme dvě možnosti, celkem čtyři. Odstraněním možností, které si hráč 2 nevybere, můžeme zúžit náš strom. Tímto způsobem odvážíme řádky, které maximalizují výplatu hráče v dané sadě informací.
Obrázek 2
Po tomto snížení může hráč 1 maximalizovat své výplaty nyní, když jsou zveřejněny volby hráče 2. Výsledkem je rovnováha nalezená zpětným navozením hráče 1 zvolením „right“ a hráče 2 zvolením „up“. Níže je řešení hry s vyváženou cestou tučně.
Obrázek 3
Například, jeden mohl snadno nastavit hru podobnou té nahoře používat společnosti jako hráče. Tato hra může zahrnovat scénáře vydání produktu. Pokud společnost 1 chtěla vydat produkt, co by mohla společnost 2 udělat v reakci? Vydá společnost 2 podobný konkurenční produkt? Předpovídáním prodeje tohoto nového produktu v různých scénářích můžeme vytvořit hru, která předpovídá, jak se události mohou vyvíjet. Níže je uveden příklad, jak by člověk mohl modelovat takovou hru.
Obrázek 4
