Nashova rovnováha. Teória hier pre ekonómov (John Nash)

Obsah:

Nashova rovnováha. Teória hier pre ekonómov (John Nash)
Nashova rovnováha. Teória hier pre ekonómov (John Nash)

Video: Nashova rovnováha. Teória hier pre ekonómov (John Nash)

Video: Nashova rovnováha. Teória hier pre ekonómov (John Nash)
Video: Дэниел Шмахтенбергер: Уничтожат ли нас технологии? 2024, Smieť
Anonim

V tridsiatych rokoch sa John von Neumann a Oscar Morgenstern stali zakladateľmi nového a zaujímavého odvetvia matematiky s názvom „teória hier“. V 50. rokoch sa o tento smer začal zaujímať mladý matematik John Nash. Teória rovnováhy sa stala predmetom jeho dizertačnej práce, ktorú napísal ako 21-ročný. Tak sa zrodila nová herná stratégia s názvom „Nash Equilibrium“, ktorá získala Nobelovu cenu o mnoho rokov neskôr – v roku 1994.

Nashova rovnováha
Nashova rovnováha

Dlhá medzera medzi písaním dizertačnej práce a všeobecným uznaním sa stala skúškou pre matematika. Genialita bez uznania mala za následok vážne duševné poruchy, no John Nash dokázal tento problém vyriešiť vďaka svojej vynikajúcej logickej mysli. Jeho teória Nash Equilibrium získala Nobelovu cenu a jeho život bol natočený v Krásnej mysli.

Stručne o teórii hier

Keďže teória Nashovej rovnováhy vysvetľuje správanie ľudí v podmienkach interakcie, stojí za to zvážiť základné koncepty teórie hier.

Teória hier študuje správanie účastníkov (agentov) z hľadiska vzájomnej interakcie ako pri hre, keď výsledok závisí od rozhodnutia a správania viacerých ľudí. Účastník sa rozhoduje na základe svojich predpovedí o správaní ostatných, čo sa nazýva herná stratégia.

Existuje aj dominantná stratégia, v ktorej účastník dosiahne najlepší výsledok pre akékoľvek správanie ostatných účastníkov. Toto je pre hráča najlepšia win-win stratégia.

Väzeňova dilema a vedecký prielom

Väzňova dilema je prípadom hry, v ktorej sú účastníci nútení robiť racionálne rozhodnutia a dosiahnuť spoločný cieľ v konflikte alternatív. Otázkou je, ktorú z týchto možností si vyberie, uvedomujúc si osobný a všeobecný záujem, ako aj nemožnosť získať oboje. Zdá sa, že hráči sú uväznení v tvrdom hernom prostredí, čo ich niekedy núti myslieť veľmi produktívne.

Príklady Nashovej rovnováhy
Príklady Nashovej rovnováhy

Túto dilemu skúmal americký matematik John Nash. Rovnováha, ktorú dosiahol, bola svojím spôsobom revolučná. Táto nová myšlienka obzvlášť výrazne ovplyvnila názor ekonómov na to, ako sa hráči na trhu rozhodujú, berúc do úvahy záujmy iných, v úzkej interakcii a priesečníku záujmov.

Najlepšie je študovať teóriu hier na konkrétnych príkladoch, keďže táto matematická disciplína sama osebe nie je sucho teoretická.

Príklad väzňovej dilemy

Príklad, dvaja ľudia spáchali lúpež, dostali sa do rúk polície a sú vypočúvaní v oddelených celách. Policajti zároveň každému účastníkovi ponúkajú zvýhodnené podmienky, za ktorých bude prepustený, ak bude svedčiť proti svojmu partnerovi. Každý zzločinci majú nasledujúci súbor stratégií, ktoré zváži:

  1. Obaja svedčia v rovnakom čase a dostanú 2,5 roka väzenia.
  2. Obaja súčasne mlčia a každý dostávajú 1 rok, pretože v tomto prípade bude dôkazová základňa ich viny malá.
  3. Jeden svedčí a je prepustený, zatiaľ čo druhý mlčí a dostane 5 rokov väzenia.

Výsledok prípadu samozrejme závisí od rozhodnutia oboch účastníkov, no nemôžu sa dohodnúť, pretože sedia v iných celách. Jasne viditeľný je aj konflikt ich osobných záujmov v boji za spoločný záujem. Každý z väzňov má dve možnosti akcie a 4 možnosti výsledkov.

Reťazec logických záverov

Previnilec A teda zvažuje nasledujúce možnosti:

  1. Ja mlčím a môj partner mlčí – obaja dostaneme 1 rok väzenia.
  2. Ja odovzdám svojho partnera a on mňa - obaja dostaneme 2,5 roka väzenia.
  3. Mlčím a môj partner ma zradí - dostanem 5 rokov väzenia a on bude na slobode.
  4. Odovzdávam svojho partnera, ale on mlčí – ja dostanem slobodu a on dostane 5 rokov väzenia.

Pre prehľadnosť si dajme maticu možných riešení a výsledkov.

Tabuľka možných výsledkov väzňovej dilemy.

Nashova teória rovnováhy
Nashova teória rovnováhy

Otázka je, čo si vyberie každý súťažiaci?

„Buď ticho, nemôžeš hovoriť“alebo „Nemôžeš byť ticho, nemôžeš hovoriť“

Ak chcete pochopiť výber účastníka, musíte prejsť reťazcom jeho myšlienok. V nadväznosti na odôvodnenie trestného A: ak budem mlčať a môj partner bude mlčať, dostaneme minimálnu lehotu (1 rok), ale jaNeviem, ako sa bude správať. Ak bude svedčiť proti mne, tak je lepšie, aby som vypovedal, inak môžem sedieť 5 rokov. Radsej si sadnem na 2,5 roka ako na 5 rokov. Ak bude mlčať, o to viac potrebujem svedčiť, lebo tak získam slobodu. Účastník B.

rovnováhu Johna Nasha
rovnováhu Johna Nasha

Nie je ťažké pochopiť, že dominantnou stratégiou každého z páchateľov je svedčiť. Optimálny bod tejto hry nastáva, keď obaja zločinci vypovedajú a dostanú svoju „cenu“– 2,5 roka väzenia. Nashova teória hier nazýva túto rovnováhu.

Neoptimálne optimálne riešenie Nash

Revolučnou povahou Nashianovho názoru je, že takáto rovnováha nie je optimálna, ak vezmeme do úvahy individuálneho účastníka a jeho vlastný záujem. Koniec koncov, najlepšou možnosťou je zostať ticho a ísť na slobodu.

Nashova rovnováha je bod konvergencie záujmov, kde si každý účastník vyberie možnosť, ktorá je pre neho optimálna, iba ak ostatní účastníci zvolia určitú stratégiu.

Vzhľadom na možnosť, keď obaja zločinci mlčia a dostanú iba 1 rok, môžeme ju nazvať Paretovou optimálnou možnosťou. Je to však možné len vtedy, ak by sa zločinci mohli vopred dohodnúť. Ale ani to by nezaručilo tento výsledok, pretože pokušenie odstúpiť od dohody a vyhnúť sa trestu je veľké. Nedostatok úplnej vzájomnej dôvery a nebezpečenstvo, že dostanete 5 rokov, boli nútení vybrať si možnosť s uznaním. Zamyslite sa nad tým, čo budú účastníci dodržiavaťmožnosť mlčania konať v zhode je jednoducho iracionálna. Takýto záver možno vyvodiť, ak budeme študovať Nashovu rovnováhu. Príklady len dávajú za pravdu.

Sebecký alebo racionálny

Teória Nashovej rovnováhy priniesla prekvapivé závery, ktoré vyvrátili princípy, ktoré existovali predtým. Napríklad Adam Smith považoval správanie každého z účastníkov za úplne sebecké, čím sa systém dostal do rovnováhy. Táto teória sa nazývala „neviditeľná ruka trhu“.

John Nash teória rovnováhy
John Nash teória rovnováhy

John Nash videl, že ak budú všetci účastníci konať vo svojom vlastnom záujme, nikdy to nepovedie k optimálnemu skupinovému výsledku. Vzhľadom na to, že racionálne myslenie je vlastné každému účastníkovi, voľba, ktorú ponúka Nashova rovnovážna stratégia, je pravdepodobnejšia.

Čisto mužský experiment

Výborným príkladom je hra blondínka paradox, ktorá, aj keď zdanlivo nie je na mieste, je jasnou ilustráciou toho, ako funguje Nashova teória hier.

V tejto hre si musíte predstaviť, že do baru prišla spoločnosť slobodných chlapov. Neďaleko je spoločnosť dievčat, z ktorých jedna má prednosť pred ostatnými, povedzme blondínka. Ako sa chlapci správajú, aby pre seba získali tú najlepšiu priateľku?

rovnovážny stav
rovnovážny stav

Takže zdôvodnenie chlapcov: ak sa každý začne zoznamovať s blondínkou, potom to s najväčšou pravdepodobnosťou nikto nedostane, potom sa jej priatelia nebudú chcieť zoznámiť. Nikto nechce byť druhým záložným. Ale ak sa chlapci rozhodnú vyhnúťblondína, potom je pravdepodobnosť, že každý z chlapcov nájde medzi dievčatami dobrú priateľku, vysoká.

Nashova rovnovážna situácia nie je pre chlapov optimálna, pretože sledujúc len svoje sebecké záujmy, každý by si vybral blondínku. Je vidieť, že presadzovanie iba sebeckých záujmov sa bude rovnať kolapsu skupinových záujmov. Nashova rovnováha bude znamenať, že každý chlap koná vo svojich vlastných záujmoch, ktoré sú v kontakte so záujmami celej skupiny. Toto nie je najlepšia možnosť pre každého osobne, ale najlepšia pre každého na základe celkovej stratégie úspechu.

Celý náš život je hra

Rozhodovanie v reálnom svete je veľmi podobné hre, v ktorej očakávate isté racionálne správanie aj od ostatných účastníkov. V biznise, v práci, v tíme, vo firme a dokonca aj vo vzťahoch s opačným pohlavím. Od veľkých obchodov až po bežné životné situácie, všetko sa riadi jedným alebo druhým zákonom.

teória nashových hier
teória nashových hier

Samozrejme, vyššie uvedené herné situácie so zločincami a barom sú len vynikajúce ilustrácie, ktoré demonštrujú Nashovu rovnováhu. Príklady takýchto dilem sa veľmi často vyskytujú na skutočnom trhu a funguje to najmä v prípadoch, keď trh ovládajú dvaja monopolisti.

Zmiešané stratégie

Často nie sme zapojení do jednej, ale do niekoľkých hier naraz. Výberom jednej z možností v jednej hre, vedenej racionálnou stratégiou, ale skončíte v inej hre. Po niekoľkých racionálnych rozhodnutiach možno zistíte, že váš výsledok nie je podľa vašich predstáv. Čovziať?

Pozrime sa na dva typy stratégie:

  • Čistá stratégia je správanie účastníka, ktoré vychádza z premýšľania o možnom správaní ostatných účastníkov.
  • Zmiešaná stratégia alebo náhodná stratégia je náhodné striedanie čistých stratégií alebo výber čistej stratégie s určitou pravdepodobnosťou. Táto stratégia sa tiež nazýva randomizovaná.
Nashova rovnováha v zmiešaných stratégiách
Nashova rovnováha v zmiešaných stratégiách

Ak vezmeme do úvahy toto správanie, získame nový pohľad na Nashovu rovnováhu. Ak skôr bolo povedané, že hráč si vyberie stratégiu raz, potom si možno predstaviť iné správanie. Dá sa predpokladať, že hráči volia stratégiu náhodne s určitou pravdepodobnosťou. Hry, ktoré nedokážu nájsť Nashovu rovnováhu v čistých stratégiách, ju majú vždy v zmiešaných stratégiách.

Nashova rovnováha v zmiešaných stratégiách sa nazýva zmiešaná rovnováha. Toto je rovnováha, kde si každý účastník volí optimálnu frekvenciu výberu svojich stratégií za predpokladu, že ostatní účastníci si vyberú svoje stratégie s danou frekvenciou.

Pen alty a zmiešaná stratégia

Príklad zmiešanej stratégie možno nájsť v hre futbal. Najlepšou ilustráciou zmiešanej stratégie je možno pen altový rozstrel. Takže máme brankára, ktorý môže skočiť len do jedného rohu a hráča, ktorý bude pen altu.

Ak teda hráč prvýkrát zvolí stratégiu vystreliť do ľavého rohu a brankár tiež spadne do tohto rohu a chytí loptu, ako sa môže situácia vyvinúť druhýkrát? Ak hráčzasiahne do opačného rohu, to je s najväčšou pravdepodobnosťou príliš zrejmé, ale zasiahnutie do rovnakého rohu nie je o nič menej zrejmé. Preto brankárovi aj kopačke nezostáva nič iné, len sa spoľahnúť na náhodný výber.

A tak striedaním náhodného výberu s určitou čistou stratégiou sa hráč a brankár snažia dosiahnuť maximálny výsledok.

Odporúča: