Na koniec omówimy jeszcze podstawowe pojęcia związane z teorią gier i w ich języku spróbujemy wyjaśnić pewne zachowania osobników, które na pozór wydają się paradoksalne, ale mają głębokie uzasadnienie z punktu widzenia przetrwania gatunku. Zauważmy, że różne gatunki wykształciły różne typy zachowań. Zdarza się, że osobniki danego gatunku prawie nigdy w trakcie rywalizacji — czy o partnera, czy o pożywienie — nie walczą ,,na poważnie”, a tylko straszą się wzajemnie w trakcie tzw. walk rytualnych. W przypadku innych — dochodzi do bardzo poważnych potyczek. Analogiczne zachowania mogą być dyskutowane na gruncie socjologicznym w stosunku np. do pracowników danego przedsiębiorstwa czy innych społeczności. Pojawia się zatem pytanie, kiedy osobnikom bardziej opłaca się stosować strategię walki, a kiedy uniku i od czego taki wybór zależy. Odpowiedzi możemy poszukiwać na gruncie teorii gier w oparciu o strategie ewolucyjnie stabilne.
Teoria gier w nierozerwalny sposób łączy się z dwoma nazwiskami — Johna Maynarda Smitha [15] i Johna Nasha. Pierwszy z nich wprowadził pojęcie strategii ewolucyjnie stabilnej, natomiast drugi sprecyzował matematyczne podstawy tej teorii i zaproponował pojęcie równowagi Nasha.
W teorii gier zakładamy, że co najmniej dwóch osobników ,,gra” w pewną grę. Mają do wyboru pewne zachowania, które nazywamy strategiami. W zależności od tego jakie strategie wybiorą poszczególni gracze, dostają odpowiednie wypłaty. Zatem budując model w oparciu o teorię gier musimy zaproponować zbiór graczy, zbiór strategii oraz macierz wypłat związanych z poszczególnymi strategiami.
Załóżmy, że każdy z graczy ma do wyboru jedną z strategii , które nazwiemy strategiami czystymi. Jeśli założymy, że gracz może wybierać te strategie z pewnymi prawdopodobieństwami , to taki profil strategii , , , nazywamy strategią mieszaną. Strategie mieszane identyfikujemy z punktami sympleksu
Wierzchołki sympleksu są oczywiście strategiami czystymi.
Niech w grze bierze udział dwóch graczy i niech oznacza wypłatę gracza I jeśli gra on strategią przeciwko graczowi II grającemu strategią . Macierz nazywamy macierzą wypłat.
Gra w postaci normalnej dla dwóch graczy zadana jest za pomocą zbioru strategii czystych , sympleksu strategii mieszanych oraz macierzy wypłat .
Załóżmy teraz, że gracz I gra strategią mieszaną przeciwko graczowi II grającemu strategią mieszaną . Ile wyniesie średnia wypłata gracza I? Gdyby gracz I grał czystą strategią przeciwko , to z prawdopodobieństwami dostawałby wypłatę , , czyli średnio . Wobec tego grając przeciw dostaje z prawdopodobieństwami wypłatę , zatem średnio .
Funkcją odpowiedzi na strategię nazwiemy funkcję średnich wypłat .
Niech oznacza zbiór najlepszych odpowiedzi na strategię , czyli zbiór tych , dla których osiąga wartość maksymalną.
Równowagą Nasha nazwiemy taką strategię , która jest najlepszą odpowiedzią na siebie samą, czyli . Ścisła równowaga Nasha jest jedyną taką strategią, czyli .
Widzimy więc, że dla równowagi Nasha zachodzi dla dowolnej strategii , natomiast dla ścisłej równowagi Nasha mamy dla dowolnej strategii .
Możemy dość łatwo wykazać, że ścisła równowaga Nasha jest strategią czystą.
Niech będzie równowagą Nasha. Jeśli jest ścisłą równowagą Nasha, to istnieje , dla którego .
Załóżmy, że dla wszystkich mamy . Oczywiście dla dowolnej strategii zachodzi nierówność , a w szczególności
(15.1) |
Pomnóżmy stronami nierówność (15.1) przez i zsumujmy po wszystkich . Dostaniemy . Zauważmy, że , zatem z liniowości otrzymujemy , czyli nie może być strategią czystą.
∎Zauważmy, że gdy jest ścisłą równowagą Nasha, to jeśli w populacji wszyscy stosują tę strategię, to osobnik, który będzie próbował zastosować inną — przegra, gdyż jego wypłata zawsze będzie mniejsza. Taka dynamika gry wiąże się też z koncepcją strategii ewolucyjnie stabilnej, czyli strategii odpornej na niewielkie zaburzenia.
Strategię nazwiemy ewolucyjnie stabilną (ESS, czyli evolutionary stable strategie), jeśli dla wszystkich , zachodzi nierówność
dla wszystkich dostatecznie małych .
Stałą nazywamy barierą inwazji. Oczywiście ścisła równowaga Nasha jest strategią ewolucyjnie stabilną. Z drugiej strony
Strategia jest ESS wtw spełnione są następujące warunki
równowagi: dla wszystkich ;
stabilności: jeśli dla pewnego zachodzi , to .
Dowód tego twierdzenia pozostawiamy jako ćwiczenie.
Omówimy teraz dwa podstawowe przykłady gier i zinterpretujemy ich wyniki.
Gra jastrząb – gołąb polega na tym, że gracz ma do wyboru strategię agresji, którą stosując zawsze walczy z przeciwnikiem, albo strategię wycofywania się, w której zawsze ustępuje przeciwnikowi. W trakcie walki osobnik może być poważnie zraniony, więc może wiele stracić, ale z drugiej strony może dużo zyskać, jeśli wygra. Z kolei osobnik ustępujący nie traci w trakcie spotkania z przeciwnikiem. Miarą wygranej w tej grze jest dostosowanie (ang. fitness), często wyrażane jako liczba potomstwa. Niech osobnik, który wygrywa, dostaje , natomiast osobnik zraniony traci . Wtedy jeśli spotyka się jastrząb z jastrzębiem, to z prawdopodobieństwem może zyskać i stracić , więc średnia wygrana to . Wygrana jastrzębia przeciw gołębiowi to oczywiście . Gołąb w starciu z jastrzębiem wycofuje się, więc jego wygrana to , a w starciu z gołębiem może wygrać z prawdopodobieństwem , więc wygrana to . Gra jest symetryczna, zatem wystarczy podać jedynie macierz wypłat gracza I przeciwko II. Często mówi się o graczu ,,kolumnowym” i ,,wierszowym”. Jeśli przez oznaczymy strategię jastrzębia, a przez — gołębia, to macierz wypłat ma postać
W grze tej dodatkowo zakładamy, że rany otrzymywane w walce są na tyle dotkliwe, że .
Sprawdzimy, że gra ta nie ma ścisłej równowagi Nasha. Wiemy, że taka równowaga musiałaby odpowiadać albo czystej strategii jastrzębia, albo czystej strategii gołębia. Policzmy dla obu strategii funkcje najlepszej odpowiedzi.
Biorąc dostajemy
i maksymalizując to wyrażenie dostajemy (tu widzimy, do czego potrzebne jest założenie ), czyli .
Biorąc dostajemy
i maksymalizując to wyrażenie dostajemy , czyli .
Widzimy więc, że w grze tej nie ma ścisłej równowagi Nasha. Staje się to oczywiste, jeśli wyobrazimy sobie populację składającą się albo z samych jastrzębi, albo z samych gołębi. Jeśli są same jastrzębie, to pojawiający się gołąb ma lepiej, gdyż w starciu z jastrzębiem nic nie traci, zatem gołębie zaczynają się rozprzestrzeniać. Z kolei jeśli są same gołębie, to pojawiający się jastrząb zawsze wygrywa, więc zaczną rozprzestrzeniać się jastrzębie. Wydaje się więc, że powinna być jakaś odpowiednia proporcja między gołębiami i jastrzębiami.
Rozpatrzmy strategię mieszaną , w której z prawdopodobieństwem osobnik gra strategię jastrzębia i z prawdopodobieństwem gra gołębia. Wtedy średni wzrost dostosowania jastrzębia wyniesie
natomiast gołębia
Dopóki któreś z tych dostosowań jest większe, odpowiadająca mu strategia będzie się rozprzestrzeniać. Równowaga ustali się, jeśli oba będą jednakowe, czyli
Zatem proporcja jastrzębi będzie tym mniejsza, im więcej można stracić w walce w stosunku do zysku. Ta analiza wyjaśnia też popularność walk rytualnych wśród zwierząt, które mogą się poważnie zranić w trakcie prawdziwej walki — zamiast faktycznie walczyć zwierzęta te wolą w walce rytualnej zaprezentować przed przeciwnikiem swoją siłę licząc na to, że przeciwnik się zniechęci i odejdzie bez prawdziwej walki. W taki sposób postępują np. jelenie na rykowisku.
Dylemat więźnia jest typową grą socjologiczną. Zakłada się w niej, że dwóch więźniów zostało osadzonych w więzieniu w osobnych celach i każdemu z nich prokurator obiecał zmniejszenie wyroku za wydanie współwinnego. Jeśli jednak żaden z nich się nie przyzna, to niewiele będzie im można udowodnić, więc obaj dostaną najwyżej niewielki wyrok. Z kolei jeśli jeden z nich zdradzi, a drugi nie, to ten, który wydał współwinnego dostanie wyrok w zawieszeniu. Jeśli obaj zdradzą się wzajemnie, obaj dostaną nieco mniejsze wyroki. Niech macierz wypłat w tej grze przy założeniu, że oznacza zdradę kolegi, a — odrzucenie propozycji prokuratora, ma postać
gdzie to wyrok dla więźnia I przy założeniu, że obaj zdradzają się wzajemnie, — wyrok dla tego więźnia, gdy on odrzuca propozycję prokuratora, a wiezień II go zdradza, więc , natomiast to wyrok w sytuacji, gdy obaj odrzucają współpracę z prokuratorem, więc .
Zauważmy, że obu więźniom najbardziej opłaca się odrzucić współpracę z prokuratorem, gdyż dzięki temu zapewniają sobie mniejszy wyrok, ale z obawy przed zdradą kolegi wolą sami też zdradzić, bo jeśli kolega zdradzi, a dany więzień nie, to on dostanie cięższy wyrok, niż jeśliby też zdradził. Zatem jest tu czystą równowagą Nasha. Faktycznie grając przeciw mamy wypłatę
natomiast grając przeciw dowolnej strategii
i oczywiście dla . Wobec tego jest ścisłą równowagą Nasha i jednocześnie strategią ewolucyjnie stabilną. Zauważmy jednak, że strategii tej brakuje jednej z podstawowych cech — nie jest optymalna, w tym sensie, że jeśli obaj wybiorą , dostaną mniejsze wyroki.
Tego typu zagadnienia możemy rozważać badając np. optymalność w sensie Pareto.
Powiemy, że wynik gry jest nieoptymalny w sensie Pareto, jeżeli istnieje inny wynik, dający albo obu graczom wyższe wypłaty, albo jednemu z nich taką samą, a drugiemu wyższą. W przeciwnym przypadku wynik jest optymalny.
Pareto postulował następujące kryterium: tylko wynik optymalny w sensie Pareto może być akceptowany jako rozwiązanie gry. Kryterium Pareto stanowi podstawową zasadą racjonalności zbiorowej. W dylemacie więźnia wchodzi ona w konflikt z zasadą racjonalności indywidualnej reprezentowanej przez równowagę Nasha.
Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.
strona główna | webmaster | o portalu | pomoc
© Wydział Matematyki, Informatyki i Mechaniki UW, 2009-2010. Niniejsze materiały są udostępnione bezpłatnie na licencji Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska.
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.
Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.