Na koniec omówimy jeszcze podstawowe pojęcia związane z teorią gier i w ich języku spróbujemy wyjaśnić pewne zachowania osobników, które na pozór wydają się paradoksalne, ale mają głębokie uzasadnienie z punktu widzenia przetrwania gatunku. Zauważmy, że różne gatunki wykształciły różne typy zachowań. Zdarza się, że osobniki danego gatunku prawie nigdy w trakcie rywalizacji — czy o partnera, czy o pożywienie — nie walczą ,,na poważnie”, a tylko straszą się wzajemnie w trakcie tzw. walk rytualnych. W przypadku innych — dochodzi do bardzo poważnych potyczek. Analogiczne zachowania mogą być dyskutowane na gruncie socjologicznym w stosunku np. do pracowników danego przedsiębiorstwa czy innych społeczności. Pojawia się zatem pytanie, kiedy osobnikom bardziej opłaca się stosować strategię walki, a kiedy uniku i od czego taki wybór zależy. Odpowiedzi możemy poszukiwać na gruncie teorii gier w oparciu o strategie ewolucyjnie stabilne.
Teoria gier w nierozerwalny sposób łączy się z dwoma nazwiskami — Johna Maynarda Smitha [15] i Johna Nasha. Pierwszy z nich wprowadził pojęcie strategii ewolucyjnie stabilnej, natomiast drugi sprecyzował matematyczne podstawy tej teorii i zaproponował pojęcie równowagi Nasha.
W teorii gier zakładamy, że co najmniej dwóch osobników ,,gra” w pewną grę. Mają do wyboru pewne zachowania, które nazywamy strategiami. W zależności od tego jakie strategie wybiorą poszczególni gracze, dostają odpowiednie wypłaty. Zatem budując model w oparciu o teorię gier musimy zaproponować zbiór graczy, zbiór strategii oraz macierz wypłat związanych z poszczególnymi strategiami.
Załóżmy, że każdy z graczy ma do wyboru jedną z
Wierzchołki sympleksu
Niech w grze bierze udział dwóch graczy i niech
Gra w postaci normalnej dla dwóch graczy zadana jest za pomocą zbioru strategii czystych
Załóżmy teraz, że gracz I gra strategią mieszaną
Funkcją odpowiedzi na strategię
Niech
Równowagą Nasha nazwiemy taką strategię
Widzimy więc, że dla równowagi Nasha zachodzi
Możemy dość łatwo wykazać, że ścisła równowaga Nasha jest strategią czystą.
Niech
Załóżmy, że dla wszystkich
(15.1) |
Pomnóżmy stronami nierówność (15.1) przez
Zauważmy, że gdy
Strategię
dla wszystkich dostatecznie małych
Stałą
Strategia
równowagi:
stabilności: jeśli dla pewnego
Dowód tego twierdzenia pozostawiamy jako ćwiczenie.
Omówimy teraz dwa podstawowe przykłady gier i zinterpretujemy ich wyniki.
Gra jastrząb – gołąb polega na tym, że gracz ma do wyboru strategię agresji, którą stosując zawsze walczy z przeciwnikiem, albo strategię wycofywania się, w której zawsze ustępuje przeciwnikowi. W trakcie walki osobnik może być poważnie zraniony, więc może wiele stracić, ale z drugiej strony może dużo zyskać, jeśli wygra. Z kolei osobnik ustępujący nie traci w trakcie spotkania z przeciwnikiem. Miarą wygranej w tej grze jest dostosowanie (ang. fitness), często wyrażane jako liczba potomstwa. Niech osobnik, który wygrywa, dostaje
W grze tej dodatkowo zakładamy, że rany otrzymywane w walce są na tyle dotkliwe, że
Sprawdzimy, że gra ta nie ma ścisłej równowagi Nasha. Wiemy, że taka równowaga musiałaby odpowiadać albo czystej strategii jastrzębia, albo czystej strategii gołębia. Policzmy dla obu strategii funkcje najlepszej odpowiedzi.
Biorąc
i maksymalizując to wyrażenie dostajemy
Biorąc
i maksymalizując to wyrażenie dostajemy
Widzimy więc, że w grze tej nie ma ścisłej równowagi Nasha. Staje się to oczywiste, jeśli wyobrazimy sobie populację składającą się albo z samych jastrzębi, albo z samych gołębi. Jeśli są same jastrzębie, to pojawiający się gołąb ma lepiej, gdyż w starciu z jastrzębiem nic nie traci, zatem gołębie zaczynają się rozprzestrzeniać. Z kolei jeśli są same gołębie, to pojawiający się jastrząb zawsze wygrywa, więc zaczną rozprzestrzeniać się jastrzębie. Wydaje się więc, że powinna być jakaś odpowiednia proporcja między gołębiami i jastrzębiami.
Rozpatrzmy strategię mieszaną
natomiast gołębia
Dopóki któreś z tych dostosowań jest większe, odpowiadająca mu strategia będzie się rozprzestrzeniać. Równowaga ustali się, jeśli oba będą jednakowe, czyli
Zatem proporcja jastrzębi będzie tym mniejsza, im więcej można stracić w walce w stosunku do zysku. Ta analiza wyjaśnia też popularność walk rytualnych wśród zwierząt, które mogą się poważnie zranić w trakcie prawdziwej walki — zamiast faktycznie walczyć zwierzęta te wolą w walce rytualnej zaprezentować przed przeciwnikiem swoją siłę licząc na to, że przeciwnik się zniechęci i odejdzie bez prawdziwej walki. W taki sposób postępują np. jelenie na rykowisku.
Dylemat więźnia jest typową grą socjologiczną. Zakłada się w niej, że dwóch więźniów zostało osadzonych w więzieniu w osobnych celach i każdemu z nich prokurator obiecał zmniejszenie wyroku za wydanie współwinnego. Jeśli jednak żaden z nich się nie przyzna, to niewiele będzie im można udowodnić, więc obaj dostaną najwyżej niewielki wyrok. Z kolei jeśli jeden z nich zdradzi, a drugi nie, to ten, który wydał współwinnego dostanie wyrok w zawieszeniu. Jeśli obaj zdradzą się wzajemnie, obaj dostaną nieco mniejsze wyroki. Niech macierz wypłat w tej grze przy założeniu, że
gdzie
Zauważmy, że obu więźniom najbardziej opłaca się odrzucić współpracę z prokuratorem, gdyż dzięki temu zapewniają sobie mniejszy wyrok, ale z obawy przed zdradą kolegi wolą sami też zdradzić, bo jeśli kolega zdradzi, a dany więzień nie, to on dostanie cięższy wyrok, niż jeśliby też zdradził. Zatem
natomiast grając przeciw dowolnej strategii
i oczywiście
Tego typu zagadnienia możemy rozważać badając np. optymalność w sensie Pareto.
Powiemy, że wynik gry jest nieoptymalny w sensie Pareto, jeżeli istnieje inny wynik, dający albo obu graczom wyższe wypłaty, albo jednemu z nich taką samą, a drugiemu wyższą. W przeciwnym przypadku wynik jest optymalny.
Pareto postulował następujące kryterium: tylko wynik optymalny w sensie Pareto może być akceptowany jako rozwiązanie gry. Kryterium Pareto stanowi podstawową zasadą racjonalności zbiorowej. W dylemacie więźnia wchodzi ona w konflikt z zasadą racjonalności indywidualnej reprezentowanej przez równowagę Nasha.
Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.
strona główna | webmaster | o portalu | pomoc
© Wydział Matematyki, Informatyki i Mechaniki UW, 2009-2010. Niniejsze materiały są udostępnione bezpłatnie na licencji Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska.
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.
Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.