Początki teorii gier ewolucyjnych (TGE) sięgają lat 60ych XX wieku. Pierwotnie TGE rozwijała się w oparciu o idee i przykłady wzięte z biologii. Zasadniczym jej elementem bylo spostrzeżenie że biologiczne przystosowanie (fitness) gatunków zależy od interakcji które można opisać językiem teorii gier. Gracze (osobniki, geny) nie zmieniali swych strategii (np. cech w jakie geny wyposażają organizm, przykładowo gresywna, pokojowa), nie musieli wiedziec że graja w grę, a zmiana udziału strategii w populacji brała się z różnego tempa reprodukcji graczy używajacych poszczególonych strategii. W tym kontekście TGE jest związana z darwinowska teoria ewolucji, której jednym z podstawowych postulatów jest założenie że udział procentowy osobników o lepszym przystosowaniu rośnie w populacji.
J. Maynard Smith jako pierwszy w latach 60ych zaproponował wyjaśnianie zachowań zwierząt za pomocą teorii gier. O ile w interakcjach międzyludzkich gracze, agenci, to ludzie, zespoły, instytucje, mający świadomośc uczestniczenia w grze, o tyle w przypadku świata zwierzęcego, ogólniej w biologii, opisywane obiekty nie mają świadomości uczestnictwa w interakcjach które nazywamy teoriogrowymi, nie mają świadomości podejmowania decyzji, i idea opisu takich interakcji za pomocą formalizmu teorii gier miała w owym czasie charakter rewolucyjny. Jedną z inspiracji leżących u źródeł TGE były obserwacje konfliktów w świecie zwierzęcym, np. walk rytualnych, walk o terytorium, o samicę, czy o przewodnictwo w stadzie.
W naukach biologicznych powstały odrębne działy wykozystujące formalizm teorii gier, takie jak biologia ewolucyjna, ekologia ewolucyjna, patrz np. [3]. Rozwijają sie zastosowania TGE w ekonomii, patrz np. [15, 33, 26], w psychologii i w naukach społecznych. W ekonomii gracze to podmioty gospodarcze, wypłaty to zyski, a strategie to np. sposoby działania na rynku. W naukach społecznych stosuje się TGE w szczegolności do opisu, powstawania i utrzymywania się postaw kooperacyjnych i altruistycznych w społeczeństwach (ludzi, zwierzat), do opisu powstawania i ewolucji norm społecznych.
O ile w biologii czestości strategii zależą od temp reprodukcji, a mutacje mają podłoże genetyczne, to w naukach społecznych i w ekonomii zależą od możliwości imitacji jednych graczy przez drugich, oraz od możliwości indywidualnego i grupowego uczenia się (learning), a mutacje to np. eksperymenty, innowacje, przypadkowe błędy czy zachowania idiosynkratyczne. W ekonomii, naukach behawioralnych, stosujemy równania dynamiki imitacji, dynamiki najlepszej odpowiedzi, dynamiki wielokrotnego testowania i inne. Będzie to tematem wykładu XV.
Podstawowym pojęciem klasycznej TG jest równowaga Nasha. TG w zasadzie nie precyzuje czy, i która (gdy jest więcej niż jedna) RN jest grana, osiągana, i jeżeli gracze grają RN, to jak do niej doszli. Teoria Gier Ewolucyjnych (TGE) próbuje odpowiedzieć na te pytania. Podejście ewolucyjne polega na opisie jak zachodzą zmiany składu takich układów, jakie są stany asymptotyczne procesów ewolucyjnych, jaka jest ich stabilność itp.
Równania rozpadu promieniotwórczego i reprodukcji
Niech
Dla
W fizyce cząstek elementarnych rozważa sie analogiczne równanie rozpadu promieniotwórczego. Niech
gdzie
Podstawowy scenariusz ewolucyjny:
Podstawowy scenariusz ewolucyjny jest to eksperyment myślowy, wywód teoretyczny:
1. rozpatrujemy dużą populacja jednakowych graczy
2. każdy posiada jedną, niezmienną strategię
3. zakładamy łączenie losowe w pary, w parach jest jednorazowo rozgrywana 2-osobowa gra symetryczna
4. każdy gracz rodzi potomstwo (reprodukcja aseksualna), wypłata z gry jest to liczebność potomstwa.
5. potomstwo dziedziczy strategię rodzica.
6. wracamy do p. 1.
Bardziej skomplikowane scenariusze ewolucyjne uwzględniaja np. gry wieloosobowe, zmiany strategii przez graczy, błędy w wyborze optymalnych strategii, wprowadzają nielosowe oddziaływania (selekcja grupowa, dobór krewniaczy, sygnalny itp.)
Gra ewolucyjna jest to gra strategiczna rozgrywana w populacji osobników zgodnie z scenariuszem ewolucyjnym.
Rozważmy dużą populację składajacą się z osobników 2 typów: A i B. Załóżmy dla uproszczenia że osobniki nie
wymierają, liczba osobników każdego typu rośnie w wyniku pewnego procesu, które nazwiemy reprodukcją,
procesem urodzin. Niech będzie w danej chwili
Zakładamy że liczba nowych osobników typu A która powstaje w czasie pomiędzy
Wzór ten możemy przyjąć za definicję tempa urodzin dla odpowiednio gładkich funkcji
(w dużych populacjach zamiast liczby osobników danego typu rozważamy ich masę).
Niech
Jak łatwo obliczyć,
Otrzymaliśmy intuicyjnie oczywisty
Częstość graczy A rośnie gdy tempo urodzin osobników A jest większe od tempa urodzin B.
Podstawową rolę w prezentacji podstaw ewolucyjnej teorii gier będzie miala gra Jastrząb–Gołąb.
Gra Jastrząb–Gołąb.
n=2 identyczne osobniki wchodzą w konflikt o pewne dobro, np. terytorium, o wartości
J | G | |
---|---|---|
J | ||
G |
Gra ma 2 ”czyste” RN:
Rozważamy scenariusz ewolucyjny z grą Jastrząb–Gołąb. Mamy dużą populację składającą się z osobników A=J, i B=G, o częstościach odpowiednio p i 1-p, których losowo
łączymy w pary w każdej jednostce czasu. Każda para rozgrywa jedną grę Jastrząb-Gołąb. Chcemy opisać jak będzie ewoluował skłąd
procentowy Jastrzębi i Gołębi w populacji. Niech
Średnie wypłata osobników grających J i G w chwili
Założenie ze scenariusza ewolucyjnego, że wynikiem gry sa wypłaty w grze są mierzone liczebnością potomstwa, (dziedziczącego strategię rodzica) odpowiada paradygmatowi teorii Darwina: przystosowanie (fitness) jest mierzone liczebnością potomstwa. Teoriogrowym odpowiednikiem przystosowania jest wypłata. Założenie to formalnie formułujemy jako postulat:
Tempa urodzin
gdzie
W szczególności, jeżeli
Powyższy model ewolucyjny przestawimy w języku rownań różniczkowych.
Niech
(7.1) |
gdzie
(7.2) |
Punkty
Do liczenia średnich wypłat są równoważne scenariusze:
1. Duża populacja graczy:
2. Duża populacja graczy, każdy gra z prawdopodobieństwem
3. Duża populacja graczy, osobniki grają różne strategie mieszane, ale średnio w każdej chwili czasu
w
Model dynamiki replikatorowej jest podstawowym i najbardziej znanym różniczkowym modelem TGE.
Rozważamy scenariusz ewolucyjny: GS:
W ogólniejszym przypadku gier k-osobowych
K. Darwin: udział procentowy osobników (czyli strategii) o lepszej adaptacji rośnie w wyniku doboru naturalnego
(”lepsza adaptacja”
W rozważanym scenariuszu ewolucyjnym postulat ten formalizujemy w następujący sposób:
Tempo wzrostu liczby osobników grających strategię
Obliczamy
Dzieląc przez
Równania Dynamiki Replikatorowej (RDR)
Słownie: tempo zmiany
Przypomnijmy że w podstawowym scenariuszu ewolucyjnym gracze grają w symetryczną grę dwuosobową o macierzy wypłat
(7.3) |
RDR przyjmuja postać
gdzie
Udział strategii o wyższej wypłacie rośnie, patrz Ćwiczenie 7.1.
Sympleks jednostkowy
Jeżeli do tempa wzrostu
Strategia nieobecna pozostaje nieobecna:
Dla
Gra ewolucyjna z dwiema strategiami:
W szczególnym przypadku gry dwuosobowej z macierzą wypłat
Dla HD:
Dla PD:
RDR mają ciekawe własności matematyczne. Udowodnimy interesujące twierdzenie łaczące ”statyczne” pojęcie równowagi Nasha z ”dynamicznym” pojęciem punktu krytycznego (punktu stałego) RDR.
W grach symetrycznych 2-osobowych profil
Jeżeli
Niech
Zauważmy że
a zatem
Oto kilka innych interesujących zależności między powyższymi pojęciami. Scisłe sformułowania i dowody tych i innych ciekawych faktów wiążących strategie Nasha i punkty krytyczne RDR można znależć np. w monografiach [11, 39].
Stabilne w sensie Liapunowa (neutralnie stabilne) punkty krytyczne RDR są strategiami Nasha.
Strategie Nasha będące ESS (patrz kolejny podrozdział) są lokalnie asymptotycznie stabilnymi punktami krytycznymi RDR.
Udział strategii ściśle zdominowanej maleje do zera w dynamice replikatorowej.
John Maynard Smith w latach 1970-ych wprowadził pojęcie strategii ewolucyjnie stabilnej (ESS), uzupełniając warunek rownowagi Nasha o dodatkowy warunek stabilności. ESS odgrywa w TGE porównywalną rolę do Równowagi Nasha w klasycznej TG. Nieformalnie ESS jest to taki profil populacji, który jest odporny na inwazję (dostatecznie) małej grupy mutantów o odmiennym fenotypie. Fenotyp to np. cecha budowy ciała (wielkość osobnika, kolor skóry), agresja, altruizm, sygnał wysyłany innym zwierzęciom itp. Fenotypy są dziedziczone.
Do istotnych osiągnięć ESS należy wytłumaczenie dlaczego na ogół rodzi się mniej więcej tyle samo samców co samic. Okazuje się że strategia rodzenia samców i samic z jednakowym prawdopodobieństwem jest–w odpowiednim formaliźmie teoriogrowym–jedyną strategią ewolucyjnie stabilną.
W symetrycznej 2–osobowej grze ewolucyjnej strategia
Strategia
(i) to warunek RN, (ii)–warunek ”stabilności”. Gdyby (ii) nie było spełnione, strategia
Tak więc strategia
Przepiszmy definicję ESS w postaci
(7.4) |
Jeśli
Jeśli
Ad abs. Niech
Dla dostatecznie małego
Niech
Wtedy lewa strona (7.4) jest mniejsza lub równa zero, sprzeczność.
∎Natychmiastową konsekwencją tego twierdzenia jest
Jeżeli
Jeżeli profil
Pokażemy że
J | G | |
---|---|---|
J | ||
G |
Dla uproszczenia przyjmiemy
a zatem warunek równowagi (i) jest spełniony. Warunek stabilności sprowadza się do wykazania że
Powyższy rezultat wynika też z twierdzenia, które podajemy bez dowodu.
Strategia
Dla gry HD (7.4) i strategii
Jedną z wad pojęcia ESS jest fakt że nie dla wszystkich klas gier ważnych w teorii i w zastosowaniach ESS istnieje.
W grze Kamień-Papier-Nożyczki, z macierzą wypłat
K | P | N | |
---|---|---|---|
K | 0,0 | -1,1 | 1,-1 |
P | 1,-1 | 0,0 | -1,1 |
N | -1,1 | 1,-1 | 0,0 |
jedyna RN jest strategia mieszana
Warunki te są sprzeczne z częścią
Pokaż że jeżeli
Pokaż inwariantność sympleksu jednostkowsego względem RDR. Wsk.: wysumuj RDR po wszystkich strategiach i skorzystaj z jednoznaczności rozwiązania odpowiedniego zagadnienia Cauchy'ego.
Niech tempo urodzin graczy o strategii
RDR dla SD:
Rozważmy grę
A | B | |
---|---|---|
A | 2,2 | 0,0 |
B | 0,0 | 0,0 |
w scenariuszu ewolucyjnym. Pokazać że z dwóch strategii Nasha
Omówić Twierdzenie 7.1 dla słabego Dylematu Więźnia (napisać RDR, strategie Nasha itp.).
Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.
strona główna | webmaster | o portalu | pomoc
© Wydział Matematyki, Informatyki i Mechaniki UW, 2009-2010. Niniejsze materiały są udostępnione bezpłatnie na licencji Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska.
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.
Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.