Używa się też nazwy gry powtarzane (repeated games, infinitely repeated games, iterated games).
W świecie realnym podmioty interakcji, gracze często wchodzą w interakcje z tymi samymi przeciwnikami, partnerami. Perspektywa przyszłych interakcji z tym samym graczem może istotnie wpływać na wybór strategii graczy.
Gry powtarzane opisują np. sytuacje wielokrotnych interakcji społecznych, altruizmu, kary etc. Gracz musi uwzględnić wpływ granej akcji na przyszłe akcje przeciwników. Pojedyńcza interakcja jest opisywana pewną grą strategiczną (stage game, one–shot game). Gracze wielokrotnie powtarzają tę grę, podejmując za każdym razem decyzję o wyborze akcji jednocześnie (ogólniej–nie znając decyzji pozostałych graczy), natomiast znając poprzednie akcje pozostałych graczy.
Jest wiele przykładów powtarzalnych interakcji z których każda jest np. opisywana tą samą jednokrotną grą strategiczną i które nie mają określonego terminu zakończenia, horyzontu czasowego. Z drugiej strony w wielu przypadkach termin zakończenia takich interakcji nie odgrywa istotnej roli w planowaniu strategii graczy. W takich przypadkach model z nieskończona liczbą interakcji może być lepszy do opisu strategii graczy.
Gry iterowane dzielimy na skończone i nieskończone. Gra skończona to ciąg skończenie
n-krotny Dylemat Więźnia.
Metoda indukcji wstecznej zastosowana do równoważnej EGwII pokazuje że racjonalny gracz gra defekcję w każdej grze pojedynczej.
Gra nieskończona (będziemy uzywać skrótu GN lub GI: Gra Iterowana) to nieskończony ciag takich gier. Będziemy zajmowali się powtarzanymi grami nieskończonymi. Motywacją do ich wprowadzenia jest np. fakt że w wielu sytuacjach nie znamy liczby przyszłych interakcji.
Ponieważ nie można zastosować metody indukcji wstecznej, więc w nieskończonym Dylemacie Więźnia nie jest oczywiste jakie akcje powinien podejmować racjonalny gracz–świadomość kary w przyszłych grach za defekcję w pewnej chwili (czyli obniżenia wypłaty) może spowodować wybór kooperacji.
Wypłaty będziemy opisywać jako sumę wypłat z gier pojedynczych. Aby uniknąć wypłat nieskończonych wprowadzimy
czynnik dyskontujący wypłaty. Formalnie będzie to odpowiadało sytuacji gdy po każdej grze
pojedynczej jest niezerowe prawdopodobieństwo
Iterowany Dylemat Więźnia (IDW) (Iterated Prisoner's Dilemma, IPD)
Jest to najbardziej–ze względu na zastosowania–popularny przykład gry nieskończenie powtarzanej. Gdy nie jest
explicite
powiedziane inaczej, wyjściową grą pojedyńczą jest dwuosobowy Dylemat Więźnia
Niech GS=
–profil akcji granych w chwili
Historia do (chwili)
gdzie
Na przykład dla dwóch graczy historia do
Używając nomenklatury z teorii GE mówimy że historia jest zakończona wtedy i tylko wtedy gdy jest nieskończona.
Formalnie historia zakończona to nieskończony ciag profili
W celu zdefiniowania strategii w GN oznaczmy:
Strategia (czysta) gracza
gdzie
Strategia grim–trigger (strategia cynglowa) w Iterowanym DW (IDW):
(13.1) |
Gracz stosujący tę strategię zaczyna akcją C i gra C do chwili gdy przeciwnik zagra D, i od tego momentu gra D niezależnie od akcji przeciwnika.
Przykłady innych strategii w IDW.
All C–zawsze kooperuj.
All D–zawsze zdradzaj.
TFT–Wet Za Wet (Tit For Tat): w pierwszej rundzie koperuj, następnie powtarzaj ostatni ruch przeciwnika.
TFT2–Wet Za 2 Wety (Tit For 2 Tats): zdradzaj gdy przeciwnik zdradził w 2 poprzednich rundach, wpp. kooperuj.
BRUTAL: w pierwszym ruchu kooperuj. Następnie: jeżeli przeciwnik kooperuje, zdradzaj co drugą rundę, jeśli w pewnej rundzie zdradzi, graj cały czas D.
WIN–STAY, LOSE–SHIFT (PAVLOV): Graj C w pierwszej rundzie, po (C,C) i po (D,D) wpp. graj D.
STAND1: w pierwszym ruchu zdradź. Jeżeli przeciwnik też zdradził, to zdradzaj we wszystkich kolejnych rundach, jeśli kooperował to kooperuj we wszystkich kolejnych rundach, w obu przypadkach niezależnie od akcji przeciwnika.
STAND2: w pierwszych 2 ruchach zdradź. Jeżeli w nich przeciwnik chociaż raz zdradził, to zdradzaj we wszystkich kolejnych rundach, jeśli nie, to kooperuj we wszystkich kolejnych rundach, w obu przypadkach niezależnie od akcji przeciwnika.
Analogicznie jak dla GE, profil strategii wszystkich graczy
Wypłata gracza
Normalizacja
Zdefiniujemy równowagę Nasha.
Ponieważ profil strategii
gdzie
Profil
W IDW profil w którym strategia każdego gracza to: graj D po każdej historii do
Okazuje się że nie jest to jedyna RN w IDW.
Profil
Pokażemy to dla 2-osobowego IDW z macierzą wypłat gry pojedynczej
Jeżeli pewna inna strategia
gdzie
Znormalizowana wypłata:
Łatwo widać że dla
Tak więc, gdy czynnik dyskontowy jest conajmniej 0.5 to para strategii grim–trigger jest RN w
nieskończenie powtarzanym (iterowanym) Dylemacie Więźnia z macierzą wypłat
Analogiczny rachunek dla ogólnego Dylematu Więźnia daje warunek
Para strategii
Obaj gracze stosując TFT grają w każdej rundzie C i mają w IDW znormalizowane wypłaty równe
W pierwszym przypadku historia ma postać
gdzie pierwsze
Ponieważ przez pierwsze
Łatwo widać że
W drugim przypadku historia ma postać
gdzie
Znormalizowana wypłata gracza 2 ze strategii
Widać że
Identyczne rozumowanie przeprowadzamy dla gracza
Dla twierdzeń o istnieniu w grach iterowanych uzywa się też np. nazw: twierdzenia potoczne, ludowe, które biorą się stąd że były one znane od pewnego czasu, a nie są znani ich pierwsi autorzy.
Typowe twierdzenie potoczne mówi że w grze powtarzalnej prawie każdy wynik (ciąg wypłat graczy) może być zrealizowany w pewnej RN, o ile czynnik dyskontowy jest dostatecznie duży. Różne założenia dają różne postacie twierdzenia potocznego.
Gwarantowana wypłata (reservation payoff) w 2-osobowej GN gracza
Jest to wypłata jaką
Procentem (udziałem) kooperacji w zakończonej historii IDW jest to granica
gdzie
Dla dowolnej liczby
IDW jako gra jednokrotna
Niech
Rozważmy grę 2-osobowa w której każdy z graczy może grać jedną ze strategii: AllD, TFT, z wypłatami
TFT | AllD | |
---|---|---|
TFT | R/(1-w),R/(1-w) | S+Pw/(1-w),P/(1-w) |
AllD | T+Pw/(1-w),S+Pw/(1-w) | P/(1-w),P/(1-w) |
lub, oznaczając x = w/(1-w):
TFT | AllD | |
---|---|---|
TFT | R(1+x),R(1+x) | S+Px,T+Px |
AllD | T+Px,S+Px | P(1+x),P(1+x) |
Oprócz ”nieefektywnej” równowagi Nasha
W każdej z dwóch RN gracze grają te same akcje.
Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.
strona główna | webmaster | o portalu | pomoc
© Wydział Matematyki, Informatyki i Mechaniki UW, 2009-2010. Niniejsze materiały są udostępnione bezpłatnie na licencji Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska.
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.
Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.