RN w jest to profil
taki że zachodzi
Gdy każdy gracz ma skończona liczbę strategii to RN znajdujemy biorąc wszystkie profile strategii, wyniki GE z profili i porównując wypłaty graczy na wynikach, tak jak w GS.
RN Gry Ekstensywnej (ze skończonymi zbiorami strategii graczy) jest to RN Postaci Strategicznej GE, czyli RN Gry Strategicznej:
W Grze na Wejście (Przykład 9.3) RN to pary: (Enter, Agree), (Out, Fight).
W grze Targ (Przykład 9.7) RN to pary
W grze z Przykładu 9.8, RN to pary
Omówimy je w następnym rozdziale.
Pełna nazwa: Równowaga doskonała za względu na podgry (Subgame Perfect Equilibrium, SPE).
Rozważmy Grę na Wejście. Oznaczamy: E – gracz 1-y (Entrant), M – 2-i (Monopolist), E=Enter, O=Out - strategie 1-go, A=Agree, F=Fight – 2-go. Są dwie RN postaci strategicznej: i . Niech postać strategiczna tej GE ma macierz wypłat (”wartość monopolu” wynosi 6):
Agree | Fight | |
---|---|---|
Enter | 3,3 | -1,-1 |
Out | 0,6 | 0,6 |
Rozważmy nastepujący scenariusz ”omyłki gracza 1”. Jest grana jedna z dwóch RN: Enter(Out,Fight) i (Enter, Agree). Gracz 1 zmienia omyłkowo strategię, gracz 2-i reaguje ”racjonalnie”: zmienia strategię tylko jeżeli podwyższy sobie wypłatę. Po ruchu gracza 2 gracz 1 reaguje ”racjonalnie” (już bez możliwości bez pomyłki). Zastosujmy ten scenariusz do obu RN.
: 1 zmienia Out na Enter, wtedy 2 zmienia Fight na Agree, 1 pozostaje przy Agree. W efekcie czyli jedna równowaga przeszła w drugą.
: 1 zmienia Enter na Out, wtedy 2-i pozostaje przy strategii Agree, 1 wraca do Enter. W efekcie , a zatem następuje powrót do RN (Enter,Agree).
Rozważmy analogiczny scenariusz ”omyłki gracza 2”. Daje on oraz .
Można powiedzieć że jest ”mniej stabilna” ze względu na oba scenariusze łącznie, niż [trzy ”przejścia” dają , jedno ]. W dalszej części wykładu pokażemy że równowagi różnią się też w aspekcie ”wiarygodności” (credibility): pierwsza z nich nie jest ”wiarygodna”.
Wprowadzimy pojęcie równowagi (Równowaga Doskonała ze względu na podgry) które eliminuje takie ”mniej niestabilne” równowagi. Wpierw zdefiniujemy podgry po niezakończonych historiach.
podgra GE(h) po historii gry ekstensywnej
jest to następująca GE:
gdzie
jest to zbiór graczy, taki sam jak w wyjściowej GE
jest to zbiór złożony z wszystkich ciagów akcji t. że , czyli że jest historią w wyjściowej GE, oraz z dodatkowego elementu który oznaczymy
–funkcja gracza:
gdzie
preferencje graczy, t. że , czyli gracz preferuje od jeśli preferuje od w wyjściowej GE.
Zachodzi . Każdą inną podgrę nazywamy podgrą właściwą.
Każdej niezakończonej historii odpowiada 1 podgra (a więc liczba niezakończonych historii = liczba podgier).
GE z Przykładu 9.7 ma 3 historie niezakończone: , a wiec 3 podgry: .
GE z Przykładu 9.8 ma 3 historie niezakończone: , a wiec 3 podgry: oraz .
Stosując powyższą terminologię wprowadzimy wpierw nieformalną definicję równowagi doskonałej GE.
Równowaga doskonała (RD) w GE jest to profil strategii t. że podgry GE strategia jest optymalna w tej podgrze, tzn. jej zmiana nie podwyższa wypłaty gracza .
W Grze na Wejście RN (Out, Fight) nie jest RD, gdyż w podgrze GE(Enter) strategia Fight gracza 2 nie jest optymalna - gracz 2 podwyższy swą wypłatę zmieniając ją na Agree. RN (Enter, Agree) jest RD: strategia każdego gracza jest optymalna zarówno w GE (=GE()) jak i w GE(Enter).
Wprowadzimy notację potrzebną do formalnej definicji RD.
Niech , - profil, - podgra po . Profil jednoznacznie wyznacza w podgrze pewną zakończoną historię i w konsekwencji zakończoną historię w wyjściowej GE. Oznaczamy ją
i nazywamy (zakończoną) historią po generowaną przez profil .
Tak więc jest to zakończona historia w GE złożona z i z ciągu akcji generowanych przez profil po . W szczególności .
W Grze na Wejście niech , =. Mamy
to ciąg złożony z jednej akcji w GE(Enter), wyznaczony przez , czyli , a zatem
Profil jest Równowagą Doskonałą ze względu na podgry (w skrócie: RD) w GE (Subgame Perfect Equilibrium, SPE) jeśli
takiej że zachodzi
(mówimy: strategia jest optymalna w podgrze GE(h) ).
Zauważmy że w RD strategia każdego gracza ma być optymalna po każdej historii po której jest ruch tego gracza, podczas gdy w RN strategia każdego gracza ma być optymalna jedynie po historii . Ponieważ , więc każda RD jest RN. RD jest ulepszeniem, udoskonaleniem (refinement) RN. Znajdowaniu różnych udoskonaleń RN w GS i GE jest poświęcona bogata literatura, patrz np. [5, 10].
RD nie zawsze jest ”optymalnym” wyborem graczy. Przykład: eksperymenty laboratoryjne z grą w stonogę.
W Grze na Wejście strategie 1-go to funkcje: takie że
U nas
a zatem gracz 1 ma dwie strategie – odwzorowania
więc gracz 2 ma dwie strategie – odwzorowania
Profil nie jest RD, gdyż w podgrze GE(Enter) mamy:
i zmiana strategii na daje graczowi 2 wypłatę
Profil jest RD, gdyż
W profil jest RN, a więc zmiana strategii przez gracza 1 nie podwyższy jego wypłaty;
W GE(Enter) mamy a zmiana strategii na daje graczowi 2 wypłatę
Pod pojęciem rozwiązanie (wynik) GE chcielibyśmy rozumieć jej ”przebieg”, czyli informację, jakie akcje były grane przez graczy we wszystkich krokach GE. Ich znajomość daje nam zakończoną historię i odpowiadające jej wypłaty, czyli to co chvcielibyśmy rozumieć jako wynik gry. Dla pewnych typów GE rozwiązanie daje MIW. Jest to metoda znajdowania rozwiązania skończonych GE o skończonym horyzoncie i z doskonałą informacją (to ostatnie założenie można osłabić, odpowiednio modyfikując metodę). MIW polega na wyborze optymalnych akcji graczy w ich ostatnim ruchu i powtarzaniu tej procedury ”w tył” do początku gry. W kolejnych etapach MIW:
1. Znajdujemy optymalne akcje graczy wykonujących ruch w podgrach o długości 1 (długość podgry jest to długość najdłuższej historii w tej podgrze).
2. Powtarzamy to samo w podgrach o długości 2 itd., aż do wyjściowej GE.
3. Otrzymujemy w ten sposób pewną historię zakończoną którą nazwiemy wynikiem GE.
W Grze na Wejście MIM daje RD (Enter, Agree). Gdy zmienimy wypłaty po akcji Fight gracza M z (0,0) na (0,1) to MIW nie można zastosować, bo w podgrze o długości 1 gracz M nie ma jednoznacznego wyboru. Są wtedy dwie RD: (Enter,Agree) oraz (Out,Fight).
W GE Targ (Przykład 9.7) w podgrach o długości 1 jest ruch gracza 2: w GE(C) optymalna akcja 2 to E, w GE(D) - H. W podgrze o długości 2 jest ruch 1-go, jego optymalna akcja to C. RD = (C, EH). Historię łatwo uzyskujemy MIW.
W GE z Przykładu 9.8 w podgrze GE((C,E)) o długości 1, tzn. po historii (C,E) gracz 1-y wybiera G. W podgrze GE(C) o długości 2, tzn po historii C, gracz 2-i wybiera E.W całej GE (o długości 3) gracz 1-y wybiera D. Tak więc RD=(DG,E). MIW daje D jako wynik gry, z wypłatami (2,0).
Podamy przykład GE z dwiema RD.
Gracz 1-y ma akcje L, R. Po L 2-i może grać A z wypłatami (3,2), lub B, z wypłatami (0,0). Po R gracz 2-i może grać C z wypłatami (1,1), lub D z wypłatami (1,1).
RD: oraz wystarczy sprawdzić optymalność w podgrach GE(L), GE(R).
Dla RD : W GE(h=L): każda wypłata.
W GE(h=R): każdej wypłaty 2-go w GE(R).
Dla drugiej RD postępujemy analogicznie.
Tak samo pokazujemy że RN: nie są RD. W tym przykładzie nie możemy zastosować MIW.
Przytoczymy podstawowe twierdzenia o RD.
GE jest GE z doskonałą informacją jeżeli funkcja gracza jest jednowartościowa, każdy gracz zna wszystkie akcje grane do momentu w którym ma pojąć decyzję o wyborze akcji i zna wykonawców tych akcji.
Skończona GE z doskonałą informacją posiada RD. W skończonych GE z doskonałą informacją, w których gracze w każdym ruchu mają jednoznaczne preferencje wyboru akcji istnieje dokładnie jedna RD w strategiach czystych.
Twierdzenie nie zachodzi np. dla GE z nieskończoną liczbą historii, np. w trywialnej GE w której gracz wybiera liczbę z odcinka (0, 1) i otrzymuje wypłatę równą tej liczbie. Gracz nie ma strategii optymalnej, w szczegolności nie można zastosować MIW.
Jeżeli dla każdej podgry GE MIW wybiera optymalną akcję jednoznacznie, to uzyskany profil strategii jest jedyną RD GE (dowód pomijamy). Jeśli istnieje więcej niż jedna optymalna akcja, to pewna modyfikacja MIW daje wszystkie RD w skończonej GE.
Jeżeli w pewnym momencie GE decyzje podejmuje conajmniej dwóch graczy bez wiedzy jaką decyzję podjął każdy z tych graczy, to taką grę będziemy nazywać GE z Jednoczesnymi Ruchami (możemy bowiem wyobrażać sobie takią sytuację gdy gracze podejmują decyzje jednocześnie, w tej samej chwili). Będziemy używali skrótu GEzJR.
n=3 graczy dzieli między siebie tort. Gracz 1 proponuje podział tortu na 3 części, gracze 2 i 3 bez wiedzy o swoich decyzjach (np. jednocześnie) wyrażają zgodę (T) lub nie (N). Jeśli 2 i 3 zagrają T, nastepuje podział, wpp. żaden z trzech graczy nic nie dostaje.
Formalna definicja GEzJR jest taka sama jak GE: GE z JR jest to czwórka
w której są takie same jak w GE, natomiast wartościami funkcji są zbiory graczy (podzbiory ) (podejmujących jednocześnie decyzje) a nie, jak w GE, pojedyńczy gracze.
Poza tym, o ile w GE historie są ciągami akcji, w GEzJR historie (poza pustą) to ciągi wektorów; współrzędne każdego wektora to ciągi akcji graczy podejmujących decyzje po historii .
Formalizacja stategii, równowag, postaci strategicznej itp. w GEzJR jest podobna jak w przypadku GE i nie będziemy jej tu przedstawiać.
GS vs. GEzJR:
Dla każdej GS istnieje GEzJR w której każda historia zakończona ma długość 1, zbiór jest zbiorem profili akcji w GS:
Każda skończona GE ma dokładnie jedną Postać Strategiczną. Odwrotnie nie, np.
L | R | |
---|---|---|
T | 2,1 | 0,0 |
B | 1,2 | 1,2 |
jest postacią strategiczną GEzJR, w której np. zbiór informacyjny gracza 2 jest dwuelementowy (także gracza 1–go), a także postacią strategiczną GE Na Wejście:
Agree | Fight | |
---|---|---|
Enter | 2,1 | 0,0 |
Out | 1,2 | 1,2 |
Każda skończona GE z doskonałą informacją ma RD w strategiach czystych. GEzJR nie musi mieć takiej RD. Przykładem może być GE w Orła i Reszkę, traktowana jako GEzJR, która nie ma RN (a więc i RD) w strategiach czystych.
Do tej pory zajmowaliśmy się GE z Doskonałą Informacją i używaliśmy skrótu GE. GE z Niedoskonałą Informacją (EG with Imperfect Information) definiujemy analogicznie, specyfikując dodatkowo informację jaką gracz posiada o dotychczasowym przebiegu gry gdy jest jego ruch. Niech oznacza zbiór historii po których jest ruch gracza . Określamy podział , jego elementy nazywamy zbiorami informacyjnymi. Historie należą do tego samego zbioru informacyjnego tylko wtedy gdy gdzie – zbiór akcji gracza po .
W szczególności definicja ta dopuszcza ruchy określane jako losowe, ruchy Natury, po których zbiory informacyjne gracza który ma ruch po ruchu Natury nie są singletonami. Wtedy wynik gry jest to loteria na zbiorze zakończonych historii i preferencje graczy (utożsamiane u nas z wartościami oczekiwanymi wypłat) muszą być określane na tych loteriach.
Prosty poker dwukartowy.
Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.
strona główna | webmaster | o portalu | pomoc
© Wydział Matematyki, Informatyki i Mechaniki UW, 2009-2010. Niniejsze materiały są udostępnione bezpłatnie na licencji Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska.
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.
Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.