Równowaga skorelowana (RS), wprowadzona przez R. Aumanna w 1974 r. jest uogólnieniem RN dla gier w których występują korelacje w odbiorze sygnałów (o stanie świata) przez graczy. Pojęcie to wymaga wprowadzenia zewnętrznego informatora (”koordynatora”, ”choreografa”), przysyłającego sygnały wpływające na decyzje graczy o wyborze strategii. Model który pozwoli na zdefiniowanie RS dopuszcza aby gracze podejmowali swoje decyzje stosując pewien stochastyczny mechanizm koordynacji wyboru akcji. W szczególności jeżeli taki mechanizm będzie asymetryczny, czyli będzie dawał inne sygnały różnym graczom, to uzyskiwane przez graczy wypłaty mogą być wyższe niż osiągalne w jakiejkolwiek istniejacej w danej grze RN.
Rozważmy dwuosobową GS o macierzy wypłat
L | R | |
---|---|---|
U | 5,1 | 0,0 |
D | 4,4 | 1,5 |
Gra ma 3 RN: . Wypłata każdego gracza z mieszanej RN wynosi
Załóżmy że gracze obserwują jednoczesnie ciąg realizacji zmiennej losowej: rzut monetą symetryczną, i że grają po każdej realizacji w nastepujący sposób:
Gracz 1: jeśli wypadnie orzeł, jeśli reszka.
Gracz 2: jeśli wypadnie orzeł, jeśli reszka.
Wtedy każdy ma średnią wypłatę 3.
Rozważmy wypukłą kombinację liniową wypłat w czysrych RN:
(8.1) |
Wartość możemy interpretować jako stopień symetrii monety–prawdopodobieństwa że wypadnie orzeł. Dla odpowiednio niesymetrycznej monety gracze mogą mieć każdą wypłatę z wypukłej kombinacji liniowej czystych RN.
Okazuje się że mając do dyspozycji pewne ”urządzenie” generujące określone sygnały (”urządzenie korelujące”) i różnicując w odpowiedni sposób informację otrzymywaną z tego urządzenia obaj gracze moga otrzymać wyższe wypłaty niż 3. Niech urządzenie generuje z jednakowym prawdopodobieństwem 3 sygnały: . Załóżmy że jeśli zaszło to gracz 1 wie że zaszło A, jeśli B lub C to przypisuje każdemu z nich prawdopodobieństwo 1/2. Załóżmy że jeśli zaszło C to 2 wie że zaszło C, a jeśli A lub B to przypisuje każdemu z nich prawdopodobieństwo 1/2.
Niech 1 gra U gdy zaszło A, D gdy B lub C. Niech 2 gra R gdy zaszło C, L gdy A lub B.
Jeżeli zaszlo A to 1 wie że 2 wie że zaszło A lub B, więc wie że 2 zagra L. U jest najlepszą odpowiedzią gracza 1.
Jesli zaszło B lub C to 1 wie tylko że zaszło jedno z nich z prawdopodobieństwem 1/2, czyli wie że 2 zagra L z prawdopodobieństwem 1/2 i R z prawdopodobieństwem 1/2. Ponieważ wypłata 1 jest wtedy równa 2.5 zarówno z D jak i z U, więc jest tez najlepszą odpowiedzią.
Dla gracza 2 rozumowanie jest analogiczne.
Skonstruowaliśmy nową grę, w której strategie to ciągi trzyelementowe o wyrazach: U, D dla gracza 1, R, L dla gracza 2. Para strategii: 1 gra U gdy zaszło A, D gdy B lub C. Niech 2 gra R gdy zaszło C, L gdy A lub B jest równowaga Nasha.
Mówimy że w tej równowadze akcje graczy są skorelowane. Ponieważ A, B, C zachodzą z prawdopodobieństwem 1/3 każde, więc w tej równowadze pary akcji (U,L), (D,L) i (D,R) sa grane z prawdopodobieństwem 1/3 każda, a para (U,R) nigdy. W tej nowej równowadze średnia wypłata każdego gracza jest równa 3 1/3, gdyż:
Para nie jest równowagą Nasha. Mamy , ale gdy 1 zmieni strategię na , to .
Analogicznie jak w poprzednim przykładzie, zmieniając rozkład prawdopodobieństwa zdarzeń: możemy uzyskać dowolna wypłatę z wypukłej kombinacji .
Podamy przykład w którym jeden z graczy (trzeci) ograniczy swoją informację, a pozostali gracze będąc o tym poinformowani będa zmuszeni do zagrania w pożądany przez trzeciego gracza sposób, podwyższając wypłate wzystkich graczy w stosunku do wypłaty z RN.
Rozważmy grę trzyosobowa, w której gracz 1 gra wierszami, 2 kolumnami a 3 macierzami. Macierze wypłat graczy 1,2,3 mają postać odpowiednio:
L | R | |
---|---|---|
U | 0,1,3 | 0,0,0 |
D | 1,1,1 | 1,0,0 |
L | R | |
---|---|---|
U | 2,2,2 | 0,0,0 |
D | 2,2,0 | 2,2,2 |
L | R | |
---|---|---|
U | 0,1,0 | 0,0,0 |
D | 1,1,0 | 1,0,2 |
Jedyną RN jest , w której każdy gracz otrzymuje wypłatę . Niech urządzeniem korelującym będzie symetryczna moneta z wunikami O, R. Niech 1 i 2 znają wynik rzutu, a 3 nie. Otrzymujemy nową grę w której strategie graczy to odpowiednie pary akcji: np. dla gracza 1 są 4 strategie: pary (U,U), (U,D), (D,U), (D,D); dla gracza 3 strategie to pary macierzy. Pierwszy element pary to macierz którą gra 3 gdy wypadnie O, drugi–gdy R. Gracz 3 ma 8 strategii.
RN to trójka strategii :
: graj U jeśli O, D jeśli R
: graj L jeśli O, R jeśli R.
: graj drugą macierzą jeśli O, drugą macierzą jeśli R (czli graj zawsze drugą macierzą).
Pokażemy że strategia każdego gracza to najlepsza odpowiedż.
Gracz 1:
jeśli O to 1 wie że 2 wie że O i że 2 gra L, 3 gra drugą macierzą, a więc U daje najwyższą wypłatę.
jeśli R to 1 wie że 2 wie że R i że 2 gra R, 3 gra drugą macierzą, a więc D daje najwyższą wypłatę.
Tak więc strategia jest najlepszą odpowiedzią.
Gracz 2: analogicznie. Najwyższe wypłaty dają odpowiednio L przy O i R przy R.
Gracz 3:
wie że para graczy (1,2) gra (U,L) z prawdopodobieństwem 1/2, (D,R) z prawdopodobieństwem 1/2. Najwyższą wypłatę, równą 2, daje mu gra drugą macierzą (gracze 1 i 2 otrzymuja też po 2).
∎Ważne jest że 1 i 2 wiedzą że 3 ma ograniczoną informację, tzn. że wiedzą że 3 nie wie czy wypadł O czy R. Gdyby 3 wiedział, czyli miał taką samą informację jak 1 i 2, to grałby nastepującą strategią : graj pierwszą macierza jeśli O, trzecią jeśli R. Wtedy nie byłaby RN, gracze wróciliby wtedy do RN z wypłatami po 1 dla każdego.
Rozważmy . Zdefiniujemy ”rozszerzoną” gre, strategie i RN dla gry rozszerzonej. Wpierw zdefiniujemy
Urządzenie korelujące jest to trójka , gdzie:
–skończony zbiór (stanów świata). W powyższych przykładach odpowiada realizacjom odpowiedniej zmiennej losowej.
–podział dla gracza . Podział opisuje informację gracza o realizacji zmiennej losowej (”zajściu stanu”). Jeśli zaszedł to gracz wie że stan który zaszedł leży w , gdzie jest elementem podziały takim że .
Podział przyporządkowuje każdemu zbiór t. że .
–miara probabilistyczna na .Zdefiniujemy strategie czyste graczy:
Strategia gracza jest to funkcja : jeżeli dla pewnego , to .
Tak więc jeżeli , to strategia implikuje tę samą akcję gracza zarówno jeżeli zaszło , jak i jeżeli zaszło . Mówimy że strategie gracza są adoptowane do jego zbioru informacyjnego (czyli do podziału ).
jest równowagą skorelowana gdy (dla każdej strategii adaptowanej)
1. W tej definicji jest takie same dla każdego gracza . Taką RS nazywamy obiektywną. Jeżeli dla każdego gracza mielibyśmy określona miarę , to taką RS nazwiemy subiektywna.
2. nazywamy przekonaniami (beliefs) graczy.
Powyższa definicja RS zależy od urządzenia korelacyjnego. Podamy definicje równoważną.
Równowagą skorelowaną nazywamy (każdy) rozkład prawdopodobieństwa na t. że oraz dla każdej funkcji
(8.2) |
W grze walka płci o macierzy wypłat
B | S | |
---|---|---|
B | 2,1 | 0,0 |
S | 0,0 | 1,2 |
niech . RS stanowi para strategii adaptowanych Tę RS można interpretować tak że gracze obserwują wynik rzutu monetą symetryczna który wyznacza która z RN będzie grana.
Rozważmy dwuosobową GS o macierzy wypłat (patrz Przykład 8.1)
L | R | |
---|---|---|
U | 5,1 | 0,0 |
D | 4,4 | 1,5 |
Zdefiniujemy rodzinę urządzeń korelujących. Niech ,
.
Znajdziemy odpowiednie równowagi skorelowane. Rozważmy parę strategii adaptowanych
: graj U gdy (czyli ), D gdy ,
: graj L gdy , R gdy .
Znajdziemy dla których jest Rn w grze rozszerzonej.
Rozważmy wpierw gracza 1. Jeśli to 1 wie że 2 zagra L, więc U daje najwyższą wypłatę, a zatem jest najlepszą odpowiedzią. Jeśli to 1 wie tylko że . Gracz 1 nie wie czy zaszło czy (a zatem czy 2 zagra L czy R) i oblicza te prawdopodobieństwa z wzoru Bayesa :
Inaczej mówiąc, gracz 1 gra przeciw strategii mieszanej gracza 2: i jego wypłata wynosi:
z U: ,
z D: .
Aby para strategii adaptowanych była RN, wypłata gracza 1 z D musi być nie mniejsza niż z U, co daje warunek
(8.3) |
Jeśli to dla gracza 1 otrzymujemy ten sam warunek.
Gracz 2:
Jeśli zaszło to gracz 2 wie tylko, że zaszło lub , a więc wie że gracz 1 gra:
U z prawdopodobieństwem
D z prawdopodobieństwem
Wypłaty gracza 2 przeciwko tej strategii mieszanej to:
z L: ,
z R: .
Aby było najlepszą odpowiedzią, wypłata z l musi być nie mniejsza niż z R, co implikuje nierówność:
(8.4) |
Jeśli zaszło to otrzymujemy identyczny warunek.
Jeśli zaszło to gracz 2 wie że zaszło , czyli że gracz 1 gra D, a więc gracz 2 zagra R. Tak więc jest najlepszą odpowiedzią.
Dla każdej pary liczb spełniającej warunki 8.3, 8.4 określona powyżej para strategii adaptowanych jest RS.
Srednie wypłaty graczy w tych równowagach:
Pamiętając że , znajdujemy średnie wypłaty obu graczy:
(8.5) |
przy warunkach 8.3, 8.4. Jest to zagadnienie programowania liniowego. Rozwiązaniem są, w pierwszej ćwiartce układu współrzędnych o osiach , odcinki łączące punkty (1,5) z (10/3,10/3) oraz (10/3,10/3) z (5,1). Każdy punkt obu odcinkow odpowiada pewnej równowadze Pareto-optymalnej. W szczególności punkt (10/3,0/3) odpowiada wyborowi .
Zachodzi interesujące twierdzenie, które podamy bez dowodu (patrz [18]):
Każda wypukła kombinacja liniowa profili wypłat w RS jest profilem wypłat pewnej RS.
Znajdź urządzenie korelacyjne i RS w grze trzyosobowej (patrz podobny przykład 8.2) w której gracz 1 gra wierszami, 2 kolumnami a 3 macierzami. Macierze A, B, C wypłat graczy 1,2,3 mają postać odpowiednio:
A | L | R |
---|---|---|
T | 0,0,3 | 0,0,0 |
B | 1,0,0 | 0,0,0 |
B | L | R |
---|---|---|
T | 2,2,2 | 0,0,0 |
B | 0,0,0 | 2,2,2 |
C | L | R |
---|---|---|
T | 0,0,0 | 0,0,0 |
B | 0,1,0 | 0,0,3 |
Pokaż że RN w wyjściowej GS to . Pokaż że istnieje RS w której gracz 3 gra B, gracze 1 i 2 graja (T,L) i (B,R) z prawdopodobieństwami 1/2. Wyjaśnij w jakim sensie gracz 3 woli nie wiedzieć że gracze 1 i 2 koordynują swoje akcje.
Urządzenie korelujące: .
RS: Trójka strategii:
Gracz 3 wie że pary akcji gracza 1 i 2: (T,L) i (B,R) zachodzą z jednakowymi prawdopodobieństwami, więc jesli zmieni akcję na A lub C to otrzyma .
Niech urządzeniem korelującym będzie symetryczna moneta z wynikami O, R. Niech 1 i 2 znają wynik rzutu, a 3 nie. Otrzymujemy nową gre w której strategie graczy to odpowiednie pary akcji: np. dla gracza 1 są 4 strategie: pary (U,U), (U,D), (D,U), (D,D); dla gracza 3 strategie to pary macierzy. Pierwszy element pary to macierz która gra 3 gdy wypadnie O, drugi–gdy R. Gracz 3 ma 8 strategii.
RN to trójka strategii :
: graj U jeśli O, D jeśli R
: graj L jeśli O, R jeśli R.
: graj drugą macierzą jeśli O, drugą macierzą jeśli R (czli graj zawsze drugą macierzą).
Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.
strona główna | webmaster | o portalu | pomoc
© Wydział Matematyki, Informatyki i Mechaniki UW, 2009-2010. Niniejsze materiały są udostępnione bezpłatnie na licencji Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska.
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.
Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.