Zagadnienia

2. Gry w postaci strategicznej

2.1. Gra strategiczna

Wprowadzamy oznaczenia

N=1,2,n-zbiór graczy

Ai,i=1,2,n-niepusty zbiór akcji (strategii czystych) graczai

A=×Ai,iN.

ui:A-wypłata (funkcja wypłat) graczai,i=1,n

Definicja (ważna) 2.1

Gra strategiczna jest to trójka GS=N,AiiN,uiiN

Używa się też terminów: gra w postaci strategicznej, gra w postaci normalnej, gra niekooperacyjna.

Oznaczamy

a=a1,a2,an=aiiN-profil (strategii czystych) gry,aiAi.

uia-wypłata gracza i z profilu a

Niekiedy, chcąc wyróżnić gracza i, np. by porównywać wartości funkcji wypłat w profilach w których zmieniamy jedną współrzędna, będziemy profil zapisywali w postaci ai,a-i, gdzie a-i oznacza ciąg wyrazów profilu aj dla wszystkich graczy poza i: a-i=ajjN\i. Konsekwentnie oznaczamy A-i=×Ak,kN\{i}

Uwaga 2.1

Tam gdzie nie będzie wątpliwości, będziemy utożsamiać akcję ze strategią. W ogólności, dla wielu typów gier strategia to scenariusz, plan działań, akcji na wszystkie możliwe sytuacje. Odpowiednie formalne definicje będą podane w dalszych rozdziałach.

Uwaga 2.2

Ogólniejsza definicja gry strategicznej wprowadza pojęcie wynikow gry i zastepuje funkcje wypłat graczy przez relacje preferencji na zbiorze wyników gry. W tym wykładzie relacje preferencji specyfikujemy przez podanie funkcji użyteczności - funkcji wypłat, które te relacje określają. Więcej na ten temat - patrz np. [13, 16, 20, 14].

Przykład 2.1

N=1,2, A1=1,2,m1,A2=1,2,m2. Niech a=a1,a2A=A1×A2 - profil strategii czystych, uia - wyplata gracza i z profilu a, i=1,2. W ogólności zbiory Ai mogą być zbiorami różnych strategii. Zbiory uia,aA mają po m1×m2 elementów, które tworzą m1×m2 elementowe macierze - macierze wypłat graczy. Niech E oznacza macierz wypłat gracza 1, F–gracza 2:

E=ehk,ehk=u1h,k,F=fhk,fhk=u2h,khA1,kA2.

Numer wiersza odpowiada numerowi strategii gracza 1, numer kolumny - numerowi strategii gracza 2.

Przykład 2.2

Jako szczególny przypadek Przykładu 2.1 przyjmijmy

N=1,2,A1=A2=C,D, oraz

u1C,C=R,u1C,D=S,u1D,C=T,u1D,D=P,

u2C,C=R,u2C,D=T,u2D,C=S,u2D,D=P,T,R,P,S. Macierze E,F wypłat gracza 1 i 2 mają postać odpowiednio

E C D
C R S
D T P

F C D
C R T
D S P

Będziemy używać łącznego zapisu

C D
C R,R S,T
D T,S P,P

W szczególoności dla T>R>P>S otrzymujemy Dylemat Więźnia, z oznaczeniami: C = Cooperation, D = Defection.

2.2. Równowaga Nasha w strategiach czystych

Definicja (ważna) 2.2

Równowaga Nasha w strategiach czystych (RN) gry strategicznej

GS=N,AiiN,uiiN

jest to profil akcji (strategii czystych) a*=a1*,a2*,,aN*A t. że iNaiAi

uiai*,a-i*uiai,a-i*

Okazuje się że wiele gier nie ma RN w strategiach czystych, np. gra Orzeł - Reszka z Przykładu 1.4.

2.3. Strategie mieszane

Rozważmy grę ”W Kotka i Myszkę” z Przykładu 1.5, o macierzy wypłat

L P
L 0,2 1,0
P 1,0 0,2

gdzie myszka (M) jest graczem wierszowym, kot (K) - graczem kolumnowym i nie ma RN w strategiach czystych.

Rozważmy intuicyjny sposób wprowadzenia strategii mieszanych. Niech M wybiera akcję L z prawdopodobieństwem x, P z 1-x, K wybiera L z p-stwem y, P z 1-y. Nazwijmy pary x,1-x,y,1-y strategiami mieszanymi odpowiednio M i K. Można pokazać że para strategii 1/2,1/2,1/2,1/2 ma tę własność że oczekiwana wartość wypłaty M (K) nie podniesie się (w istocie–nie ulegnie zmianie, co będzie wynikało z ogólnej teorii przedstawionej w następnej części) jeżeli dowolnie zmienimy xy (patrz Ćwiczenie 3.2, Ćwiczenie 3.3 ).

Można więc nazwać tę parę równowagą Nasha dla strategii mieszanych.

Definicja 2.3

GS jest skończona jeżeli miAi<,i=1,2,n.

W dalszym ciągu, o ile nie będzie to powiedziane explicite inaczej, będziemy rozważać gry skończone. Definiujemy

Definicja 2.4

Strategia mieszana σi gracza i w grze strategiczej GS=N,AiiN,uiiN jest to rozkład prawdopodobieństwa na zbiorze jego strategii czystych Ai:

σi=σi1,σi2,,σimi

Współrzędna σih0 jest prawdopodobieństwem że gracz i zagra strategią czystą (wybierze akcję) hAi. Wprowadzamy oznaczenia:

Σi=σi:Ai0,1:k=1miσik=1,σik0– zbiór strategii mieszanych gracza i

σσjjN=σ1,σ2,σn-profil gry

Σ=×Σi,iN – zbiór wszystkich profili gry

σ-i=(σ1,σ2,..σi.,.,σN) - profil strategii wszystkich graczy poza graczem i.

uiσ=uiσi,σ-i-wypłata gracza i z profilu σ

W dalszym ciągu zamiast strategia mieszana będziemy mówić strategia. Strategia czysta jest szczególnym przypadkiem strategii mieszanej; czasami gdy będziemy chcieli podkreślić że mamy do czynienia ze strategią czystą będziemy zamiast strategia mówić strategia czysta.

Strategie mieszane opisują sytuacje w których gracze podejmują akcje z pewnym prawdopodobieństwem. Można sobie wyobrażać że każdy gracz posiada urządzenie dające rozkład p-stwa określający jego strategię mieszaną i używaja tego urządzenia do gry. Alternatywna interpretacja strategii mieszanych jest następująca. Każdemu graczowi odpowiada jedna ”bardzo duża” populacja graczy. Częstość występowania w niej graczy grających każdą z akcji ze zbioru Ai jest równa p-stwu występowania tej akcji w strategii mieszanej. Gracz i losuje z tej populacji jednego gracza i gra jego strategią.

Każda strategia mieszana σi każdego gracza i jest opisana przez wektor pewien wektor xi=xi1,,ximi w przestrzeni euklidesowej Rmi. Będziemy używać alternatywnie zapisu: σi=σi1,,σimi oraz, gdy będziemy chcieli podkreślić algebraiczną strukture wprowadzanego formalizmu, powyższej reprezentacji xi. Profil σ gry będziemy alternatywnie oznaczać przex x, x=x1,xN. Z definicji rozkładu p-stwa mamy

h=1mixih=1,xih0iN.

Współrzędna xih jest prawdopodobieństwem że gracz i zagra strategią czystą (wybierze akcję) hAi.

Definicja 2.5

Niech iNAi=A, czyli zbiór akcji jest ten sam dla wszystkich graczy. GS jest symetryczna ij,a=a1,an zachodzi

uja1,,ai,aj,an=uia1,,aj,,ai,,an.

Mówimy że GS jest symetryczna jeżeli wypłaty każdych dwóch graczy nie ulegają zmianie przy zamianie ról tych graczy.

Uwaga 2.3

Dla n=2 i gry symetrycznej u2a1,a2=u1a2,a1, macierze wypłat graczy są transponowane. Ogólniej, dla n=2 symetria sprowadza sie do stwierdzenia że macierze wypłat są kwadratowe i jedna powstaje z drugiej przez transpozycję.

Wypłaty graczy z profili strategii mieszanych.

Dla każdego gracza i definiujemy Δi - sympleks jednostkowy gracza i (sympleks strategii mieszanych gracza i) oraz Δ - sympleks strategii mieszanych GS:

Definicja 2.6
Δi=xi=xi1,xi2,,xmiRmi:h=1mixih=1,xih0hAi.
Δ=×iΔi.

Tak więc elementy sympleksu jednostkowego gracza utożsamiamy z jego strategiami mieszanymi. Zbiory Δi,i=1,n,Δ są zwarte i wypukłe, co bedzie w szczegolności odgrywało rolę w dowodzie istnienia równowagi Nasha.

Przykład 2.3

Dla N=1,2,m1=m2=2,x1=x11,x12,x2=x21,x22, sympleksy obu graczy są odcinkami o długości 2. Dla N=1,2,m1=m2=3 sympleksy obu graczy są trójkątami równobocznymi.

Strategia czysta jest szczególnym przypadkiem strategii mieszanej. Oznaczając

eik=0,0,1,0,0 (2.1)

- k-ty wersor w mi, możemy zapisać wektorową reprezentację profilu xi=xi1,,ximi w nastepujący sposób:

xi=k=1mixikeikΔi. (2.2)

Można powiedzieć że wektor eik jest strategią (mieszaną) gracza i przypisującą akcji o numerze k ze zbioru Ai prawdopodobieństwo 1, eik jest k-tą strategią czystą gracza i. Dla każdego gracza i wierzchołki sympleksu Δi są to elementy bazy kanonicznej ei1,,eimi przestrzeni wektorowej Rmi.

Rozważmy GS=N,AiiN,uiiN. Założenie że każdy gracz podejmuje decyzję o wyborze akcji ”niezależnie”, bez wiedzy o wyborze innych graczy, formalizujemy w postaci tzw. postulatu niezależności stochastycznej.

Definicja 2.7

Niech a=a1,an,aiAi - profil strategii czystych GS. Postulat niezależności statystycznej mówi że (łączne) p-stwo że 1-y gracz wybierze akcję (zagra) a1, …, n-ty zagra an jest dane wyrażeniem

xa=x1a1x2a2xnan

gdzie xiai jest p-stwem że gracz i zagra ai,i=1,n.

W ten sposób każdemu profilowi strategii czystych aA gry GS przyporządkowaliśmy liczbę xa0. Zachodzi przy tym

aAxa=1 (2.3)

Dla każdego gracza i procedura ta definiuje na zbiorze A=×Ai,i=1,n profili strategii czystych gry pewną zmienna losową Ui o rozkładzie

uia,xa,aA (2.4)

gdzie uia jest wypłatą gracza i z profilu a, natomiast xa jest zdefiniowanym wyżej prawdopodobieństwem zagrania tego profilu.

Definicja 2.8

Wypłata gracza i z profilu strategii mieszanych x=x1,xn jest to wartość oczekiwana zmiennej losowej Ui:

u~ix=aAuiaxa

W dalszym ciagu będziemy na ogół zastępować u~ix przez uix, oraz pomijać jedną parę nawiasów tam gdzie nie budzi to wątpliwości. Np. zamiast uix1,x2 będziemy pisać uix1,x2.

Funkcje wypłat są liniowe względem poszczególnych współrzędnych profilu gry (w dalszym ciagu będziemy używali zwrotu: wypłaty są liniowe). Mówi o tym

Stwierdzenie 2.1

O liniowości wypłat względem każdej współrzednej pofilu

iNjNuix1,,k=1mjxjkejk,xn=k=1mjxjkuix1,,ejk,,xn (2.5)

Wykorzystując postulat niezależności statystycznej [xa=x1a1xjajxnan] prawą stronę przepisujemy w postaci

k=1mjxjka1,,aj,anuia1,,k,,anx1a11...xnan.

Lewa strona ma postać

uixi,x-i=aja1,,aj,anxauia,

Wyciągając xjaj z xa przed ”wewnętrzną” sumę i pamiętając że ajAjxjaj=k=1mjxjk otrzymujemy tezę.

W szczególności dla j=i otrzymujemy wykorzystywana w dalszych rozważaniach równość

iNuik=1mixikeik,x-i=k=1mixikuieik,x-i.
Przykład 2.4

N=2. Oznaczmy A,B - macierze wypłat odpowiednio gracza 1,2. Wypłata gracza 1 z profilu x=x1,x2:

u1x1,x2=a1,a2Ax1a1x2a2u1a1,a2=x1Ax2T.

Analogicznie dla drugiego gracza u2x1,x2=x1Bx2T. W szczególności dla gry symetrycznej, tzn. gdy u1x1,x2=u2x2,x1, czyli A=BT.

Uwaga: xi,x-i oznacza profil x1,x2,xn, a nie profil xi,x1,xi,,xn. W szczególności, dla n=2,i=2 mamy x-i=x1, ale formalny zapis uixi,x-iu2x2,x1 jest to wartość funkcji wypłat u2 na profilu (w punkcie) x1,x2, a nie na x2,x1.

Definicja 2.9

Rozszerzenie mieszane skończonej gry strategicznej GSN,AiiN,uiiN jest to trójka

GS~=N,ΣiiN,u~iiN.

W dalszym ciągu rozszerzenie mieszane także oznaczamy skrótem GS.

2.4. Dominacje strategii

Definicja 2.10

Strategia σiΣi ściśle dominuje strategię ηiΣi jeżeli

σ-iΣ-iuiσi,σ-i>uiηi,σ-i
Definicja 2.12

Strategia σiΣi słabo dominuje strategię ηiΣi jeżeli

σ-iΣ-iuiσi,σ-iuiηi,σ-i

oraz istnieje podprofil σ-iΣ-i dla którego powyższa nierówność jest ostra.

Mówimy że odpowiednie strategie ηi sa ściśle (słabo) zdominowane przez powyższe strategie σi. Strategia jest słabo zdominowana jeżeli istnieje inna która ją słabo dominuje.

Przykład 2.5

W DW (czysta) strategia D (i.e. σi=0,1,i=1,2) ściśle dominuje każdą inną strategię gracza i.

Przykład 2.6

W Słabym DW

C D
C R,R S,T
D T,S S,S

T>R>S, strategia D nie dominuje ściśle strategii C gracza. Mamy bowiem np. dla i=1–ego gracza, oznaczając σ2=β,1-β:

u1D,σ2=βT+1-βS,

u1C,σ2=βR+1-βS,

a zatem dla β=0, czyli dla σ2=0,1, zachodzi równość u1D,σ2=u1C,σ2.

Przykład 2.7

W Słabym DW (czysta) strategia σ1=D słabo dominuje strategię η1=C 1–go gracza. Mamy bowiem, dla i=1, σ-iσ2:=β,1-β, z liniowości,

u1D,σ2u1C,σ2,

oraz σ21,0:

u1D,σ2>u1C,σ2
Uwaga 2.4

Scisła dominacja implikuje słabą dominację.

Definicja 2.13

Strategia σiΣi dominuje strategię ηiΣi jeżeli

σ-iΣ-iuiσi,σ-iuiηi,σ-i
Stwierdzenie 2.2

Strategia mieszana która dominuje każdą strategię czystą danego gracza, dominuje każdą strategię nieszaną tego gracza.

W szczególności strategia czysta która dominuje każdą inną strategię czystą danego gracza, dominuje każdą strategię nieszaną tego gracza. Dowód wynikający z liniowości wypłat, pomijamy.

Uwaga 2.5

Strategia ściśle zdominowana nie może wystepować w profilu równowagowym (”nie może być grana w równowadze”), gdyż gracz grający tą strategią mógłby podwyższyć swą wypłatę zmieniając ją na ścisle dominującą.

Usuwając ze zbioru strategii gracza strategię ściśle zdominowaną nie zmieniamy zbioru równowag Nasha. Jeżeli metoda eliminacji strategii ściśle zdominowanych prowadzi do jednego profilu gry, to jest on RN. Nie jest to prawda w przeciwną stronę - w wielu GS istnieją jednoznaczne RN które nie mogą być uzyskane tą metodą.

Uwaga 2.6

Algorytm usuwania strategii ściśle zdominowanych ( wynik nie zależy od kolejności usuwania):

1. Jeśli nie istnieje gracz który ma strategię ściśle zdominowaną, to stop. W przeciwnym razie przejdź do p. 2.

2. Usuń tę strategię i powróć do punktu 1.

Przykład 2.9

L S R
U 4,3 5,1 6,2
M 2,1 8,4 3,6
D 3,0 9,6 2,8

Strategia R ściśle dominuje S, po usunięciu S strategia U ściśle dominuje M i D, po ich usunięciu L ściśle dominuje R. RN to profil (U,L).

Strategia czysta, jeśli nawet nie jest ścisle zdominowana przez żadną inną czystą, może być ściśle zdominowana przez mieszana, jak pokazuje

Przykład 2.10

L R
U 2,0 -1,0
M 0,0 0,0
D -1,0 2,0

M nie jest ściśle zdominowana ani przez R ani D, natomiast jest ściśle zdominowana przez strategię σ=1/2,0,1/2.

Stwierdzenie 2.3

Strategia która nie jest strategią czystą nie może być strategią ściśle dominującą.

Dowód pozostawiamy czytelnikowi jako ćwiczenie.

Ćwiczenie 2.1

Znależć wszystkie strategie słabo zdominowane i ściśle zdominowane w Słabym Dylemacie Więźnia.

Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.

Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.

Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.