Zagadnienia

3. Równowaga Nasha

3.1. Definicje

Równowaga Nasha (RN) jest centralnym pojęciem teorii gier strategicznych.

Definicja (ważna) 3.1

Profil (strategii mieszanych) gry strategicznej σ* jest równowagą Nasha wtedy i tylko wtedy jeżeli

uiσi*,σ-i*uiσi,σ-i*i=1,n,σiΣi

Słownie: żaden z graczy nie może podwyższyć swojej wypłaty przez jednostronną (to znaczy bez zmiany strategii wszystkich innych graczy) zmianę swojej strategii.

W dalszym ciągu udowodnimy ważne twierdzenia charakteryzujące RN.

3.2. Własności RN

Definicja 3.2

Nośnik strategii mieszanej σi=σi1,,σimi jest to zbiór suppσiAi akcji (strategii czystych gracza i) taki że akcja o numerze k z Ai należy do suppσiσik>0.

INaczej mówiąc nosnik strategii σi jest to zbiór strategii czystych które sa grane z dodatnimi prawdopodobieństwami w danej strategii mieszanej σi.

Jeżeli używamy dla strategii mieszanej notacji xi, to jej nośnik oznaczmy suppxi. Nośnik strategii czystej jest singletonem. Można wprowadzić dodatkowe charakterystyki strategii: strategie istotnie mieszane (te które nie są czyste) i całkowicie mieszane (te których nośniki pokrywają się ze odpowiednim zbiorem strategii czystych).

Twierdzenie 3.1 (O wypłatach strategii czystych w RN)

Niech

x=x1,xn,xi=k=1mieikxik,i=1,n

- profil strategii mieszanych GS. Ustalmy gracza i. Niech eik1,eik2 - dwie różne strategie w suppxi czyli p1:=xik1>0,p2:=xik2>0. Wtedy

xjestRNiNuieik1,x-i=uieik2,x-i (3.1)

Tak więc w RN każdy gracz ma jednakowe wypłaty ze wszystkich strategii czystych z nośnika swojej strategii mieszanej którą gra w RN.

Uwaga 3.1

uieik1,x-i oznacza ui(x1,x2,,eik1,,,xn).

ad absurdum. Niech x=x1,,xn - RN, oraz

uieik1,x-i>uieik2,x-i (3.2)

Definiujemy profil

x~=x1,,xi-1,x~i,xi+1,,xN

taki że

x~i=k=1mieikix~ik,

gdzie

x~ik1=p1+p2,
x~ik2=0,
x~ij=xijdlajk1,jk2.

Pokażemy że

uix~i,x-i>uixi,x-i (3.3)

czyli sprzeczność z definicją RN. Lewa strona tej nierówności ma postać:

L=uik=1mieikx~ik,x-i=p1+p2uieik1,x-i (3.4)
+0uieik2,x-i+uikk1,kk2eikxik,x-i. (3.5)

Prawa strona nierówności

P=uik=1mieikxik,x-i=p1uieik1,x-i+p2uieik2,x-i (3.6)
+uikk1,kk2eikxik,x-i, (3.7)

a zatem z (3.2) otrzymujemy L>P, czyli (3.3), i.e. sprzeczność z definicją RN.

Wniosek 3.1

Wypłata każdego gracza w RN jest równa jego wypłacie z profilu w którym gracz ten gra dowolną strategią czystą z nośnika swojej strategii w RN, a pozostali gracze grają swoimi strategiami z RN. Mowi o tym

Stwierdzenie 3.1 (O wypłatach w RN)

Niech

x*=x1*,xN*,xi*=k=1mieikxik*,iN

- profil strategii mieszanych GS w RN. Wypłata każdego gracza iN z profilu x* jest równa jego wypłacie z profilu w którym gra (dowolną) strategię czystą z suppxi* a wszyscy inni nie zmieniają swych strategii. Formalnie:

uixi*,x-i*=uieik,x-i*eiksuppxi* (3.8)

Mówimy, że w RN wypłata gracza jest równa wypłacie z dowolnej granej przez niego w RN strategii czystej.

Gracz i gra w RN pewną strategią xi*=ksuppxi*xik*eik.

Korzystając z liniowości ui otrzymujemy

uixi*,x-i*=ksuppxi*xik*uieik,x-i*=

(z Twierdzenia 3.1), oznaczając s–numer dowolnej ustalonej strategii z suppxi*:

=ksuppxi*xik*ui(eis,x-i*)=ui(eis,x-i*)ksuppxi*xik*=
=(ksuppxi*xik*=1)ui(eis,x-i*).

Poniżej udowodnimy twierdzenie które pozwala znaleźć RN jeśli jest spełniony warunek dostateczny, oraz daje charakterystykę RN jako warunek konieczny.

:

Warunek 1. jest identyczny z Twierdzeniem 3.1.

Warunek 2.: ad absurdum: w przeciwnym razie mielibyśmy

uis,x-i*>uis′′,x-i*dlassuppxi*,s′′suppxi*.

Z Wniosku (3.1), w RN dla s′′suppxi*

uis′′,x-i*=uixi*,x-i*uix*,

a zatem otrzymujemy uis,x-i*>uixi*,x-i*, sprzeczność z definicją RN.

:

Ustalmy gracza i. Niech xi* będzie jego strategią mieszaną spełniającą warunki 1. i 2. Należy wykazać że

uixi,x-i*uixi*,x-i*xiΣi.

Oznaczmy, pomijając dla uproszczenia notacji w obu symbolach indeks i: S:=suppxi*, akeik - k-ta strategia czysta gracza i. Rozkładając uixi,x-i* względem nośnika strategii xi* i jego dopełnienia otrzymujemy, korzystając z liniowości ui:

uixi,x-i*=akSxikuiak,x-i*+akSxikuiak,x-i*,

gdzie zastosowaliśmy zapis xi=kakxik.

Pierwsza suma po prawej stronie ma (z warunku 1.) postać:

akSxikuias,x-i*=uias,x-i*akSxik,

gdzie as jest jedną ze strategii czystych z nośnika S. Druga suma spełnia (z warunku 2.) nierówność:

akSxikuiak,x-i*akSxikuias,x-i*=uias,x-i*akSxik

gdzie as jest ustaloną strategią czystą z nośnika S. Zatem, ponieważ Ai=SS¯,

uixi,x-i*uias,x-i*akAixik,

Zauważmy że dla obu profili xi oraz xi* (każdy profil należy do sympleksu jednostkowego Δi)

akAixik=akAixik*=1,

a więc

uixi,x-i*uias,x-i*akAixik*=akSuias,x-i*xik*+akSuias,x-i*xik*.

Wykorzystując warunek 1. (do zamiany as na ak), reprezentację xi*=akAiakxik* i liniowość funkcji wypłat względem odpowiednich argunentów, przepisujemy wyrażenie po ostatnim znaku równości w postaci

akSuiak,x-i*xik*+akSuias,x-i*xik*=akAiuiak,x-i*xik*=uixi*,x-i*,

gdzie ostatnia równość wynika z liniowości wypłat. Otrzymaliśmy więc

uixi,x-i*uixi*,x-i*.

Powyższe rozumowanie przeprowadzamy iN.

Pokażemy przykład zastosowania Twierdzenia LABEL:waz1.

Przykład 3.1

L C R
T a,2 3,3 1,1
M 0,0 0,0 2,b
B c,4 5,1 0, 7

a,b,c. Nastepująca para (profil) strategii mieszanych jest RN:

x*=x1*,x2*=3/4,0,1/4,0,1/3,2/3

Porównamy wypłaty ze strategii czystych i zastosujemy Twierdzenie LABEL:waz1. Obliczamy wypłaty ze strategii czystych gdy profil przeciwnika jest z RN. Dla gracza i=1:

Wypłata z T:0a+1/33+2/31=5/3

Wypłata z M:0b+1/30+2/32=4/3

Wypłata z B:0c+1/35+2/30=5/3

Wypłaty ze strategii czystych z suppx1=T,B są jednakowe, wypłata z M jest niższa. Dla gracza i=2 analogiczny rachunek pokazuje że wypłaty ze wszystkich strategii czystych: u2(x1*,) są równe 5/2, np:

u2x1*,L=23/4+00+41/4=5/2.

Warunki dostateczne na RN (dla drugiego gracza jest potrzebny tylko warunek 1) są więc spełnione.

Uwaga: Jeśli w drugim wierszu zamienimy 2 na 3 to powyższy profil nie będzie RN bo

u1M,x2*=u10,1,0,0,1/3,2/3=6/3>5/3.

A oto jeszcze jedna charakterystyka RN dająca w szczególności warunek dostateczny istnienia RN.

Stwierdzenie 3.2

Profil x* jest RN

iN,eikAiuieik,x-i*uixi*,x-i*

: Z definicji RN.

: Ustalmy i. Niech xi=k=1mixikeik - dowolna strategia mieszana gracza i. Obliczamy: z liniowości

uixi,x-i*=k=1mixikuieik,x-i*k=1mixikuixi*,x-i* (3.9)
=ui(xi*,x-i*)k=1mixik=ui(xi*,x-i*). (3.10)

Istotną rolę w teorii gier strategicznych odgrywa ścisła RN.

Definicja 3.3

Profil x*=x1*,,xi* jest ścisłą RN (SRN) ixixi*

uixi,x-i*<uixi*,x-i*
Uwaga 3.2

RN jest SRN gdy strategia każdego gracza w RN jest JEDYNĄ najlepszą odpowiedzią na strategie wszystkich innych graczy w RN (definicja najlepszej odpowiedzi będzie podana w następnym rozdziale).

Mówimy że skończona GS jest generyczna jeśli iN funkcja wypłat ui jest różnowartościowa.

Zachodzi:

Stwierdzenie 3.3

SRN jest RN w strategiach czystych

Wsk. W przeciwnym razie w RN nośnik strategii xi pewnego gracza i nie jest singletonem. Z Twierdzenia 3.1 wynika istnienie co najmniej dwóch różnych najlepszych odpowiedzi na xi.

Uwaga 3.3

SRN nie musi istnieć. Przykład: Gra Orzeł-Reszka.

RN w strategiach czystych nie musi być SRN. Przykład: W grze

A B
A 1,1 0,0
B 0,0 0,0

(A,A) jest SRN, (B,B) nie.

Nawet gdy GS ma dokładnie jedną RN, to ta RN nie musi być SRN. Przykład: w grze

A B C
D 1,1 1,0 0,1
E 1,0 0,1 1,0

D,A jest (jedyną) RN, ale nie jest SRN.

Przykład 3.2

W Słabym Dylemacie Więźnia nie ma SRN. To że mieszane strategie nie są SRN wynika ze Stwierdzeniaq 3.3. Bezpośredni rachunek pokazuje że żadna z 3 czystych Rn nie jest SRN.

Definicja 3.4

Profil σ*=σj*jN w GS w której wszyscy gracze mają ten sam zbiór akcji ( czyli Aj=A,jN) jest symetryczną RN jeśli jest RN oraz σi*=σj*i,jA.

Uwaga 3.4

”Większość” gier skończonych ma nieparzystą liczbę RN. Przykładem sa gry 2–osobowe dla których iN funkcja ui:A jest różnowartościowa (gry generyczne).

Oto ”kontrprzykład”: GS z czterema RN ([33]):

A B C
D 0,0 -1,-1 -1,-1
E -1,-1 -1,-1 -1,-1
E -1,-1 -1,-1 0,0

(poza trzema czystymi RN jest ”częściowo mieszana” RN 1/2,0,1/2.

Innym ”kontrprzykładem” jest gra ”Słaby Dylemat Więźnia”, która jest modyfikacją DW z wypłatą P=S:

C D
C R,R S,T
D T,S S,S

dla T>R>S. Wypłata każdego gracza nie jest funkcją różnowartośiowa. Gra ma continuum RN (w tym 3 RN w strategiach czystych), patrz Cwiczenie 4.1.

W ekonomicznych zastosowaniach teorii gier istotną rolę odgrywa pojęcie Pareto-optymalności.

Definicja 3.5

Profil gry strategicznej jest Pareto-optymalny (PO) jeżeli nie istnieje profil dający conajmniej jednemu graczowi wyższą, a wszystkim innym conajmniej taką samą wypłatę.

Profil gry jest Pareto-nieoptymalny jeżeli istnieje inny, lepszy dla conajmniej jednego gracza i nie gorszy dla żadnego (czyli gdy nie jest PO).

Przykład 3.3

L S R
U 4,3 5,1 6,2
M 2,1 8,4 3,6
D 3,0 9,6 2,8

U,L jest RN ale nie jest PO. D,S jest PO, ale nie jest RN.

Przykład 3.4

Gra koordynacyjna

A B
A 2,2 -10-5,0
B -10-5,0 1,1

ma 2 RN w strategiach czystych. RN (A,A) jest PO, ale, zakładając wypłaty np. w PLN, nie jest to ”przekonywujący” wybór w praktycznej realizacji.

Przykład 3.5

W 2-osobowym DW profil (C,C) jest PO gdyż gdy jeden z graczy sobie podwyższy wypłatę to wypłata drugiego się obniży. (C,C) jest PO, ale nie jest RN. Profil (D,D) jest RN ale nie jest PO.

W ”Dylemacie Wspólnych Zasobów” (Tragedy of Commons) tzw. minimalna efektywna kooperacja (czyli profil w którym jest dokładnie tylu kooperantów ile wynosi ”próg” - minimalna liczba kooperantów przy której pula jest rozdzielana między wszystkich graczy) jest jedynym profilem PO.

Dla gier o sumie stałej (patrz część 5) każdy profil jest PO (bo nie istnieje profil dający conajmniej jednemu graczowi wyższą, a wszystkim innym conajmniej taką samą wypłatę).

Ćwiczenie 3.1

Pokazać że DW nie ma innych równowag poza (D,D).

W strategiach czystych nie ma innych RN poza (D,D). Gdyby miał równowagę ściśle mieszaną σ1,σ2, to dla σ2=β,1-β mamy, z twierdzenia podstawowego u1C,σ2=u1D,σ2, czyli Rβ+S1-β=Tβ+P1-β, czyli S-P1-β=T-Rβ, sprzeczność dla DW. Dla profili w których jeden gracz gra strategią ściśle mieszaną a drugi czystą z twierdzenia–warunku koniecznego na wypłaty z obu strategii czystych pierwszego gracza byłyby jednakowe, co nie jest możliwe dla DW.

Ćwiczenie 3.2

Pokaż że w grze w Kota i Myszkę uM1/2,1/2,1/2,1/2uMx,1-x,1/2,1/2x0,1, oraz uM1/2,1/2,1/2,1/2uM1/2,1/2,y,1-yy0,1, a zatem para strategii 1/2,1/2,1/2,1/2 jest RN (w istocie zachodzą równości).

Ćwiczenie 3.3

Ogólniejsza postać gry ”W Kota i Myszkę”

L P
L 0,K M,0
P M,0 0,K

Obliczyć średnie wypłaty przy stosowaniu strategii mieszanych i znależć RN.

Ćwiczenie 3.4

W grze

L S R
U 0,1 0,1 2,4
M 5,1 2,2 1,0
D 4,3 1,4 1,0

znależć RN i profile PO w strategiach czystych.

Odp.: (U,R): RN, PO. (M,S):RN ale nie PO. (D,L):PO ale nie RN.

Ćwiczenie 3.5

Znaleźć RN w grze

L S R
U 1,3 1,3 1,3
M 0,0 2,2 2,2
D 0,0 0,0 3,1

Ćwiczenie 3.6

GS jest o sumie zerowej jeżeli a1,,anAi=1nuia1,,an=0. Wykaż że dla GS o sumie zerowej każdy profil jest PO.

Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.

Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.

Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.