Równowaga Nasha (RN) jest centralnym pojęciem teorii gier strategicznych.
Profil (strategii mieszanych) gry strategicznej jest równowagą Nasha wtedy i tylko wtedy jeżeli
Słownie: żaden z graczy nie może podwyższyć swojej wypłaty przez jednostronną (to znaczy bez zmiany strategii wszystkich innych graczy) zmianę swojej strategii.
W dalszym ciągu udowodnimy ważne twierdzenia charakteryzujące RN.
Nośnik strategii mieszanej jest to zbiór akcji (strategii czystych gracza ) taki że akcja o numerze z należy do .
INaczej mówiąc nosnik strategii jest to zbiór strategii czystych które sa grane z dodatnimi prawdopodobieństwami w danej strategii mieszanej .
Jeżeli używamy dla strategii mieszanej notacji , to jej nośnik oznaczmy . Nośnik strategii czystej jest singletonem. Można wprowadzić dodatkowe charakterystyki strategii: strategie istotnie mieszane (te które nie są czyste) i całkowicie mieszane (te których nośniki pokrywają się ze odpowiednim zbiorem strategii czystych).
Niech
- profil strategii mieszanych GS. Ustalmy gracza . Niech - dwie różne strategie w czyli . Wtedy
(3.1) |
Tak więc w RN każdy gracz ma jednakowe wypłaty ze wszystkich strategii czystych z nośnika swojej strategii mieszanej którą gra w RN.
oznacza .
ad absurdum. Niech - RN, oraz
(3.2) |
Definiujemy profil
taki że
gdzie
Pokażemy że
(3.3) |
czyli sprzeczność z definicją RN. Lewa strona tej nierówności ma postać:
(3.4) | ||||
(3.5) |
Prawa strona nierówności
(3.6) | ||||
(3.7) |
a zatem z (3.2) otrzymujemy , czyli (3.3), i.e. sprzeczność z definicją RN.
∎Wypłata każdego gracza w RN jest równa jego wypłacie z profilu w którym gracz ten gra dowolną strategią czystą z nośnika swojej strategii w RN, a pozostali gracze grają swoimi strategiami z RN. Mowi o tym
Niech
- profil strategii mieszanych GS w RN. Wypłata każdego gracza z profilu jest równa jego wypłacie z profilu w którym gra (dowolną) strategię czystą z a wszyscy inni nie zmieniają swych strategii. Formalnie:
(3.8) |
Mówimy, że w RN wypłata gracza jest równa wypłacie z dowolnej granej przez niego w RN strategii czystej.
Gracz gra w RN pewną strategią
Korzystając z liniowości otrzymujemy
(z Twierdzenia 3.1), oznaczając –numer dowolnej ustalonej strategii z :
Poniżej udowodnimy twierdzenie które pozwala znaleźć RN jeśli jest spełniony warunek dostateczny, oraz daje charakterystykę RN jako warunek konieczny.
:
Warunek 1. jest identyczny z Twierdzeniem 3.1.
Warunek 2.: ad absurdum: w przeciwnym razie mielibyśmy
Z Wniosku (3.1), w RN dla
a zatem otrzymujemy , sprzeczność z definicją RN.
:
Ustalmy gracza . Niech będzie jego strategią mieszaną spełniającą warunki 1. i 2. Należy wykazać że
Oznaczmy, pomijając dla uproszczenia notacji w obu symbolach indeks : , - k-ta strategia czysta gracza . Rozkładając względem nośnika strategii i jego dopełnienia otrzymujemy, korzystając z liniowości :
gdzie zastosowaliśmy zapis
Pierwsza suma po prawej stronie ma (z warunku 1.) postać:
gdzie jest jedną ze strategii czystych z nośnika . Druga suma spełnia (z warunku 2.) nierówność:
gdzie jest ustaloną strategią czystą z nośnika . Zatem, ponieważ ,
Zauważmy że dla obu profili oraz (każdy profil należy do sympleksu jednostkowego )
a więc
Wykorzystując warunek 1. (do zamiany na ), reprezentację i liniowość funkcji wypłat względem odpowiednich argunentów, przepisujemy wyrażenie po ostatnim znaku równości w postaci
gdzie ostatnia równość wynika z liniowości wypłat. Otrzymaliśmy więc
Powyższe rozumowanie przeprowadzamy .
∎Pokażemy przykład zastosowania Twierdzenia LABEL:waz1.
L | C | R | |
---|---|---|---|
T | ,2 | 3,3 | 1,1 |
M | 0,0 | 0,0 | 2, |
B | ,4 | 5,1 | 0, 7 |
. Nastepująca para (profil) strategii mieszanych jest RN:
Porównamy wypłaty ze strategii czystych i zastosujemy Twierdzenie LABEL:waz1. Obliczamy wypłaty ze strategii czystych gdy profil przeciwnika jest z RN. Dla gracza :
Wypłata z
Wypłata z
Wypłata z
Wypłaty ze strategii czystych z są jednakowe, wypłata z jest niższa. Dla gracza analogiczny rachunek pokazuje że wypłaty ze wszystkich strategii czystych: są równe , np:
Warunki dostateczne na RN (dla drugiego gracza jest potrzebny tylko warunek 1) są więc spełnione.
∎Uwaga: Jeśli w drugim wierszu zamienimy 2 na 3 to powyższy profil nie będzie RN bo
A oto jeszcze jedna charakterystyka RN dająca w szczególności warunek dostateczny istnienia RN.
Profil jest RN
: Z definicji RN.
: Ustalmy . Niech - dowolna strategia mieszana gracza . Obliczamy: z liniowości
(3.9) | ||||
(3.10) |
Istotną rolę w teorii gier strategicznych odgrywa ścisła RN.
Profil jest ścisłą RN (SRN)
RN jest SRN gdy strategia każdego gracza w RN jest JEDYNĄ najlepszą odpowiedzią na strategie wszystkich innych graczy w RN (definicja najlepszej odpowiedzi będzie podana w następnym rozdziale).
Mówimy że skończona GS jest generyczna jeśli funkcja wypłat jest różnowartościowa.
Zachodzi:
SRN jest RN w strategiach czystych
Wsk. W przeciwnym razie w RN nośnik strategii pewnego gracza nie jest singletonem. Z Twierdzenia 3.1 wynika istnienie co najmniej dwóch różnych najlepszych odpowiedzi na .
∎SRN nie musi istnieć. Przykład: Gra Orzeł-Reszka.
RN w strategiach czystych nie musi być SRN. Przykład: W grze
A | B | |
---|---|---|
A | 1,1 | 0,0 |
B | 0,0 | 0,0 |
(A,A) jest SRN, (B,B) nie.
Nawet gdy GS ma dokładnie jedną RN, to ta RN nie musi być SRN. Przykład: w grze
A | B | C | |
---|---|---|---|
D | 1,1 | 1,0 | 0,1 |
E | 1,0 | 0,1 | 1,0 |
jest (jedyną) RN, ale nie jest SRN.
W Słabym Dylemacie Więźnia nie ma SRN. To że mieszane strategie nie są SRN wynika ze Stwierdzeniaq 3.3. Bezpośredni rachunek pokazuje że żadna z 3 czystych Rn nie jest SRN.
Profil w GS w której wszyscy gracze mają ten sam zbiór akcji ( czyli ) jest symetryczną RN jeśli jest RN oraz
”Większość” gier skończonych ma nieparzystą liczbę RN. Przykładem sa gry 2–osobowe dla których funkcja jest różnowartościowa (gry generyczne).
Oto ”kontrprzykład”: GS z czterema RN ([33]):
A | B | C | |
---|---|---|---|
D | 0,0 | -1,-1 | -1,-1 |
E | -1,-1 | -1,-1 | -1,-1 |
E | -1,-1 | -1,-1 | 0,0 |
(poza trzema czystymi RN jest ”częściowo mieszana” RN .
Innym ”kontrprzykładem” jest gra ”Słaby Dylemat Więźnia”, która jest modyfikacją DW z wypłatą :
C | D | |
---|---|---|
C | R,R | S,T |
D | T,S | S,S |
dla . Wypłata każdego gracza nie jest funkcją różnowartośiowa. Gra ma continuum RN (w tym 3 RN w strategiach czystych), patrz Cwiczenie 4.1.
W ekonomicznych zastosowaniach teorii gier istotną rolę odgrywa pojęcie Pareto-optymalności.
Profil gry strategicznej jest Pareto-optymalny (PO) jeżeli nie istnieje profil dający conajmniej jednemu graczowi wyższą, a wszystkim innym conajmniej taką samą wypłatę.
Profil gry jest Pareto-nieoptymalny jeżeli istnieje inny, lepszy dla conajmniej jednego gracza i nie gorszy dla żadnego (czyli gdy nie jest PO).
L | S | R | |
---|---|---|---|
U | 4,3 | 5,1 | 6,2 |
M | 2,1 | 8,4 | 3,6 |
D | 3,0 | 9,6 | 2,8 |
jest RN ale nie jest PO. jest PO, ale nie jest RN.
Gra koordynacyjna
A | B | |
---|---|---|
A | 2,2 | ,0 |
B | ,0 | 1,1 |
ma 2 RN w strategiach czystych. RN (A,A) jest PO, ale, zakładając wypłaty np. w PLN, nie jest to ”przekonywujący” wybór w praktycznej realizacji.
W 2-osobowym DW profil (C,C) jest PO gdyż gdy jeden z graczy sobie podwyższy wypłatę to wypłata drugiego się obniży. (C,C) jest PO, ale nie jest RN. Profil (D,D) jest RN ale nie jest PO.
W ”Dylemacie Wspólnych Zasobów” (Tragedy of Commons) tzw. minimalna efektywna kooperacja (czyli profil w którym jest dokładnie tylu kooperantów ile wynosi ”próg” - minimalna liczba kooperantów przy której pula jest rozdzielana między wszystkich graczy) jest jedynym profilem PO.
Dla gier o sumie stałej (patrz część 5) każdy profil jest PO (bo nie istnieje profil dający conajmniej jednemu graczowi wyższą, a wszystkim innym conajmniej taką samą wypłatę).
Pokazać że DW nie ma innych równowag poza (D,D).
W strategiach czystych nie ma innych RN poza (D,D). Gdyby miał równowagę ściśle mieszaną , to dla mamy, z twierdzenia podstawowego , czyli , czyli , sprzeczność dla DW. Dla profili w których jeden gracz gra strategią ściśle mieszaną a drugi czystą z twierdzenia–warunku koniecznego na wypłaty z obu strategii czystych pierwszego gracza byłyby jednakowe, co nie jest możliwe dla DW.
Pokaż że w grze w Kota i Myszkę oraz a zatem para strategii jest RN (w istocie zachodzą równości).
Ogólniejsza postać gry ”W Kota i Myszkę”
L | P | |
---|---|---|
L | 0,K | M,0 |
P | M,0 | 0,K |
Obliczyć średnie wypłaty przy stosowaniu strategii mieszanych i znależć RN.
W grze
L | S | R | |
---|---|---|---|
U | 0,1 | 0,1 | 2,4 |
M | 5,1 | 2,2 | 1,0 |
D | 4,3 | 1,4 | 1,0 |
znależć RN i profile PO w strategiach czystych.
Odp.: (U,R): RN, PO. (M,S):RN ale nie PO. (D,L):PO ale nie RN.
Znaleźć RN w grze
L | S | R | |
---|---|---|---|
U | 1,3 | 1,3 | 1,3 |
M | 0,0 | 2,2 | 2,2 |
D | 0,0 | 0,0 | 3,1 |
GS jest o sumie zerowej jeżeli . Wykaż że dla GS o sumie zerowej każdy profil jest PO.
Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.
strona główna | webmaster | o portalu | pomoc
© Wydział Matematyki, Informatyki i Mechaniki UW, 2009-2010. Niniejsze materiały są udostępnione bezpłatnie na licencji Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska.
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.
Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.