Równowaga Nasha (RN) jest centralnym pojęciem teorii gier strategicznych.
Profil (strategii mieszanych) gry strategicznej
Słownie: żaden z graczy nie może podwyższyć swojej wypłaty przez jednostronną (to znaczy bez zmiany strategii wszystkich innych graczy) zmianę swojej strategii.
W dalszym ciągu udowodnimy ważne twierdzenia charakteryzujące RN.
Nośnik strategii mieszanej
INaczej mówiąc nosnik strategii
Jeżeli używamy dla strategii mieszanej notacji
Niech
- profil strategii mieszanych GS. Ustalmy gracza
(3.1) |
Tak więc w RN każdy gracz ma jednakowe wypłaty ze wszystkich strategii czystych z nośnika swojej strategii mieszanej którą gra w RN.
ad absurdum. Niech
(3.2) |
Definiujemy profil
taki że
gdzie
Pokażemy że
(3.3) |
czyli sprzeczność z definicją RN. Lewa strona tej nierówności ma postać:
(3.4) | ||||
(3.5) |
Prawa strona nierówności
(3.6) | ||||
(3.7) |
a zatem z (3.2) otrzymujemy
Wypłata każdego gracza w RN jest równa jego wypłacie z profilu w którym gracz ten gra dowolną strategią czystą z nośnika swojej strategii w RN, a pozostali gracze grają swoimi strategiami z RN. Mowi o tym
Niech
- profil strategii mieszanych GS w RN. Wypłata każdego gracza
(3.8) |
Mówimy, że w RN wypłata gracza jest równa wypłacie z dowolnej granej przez niego w RN strategii czystej.
Gracz
Korzystając z liniowości
(z Twierdzenia 3.1), oznaczając
Poniżej udowodnimy twierdzenie które pozwala znaleźć RN jeśli jest spełniony warunek dostateczny, oraz daje charakterystykę RN jako warunek konieczny.
Warunek 1. jest identyczny z Twierdzeniem 3.1.
Warunek 2.: ad absurdum: w przeciwnym razie mielibyśmy
Z Wniosku (3.1), w RN dla
a zatem otrzymujemy
Ustalmy gracza
Oznaczmy, pomijając dla uproszczenia notacji w obu symbolach indeks
gdzie zastosowaliśmy zapis
Pierwsza suma po prawej stronie ma (z warunku 1.) postać:
gdzie
gdzie
Zauważmy że dla obu profili
a więc
Wykorzystując warunek 1. (do zamiany
gdzie ostatnia równość wynika z liniowości wypłat. Otrzymaliśmy więc
Powyższe rozumowanie przeprowadzamy
Pokażemy przykład zastosowania Twierdzenia LABEL:waz1.
L | C | R | |
---|---|---|---|
T | 3,3 | 1,1 | |
M | 0,0 | 0,0 | 2, |
B | 5,1 | 0, 7 |
Porównamy wypłaty ze strategii czystych i zastosujemy Twierdzenie LABEL:waz1.
Obliczamy wypłaty ze strategii czystych gdy profil przeciwnika jest z RN. Dla gracza
Wypłata z
Wypłata z
Wypłata z
Wypłaty ze strategii czystych z
Warunki dostateczne na RN (dla drugiego gracza jest potrzebny tylko warunek 1) są więc spełnione.
∎Uwaga: Jeśli w drugim wierszu zamienimy 2 na 3 to powyższy profil nie będzie RN bo
A oto jeszcze jedna charakterystyka RN dająca w szczególności warunek dostateczny istnienia RN.
Profil
(3.9) | ||||
(3.10) |
Istotną rolę w teorii gier strategicznych odgrywa ścisła RN.
Profil
RN jest SRN gdy strategia każdego gracza w RN jest JEDYNĄ najlepszą odpowiedzią na strategie wszystkich innych graczy w RN (definicja najlepszej odpowiedzi będzie podana w następnym rozdziale).
Mówimy że skończona GS jest generyczna jeśli
Zachodzi:
SRN jest RN w strategiach czystych
Wsk. W przeciwnym razie w RN nośnik strategii
SRN nie musi istnieć. Przykład: Gra Orzeł-Reszka.
RN w strategiach czystych nie musi być SRN. Przykład: W grze
A | B | |
---|---|---|
A | 1,1 | 0,0 |
B | 0,0 | 0,0 |
(A,A) jest SRN, (B,B) nie.
Nawet gdy GS ma dokładnie jedną RN, to ta RN nie musi być SRN. Przykład: w grze
A | B | C | |
---|---|---|---|
D | 1,1 | 1,0 | 0,1 |
E | 1,0 | 0,1 | 1,0 |
W Słabym Dylemacie Więźnia nie ma SRN. To że mieszane strategie nie są SRN wynika ze Stwierdzeniaq 3.3. Bezpośredni rachunek pokazuje że żadna z 3 czystych Rn nie jest SRN.
Profil
”Większość” gier skończonych ma nieparzystą liczbę RN.
Przykładem sa gry 2–osobowe dla których
Oto ”kontrprzykład”: GS z czterema RN ([33]):
A | B | C | |
---|---|---|---|
D | 0,0 | -1,-1 | -1,-1 |
E | -1,-1 | -1,-1 | -1,-1 |
E | -1,-1 | -1,-1 | 0,0 |
(poza trzema czystymi RN jest ”częściowo mieszana” RN
Innym ”kontrprzykładem” jest gra ”Słaby Dylemat Więźnia”, która jest modyfikacją DW z wypłatą
C | D | |
---|---|---|
C | R,R | S,T |
D | T,S | S,S |
dla
W ekonomicznych zastosowaniach teorii gier istotną rolę odgrywa pojęcie Pareto-optymalności.
Profil gry strategicznej jest Pareto-optymalny (PO) jeżeli nie istnieje profil dający conajmniej jednemu graczowi wyższą, a wszystkim innym conajmniej taką samą wypłatę.
Profil gry jest Pareto-nieoptymalny jeżeli istnieje inny, lepszy dla conajmniej jednego gracza i nie gorszy dla żadnego (czyli gdy nie jest PO).
L | S | R | |
---|---|---|---|
U | 4,3 | 5,1 | 6,2 |
M | 2,1 | 8,4 | 3,6 |
D | 3,0 | 9,6 | 2,8 |
Gra koordynacyjna
A | B | |
---|---|---|
A | 2,2 | |
B | 1,1 |
ma 2 RN w strategiach czystych. RN (A,A) jest PO, ale, zakładając wypłaty np. w PLN, nie jest to ”przekonywujący” wybór w praktycznej realizacji.
W 2-osobowym DW profil (C,C) jest PO gdyż gdy jeden z graczy sobie podwyższy wypłatę to wypłata drugiego się obniży. (C,C) jest PO, ale nie jest RN. Profil (D,D) jest RN ale nie jest PO.
W ”Dylemacie Wspólnych Zasobów” (Tragedy of Commons) tzw. minimalna efektywna kooperacja (czyli profil w którym jest dokładnie tylu kooperantów ile wynosi ”próg” - minimalna liczba kooperantów przy której pula jest rozdzielana między wszystkich graczy) jest jedynym profilem PO.
Dla gier o sumie stałej (patrz część 5) każdy profil jest PO (bo nie istnieje profil dający conajmniej jednemu graczowi wyższą, a wszystkim innym conajmniej taką samą wypłatę).
Pokazać że DW nie ma innych równowag poza (D,D).
W strategiach czystych nie ma innych RN poza (D,D).
Gdyby miał równowagę ściśle mieszaną
Pokaż że w grze w Kota i Myszkę
Ogólniejsza postać gry ”W Kota i Myszkę”
L | P | |
---|---|---|
L | 0,K | M,0 |
P | M,0 | 0,K |
Obliczyć średnie wypłaty przy stosowaniu strategii mieszanych i znależć RN.
W grze
L | S | R | |
---|---|---|---|
U | 0,1 | 0,1 | 2,4 |
M | 5,1 | 2,2 | 1,0 |
D | 4,3 | 1,4 | 1,0 |
znależć RN i profile PO w strategiach czystych.
Odp.: (U,R): RN, PO. (M,S):RN ale nie PO. (D,L):PO ale nie RN.
Znaleźć RN w grze
L | S | R | |
---|---|---|---|
U | 1,3 | 1,3 | 1,3 |
M | 0,0 | 2,2 | 2,2 |
D | 0,0 | 0,0 | 3,1 |
GS jest o sumie zerowej jeżeli
Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.
strona główna | webmaster | o portalu | pomoc
© Wydział Matematyki, Informatyki i Mechaniki UW, 2009-2010. Niniejsze materiały są udostępnione bezpłatnie na licencji Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska.
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.
Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.