Wprowadzamy oznaczenia
.
Gra strategiczna jest to trójka
Używa się też terminów: gra w postaci strategicznej, gra w postaci normalnej, gra niekooperacyjna.
Oznaczamy
Niekiedy, chcąc wyróżnić gracza , np. by porównywać wartości funkcji wypłat w profilach w których zmieniamy jedną współrzędna,
będziemy profil zapisywali w postaci
, gdzie
oznacza ciąg wyrazów profilu
dla wszystkich graczy poza
:
. Konsekwentnie oznaczamy
Tam gdzie nie będzie wątpliwości, będziemy utożsamiać akcję ze strategią. W ogólności, dla wielu typów gier strategia to scenariusz, plan działań, akcji na wszystkie możliwe sytuacje. Odpowiednie formalne definicje będą podane w dalszych rozdziałach.
Ogólniejsza definicja gry strategicznej wprowadza pojęcie wynikow gry i zastepuje funkcje wypłat graczy przez relacje preferencji na zbiorze wyników gry. W tym wykładzie relacje preferencji specyfikujemy przez podanie funkcji użyteczności - funkcji wypłat, które te relacje określają. Więcej na ten temat - patrz np. [13, 16, 20, 14].
,
. Niech
- profil
strategii czystych,
- wyplata gracza
z profilu
,
W ogólności
zbiory
mogą być zbiorami różnych strategii. Zbiory
mają po
elementów, które tworzą
elementowe macierze - macierze wypłat
graczy. Niech
oznacza macierz wypłat gracza 1,
–gracza 2:
![]() |
Numer wiersza odpowiada numerowi strategii gracza 1, numer kolumny - numerowi strategii gracza 2.
Jako szczególny przypadek Przykładu 2.1 przyjmijmy
oraz
,
Macierze
wypłat gracza 1 i 2 mają postać odpowiednio
E | C | D |
---|---|---|
C | R | S |
D | T | P |
F | C | D |
---|---|---|
C | R | T |
D | S | P |
Będziemy używać łącznego zapisu
C | D | |
---|---|---|
C | R,R | S,T |
D | T,S | P,P |
W szczególoności dla otrzymujemy Dylemat Więźnia, z oznaczeniami: C = Cooperation,
D = Defection.
Równowaga Nasha w strategiach czystych (RN) gry strategicznej
![]() |
jest to profil akcji (strategii czystych) t. że
![]() |
Okazuje się że wiele gier nie ma RN w strategiach czystych, np. gra Orzeł - Reszka z Przykładu 1.4.
Rozważmy grę ”W Kotka i Myszkę” z Przykładu 1.5, o macierzy wypłat
L | P | |
---|---|---|
L | 0,2 | 1,0 |
P | 1,0 | 0,2 |
gdzie myszka (M) jest graczem wierszowym, kot (K) - graczem kolumnowym i nie ma RN w strategiach czystych.
Rozważmy intuicyjny sposób wprowadzenia strategii mieszanych. Niech M wybiera akcję L z prawdopodobieństwem ,
P z
, K wybiera L z p-stwem
, P z
.
Nazwijmy pary
strategiami mieszanymi odpowiednio M i K.
Można pokazać że para strategii
ma tę własność że oczekiwana wartość wypłaty M (K)
nie podniesie się (w istocie–nie ulegnie zmianie, co będzie wynikało z ogólnej teorii przedstawionej w
następnej części) jeżeli dowolnie zmienimy
(patrz Ćwiczenie 3.2, Ćwiczenie 3.3 ).
Można więc nazwać tę parę równowagą Nasha dla strategii mieszanych.
GS jest skończona jeżeli .
W dalszym ciągu, o ile nie będzie to powiedziane explicite inaczej, będziemy rozważać gry skończone. Definiujemy
Strategia mieszana gracza
w grze strategiczej
jest to rozkład prawdopodobieństwa na zbiorze jego strategii czystych
:
![]() |
Współrzędna jest prawdopodobieństwem że gracz
zagra strategią czystą
(wybierze akcję)
. Wprowadzamy oznaczenia:
–
zbiór strategii mieszanych gracza
– zbiór wszystkich profili gry
- profil strategii wszystkich graczy poza graczem
.
W dalszym ciągu zamiast strategia mieszana będziemy mówić strategia. Strategia czysta jest szczególnym przypadkiem strategii mieszanej; czasami gdy będziemy chcieli podkreślić że mamy do czynienia ze strategią czystą będziemy zamiast strategia mówić strategia czysta.
Strategie mieszane opisują sytuacje w których gracze podejmują akcje z pewnym prawdopodobieństwem. Można sobie wyobrażać że każdy gracz posiada urządzenie dające rozkład p-stwa określający jego strategię mieszaną i używaja tego urządzenia do gry.
Alternatywna interpretacja strategii mieszanych jest następująca. Każdemu graczowi odpowiada jedna ”bardzo duża” populacja graczy. Częstość występowania w niej graczy grających każdą z akcji ze zbioru jest równa p-stwu występowania tej akcji w strategii mieszanej. Gracz
losuje z tej populacji jednego gracza i gra jego strategią.
Każda strategia mieszana każdego gracza
jest opisana przez wektor
pewien wektor
w przestrzeni euklidesowej
Będziemy używać alternatywnie zapisu:
oraz, gdy będziemy chcieli
podkreślić algebraiczną strukture wprowadzanego formalizmu, powyższej
reprezentacji
. Profil
gry będziemy alternatywnie oznaczać przex
,
Z definicji rozkładu p-stwa mamy
![]() |
Współrzędna jest prawdopodobieństwem że gracz
zagra strategią czystą (wybierze akcję)
.
Niech , czyli zbiór akcji jest ten sam dla wszystkich graczy. GS jest
symetryczna
zachodzi
![]() |
Mówimy że GS jest symetryczna jeżeli wypłaty każdych dwóch graczy nie ulegają zmianie przy zamianie ról tych graczy.
Dla n=2 i gry symetrycznej , macierze wypłat graczy są transponowane.
Ogólniej, dla n=2 symetria sprowadza sie do stwierdzenia że macierze wypłat są kwadratowe
i jedna powstaje z drugiej przez transpozycję.
Wypłaty graczy z profili strategii mieszanych.
Dla każdego gracza definiujemy
- sympleks jednostkowy gracza
(sympleks strategii
mieszanych gracza
) oraz
- sympleks strategii mieszanych GS:
![]() |
![]() |
Tak więc elementy sympleksu jednostkowego gracza utożsamiamy z jego strategiami mieszanymi. Zbiory
są zwarte i wypukłe, co bedzie w szczegolności odgrywało rolę w dowodzie
istnienia równowagi Nasha.
Dla
sympleksy obu graczy są odcinkami o długości
. Dla
sympleksy obu graczy są trójkątami równobocznymi.
Strategia czysta jest szczególnym przypadkiem strategii mieszanej. Oznaczając
![]() |
(2.1) |
- -ty wersor w
,
możemy zapisać wektorową reprezentację profilu
w nastepujący sposób:
![]() |
(2.2) |
Można powiedzieć że wektor jest strategią (mieszaną) gracza
przypisującą akcji o numerze
ze
zbioru
prawdopodobieństwo 1,
jest
-tą strategią czystą gracza
.
Dla każdego gracza
wierzchołki sympleksu
są to elementy bazy kanonicznej
przestrzeni wektorowej
.
Rozważmy . Założenie że każdy gracz podejmuje decyzję o wyborze akcji ”niezależnie”, bez wiedzy o wyborze innych graczy, formalizujemy w postaci tzw. postulatu niezależności stochastycznej.
Niech - profil strategii czystych GS. Postulat niezależności statystycznej mówi że (łączne) p-stwo że 1-y gracz wybierze akcję (zagra)
, …,
-ty zagra
jest dane wyrażeniem
![]() |
gdzie jest p-stwem że gracz
zagra
.
W ten sposób każdemu profilowi strategii czystych gry GS przyporządkowaliśmy liczbę
. Zachodzi przy tym
![]() |
(2.3) |
Dla każdego gracza procedura ta definiuje na zbiorze
profili strategii czystych gry pewną zmienna losową
o rozkładzie
![]() |
(2.4) |
gdzie jest wypłatą gracza
z profilu
, natomiast
jest zdefiniowanym wyżej prawdopodobieństwem zagrania tego profilu.
Wypłata gracza z profilu strategii mieszanych
jest to wartość oczekiwana zmiennej losowej
:
![]() |
W dalszym ciagu będziemy na ogół zastępować przez
, oraz pomijać jedną parę nawiasów
tam gdzie nie budzi to wątpliwości. Np. zamiast
będziemy pisać
Funkcje wypłat są liniowe względem poszczególnych współrzędnych profilu gry (w dalszym ciagu będziemy używali zwrotu: wypłaty są liniowe). Mówi o tym
O liniowości wypłat względem każdej współrzednej pofilu
![]() |
(2.5) |
Wykorzystując postulat niezależności statystycznej []
prawą stronę przepisujemy w postaci
![]() |
Lewa strona ma postać
![]() |
Wyciągając z
przed ”wewnętrzną” sumę i pamiętając że
otrzymujemy tezę.
W szczególności dla otrzymujemy wykorzystywana w dalszych rozważaniach równość
![]() |
N=2. Oznaczmy - macierze wypłat odpowiednio gracza 1,2. Wypłata gracza 1 z profilu
:
![]() |
Analogicznie dla drugiego gracza W szczególności dla gry symetrycznej, tzn.
gdy
, czyli
.
Uwaga:
oznacza profil
, a nie profil
.
W szczególności, dla
mamy
, ale formalny zapis
jest to wartość funkcji wypłat
na profilu (w punkcie)
a nie na
Rozszerzenie mieszane skończonej gry strategicznej jest to trójka
![]() |
W dalszym ciągu rozszerzenie mieszane także oznaczamy skrótem .
Strategia ściśle dominuje strategię
jeżeli
![]() |
Strategia słabo dominuje strategię
jeżeli
![]() |
oraz istnieje podprofil dla którego powyższa nierówność jest ostra.
Mówimy że odpowiednie strategie sa ściśle (słabo) zdominowane przez powyższe strategie
. Strategia jest słabo zdominowana jeżeli istnieje inna która ją słabo dominuje.
W DW (czysta) strategia D (i.e. ) ściśle dominuje każdą inną strategię gracza
.
W Słabym DW
C | D | |
---|---|---|
C | R,R | S,T |
D | T,S | S,S |
strategia
nie dominuje ściśle strategii
gracza. Mamy bowiem np. dla
–ego gracza, oznaczając
:
a zatem dla czyli dla
, zachodzi równość
.
W Słabym DW (czysta) strategia słabo dominuje strategię
1–go gracza. Mamy bowiem, dla
z liniowości,
![]() |
oraz :
![]() |
Scisła dominacja implikuje słabą dominację.
Strategia dominuje strategię
jeżeli
![]() |
Strategia mieszana która dominuje każdą strategię czystą danego gracza, dominuje każdą strategię nieszaną tego gracza.
W szczególności strategia czysta która dominuje każdą inną strategię czystą danego gracza, dominuje każdą strategię nieszaną tego gracza. Dowód wynikający z liniowości wypłat, pomijamy.
Strategia ściśle zdominowana nie może wystepować w profilu równowagowym (”nie może być grana w równowadze”), gdyż gracz grający tą strategią mógłby podwyższyć swą wypłatę zmieniając ją na ścisle dominującą.
Usuwając ze zbioru strategii gracza strategię ściśle zdominowaną nie zmieniamy zbioru równowag Nasha. Jeżeli metoda eliminacji strategii ściśle zdominowanych prowadzi do jednego profilu gry, to jest on RN. Nie jest to prawda w przeciwną stronę - w wielu GS istnieją jednoznaczne RN które nie mogą być uzyskane tą metodą.
Algorytm usuwania strategii ściśle zdominowanych ( wynik nie zależy od kolejności usuwania):
1. Jeśli nie istnieje gracz który ma strategię ściśle zdominowaną, to stop. W przeciwnym razie przejdź do p. 2.
2. Usuń tę strategię i powróć do punktu 1.
L | S | R | |
---|---|---|---|
U | 4,3 | 5,1 | 6,2 |
M | 2,1 | 8,4 | 3,6 |
D | 3,0 | 9,6 | 2,8 |
Strategia R ściśle dominuje S, po usunięciu S strategia U ściśle dominuje M i D, po ich usunięciu L ściśle dominuje R. RN to profil (U,L).
Strategia czysta, jeśli nawet nie jest ścisle zdominowana przez żadną inną czystą, może być ściśle zdominowana przez mieszana, jak pokazuje
L | R | |
---|---|---|
U | 2,0 | -1,0 |
M | 0,0 | 0,0 |
D | -1,0 | 2,0 |
M nie jest ściśle zdominowana ani przez R ani D, natomiast jest ściśle zdominowana przez strategię
.
Strategia która nie jest strategią czystą nie może być strategią ściśle dominującą.
Dowód pozostawiamy czytelnikowi jako ćwiczenie.
Znależć wszystkie strategie słabo zdominowane i ściśle zdominowane w Słabym Dylemacie Więźnia.
Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.
strona główna | webmaster | o portalu | pomoc
© Wydział Matematyki, Informatyki i
Mechaniki UW, 2009-2010. Niniejsze materiały są udostępnione bezpłatnie na licencji Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska.
Projekt współfinansowany przez Unię Europejską w ramach
Europejskiego Funduszu Społecznego.
Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.