Wprowadzamy oznaczenia
.
Gra strategiczna jest to trójka
Używa się też terminów: gra w postaci strategicznej, gra w postaci normalnej, gra niekooperacyjna.
Oznaczamy
Niekiedy, chcąc wyróżnić gracza , np. by porównywać wartości funkcji wypłat w profilach w których zmieniamy jedną współrzędna, będziemy profil zapisywali w postaci , gdzie oznacza ciąg wyrazów profilu dla wszystkich graczy poza : . Konsekwentnie oznaczamy
Tam gdzie nie będzie wątpliwości, będziemy utożsamiać akcję ze strategią. W ogólności, dla wielu typów gier strategia to scenariusz, plan działań, akcji na wszystkie możliwe sytuacje. Odpowiednie formalne definicje będą podane w dalszych rozdziałach.
Ogólniejsza definicja gry strategicznej wprowadza pojęcie wynikow gry i zastepuje funkcje wypłat graczy przez relacje preferencji na zbiorze wyników gry. W tym wykładzie relacje preferencji specyfikujemy przez podanie funkcji użyteczności - funkcji wypłat, które te relacje określają. Więcej na ten temat - patrz np. [13, 16, 20, 14].
, . Niech - profil strategii czystych, - wyplata gracza z profilu , W ogólności zbiory mogą być zbiorami różnych strategii. Zbiory mają po elementów, które tworzą elementowe macierze - macierze wypłat graczy. Niech oznacza macierz wypłat gracza 1, –gracza 2:
Numer wiersza odpowiada numerowi strategii gracza 1, numer kolumny - numerowi strategii gracza 2.
Jako szczególny przypadek Przykładu 2.1 przyjmijmy
oraz
,
Macierze wypłat gracza 1 i 2 mają postać odpowiednio
E | C | D |
---|---|---|
C | R | S |
D | T | P |
F | C | D |
---|---|---|
C | R | T |
D | S | P |
Będziemy używać łącznego zapisu
C | D | |
---|---|---|
C | R,R | S,T |
D | T,S | P,P |
W szczególoności dla otrzymujemy Dylemat Więźnia, z oznaczeniami: C = Cooperation, D = Defection.
Równowaga Nasha w strategiach czystych (RN) gry strategicznej
jest to profil akcji (strategii czystych) t. że
Okazuje się że wiele gier nie ma RN w strategiach czystych, np. gra Orzeł - Reszka z Przykładu 1.4.
Rozważmy grę ”W Kotka i Myszkę” z Przykładu 1.5, o macierzy wypłat
L | P | |
---|---|---|
L | 0,2 | 1,0 |
P | 1,0 | 0,2 |
gdzie myszka (M) jest graczem wierszowym, kot (K) - graczem kolumnowym i nie ma RN w strategiach czystych.
Rozważmy intuicyjny sposób wprowadzenia strategii mieszanych. Niech M wybiera akcję L z prawdopodobieństwem , P z , K wybiera L z p-stwem , P z . Nazwijmy pary strategiami mieszanymi odpowiednio M i K. Można pokazać że para strategii ma tę własność że oczekiwana wartość wypłaty M (K) nie podniesie się (w istocie–nie ulegnie zmianie, co będzie wynikało z ogólnej teorii przedstawionej w następnej części) jeżeli dowolnie zmienimy (patrz Ćwiczenie 3.2, Ćwiczenie 3.3 ).
Można więc nazwać tę parę równowagą Nasha dla strategii mieszanych.
GS jest skończona jeżeli .
W dalszym ciągu, o ile nie będzie to powiedziane explicite inaczej, będziemy rozważać gry skończone. Definiujemy
Strategia mieszana gracza w grze strategiczej jest to rozkład prawdopodobieństwa na zbiorze jego strategii czystych :
Współrzędna jest prawdopodobieństwem że gracz zagra strategią czystą (wybierze akcję) . Wprowadzamy oznaczenia:
– zbiór strategii mieszanych gracza
– zbiór wszystkich profili gry
- profil strategii wszystkich graczy poza graczem .
W dalszym ciągu zamiast strategia mieszana będziemy mówić strategia. Strategia czysta jest szczególnym przypadkiem strategii mieszanej; czasami gdy będziemy chcieli podkreślić że mamy do czynienia ze strategią czystą będziemy zamiast strategia mówić strategia czysta.
Strategie mieszane opisują sytuacje w których gracze podejmują akcje z pewnym prawdopodobieństwem. Można sobie wyobrażać że każdy gracz posiada urządzenie dające rozkład p-stwa określający jego strategię mieszaną i używaja tego urządzenia do gry. Alternatywna interpretacja strategii mieszanych jest następująca. Każdemu graczowi odpowiada jedna ”bardzo duża” populacja graczy. Częstość występowania w niej graczy grających każdą z akcji ze zbioru jest równa p-stwu występowania tej akcji w strategii mieszanej. Gracz losuje z tej populacji jednego gracza i gra jego strategią.
Każda strategia mieszana każdego gracza jest opisana przez wektor pewien wektor w przestrzeni euklidesowej Będziemy używać alternatywnie zapisu: oraz, gdy będziemy chcieli podkreślić algebraiczną strukture wprowadzanego formalizmu, powyższej reprezentacji . Profil gry będziemy alternatywnie oznaczać przex , Z definicji rozkładu p-stwa mamy
Współrzędna jest prawdopodobieństwem że gracz zagra strategią czystą (wybierze akcję) .
Niech , czyli zbiór akcji jest ten sam dla wszystkich graczy. GS jest symetryczna zachodzi
Mówimy że GS jest symetryczna jeżeli wypłaty każdych dwóch graczy nie ulegają zmianie przy zamianie ról tych graczy.
Dla n=2 i gry symetrycznej , macierze wypłat graczy są transponowane. Ogólniej, dla n=2 symetria sprowadza sie do stwierdzenia że macierze wypłat są kwadratowe i jedna powstaje z drugiej przez transpozycję.
Wypłaty graczy z profili strategii mieszanych.
Dla każdego gracza definiujemy - sympleks jednostkowy gracza (sympleks strategii mieszanych gracza ) oraz - sympleks strategii mieszanych GS:
Tak więc elementy sympleksu jednostkowego gracza utożsamiamy z jego strategiami mieszanymi. Zbiory są zwarte i wypukłe, co bedzie w szczegolności odgrywało rolę w dowodzie istnienia równowagi Nasha.
Dla sympleksy obu graczy są odcinkami o długości . Dla sympleksy obu graczy są trójkątami równobocznymi.
Strategia czysta jest szczególnym przypadkiem strategii mieszanej. Oznaczając
(2.1) |
- -ty wersor w , możemy zapisać wektorową reprezentację profilu w nastepujący sposób:
(2.2) |
Można powiedzieć że wektor jest strategią (mieszaną) gracza przypisującą akcji o numerze ze zbioru prawdopodobieństwo 1, jest -tą strategią czystą gracza . Dla każdego gracza wierzchołki sympleksu są to elementy bazy kanonicznej przestrzeni wektorowej .
Rozważmy . Założenie że każdy gracz podejmuje decyzję o wyborze akcji ”niezależnie”, bez wiedzy o wyborze innych graczy, formalizujemy w postaci tzw. postulatu niezależności stochastycznej.
Niech - profil strategii czystych GS. Postulat niezależności statystycznej mówi że (łączne) p-stwo że 1-y gracz wybierze akcję (zagra) , …, -ty zagra jest dane wyrażeniem
gdzie jest p-stwem że gracz zagra .
W ten sposób każdemu profilowi strategii czystych gry GS przyporządkowaliśmy liczbę . Zachodzi przy tym
(2.3) |
Dla każdego gracza procedura ta definiuje na zbiorze profili strategii czystych gry pewną zmienna losową o rozkładzie
(2.4) |
gdzie jest wypłatą gracza z profilu , natomiast jest zdefiniowanym wyżej prawdopodobieństwem zagrania tego profilu.
Wypłata gracza z profilu strategii mieszanych jest to wartość oczekiwana zmiennej losowej :
W dalszym ciagu będziemy na ogół zastępować przez , oraz pomijać jedną parę nawiasów tam gdzie nie budzi to wątpliwości. Np. zamiast będziemy pisać
Funkcje wypłat są liniowe względem poszczególnych współrzędnych profilu gry (w dalszym ciagu będziemy używali zwrotu: wypłaty są liniowe). Mówi o tym
O liniowości wypłat względem każdej współrzednej pofilu
(2.5) |
Wykorzystując postulat niezależności statystycznej [] prawą stronę przepisujemy w postaci
Lewa strona ma postać
Wyciągając z przed ”wewnętrzną” sumę i pamiętając że otrzymujemy tezę.
∎W szczególności dla otrzymujemy wykorzystywana w dalszych rozważaniach równość
N=2. Oznaczmy - macierze wypłat odpowiednio gracza 1,2. Wypłata gracza 1 z profilu :
Analogicznie dla drugiego gracza W szczególności dla gry symetrycznej, tzn. gdy , czyli .
Uwaga: oznacza profil , a nie profil . W szczególności, dla mamy , ale formalny zapis jest to wartość funkcji wypłat na profilu (w punkcie) a nie na
Rozszerzenie mieszane skończonej gry strategicznej jest to trójka
W dalszym ciągu rozszerzenie mieszane także oznaczamy skrótem .
Strategia ściśle dominuje strategię jeżeli
Strategia słabo dominuje strategię jeżeli
oraz istnieje podprofil dla którego powyższa nierówność jest ostra.
Mówimy że odpowiednie strategie sa ściśle (słabo) zdominowane przez powyższe strategie . Strategia jest słabo zdominowana jeżeli istnieje inna która ją słabo dominuje.
W DW (czysta) strategia D (i.e. ) ściśle dominuje każdą inną strategię gracza .
W Słabym DW
C | D | |
---|---|---|
C | R,R | S,T |
D | T,S | S,S |
strategia nie dominuje ściśle strategii gracza. Mamy bowiem np. dla –ego gracza, oznaczając :
a zatem dla czyli dla , zachodzi równość .
W Słabym DW (czysta) strategia słabo dominuje strategię 1–go gracza. Mamy bowiem, dla z liniowości,
oraz :
Scisła dominacja implikuje słabą dominację.
Strategia dominuje strategię jeżeli
Strategia mieszana która dominuje każdą strategię czystą danego gracza, dominuje każdą strategię nieszaną tego gracza.
W szczególności strategia czysta która dominuje każdą inną strategię czystą danego gracza, dominuje każdą strategię nieszaną tego gracza. Dowód wynikający z liniowości wypłat, pomijamy.
Strategia ściśle zdominowana nie może wystepować w profilu równowagowym (”nie może być grana w równowadze”), gdyż gracz grający tą strategią mógłby podwyższyć swą wypłatę zmieniając ją na ścisle dominującą.
Usuwając ze zbioru strategii gracza strategię ściśle zdominowaną nie zmieniamy zbioru równowag Nasha. Jeżeli metoda eliminacji strategii ściśle zdominowanych prowadzi do jednego profilu gry, to jest on RN. Nie jest to prawda w przeciwną stronę - w wielu GS istnieją jednoznaczne RN które nie mogą być uzyskane tą metodą.
Algorytm usuwania strategii ściśle zdominowanych ( wynik nie zależy od kolejności usuwania):
1. Jeśli nie istnieje gracz który ma strategię ściśle zdominowaną, to stop. W przeciwnym razie przejdź do p. 2.
2. Usuń tę strategię i powróć do punktu 1.
L | S | R | |
---|---|---|---|
U | 4,3 | 5,1 | 6,2 |
M | 2,1 | 8,4 | 3,6 |
D | 3,0 | 9,6 | 2,8 |
Strategia R ściśle dominuje S, po usunięciu S strategia U ściśle dominuje M i D, po ich usunięciu L ściśle dominuje R. RN to profil (U,L).
Strategia czysta, jeśli nawet nie jest ścisle zdominowana przez żadną inną czystą, może być ściśle zdominowana przez mieszana, jak pokazuje
L | R | |
---|---|---|
U | 2,0 | -1,0 |
M | 0,0 | 0,0 |
D | -1,0 | 2,0 |
M nie jest ściśle zdominowana ani przez R ani D, natomiast jest ściśle zdominowana przez strategię .
Strategia która nie jest strategią czystą nie może być strategią ściśle dominującą.
Dowód pozostawiamy czytelnikowi jako ćwiczenie.
Znależć wszystkie strategie słabo zdominowane i ściśle zdominowane w Słabym Dylemacie Więźnia.
Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.
strona główna | webmaster | o portalu | pomoc
© Wydział Matematyki, Informatyki i Mechaniki UW, 2009-2010. Niniejsze materiały są udostępnione bezpłatnie na licencji Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska.
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.
Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.