Dwuosobowe gry o sumie zerowej (ogólniej: o sumie stałej) byly–chronologicznie–pierwszym typem gier rozważanym przez natematyków, w szczególności w pracach J. von Neumanna w latach 20ych i 30ych XX wieku. Gry o sumie zerowej były podstawą opracowanej przez J. von Neumanna i O. Morgensterna matematycznej teorii gier [16].
GS jest grą o sumie stałej jeżeli
Jeśli to GS nazywamy grą o zumie zerowej i oznaczamy GS0.
Gry dwuosobowe (n=2) o sumie zero nazywa się też grami ściśle konkurencyjnymi. Nazwa gry ściśle konkurencyjne wynika stąd że w takich grach interesy graczy są ”ściśle przeciwstawne”: aby uzyskać maksymalną wypłatę gracz dąży do tego by zminimalizować sumę wypłat przeciwników. W takich grach gracze mają przeciwne wypłaty:
Do takich gier można zaklasyfikować (pomijając remisy) gry towarzyskie (parlor games): szachy, GO, warcaby, klasyczne dwuosobowe gry karciane. ”Teoriogrowe” przykłady ściśle konkurencyjnych GS to: gra Kamień-Papier-Nożyczki, Orzeł-Reszka.
Skończone gry dwuosobowe o sumie zerowej nazywa się też grami macierzowymi.
Możemy sformułować równoważną definicję GS o sumie stałej używając strategii mieszanych: GS jest grą o sumie stałej jeżeli
Równoważność wynika z liniowości funkcji wypłat względem poszczególnych argumentów profilu GS0.
Wszystkie poniższe definicje, o ile nie zostanie napisane inaczej, odnoszą sie do GS0.
Wypłaty w takich grach możeny zapisać w formie macierzowej:
gdzie profil jest wektorem wierszowym, - wektorem kolumnowym.
Zdefiniujemy dwie liczby: : maximin, oraz : minimax.
nazywamy też odpowiednio dolną i górna wartością GS0.
Gdy zastąpimy w tej definicji przez , czyli weźmiemy pod uwagę tylko strategie czyste, to w celu obliczenia bierzemy minimum z każdego wiersza macierzy wypłat gracza 1 i z tak uzyskanej kolumny znajdujemy maksimum.
Heurystycznie, maximin jest maksymalną wypłatą gracza 1 gdy gracz 2 minimalizuje wypłaty gracza 1. Dokładniej: dla każdego profilu gracz 1 znajduje profil który minimalizuje a ”następnie” 1 swoimi profilami maksymalizuje . Otrzymana wartość to maximin; minimax jest wynikiem procedury optymalizacyjnej gracza 2, który wpierw maksymalizuje profilami przy ustalonym , a następnie minimalizuje swoimi profilami .
Zauważmy że można zdefiniować dla dowolnych (niekoniecznie o sumie zero) dwuosobowych GS.
Profil jest punktem siodłowym jeżeli
Wypłatę nazwiemy wartością gry (w punkcie siodłowym, saddle point value of the game).
Ponieważ
więc, z uwagi na , mamy
a zatem punkt siodłowy GS0 jest RN GS0.
Sformułujemy podstawowe twierdzenie dla rozważanych gier.
Dla każdej 2-osobowej skończonej GS o sumie zerowej
1. Istnieje punkt siodłowy.
2. Istnieje taka że , patrz Definicja 5.2.
3. Jeżeli jest punktem siodłowym to .
4. jest punktem siodłowym wtedy i tylko wtedy gdy
oraz
Punkt 1 jest szczególnym ptzypadkiem Twieredzenia Nasha.
Punkt 2. mówi że w dwuosobowych GS0 maximin i minimaks są sobie równe.
Punkt 3. mówi że jest taka sama we wszystkich punktach siodłowych. W każdym punkcie siodłowym są jednocześnie spełnione najbardziej pesymistyczne przewidywania obu graczy. Gracz 1 otrzymuje wypłatę , gracz 2 otrzymuje wypłatę .
Punkt 4 mówi że w punkcie siodłowym gracz 1 gra strategią maximinową, gracz 2-i minimaksową.
1. Jest to szczególny przypadek twierdenia Nasha o istnieniu. Oryginalny dowód von Neumanna korzystał z innych technik matematycznych.
2. Wykażemy wpierw że . Niech . Zachodzi
(5.1) |
Działając na powyższą nierówność operatorem otzymujemy
(5.2) |
Nierówność ta zachodzi dla każdego . Działając na powyższą nierówność operatorem otzymujemy
(5.3) |
co dowodzi nierowności .
Pokażemy teraz że . Wykorzystamy fakt istnienia RN. Niech będzie RN, czyli
(5.4) |
oraz
(5.5) |
Zachodzi też
(5.6) |
Ponieważ, na mocy (5.5)
(5.7) |
więc
(5.8) |
Z uwagi na (5.4) mamy
(5.9) |
a więc
(5.10) |
Wykazaliśmy i , a zatem równość
3. Punkt 3 jest bezpośrednia konsekwencją powyższej równości. W każdej równowadze mamy więc:
Dla gracza 1:
(5.11) |
a dla gracza 2
(5.12) |
Punkt 4 zostawiamy czytelnikowi jako ćwiczenie.
∎Liczbę nazywamy wartością (value) dwuosobowej GS o sumie zerowej.
Wartość ściśle konkurencyjnej GS0 jest to więc wypłata gracza 1 w punkcie siodłowym.
Strategia gracza rozwiązująca problem
nazywa sie strategią maksyminową gracza .
Jeżeli to (każdy) profil , gdzie jest strategią maksyminową gracza jest punktem siodłowym.
Znajdziemy strategię maksyminową i wypłatę ze strategii maksyminowej gracza 1 (wierszowego) w grze Orzeł – Reszka.
B | S | |
---|---|---|
B | 1,-1 | -1,1 |
S | -1,1 | 1,-1 |
Niech . Obliczamy
Przy ustalonym : dla przyjmuje minimum dla , wynosi ono . Dla minimum wynosi 0. Dla minimum jest dla i jest mniejsze od zera. Tak więc strategia maksyminowa to profil z wypłatą 0. Analogicznie postępujemy dla gracza 2.
W każdej RN GS0 gracze otrzymują takie same (przeciwne co do znaku) wypłaty. Zachodzi też interesująca własność ”wymienności równowag” (equilibrium interchangeability). W 2-osobowych GS o sumie zerowej jeżeli gracz 1 wybierze swój profil z pewnej RN a drugi gracz wybierze swój z innej RN, to para tych profili też jest RN. Mówi o tym
Niech - dwie RN dwuosobowej GS o sumie zerowej. Wtedy profile też są RN.
Niech - wartość gry. W RN , ponieważ suma wypłat graczy jest zero oraz
(a zatem ), więc otrzymujemy
Podstawiając otrzymujemy obustronne oszacowanie
gdzie równość wynika z faktu że gra jest o sumie zerowej, a ostatnia nierówność z tego że jest RN. Wypłata została obustronnie oszacowana przez , a zatem zachodzi równość . Otrzymujemy
gdzie nierówność z faktu że jest RN. Mamy też
nierówność wynika z faktu że jesr RN. Mnożąc przez otrzymujemy stąd
a zatem
Profil jest więc RN. Analogicznie dowodzimy że profil jest RN.
∎Dla GS0 można podać efektywne algorytmy szukanie wartości gry za pomocą programowania liniowego, patrz np. monografia Luce, Reiffa [13].
W symetrycznej GS0 w mieszanej RN (jeżeli istnieje) zachodzi .
Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.
strona główna | webmaster | o portalu | pomoc
© Wydział Matematyki, Informatyki i Mechaniki UW, 2009-2010. Niniejsze materiały są udostępnione bezpłatnie na licencji Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska.
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.
Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.