Dwuosobowe gry o sumie zerowej (ogólniej: o sumie stałej) byly–chronologicznie–pierwszym typem gier rozważanym przez natematyków, w szczególności w pracach J. von Neumanna w latach 20ych i 30ych XX wieku. Gry o sumie zerowej były podstawą opracowanej przez J. von Neumanna i O. Morgensterna matematycznej teorii gier [16].
GS jest grą o sumie stałej jeżeli
![]() |
Jeśli
to GS nazywamy grą o zumie zerowej i oznaczamy GS0.
Gry dwuosobowe (n=2) o sumie zero nazywa się też grami ściśle konkurencyjnymi. Nazwa gry ściśle konkurencyjne wynika stąd że w takich grach interesy graczy są ”ściśle przeciwstawne”: aby uzyskać maksymalną wypłatę gracz dąży do tego by zminimalizować sumę wypłat przeciwników. W takich grach gracze mają przeciwne wypłaty:
Do takich gier można zaklasyfikować (pomijając remisy) gry towarzyskie (parlor games): szachy, GO, warcaby, klasyczne dwuosobowe gry karciane. ”Teoriogrowe” przykłady ściśle konkurencyjnych GS to: gra Kamień-Papier-Nożyczki, Orzeł-Reszka.
Skończone gry dwuosobowe o sumie zerowej nazywa się też grami macierzowymi.
Możemy sformułować równoważną definicję GS o sumie stałej używając strategii mieszanych: GS jest grą o sumie stałej jeżeli
![]() |
Równoważność wynika z liniowości funkcji wypłat względem poszczególnych argumentów profilu GS0.
Wszystkie poniższe definicje, o ile nie zostanie napisane inaczej, odnoszą sie do GS0.
Wypłaty w takich grach możeny zapisać w formie macierzowej:
gdzie profil
jest wektorem wierszowym,
- wektorem kolumnowym.
Zdefiniujemy dwie liczby:
: maximin, oraz
: minimax.
nazywamy też odpowiednio dolną i górna wartością GS0.
Gdy zastąpimy w tej definicji
przez
, czyli weźmiemy pod uwagę tylko strategie czyste,
to w celu obliczenia
bierzemy minimum z każdego wiersza macierzy wypłat gracza 1 i z tak uzyskanej kolumny znajdujemy maksimum.
Heurystycznie, maximin
jest maksymalną wypłatą gracza 1 gdy gracz 2 minimalizuje wypłaty
gracza 1.
Dokładniej: dla każdego profilu
gracz 1 znajduje profil
który minimalizuje
a ”następnie” 1
swoimi profilami
maksymalizuje
. Otrzymana wartość
to maximin; minimax
jest wynikiem
procedury optymalizacyjnej gracza 2, który wpierw maksymalizuje
profilami
przy ustalonym
,
a następnie minimalizuje
swoimi profilami
.
Zauważmy że
można zdefiniować dla dowolnych (niekoniecznie o sumie zero) dwuosobowych GS.
Profil
jest punktem siodłowym jeżeli
Wypłatę
nazwiemy wartością gry (w punkcie siodłowym, saddle point value of the game).
Ponieważ
więc, z uwagi na
, mamy
a zatem punkt siodłowy GS0 jest RN GS0.
Sformułujemy podstawowe twierdzenie dla rozważanych gier.
Dla każdej 2-osobowej skończonej GS o sumie zerowej
1. Istnieje punkt siodłowy.
2. Istnieje
taka że
, patrz Definicja 5.2.
3. Jeżeli
jest punktem siodłowym to
.
4.
jest punktem siodłowym wtedy i tylko wtedy gdy
oraz
Punkt 1 jest szczególnym ptzypadkiem Twieredzenia Nasha.
Punkt 2. mówi że w dwuosobowych GS0 maximin i minimaks są sobie równe.
Punkt 3. mówi że
jest taka sama we wszystkich punktach siodłowych. W każdym punkcie siodłowym są jednocześnie spełnione najbardziej pesymistyczne przewidywania obu graczy. Gracz 1 otrzymuje wypłatę
, gracz 2 otrzymuje wypłatę
.
Punkt 4 mówi że w punkcie siodłowym gracz 1 gra strategią maximinową, gracz 2-i minimaksową.
1. Jest to szczególny przypadek twierdenia Nasha o istnieniu. Oryginalny dowód von Neumanna korzystał z innych technik matematycznych.
2. Wykażemy wpierw że
. Niech
. Zachodzi
| (5.1) |
Działając na powyższą nierówność operatorem
otzymujemy
| (5.2) |
Nierówność ta zachodzi dla każdego
. Działając na powyższą nierówność operatorem
otzymujemy
| (5.3) |
co dowodzi nierowności
.
Pokażemy teraz że
. Wykorzystamy fakt istnienia RN. Niech
będzie RN, czyli
| (5.4) |
oraz
| (5.5) |
Zachodzi też
| (5.6) |
Ponieważ, na mocy (5.5)
| (5.7) |
więc
| (5.8) |
Z uwagi na (5.4) mamy
| (5.9) |
a więc
| (5.10) |
Wykazaliśmy
i
, a zatem równość ![]()
3. Punkt 3 jest bezpośrednia konsekwencją powyższej równości. W każdej równowadze mamy więc:
Dla gracza 1:
| (5.11) |
a dla gracza 2
| (5.12) |
Punkt 4 zostawiamy czytelnikowi jako ćwiczenie.
∎Liczbę
nazywamy wartością (value) dwuosobowej GS o sumie zerowej.
Wartość ściśle konkurencyjnej GS0 jest to więc wypłata gracza 1 w punkcie siodłowym.
Strategia
gracza
rozwiązująca problem
nazywa sie strategią maksyminową gracza
.
Jeżeli
to (każdy) profil
, gdzie
jest strategią maksyminową
gracza
jest punktem siodłowym.
Znajdziemy strategię maksyminową i wypłatę ze strategii maksyminowej gracza 1 (wierszowego) w grze Orzeł – Reszka.
| B | S | |
|---|---|---|
| B | 1,-1 | -1,1 |
| S | -1,1 | 1,-1 |
Niech
. Obliczamy
Przy ustalonym
: dla
przyjmuje minimum dla
, wynosi ono
. Dla
minimum
wynosi 0. Dla
minimum
jest dla
i jest mniejsze od zera.
Tak więc
strategia maksyminowa to profil
z wypłatą 0. Analogicznie postępujemy dla gracza 2.
W każdej RN GS0 gracze otrzymują takie same (przeciwne co do znaku) wypłaty. Zachodzi też interesująca własność ”wymienności równowag” (equilibrium interchangeability). W 2-osobowych GS o sumie zerowej jeżeli gracz 1 wybierze swój profil z pewnej RN a drugi gracz wybierze swój z innej RN, to para tych profili też jest RN. Mówi o tym
Niech
- dwie RN dwuosobowej GS o sumie zerowej. Wtedy profile
też są RN.
Niech
- wartość gry. W RN
, ponieważ suma wypłat graczy jest zero oraz
(a zatem
), więc otrzymujemy
Podstawiając
otrzymujemy obustronne oszacowanie
gdzie równość wynika z faktu że gra jest o sumie zerowej, a ostatnia nierówność z tego że
jest RN. Wypłata
została obustronnie oszacowana przez
, a zatem zachodzi równość
. Otrzymujemy
gdzie nierówność z faktu że
jest RN. Mamy też
nierówność wynika z faktu że
jesr RN. Mnożąc przez
otrzymujemy stąd
a zatem
Profil
jest więc RN. Analogicznie dowodzimy że profil
jest RN.
Dla GS0 można podać efektywne algorytmy szukanie wartości gry za pomocą programowania liniowego, patrz np. monografia Luce, Reiffa [13].
W symetrycznej GS0
w mieszanej RN (jeżeli istnieje) zachodzi
.
Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.
strona główna | webmaster | o portalu | pomoc
© Wydział Matematyki, Informatyki i
Mechaniki UW, 2009-2010.
Niniejsze materiały są udostępnione bezpłatnie na licencji Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska.
Projekt współfinansowany przez Unię Europejską w ramach
Europejskiego Funduszu Społecznego.
Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.