W dotychczas rozpatrywanym modelu gry strategicznej gracze którzy podejmowali decyzje mieli pełną informację dotyczącą gry, w szczególności znali macierze wypłat wszystkich graczy. W wielu rzeczywistych sytuacjach w ekonomii, w polityce, w konfliktach militarnych, w relacjach społecznych gracze mają zróznicowaną informację o pewnych aspektach gry, istotnych dla podjęcia decyzji o wyborze akcji. Gry w których przynajmniej jeden gracz posiada taka informację, tzn. nieznana conajmniej jednemu innemu graczowi, będziemy nazywać grami Bayesa (Bayesian games), albo grami z niepełną informacją. Używa się też terminu: gry z asymetryczną informacją.
W dotychczasowych rozważaniach dla GS gracze znali w szczególności akcje i wypłaty swoje i przeciwników. W rzeczywistych konfliktach często tak nie jest, walczący nie znaja siły przeciwników, firmy nie znaja kosztów produkcji konkurentów, uczestnicy aukcji nie znają waluacji obiektu aukcji przez innych uczestników aukcji. W grach opisujących takie sytuacje dochodzi więc element ryzyka związany z niepełną informacją.
W grach Bayesa definicja równowagi Nasha musi zostać zmieniona tak aby uwzględnić zróżnicowaną informację graczy o grze. Odpowiednie uogólnienie pojęcia równowagi będziemy nazywali równowagą Nasha–Bayesa, lub po prostu równowagą Bayesa. W takiej równowadze akcje graczy będa optymalne (będą najlepszymi odpowiedziami) przy ich określonych przekonaniach (beliefs) dotyczących innych graczy.
W formalnym modelu gry strategicznej uwzględniającym niepełną informację dojda dodatkowe obiekty–stany świata, i subiektywne, zależne od gracza prawdopodobieństwa wystąpienia różnych stanów świata. Odpowiednim modyfikacjom ulegną wypłaty, które będą wartościami oczekiwanymi odpowiednich zmiennych losowych, i w konsekwencji pojęcia najlepszej odpowiedzi.
Innym rodzajem niepełnej informacji o grze może być brak informacji gracza co inni gracze wiedzą o tym co wie dany gracz na temat gry. W grach ekstensywnych, będących tematem kolejnych rozdziałów, rozważa się jeszcze inny rodzaj niepewności w grze: brak pewności jaka akcję grał ostatnio przeciwnik (przeciwnicy). Gry tego typu nazwiemy grami z niedoskonałą informacją (imperfect information).
W poniższych przykładach (por. [19]) rozważymy gry dwuosobowe w których przynajmniej jeden gracz nie będzie miał pewności na temat wypłat swojego przeciwnika czy też partnera gry.
Niech jest funkcja kosztów 1-ej firmy. Funkcja kosztów 2-ej jest równa
z prawdopodobieństwem
,
z prawdopodobieństwem
. Informacja graczy o grze jest asymetryczna w nastepującym sensie: 2 zna
and
, 1 zna
i wie że koszt koszt wyprodukowania jednostki towaru przez firmę 2 wynosi
z prawdopodobieństwem
,
z prawdopodobieństwem
. Przykładowo, firma 2 może dopiero wchodzić na rynek lub wprowadzać nową technologię produkcji rozważanego towaru. Zakładamy ”common knowledge”: 1 wie co 2 wie o grze, 2 wie że 1 wie co 2 wie o grze itd.
Walka Płci (przy niepełnej informacji)
Rozważmy symetryczną GS: . 1-y gracz to Mężczyzna, 2-i gracz to Kobieta. B oznacza Boks, S–Siatkówkę. 1 and 2 muszą zdecydować jednocześnie: wybrać B czy S.
Gracz 1 ma macierz wypłat
B | S | |
---|---|---|
B | 2 | 0 |
S | 0 | 1 |
Gracz 2 może być jednym z dwóch typów: i
(od ang.: love, hate). Gdy jest typu
to jego macierz wypłat ma postać
B | S | |
---|---|---|
B | 1 | 0 |
S | 0 | 2 |
a gdy typu , to
B | S | |
---|---|---|
B | 0 | 2 |
S | 1 | 0 |
W tym przykładzie gracz 1 ma tylko jeden typ. Zakładamy że przy realizacji gry każdy gracz wie jakiego jest typu.
Gracz 1 nie wie z jakim typem gracza 2 będzie grał. Zakładając prawdopodobieństwo każdego typu równe (w naszym przykładzie) 0.5 i wiedząc jaką akcję wybierze (z prawdopodobieństwem 1) gracz 2 gdy jest każdego z typów, gracz 1 może obliczyć wypłaty ze swoich strategii czystych jako wartości oczekiwane zmiennej losowej ”typ gracza 2”.
Niech para (A,B) oznacza: gracz 2 gra A gdy jest typu , B gdy jest typu
. Otrzymujemy macierz wartości oczekiwanych wypłat gracza 1 przy danych założeniach o graczu 2:
(B,B) | (B,S) | (S,B) | (S,S) | |
---|---|---|---|---|
B | 2 | 1 | 1 | 0 |
S | 0 | 1/2 | 1/2 | 1 |
Zauważmy że macierz tę można traktować jako macierz wypłat pewnej gry trzyosobowej.
Za profil strategii czystych gry przyjmiemy trójkę
![]() |
Za profil rówowagowy (strategii czystych) przyjmiemy taki profil dla którego:
1. Przy ustalonych akcjach (A,B) 2-ego gracza gdy jest typu odpowiednio (i przy znanym graczowi 1 prawdopodobieństwie każdego typu gracza 2 (w maszym przykładzie 0.5) akcja
daje graczowi 1 maksymalna wypłatę
2. Przy ustalonej akcji 1-ego: gdy 2-i jest typu
(typu
) to akcja
(akcja
) daje 2-emu maksymalna wypłatę.
Jak łatwo sprawdzić, w naszym przykładzie warunki te spełnia trójka .
Przekonanie (belief) gracza
(o akcjach pozostałych graczy) jest to rozkład prawdopodobieństwa na
.
Gracz jest racjonalny jeżeli wybiera strategię
taką że
![]() |
czyli taką która maksymalizuje wyrażenie
![]() |
Przykładowo jest przekonaniem gracza 1 w grze koordynacyjnej
C | D | |
---|---|---|
C | 1 | 0 |
D | 0 | 1 |
Gracz 1 jest racjonalny jeżeli wybiera C.
Niech będzie zbiorem skończonym. Elementy
bedziemy nazywać stanami świata.
Przekonanie
gracza
o stanach świata jest to rozkład prawdopodobieństwa na
.
Gra Bayesowska
![]() |
składa się z następujących elementów:
– skończony zbiór graczy.
– skończony zbiór stanów świata.
Dla każdego gracza określamy
– zbiór akcji gracza
.
– skończony zbiór
typów gracza
(sygnałów które może otrzymać).
W dalszym ciągu dla uproszczenia górny wskaźnik numerujący typ będziemy pomijać.
– funkcja sygnału gracza
. Przyporządkowuje ona stanom świata typ gracza
.
Moc zbioru stanów które generują ryp opisuje stopień pewności gracza
o stanie świata. Na przykład
jeżeli
to gracz
wie, po otrzymaniu sygnału, jaki jest stan świata (jaki stan ”zaszedł”), a zatem zna typy wszystkich graczy.
Jeżeli natomiast to sygnął który otrzymuje gracz (a zatem jego typ) nie daje mu żadnej informacji o stanie świata.
W pozostałych przypadkach informacja ma charakter częściowy. Niech np. świat ma trzy stany: ,
. Jeżeli świat jest w stanie
, to gracz
wie że świat jest w stanie
, jesli
lub
to gracz
nie wie w którym z tych stanów.
Dla każdego typu
jest prawdopodobieństwem apriori (prior belief) jakie typ
assigns stanowi
.
Funkcja sygnału wraz ze zbiorem prawdopodobieństw apriori opisują wiedzę
o stanie świata.
– funkcja wypłat gracza
.
Gra odbywa się w następstwie realizacji pewnego stanu świata .
Gracz otrzymuje sygnał (dla uproszczenia oznaczeń pomijamy numer sygnału)
, czyli jest typu
. Typ
definiuje podzbiór stanów świata
(które implikują typ
).
Dla każdego takiego stanu
otrzymujemy
- aprioryczne prawdobodobieństwa gracza
w stanie
że stan świata jest
. Mając te prawdopodobieństwa obliczamy wypłaty gracza
.
W rozpatrywanej grze Walka Płci (przy niepełnej informacji):
Funkcje sygnału: gracza 1: – gracz 1 może otrzymać tylko jeden sygnał, jest tylko jednego typu.
gracza 2: – gracz 2 może być typu
lub typu
.
Prawdopodobieństwa aprioryczne gracza 1:
![]() |
Mówimy że gracz przypisuje każdemu stanowi świata prawdopodobieństwo 1/2 po otrzymaniu sygnału
.
Prawdopodobieństwa aprioryczne gracza 2:
![]() |
Gracz przypisuje prawdopodobieństwo 1 stanowi
po otrzymaniu synału
i stanowi
po otrzymaniu sygnału
.
Wypłaty: dla :
Liczby są elementami macierzy wypłat gdy 2 jest typu
,
Liczby są elementami macierzy wypłat gdy 2 jest typu
.
Równowaga Nasha Gry Bayesowskiej GB jest to RN następującej GS:
Gracze: pary , gdzie
Zbiór akcji gracza jest to zbiór akcji
gracza
w GS
Wypłaty gracza definiujemy następująco:
Oznaczmy: –akcja typu
gracza
.
Wypłata gracza wybierającego akcję
jest równa
![]() |
jest profilem GS w której gracz
typu
gra
, a pozostali grają
,
jest wprowadzonym wyżej oznaczeniem akcji gracz
typu
gdy stan świata jest
.
Zauważmy że zależy od akcji wszystkich typów wszystkich pozostałych graczy, a nie zależy od akcji żadnego z typów gracza
.
W rozważanym wyżej Przykładzie 6.4 policzymy oczekiwaną wypłatę (jedynego) typu gracza 1 z akcji
, gdy
:
![]() |
Niech obaj gracze mogą być jednego z dwóch typów: , i że nie wiedzą jakiego typu jest przeciwnik: 1 przypisuje typowi 2-go prawdopodobieństwo 1/2, 2-i przypisuje 1-mu typ
z prawdopodobieństwem 2/3,
z prawdopodobieństwem 1/3. Gracze znają swoje typy.
Tę sytuację modelujemy jako następującą GB:
Funkcja sygnału gracza 1:
Funkcja sygnału gracza 2:
Prawdopodobieństwa aprioryczne (beliefs) gracza 1:
![]() |
Prawdopodobieństwa aprioryczne (beliefs) gracza 2:
![]() |
Wypłaty: dla : liczby
są elementami macierzy
.
:
B | S | |
---|---|---|
B | 2,1 | 0,0 |
S | 0,0 | 1,2 |
:
B | S | |
---|---|---|
B | 2,0 | 0,2 |
S | 0,1 | 1,0 |
:
B | S | |
---|---|---|
B | 0,1 | 2,0 |
S | 1,0 | 0,2 |
:
B | S | |
---|---|---|
B | 0,0 | 2,2 |
S | 1,1 | 0,1 |
W Przykładzie 6.2 gra Bayesa ma postać:
,
,
.
Funkcje sygnału: .
Prawdopodobieństwa aprioryczne: jedyny typ gracza 1 przypisuje prwadopodobieństwo stanowi
,
stanowi
. Każdy typ gracza 2 przypisuje prawdopodobieństwo 1 każdemu stanowi konsystentnemu ze swoim sygnałem
, natomiast prawdopodobieństwo
w przeciwnym przypadku.
Funkcje wypłaty: gdzie
, a
jest rynkową ceną jednostki towaru którego całkowita produkcja wynosi
.
W duopolu Cournota z Przykładu 9.7 dla dostatecznie bliskich by istniała RN z dodatnimi produkcjami znaleźć tę RN i porównać z RN gier w których 1 zna
i
.
Niech dla
,
dla
. Niech
– RN. Wtedy
![]() |
.
Obliczając pierwsze pochodne otrzymujemy 3 równania algebraiczne na . Ich rozwiązanie:
![]() |
![]() |
![]() |
Przypomnijmy że dla duopolu Cournota z pełną informacją gdy koszt produkcji firmy wynosi
, to zakładając dodatniość odpowiednich wielkości produkcji, w RN wielkości te wynoszą
![]() |
W szczególoności otrzymujemy więc
![]() |
I. Rozważmy wpierw 2-osobową GB z dwoma stanami: , w której żaden z graczy nie zna stanu świata i każdy przypisuje prawdopodobieńtwo 1/2 każdemu z 2 stanów. Macierze wypłat odpowiadające obu stanom mają postać:
:
L | M | R | |
---|---|---|---|
T | 1,2a | 1,0 | 1,3a |
B | 2,2 | 0,0 | 0,3 |
:
L | M | R | |
---|---|---|---|
T | 1,2a | 1,3a | 1,0 |
B | 2,2 | 0,3 | 0,0 |
gdzie .
Najlepsza odpowiedź gracza 2 na każdą akcję 1-go to L:
jeśli 1 wybierze T, to L da 2a, M i R dadzą po 3a/2 każda.
jeśli 1 wybierze B, to L da 2, M i R dadzą po 3/2 każda.
Co więcej, najlepsza odpowiedź 1 na L to B. Ponieważ jest to jedyna najlepsza odpowiedż, więc para (par) jest jedyną RN (także w strategiach mieszanych). W Rn każdy gracz otrzymuje 2.
II. Rozważmy teraz nastepującą modyfikację tej gry. Gracz 2 zna stan świata: . Mamy sytuację taką jak w pierwszej wersji gry Wojna Płci z niepełną informacja. Gracz 2 ma więc więcej informacji. Zakładamy że gracz 1 jest o tym poinformowany.
W tej grze jest jedyną RN: każdy typ gracza 2 ma strategię ścisle dominującą, wprzy której jedyną najlepszą odpowiedzią gracza 1 jest T. W tej RN gracz 2 otrzymuje
w każdym ze stanów, a więc wypłatę niższą niż w przypadku I!
Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.
strona główna | webmaster | o portalu | pomoc
© Wydział Matematyki, Informatyki i
Mechaniki UW, 2009-2010. Niniejsze materiały są udostępnione bezpłatnie na licencji Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska.
Projekt współfinansowany przez Unię Europejską w ramach
Europejskiego Funduszu Społecznego.
Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.