Przegl¡d gier
Transkrypt
Przegl¡d gier
Przegl¡d gier
1
Wszyscy graj¡ skªadaj¡c oferty (cenowe, zapªaty itp.).
• gra w monet¦
• oligopol Cournota (1838)
• kamie«-no»ycepapier
(staro»ytne Chiny i
Japonia,
Hofbauer)
• oligopol Bertranda (1883)
• marynarz, morra
(staro»ytny
Rzym i Grecja)
• tragedia wspólnoty, pastwisko (staro»ytna Grecja, de Molina XVI w., W.
Forster Lloyd 1833, Hardin 1968)
• bar El Farol, minority (W.
Brian Arthur 1994, Challet & Y.C.Zhang 1997)
• jele«, czy zaj¡c (Rousseau &
Hume XVIII w., Skyrms 2004)
• wojna pªci
• dylemat wi¦¹nia (Flood & Dresher
1950, Tucker)
• dylemat podró»nika (Basu 1994)
• cykor; goª¡b i jastrz¡b (B.Russell
1955, Maynard Smith & Price
1973)
• dylemat smakosza (Glance & Huberman 1994)
• dobro publiczne
2003-2006)
N
j=1 Aj
Hauert
• dylemat wolontariusza (???, Diekmann 1985)
Oznaczenia
wspólne
Q
G = (Ai , Pi :
(???,
→ R; i = 1, . . ., N )
gra wieloosobowa w postaci normalnej
N
liczba graczy
i = 1, . . ., N
nr gracza
Ai
zbiór akcji (strategii czystych) gracza i
A = Ai
jednakowy dla wszystkich zbiór akcji
x i ∈ Ai
wybór i-tego gracza
funkcja wypªaty i-tego gracza
Pi
x−i = (x1 , . . ., x
66 i , . . ., xN ) ∈
Q
j6=i Aj
wybór pozostaªych graczy (poza i)
Ekwilibrium Nasha (±cisªe, sªabe), optimum Pareto (mocne, sªabe), dominacja itp. itd. to s¡ poj¦cia
strategiczne zale»¡ jedynie od wzajemnych preferencji graczy.
Let Γ = (Σ1 , Σ2 ; P1 , P2 : Σ1 × Σ2 → R) be a game and ϕi : R → R be strictly increasing
e = (Σ1 , Σ2 ; P
f1 , P
f2 :
(right continuous in the case of innite compact Σi ) functions, i = 1, 2. Then the game Γ
Σ1 × Σ2 → R) transformed from Γ via the formula
Wªasno±¢ 1
Pei = ϕi ◦ Pi
admits the same (strict) equilibria and (strong) Pareto optima as the original game Γ.
e = (S)N E(Γ), (S)P O(Γ)
e = (S)P O(Γ).
Symbolically (S)N E(Γ)
e nazywamy strategicznie równowa»nymi.
Gry Γ i Γ
27,28,29,30,31.x, 1,2.xi 2011, K.L.
Przegl¡d gier
2
Gry dyskoordynacji
Heads
Tails
H [+1, −1] [−1, +1] (moneta, matching pennies);
(1)
T [−1, +1] [+1, −1]
Rock
Scissors
Paper
R
[0, 0]
[+1, −1] [−1, +1]
S
[−1, +1]
[+1, −1]
[0, 0]
(kamie«-no»yce-papier, RSP);
(2)
P [+1, −1] [−1, +1]
[0, 0]
N
X
A = {1, . . ., 10}, Pi (x1 , . . ., xN ) = 1 − 2 · sgn xj mod N + 1 − i (marynarz).
j=1
(3)
Sªu»¡ do podejmowania sprawiedliwych decyzji metod¡ losow¡.
Mechanizm projektowania zachowa« speªniaj¡cych kryterium sprawiedliwego podziaªu (dwie
zasady K.Szaniawskiego równych szans: satysfakcji oraz wyboru).
Wªasno±¢ 2
RSP niekiedy uwa»a si¦ za jednoczesne rozszerzenie na 3 strategie gry w monet¦ i w cykora.
Gry koordynacji
Bach Stravinsky
(wojna pªci, BoS),
(4)
B [3, 2] [1, 1] (asymetryczna wojna pªci, BoS);
(5)
B
[3, 2]
[0, 0]
S
[0, 0]
[2, 3]
B
S
S
[0, 0] [2, 3]
Stag Hunt
S
[2, 2]
H [1, 0]
[0, 1] (jele«, czy zaj¡c stag hunt).
(6)
[1, 1]
Zastosowania: umowy spoªeczne, standardy technologiczne.
W dwuosobowej grze koordynacji z dwiema strategiami oprócz dwóch równowag czystych wyst¦puje równowaga mieszana, która
Wªasno±¢ 3
(i) jest Pareto-zdominowana przez równowagi czyste, (mocno zdominowana przez co najmniej jedn¡ równowag¦ czyst¡),
(ii) nie jest ewolucyjnie stabilna (ESS).
ródªa trudno±ci koordynacji wyboru równowagi czystej:
a) nieporównywalno±¢ w sensie Pareto,
b) dominacja ryzyka w sensie Seltena-Harsanyia nad dominacj¡ Pareto.
27,28,29,30,31.x, 1,2.xi 2011, K.L.
Przegl¡d gier
3
Wieloosobowe wersje koordynacji: gªosowanie (?).
Gry anty-koordynacji
V warto±¢ zasobu, C koszt walki, 0 < C < V,
Hawk
V −C V −C H
2 , 2
D
[0, V ]
Dove
[V, 0] (goª¡b i jastrz¡b),
V V 2, 2
Hawk
Dove
V −C V −C H
[V, 0] (wariant wojny na wyczerpanie war of attrition).
2 , 2
D
[0, V ]
(7)
(8)
(9)
[0, 0]
Cykor (chicken) = goª¡b i jastrz¡b (hawk-dove) = zaspa (snowdrift).
Rozszerzenia wieloosobowe gier antykoordynacji:
• crowding game wypªata nierosn¡ca wzgl¦dem liczby graczy wybieraj¡cych to samo co ja;
• congestion game = crowding game w sieci;
• minority game by¢ w mniejszo±ci (El Farol);
• aukcje (?); gieªdy (?).
Por. gry dyskoordynacji.
Oligopol Cournota (symetryczny)
A = [0, L], (L zdolno±ci produkcyjne), A 3 xi wielko±¢ produkcji,
=b
=a−c
N
N
z}|{
X
X
z}|{
Pi (x1 , . . ., xN ) = xi · a − b ·
xj − c · xi = xi · α − β ·
xj .
| {z }
j=1
j=1
koszt
|
{z
}
(10)
(11)
przychód
Model konkurencji produkcyjnej sugerowany jako wªa±ciwy w sytuacji, gdy szybka zmiana poziomu
produkcji jest utrudniona i wyst¦puje ograniczenie zdolno±ci produkcyjnych.
Historyjka (dylemat pastwiska) : We wsi jest 5 gospodarzy i maj¡ oni po 2 krowy. Mog¡ wyprowadzi¢
na wspólne pastwisko pewn¡ liczb¦ krów. Ka»dy chce skorzysta¢ z darmowego popasu, ale nadmierna
eksploatacja mo»e unicestwi¢ dobro wspólne. Zysk zale»y od wªasnej decyzji, ale jest hamowany przez
wybór innych.
Opªaca si¦ graczom tworzy¢ kartel. W przypadku rm jest to (na ogóª) zabronione prawnie
(zawy»enie ceny jako koszt spoªeczny), ale w przypadku dobra wspólnego po»¡dane (zrównowa»ona eksploatacja jako koszt spoªeczny). Model Hotellinga dªugiej ulicy (gra lokalizacji) ukazuje niejawny duopol trudny
do ukarania. Korzystno±¢ rozwi¡zania gry zale»y od nieuwidocznionego w wypªatach dodatkowego gracza spoªecze«stwa (tzw. dummy player).
Wªasno±¢ 4
27,28,29,30,31.x, 1,2.xi 2011, K.L.
Przegl¡d gier
5
X
4
xj (pastwisko Hardina);
(12)
Pi (x1 , x2 ) = xi · (α − β (x1 + x2 )) (N = 2, duopol);
(13)
A = {1, 2} = {Low, High}, 4β ≥ α > 3β, a < b < c < d,
(14)
A = {0, 1, 2}, Pi (x1 , . . ., x5 ) = xi · 12 −
j=1
1
1
2
[α − 2β, α − 2β]
[α − 3β, 2 · (α − 3β)]
(duopol dla 2 strategii),
(15)
[b, d] (duopol w porównaniu do PD);
(16)
2 [2 · (α − 3β), α − 3β] [2 · (α − 4β), 2 · (α − 4β)]
L
L
[c, c]
H
H [d, b] [a, a]
[91, 91]
[96, 84]
[99, 77]
[100, 70]
[84, 96] [77, 99] [70, 100]
[88, 88] [80, 90]
[90, 80] [81, 81]
[90, 72] [80, 72]
A = {7, 8, 9, 10}, α = 27, β = 1,
[72, 90]
(duopol w porównaniu do TD),
[72, 80]
[70, 70]
N E = {(10, 8), (8, 10), (9, 9)}.
(17)
(18)
(19)
(J.Watson) Podobie«stwo duopolu Cournota do PD: równowaga Nasha nie jest Pareto-optymalna.
Oligopol Bertranda (symetryczny)
A = [c, a], A 3 xi cena towaru, (a − xi ) zadeklarowana wielko±¢ produkcji,
1 − sgn (xi − minj xj )
· min xj − c
a − min xj ;
Pi (x1 , . . ., xN ) = PN
j
j
k=1 (1 − sgn (xk − minj xj ))
xi · (a − xi ) − c · (a − xi ) = (a − xi ) (xi − c), xi < x−i
{z
} | {z }
| przychód
koszt
Pi (x1 , x2 ) =
(N = 2, duopol).
1
xi = x−i
2 · (a − xi ) (xi − c),
0,
xi > x−i
(20)
(21)
(22)
(J.Watson) Manipulacja cenowa Bertranda jest bardziej konkurencyjna od manipulacji ilo±ciowej (zysk
0, cena = koszta kra«cowe).
Gry mniejszo±ciowe
Historyjka (problem Baru El Farol) : Ka»dego czwartku pewna liczba osób z miasteczka chce si¦ wybra¢
do (niezbyt du»ego) baru. Je±li przyb¦dzie zbyt wielu go±ci (ponad 60%), to b¦dzie tªok i lepiej byªo pozosta¢
w domu.
27,28,29,30,31.x, 1,2.xi 2011, K.L.
Przegl¡d gier
5
A = {±1} = {Attend, Dismiss},
(23)
(El Farol mniejszo±ciowy gieªda);
(24)
A = {1, 0} = {Attend, Dismiss}, 1 > a poziom przepeªnienia,
N
X
Pi (x1 , . . ., xN ) = xi · a −
xj (El Farol samotników; oligopol),
(25)
P
N
+1, sgn(xi ) 6= sgn
j=1 xj
Pi (x1 , . . ., xN ) =
−1, sgn(xi ) = sgn PN xj
j=1
(26)
j=1
a > d minimum towarzystwa,
N
N
X
X
Pi (x1 , . . ., xN ) = xi · a −
xj ·
xj − d (El Farol imprezowy).
(27)
j=1
(28)
j=1
Dylematy podró»nika (TD) i wi¦¹nia (PD)
TD
Pi (x1 , x2 ) = min(x1 , x2 ) + 2 · sgn(x2 − x1 ), i = 1, 2, x1 , x2
[100, 100] [97, 101]
[101, 97] [99, 99]
A = {100, 99, 98, 97},
[100, 96] [100, 96]
[99, 95]
[99, 95]
∈ A = {2, . . ., 100};
[96, 100] [95, 99]
[96, 100] [95, 99]
[98, 98] [95, 99]
[99, 95] [97, 97]
(29)
(30)
PD
A = {Cooperate, Defect} = {c, b}, (b = 1, c = 2 ⇒ A = {2, 1}),
(31)
D(b) C(c)
D(b)
[b, b]
C(c) [a, d]
[d, a] ,
(32)
[c, c]
a < b < c < d (warunek zdrady i mo»liwej kooperacji),
(33)
2c > a + d (nie warto zdradza¢ na przemian);
"
#
[1, 1] [3, 0]
(macierz Smale'a),
[0, 3] [2, 2]
"
#
[1, 1] [3, −1]
(macierz typu Basu).
[−1, 3] [2, 2]
(34)
(35)
(36)
Wszystkie gry PD opisane macierz¡ ogóln¡ s¡ strategicznie równowa»ne (w szczególno±ci równowa»ne macierzy Smale'a). To samo dotyczy ich rozszerze« mieszanych.
Wªasno±¢ 5
Gra dana macierz¡
"
M9 =
[1, 1] [9, 0]
#
[0, 9] [2, 2]
jest strategicznie równowa»na PD z macierz¡ Smale'a, chocia» graczom opªaca si¦ zdradza¢ na przemian;
M9 nie speªnia warunku (34 ). W grach powtarzanych nabieraj¡ znaczenia strategie skorelowane.
27,28,29,30,31.x, 1,2.xi 2011, K.L.
Przegl¡d gier
6
Dylemat smakosza (Unscrupulous Diner's Dilemma)
Historyjka : Grupa N osób udaje si¦ na obiad. Menu zawiera dania za $10 i $20. Ka»dy podejmuje decyzj¦
w tajemnicy przed innymi, a rachunek jest dzielony równo pomi¦dzy wszystkich.
A = {10, 20}, xi warto±¢ zamówienia i-tego gracza,
Pi (x1 , . . ., xN ) = xi −
1
·
N
N
X
(37)
xj (ile nad- lub niedopªaci¢).
(38)
j=1
[Wikipedia] podaje bardziej zªo»on¡ realizacj¦.
Dobro publiczne (Public Goods Game)
A = {Cooperate (inwestuj), Defect (korzystaj)},
(39)
[0, N ] 3 nC liczba kooperatorów,
(40)
0 < c koszt inwestycji w dobro publiczne,
(41)
1 < r mno»nik wzrostu dobra,
(42)
(wypªata eksploatora),
(43)
PC (nC ) = PD (nC ) − c (wypªata inwestora).
(44)
1
·
PD (nC ) =
N
Wªasno±¢ 6
r nC c
| {z }
warto±¢ dobra
1. PC < PD ;
2. r ≤ 1 ⇒ PC (N ) = (r − 1) c ≤ 0 = PD (0) (lepiej gdy nikt nie kooperuje);
3. 1 < r < 2 dla PD (zob.46,47);
4. r = 1 w dylemacie smakosza (zob.48,50).
(Ch.Hauert) PGG in group of size N ≈ (N − 2) pairwise PD interactions.
nC
PC
PD
0
−c
66
0
D
C
(PD jako PGG),
(45)
r
> r − 1 (w-k dominacji zdrady D C ),
2
r
− 1 c ≤ 0 (w-k równowagi (D, D) (D, C));
2
A = {10, 20} = {C, D}, c = 10, r = 1, (dylemat smakosza jako PGG),
(46)
20 · (N − nC ) + 10 · nC (rachunek za obiad),
(49)
20 − PD (nC ) = 10 − PC (nC ) (pªatno±¢ na uczestnika).
(50)
1
r
2c
−c
r
2c
2
rc − c
rc
66
r
D
C
r
2
r
2
[0, 0]
−1 c
2 c,
− 1 c, 2r c [(r − 1)c, (r − 1)c]
(47)
(48)
Dylemat wolontariusza (Volunteer's Dilemma)
Historyjka (wi¦¹niowie) : Je±li spo±ród wielu oskar»onych jeden przyzna sie do popeªnionych czynów, to
otrzyma on wyrok 10 lat, a pozostali uzyskaj¡ odszkodowanie. W przeciwnym przypadku wszyscy b¦d¡
przetrzymywani tak dªugo jak tylko mo»na celem wyja±nienia sprawy.
27,28,29,30,31.x, 1,2.xi 2011, K.L.
Przegl¡d gier
7
Historyjka (zbiegowisko) : Je±li zareaguje kto± z tªumu, to pomoc zostanie udzielona. Ka»dy ogl¡da si¦
na pozostaªych.
A = {Cooperate, Defect} = {0, 1},
0
xi = 0
N
X
P
.
Pi (x1 , . . ., N ) = sgn(xi ) · −10 + 11 · sgn
xj − xi
=
1
1 ≤ xi < N
j=1 xj
PN
j=1
−10 1 ≤ xi = j=1 xj
(51)
(52)
Gra uznawana za wieloosobow¡ wersj¦ cykora (chicken, hawk-dove).
Literatura
[Wikipedia]
Wikipedia, Category: Game Theory, http://en.wikipedia.org/wiki/Category:Game_
theory.
[Watson]
J.Watson, Strategia. Wprowadzenie do teorii gier, WNT 2005.
[Gibbons]
R.Gibbons, A Primer in Game Theory, Prentice Hall.
[Malawski al.] M.Malawski, A.Wieczorek, H.Sosnowska, Konkurencja i kooperacja. Teoria gier w ekonomii
i naukach spoªecznych, PWN 2004.
[Glance al.]
N.S.Glance, B.A.Huberman, The Dynamics of Social Dilemmas, Scientic American Magazine, March 1994.
[Gneezy al.]
U.Gneezy, E.Harury, H.Yafe, The ineciency of splitting the bill, The Economic Journal 114
(495) (2004), 265-280.
[Hauert]
Ch.Hauert, http://www.univie.ac.at/virtuallabs.
[Diekmann]
A.Diekmann, Volunteer's Dilemma, The Journal Of Conict Resolution 29 no.4 (1985), 605610.
[Bischi al.]
G.-I.Bischi, C.Chiarella, M.O.Kopel, F.Szidarovszky, Nonlinear Oligopolies: Stability and
Bifurcations, Springer 2010.
[Basu]
K.Basu, The Traveler's Dilemma: Paradoxes of Rationality in Game Theory, American Economic Review, 84 no.2 (1994), 391-395.
[Hofbauer al.] J.Hofbauer, K.Sigmund, Evolutionary games and population dynamics, Cambridge University Press 1998.
[Skyrms]
B.Skyrms, The stag hunt and the evolution of social structure, Cambridge University Press
2004.
[Lissowski]
G.Lissowski, Zasady sprawiedliwego podziaªu dóbr, Scholar 2008.
[Holt]
Ch.A.Holt, Markets, Games, and Strategic Behavior: Recipes for Interactive Learning,
Addison-Wesley 2005.
27,28,29,30,31.x, 1,2.xi 2011, K.L.