Wstęp do Teorii Gier

19
Wstęp do Teorii Gier

description

Wstęp do Teorii Gier. Biologia. Prosty model konfliktu wg Maynarda Smitha i Price'a. Dwa osobniki jednego gatunku spotykają się w sposób losowy Każdy z nich chce pewne dobro, ale tylko jeden je dostanie Zdobycie dobra warte jest 50 punktów dostosowawczych - PowerPoint PPT Presentation

Transcript of Wstęp do Teorii Gier

Page 1: Wstęp do Teorii Gier

Wstęp do Teorii Gier

Page 2: Wstęp do Teorii Gier

BiologiaProsty model konfliktu wg Maynarda Smitha i

Price'a.• Dwa osobniki jednego gatunku spotykają się w

sposób losowy• Każdy z nich chce pewne dobro, ale tylko

jeden je dostanie• Zdobycie dobra warte jest 50 punktów

dostosowawczych– na przykład zwiększenie

prawdopodobieństwa przekazania swoich genów następnemu pokoleniu.

• Dwie strategie:– Jastrząb - walczy o dobro– Gołąb - ogranicza się do działań

symbolicznych

Page 3: Wstęp do Teorii Gier

Gra gołąb-jastrząb

• Zdobycie dobra +50• Przegrana w walce -100• Strata czasu ma straszenie się -10• Zatem: – jastrząb walczący z jastrzębiem - 0.5*50+0.5*(-100)=-25– Jastrząb z gołębiem 50– Gołąb z jastrzębiem 0– Gołąb z gołębiem 0.5*(50-10)+0.5*(-10)=15

Page 4: Wstęp do Teorii Gier

Strategia stabilna ewolucyjnie

• Jeśli są same gołębie, to opłacałoby się być jastrzębiem

• Jeśli są same jastrzębie, opłacałoby się być gołębiem• Strategia 7/12 jastrząb 5/12 gołąb jest stabilna

ewolucyjnie• Strategia jest stabilna ewolucyjnie, jeśli spełnia: Niech T

będzie jakąkolwiek inną strategią czystą lub mieszaną. Załóżmy, że wszystkie osobniki grają S za wyjątkiem niewielkiej liczby tych, co grają T. Jeśli S jest SSE, to oczekiwana wypłata graczy grających S jest nie mniejsza niż oczekiwana wypłata graczy grających T.

• Znaczy to tyle, że populacja S jest odporna na inwazję mutantów T.

Page 5: Wstęp do Teorii Gier

• B jest jedyną ESS

• A i B są ESS

• Tylko mieszana ESS

  P2 A BP1  A 1 2B 3 4

  P2 A BP1  A 3 1B 2 4

  P2 A BP1  A 1 4B 2 3

Strategia stabilna ewolucyjnie

Page 6: Wstęp do Teorii Gier

• Ogólnie dla gier 2x2:– A jest ESS, jeśli a>c, lub a=c i b≥d– B jest ESS, jeśli d>b, lub d=b i c≥a– Inaczej tylko mieszana

• Jeśli jest więcej niż dwie strategie, to– strategia czysta S jest stabilna ewolucyjnie, jeśli na głównej przekątnej

dla strategii S jest wartość najwyższa w tej kolumnie – ponieważ wtedy S jest najlepszą strategią przeciwko sobie samej S.

– Jeśli wartość na przekątnej nie jest jedyną największą wartością w kolumnie, potrzebny jest dalszy test: Wtedy S musi być niegorsza przeciwko jakiejkolwiek alternatywie niż ta alternatywa jest dla siebie samej

  P2 A BP1  A a bB c d

Strategia stabilna ewolucyjnie

Page 7: Wstęp do Teorii Gier

Znęcający się nad słabszymi• Jeśli jest więcej niż dwie strategie, czysta strategia S jest SSE, jeśli wartość wypłaty

dla S leżąca na głównej przekątnej macierzy gry jest największą wartością w swojej kolumnie

• Dodajmy strategię „gnębiciel” – atakuj jeśli przeciwnik się nie broni, uciekaj kiedy atakuje (jeśli dwóch gnębicieli się spotka, jeden z nich ucieknie szybciej niż pozostały)

• Gołąb jest zdominowany• Jedyna SSE to ½ jastrzębia, ½ gnębiciela• Jak najlepiej radzić sobie z gnębicielem?

Page 8: Wstęp do Teorii Gier

Mściwy typ• Dodajmy strategię „mściciel” – na początku graj gołębia, ale

jeśli cię ktoś atakuje walcz z nim z całej siły

• Mściciel jest SSE• Również SSE jest strategia mieszana - mniej niż 30% gołębia,

reszta mściciel (jeśli będzie więcej niż 30% gołębi, gnębiciel dokona inwazji)

• W populacji mścicieli nie dochodzi do walki – ten rodzaj pokojowej równowagi zachodzi dzięki gotowości do walki

Page 9: Wstęp do Teorii Gier

Mściwy typ• Are we jumping to conclusions too soon???

– We should check ALL conditional strategies in fact.• However, the retaliator strategy is very robust.

– To do better against a retaliator than another retaliator would do, you would have to win the resource from him without wasting time or risking injury. This is difficult because a retaliator will not run away, and if you fight him, he will fight back.

Another conclusion??– Conditional strategies seem to do better than mechanical strategies

Page 10: Wstęp do Teorii Gier

Efektywność i koordynacja

• Wynik nieoptymalny w sensie Pareto• Gdyby grali gołębia, mieliby po 15• A gdyby grali ½ GJ, ½ GJ to mieliby po 25• Jak skoordynować działanie:

– Walcz tylko wtedy, gdy jesteś większy– Walcz tylko wtedy, gdy masz dłuższy ogon– Walcz tylko wtedy, gdy jaśniejsze pierze– Walcz tylko wtedy, gdy jesteś na swoim

terytorium

)15(125)0(

127

416)50(

125)25(

127

50

50

-25

-25

Symetryczny wynik paretooptymalny

SSEGG

25

25

Page 11: Wstęp do Teorii Gier

Mieszczuch• Rozpatrzmy strategię „posiadacza” – bądź jastrzębiem na

własnym terytorium, a gołębiem na cudzym• Załóżmy, że połowa starć na własnym terytorium oraz że dwa

osobniki nigdy nie spotkają się na terytorium nienależącym do któregoś z nich

• Dwie SSE– Mściciel dopuszczający istnienie pewnej liczby gołębi– Posiadacz dopuszczający istnienie pewnej liczby gnębicieli

Page 12: Wstęp do Teorii Gier

Exercise [Dawkins (1976)]• A bird female tries to get a male to stay around and help raise a family of babies, instead

of going off and propagating his genes elsewhere.• One possible technique is to insist on a long and arduous courtship before mating.• Suppose a female can be either coy (insist on courtship) or fast (be willing to mate with

anyone)• A a male can be either faithful (go through a courtship and then help raise the babies) or

philandering (be unwilling to go through a courtship, and desert any female after mating)

• Suppose the payoff to each parent of babies is +15, the total cost of raising babies is -20, which can be split equally between both parents, or fall entirely on the female if the male deserts. Suppose the cost of a long courtship is -3 to each player.

a) Formulate the resulting gameb) Draw the movement diagram of this game to show

there is no pure strategy equilibriumc) A mixed strategy ESS for males would be one which

equilizes the expected payoffs to coy and fast females. Find it.

d) Similarly, find an ESS for the females.e) If males and females follow these ESS’s, what will the

epxected payoffs be? Is this result Pareto optimal?

Page 13: Wstęp do Teorii Gier

Gry Bayesowskie• Gry z niepełną informacją (incomplete information), gdzie

gracze poruszają się jednocześnie• Co jest nowego z grze Bayesowskiej:

– Każdy gracz ma jakiś typ (type), który podsumowuje jego prywatną informację

– Każdy gracz dokonuje oceny (belief) typów innych graczy – Wypłaty graczy zależą od typów– Różne typy tego samego gracza mogą grać różne strategie

Page 14: Wstęp do Teorii Gier

Gry w postaci strategicznejGra z pełną informacją

1. Zbiór graczy: 2. Zbiór akcji dla każdego gracza:

3. Funkcja wypłat dla każdego gracza:

gdzie

Gra z niepełną informacją

1. Zbiór graczy: 2. Zbiór typów dla każdego gracza:

3. Oceny typów innych graczy dla każdego gracza

4. Zbiór akcji dla każdego gracza:

5. Zbiór funkcji strategii dla każdego gracza zależnych od typu

6. Funkcja wypłat dla każdego gracza i każdego typu gracza

Page 15: Wstęp do Teorii Gier

Gry Bayesowskie• Niepełna informacja może dotyczyć czegokolwiek w grze:

– Funkcji wypłat– Akcji innych graczy– Ocen innych (belief of others)

• Harsanyi pokazał, że wprowadzenie typów przy funkcjach wypłat jest właściwym podejściem

• Równowaga Bayesowska Nasha to profil strategii (jedna dla każdego typu każdego gracza) taka, że każdy typ stosuje najlepszą odpowiedź (best response) dysponując swoją oceną (belief) typów innych graczy i ich strategii

Page 16: Wstęp do Teorii Gier

Panika finansowa (Bank run)• Ty (gracz I) oraz inny inwestor (gracz II) macie

depozyt w wysokości 100 złotych w banku.• Jeśli inwestor dobrze zarządza pieniędzmi

oboje dostaniecie 150 złotych pod koniec roku. Jeśli nie, stracicie Wasze pieniądze.

• Możesz spróbować wypłacić pieniądze teraz, ale bank ma tylko 100 złotych w gotówce.– Jeśli tylko jeden z Was spróbuje wypłacić dostanie

100 złotych.– Jeśli oboje będziecie starali się wypłacić, oboje

dostaniecie po 50 złotych.

• Wierzysz, że inwestor dobrze zarządza z prawdopodobieństwem q.

• Gracz II wie czy szef banku dobrze zarządza czy źle.

• Ty oraz gracz II musicie jednocześnie zdecydować, czy wypłacić pieniądze z banku, czy nie.

Page 17: Wstęp do Teorii Gier

Typy równowag

Wypłacić Nie wypłacać

Wypłacać 50,50 100,0Nie wypłacać 0,100 150,150

Wypłacić Nie wypłacać

Wypłacać 50,50 100,0

Nie wypłacać 0,100 0,0

dobry q słaby (1-q)

• Równowaga separowalna (separating eq.): każdy typ gra inną strategię• Równowaga łączona (pooling eq.): każdy typ gra tą samą strategię

• Jak zachowałbyś się jako gracz II, gdybyś wiedział, że szef banku słabo zarządza?• Wypłaciłbyś pieniądze

Page 18: Wstęp do Teorii Gier

Wypłacić Nie wypłacać

Wypłacać 50,50 100,0Nie wypłacać 0,100 150,150

Wypłacić Nie wypłacać

Wypłacać 50,50 100,0

Nie wypłacać 0,100 0,0

Równowagi separowalne:• (Dobry: Wypłacić, Zły: Nie wypłacać)

• Nie może być równowagą, ponieważ Wypłacić jest dominującą strategią dla Słaby• (Dobry: Nie wypłacać, Słaby: Wypłacić):

Oczekiwana wypłata gracza I:• Wypłacić:• Nie wypłacać:

Dwie możliwości:• q<1/2: Gracz I wybierze Wypłacić, wtedy gracz II Dobrego typu powinien

zagrać Wypłacić, co przeczy założeniu, że gra Nie wypłacać• q≥1/2: Gracz I wybierze Nie wypłacać. Najlepszą odpowiedzią gracza II

Dobrego typu jest Nie wypłacać, co nie przeczy założeniuRównowaga separowalna:• dla q<1/2: nie ma• dla q≥1/2 Gracz I: Nie wypłacać, Gracz II: (Dobry: Nie wypłacać, Słaby:

Wypłacać)

dobry q słaby (1-q)

Page 19: Wstęp do Teorii Gier

Równowagi łączone:• (Dobry: Nie wypłacać, Słaby: Nie wypłacać)

– Nie może być równowagą, ponieważ Wypłacać jest dominującą strategią dla Słabego

• (Dobry: Wypłacać, Słaby: Wypłacać)Oczekiwana wypłaty gracza I:

• Wypłacać• Nie wypłacać

Gracz I wybierze Wypłacać. Najlepsza odpowiedź dobrego typu gracza II jest Wypłacać. Zatem dla każdej wartości q następująca równowaga łączona jest jedyna:

Rówowaga łączona Gracz I: Wypłacać, Gracz II: (Dobry: Wypłacać, Słaby: Wypłacać)

Jeśli q<1/2 jedyną równowagą jest równowaga łączona panika finansowa

dobry q słaby (1-q)

Wypłacić Nie wypłacać

Wypłacać 50,50 100,0Nie wypłacać 0,100 150,150

Wypłacić Nie wypłacać

Wypłacać 50,50 100,0

Nie wypłacać 0,100 0,0