Wstęp do Teorii Gier
description
Transcript of Wstęp do Teorii Gier
Wstęp do Teorii Gier
BiologiaProsty model konfliktu wg Maynarda Smitha i
Price'a.• Dwa osobniki jednego gatunku spotykają się w
sposób losowy• Każdy z nich chce pewne dobro, ale tylko
jeden je dostanie• Zdobycie dobra warte jest 50 punktów
dostosowawczych– na przykład zwiększenie
prawdopodobieństwa przekazania swoich genów następnemu pokoleniu.
• Dwie strategie:– Jastrząb - walczy o dobro– Gołąb - ogranicza się do działań
symbolicznych
Gra gołąb-jastrząb
• Zdobycie dobra +50• Przegrana w walce -100• Strata czasu ma straszenie się -10• Zatem: – jastrząb walczący z jastrzębiem - 0.5*50+0.5*(-100)=-25– Jastrząb z gołębiem 50– Gołąb z jastrzębiem 0– Gołąb z gołębiem 0.5*(50-10)+0.5*(-10)=15
Strategia stabilna ewolucyjnie
• Jeśli są same gołębie, to opłacałoby się być jastrzębiem
• Jeśli są same jastrzębie, opłacałoby się być gołębiem• Strategia 7/12 jastrząb 5/12 gołąb jest stabilna
ewolucyjnie• Strategia jest stabilna ewolucyjnie, jeśli spełnia: Niech T
będzie jakąkolwiek inną strategią czystą lub mieszaną. Załóżmy, że wszystkie osobniki grają S za wyjątkiem niewielkiej liczby tych, co grają T. Jeśli S jest SSE, to oczekiwana wypłata graczy grających S jest nie mniejsza niż oczekiwana wypłata graczy grających T.
• Znaczy to tyle, że populacja S jest odporna na inwazję mutantów T.
• B jest jedyną ESS
• A i B są ESS
• Tylko mieszana ESS
P2 A BP1 A 1 2B 3 4
P2 A BP1 A 3 1B 2 4
P2 A BP1 A 1 4B 2 3
Strategia stabilna ewolucyjnie
• Ogólnie dla gier 2x2:– A jest ESS, jeśli a>c, lub a=c i b≥d– B jest ESS, jeśli d>b, lub d=b i c≥a– Inaczej tylko mieszana
• Jeśli jest więcej niż dwie strategie, to– strategia czysta S jest stabilna ewolucyjnie, jeśli na głównej przekątnej
dla strategii S jest wartość najwyższa w tej kolumnie – ponieważ wtedy S jest najlepszą strategią przeciwko sobie samej S.
– Jeśli wartość na przekątnej nie jest jedyną największą wartością w kolumnie, potrzebny jest dalszy test: Wtedy S musi być niegorsza przeciwko jakiejkolwiek alternatywie niż ta alternatywa jest dla siebie samej
P2 A BP1 A a bB c d
Strategia stabilna ewolucyjnie
Znęcający się nad słabszymi• Jeśli jest więcej niż dwie strategie, czysta strategia S jest SSE, jeśli wartość wypłaty
dla S leżąca na głównej przekątnej macierzy gry jest największą wartością w swojej kolumnie
• Dodajmy strategię „gnębiciel” – atakuj jeśli przeciwnik się nie broni, uciekaj kiedy atakuje (jeśli dwóch gnębicieli się spotka, jeden z nich ucieknie szybciej niż pozostały)
• Gołąb jest zdominowany• Jedyna SSE to ½ jastrzębia, ½ gnębiciela• Jak najlepiej radzić sobie z gnębicielem?
Mściwy typ• Dodajmy strategię „mściciel” – na początku graj gołębia, ale
jeśli cię ktoś atakuje walcz z nim z całej siły
• Mściciel jest SSE• Również SSE jest strategia mieszana - mniej niż 30% gołębia,
reszta mściciel (jeśli będzie więcej niż 30% gołębi, gnębiciel dokona inwazji)
• W populacji mścicieli nie dochodzi do walki – ten rodzaj pokojowej równowagi zachodzi dzięki gotowości do walki
Mściwy typ• Are we jumping to conclusions too soon???
– We should check ALL conditional strategies in fact.• However, the retaliator strategy is very robust.
– To do better against a retaliator than another retaliator would do, you would have to win the resource from him without wasting time or risking injury. This is difficult because a retaliator will not run away, and if you fight him, he will fight back.
Another conclusion??– Conditional strategies seem to do better than mechanical strategies
Efektywność i koordynacja
• Wynik nieoptymalny w sensie Pareto• Gdyby grali gołębia, mieliby po 15• A gdyby grali ½ GJ, ½ GJ to mieliby po 25• Jak skoordynować działanie:
– Walcz tylko wtedy, gdy jesteś większy– Walcz tylko wtedy, gdy masz dłuższy ogon– Walcz tylko wtedy, gdy jaśniejsze pierze– Walcz tylko wtedy, gdy jesteś na swoim
terytorium
)15(125)0(
127
416)50(
125)25(
127
50
50
-25
-25
Symetryczny wynik paretooptymalny
SSEGG
25
25
Mieszczuch• Rozpatrzmy strategię „posiadacza” – bądź jastrzębiem na
własnym terytorium, a gołębiem na cudzym• Załóżmy, że połowa starć na własnym terytorium oraz że dwa
osobniki nigdy nie spotkają się na terytorium nienależącym do któregoś z nich
• Dwie SSE– Mściciel dopuszczający istnienie pewnej liczby gołębi– Posiadacz dopuszczający istnienie pewnej liczby gnębicieli
Exercise [Dawkins (1976)]• A bird female tries to get a male to stay around and help raise a family of babies, instead
of going off and propagating his genes elsewhere.• One possible technique is to insist on a long and arduous courtship before mating.• Suppose a female can be either coy (insist on courtship) or fast (be willing to mate with
anyone)• A a male can be either faithful (go through a courtship and then help raise the babies) or
philandering (be unwilling to go through a courtship, and desert any female after mating)
• Suppose the payoff to each parent of babies is +15, the total cost of raising babies is -20, which can be split equally between both parents, or fall entirely on the female if the male deserts. Suppose the cost of a long courtship is -3 to each player.
a) Formulate the resulting gameb) Draw the movement diagram of this game to show
there is no pure strategy equilibriumc) A mixed strategy ESS for males would be one which
equilizes the expected payoffs to coy and fast females. Find it.
d) Similarly, find an ESS for the females.e) If males and females follow these ESS’s, what will the
epxected payoffs be? Is this result Pareto optimal?
Gry Bayesowskie• Gry z niepełną informacją (incomplete information), gdzie
gracze poruszają się jednocześnie• Co jest nowego z grze Bayesowskiej:
– Każdy gracz ma jakiś typ (type), który podsumowuje jego prywatną informację
– Każdy gracz dokonuje oceny (belief) typów innych graczy – Wypłaty graczy zależą od typów– Różne typy tego samego gracza mogą grać różne strategie
Gry w postaci strategicznejGra z pełną informacją
1. Zbiór graczy: 2. Zbiór akcji dla każdego gracza:
3. Funkcja wypłat dla każdego gracza:
gdzie
Gra z niepełną informacją
1. Zbiór graczy: 2. Zbiór typów dla każdego gracza:
3. Oceny typów innych graczy dla każdego gracza
4. Zbiór akcji dla każdego gracza:
5. Zbiór funkcji strategii dla każdego gracza zależnych od typu
6. Funkcja wypłat dla każdego gracza i każdego typu gracza
Gry Bayesowskie• Niepełna informacja może dotyczyć czegokolwiek w grze:
– Funkcji wypłat– Akcji innych graczy– Ocen innych (belief of others)
• Harsanyi pokazał, że wprowadzenie typów przy funkcjach wypłat jest właściwym podejściem
• Równowaga Bayesowska Nasha to profil strategii (jedna dla każdego typu każdego gracza) taka, że każdy typ stosuje najlepszą odpowiedź (best response) dysponując swoją oceną (belief) typów innych graczy i ich strategii
Panika finansowa (Bank run)• Ty (gracz I) oraz inny inwestor (gracz II) macie
depozyt w wysokości 100 złotych w banku.• Jeśli inwestor dobrze zarządza pieniędzmi
oboje dostaniecie 150 złotych pod koniec roku. Jeśli nie, stracicie Wasze pieniądze.
• Możesz spróbować wypłacić pieniądze teraz, ale bank ma tylko 100 złotych w gotówce.– Jeśli tylko jeden z Was spróbuje wypłacić dostanie
100 złotych.– Jeśli oboje będziecie starali się wypłacić, oboje
dostaniecie po 50 złotych.
• Wierzysz, że inwestor dobrze zarządza z prawdopodobieństwem q.
• Gracz II wie czy szef banku dobrze zarządza czy źle.
• Ty oraz gracz II musicie jednocześnie zdecydować, czy wypłacić pieniądze z banku, czy nie.
Typy równowag
Wypłacić Nie wypłacać
Wypłacać 50,50 100,0Nie wypłacać 0,100 150,150
Wypłacić Nie wypłacać
Wypłacać 50,50 100,0
Nie wypłacać 0,100 0,0
dobry q słaby (1-q)
• Równowaga separowalna (separating eq.): każdy typ gra inną strategię• Równowaga łączona (pooling eq.): każdy typ gra tą samą strategię
• Jak zachowałbyś się jako gracz II, gdybyś wiedział, że szef banku słabo zarządza?• Wypłaciłbyś pieniądze
Wypłacić Nie wypłacać
Wypłacać 50,50 100,0Nie wypłacać 0,100 150,150
Wypłacić Nie wypłacać
Wypłacać 50,50 100,0
Nie wypłacać 0,100 0,0
Równowagi separowalne:• (Dobry: Wypłacić, Zły: Nie wypłacać)
• Nie może być równowagą, ponieważ Wypłacić jest dominującą strategią dla Słaby• (Dobry: Nie wypłacać, Słaby: Wypłacić):
Oczekiwana wypłata gracza I:• Wypłacić:• Nie wypłacać:
Dwie możliwości:• q<1/2: Gracz I wybierze Wypłacić, wtedy gracz II Dobrego typu powinien
zagrać Wypłacić, co przeczy założeniu, że gra Nie wypłacać• q≥1/2: Gracz I wybierze Nie wypłacać. Najlepszą odpowiedzią gracza II
Dobrego typu jest Nie wypłacać, co nie przeczy założeniuRównowaga separowalna:• dla q<1/2: nie ma• dla q≥1/2 Gracz I: Nie wypłacać, Gracz II: (Dobry: Nie wypłacać, Słaby:
Wypłacać)
dobry q słaby (1-q)
Równowagi łączone:• (Dobry: Nie wypłacać, Słaby: Nie wypłacać)
– Nie może być równowagą, ponieważ Wypłacać jest dominującą strategią dla Słabego
• (Dobry: Wypłacać, Słaby: Wypłacać)Oczekiwana wypłaty gracza I:
• Wypłacać• Nie wypłacać
Gracz I wybierze Wypłacać. Najlepsza odpowiedź dobrego typu gracza II jest Wypłacać. Zatem dla każdej wartości q następująca równowaga łączona jest jedyna:
Rówowaga łączona Gracz I: Wypłacać, Gracz II: (Dobry: Wypłacać, Słaby: Wypłacać)
Jeśli q<1/2 jedyną równowagą jest równowaga łączona panika finansowa
dobry q słaby (1-q)
Wypłacić Nie wypłacać
Wypłacać 50,50 100,0Nie wypłacać 0,100 150,150
Wypłacić Nie wypłacać
Wypłacać 50,50 100,0
Nie wypłacać 0,100 0,0