Strategie kwantowe w teorii gier

21
Gra w odwracanie monety (PQ penny flip) Podstawy klasycznej teorii gier Strategie kwantowe w Wojnie plci Kwantowy Paradoks więźnia Strategie kwantowe w teorii gier Adam Wyrzykowski Uniwersytet Jagielloński [email protected] 18 stycznia 2015 Adam Wyrzykowski Strategie kwantowe w teorii gier

Transcript of Strategie kwantowe w teorii gier

Page 1: Strategie kwantowe w teorii gier

Gra w odwracanie monety (PQ penny flip)Podstawy klasycznej teorii gier

Strategie kwantowe w Wojnie płciKwantowy Paradoks więźnia

Strategie kwantowe w teorii gier

Adam Wyrzykowski

Uniwersytet Jagielloński

[email protected]

18 stycznia 2015

Adam Wyrzykowski Strategie kwantowe w teorii gier

Page 2: Strategie kwantowe w teorii gier

Gra w odwracanie monety (PQ penny flip)Podstawy klasycznej teorii gier

Strategie kwantowe w Wojnie płciKwantowy Paradoks więźnia

Plan prezentacji

1 Gra w odwracanie monety (PQ penny flip)

2 Podstawy klasycznej teorii gierWojna płciDefinicje i pojęciaRównowagi Nasha w Wojnie płci

3 Strategie kwantowe w Wojnie płciKwantowanie Wojny płciKwantowa Wojna płci pod nieobecność splątaniaWpływ splątania na kwantową Wojnę płci

4 Kwantowy Paradoks więźnia

Adam Wyrzykowski Strategie kwantowe w teorii gier

Page 3: Strategie kwantowe w teorii gier

Gra w odwracanie monety (PQ penny flip)Podstawy klasycznej teorii gier

Strategie kwantowe w Wojnie płciKwantowy Paradoks więźnia

Gra w odwracanie monety (PQ penny flip)

Zasady gry

Gracze Q i P nie znają bieżącej orientacjimonety ani ruchów przeciwnika.Początkowo moneta jest ustawionareszką do góry. Ruch każdego z graczypolega na odwróceniu monety lubpozostawieniu jej stanu bez zmian.Kolejność ruchów jest następująca:

pierwszy ruch gracza Q,

ruch gracza P,

kończący rozgrywkę ruch gracza Q.

Jeżeli końcowy stan monety to reszka,wygrywa Q, jeżeli orzeł – wygrywa P.

NN NF FN FFN -1 1 1 -1F 1 -1 -1 1

Tabela : Tabela wypłat gracza P

Adam Wyrzykowski Strategie kwantowe w teorii gier

Page 4: Strategie kwantowe w teorii gier

Gra w odwracanie monety (PQ penny flip)Podstawy klasycznej teorii gier

Strategie kwantowe w Wojnie płciKwantowy Paradoks więźnia

Kwantowanie gry w odwracanie monety

|ψ >= a|R > +b|O >

aa∗ + bb∗ = 1

|R >↔(

10

)|O >↔

(01

)

Strategie klasyczne

Liniowa kombinacja odwróceniamonety z prawdopodobieństwemp i pozostawienia jej stanu bezzmian z pr-stwem (1− p):

UP = p

(0 11 0

)+(1−p)

(1 00 1

)

Strategie kwantowe

Operacje unitarne:

UQ =

(c dd∗ −c∗

),

gdzie |c|2 + |d |2 = 1.Adam Wyrzykowski Strategie kwantowe w teorii gier

Page 5: Strategie kwantowe w teorii gier

Gra w odwracanie monety (PQ penny flip)Podstawy klasycznej teorii gier

Strategie kwantowe w Wojnie płciKwantowy Paradoks więźnia

Przewaga strategii kwantowych

|ψ1 >= UQ |R >= 1√2

(1 11 −1

)(10

)= 1√

2

(11

)= 1√

2(|R > +|O >) (1)

|ψ2 >= UP |ψ1 >= 1√2

(p

(0 11 0

)+ (1− p)

(1 00 1

))(11

)= 1√

2

(11

)(2)

|ψ3 >= UQ |ψ2 >= 1√2

1√2

(1 11 −1

)(11

)=

(10

)= |R > (3)

Adam Wyrzykowski Strategie kwantowe w teorii gier

Page 6: Strategie kwantowe w teorii gier

Gra w odwracanie monety (PQ penny flip)Podstawy klasycznej teorii gier

Strategie kwantowe w Wojnie płciKwantowy Paradoks więźnia

Wojna płciDefinicje i pojęciaRównowagi Nasha w Wojnie płci

Wojna płci

Rysunek : Macierz wypłat (źródło obrazka [2]).

α > β > γ

Adam Wyrzykowski Strategie kwantowe w teorii gier

Page 7: Strategie kwantowe w teorii gier

Gra w odwracanie monety (PQ penny flip)Podstawy klasycznej teorii gier

Strategie kwantowe w Wojnie płciKwantowy Paradoks więźnia

Wojna płciDefinicje i pojęciaRównowagi Nasha w Wojnie płci

Definicje i pojęcia (cz. 1)

Statyczna gra o pełnej informacji

Każdy z graczy zna dostępne strategie innych i wynikające znich wypłaty, ale poznają wybrane przez nich strategie dopierowraz z końcem gry. Należy określić:

liczbę graczy i = 1, 2, ...,N;

zbiory strategii dla każdego gracza {sαi };funkcje wypłaty $i = $i (s1, s2, ..., sN), które przypisują i−temugraczowi liczbę rzeczywistą (wypłatę) w zależności odstrategii wybranych przez wszystkich graczy.

W przypadku Wojny płci i = 2, zbiór strategii Alicji (Boba) to{O,T}, zaś funkcje wypłaty $1(s1, s2) oraz $2(s1, s2) są określoneprzez macierz wypłaty, np. $1(O,O) = $2(T ,T ) = α.

Adam Wyrzykowski Strategie kwantowe w teorii gier

Page 8: Strategie kwantowe w teorii gier

Gra w odwracanie monety (PQ penny flip)Podstawy klasycznej teorii gier

Strategie kwantowe w Wojnie płciKwantowy Paradoks więźnia

Wojna płciDefinicje i pojęciaRównowagi Nasha w Wojnie płci

Definicje i pojęcia (cz. 2)

Mocna dominacja strategii

Strategię i−tego gracza si nazywamy ściśle zdominowaną przezstrategię s̃i , jeżeli:

$i (s1, ..., si , ..., sN) < $i (s1, ..., s̃i , ..., sN)

dla każdego wyboru (s1, ..., si−1, si+1, ..., sN).

Równowaga Nasha

Zespół strategii (s?1 , s?2 , ..., s

?N) stanowi równowagę Nasha, jeżeli dla

każdego gracza i zachodzi:

$i (s?1 , ..., s

?i−1, s

?i , s

?i+1, ..., s

?N) ­ $i (s

?1 , ..., s

?i−1, si , s

?i+1, ..., s

?N)

dla każdej strategii si dostępnej dla i−tego gracza.Adam Wyrzykowski Strategie kwantowe w teorii gier

Page 9: Strategie kwantowe w teorii gier

Gra w odwracanie monety (PQ penny flip)Podstawy klasycznej teorii gier

Strategie kwantowe w Wojnie płciKwantowy Paradoks więźnia

Wojna płciDefinicje i pojęciaRównowagi Nasha w Wojnie płci

Definicje i pojęcia (cz. 3)

Strategie mieszane

Strategia mieszana dla i−tego gracza to rozkładprawdopodobieństwa, który przypisuje pr-stwo pαi każdej czystejstrategii sαi ze zbioru strategii i−tego gracza. Wówczas$i (s1, s2, ..., sN) jest zastępowane przez funkcję oczekiwanejwypłaty:

$̄i ({p1}, {p2}, ..., {pN}) =∑

α1,α2,...,αN

pα11 pα2

2 ...pαNN $i (s

α11 , sα2

2 , ..., sαNN )

Adam Wyrzykowski Strategie kwantowe w teorii gier

Page 10: Strategie kwantowe w teorii gier

Gra w odwracanie monety (PQ penny flip)Podstawy klasycznej teorii gier

Strategie kwantowe w Wojnie płciKwantowy Paradoks więźnia

Wojna płciDefinicje i pojęciaRównowagi Nasha w Wojnie płci

Równowagi Nasha w Wojnie płci

p−prawdopodobieństwo, że Alicja wybierze operę, p ∈ [0, 1]q−prawdopodobieństwo, że Bob wybierze operę, q ∈ [0, 1]

$̄A(p, q) = p[q(α− 2γ + β) + γ − β] + β + q(γ − β) (4)

$̄B(p, q) = q[p(α− 2γ + β) + γ − α] + α + p(γ − α) (5){$̄A(p?, q?)− $̄A(p, q?) = (p? − p)[q?(α + β − 2γ)− β + γ] ­ 0

$̄B(p?, q?)− $̄B(p?, q) = (q? − q)[p?(α + β − 2γ)− α + γ] ­ 0(6)

p?(1) = 1, q?(1) = 1

$̄A(1, 1) = α

$̄B(1, 1) = β

p?(2) = 0, q?(2) = 0

$̄A(0, 0) = β

$̄B(0, 0) = α

p?(3) = α−γα+β−2γ

q?(3) = β−γα+β−2γ

$̄A = $̄B = αβ−γ2

α+β−2γ

Adam Wyrzykowski Strategie kwantowe w teorii gier

Page 11: Strategie kwantowe w teorii gier

Gra w odwracanie monety (PQ penny flip)Podstawy klasycznej teorii gier

Strategie kwantowe w Wojnie płciKwantowy Paradoks więźnia

Kwantowanie Wojny płciKwantowa Wojna płci pod nieobecność splątaniaWpływ splątania na kwantową Wojnę płci

Kwantowanie gry (cz. 1)

Reguła 1

Przestrzeń strategii Alicji SA (Boba SB) jest dwuwymiarowąprzestrzenią Hilberta:

|ψ >= a|O > +b|T >, |a|2 + |b|2 = 1 .

Na początku gry ustala się dowolny początkowy stan |ψin > zprzestrzeni S = SA ⊗ SB = (|OO >, |OT >, |TO >, |TT >).

Reguła 2

Ruch Alicji (Boba) polega na wykonaniu operacji unitarnej A ∈ SA

(B ∈ SB) na jej (jego) kubicie stanu |ψin >. Końcowy stan wynosi|ψfin >= A⊗ B|ψin >.

Adam Wyrzykowski Strategie kwantowe w teorii gier

Page 12: Strategie kwantowe w teorii gier

Gra w odwracanie monety (PQ penny flip)Podstawy klasycznej teorii gier

Strategie kwantowe w Wojnie płciKwantowy Paradoks więźnia

Kwantowanie Wojny płciKwantowa Wojna płci pod nieobecność splątaniaWpływ splątania na kwantową Wojnę płci

Kwantowanie gry (cz. 2)

Reguła 3

Wartości $̄A i $̄B znajduje się obliczając kwadraty modułów rzutówstanu |ψfin > na wektory bazowe |OO >, |OT >, |TO >, |TT >,a następnie dodając uzyskane liczby przemnożone przezodpowiednie współczynniki z macierzy wypłat.

Reguła 4

Ostatecznie Alicja musi zagrać klasyczną strategię, która wynika zpomiaru na końcowym stanie kwantowym, tzn. z rzutowania|ψfin > na wektory bazowe SA. Podobnie Bob.

Adam Wyrzykowski Strategie kwantowe w teorii gier

Page 13: Strategie kwantowe w teorii gier

Gra w odwracanie monety (PQ penny flip)Podstawy klasycznej teorii gier

Strategie kwantowe w Wojnie płciKwantowy Paradoks więźnia

Kwantowanie Wojny płciKwantowa Wojna płci pod nieobecność splątaniaWpływ splątania na kwantową Wojnę płci

Równowagi Nasha – faktoryzowalne stany |ψin > (cz. 1)

Skoro |ψin > jest faktoryzowalny, można przyjąć bez stratyogólności |ψin >= |OO >.

W bazie {|O >, |T >} operacje Alicji i Boba mają postać:

A =

(a b−b∗ a∗

)B =

(c d−d∗ c∗

),

gdzie |a|2 + |b|2 = |c |2 + |d |2 = 1.

Stan końcowy wynosi zatem:

|ψfin >= A⊗ B|ψin >=

= ac |OO > −ad∗|OT > −b∗c|TO > +b∗d∗|TT >

Adam Wyrzykowski Strategie kwantowe w teorii gier

Page 14: Strategie kwantowe w teorii gier

Gra w odwracanie monety (PQ penny flip)Podstawy klasycznej teorii gier

Strategie kwantowe w Wojnie płciKwantowy Paradoks więźnia

Kwantowanie Wojny płciKwantowa Wojna płci pod nieobecność splątaniaWpływ splątania na kwantową Wojnę płci

Równowagi Nasha – faktoryzowalne stany |ψin > (cz. 2)

Zgodnie z Regułą 3 znajdujemy więc:

$̄A = |a|2[(α + β − 2γ)|c|2 − β + γ] + β + (γ − β)|c |2 (7)

$̄B = |c|2[(α + β − 2γ)|a|2 − α + γ] + α + (γ − α)|a|2 (8)

Wynik ten jest identyczny jak uzyskany w klasycznej teorii gier,jeżeli p = |a|2 oraz q = |c |2. Równowagi Nasha:

(|a|2 = 0, |c |2 = 0) |ψfin >= |TT > $̄A = β $̄B = α

(|a|2 = 1, |c |2 = 1) |ψfin >= |OO > $̄A = α $̄B = β(|a|2 = α−γ

α+β−2γ , |c |2 = β−γ

α+β−2γ

)$̄A = $̄B = αβ−γ2

α+β−2γ

|ψfin >=(√α−γ|O>−

√β−γ|T>)⊗(

√β−γ|O>−

√α−γ|T>)

α+β−2γ

Adam Wyrzykowski Strategie kwantowe w teorii gier

Page 15: Strategie kwantowe w teorii gier

Gra w odwracanie monety (PQ penny flip)Podstawy klasycznej teorii gier

Strategie kwantowe w Wojnie płciKwantowy Paradoks więźnia

Kwantowanie Wojny płciKwantowa Wojna płci pod nieobecność splątaniaWpływ splątania na kwantową Wojnę płci

Nowe równowagi Nasha – stany splątane

|ψin >= a|OO > +b|TT >, |a|2 + |b|2 = 1

ρA(B)fin = pIρ

A(B)in I †+(1−p)Cρ

A(B)in C † (C |O >= T , C |T >= O)

1 p?(1) = q?(1) = 1

$̄A(1, 1) = α|a|2 + β|b|2 $̄B(1, 1) = β|a|2 + α|b|2

2 p?(2) = q?(2) = 0

$̄A(0, 0) = β|a|2 + α|b|2 $̄B(0, 0) = α|a|2 + β|b|2

3 p?(3) = (α−γ)|a|2+(β−γ)|b|2α+β−2γ q?(3) = (α−γ)|b|2+(β−γ)|a|2

α+β−2γ

$̄A(p?(3), q?(3)) = $̄B(p?(3), q

?(3)) =

αβ + (α− β)2|a|2|b|2 − γ2

α + β − 2γ

Adam Wyrzykowski Strategie kwantowe w teorii gier

Page 16: Strategie kwantowe w teorii gier

Gra w odwracanie monety (PQ penny flip)Podstawy klasycznej teorii gier

Strategie kwantowe w Wojnie płciKwantowy Paradoks więźnia

Kwantowanie Wojny płciKwantowa Wojna płci pod nieobecność splątaniaWpływ splątania na kwantową Wojnę płci

Ostateczny kompromis

1. Brak samotnych wieczorów

$̄A(1, 1) + $̄B(1, 1) = $̄A(0, 0) + $̄B(0, 0) = α + β

2. Równowagi Nasha 1 i 2 można ”połączyć”

{$̄A(1, 1)− $̄A(0, 0) = (α− β)(|a|2 − |b|2)

$̄B(1, 1)− $̄B(0, 0) = (α− β)(|b|2 − |a|2)

kompromis=⇒ |a| = |b| = 1√

2

3. Najlepsza strategia

|ψin >=1√2

(|OO > +|TT >) = |ψfin >

(p? = 0, q? = 0) albo (p? = 1, q? = 1) ⇒ $̄A = $̄B =α + β

2Adam Wyrzykowski Strategie kwantowe w teorii gier

Page 17: Strategie kwantowe w teorii gier

Gra w odwracanie monety (PQ penny flip)Podstawy klasycznej teorii gier

Strategie kwantowe w Wojnie płciKwantowy Paradoks więźnia

Paradoks więźnia – klasyczne i kwantowe sformułowanie

Bob: C Bob: DAlice: C (3,3) (0,5)Alice: D (5,0) (1,1)

|ψf >= J†(UA ⊗ UB)J|CC > (9)

U(θ, φ) =

(e iφ cos θ/2 sin θ/2− sin θ/2 e−iφ cos θ/2

)(10)

U(0, 0) = C =

(1 00 1

)U(π, 0) = D =

(0 1−1 0

)U(0, π2

)= Q =

(i 00 −i

)

J = exp[iγD ⊗ D

2

]γ ∈ [0, π/2] – wsp. splątania (11)

Adam Wyrzykowski Strategie kwantowe w teorii gier

Page 18: Strategie kwantowe w teorii gier

Gra w odwracanie monety (PQ penny flip)Podstawy klasycznej teorii gier

Strategie kwantowe w Wojnie płciKwantowy Paradoks więźnia

Paradoks więźnia - gra separowalna (γ = 0)

Rysunek : Wypłata Alicji w grze separowalnej. Na wykresie wybrano specjalnąparametryzację, w której UA i UB zależą tylko od jednego parametrut ∈ [−1, 1]: przyjmujemy UA = U(tπ, 0) dla t ∈ [0, 1] oraz UA = U(0,−tπ/2)dla t ∈ [−1, 0) (podobnie dla Boba). Zdrada D odpowiada t = 1, współpraca Cto t = 0, a strategia Q jest reprezentowana przez t = −1 (źródło obrazka [3]).

Adam Wyrzykowski Strategie kwantowe w teorii gier

Page 19: Strategie kwantowe w teorii gier

Gra w odwracanie monety (PQ penny flip)Podstawy klasycznej teorii gier

Strategie kwantowe w Wojnie płciKwantowy Paradoks więźnia

Paradoks więźnia - maksymalne splątanie (γ = π/2)

Rysunek : Wypłata Alicji w grze o maksymalnym splątaniu (źródłoobrazka [3]).

Adam Wyrzykowski Strategie kwantowe w teorii gier

Page 20: Strategie kwantowe w teorii gier

Gra w odwracanie monety (PQ penny flip)Podstawy klasycznej teorii gier

Strategie kwantowe w Wojnie płciKwantowy Paradoks więźnia

Podsumowanie

Poszerzenie przestrzeni dostępnych strategii o strategiekwantowe może prowadzić do powstawania nowych równowagNasha i znikania dotychczasowych.

Zastosowanie strategii kwantowych może prowadzić dorozwiązań korzystniejszych dla obu graczy, klasycznieniedostępnych.

Szczególną rolę w grach kwantowych spełnia splątanie stanu,na krórym operacje mogą wykonywać gracze.

Gracz dysponujący strategią kwantową grający przeciwkograczowi korzystającemu wyłącznie ze strategii klasycznych naogół będzie posiadać przewagę.

Adam Wyrzykowski Strategie kwantowe w teorii gier

Page 21: Strategie kwantowe w teorii gier

Gra w odwracanie monety (PQ penny flip)Podstawy klasycznej teorii gier

Strategie kwantowe w Wojnie płciKwantowy Paradoks więźnia

Literatura

[1] David A. Meyer (1999)

Quantum strategies

Physical Review Letters 82 (5), 1052–1055.

[2] L. Marinatto, T. Weber (2000)

A quantum approach to static games of complete information

Physics Letters A 272, 291–303.

[3] J. Eisert, M. Wilkens, M. Lewenstein (1999)

Quantum games and quantum strategies

Physical Review Letters 83 (15), 3077–3080.

[4]

http://mindyourdecisions.com/blog/2012/09/11/quantum-coin-flipping-game-theory/

Adam Wyrzykowski Strategie kwantowe w teorii gier