Metody oceny siły rąk w rozdaniach brydżowych

Post on 21-Mar-2016

47 views 1 download

description

Metody oceny siły rąk w rozdaniach brydżowych. mgr inż. Krzysztof Mossakowski Wydział Matematyki i Nauk Informacyjnych Politechnika Warszawska. Warszawa, 8 listopada 2006. Zagadnienie. - PowerPoint PPT Presentation

Transcript of Metody oceny siły rąk w rozdaniach brydżowych

Metody oceny siły rąk w rozdaniach brydżowych

mgr inż. Krzysztof MossakowskiWydział Matematyki i Nauk Informacyjnych

Politechnika WarszawskaWarszawa, 8 listopada 2006

Zagadnienie Znając dokładny rozkład kart w

rozdaniu brydżowym, odpowiedzieć na pytanie ile lew weźmie para NS przy założeniu optymalnej gry wszystkich graczy

Miara skuteczności - dla ilu procent rozdań: bezbłędny wynik tolerancja jednej lewy tolerancja dwóch lew

Sieci neuronowe Java Neural Network Simulator Sieci feed-forward:

funkcja aktywacji: unipolarna lub bipolarna sigmoidalna,

resilient backpropagation (RProp), 52 lub 104 neurony wejściowe, eksperymenty z liczbą warstw i

neuronów ukrytych, 1 lub 14 neuronów wyjściowych.

Dotychczasowe wyniki

WynikiGra BA, wist WSieć Uczący Testowy(26x4)-(13x4)-1 94.77 | 77.45 | 31.91 94.77 | 77.50 | 32.05(26x4)-(13x4)-(3x4)-5-1 93.86 | 75.67 | 30.00 92.85 | 73.60 | 29.60(26x4)-(13x4)-(7x4)-13-1 96.02 | 80.14 | 33.57 93.87 | 75.70 | 31.04(26x4)-(13x4)-(13x4)-26-13-1 97.29 | 82.02 | 34.99 90.09 | 69.17 | 26.8752-1 94.22 | 76.14 | 30.88 94.15 | 76.15 | 31.2952-4-1 94.52 | 77.13 | 31.80 94.44 | 77.05 | 32.1352-8-1 95.42 | 78.77 | 32.92 95.24 | 78.53 | 32.8852-25-1 96.51 | 81.80 | 35.34 96.07 | 80.88 | 34.6652-52-1 96.79 | 82.23 | 35.45 95.66 | 79.46 | 33.64104-1 94.81 | 77.62 | 32.19 94.76 | 77.52 | 32.19104-30-4-1 96.96 | 82.70 | 35.85 96.46 | 81.43 | 34.86

W procentach: błąd nie większy niż dwie lewy

W procentach: błąd nie większy niż jedna lewa

W procentach:bezbłędnie

WynikiGry kolorowe, wist W (26x4;1) – dodatkowy neuron

52 i 104 – wzmacniane wartości wejściowe neuronów kart atutowych

(26,1x4;1)-(13x4)-(7x4)-13-1 97.26 | 83.74 | 36.21 96.74 | 82.36 | 35.62

52-1 atu*2 NS 0.5 WE 0.5 96.66 | 79.81 | 32.87 96.69 | 79.81 | 32.7952-1 atu*2 NS 1.0 WE -1.0 96.66 | 79.82 | 32.89 96.68 | 79.81 | 32.7952-25-1 atu*2 NS 0.5 WE 0.5 98.78 | 88.22 | 40.51 98.68 | 87.88 | 40.11

test dla BA (nie było w uczeniu) 91.64 | 69.21 | 26.0652-25-1 j.w. + BA 97.83 | 85.12 | 37.75 97.72 | 84.90 | 37.56

test tylko dla gier kolorowych 98.57 | 87.24 | 39.43test tylko dla BA 94.30 | 75.50 | 30.09

WynikiGra w zadany kolor, wist W

52-25-1 Piki N 1.0 S 0.8 W -1.0 E -0.8

98.66 | 87.74 | 39.76 98.47 | 86.83 | 39.16

52-25-1 Piki NS 1.0 WE -1.0 98.91 | 88.81 | 41.04 98.77 | 88.00 | 40.13

test dla Kierów (nie było w uczeniu) 59.18 | 39.09 | 14.12

test dla Kar (nie było w uczeniu) 58.89 | 38.67 | 13.51

test dla Trefli (nie było w uczeniu) 58.86 | 38.90 | 13.77

52-25-1 Kiery NS 1.0 WE -1.0 98.90 | 88.65 | 41.18

98.65 | 87.81 | 40.18

52-25-1 Kara NS 1.0 WE -1.0 98.96 | 88.76 | 40.94

98.66 | 87.68 | 39.96

52-25-1 Trefle NS 1.0 WE -1.0 98.87 | 88.69 | 40.82

98.73 | 87.90 | 40.02

52-26-13-6-1 Piki NS 1.0 WE 0.0 98.95 | 88.86 | 41.06

98.76 | 87.96 | 40.20

52-7x4-20-1 Piki NS 1.0 WE 0.0 98.89 | 88.63 | 40.91

98.83 | 88.37 | 40.77

test dla BA (nie było w uczeniu) 72.87 | 50.34 | 18.42

104-30-4-1 Piki NS 1 WE -1 NW 1 SE -1

99.18 | 89.96 | 42.40

98.57 | 87.07 | 39.11

WynikiGra w Piki, zmiana wistu W 7,1% rozdań liczba lew zależy od

tego, kto wistuje52-25-1 wszystkie wisty 62.53 | 39.89 | 13.66 58.28 | 36.94 | 12.6552-25-1 wisty NS N 1.0 S 0.5 W -1.0 E -0.5

97.78 | 84.43 | 36.82 97.61 | 84.00 | 36.57

52-25-1 wisty NS N 1.0 S 0.8 W -1.0 E -0.8

98.65 | 87.61 | 39.70 98.49 | 87.15 | 39.29

52-25-1 Piki NS 1.0 WE -1.0

98.91 | 88.81 | 41.04 98.77 | 88.00 | 40.13

test dla rozdań z liczbą lew zależną od wistu 97.78 | 83.20 | 35.84test dla rozdań z liczbą lew zależną od wistu 98.85 | 88.37 | 40.46

104-30-4-1 NS 1.0 WE -1.0 NW 1.0 SE -1.0

99.29 | 90.64 | 42.64 99.09 | 89.79 | 41.92

WynikiPodsumowanie

Bez Atu 96.96 | 82.70 | 35.85 96.46 | 81.43 | 34.86Bez Atu i wszystkie kolory 97.83 | 85.12 | 37.75 97.72 | 84.90 | 37.56Wszystkie kolory 98.78 | 88.22 | 40.51 98.68 | 87.88 | 40.11Piki 98.89 | 88.63 | 40.91 98.83 | 88.37 | 40.77Piki ze zmianą wistu 99.29 | 90.64 | 42.64 99.09 | 89.79 | 41.92

Najlepsze dotychczasowe wyniki

uczenie wyłącznie na przykładach bez ludzkiej wiedzy bez znajomości zasad gry

Ludzkie metody oceny siły rąk

Punkty za honory Punkty Miltona Worka Punkty Bambergera Punkty Colleta Punkty czterech asów Polskie punkty Punkty AKD Punkty Reitha Punkty Robertsona Punkty Vernesa

A K Q J T4 3 2 1 07 5 3 1 04 3 2 0.5 0.53 2 1 0.5 07 4 3 0 04 3 2 0 06 4 3 2 17 5 3 2 14 3.08 1.88 0.94 0

Punkty Vernesa Relatywna wartość honorów w stosunku

do asa, obliczona na podstawie 2400 rozdań z Mistrzostw Świata w 1965 roku A K Q J

4,00 3,08 1,88 0,94 Sieci neuronowe 52-1

BA: 4,00 2,67 1,68 1,05 Atu: 4,00 3,11 2,27 1,63 ... 2:

0,59Nie-Atu: 1,82 0,64 -0,26 -0,73

Punkty za układModyfikacje Miltonów Plus

+0.25 za każdego asa +0.5 za każdą dziesiątkę z innym honorem lub

dziewiątką +0.5 za zgrupowanie honorów +0.5 za każdą figurę za ręką

Minus -1 za brak asa na ręce -0.5 za brak dziesiątek -1 za brak odpowiedniej liczby kart towarzyszących

honorowi -0.5 za brak zgrupowania honorow -1 za każdą figurę przed ręką

Trzech i czterech reguła +1 za każdą kartę powyżej 4 w atu +1 za każdą kartę powyżej 3 w bocznym kolorze

Punkty za układModyfikacje Miltonów c.d. Punkty przeliczeniowe Truscotta

+1 za kolor 5+ +1 za singel +2 za renons

Punkty przeliczeniowe Staymana +1 za 4 asy +1 za K, D lub KD w kolorze partnera -1 za brak asów -1 za honory w bocznych kolorach bez obstawy +2 za piątą, szóstą itd. kartę w kolorach 5+ z AKDW lub

AKD +1 za piątą, szóstą itd. kartę w kolory 5+ z co najmniej

dwoma honorami +3 za renons, +2 za singel, +1 za dubleton

Punkty za układUjemna lewa Ile lew jest do oddania w kolorze

1 LU za K, D, x, AD, Ax, Kx, AKW, AKx, ADW, ADx, KDW, KDx

2 LU za DW, Dx, xx, AWx, Axx, KW10, Kxx, DW10, Dxx

3 LU za W10x, xxx

Punkty za układWygrywająca lewa Ile lew jest do wzięcia w kolorze

wartości honorów w krótkich kolorach• np. AKD 3, AKW 2.5, KW10 1,5, KDW 2,

wartości honorów w sekwensach i niskich kart w długich kolorach zawierających sekwensy

• np. AKDW 4, AKD10 3.5, AW109 2.5• +1 za 5 kart w kolorze, +2 za 6, +3 za 7

wartości niskich kart w długich kolorach• np. dla 5-kartowego koloru: +2 dla atu, +1 dla

bocznego koloru dodatkowo za kolor atutowy

• +1 za A, K lub DW, +0,5 za D lub W10• +2 za 6 kart, +1 za 5, +0,5 za 4

krótkość w bocznym kolorze przy grze w atu

Wyniki Bez Atu

1-1 : suma Miltonów pary 93.62 | 76.01 | 31.51

93.73 | 76.41 | 31.37

4-1 : Miltony dla poszczególnych rąk 93.64 | 75.95 | 31.47

93.73 | 76.34 | 31.31

20-1 : Miltony i długości kolorów 93.61 | 75.93 | 31.48

93.73 | 76.34 | 31.31

20-10-5-1 : j.w. 94.23 | 77.60 | 33.00

94.24 | 77.78 | 32.78

4-1 : punkty Vernesa 93.64 | 75.95 | 31.47

93.73 | 76.34 | 31.31

32-25-1 : 8 estymatorów układu dla rąk 95.07 | 78.29 | 32.57

94.94 | 77.71 | 32.50

36-25-1 : 9 estymatorów siły dla rąk 95.03 | 79.09 | 32.84

94.87 | 78.30 | 32.39

54-25-1 : 9 estymatorów siły dla rąk i par 95.00 | 78.95 | 32.93

94.85 | 78.27 | 32.47

68-25-1 : 9 est. siły i 8 est. układu 96.14 | 81.44 | 35.60

96.03 | 81.34 | 35.41

52-25-1 : tylko rozkład (bez estymatorów) 96.51 | 81.80 | 35.34

96.07 | 80.88 | 34.66

(52+36)-25-1 : rozkład i 9 estymatorów siły

96.77 | 82.37 | 35.65

96.33 | 81.39 | 35.01

(52+32)-25-1 : rozkład i 8 estymatorów układu

97.40 | 84.34 | 37.66

96.86 | 83.02 | 36.67

(52+102)-77-38-19-1 : rozkład, siła i układ dla rąk i par

98.28 | 86.93 | 39.95

96.06 | 81.21 | 35.15

(dalej przeuczenie)

Liczba punktów a liczba lew(wg sieci 1-1) Bez Atu

Liczba punktów Liczba lew0 – 7 0

8 – 10 1 11 – 13 214 – 15 316 – 17 418 – 19 5

20 621 – 22 723 – 24 825 – 26 927 – 28 1029 – 31 1132 – 34 1235 – 40 13

93.73 | 76.41 | 31.37

Wyniki Piki

4-1 : Miltony dla poszczególnych rąk 76.38 | 50.05 | 17.09

76.22 | 49.64 | 16.91

20-1 : Miltony i długości kolorów 96.92 | 82.40 | 35.35

97.00 | 82.21 | 35.29

20-10-5-1 : j.w. 98.73 | 88.30 | 40.52

98.75 | 88.21 | 40.30

32-25-1 : 8 estymatorów układu dla rąk 98.70 | 88.32 | 40.82

98.56 | 88.07 | 39.94

36-25-1 : 9 estymatorów siły dla rąk 76.84 | 50.09 | 16.94

76.83 | 49.77 | 16.75

68-25-1 : 9 est. siły i 8 est. układu 98.74 | 89.02 | 41.55

98.71 | 88.70 | 40.94

52-25-1 : tylko rozkład (bez estymatorów)

98.91 | 88.81 | 41.04

98.77 | 88.00 | 40.13

52-7x4-20-1 : j.w. 98.89 | 88.63 | 40.91

98.83 | 88.37 | 40.77

(52+16)-25-1 : rozkład i długości kolorów 99.60 | 92.98 | 46.19

99.54 | 92.38 | 45.40

(52+16)-34-17-8-1 : j.w. 99.81 | 95.45 | 50.52

99.75 | 94.50 | 49.03

ze zmianą wistu:104-30-4-1 : tylko rozkład [104] 99.29 | 90.64 |

42.6499.09 | 89.79 | 41.92

(104+68)-50-10-1 : rozkład i 8 est. układu

99.88 | 96.34 | 52.45

99.46 | 92.40 | 45.54

Punkty Zara Siła ręki to suma:

wartości honorów wg puktacji:A: 6, K: 4, D: 2, W: 1

różnicy długości najdłuższego i najkrótszego koloru

sumy długości dwóch najdłuższych kolorów Wyniki dla Pików ze zmianą wistu:

4-1 84.11 | 60.69 | 22.72

84.08 | 60.61 | 22.62

4-3-2-1 83.74 | 61.65 | 23.73

83.77 | 61.60 | 23.65

52-25-1 98.91 | 88.81 | 41.04

98.77 | 88.00 | 40.13

(52+4)-25-1 91.86 | 72.04 | 28.60

91.49 | 71.27 | 28.18

Reprezentacja danych

Reprezentacja danych26x4

Reprezentacja danych52

Reprezentacja danych104

Reprezentacja danych52x4 NOWOŚĆ

Wyniki reprezentacji 52x4Piki ze zmianą wistu

52x4-4x4x4-5x4-7-1 99.58 | 93.54 | 47.11

99.56 | 93.31 | 46.82

52x4-(3x4,4)x4-8x4-8x2-8-1 99.73 | 95.13 | 49.54

99.60 | 93.14 | 46.69

52x4-8x4-8-1 99.64 | 94.02 | 47.87

99.63 | 93.75 | 47.32

52x4-13x4-13-1 99.81 | 95.88 | 51.54

99.79 | 95.49 | 50.62

52x4-26x4-26-13-1 99.92 | 97.28 | 55.07

99.88 | 96.48 | 53.11

(52x4+16)-(13x4+8)-16-1rozkład i długości kolorów

99.80 | 95.85 | 51.33

99.79 | 95.44 | 50.70

(52x4+84)-(13x4+21)-26-1rozkład, długości kolorów, estymatory siły, estymatory układu

99.86 | 96.68 | 53.63

99.84 | 96.12 | 52.47

Porównanie procesu nauki (26x4)

10 tys. rozdań ~ 50 tys. iteracji

52 i 104 100 tys. rozdań ~ 1 tys. iteracji

52x4 100 tys. rozdań ~ 10 tys. iteracji

52x4

104

52

26x4

Porównanie wielkości sieciSieć

Liczbaneuronó

w

Liczbapołącze

ń

Wynik(Piki ze zmianą

wistu)(26x4)-(13x4)-(7x4)-13-1 198 845 98.76 | 88.00 | 39.9052-25-1 78 1325 98.49 | 87.15 | 39.29104-30-4-1 139 3244 99.09 | 89.79 | 41.92104-52-26-13-1 196 7111 98.60 | 87.45 | 39.60104-74-44-14 236 11568 96.99 | 81.98 | 35.1352x4-4x4x4-5x4-7-1 300 1299 99.56 | 93.31 | 46.8252x4-(3x4,4)x4-8x4-8x2-8-1 329 2360 99.60 | 93.14 | 46.6952x4-8x4-8-1 249 1928 99.63 | 93.75 | 47.3252x4-13x4-13-1 274 3393 99.79 | 95.49 | 50.6252x4-26x4-26-13-1 352 8463 99.88 | 96.48 | 53.11

Ekperymenty

Sprawdzenie powtarzalności wyników 4 sieci 52-25-1 uczone niezależnie

na tych samych rozdaniach98.84 | 88.69 | 40.91 98.52 | 87.23 | 39.5498.87 | 88.65 | 41.16 98.51 | 87.11 | 39.6098.82 | 88.47 | 40.89 98.52 | 87.17 | 39.5898.87 | 88.61 | 40.79 98.51 | 87.09 | 39.42

BA Atu zgodne wyniki 61.23% 63.40%1 lewa rozbieżności 37.93% 36.56%2 lewy rozbieżności 0.81% 0.04%3 lewy rozbieźności 0.03% 0.00%

Użycie średniej wartości wynikowej kilku sieci Cztery niezależnie uczone sieci

52-25-1:

Biorąc ich średnią wartość wyjścia:

Kontrakty atutowe98.81 | 88.85 | 40,7198.86 | 88.75 | 41,0298.81 | 88.51 | 40.7198.87 | 88.62 | 40.71

Bez Atu96.21 | 81.29 | 34.7796.16 | 81.30 | 34.8696.36 | 81.72 | 35.0096.36 | 81.94 | 35.1596.43 | 82.14 |

35.4698.91 | 89.13 |

41.13

Sprawdzenie skuteczności dla poszczególnych liczb lewlewy # ±2 ±1 0 0 1138 93,32% 66,61% 12,30% 1 2725 97,39% 81,21% 34,53% 2 5156 98,10% 86,66% 40,73% 3 8043 98,93% 88,96% 41,41% 4 10447 98,94% 89,04% 40,36% 5 12201 98,85% 88,67% 40,80% 6 12927 99,03% 88,75% 41,32% 7 12709 99,10% 88,99% 40,50% 8 11467 99,28% 89,29% 40,46% 9 9618 99,14% 89,19% 42,14%10 6866 98,89% 88,45% 40,58%11 4225 97,94% 85,87% 42,32%12 1935 97,57% 81,71% 31,94%13 543 94,66% 73,85% 9,39%

Piki52-25-1

Zmiana docelowych wartości  Równy podział Proporcjonalny podział

Liczba rozdań

Liczbakew

Wielkość przedziału

Wartość docelowa

Wielkość przedziału

Wartość docelowa

1138 0   0,1000   0,10002725 1 0,0615 0,1615 0,0155 0,11555156 2 0,0615 0,2231 0,0315 0,14708043 3 0,0615 0,2846 0,0528 0,1998

10447 4 0,0615 0,3462 0,0740 0,273712201 5 0,0615 0,4077 0,0906 0,364312927 6 0,0615 0,4692 0,1005 0,464812709 7 0,0615 0,5308 0,1025 0,567411467 8 0,0615 0,5923 0,0967 0,6641

9618 9 0,0615 0,6538 0,0843 0,74846866 10 0,0615 0,7154 0,0659 0,81444225 11 0,0615 0,7769 0,0444 0,85871935 12 0,0615 0,8385 0,0246 0,8834

543 13 0,0615 0,9000 0,0166 0,9000100000          

           52-25-1:   98.77 | 88.00 | 40.13 98.66 | 87.41 | 39.98

Sprawdzenie skuteczności na granicachLiczba lew Skuteczność Liczba lew

0 100.00 | 98.25 | 84.21 0-1 100.00 | 99.76 | 48.461 99.91 | 96.95 | 46.86 1-2 99.34 | 88.47 | 40.382 99.42 | 89.61 | 40.71 2-3 98.37 | 86.59 | 38.273 98.68 | 88.09 | 40.93 3-4 98.55 | 86.23 | 37.964 98.85 | 88.49 | 40.34 4-5 98.60 | 86.01 | 37.285 98.87 | 88.93 | 41.23 5-6 98.47 | 86.38 | 37.956 98.83 | 89.21 | 41.73 6-7 98.41 | 86.49 | 38.747 98.91 | 88.65 | 41.64 7-8 98.48 | 86.54 | 37.138 98.43 | 87.60 | 40.42 8-9 98.43 | 86.73 | 38.619 99.31 | 88.29 | 41.68 9-10 98.66 | 86.85 | 38.75

10 98.95 | 89.55 | 42.05 10-11 98.93 | 87.73 | 40.4711 99.80 | 92.15 | 47.27 11-12 99.68 | 92.26 | 43.1512 99.54 | 97.26 | 53.05 12-13 100.00 | 99.48 | 38.6613 100.00 | 100.00 | 100.00

Piki52-25-1

Uczenie na błędach Piki, sieci 52-25-1 I faza

98.77 | 88.00 | 40.13

II faza – inna sieć uczona na błędach I fazy97.48 | 77.56 | 15.17wynik dla poprawnych z I fazy: 100.00 | 99.96 | 74.35

III faza – inna sieć uczona na błędach II fazy96.61 | 73.01 | 12.77wynik dla poprawnych z I fazy: 100.00 | 99.87 | 70.69wynik dla poprawnych z II fazy: 100.00 | 98.34 | 39.15

Uczenie na błędach kontynuacja Używając 2 sieci w II fazie (jedna uczona na

błędach przeszacowania, druga niedoszacowania) przeszacowanie:

uczenie: 99.85 | 98.29 | 65.72na całym testowym: 91.85 | 65.02 | 21.13

niedoszacowanie:uczenie: 99.94 | 98.56 | 67.68na całym testowym: 92.47 | 66.52 | 22.08

Tworząc system 3 sieci (dwie powyższa i ta z pierwszej fazy) i jako wynik biorąc ich średnią:

98.80 | 88.01 | 40.37dla porównania wynik pierwotnej sieci:

98.77 | 88.00 | 40.13

Przykładowe rozdania

Przykładowe rozdanie 1Piki, wist W

Liczba lew pary NS: 10Wyniki sieci:

(52x4)-(13x4)-13-1(52x4)-(26x4)-26-13-1

104-30-4-152-25-1

(104+68)-50-10-1(52x4+84)-(13x4+21)-

26-1

101087

1010

Przykładowe rozdanie 2Piki, wist N

Liczba lew pary NS: 3Wyniki sieci:

(52x4)-(13x4)-13-1(52x4)-(26x4)-26-13-1

104-30-4-152-25-1

(104+68)-50-10-1(52x4+84)-(13x4+21)-

26-1

535554

Przykładowe rozdanie 3Piki, wist N lub S

wistN S

Liczba lew pary NS: 4 3Wyniki sieci:

(52x4)-(13x4)-13-1(52x4)-(26x4)-26-13-1

104-30-4-152-25-1

(104+68)-50-10-1(52x4+84)-(13x4+21)-

26-1

344433

434444

Przykładowe rozdanie 4Piki, wist N

Liczba lew pary NS: 0Wyniki sieci:

(52x4)-(13x4)-13-1(52x4)-(26x4)-26-13-1

104-30-4-152-25-1

(104+68)-50-10-1(52x4+84)-(13x4+21)-

26-1

433434

Podsumowanie:

Wyniki najlepszej sieci52x4-26x4-26-13-1 Bez Atu: 96.89 | 83.64 | 37.31 Piki ze zmianą wistu: 99.88 | 96.48 | 53.11

Uczenie wyłącznie na przykładach Bez ludzkiej wiedzy Bez znajomości zasad gry

Pomysły

?