Modele probabilistyczne (bayesowskie) racjonalności człowieka

Post on 11-Jan-2017

217 views 0 download

Transcript of Modele probabilistyczne (bayesowskie) racjonalności człowieka

WSTĘP DO KOGNITYWISTYKI

PROBABILISTYCZNE MODELE

RACJONALNOŚCI I POZNANIA

Marcin Miłkowski

ŚWIAT NIEPEWNOŚCI Nasze zmysły dostarczają informacje, w których jest dużo szumu (zakłóceń). Szum i niepewność wszędzie: złudzenia wzrokowe grzechy pamięci wieloznaczność języka

PROBABILIZM Procesy poznawcze opierają się na wnioskowaniu probabilistycznym.Percepcja, wnioskowanie dedukcyjne i indukcyjne, kategoryzacja, uczenie, rozumienie i tworzenie wypowiedzi…

TRZY POZIOMY MARRA JESZCZE RAZObliczeniowy (ekologiczny)

Probabilistyczna charakterystyka zadania w ramach tzw. analizy racjonalnej

Algorytmy i reprezentacja Algorytmy probabilistyczne operujące na reprezentacjach prawdopodobieństw

Implementacja Hipoteza mózgu probabilistycznego (zwykle bayesowskiego)

PROBABILIZM Korzenie: rachunek prawdopodobieństwa Bernoulliego Fizjologia: prace Helmholtza i hipoteza nieświadomego wnioskowania Współcześnie: bayesizm jako jeden z najważniejszych paradygmatów

PROBABILISTYCZNE WNIOSKOWANIE NIEŚWIADOME Hermann von Helmholtz (1866): oczy nie wyczuwają kierunku wzroku, lecz przewidują go na podstawie tzw. kopii eferentnej, czyli kopii polecenia motorycznego do mięśni oka.

Kopia eferentna to jeden z możliwych sposobów realizacji tzw. modeli wyprzedzających (forward models).

RACJONALNE WNIOSKOWANIE STATYSTYCZNE (BAYES, LAPLACE)

Hhhphdp

hphdpdhp)()|(

)()|()|(

Prawdopodobieństwokońcowe

Wiarygodność Prawdopodobieństwowstępne

Suma w przestrzeniwszystkich hipotez

P (pies|szczekanie) = P(szczekanie)

P(szczekanie|pies) P(pies)

Hipoteza: „Tu jest pies”Dane zmysłowe: odgłos

szczekania

Prawdopodobieństwo końcowe

Wiarygodność (likelihood)

Prawdopodobieństwo wstępne hipotezy

(prior)

Prawdopodobieństwo wstępne danych

0,6 0,3

0,2

0,9

ANALIZA RACJONALNA WG JOHNA ANDERSONA (1988) Przepis na wyjaśnianie w kognitywistyce:1. Określ cele systemu poznawczego.2. Opracuj model formalny środowiska, do

którego przystosowany jest system.3. Załóż minimalne koszty obliczeniowe.4. Wyprowadź optymalną funkcję zachowania

ze względu na 1-3.5. Sprawdź empirycznie, czy predykcje funkcji

są poprawne.6. Jeśli nie, iteruj.

KRYTYKA ANALIZY RACJONALNEJ Herbert Simon (1988): Przepis Andersona pomija strukturę systemu poznawczego, analiza może dotyczyć tylko struktury środowiska.

Ludzie nie są optymalni. Trudno znaleźć jeden cel systemu.

J. Bowers i C. Davis (2012): To są takie sobie bajeczki! Modele bayesowskie dopasowują się do danych eksperymentalnych i nic nie wyjaśniają. Są płytkie.

ARCHITEKTURY POZNAWCZE I BAYES Anderson jest twórcą architektur poznawczych (m.in. ACT-R), które zawierają reguły produkcji. Jego metoda dotyczy przede wszystkim poziomu obliczeniowego w sensie Marra.

ACT-R łączy reguły symboliczne z sieciami neuropodobnymi.

PRZYKŁAD 1: RACJONALNA ANALIZA PRZECIWKO HEURYSTYKOM Gerd Gigerenzer i Daniel Goldstein (1996): Ludzie posługują się heurystykami, które są omylne, ale błyskawiczne.

Przykład: heurystyka „weź najlepszy”, stosowana do określania, które miasto jest większe.

DYGRESJA: PSYCHOLOGIA EWOLUCYJNA Psychologia ewolucyjna korzysta z wariantu analizy racjonalnej. Bada przystosowanie do środowiska w czasach łowiecko-zbierackich. Krytykowana za często zbyt spekulacyjne wyjaśnienia.

Wyjaśnia jednak fakty na temat gwałtów, skłonności do przemocy itp.

Pinker: Jak działa umysł? – adwokat podejścia.

ALGORYTM „WEŹ NAJLEPSZY” (TAKE-THE-BEST) Jeśli znasz nazwę jednego miasta, a nie drugiego, pierwsze jest większe. Jeśli nie, to sprawdzaj cechy miast i jeśli którąkolwiek ma jedno, a nie drugie, jest większe. jest stolicą państwa, ma drużynę piłkarską, jest stolicą landu, ma uniwersytet…

PRZYKŁAD Hanower czy Bielefeld? Moguncja czy Hamburg? Monachium czy Goerlitz?

CHATER I OAKSFORD (2003) De facto stosuje się strategię racjonalną! Sukces w środowisku (efekt heurystyki) nie wyklucza racjonalności wg przepisu Andersona.

Ludzie wcale nie muszą obliczać optymalnego (=zawsze poprawnego wyniku), wystarcza skuteczny algorytm. Na poziomie algorytmu jest aproksymacja wyniku poprawnego

(czasem nieobliczalnego praktycznie).

CHATER I OAKSFORD (2003) „Weź najlepszy” to algorytm zasadny ze względu na analizę racjonalną, bo prowadzi do poprawnego wyniku. Ale wcale nie jest pewne, że ludzie właśnie tę zasadę stosują.

TAKA SOBIE BAJECZKA? Ale czy te argumenty nie znaczą, że bayesizm może przyswoić dowolną skuteczną strategię poznawczą jako własną? Może jest tylko opakowaniem cudzego produktu?

PRZYKŁAD 2: ROZUMOWANIA WARUNKOWE Weźmy regułę: Jeśli ptak jest krukiem, to jest czarny. Przy założeniu, że Ćwirek jest krukiem, wynika, że jest czarny (MP).

Przy założeniu, że Ćwirek nie jest czarny, wynika, że nie jest krukiem. (MT)

Dlaczego modus ponens jest łatwiej przyjąć niż modus tollens?

ROZUMOWANIA WARUNKOWE A co z rozumowaniami typu: Ćwirek nie jest krukiem. A zatem nie jest czarny? [odrzucenie poprzednika]

Ćwirek jest czarny. A więc jest krukiem. [uznanie następnika]

To błędy logiczne. Ale dlaczego są popularne?

CZTERY REGUŁY modus ponensp → qp—————q

modus tollensp → q~q——————~p

odrzucenie poprzednikap → q~p—————~q

uznanie następnika p → qq——————p

POMYSŁ BAYESOWSKI Kluczowe równanie:

p(p→q) = p(q|p)

Prawdopodobieństwo warunkowe to klucz do zrozumienia, dlaczego ludzie przyjmują chętnie niektóre wnioskowania mimo ich niepoprawności (lub odrzucają wbrew poprawności).

PROSTY MODEL CHATERA I OAKSFORDA a = P(p) b = P(q) ϵ = P(~q|p)tj. wyjątek,czyliprawdopodobieństwo ~q ze względu na p

MODELE WNIOSKOWAŃ A EMPIRIA

(a) – prosty model prawdopobieństwa warunkowego (b) – logika klasyczna (c) – zmodyfikowany model prawdopodobieństwa warunkowego (Oaksford i Chater 2008)

LOGIKA KLASYCZNA KONTRA BAYESIZM Błądzenie nie jest tak irracjonalne, jak wskazuje logika klasyczna. Czasem istotne jest też, czy same przesłanki są prawdopodobne. Ale czy logika normatywna musi być zawsze taka sama jak opisowa?

MÓZG BAYESOWSKI Karl Friston (ur. 1959): hierarchiczne kodowaniepredykcyjne, aproksymacja (?) trudnego obliczeniowo wnioskowania bayesowskiego

mózg minimalizuje tzw. swobodną energię, czyli zaskoczenie nowymi informacjami

TEORIA HIERARCHICZNEGO KODOWANIA PREDYKCYJNEGO Mózgi przewidują przyczyny aktualnych wejść zmysłowych i minimalizują błędy takich przewidywań: zmieniając przewidywania na temat wejść zmysłowych lub

zmieniając świat.

Jednolita teoria percepcji i działania (A. Clark 2013).

INNE WARIANTY Daniel Wolpert: mózg metodami bayesowskimi tworzy modele antycypacyjne, aby sterować ruchem,

mózg mamy tylko po to, aby się poruszać.

DLACZEGO TRUDNO POŁASKOTAĆ SAMEGO SIEBIE? Kiedy łaskoczemysiebie, przewidujemy efekt.

Za pomocąrobota możemy wprowadzić błąd predykcji.

PODSUMOWANIE Bayesizm to bardzo żywa metodologia kognitywistyki. Zachowanie jako efekt racjonalnego wnioskowania probabilistycznego. Różne poziomy Marra, wiele zjawisk Wątpliwości: Czy w ogóle da się go obalić? Czy nie jest tylko innym sposobem opisu?

O CZYM BYŁA MOWA Zasady analizy racjonalnej Andersona Reguła Bayesa Modele bayesowskie Kodowanie predykcyjne

DO ZOBACZENIA ZA TYDZIEŃ!