Wstęp do kognitywistyki OBLICZENIA INSPIROWANE NEUROLOGICzNIE . MARR

Post on 14-Jan-2016

40 views 0 download

description

Marcin Miłkowski. Wstęp do kognitywistyki OBLICZENIA INSPIROWANE NEUROLOGICzNIE . MARR. O czym będzie mowa. Komórki babcine i widzenie Trzy poziomy jeszcze raz Widzenie w analizie odgórnej. Jak widzi mózg?. Oko to nie kamera, która rzuca obraz na ekran w mózgu. - PowerPoint PPT Presentation

Transcript of Wstęp do kognitywistyki OBLICZENIA INSPIROWANE NEUROLOGICzNIE . MARR

Marcin Miłkowski

O czym będzie mowa

Komórki babcine i widzenie Trzy poziomy jeszcze raz Widzenie w analizie odgórnej

Jak widzi mózg?

Oko to nie kamera, która rzuca obraz na ekran w mózgu.

Musiałby istnieć w mózgu widz, w którego mózgu byłby ekran, na który patrzyłby kolejny widz...

Komórki babcine

Lata 50-60: odkrycie komórek reagujących na konkretny rodzaj bodźca

Jerzy Konorski (1967): hipoteza istnienia jednostek gnostycznych w mózgu rozpoznających określony rodzaj bodźca

Jerry Lettvin (1969): komórki babcine

Jak widzą ropuchy?

W 1959 r. zespół Lettvina odkrył w układzie nerwowym ropuch komórki reagujące na czarne ruchome obiekty w polu widzenia: „Detektory robaków”

Hubel i Wiesel (1959)

David H. Hubel (1926-2013); Torsten Wiesel (1924)

Odkryli, że odpowiednie komórki w mózgu kota reagują na bodźce o określonej orientacji: złożone obrazy powstają z prostych elementów rozpoznawanych przez detektory cech (ale detektor cechy prostej to nie komórka babcina!)

Potem dostali Nobla za pracę nad kolumnami wzrokowymi.

Horace Barlow (ur. 1921): teoretyk detektorów cech Aby całkowicie zrozumieć widzenie, wystarczy zrozumieć pojedyncze komórki rozpoznające cechy.

Pierwszy pracował nad detektorami u żab (1953).

Zespoły komórkowe

Teoria konkurencyjna: reprezentacje neuronalne rozproszone w układzie nerwowym

Dopiero cały zespół komórek koduje cechy.

U ssaków prawdopodobnie dominują reprezentacje rozproszone; u prostych organizmów teoria Konorskiego może być wystarczająca!

Marr kontra Barlow

Widzenia nie da się zrozumieć na podstawie pojedynczych neuronów.

To tak jakby chcieć zrozumieć latanie, oglądając pojedyncze pióra!

Aleksander Łuria w ZSRR głosił podobną teorię: należy zrozumieć całe systemy funkcjonalne w mózgu, a nie wąsko lokalizować funkcje w pojedynczych obszarach.

Poziomy Marra

Trzy poziomy Marra

Poziom kompetencji

Mnożenie na maszynie Turinga Funkcja obliczeniowaMnożenie

Algorytm Tabela maszyny Turinga

Implementacja Konstrukcja maszyny Turinga (fizyczna)

Analiza zadania

Należy wskazać: problem z zakresu przetwarzania informacji i

ogólne ograniczenia rozwiązania problemu.

Analiza zadania

Poziom obliczeniowy: Czemu służy widzenie?

Odwzorowaniu dwuwymiarowej informacji z siatkówki w trójwymiarową informację o otoczeniu.

Analiza zadania

Zadaniem systemu wzrokowego jest dostarczanie 3W reprezentacji otoczenia, która może posłużyć jako wejście dla procesów rozpoznawania i klasyfikacji – głównie informacje o kształcie obiektów i ich rozmieszczeniu w przestrzeni

Reprezentacja 3W nie jest egocentryczna, lecz przedmiotowa

Świadectwa empiryczne Możliwość podwójnych dysocjacji między postrzeganiem a rozpoznawaniem Lezje prawego płata ciemieniowego – rozpoznawanie zachowane, ale problemy z postrzeganiem kształtów z niezwykłych perspektyw

Lezje lewego płata ciemieniowego – zachowane postrzeganie kształtu, ale zaburzone rozpoznawanie obiektów

Marr: system wzrokowy to wejście systemu rozpoznawania

Podwójna dysocjacja

Uszkodzenie pewnego miejsca mózgu zaburza daną funkcję, ale inną pozostawia w stanie prawidłowym, a zarazem inne uszkodzenie mózgu zaburza tę inną funkcję poznawczą, tę pierwszą zaś pozostawia w stanie prawidłowym.

Racje teoretyczne

Zdolności rozpoznawania nie zależą od zmian wyglądu związanych z:

orientacją przedmiotu, odległością od obserwatora, częściowym zasłonięciem przez inne przedmioty.

Zatem system wzrokowy dostarcza informacje do systemów rozpoznawania, które abstrahują od własności perspektywy – reprezentacja niezależna od obserwatora

Analiza algorytmiczna

Wejście = światło docierające do siatkówki

Wyjście = trójwymiarowa reprezentacja otoczenia

Pytania: Jakiego rodzaju informacje wydobywa się ze światła na siatkówce?

Jak system przechodzi od tych informacji do 3W reprezentacji otoczenia?

Wyzwanie

Konieczność znalezienia elementarnych reprezentacji, które pozwolą wnioskować o strukturze otoczenia ze struktury obrazu.

Elementarne reprezentacje

Podstawowe informacje na siatkówce = wielkość natężenia światła w każdym punkcie obrazu na siatkówce

zmiany w natężeniu to wskazówki ułatwiające wykrycie granic powierzchni

Elementarne reprezentacje pozwalają na wykrycie struktury we wzorcach zmian natężenia

np. przejścia przez zero (nagłe zmiany natężenia)

Przejścia przez zero

• Jeśli zmiany natężenia umieścimy na wykresie, nieciągłości będą widoczne jako przejścia krzywej przez linię zerową

• Marr zaproponował laplasjan filtru Gaussa do wykrywania przejść przez zero

Szkic pierwotny

wskazuje zmiany natężenia w obrazie 2W

podstawowe informacje o geometrycznej organizacji zmian natężenia

Elementarne reprezentacje: przejścia przez zero, linie wirtualne, grupy.

Obraz

Surowy szkic

pierwotny

Elementy poziomu 1

Granice poziomu

2

Subiektywne nieciągłości

Czy te kształty naprawdę widać?

Szkic 2 ½ W Pokazuje orientację widocznych powierzchni we współrzędnych egocentrycznych

Reprezentuje odległość każdego punktu w polu widzenia od obserwatora

Także orientację każdego punktu i kontury nieciągłości

Bardzo podstawowe informacje o głębi

Zauważmy: tu jeszcze nie ma przedmiotów!

Szkic 3W określa kształty i ich organizację przestrzenną

przedmiotowy podstawowe elementy objętościowe i powierzchniowe (ułatwia rozpoznawanie)

Reprezentacja w szkicu 3W

Zależy od rozpoznawalności kształtów jako zespołów uogólnionych stożków.

Uogólnione stożki łatwo reprezentować wektor opisu ścieżkę osi symetrii figur,

wektor określający odległość prostopadłą od każdego punktu na osi na powierzchni kształtu.

Ale okazuje się, że tak naprawdę jest to zadanie obliczeniowo zbyt trudne dla mózgu (Rolls, 2008).

Ścieżka przetwarzania wg Marra Etapy w potoku:

Obraz natężeń światła

Szkic pierwotny

Wybór modelu

Szkic 2½ wym.

Wyjaśnianie odgórne

Wyjaśnianie jest odgórne z powodu niezdeterminowania

Wiele różnych algorytmów może w zasadzie obliczyć to samo.

Jest wiele sposobów realizacji tego samego algorytmu.

Wieloraka realizowalność więcej informacji na wyższym poziomie

Marr podaje stosunkowo mało szczegółów neuronalnych (ale w owym czasie bardzo trudno je potwierdzać!)

Przetwarzanie nieświadome

Marr nie analizuje zawartości bufora uwagi. Tu nie ma miejsca na raporty werbalne i na eye tracker, jak u Simona i Newella. Simona i Newella lekceważy i krytykuje, uważając, że rozwiązywanie problemów jest na zbyt wysokim poziomie abstrakcji, aby je wyjaśnić.

To procesy niedostępne świadomości. Reprezentacje 2½ W nie są nam dostępne!

Przetwarzanie sekwencyjne

Model sekwencyjny: kolejne etapy przetwarzania, od percepcji do reprezentacji przedmiotów

Przekonania nie modyfikują samego wczesnego widzenia (co najwyżej procesy rozpoznawania)

Główne idee Marra

1) Bardzo wpływowa metodologia trzech poziomów

2) Klasyczna analiza odgórna

3) Większość szczegółów na poziomie algorytmicznym

4) Neurobiologia pojawia się dopiero na poziomie implementacji

Wczesne widzenie i neuronauki obliczeniowe Dzisiejsze metody łączą zdecydowanie więcej świadectw empirycznych, a modele mają być testowane np. przy użyciu obrazowania.

Neuropsychologia, lezje i podwójne dysocjacje bardzo ważne.

Za tydzień: będzie zastępstwo. Jakub Kozakoszczak opowie Państwu o sieciach neuronowych i uczeniu się czasowników.