Sieci neuronowe (wprowadzenie) -...

127
Obliczenia neuronowe (wprowadzenie) Ryszard Tadeusiewicz Laboratorium Biocybernetyki Katedra Automatyki AGH

Transcript of Sieci neuronowe (wprowadzenie) -...

Page 1: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Obliczenia neuronowe

(wprowadzenie) Ryszard Tadeusiewicz

Laboratorium Biocybernetyki Katedra Automatyki AGH

Page 2: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Oto przykładowa sieć neuronowa

Dane reprezentujące

zadanie do wykonania

Wynik reprezentujący

rozwiązanie zadania

Wie

dza

zdob

yta

w c

zasie

ucz

enia

Page 3: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Zacznijmy jednak od formalnej definicji:

• sieć neuronowa to urządzenie techniczne lub algorytm, którego działanie wzorowane jest w pewnym stopniu na działaniu sieci biologicznych struktur nerwowych.

• Zazwyczaj składa się z systemu połączonych ze sobą elementów naśladujących biologiczne neurony, z których każdy posiada pewną liczbę wejść i jedno wyjście

Page 4: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Wyjścia z poszczególnych elementów są na ogół połączone z wejściami innych tworząc sieć.

Niektóre elementy wyprowadzają sygnały wyjściowe na zewnątrz i to one dostarczają odpowiedzi na zadanie, które rozwiązuje sieć.

Inne elementy przyjmują na swych wejściach sygnały z zewnątrz i to właśnie one służą do stawiania zadań, które sieć ma rozwiązywać.

Page 5: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Zależność pomiędzy wejściami i wyjściami jest modyfikowana dla każdego elementu z osobna w procesie tzw. uczenia sieci.

Nauczona sieć przetwarza informację poprzez jej obróbkę głównie na złączach między elementami, tak zwanych synapsach.

Pomocniczą rolę odgrywa generowanie sygnałów w poszczególnych elementach oraz ich przesyłanie pomiędzy elementami.

Page 6: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Zależność pomiędzy sygnałami wejściowymi a wyjściowymi

w całej sieci jest następnie interpretowana

jako rozwiązanie postawionego sieci problemu.

Page 7: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Wykład nie wyczerpie wszystkich zagadnień.

Jak znaleźć książkę

o sieciach neuronowych w wirtualnej bibliotece?

Page 8: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

http://abc.agh.edu.pl

Page 9: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne
Page 10: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Dlaczego warto się interesować

sieciami neuronowymi?

Page 11: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Na jednej z pierwszych konferencji naukowych poświęconych sieciom neuronowym (w 1995 roku) jeden z amerykańskich badaczy pokazał taki slajd:

Uznałem, że to dobry pomysł

i spróbowałem kontynuować

ten wykres

Page 12: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

0

50

100

150

200

1990

19

91

1992

19

93

1994

19

95

1996

19

97

1998

19

99

2000

20

01

2002

20

03

2004

20

05

2006

Wielkość obrotów oprogramowaniem dla tworzenia sieci neuronowych (w mld USD)

Page 13: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Jak widać idea obliczeń neuronowych staje się coraz popularniejsza

Page 14: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Przykładowe narzędzia do budowy sieci neuronowych

Page 15: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Zaletą sieci neuronowych jest to, że można do nich wprowadzać dowolne, nie uporządkowane dane,

a po nauczeniu sieci na jej wyjściu dostaje się zwykle porządny i użyteczny wynik

Page 16: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Cechy charakterystyczne zadań, przy rozwiązywaniu których sieci neuronowe mają

przewagę nad innymi technikami:

Nieznajom

ość

regu

ł rzą

dząc

ych

prob

lem

em

Stopień złożoności problemu

Pełna znajomość reguł Mała i średnia złożoność

Częściowa znajomość reguł Średnia złożoność

Częściowy lub całkowity brak znajomości reguł

Duża złożoność

Dokładne algorytmy

Modele statystyczne Systemy ekspertowe Metody dedukcyjne

Sieci neuronowe

Metody indukcyjne

Page 17: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Sieci neuronowe są narzędziem którego zakres zastosowań

stale się poszerza. Należą do tego zakresu między

innymi takie zadania, jak:

• Tworzenie modeli złożonych systemów • Automatyczne metody przetwarzania,

analizy i klasyfikacji złożonych sygnałów • Predykcja szeregów czasowych • i liczne, liczne inne...

Page 18: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Czasopisma, w których obecnie można znaleźć najnowsze i najwartościowsze wiadomości

dotyczące sieci neuronowych

Obydwa te pisma są wydawane w USA, ale ja jestem członkiem redakcji w obu tych periodykach

Page 19: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Zasadnicze zalety, warunkujące używanie sieci neuronowych

są następujące:

• Brak konieczności jawnego formułowania jakichkolwiek założeń dla modeli

• Możliwość rozwiązywania problemów nie mających dobrej definicji formalnej

• Możliwość zastępowania procesu programowania oraz „ręcznego” tworzenia modelu - procesem uczenia sieci

• Możliwość pracy współbieżnej

Page 20: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Do realizacji współbieżnych obliczeń w dużych sieciach neuronowych stosuje się dziś specjalne systemy mikroelektroniczne oraz klastry komputerowe

Page 21: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

HAGEN - The Heidelberg AnaloG Evolvable Neural Network

Page 22: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Szczegóły rozwiązania technicznego

Page 23: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

The EvoOpt Mixed-Signal Neural Network Chip

Page 24: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Nad strukturami neuronowymi

pracują największe firmy

hardware’owe

Page 25: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Schemat funkcjonalny neuronowego chipu Intela

Page 26: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Linux cluster CCortex with 1,000

processors for modeling of

neural system with 20 billion

neurons and 20 trillion

connections.

Parameters:

1 terabyte of RAM,

and 200 terabytes of

storage

Page 27: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Sieci neuronowe są wzorowane na faktach, które udało się ustalić w trakcie wieloletnich badań

ludzkiego mózgu

Page 28: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Neuro-komputery

Dlatego o sieciach neuronowych często mówi się:

Page 29: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Ta nazwa jest ze wszech miar uzasadniona, ponieważ w systemach tych często sprzęga się bezpośrednio

elementy elektroniczne z żywymi neuronami

Page 30: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Najczęściej jednak sieci neuronowe wykonywane są jako programy symulujące ich funkcjonowanie

w zwykłych komputerach

Page 31: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Mam program, więc działam jak sieć neuronowa

Mogę wykonywać wszelkie obliczenia

tak jakbym miał specjalnie zbudowaną

sieć!

Page 32: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Przykład programu symulującego sieci neuronowe

Page 33: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Jak jest zbudowana i jak działa sieć neuronowa?

Page 34: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Twórcy sieci neuronowych wykorzystują wiedzę neuroanatomiczną i neurofizjologiczną,

ale modelują rzeczywiste struktury nerwowe w sposób maksymalnie uproszczony

Page 35: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Początkowo anatomowie dzielili mózg tak, jak kolonizatorzy Afrykę – według arbitralnie wyznaczanych granic, bez

zwracania uwagi na to, co było w środku

Page 36: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Potem zaczęto nieco subtelniej wyodrębniać anatomiczne elementy mózgu

Page 37: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Mózg widziany od podstawy

Page 38: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne
Page 39: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Przedstawione wyżej obszary były wyodrębnione na podstawie obserwacji

i analizy zewnętrznej budowy mózgu.

Natomiast jeszcze w ostatnich latach XIX wieku podjęto próby określenia struktury mózgu na poziomie budowy elementów

wewnętrznych czyli komórek i ich połączeń.

Page 40: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

W efekcie tych prac powstała cytoarchitektoniczna mapa Brodmana

Page 41: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Ludzie już dawno poznali i opisali strukturę mózgu, jednak przez długi czas niemożliwe było

ustalenie, „jak to działa”?

Page 42: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Procesy kognitywne i mentalne, na których

modelowaniu opiera się

budowa sieci neuronowych można badać

i opisywać w różnych

skalach

Page 43: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Mózg jest trudny do badania, bo składa się z niewiarygodnie wielkie liczby elementów:

100 000 000 000 neuronów!

Page 44: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Mózg podczas odpoczynku Sygnał akustyczny - muzyka Sygnał optyczny - rysunek Rozwiązywanie zadania matematycznego

Za pomocą metod PET można pokazać aktywizację poszczególnych części mózgu przy wykonywaniu

poszczególnych czynności

Page 45: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Najwięcej informacji mamy na temat elementarnego procesora biologicznego, jakim jest

neuron.

Page 46: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Schematyczny rysunek neuronu

Page 47: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Dwa rzeczywiste obrazy neuronów

Oraz wizja graficzna na podstawie setek obrazów mikroskopowych

Page 48: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Zróżnicowanie wielkości i budowy rzeczywistych

neuronów powoduje, że trudno

jest mówić o czymś takim,

jak „typowy neuron”

Page 49: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Mikroelektrody docierają w pobliże komórek nerwowych i rejestrują ich

aktywność elektryczną

Page 50: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Potencjał czynnościowy

1 ms

Maksymalna częstotliwość

impulsacji neuronów wynosi

około 1 kHz.

W praktyce rzadko spotyka się

impulsację szybszą niż kilkaset herców.

Page 51: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Rejestracje aktywności elektrycznej różnych części neuronu

Page 52: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Matryca mikroelektrod stosowana do rejestrowania odpowiedzi z kory mózgowej

badanego zwierzęcia

Page 53: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Propagacja impulsów elektrycznych we włóknach nerwowych jest dosyć powolna!

Page 54: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

• 1904 - Pavlov I.P. - teoria odruchów warunkowych • 1906 - Golgi C., - badanie struktury układu nerwowego • 1906 - Ramón Y Cajal S. - odkrycie, że mózg składa się z sieci oddzielnych neuronów • 1920 - Krogh S.A. - opisanie funkcji regulacyjnych w organizmie • 1932 – Sherrington Ch. S. - badania sterowania nerwowego pracy mięśni • 1936 – Dale H., Hallett L.O. - odkrycie chemicznej transmisji impulsów nerwowych • 1944 - Erlanger J., Gasser H. S. - procesy w pojedynczym włóknie nerwowym • 1949 - Hess W.R. - odkrycie funkcji śródmózgowia • 1963 - Eccles J.C., Hodgkin A.L., Huxley A.F. - mechanizm elektrycznej aktywności neuronu • 1969 – Granit R., Hartline H.K., Wald G. – fizjologia widzenia • 1970 – Katz B., Von Euler U. - transmisja informacji humoralnej w komórkach nerwowych • 1974 – Claude A., De Duve Ch. - badania strukturalnej i funkcjonalnej organizacji komórki. • 1977 – Guillemin R., Schally A., Yalow R. - badania hormonów mózgu • 1981 – Sperry R. - odkrycia dotyczące funkcjonalnej specjalizacji półkul móżdżku • 1981 – Hubel D.H., Wiesel T. - odkrycie zasad przetwarzania informacji w systemie wzrokowym • 1991 – Neher E., Sakmann B. - funkcje kanałów jonowych w komórkach nerwowych

Nagrody Nobla związane z badaniami układu nerwowego, których wyniki wykorzystano w sieciach neuronowych:

Sieci neuronowe to efekt, a przyczyny to ...

Page 55: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Elementy, z których buduje się neuronowy model

Page 56: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Budowa wiernego modelu nawet pojedynczego neuronu (komórki Purkinjego) jest

bardzo kosztowna (de Schutter’05) Do zbudowania modelu użyto:

•1600 kompartmentów

•8021 modeli kanałów jonowych

•10 typów różnych złożonych opisów matematycznych kanałów zależnych od napięcia

•32000 równań różniczkowych!

•19200 parametrów do oszacowania przy dostrajaniu modelu

•Opisu morfologii zrekonstruowanej za pomocą mikroskopu

Page 57: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Obrazy wyników symulacji komputerowej modelu komórki Purkinjego uzyskane w badaniach de Schuttera:

u góry aktywność elektryczna symulowanej komórki,

u dołu zjawiska biochemiczne (przepływ jonów wapnia

Page 58: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Najciekawsze procesy toczą się na złączach pomiędzy neuronami

Page 59: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Neuron - podstawowy element sieci

x1

x2

xn

w1

w2

wn

( )nixwgs ii

,,1,

== ( )sfy =

y

agregacja danych wejściowych

obliczenie wartości funkcji aktywacji

Zadania ??? Jak zróżnicować te sygnały?

Page 60: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Przy stosowaniu sieci neuronowych zasadnicze korzyści odnosi się z procesów uczenia zachodzących w obrębie

synaps.

Page 61: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Budowa synapsy

Page 62: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Schemat funkcjonowania synapsy

Page 63: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Kryształy bardziej znanych neurotransmiterów pod mikroskopem

i ich chemiczne wzory strukturalne

Page 64: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Budowa i własności

sztucznych neuronów

i sieci

Page 65: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Własności neuronu determinują: przyjęta agregacja danych wejściowych oraz założona

funkcja wyjścia

x1

x2

xn

w1

w2

wn

( )nixwgs ii

,,1,

== y

∑==

n

iii xws

1neuron liniowy

y = s ...

Agregacja liniowa

Page 66: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

W przypadku neuronu liniowego jego zachowanie daje się łatwo zinterpretować

Page 67: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Z neuronem liniowym (i z innymi neuronami budowanymi na jego bazie) związana jest jeszcze sprawa wyrazu wolnego w

formule agregacji

x1

x2

xn

w1

w2

wn

( )nixwgs ii

,,1,

== y

∑==

n

iii xws

1

To nadal jest neuron liniowy!

y = s ...

Czysta agregacja liniowa: ma wadę, polegającą na tym, że charakterystyka neuronu musi tu przechodzić przez początek układu

Bogatsze możliwości daje agregacja afiniczna (z wyrazem wolnym w formule):

∑=

+=n

iii wxws

10Żeby zachować liniową postać

wzoru opisującego neuron dodaje się dodatkowe pseudo-wejście nazywane BIAS, które zawsze dostarcza sygnał ≡ 1

x0 ≡ 1 w0

Wtedy agregacja jest nadal liniowa:

∑=

=n

iii xws

0

Page 68: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

W przypadku neuronu nieliniowego nie jest tak łatwo, ponieważ

zagregowany (w taki lub inny sposób)

sygnał wejściowy może być przetworzony przy użyciu funkcji

nieliniowej o teoretycznie dowolnym kształcie.

Page 69: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Własności neuronu determinują: przyjęta agregacja danych wejściowych oraz założona

funkcja wyjścia

x1

x2

xn

w1

w2

wn

( )nixwgs ii

,,1,

==

( )sfy =

y

∑==

n

iii xws

1

( )2

1∑ −==

n

iii xws

neuron liniowy

Agregacja radialna

neuron nieliniowy --------------

y = s --------

----------

...

Agregacja liniowa ---------------- neuron radialny

Page 70: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Warto odróżnić dwie nieliniowe charakterystyki neuronu: unipolarną (po lewej) i bipolarną (po prawej)

Page 71: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Funkcja przejścia wiąże zagregowane wejścia do neuronu z jego sygnałem wyjściowym

Page 72: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Różne przykładowe funkcje, wykorzystywane jako funkcje przejścia

Page 73: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Funkcje aktywacji neuronu może być dowolna, ale najczęściej stosowane są niżej

podane kształty.

-1,5

-1

-0,5

0

0,5

1

1,5

x

-2,9

-2,7

-2,5

-2,3

-2,1

-1,9

-1,7

-1,5

-1,3

-1,1

-0,9

-0,7

-0,5

-0,3

-0,1 0,1

0,3

0,5

0,7

0,9

1,1

1,3

1,5

1,7

1,9

2,1

2,3

2,5

2,7

2,9

Liniowa

Sigmoidalna

Tangensoidalna

Gaussa

Page 74: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Wykres sigmoidy w zależności od parametru β

0

0,2

0,4

0,6

0,8

1

-10 -5 0 5 10

S

yβ=0,5β=1β=2

)exp(11)(

ssf

β−+=

Page 75: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Funkcja tangens hiperboliczny ma praktycznie taki sam kształt, tylko jej wartości zmieniają się od -1 do +1, a nie od 0 do +1

jak w sigmoidzie

0

0,2

0,4

0,6

0,8

1

-10 -5 0 5 10

S

yβ=0,5β=1β=2

)exp()exp()exp()exp()tanh()(

ssssssf

βββββ

−+−−

==

+1

-1

Page 76: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Nieliniowe funkcje aktywacji też bywają różne:

Page 77: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Dobierając współczynniki wagowe wejść neuronu można wpływać na kształt jego

nieliniowej charakterystyki!

Page 78: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Zapamiętajmy: Najczęściej wykorzystywany jest taki model neuronu:

x1

x2

xn

w1

w2

wn

y ∑==

n

iii xws

1...

y:=1/(1+exp(-0.5*x))

-0.1

0.1

0.3

0.5

0.7

0.9

1.1

-10 -5 0 5 10

Sieć zbudowana z takich neuronów nazywana jest zwykle MLP (Multi-Layer Perceptron)

Page 79: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Sztuczny neuron jest więc w sumie dosyć prostą strukturą, dzięki czemu stosunkowo łatwo jest stworzyć sieć takich elementów

xx

xy

1

2

n

...

Synał wyjściowy

Sygnaływejściowe

ww

w

1

2

n

Zmienne

"wagi"

Page 80: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Bywały próby budowania sieci o architekturze

ściśle dopasowanej do

natury rozwiązywanego

zadania (tutaj pokazana struktura sieci

przeznaczona była do rozpoznawania

kodów pocztowych na

kopertach)

Page 81: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Nie zdało to jednak egzaminu i obecnie przy budowie sztucznych sieci neuronowych najczęściej przyjmuje się arbitralnie, że ich budowa jest

złożona z warstw, podobnie jak na przykład struktury neuronowe zlokalizowane

w siatkówce oka

Page 82: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Również w korze mózgowej daje się zaobserwować warstwowa budowa

Połączenia do i od poszczególnych warstw w mózgu

Kora wzrokowa

Page 83: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Warstwowość kory wzrokowej widać lepiej przy wyborze małych jej fragmentów

Page 84: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Schemat sztucznej sieci neuronowej (uproszczonej)

x1

x2

y

Działanie sieci zależy od: •przyjętego modelu neuronu, •topologii (struktury) sieci, •wartości parametrów neuronu, ustalanych w wyniku uczenia

Warstwa wejściowa Warstwa ukryta (jedna lub dwie)

Warstwa wyjściowa

Page 85: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Poglądowe działanie sieci neuronowej

Page 86: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Początek działania sieci neuronowej wiąże się

z pojawieniem się na jej wejściach sygnałów (czerwone kropki)

niosących nowe zadanie do rozwiązania

Page 87: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Sygnały wejściowe (nie przetworzone w żaden

sposób w warstwie wejściowej)

są rozsyłane do wszystkich neuronów

warstwy ukrytej

Page 88: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Po przetworzeniu sygnałów przez neurony

warstwy ukrytej powstają sygnały

pośrednie, kierowane do neuronów warstwy

wyjściowej

Page 89: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Neurony warstwy wyjściowej korzystają ze wstępnie opracowanej informacji pochodzącej

z warstwy ukrytej i obliczają końcowe

wyniki, będące rozwiązaniem

postawionego zadania

Page 90: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Zasadnicze zalety sieci neuronowych wiążą się z faktem, że mogą się one

uczyć

Page 91: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne
Page 92: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Mechanizmy biochemiczne zaangażowane w proces zapamiętywania wiedzy są raczej skomplikowane

Page 93: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Dla uczenia sztucznych sieci neuronowych cała ta skomplikowana wiedza biochemiczna

nie jest konieczna, bo praktyczne metody uczenia sieci oparte są na

prostej intuicji: poszukiwania minimum funkcji błędu

Page 94: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Uczenie sieci neuronowej

• uczenie jest to w istocie iteracyjny proces estymacji optymalnych wartości parametrów sieci;

• początkowe wartości tych parametrów są zwykle wartościami losowymi;

• w trakcie uczenia sieci neuronowej prezentowane są przypadki uczące i w zależności od oceny reakcji sieci modyfikowane są jej parametry (najczęściej wagi synaptyczne).

Ewa

„Nauczyciel”

Zbiór uczący

Page 95: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Ilustracja procesu uczenia w sieci

Istota procesu uczenia polega na modyfikacji wag połączeń neuronów

W wyniku tego sygnał wyjściowy sieci upodabnia się do zbioru uczącego

Można to obserwować biorąc pod uwagę zmiany błędu uczenia

Page 96: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Przykładowy zbiór uczący pozwalający rozwiązać problem regresyjny:

Jak duże będzie zanieczyszczenie powietrza w różnych miastach?

• zmienne objaśniające: temperatura, liczba zakładów przemysłowych, liczba ludności, prędkość wiatru, wielkość opadu, liczba dni deszczowych

• zmienna objaśniana: Stężenie SO2 w powietrzu • dana nieistotna: nazwa miasta

Page 97: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Na wejście sieci podawane są dane wskazane w zbiorze jako wejściowe

Sieć na tej podstawie oblicza i podaje swoje rozwiązanie (na ogół początkowo błędne)

W zbiorze uczącym podane są poprawne wartości rozwiązań dla tych danych

można to zrobić przetwarzając dane ze zbioru uczącego

Oto sieć neuronowa, którą trzeba uczyć

Uczenie sieci polega na takim doborze jej parametrów, żeby zminimalizować błąd, jaki popełnia sieć

Page 98: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Uczenie sieci polega teraz na takim doborze jej parametrów, żeby zminimalizować błąd, jaki popełnia sieć przetwarzając

dane ze zbioru uczącego

Błąd

Robi to algorytm uczenia

Na podstawie błędu zmienia się wagi wszystkich neuronów w sieci, tak żeby malał

Porównanie zawartej w danych wzorcowej

odpowiedzi z wynikiem obliczonym

przez sieć daje błąd

Page 99: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Pierwszy współczynnik wagowy w1

Drugi współczynnik wagowy w2

Wielkość błędu popełnianego

przez sieć E

przy takim zestawie wag

sieć popełnia taki duży błąd

sieć popełnia taki mały błąd

a przy takim zestawie wag

Page 100: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

E

Algorytm wstecznej propagacji błędów polega na szukaniu kierunku spadku E i na takim zmienianiu

wartości wag w1, w2, żeby zmniejszać wartość funkcji błędu w kierunku jej najszybszego spadku

Nowy (lepszy) wektor wag

Stary (gorszy) wektor wag

Odpowiadająca mu wartość błędu

Kierunek najszybszego spadku błędu

Przemieszczenie po powierzchni błędu

Migracja w przestrzeni

wag

Page 101: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Poszukiwanie (i znajdowanie!) minimum funkcji

błędu metodą wyznaczania w

każdym kolejnym kroku kierunku

najszybszego spadku

( ))()()1( pp

pp E www ∇−=+ η

η - współczynnik uczenia

Page 102: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Uczenie sieci neuronowej jako wędrówka ślepego kangura szukającego domu

Kangur zna tylko lokalne nachylenie zbocza

Jeśli wykona za mały skok to będzie do domu wracał długo

Jeśli wykona za duży skok to może wpaść do przepaści

Jeśli mu się uda, to może pokonać przeszkody i znacząco się zbliżyć do celu

Page 103: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Problem doboru wartości współczynnika uczenia

Page 104: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Powierzchnie błędów bywają dosyć skomplikowane!

Page 105: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Dlatego proces uczenia może napotykać na różne przeszkody:

Page 106: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

W celu przezwyciężenia wad algorytmu backpropagation, takich jak:

•powolność algorytmu, •tendencja do zatrzymywania się algorytmu w minimach lokalnych funkcji E,

najczęściej stosuje się dodatkowy składnik nazywany pędem (momentum):

( ) 1−∆+∇−=∆ ppp E www µηgdzie µ jest współczynnikiem momentum, określającym wpływ poprzedniej modyfikacji wektora wag na aktualny wektor poprawek.

Page 107: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Dla ustabilizowania procesu uczenia stosuje się współczynnik wnoszący bezwładność – zwany momentum

Lekkie małe saneczki utkną w pierwszym dołku na

stoku Rozpędzony masywny bojer ześlizgnie się aż na sam dół!

Page 108: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Zmiany współczynników wag w sieci podczas uczenia bez współczynnika momentum (po lewej) i ze współczynnikiem momentum równym 0.5 (po

prawej) dla tej samej ilości kroków

Momentu przyspiesza i stabilizuje uczenie!

Page 109: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Przykładowy przebieg procesu

uczenia

Krzyżyki oznaczają elementy zbioru uczącego

Linia ciągła prezentuje wynik działania sieci

Ilość epok uczenia

Błąd SSE

Start procesu uczenia wszystkie wagi są

przypadkowe

Page 110: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

0100200300400500600700800900

1000

0 50 100 150 200 250 300 350 400 450

czas uczenia (w epokach)

sum

a kw

adra

tów

błę

dów

brak

przesunięcie

linie

W trakcie uczenia sieci błąd przez nią popełniany zmienia się w charakterystyczny i zwykle podobny sposób: szybko maleje na początku

procesu i znacznie wolniej później.

Dla tej samej sieci i dla tych samych danych uczących przebiegi procesu uczenia mogą się nieco różnić jeden od drugiego.

Zależy to głównie od tego, jak wybrany został punkt startowy, to znaczy wartości wag na

początku procesu uczenia.

Page 111: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

W dalszych przykładach będziemy używali funkcji błędu mającej jedno minimum lokalne

i jedno globalne

Oto wykres tej funkcji... oraz jej mapa z „poziomicami”

Page 112: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Wynik uczenia zależy od wyboru początkowych wartości wag (punktu

startowego algorytmu)

Jest to ważne dla praktyki, ponieważ podczas uczenia zawsze zagrażają minima lokalne funkcji błędu, w których rozwiązanie

problemu jest bardzo niedoskonałe!

Trafione minimum globalne!

Trafione minimum lokalne!

Page 113: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Utknięcie procesu uczenia w „pułapce” minimum lokalnego wyjaśnia, dlaczego czasem nauczona sieć dopasowuje swoje działanie tylko do

części danych

Page 114: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Minimum lokalne, oznaczające niedoskonałe dopasowanie sieci do danych

Minimum globalne, oznaczające najlepsze możliwe dopasowanie sieci do danych

Ucieczka z lokalnego minimum jest trudna, bo wymaga

chwilowego pogorszenia jakości działania sieci

Minimum lokalne jako pułapka w procesie uczenia

Page 115: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Zwykle kilka prób uczenia sieci startujących z różnych punktów początkowych pozwala wykryć, gdzie jest

poszukiwane minimum globalne

Page 116: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Startując z różnych punktów docieramy do różnych minimów

Page 117: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Kiedy zakończyć uczenie?

R

Celem użycia sieci jest odtworzenie pewnej nieznanej zależności, która ma funkcjonować dla wszystkich danych należących do pewnego zbioru R.

Zależność tę staramy się zamodelować w sieci neuronowej, mając do dyspozycji wyłącznie

pewien zasób danych Z. Z

W danych Z znane są zarówno dane wejściowe do budowanego modelu neuronowego, jak i

dane wyjściowe.

Są one wzorcem do którego dopasowywać będziemy parametry neuronowego modelu.

Page 118: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Niebezpieczeństwo, które nam zagraża, polega na tym, że podczas uczenia sieci może dojść do nadmiernego

dopasowania modelu do właściwości danych ze zbioru Z, nie koniecznie reprezentujących wszystkie dane w zbiorze R.

R Żeby tego uniknąć dokonujemy podziału

zasobu Z na trzy części: Z L są to dane uczące, które używamy do

aktywnego uczenia sieci.

V są to dane walidacyjne, które będą użyte do wykrycia zagrożenia przeuczeniem

L

T są to dane testowe, które będą użyte do końcowego sprawdzenia sieci

V T

Page 119: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Przeuczenie!

Page 120: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Dzięki użyciu zbioru danych walidacyjnych można wykryć moment „przeuczenia” sieci.

0

0.2

0.4

0.6

0.8

1

0 200 400 600 800 1000

Błąd dla zbioru uczącego

Błąd dla zbioru walidacyjnego

Tu zaczyna się przeuczenie

Przerwać uczenie!

Page 121: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Na tych samych danych uczących sieć może zbudować model dobrze albo źle generalizujący

Model zachowujący dobrą zdolność generalizacji

Model który utracił zdolność generalizacji

Page 122: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Jedną z głównych przyczyn złej generalizacji jest niewłaściwa struktura sieci – za bardzo lub za mało

skomplikowana

Strukturę sieci trzeba tak dobrać, żeby otrzymać aproksymację danych

uczących nie za bardzo skomplikowaną, ale i nie

nazbyt uproszczoną

Dobra

Zbyt skomplikowana

Zbyt prosta

Page 123: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Backpropagation jest generalnie metodą dosyć wolną w działaniu:

Page 124: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Niektórych badaczy to ogromnie denerwuje, więc na jednej konferencji naukowej rozprowadzane

były takie ulotki:

Page 125: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Quickprop

Page 126: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Algorytm Levenberga-Marquardta

Page 127: Sieci neuronowe (wprowadzenie) - flash.wwsi.edu.plflash.wwsi.edu.pl/wwsivideo/2007/pdf/tadeusiewicz_sieci_neuronowe.pdf · działanie wzorowane jest w pewnym ... mikroelektroniczne

Technika gradientów sprzężonych działa oczywiście szybciej, niż metody oparte na

pierwszych pochodnych: