Sieci samoorganizujące się na zasadzie współzawodnictwa

JERZY STEFANOWSKI

Instytut InformatykiPolitechnika Poznańska

1. Wprowadzenie

2. Wykrywanie grup – sieci LVQ

3. Reguły uczenia się konkurencyjnego

4. Projekcja wielowymiarowa

5. Sieci SOM i ich algorytmy uczenia

6. WebSOM i inne zastosowania

7. Uwagi końcowe

Wprowadzenie • Inny tryb uczenia się:

• Bez nadzoru (brak informacji y o zadanym wyjściu; tylko opis przykładów x)

• Sieć sama powinna wykrywać istotne zależności w danych wejściowych, badać podobieństwo wektorów x, rozpoznawania cech istotnych czy regularności bez „nadzoru”

• Typowe zastosowanie → grupowanie, kodowanie i kompresja, projekcja wielowymiarowa, wykrywanie cech istotnych.

• Kluczowe jest badanie podobieństwa wektorów (wejścia, wagi),• Miara iloczynu skalarnego wektora wag i wektora wejściowego

• Zasady uczenia się konkurencyjnego (przez współzawodnictwo)• Tylko zwycięskie neurony lub ich sąsiedzi są nauczani (modyfikacja

wag)• Na ogół prostsza topologia sieci

Typowe zastosowania• Grupowanie obserwacji: Sieć w wyniku procesu uczenia

dokonuje podziału przykładów uczących na klasy (grupy) przykładów podobnych do siebie i przyporządkowuje każdejklasie różne elementy wyjściowe sieci – sieci LVQ.

• Tworzenie mapy cech: Dane wejściowe transformowane są z wielowymiarowej przestrzeni przykładów w „małowymiarową” przestrzeń ich cech charakterystycznych. Elementy warstwywyjściowej są geometrycznie uporządkowane. Wymaga się, abypodobne przykłady wejściowe generowały aktywność bliskichgeometrycznie elementów wyjściowych - Sieci SOM Kohonena.

• Analiza czynników głównych: Sieć posiada wyjściewieloelementowe, a każdy z elementów odpowiada za jeden z tzw. czynników głównych, według których określane jest podobieństwo sygnałów wejściowych.

Podstawowa sieć Kohonena LVQ

• Celem jest grupowanie wektorów wejściowych x• Istota działania → podobieństwo• Podobne wektory powinny pobudzać te same neurony

• Prosta topologia

• gdzie

• Reguła konkurencyjnego uczenia się

xiy w xj j ij i

= = ∑w x

Wektory i miary podobieństwa• Dany jest zbiór uczący

• Podobieństwo dwóch wektorów – odległość Euklidesowa

• Równoważna miara cosinusowa (kątowa)

{ }nxxx ,,, 21 K

)()( jiT

jiji xxxxxx −⋅−=−

⋅=)cos(θ

q∑∑

qaqaqa

22 ||||||||cosθ

Sieć Kohonena - LVQ• Przetwarza się kolejne wektory x poszukując p grup –

odpowiadają im wybrane neurony

• Przed rozpoczęciem uczenia wektory wag są inicjowane losowo (małe liczby z przedziału -0.5;0.5)

• Wektory wag są normalizowane dla kolejnych p neuronów

• Stosuję się regułę „zwyciężca bierze wszystko” w celu identyfikację neuronu zwyciężcy.

• Wagi neuronu zwycięskiego podlegają modyfikacji

ww =ˆ

Reguła „zwycięzca bierze wszystko”• Określenie zwycięzcy:

• Alternatywnie iloczyn skalarny

• Zwycięzcą jest jeden neuron m. Korekcja wag wmodbywa się wyłącznie dla neuronu zwycięzcy wedługreguły:

• η - stała uczenia (na ogół między 0.1 a 0.7)

• Przykład – interpretacja geometryczna

||ˆ||min||ˆ||,,1 ipim wxwx −=−

xwxw Ti

Tm ˆmaxˆ

,,1K==

)( mm wxw −⋅=∆ η

Uczenie zwycięskiego neuronu• Po odnalezieniu zwycięskiego neuronu dokonuje się

aktualizacji wag (k numer kolejnego kroku)

)ˆ(1 km

km wxww −⋅+=+ η

Wk+1)( mm wxw −⋅=∆ η

Kilka uwag o uczeniu sieci

• Po zakończeniu uczenia znormalizowane wektory wag (neuronów) wskazują środki ciężkości wykrytych grup obserwacji → analogia do k-średnich.

• Dobór wag początkowych – rozrzucenie po przestrzeni (hiperkuli)

• Problem doboru liczby neuronów (martwe neurony)

• Tzw. techniki sumienia → „sumienie” ten sam neuron nie zwycięża zbyt często

• Stopniowe zmniejszanie prędkości uczenia

• Iteracyjne powtarzanie prezentacji przykładów

• W ostatnim kroku – „kalibracja” sieci

Odzworowanie cech istotnych• W eksploracji danych duże znaczenie ma

transformacja wysoce-wielowymiarowych danych wejściowych w małowymiaroweprzestrzenia tak aby zauważyć pewną harmonijną strukturę danych

• Podejścia analityczne (projekcje w statystyce) np. PCA

Sieci SOM• Podstawą odwzorowania takie uporządkowanie

neuronów, takie że położenie zwycięskich neuronów niesie informacje

• Topologia → relacja sąsiedztwa

• Podobne przykłady wejściowe x powinny aktywizować sąsiednie neurony

• „Gęstość” wzorców w zredukowanej przestrzeni musi odpowiadać gęstości przykładów w oryginalnej przestrzeni

Self-Organizing Feature Map (SOM)

• SOMs, also called topological ordered maps, or Kohonen Self-Organizing Feature Map (KSOMs)

• It maps all the points in a high-dimensional source space into a 2 to 3-d target space, s.t., the distance and proximity relationship (i.e., topology) are preserved as much as possible

• Similar to specific clustering: cluster centers tend to lie in a low-dimensional manifold in the feature space

• Clustering is performed by having several units competing for the current object

• The unit whose weight vector is closest to the current object wins

• The winner and its neighbors learn by having their weights adjusted

• SOMs are believed to resemble processing that can occur in the brain

• Useful for visualizing high-dimensional data in 2- or 3-D space

Unsupervised Learning:Kohonen’s Self-Organizing Map (SOM) [2]

• Another Clustering Algorithm• aka Self-Organizing Feature Map (SOFM)• Given: vectors of attribute values (x1, x2, …, xn)• Returns: vectors of attribute values (x1’, x2’, …, xk’)

• Typically, n >> k (n is high, k = 1, 2, or 3; hence “dimensionality reducing”) • Output: vectors x’, the projections of input points x; also get P(xj’ | xi)• Mapping from x to x’ is topology preserving

• Topology Preserving Networks• Intuitive idea: similar input vectors will map to similar clusters• Recall: informal definition of cluster (isolated set of mutually similar entities)• Restatement: “clusters of X (high-D) will still be clusters of X’ (low-D)”

• Representation of Node Clusters• Group of neighboring artificial neural network units (neighborhood of nodes)• SOMs: combine ideas of topology-preserving networks, unsupervised learning

• Implementation: http://www.cis.hut.fi/nnrc/ and MATLAB NN Toolkit

Projekcja

Sieć 2D, dane 3DSieć 2D, dane 3D

oo=dane

2-D siatka

wagi przypisane

neurony wejściowe

przestrzeń cech

połączeniom

neuronów

' = wagi sieci

' '' '''''

Uczenie sieci 2D Uczenie sieci 2D

xx=dane

siatka neuronów

N-wymiarowa

xo=pozycje wag neuronów

przestrzeń danych

wagi wskazująna punkty w N-D

Intuicja przekształcenia (A.Bartkowiak)z zachowaniem sąsiedztwa geometrycznego

Typowe topologie sieci SOM• Dwie typowe topologie i sąsiedztwo

Uczenie SOMUczenie SOM

Neurony reagują na sygnały X podobne do W. Podobny = iloczyn skalarny największy lub odległość min. Znajdź najsilniej reagujący neuron c.

( )2; arg minj i ij jj

X W c− = − = −∑X W X W

Przesuń wagi neuronu c i neuronów w sąsiedztwie O(c):

( ) ( ) ( ) ( ) ( ) ( ),1 , dla i i i c it t h r r t t t i O c+ = + − ∈ W W X W

( )2 20( , , ) ( )exp / ( )c c ch r r t h t r r tσ= − −

w stronę wektora X:

Modelowanie sąsiedztwa• Typowe funkcje

Algorytm SOMAlgorytm SOMSiatka neuronów i = 1 .. K w 1D-3D, każdy neuron z N wagami.

Neurony z wagami Wi(t) = {Wi1 Wi2 .. WiN}, wektory X={X1, X2 .. XN}.

t - dyskretny czas; nie ma połączeń pomiędzy neuronami!

1. Inicjalizacja: przypadkowe Wi(0) dla wszystkich i=1..K.Funkcja sąsiedztwa h(|r-rc|/σ(t),t) definiuje wokół neuronu położonego w miejscu rc siatki obszar Os(rc).

2. Oblicz odległości d(X,W), znajdź neuron z wagami Wc najbardziej podobnymi do X (neuron-zwycięzcę).

3. Zmień wagi wszystkich neuronów w sąsiedztwie Os(rc)

4. Powoli zmniejszaj siłę h0(t) i promień σ(t).

5. Iteruj aż ustaną zmiany.

Efekt: podział (tesselacja) na wieloboki Voronoia.

•572 samples of olive oil were collected from 9 Italian provinces.Content of 8 fats was determine for each oil.

•SOM 20 x 20 network,

•Maps 8D => 2D.

•Classification accuracy was around 95-97%.

An example of SOM application:

Note that topographical relations are preserved, region 3 is most diverse.

An example of analysing olive oil in Italy

• Natural language processing: linguistic analysis, parsing, learning languages, hyphenation patterns.

• Optimization: configuration of telephone connections, VLSIdesign, time series prediction, scheduling algorithms.

• Signal processing: adaptive filters, real-time signal analysis, radar, sonar seismic, USG, EKG, EEG and other medical signals ...

• Image recognition and processing: segmentation, object recognition, texture recognition ...

• Content-based retrieval: examples of WebSOM, Cartia, VisierPicSom – similarity based image retrieval.

Other examples

Quality of life dataQuality of life dataQuality of life dataWorldBank data 1992, 39 quality of life indicators.

SOM map and the same colors on the world map.

More examples of business applications from http://www.eudaptics.com/

Analiza cech istotnych• A self-organizing map

showing US Congressvoting patterns visualized inSynapse. The first twoboxes show clustering anddistances while theremaining ones show thecomponent planes. Red means a yes vote while bluemeans a no vote in thecomponent planes (exceptthe party component wherered is Republican and blueis Democrat).

Web Document Clustering Using SOM• The result of

SOM clustering of 12088 Web articles

• The picture on the right: drilling down on the keyword “mining”

• Based on websom.hut.fiWeb page

Gaz neuronowy

Wariant uczenia konkurencyjnego (Schulten i Martinez 1991)

Algorytm NG typu SOM:1. przypadkowa inicjalizacja N wektorów; t=0;2. Wybierz przypadkowy wektor V3. Zrób ranking wag najbliższych V; k=1..N

;i jW V W V i j− ≤ − <

Zastosuj regułę adaptacji:

( )( )( )i iW t h i V Wλε∆ = −

zmniejszając eksponencjalnie obszar λ i stałą uczenia ε(t).

BEATCA – nowa koncepcja wyszukiwarki o interfejsie mapowym (M.Kłopotek, K.Ciesielski, D.Czerski, M.Dramiński – IPI PAN Warszawa)

• Nowa koncepcja wyszukiwarki mapowej • Pełen cykl przetwarzania miliona dokumentów - 48 godz.

• współistnienie wielu koncepcji map (SOM, GNG, Immunologiczne)

• współistnienie wielu koncepcji reprezentacji map (czwotokątne,sześciokątne, dwuwymiarowe euklidesowskie, hiperboliczne "rybie oko", prezentacja na kuli, torusie, walcu)

• Możliwość przyrostowego generowania mapy • Środowisko do badań eksperymentalnych nad nowymi

koncepcjami map

Zbiór dokumentów

Punkty w przestrzeni dokumentów

Grupy w przestrzeni dokumentów

Mapa dokumentów

Etapy tworzenia mapy

User interface of BEATCA software

The traditional flat map - hexagonal

Map visualizations in 3D

Hierarchical maps

Level 1

Level 2

Level 3

Sieci samoorganizujące się na zasadzie współzawodnictwa · •SOM 20 x 20 network, •Maps 8D...

Transcript of Sieci samoorganizujące się na zasadzie współzawodnictwa · •SOM 20 x 20 network, •Maps 8D...

Sieci samoorganizujące się na zasadzie współzawodnictwa · •SOM 20 x 20 network, •Maps 8D...

Documents

Transcript of Sieci samoorganizujące się na zasadzie współzawodnictwa · •SOM 20 x 20 network, •Maps 8D...

Caixas de Som - Bemol€¦ · Caixas de Som multimídia black piano Mais som para seu PC e notebook 8 w RMS alimentação USB 2.0 saída P2 3,5 mm (fone de ouvido) controle de volume

Wyniki Współzawodnictwa Sportowego Krośnieńskich Szkół w latach 2004-2010

GeoEnvironGem som Excel12-fil Eksporter data til fil via højrekliksmenuens Gem som... og vælg filtypen Excel12 (alle 4 typer). NYHEDER I GEOENVIRON 12.3.0 Ændringer i integrationer

fgUnh Hkkkk vkSj uSfrd ewY; ,d lEiw.kZ v/;;u Hkkx & çFke...Limited nor its authors guarantee the accuracy and completeness of any information published herein, and neither Bhalv Publishing

Wyniki współzawodnictwa na dzień .. klasyfikacja klubów w ... wspolzawodnictwa na... · KS Podlasie iałystok 64 60 167,5 175 466,5 MKP Szczecin 43,5 118,75 280 442,25 ... LKS

fundacja-bos.home.plfundacja-bos.home.pl/oczamimlodych/2018/pliki/do_pobrania/SOM-2... · Created Date: 3/6/2017 8:09:06 AM

Towards Klimisch 2.0? – More Transparency and Quality in ... klimisch... · Q2: The evaluation system allows enough accuracy for a specific evaluation of relevance. Q3:The evaluation

SWEAmagasinet H - SWEA Moskvamoskva.swea.org/documents/swea-magasinet-nr-4.pdf · kan hända när man är expat och bor i Moskva. Vi har som alltid en krönika, som denna gång har

SOM-6869 COM-Express Compact Module Celeron™ N …advdownload.advantech.com/productfile/PIS/SOM-6869... · · 2017-10-07SOM-6869 COM-Express Compact Module ... SOM-6869RC-S1A1E

APPLICATION OF WAVELET ANALYSIS IN DAMAGE …mrucka/files/2007_Rucka_Wilde...A damage detection system can have four levels of the defect identification accuracy proposed by Rytter

Wycinarki drutowe High Accuracy MP ConneCt · pło, zużycie prądu, luz zwrotny, zjawisko tętnienia (cogging), ... Silnik tubowy to optymalny napęd do zastosowań precyzyjnych,

SOM-5992 COM Express R3.0 Type 7 Module Intel Xeon ...advdownload.advantech.com/productfile/PIS/SOM-5992/Product... · SOM-5992 COM Express R3.0 Type 7 Module ®Intel Xeon® Processor

unifikacja organizacji szkolenia i systemu współzawodnictwa dzieci i ...

SPRAWOZDANIE KOŃCOWE ZE WSPÓŁZAWODNICTWA SPORTOWEGO SZKÓŁ POWIATU TARNOWSKIEGO

Koncepcja Rozwoju Transportu Publicznego w SOM - wytyczne dla gmin

sp14.edupage.org · Web view- integracja uczniów, - motywacja do nauki poprzez zabawę, - odkrywanie nowych, własnych możliwości, - rozwijanie współpracy i współzawodnictwa.

Wyniki współzawodnictwa lotowego PZHGP o mistrzostwo ...pzhgpodolanow.pl/komunikaty/wyniki/Wyniki... · 23 XX Przodownik Talaga Krzysztof & Miłosz 2 48 1996,06 16 24 XXI Przodownik

MODERN, KVINNAN & MANNEN, KROPPEN: En komparativ .../menu/... · poeten Maria Konopnicka2. ... 2 Som hon till synes hellre hade blivit jämförd med än så som fallet ofta var –Maria

NARODOWY MODEL GRY PZPN...9. program „bramka dla Żaka” – sprzĘt dla druŻyn dzieciĘcych 10. unifikacja organizacji wspÓŁzawodnictwa i szkolenia dzieci i mŁodzieŻy 11.

EFFECT OF THE ACCURACY OF RIVERBED MEASUREMENTS …acta.urk.edu.pl/pdf-92720-39544?filename=EFFECT OF THE ACCURA… · lowing forecasting the water surface level during the passing