Predykcja chaotycznych szeregów czasowych przy pomocy Algorytmów Genetycznych

Post on 05-Jan-2016

37 views 0 download

description

Predykcja chaotycznych szeregów czasowych przy pomocy Algorytmów Genetycznych. W skrócie. Odległy cel Ambitne założenia Droga do celu Ewoluujące wzorce Karkołomna implementacja Pierwsze wyniki Dalsze problemy i prace. Cel. - PowerPoint PPT Presentation

Transcript of Predykcja chaotycznych szeregów czasowych przy pomocy Algorytmów Genetycznych

mgr inż.Marcin Borkowski

Predykcja chaotycznych szeregów czasowych

przy pomocy AlgorytmówGenetycznych

mgr inż.Marcin Borkowski

W skrócie

• Odległy cel• Ambitne założenia• Droga do celu• Ewoluujące wzorce • Karkołomna implementacja• Pierwsze wyniki• Dalsze problemy i prace

mgr inż.Marcin Borkowski

Cel

• Przewidywanie kolejnych wartości liczbowych szeregu czasowego na podstawie wiedzy o jego poprzednich wartościach

Zastosować opracowaną metodę w praktyce

Zostać bogatym ;-)

mgr inż.Marcin Borkowski

Założenia

• Sama wartość predykcji nie wystarczy, potrzeba współczynnika zaufania

• W trudnych przypadkach system może dać kilka odpowiedzi

• Praca i uczenie się systemu są operacjami tożsamymi

mgr inż.Marcin Borkowski

Założenia

• Predykcja na podstawie nie pełnych danych

• Dalszy horyzont predykcji• Uwzględnianie wielu czynników

podczas predykcji• Skalowalność

mgr inż.Marcin Borkowski

Rozwiązanie ?

• Wzorce pamięci

mgr inż.Marcin Borkowski

Rozwiązanie ?

• Odpytanie wzorca Zk

mgr inż.Marcin Borkowski

Rozwiązanie ?

• Mała rozbieżność punktów testowych prawdopodobnie pozostaje w korelacji z prawdopodobieństwem prawidłowej predykcji

• Na odpowiedź systemu składa się wypadkowa odpowiedzi wszystkich wzorców

mgr inż.Marcin Borkowski

Rozwiązanie ?

• Odpytanie wzorców Z1-Zn

Uczenie

mgr inż.Marcin Borkowski

Rozwiązanie ?

• Wzorce mało wiarygodne (w danej chwili) nie są brane do predykcji

• w razie braku dość dużej liczby wzorców system nie daje odpowiedzi

• Skalowanie to podstawa• Pozostaje problem jak zdobyć i

utrzymać efektywny zbiór wzorców ?

mgr inż.Marcin Borkowski

Rozwiązanie ewolucyjne

• Wzorce mogą być osobnikami algorytmu genetycznego lub ewolucyjnego

• ale:– nie chodzi o wyszukanie super

osobnika, ale o skuteczną populacje.

mgr inż.Marcin Borkowski

Rozwiązanie ewolucyjne

• Klasyczny napór ewolucyjny zawodzi

• Potrzeba nowych metod oceny• Potrzeba nowej metody selekcji

– bieżąca nieprzydatność o niczym nie świadczy

• Potrzeba prezentacji osobnika

mgr inż.Marcin Borkowski

Implementacja

• Wzorce przewidujące 1 krok, o stałej ilości segmentów– Reprezentacja binarna (bloki

reprezentujące węzły (dystans od bieżącego pomiaru, wartość)

– standardowe operatory genetyczne, selekcja ruletkowa ze skalowaniem

mgr inż.Marcin Borkowski

Implementacja

• Ocena (fitness)kumulacyjna:– jeżeli wzorzec był przydatny i

wiarygodny i się sprawdził, jego ocena zwiększa się proporcjonalnie

– jeżeli wzorzec mimo wiarygodności okazał się błędny proporcjonalnie traci ocenę

– mało wiarygodny wzorzec mało zmienia swoją ocenę

mgr inż.Marcin Borkowski

1’sze wyniki

• Początkowa populacja była losowa i algorytm musiał się nauczyć wzorców

• Katastroficzne zapominanie• Zbyt silne dominowanie super

osobników nad populacją

mgr inż.Marcin Borkowski

1’sze wyniki

• Pozytywne (sprawdzone na drodze oszustwa)– udało się wypracować skuteczne

skalowanie– udało się ze zbioru wyników wydobyć

poprawne odpowiedzi

mgr inż.Marcin Borkowski

Dalsze prace

• Reasumując– brak sprawnej metody naboru do

nowej populacji (metody oceny)– brak efektywnej prezentacji wzorca– i wiele dalszych prac

mgr inż.Marcin Borkowski

EtapII

• Reprezentacja bitowa pozostaje• Zmieniono zasady naboru i oceny• Zmieniono operatory • Dodano czynnik ścisku – algorytmy

niszowe• Tymczasowa eliminacja

skalowania, dane z zakresu <-1,1>

mgr inż.Marcin Borkowski

EtapII

• Nabór „rankingowy” inspirowany lepszymi niż nabór ruletkowy – Osobniki przed naborem są sortowane

według przydatności– Podczas krzyżowania i mutacji

powstające nowe osobniki są umieszczane na początku populacji (zastępują najsłabszych)

mgr inż.Marcin Borkowski

EtapII

• Operator krzyżowania zostawia w populacji oboje rodziców, dzieci są umieszczane na początku populacji

• Operator mutacji zostawia oryginał, nowy osobnik z maksimum 1 mutacją jest przenoszony na początek populacji

mgr inż.Marcin Borkowski

EtapII

• Ocena osobnika – Każdy osobnik ma pewną długość n,

pozwala to korzystając z dostępnych danych (seria N odczytów) sprawdzić N-n dopasowań.

– Tylko dopasowania powyżej zadanego pułapu są uśredniane i uznawane za ocenę osobnika

mgr inż.Marcin Borkowski

EtapII

• Czynnik ścisku– Uniemożliwia superosobnikom

zdominowanie populacji– Pozwala utrzymać w populacji wiele

efektywnych, wysoko ocenianych osobnikow

mgr inż.Marcin Borkowski

EtapII

• Czynnik ścisku– Dla każdych 2 osobników w populacji

wyliczany jest „dystans”– Jeżeli 2 osobniki są dość podobne

(decyduje parametr) słabszy z nich zwiększa swój czynnik ścisku

– Współczynniki ścisku dzielą wartość dopasowania

mgr inż.Marcin Borkowski

EtapII

• Czynnik ścisku– Odległość początkowo jako dystans

Haminga • Różnica jednego bitu oznacza czasem dużą

różnice we wzorcu!

– Podobieństwo fizyczne wzorców pod rozkodowaniu chromosomu

• Fizycznie niepodobne dopasowania mogą mieć zastosowania w podobnych przypadkach, jednak nie podlegają ściskowi!

mgr inż.Marcin Borkowski

EtapII

Prezentacja wyników testowych

mgr inż.Marcin Borkowski

EtapIII

• Nowe zastosowanie– Data Fitting

• Zmiana reprezentacji chromosomu• Zmiana metody oceny• Zmiana metody predykcji• Zmiana metody liczenia dystansu

mgr inż.Marcin Borkowski

EtapIII

• Nowe zastosowanie– Wzorce można dopasowywać również

wewnątrz szeregu i uzupełniać w ten sposób braki

– Pokrywa to też poprzednie podejście predykcyjne

– Umożliwia predykcje na kilka kroków w przód

mgr inż.Marcin Borkowski

EtapIII

• Zmiana reprezentacji chromosomu– Dotychczasowa wartość predykcji

staje się ustalonym węzłem zero– Węzły są poprzesuwane o jeden dalej

w kierunku starszych danych– Więcej osobników może teraz brać

udział w predykcji

mgr inż.Marcin Borkowski

EtapIII

• Zmiana metody oceny– Podczas oceniania osobników pojawia

się problem braku w danych– dla każdego węzła predykcji, któremu

brakuje danej zakłada się maksymalne niedopasowanie

– Do oceny brane są dopasowania tylko powyżej i równe średniej z danych (wyeliminowało to parametr)

mgr inż.Marcin Borkowski

EtapIII

• Zmiana metody predykcji– Każdy osobnik (dopasowanie) jest

przypasowywane każdym węzłem do brakującej danej

– Czyli każdy węzeł może stanowić o wartości predykcji, lub być jak poprzednio uwzględniany przy dopasowaniu

mgr inż.Marcin Borkowski

EtapIII

• Zmiana metody liczenia dystansu– Istotne dla dłuższych dopasowań o

malej ilości węzłów– Porównuje się podobieństwo

cząstkowych dopasowań (ocen) na danych uczących

– Pozwala to uznać za podobne zupełnie różne fizycznie osobniki !

mgr inż.Marcin Borkowski

EtapIII

Prezentacja wyników testowych

mgr inż.Marcin Borkowski

Dziękuje za uwagę