Predykcja chaotycznych szeregów czasowych przy pomocy Algorytmów Genetycznych
description
Transcript of Predykcja chaotycznych szeregów czasowych przy pomocy Algorytmów Genetycznych
mgr inż.Marcin Borkowski
Predykcja chaotycznych szeregów czasowych
przy pomocy AlgorytmówGenetycznych
mgr inż.Marcin Borkowski
W skrócie
• Odległy cel• Ambitne założenia• Droga do celu• Ewoluujące wzorce • Karkołomna implementacja• Pierwsze wyniki• Dalsze problemy i prace
mgr inż.Marcin Borkowski
Cel
• Przewidywanie kolejnych wartości liczbowych szeregu czasowego na podstawie wiedzy o jego poprzednich wartościach
Zastosować opracowaną metodę w praktyce
Zostać bogatym ;-)
mgr inż.Marcin Borkowski
Założenia
• Sama wartość predykcji nie wystarczy, potrzeba współczynnika zaufania
• W trudnych przypadkach system może dać kilka odpowiedzi
• Praca i uczenie się systemu są operacjami tożsamymi
mgr inż.Marcin Borkowski
Założenia
• Predykcja na podstawie nie pełnych danych
• Dalszy horyzont predykcji• Uwzględnianie wielu czynników
podczas predykcji• Skalowalność
mgr inż.Marcin Borkowski
Rozwiązanie ?
• Wzorce pamięci
mgr inż.Marcin Borkowski
Rozwiązanie ?
• Odpytanie wzorca Zk
mgr inż.Marcin Borkowski
Rozwiązanie ?
• Mała rozbieżność punktów testowych prawdopodobnie pozostaje w korelacji z prawdopodobieństwem prawidłowej predykcji
• Na odpowiedź systemu składa się wypadkowa odpowiedzi wszystkich wzorców
mgr inż.Marcin Borkowski
Rozwiązanie ?
• Odpytanie wzorców Z1-Zn
Uczenie
mgr inż.Marcin Borkowski
Rozwiązanie ?
• Wzorce mało wiarygodne (w danej chwili) nie są brane do predykcji
• w razie braku dość dużej liczby wzorców system nie daje odpowiedzi
• Skalowanie to podstawa• Pozostaje problem jak zdobyć i
utrzymać efektywny zbiór wzorców ?
mgr inż.Marcin Borkowski
Rozwiązanie ewolucyjne
• Wzorce mogą być osobnikami algorytmu genetycznego lub ewolucyjnego
• ale:– nie chodzi o wyszukanie super
osobnika, ale o skuteczną populacje.
mgr inż.Marcin Borkowski
Rozwiązanie ewolucyjne
• Klasyczny napór ewolucyjny zawodzi
• Potrzeba nowych metod oceny• Potrzeba nowej metody selekcji
– bieżąca nieprzydatność o niczym nie świadczy
• Potrzeba prezentacji osobnika
mgr inż.Marcin Borkowski
Implementacja
• Wzorce przewidujące 1 krok, o stałej ilości segmentów– Reprezentacja binarna (bloki
reprezentujące węzły (dystans od bieżącego pomiaru, wartość)
– standardowe operatory genetyczne, selekcja ruletkowa ze skalowaniem
mgr inż.Marcin Borkowski
Implementacja
• Ocena (fitness)kumulacyjna:– jeżeli wzorzec był przydatny i
wiarygodny i się sprawdził, jego ocena zwiększa się proporcjonalnie
– jeżeli wzorzec mimo wiarygodności okazał się błędny proporcjonalnie traci ocenę
– mało wiarygodny wzorzec mało zmienia swoją ocenę
mgr inż.Marcin Borkowski
1’sze wyniki
• Początkowa populacja była losowa i algorytm musiał się nauczyć wzorców
• Katastroficzne zapominanie• Zbyt silne dominowanie super
osobników nad populacją
mgr inż.Marcin Borkowski
1’sze wyniki
• Pozytywne (sprawdzone na drodze oszustwa)– udało się wypracować skuteczne
skalowanie– udało się ze zbioru wyników wydobyć
poprawne odpowiedzi
mgr inż.Marcin Borkowski
Dalsze prace
• Reasumując– brak sprawnej metody naboru do
nowej populacji (metody oceny)– brak efektywnej prezentacji wzorca– i wiele dalszych prac
mgr inż.Marcin Borkowski
EtapII
• Reprezentacja bitowa pozostaje• Zmieniono zasady naboru i oceny• Zmieniono operatory • Dodano czynnik ścisku – algorytmy
niszowe• Tymczasowa eliminacja
skalowania, dane z zakresu <-1,1>
mgr inż.Marcin Borkowski
EtapII
• Nabór „rankingowy” inspirowany lepszymi niż nabór ruletkowy – Osobniki przed naborem są sortowane
według przydatności– Podczas krzyżowania i mutacji
powstające nowe osobniki są umieszczane na początku populacji (zastępują najsłabszych)
mgr inż.Marcin Borkowski
EtapII
• Operator krzyżowania zostawia w populacji oboje rodziców, dzieci są umieszczane na początku populacji
• Operator mutacji zostawia oryginał, nowy osobnik z maksimum 1 mutacją jest przenoszony na początek populacji
mgr inż.Marcin Borkowski
EtapII
• Ocena osobnika – Każdy osobnik ma pewną długość n,
pozwala to korzystając z dostępnych danych (seria N odczytów) sprawdzić N-n dopasowań.
– Tylko dopasowania powyżej zadanego pułapu są uśredniane i uznawane za ocenę osobnika
mgr inż.Marcin Borkowski
EtapII
• Czynnik ścisku– Uniemożliwia superosobnikom
zdominowanie populacji– Pozwala utrzymać w populacji wiele
efektywnych, wysoko ocenianych osobnikow
mgr inż.Marcin Borkowski
EtapII
• Czynnik ścisku– Dla każdych 2 osobników w populacji
wyliczany jest „dystans”– Jeżeli 2 osobniki są dość podobne
(decyduje parametr) słabszy z nich zwiększa swój czynnik ścisku
– Współczynniki ścisku dzielą wartość dopasowania
mgr inż.Marcin Borkowski
EtapII
• Czynnik ścisku– Odległość początkowo jako dystans
Haminga • Różnica jednego bitu oznacza czasem dużą
różnice we wzorcu!
– Podobieństwo fizyczne wzorców pod rozkodowaniu chromosomu
• Fizycznie niepodobne dopasowania mogą mieć zastosowania w podobnych przypadkach, jednak nie podlegają ściskowi!
mgr inż.Marcin Borkowski
EtapII
Prezentacja wyników testowych
mgr inż.Marcin Borkowski
EtapIII
• Nowe zastosowanie– Data Fitting
• Zmiana reprezentacji chromosomu• Zmiana metody oceny• Zmiana metody predykcji• Zmiana metody liczenia dystansu
mgr inż.Marcin Borkowski
EtapIII
• Nowe zastosowanie– Wzorce można dopasowywać również
wewnątrz szeregu i uzupełniać w ten sposób braki
– Pokrywa to też poprzednie podejście predykcyjne
– Umożliwia predykcje na kilka kroków w przód
mgr inż.Marcin Borkowski
EtapIII
• Zmiana reprezentacji chromosomu– Dotychczasowa wartość predykcji
staje się ustalonym węzłem zero– Węzły są poprzesuwane o jeden dalej
w kierunku starszych danych– Więcej osobników może teraz brać
udział w predykcji
mgr inż.Marcin Borkowski
EtapIII
• Zmiana metody oceny– Podczas oceniania osobników pojawia
się problem braku w danych– dla każdego węzła predykcji, któremu
brakuje danej zakłada się maksymalne niedopasowanie
– Do oceny brane są dopasowania tylko powyżej i równe średniej z danych (wyeliminowało to parametr)
mgr inż.Marcin Borkowski
EtapIII
• Zmiana metody predykcji– Każdy osobnik (dopasowanie) jest
przypasowywane każdym węzłem do brakującej danej
– Czyli każdy węzeł może stanowić o wartości predykcji, lub być jak poprzednio uwzględniany przy dopasowaniu
mgr inż.Marcin Borkowski
EtapIII
• Zmiana metody liczenia dystansu– Istotne dla dłuższych dopasowań o
malej ilości węzłów– Porównuje się podobieństwo
cząstkowych dopasowań (ocen) na danych uczących
– Pozwala to uznać za podobne zupełnie różne fizycznie osobniki !
mgr inż.Marcin Borkowski
EtapIII
Prezentacja wyników testowych
mgr inż.Marcin Borkowski
Dziękuje za uwagę