Mgr

127
POLITECHNIKA WARSZAWSKA WYDZIAL FIZYKI PRACA MAGISTERSKA ANALIZA KORELACJI PRZEBIEGÓW CZASOWYCH IMISJI PYLU ZAWIESZONEGO PM 10 I PM 2,5 ORAZ TLENKÓW AZOTU CORRELATION ANALYSIS OF TIME SERIES OF PARTICULATE MATTER (PM 10 AND PM 2,5 ) AND NITROGEN OXIDE IMISSION Jacek Bzdak nr. albumu: 196909 Promotor: prof. Bronislaw Slowi ´ nski doc. Mieczyslaw Sowi ´ nski WARSZAWA 2011

Transcript of Mgr

Page 1: Mgr

POLITECHNIKA WARSZAWSKA

WYDZIAŁ FIZYKI

PRACA MAGISTERSKA

ANALIZA KORELACJI PRZEBIEGÓW CZASOWYCHIMISJI PYŁU ZAWIESZONEGO PM10 I PM2,5

ORAZ TLENKÓW AZOTU

CORRELATION ANALYSIS OF TIME SERIES OF PARTICULATE MATTER

(PM10 AND PM2,5) AND NITROGEN OXIDE IMISSION

Jacek Bzdaknr. albumu: 196909

Promotor:prof. Bronisław Słowinskidoc. Mieczysław Sowinski

WARSZAWA 2011

Page 2: Mgr

ii

Podziekowania:Chciałbym podziekowac moim opiekunom: doc. Sowin-skiemu i prof. Słowinskiemu, którzy wprowadzili mniew tematyke badan - przez wiele godzin rozmawiałem znimi na tematy poruszane w mojej pracy.Za cenne uwagi dotyczace modelowania za pomoca siecineuronowych oraz za podzielenie sie działajacym ko-dem Matlaba chciałbym podziekowac dr. Siwkowi z Wy-działu Elektrycznego PW.Wreszcie chciałbym podziekowac prof. Kosinskiemu iprof. Osowskiemu, na których wykłady dotyczace SieciNeuronowych uczeszczałem. Bez ich wykładów (i bezlektury ich podreczników) praca ta byłaby na duzo niz-szym poziomie.

Bardzo dziekuje dr. Przemysławowi Dudzie, na któregozyczliwosc zawsze mogłem liczyc.

Page 3: Mgr

iii

Streszczenie

Zanieczyszczenia powietrza sa jednym z najbardziej istotnych proble-mów ekologicznych i zdrowotnych współczesnej cywilizacji. Istnieja ba-dania jednoznacznie wiazace poziomy poszczególnych zanieczyszczen i np.smiertelnosc na danym terenie. Modelowanie tego zjawiska moze wspo-magac działania majace na celu obnizanie poziomów zanieczyszczen orazwspomagac sam proces pomiaru ich poziomów. Praca niniejsza dotyczyproblematyki zwiazanej z ochrona jakosci powietrza oraz modelowania po-ziomów wystepujacych zanieczyszczen. W pracy skoncentrowano sie napyle zawieszonym ze wzgledu na powszechnosc tego zanieczyszczenia.

Przedmiotem pracy jest analiza modeli, w których beda wykorzysty-wane dane imisyjne, w szczególnosci tzw. historyczne szeregi czasowe po-ziomy zanieczyszczen. Modele, działajace w oparciu o zbiory danych tegorodzaju, nazywaja sie modelami eksplorujacymi dane. Opracowano mo-del pozwalajacy na ekstrapolacje przestrzenna poziomów zanieczyszczen.Model ten moze miec zastosowanie miedzy innymi do uzupełniania luk wdanych pomiarowych, które moga powstawac podczas konserwacji urza-dzen lub ich awarii. Praca zawiera równiez krótkie wprowadzenie do me-tod pomiarowych pyłu zawieszonego. Ze wzgledu na specyfike pomiarówtego zanieczyszczenia (duze niepewnosci pomiarowe, róznorodnosc metodpomiarowych), jak i ze wzgledu na obowiazujaca legislacje i standardy, mo-delowanie moze odgrywac istotna role w procesie pomiaru poziomu pyłuzawieszonego. Modele eksplorujace dane pochodzace ze zróznicowanychzródeł, z których pobiera sie informacje, powinny pracowac w okreslonymdla nich srodowisku. Opracowano zatem załozenia koncepcyjne dla takiegosrodowiska oraz wyszczególniono, jakie cechy i funkcjonalnosci powinnoono posiadac.

Uruchomiono równiez czesciowa wersje takiego srodowiska, która wy-korzystano w modelach opisanych w pracy. W Dodatkach opisano pod-stawy działania sztucznych sieci neuronowych i wykorzystywanych w ni-niejszej pracy sieci SSN oraz podano krótki zarys analizy falkowej, którajest jednym z waznych narzedzi wspomagajacych sieci neuronowe.

Page 4: Mgr

iv

Abstract

Air pollution is one of most important environmental and health issues.

Many studies link level of particular pollutants and mortality rates on

given area. Modeling can support air remediation programs, as well as aid

in the pollutant measurement process. This work concerns air pollution

management. In this work we focus on particulate matter because this

pollutant is one of most common.

The subject of this work is investigation and development of models

that work on imission data (time series of archival pollutant levels). Mod-

els that work using this data are called data mining models (DMM). Model

that extrapolates pollutant levels was developed in this work, such model

can be used to fill gaps in timeseries of measurements collected by par-

ticular station (these gaps may occur due to equipment conservation and

malfunction). This work contains also short introduction to measurement

methods of PM levels. Particulate Matter measurement proses can aug-

mented using modeling techniques, due to the fact of high measurement

uncertainty, and because of current legislation and standards. DMM mod-

els should be embedded in a system that will provide access to data col-

lected from many external sources. In this work requirements for this

system were developed. Working prototype for this system was also devel-

oped.

Theoretical basis for artificial neural networks were also described in

this work, as well as introduction to wavelet transform — technique that

can be used to enhance neural network performance.

Page 5: Mgr

Spis tresci

Spis tresci v

1 Wprowadzenie 11.1 Motywacja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2 Pył zawieszony . . . . . . . . . . . . . . . . . . . . . . . . . . . 21.3 Zanieczyszczenia powietrza jako zagrozenie dla zdrowia . . 21.4 Regulacje unijne . . . . . . . . . . . . . . . . . . . . . . . . . . 61.5 Zastosowania metod opartych o eksploracje danych w kon-

tekscie uwarunkowan prawnych oraz ochrony zdrowia miesz-kanców . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

2 Przedmiot badan 122.1 Istniejace systemy modelowania o podobnym charakterze w

Polsce i Europie . . . . . . . . . . . . . . . . . . . . . . . . . . 132.2 Porównanie modeli CTM i DMM . . . . . . . . . . . . . . . . 152.3 Definicja modelu . . . . . . . . . . . . . . . . . . . . . . . . . . 18

3 Metody pomiarów poziomów PM 203.1 Regulacje prawne . . . . . . . . . . . . . . . . . . . . . . . . . 203.2 Metoda grawimetryczna . . . . . . . . . . . . . . . . . . . . . 213.3 Osłabienie promieniowania β . . . . . . . . . . . . . . . . . . 223.4 Mierniki TEOM . . . . . . . . . . . . . . . . . . . . . . . . . . 233.5 Rola modelowania w pomiarach poziomów PM . . . . . . . . 24

4 Opracowanie systemu modelowania zanieczyszczen 274.1 Załozenia koncepcyjne . . . . . . . . . . . . . . . . . . . . . . 274.2 Baza danych . . . . . . . . . . . . . . . . . . . . . . . . . . . . 344.3 Ocena stosowanego schematu bazy danych . . . . . . . . . . 374.4 Biblioteka dostepu do bazy danych . . . . . . . . . . . . . . . 394.5 Framework importu danych . . . . . . . . . . . . . . . . . . . 404.6 Framework modelowania zanieczyszczen . . . . . . . . . . . 42

v

Page 6: Mgr

SPIS TRESCI vi

4.7 Analiza opracowanego systemu . . . . . . . . . . . . . . . . . 464.8 Stosowane w systemie algorytmy . . . . . . . . . . . . . . . . 49

5 Wykorzystanie sieci neuronowych 535.1 Wstepna ekstrapolacja przestrzenna . . . . . . . . . . . . . . 53

6 Podsumowanie 626.1 Zawartosc pracy . . . . . . . . . . . . . . . . . . . . . . . . . . 626.2 Wnioski . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

A Słownik pojec 64

B Sztuczne sieci neuronowe 68B.1 Wstep . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68B.2 Podstawy teoretyczne . . . . . . . . . . . . . . . . . . . . . . . 71B.3 Pojecie cechy . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77B.4 Kroki potrzebne do zbudowania modeli opartego na SSN . . 78B.5 Sieci SVM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

C Dyskretna transformata falkowa 87C.1 Transformata Fouriera . . . . . . . . . . . . . . . . . . . . . . 88C.2 Porównanie transformaty Fouriera i falkowej . . . . . . . . . 89C.3 Budowanie rodziny falek . . . . . . . . . . . . . . . . . . . . . 89C.4 Ciagła transformata falkowa . . . . . . . . . . . . . . . . . . . 90C.5 Analiza wielorozdzielcza . . . . . . . . . . . . . . . . . . . . . 90C.6 Funkcja skalujaca . . . . . . . . . . . . . . . . . . . . . . . . 91C.7 Transformata falkowa a analiza wielorozdzielcza . . . . . . 93C.8 Szybka dyskretna transformata falkowa . . . . . . . . . . . 94C.9 Praktyczne aspekty transformaty falkowej . . . . . . . . . . 95

D Teksty cytatów w tłumaczeniu własnym w jezyku oryginału 97D.1 Cytaty z rozdziału pierwszego . . . . . . . . . . . . . . . . . . 97D.2 Cytaty z rozdziału drugiego . . . . . . . . . . . . . . . . . . . 98D.3 Cytaty z dodatków . . . . . . . . . . . . . . . . . . . . . . . . . 98

E Słownik terminów informatycznych 99

F Zawartosc płyty i uruchomienie projektu 102F.1 Zawartosc płyty . . . . . . . . . . . . . . . . . . . . . . . . . . 102F.2 Uruchomienie projektu . . . . . . . . . . . . . . . . . . . . . . 102

Bibliografia 104

Page 7: Mgr

SPIS TRESCI vii

Lista ilustracji 113

Lista tabel 114

Indeks 118

Page 8: Mgr

Rozdział 1

Wprowadzenie

1.1 Motywacja

Szeroko pojete zanieczyszczenia powietrza sa jednym z wazniejszych, nie-rozwiazanych problemów zarówno w zakresie ochrony srodowiska jak iochrony zdrowia. Fakt negatywnego wpływu stezen zanieczyszczen powie-trza na zdrowie ludnosci został wykazany w wielu niezaleznych badaniach.Duzo łatwiej jest owym zanieczyszczeniom zapobiegac, niz likwidowac ichskutki.

Brak pewnych, miarodajnych metod prognozowania i modelowania za-nieczyszczen powietrza jest powazna przeszkoda zarówno w doraznych dzia-łaniach zapobiegajacym przekroczeniom dopuszczalnych poziomów zanie-czyszczen, jak i przy długofalowym zarzadzaniu ich poziomami. By zapo-biegac doraznie zanieczyszczeniom władze samorzadowe kazdego poziomumusza miec dostep do wiarygodnego systemu ostrzegajacego o przyszłychprzekroczeniach, natomiast do długofalowego zarzadzania ich poziomamipotrzebuja one narzedzi pozwalajacych ocenic wpływ róznych inwestycjina poziomy zanieczyszczen. Dodatkowo budowa, rozwój i utrzymanie siecipomiarowych zanieczyszczen powietrza jest bardzo kosztowne — mozliwejest budowanie modeli, które umozliwia obnizenie tych kosztów, badz tezpodwyzszenie ilosci i jakosci zbieranych danych bez widocznego ich pod-wyzszania.

Problem ten dotyczy w szczególnosci władz lokalnych, dla których szcze-gólnie trudno opracowac modele emisyjne.

Celem pracy jest opracowanie i zbadanie narzedzi do wspomagania sa-morzadów lokalnych w realizacji programów naprawczych, tj. zmniejsza-nia poziomu pyłu zawieszonego tak, by poziom ten był zgodny z poziomamidopuszczalnymi zapisanymi w dyrektywie UE 2008/50/WE.

1

Page 9: Mgr

ROZDZIAŁ 1. WPROWADZENIE 2

1.2 Pył zawieszony

Pył zawieszony ( PM†), to okreslenie drobin ciała stałego, które sa zawie-szone w powietrzu (ze wzgledu na rozmiar proces ich grawitacyjnego osia-dania jest: albo bardzo powolny, albo nie jest głównym kanałem ich usu-wania ze srodowiska).

Aktualnie rozróznia sie dwie frakcje PM:

PM10 jest to frakcja pyłu zawieszonego o srednicy aerodynamicznej‡ poni-zej 10µm

PM2,5 jest to frakcja pyłu zawieszonego o srednicy aerodynamicznej poni-zej 2, 5µm

Rozróznia sie sie równiez inne frakcje. Jednak ze wzgledu na mozliwo-sci pomiarowe (im nizsze jest górne ograniczenie na wielkosc czastki, tymtrudniejszy jej pomiar), jak i obowiazujaca legislacje, w której wydzielonowłasnie te dwie frakcje, pozostaniemy przy tym podziale.

Podział ten nie jest zupełnie aprioryczny — pomiar tych frakcji wy-maga róznej aparatury pomiarowej, a ich wpływ zdrowotny równiez jestistotnie inny. Jednak w miare rozwoju wiedzy na temat wpływu stanuzanieszczyszczen na stan zdrowia człowieka oraz innowacji pomiarowych,mozliwe sa daleko idace zmiany regulacji. Zmianom moze ulegac nie tylkopodział na frakcje, ale i przykładowo na jednostki, w których dokonuje siepomiaru††.

1.3 Zanieczyszczenia powietrza jako zagrozenie dlazdrowia

Wpływ pyłów zawieszonych na zdrowie ludnosci

Wielokrotnie powtarzane badania przeprowadzane zarówno w Europie jaki w USA,[1, 4, 5]‡‡ bezspornie udowodniły wpływ wysokich stezen na zdro-wie mieszkanców. Obserwuje sie zarówno wpływ pojedynczych epizodówwysokich stezen pyłów, jak i skumulowany wpływ sredniego poziomu za-nieczyszczen, na który wystawiona jest ludnosc w długim okresie.

Powyzszy rozdział stanowi krótkie wprowadzenie do tego tematu, którywymaga głebszych analiz.†PM (z ang. particulate matter)‡Srednica aerodynamiczna patrz. A††Trwaja badania które wykazuja istotny wpływ zdrowotny liczby drobnych czastek które

przedostajacych sie do dróg oddechowych.‡‡W USA przeprowadzono zdecydowanie wiecej badan na ten temat. Podane prace sa pra-

cami przegladowymi zawierajacymi wnioski z wielu innych prac badawczych w tej dziedzinie.

Page 10: Mgr

ROZDZIAŁ 1. WPROWADZENIE 3

Metodologie badawcze w tym zakresie

Wiekszosc przeprowadzanych badan polegała na analizie serii czasowychstezen PM i konkretnej metryki zdrowia ludnosci na danym terenie. Me-tryka ta moze byc, na przykład, smiertelnosc czy ilosc wizyt w szpitalu.Prowadzi sie tez badania polegajace na ekspozycji badanych ludzi i zwie-rzat na wysokie stezenia PM, a nastepnie sprawdzania ich stanu zdrowot-nego pod katem przewidywanych objawów.

Badania epidemiologiczne prowadzono porównujac rózne metryki zdro-wotne na jakims terenie przed, w trakcie i po epizodach, w których poziompyłów zawieszonych był istotnie rózny od sredniej na tym terenie†. Wnio-ski z szeregu badan prowadzonych w USA ta metoda znajduja sie w tabeli1.1.

Kolejnym rodzajem badan epidemiologicznych prowadzonych w tej dzie-dzinie sa badania porównujace zdrowie ludnosci na terenach o róznychsrednich stezeniach pyłów zawieszonych (i innych zanieczyszczen). Bada-nia te sa trudniejsze do przeprowadzania z racji koniecznosci wprowadze-nia poprawek na inne czynniki majace wpływ na zdrowie ludnosci.

Badania mechanizmów oddziaływania pyłów zawieszonych przeprowa-dzano zarówno metodami in vitro jak i in vivo. Prowadzi sie zarównomikroskopowe badania efektów oddziaływania czastek pyłów na tkankii bada sie makroskopowe objawy pacjentów wystawionych na konkretnestezenia pyłów zawieszonych.

Wnioski z badan

Cytowane prace jasno stwierdzaja istnienie przyczynowej zaleznosci mie-dzy stezeniami PM oraz iloscia zgonów i wizyt w szpitalach na danym te-renie.

“Liczba badan na temat wpływu poziomu pyłu zawieszonegona zdrowie ludnosci wzrosła istotnie w ciagu ostatnich kilkulat. Badania te dotycza równiez poziomów zanieczyszczen po-wszechnie spotykanych w miastach Europy. Wzrosła zarównoilosc badan epidemiologicznych, jak i toksykologicznych. Te ostat-nie powoduja nowe spojrzenie na temat mozliwych mechani-zmów niebezpiecznych dla zdrowia procesów zachodzacych podwpływem zanieczyszczen powietrza czym uzupełnia zestaw do-wodów epidemiologicznych. Zgromadzone dowody sa wystar-czajace by mocno zarekomendowac dalsze regulacje majace na

†Zarówno okresów bardzo wysokich stezen, jak i okresów stezen niskich (na przykładpodczas strajków w osrodkach przemysłowych).

Page 11: Mgr

ROZDZIAŁ 1. WPROWADZENIE 4

celu obnizanie poziomów stezen pyłu zawieszonego. Jest rozsad-nym załozeniem, ze zmniejszanie poziomów zanieczyszczenia po-wietrza bedzie prowadzic do poprawienia poziomu zdrowia lud-nosci†.[6]”‡

Stwierdzono liniowa, na badanym spektrum stezen, zaleznosc miedzy nie-bezpiecznymi efektami zdrowotnymi (w tym smiertelnoscia), a stezeniempyłów zawieszonych[1, 5]. Zaleznosc ta dobrze obrazuje wykres 1.1.

Nie udało sie wykryc dolnej granicy, ponizej której pyły zawieszonenie oddziałuja na zdrowie, czesciowo wynika to z tego, ze niewiele badankoncentruje sie na obszarze niskich stezen††, czesciowo fakt ten tłuma-czy sie tym, ze w kazdej duzej populacji znajduja sie szczególnie wraz-liwe grupy społeczne. Do szczególnie wrazliwych grup społecznych zaliczasie[8]: osoby starsze; noworodki i małe dzieci, osoby o niskim statusie so-cjoekonomicznym, osoby z rozwinietymi chorobami szczególnie narazonychukładów (oddechowy, krwionosny).

Poniewaz szkodliwa kazda ilosc pyłu zawieszonego jest niekorzystnadla zdrowia (w szczególnosci dotyczy to PM2,5[18]), wyznaczone poziomydopuszczalne winny byc traktowane umownie — jako majace techniczny iekonomiczny charakter.

Z badan epidemiologicznych jasno wynika, ze krótkoterminowe oddzia-ływanie pyłu zawieszonego koncentruje sie na układzie oddechowym i krwio-nosnym. W tabeli 1.1 zamieszczono porównanie ilosci zgonów spowodo-wanych problemami z układem oddechowym i krwionosnym w wielu mia-stach USA podczas okresów bardzo wysokich stezen zanieczyszczen.

Dane dotyczace długoterminowego wpływu srednich stezen pyłów za-wieszanych na smiertelnosc sa bardziej skape, a ze wzgledu na trudno-sci w ich analizie oraz koniecznosc wprowadzania poprawek na wiele do-datkowych czynników, ich poprawnosc bywa dyskutowana. Wiekszosc ba-dan wskazuje, ze wraz ze wzrostem srednich stezen pyłu zawieszonego ro-snie liczba osób, które przedwczesnie umieraja na choroby układu krwio-nosnego (w tym zawały). Wiekszosc badan nie wiaze wzrostu stezen za-nieczyszczen ze zgonami spowodowanymi chorobami układu oddechowegochoc wydaje sie prawdopodobne, ze długotrwałe wystawienie na pyły zwie-szone moze powodowac astme u dzieci. Sa równiez badania łaczace wyso-kie srednie stezenia pyłów zwieszonych z rakiem płuc[9].

†Podkreslenie moje.‡Tłumaczenie własne, cytat w jezyku oryginału na stronie 97.††Sa jednak takie badania, które wskazuja zaleznosc miedzy szkodliwymi symptomami

zdrowotnymi, a stezeniem PM2,5 w zakresie stezen od 8 do 30 µgm3 (który to zakres miesci sie

ponizej wiekszosci norm).

Page 12: Mgr

ROZDZIAŁ 1. WPROWADZENIE 5

Rysunek 1.1: Zaleznosc wzrostu smiertelnosci przy wzroscie stezenia PM10o 10 µgm3 od sredniego stezenia PM10.[7] Wykres ten obrazuje fakt istnieniaw przyblizeniu liniowej zaleznosci miedzy stezeniem pyłów zawieszonycha ich skutkami zdrowotnymi.

Zółte kwadraty oznaczaja sredni poziom PM10[µm3

], niebieskie kropki na-

tomiast — wzgledny wzrost ryzyka zdrowotnego dla wzrostu poziomu za-nieczyszczenia o 10 µgm3 (w arbitralnych jednostkach).

Tablica 1.1: Wzrost zgonów podzielony na szerokie kategorie medycznespowodowany wzrostem stezenia PM2,5 o 50 µgm3 (na podstawie szeregu ba-dan przeprowadzonych na przykładach okresów podwyzszonych stezen za-nieczyszczen w XX wieku w USA).[1]

Smiertelnosc Wzrost Procent dodatkowychpoza okresem smiertelnosci smierci

Przyczyna podwyzszonych z danej spowodowanychsmierci zanieczyszczen przyczyny[%] ekspozycja na PM2,5

b

Całosca 100 7 100Układ oddechowy 8 25 28Układ krazenia 45 11 69

Inne 47 0.4 3a Z wykluczeniem niemedycznych przyczyn (takich jak wypadek, morderstwo,

samobójstwome)b Podczas epizodów smogowych

Page 13: Mgr

ROZDZIAŁ 1. WPROWADZENIE 6

Badania wpływu podwyzszonych stezen pyłów zawieszonych na stanzdrowotny pojedynczych osób wykazały: symptomy ze strony dolnych drógoddechowych (kaszel, nasilenie objawów astmy) oraz mierzalne badaniamiklinicznymi osłabienie czynnosci płuc†. Nie udało sie wykryc wpływu ste-zenia pyłów zawieszonych na górne drogi oddechowe. Zaobserwowano utrzy-mywanie sie objawów do 7 dni.[3]

Badania in vitro sa w toku i nie ma jeszcze bezspornych wyników[1].

Zyski z ograniczenia emisji pyłu zawieszonego

Europejski oddział WHO szacuje ze:

“Zgodnie z przewidywaniami modelu RAINS, ekspozycja po-pulacji na pył zawieszony ze zródeł antropogenicznych powo-duje obnizenie sredniej długosci zycia o srednio 8,6 miesiecy (...)

Całkowita liczba przedwczesnych smierci spowodowanych eks-pozycja na pył zawieszony to około 348 000 rocznie w całej UniiEuropejskiej.

Dodatkowo ok 100 000 wizyt w szpitalach powodowane jestekspozycja. (...)

Implementacja obowiazujacej legislacji zwiazanej z emisjazanieczyszczen moze obnizyc powyzsze liczby o około jedna trzecia[10]‡”

1.4 Regulacje unijne

Polska jako członek Wspólnoty Europejskiej podlega dyrektywom Parla-mentu Europejskiego i Rady Europy. Podstawowa dyrektywa normujacakwestie jakosci powietrza w panstwach członkowskich jest dyrektywa 2008-/50/WE w sprawie jakosci powietrza i czystego powietrza dla Europy[14]††.

Cele tej dyrektywy sa nastepujace:

1. “zdefiniowanie i okreslenie celów dotyczacych jakosci powietrza, wy-znaczonych w taki sposób, aby unikac, zapobiegac lub ograniczacszkodliwe oddziaływanie na zdrowie ludzi i srodowisko jako całosc;

2. ocene jakosci powietrza w panstwach członkowskich na podstawiewspólnych metod i kryteriów;

†Zmiany te były niewielkie — lecz statystycznie istotne.‡Tłumaczenie moje. Wersja oryginalna na stronie 97.††W tej czesci pracy bedziemy sie odnosic do prawodawstwa europejskiego z kilku po-

wodów. Głównym powodem jest fakt iz wiele uwarunkowan zwiazanych z ta dziedzina macharakter ponadnarodowy (jest to zwiazane z transgranicznym transportem zanieczyszczenpowietrza).

Page 14: Mgr

ROZDZIAŁ 1. WPROWADZENIE 7

Rysunek 1.2: Skrócenie sredniej długosci zycia spowodowane ekspozycjapopulacji na produkowany przez człowieka pył zawieszony.

(a) Dane na 2010 rok (b) Symulowane dane dla 2020 roku w pod-stawowym scenariuszu CAFE*

(c) Skala powyzszych rysun-ków (w miesiacach)

* Scenariusz CAFE (z ang. Clean Air for Europe) to scenariusz zakładajacyosiagniecie biezacych mozliwych do osiagniecia redukcji poziomów emisjioddzielnie wyznaczanych dla poszczególnych krajów Wspólnoty Europej-skiej.

Page 15: Mgr

ROZDZIAŁ 1. WPROWADZENIE 8

3. uzyskiwanie informacji na temat jakosci powietrza, pomocnych wwalce z zanieczyszczeniami powietrza i uciazliwosciami oraz w mo-nitorowaniu długoterminowych trendów i poprawy stanu powietrzawynikajacych z realizacji srodków krajowych i wspólnotowych;

4. zapewnienie, ze informacja na temat jakosci powietrza była udostep-niana społeczenstwu;

5. utrzymanie jakosci powietrza, tam gdzie jest ona dobra, oraz jej po-prawe w pozostałych przypadkach;

6. promowanie scisłej współpracy pomiedzy panstwami członkowskimiw zakresie ograniczania zanieczyszczenia powietrza;”[15]

Najwazniejsze regulacje

Powyzsza dyrektywa kompleksowo reguluje kwestie długo i krótkotermi-nowego zarzadzania jakoscia powietrza, jednak dla mojej pracy istotnebeda w niej szczególne regulacje:

ocena jakosci powietrza Dyrektywa ta wprowadza pojecie oceny jako-sci powietrza. Pojecie to “oznacza kazda metode stosowana do po-miaru, obliczania, przewidywania lub oszacowania poziomów zanie-czyszczen”. Jest to bardzo istotne w kontekscie niniejszej pracy, po-niewaz taka jego definicja umozliwia, w konkretnych sytuacjach, uzu-pełnianie (badz zastepowanie) punktów pomiarowych wynikami mo-delowania.

liczba stacji pomiarowych Dyrektywa jasno okresla wymagane iloscipunktów pomiarowych, jednoczesnie w pewnych warunkach (o tymdalej) pozwala na zastapienie czesci z nich modelami.

progi oszacowania Jesli w konkretnej strefie poziom zanieczyszczeniajest nizszy od okreslonych poziomów, mozna stosowac tansze sposobyoceny poziomu danego zanieczyszczenia niz pomiar. Dokładniej: je-sli poziom zanieczyszczenia jest nizszy, niz dolny próg oszacowania†

— pomiary mozna całkowicie zastapic wynikami modelowania/sza-cowania. Jesli poziom zanieczyszczenia jest nizszy, niz górny prógoszacowania, mozna uzywac pomiarów wskaznikowych połaczonychz wynikami modelowania‡ (Artykuł 6, par 1 – 3).

†Poziomy te definiowane sa oddzielnie dla kazdego zanieczyszczenia oraz zmieniaja sie wczasie, przytaczanie ich tutaj jest zatem niepotrzebne.‡Powyzej tych progów nalezy wprowadzic stały monitoring poziomów zanieczyszczen.

Page 16: Mgr

ROZDZIAŁ 1. WPROWADZENIE 9

uzupełnianie pomiarów modelowaniem Mozna, przy spełnieniu okre-slonych warunków, zastapic 50% wymaganych stacji pomiarowychwynikami modelowania (Artykuł 7 par. 3).

zródła naturalne Jesli zostanie udowodnione, ze przekroczenie okreslo-nego poziomu zanieczyszczen wynika z udziału zanieczyszczen po-wstajacych w sposób naturalny przekroczenie takie nie jest uzna-wane za przekroczenie (Artykuł 20, par. 2) .

koniecznosc informowania o przekroczeniach Nakłada sie obowiazekinformowania mieszkanców poszczególnych obszarów o przekrocze-niu dopuszczalnych poziomów zanieczyszczen (Artykuł 19 i Załacznik16) .

normy zanieczyszczen Wymaga sie osiagniecia odpowiednich norm ja-kosci powietrza.

pomiary wskaznikowe Wprowadza sie pojecie pomiarów wskaznikowych.Sa to pomiary, “dla których wymagania dotyczace jakosci danych samniej restrykcyjne w porównaniu z pomiarami stałymi”†. By właczycdo uzycia owe pomiary nalezy wykazac (posiłkujac sie modelami), zewartosci zanieczyszczen sa odpowiednio niskie.

wprowadzenie kar Dyrektywa ta nakłada na panstwa członkowskie obo-wiazek wprowadzenia kar dla samorzadów, na terenie których po-ziomy zanieczyszczen przekraczaja odpowiednie poziomy dopuszczalne(Artykuł 7). Aktualnie przepisy te nie sa zaimplementowane w Pol-sce.

1.5 Zastosowania metod opartych o eksploracjedanych w kontekscie uwarunkowan prawnychoraz ochrony zdrowia mieszkanców

Metody oparte o eksploracje danych mozna stosowac w nakreslonych kon-tekstach na nastepujace sposoby:

modelowanie By podejmowac racjonalne decyzje w zarzadzaniu zanie-czyszczeniami powietrza, lokalne władze samorzadowe powinny móc

†Normy dotyczace pomiarów wskaznikowych równiez zaleza od konkretnego rodzaju za-nieczyszczenia. Dla przykładu dla pyłu zawieszonego (PM10 i PM2,5) i pomiary wskaznikowemusza spełniac nastepujace normy: niepewnosc mniejsza od 50%, minimalne pokrycie czasu14% (albo losowy dzien w kazdym tygodniu albo 8 całych tygodni pomiarów rozłozonych rów-nomiernie w ciagu roku), minimalny uzysk danych 90%.

Page 17: Mgr

ROZDZIAŁ 1. WPROWADZENIE 10

ocenic wpływ swoich decyzji na te zanieczyszczenia (zatem na zdro-wie mieszkanców). Przykładem takiego narzedzia jest modeli EME-P/RAINS (dokładniej omówiony w sekcji 2.1), który umozliwia ocenewpływu osiagniecia wymaganych poziomów emisji na zdrowie miesz-kanców Wspólnoty Europejskiej. Model ten umozliwia wysłanie wła-dzom centralnym poszczególnych krajów komunikatu: “Jesli caławspólnota osiagnie oczekiwane poziomy emisji pyłu zawieszonego tow Twoim kraju bedzie rocznie kilka tysiecy hospitalizacji mniej”. Jestto komunikat przekonujacy, zrozumiały i konkretny. Bez takiego na-rzedzia mozna powiedziec co najwyzej: “Jesli cała wspólnota osiagnieoczekiwane poziomy emisji to wszyscy beda zdrowsi”, co juz nikogonie przekona. Byłoby pozadanym opracowac podobne narzedzia dzia-łajace na szczeblu lokalnym, by decyzje o wydaniu zgody na loka-lizacje (badz rozbudowe) fabryk, rafinerii, elektrowni, władze odpo-wiedniego szczebla podejmowały swiadomie. Przykładem tego typumodelu, który okresla główne zródła PM2,5, moze byc model opisanyw [22].

ostrzeganie Nie tylko długotrwałe srednie stezenie pyłu zawieszonegojest grozne dla zdrowia obywateli. Jak pokazuja badania opisane wsekcji 1.3 równiez krótkotrwałe wystawienie na bardzo wysokie ste-zenia niesie dla osób szczególnie wrazliwych ryzyko utraty zycia izdrowia. Lokalne władze samorzadowe moga podjac pewnie krótko-terminowe działania zapobiegawcze† które pozwola uniknac takichwysokich stezen — jednak działania takie moga byc same w sobieuciazliwe dla mieszkanców lub kosztowne. Władze lokalne posiada-jace dostep do odpowiedniego modelu przed takimi sytuacjami mo-głyby podejmowac te działania w sposób swiadomy. Dodatkowymbodzcem moze byc skuteczna implementacja kar dla samorzadów naterenach, na których wystepuja przekroczenia odpowiednich norm[29,31]

wspomaganie pomiarów wynikami modelowania Wyniki pomiarówmozna wspomagac za pomoca modelowania na wiele sposobów. Mozna

†Mozliwosc podjecia tego typu krótkoterminowych działan zalezy od przyczyn powstaniazanieczyszczenia (a zatem specyfiki danego terenu). Bez specjalnego dowodu podam naste-pujace przykłady takich działan:

• Zamkniecie centrum miasta dla ruchu samochodowego

• Oczyszczenie ulic z błota posniegowego

• Wyłaczenie konkretnych uciazliwych zakładów produkcyjnych

Jak widac działania te sa kosztowne — i by je podjac władze samorzadowe musza miec po-wazne powody.

Page 18: Mgr

ROZDZIAŁ 1. WPROWADZENIE 11

uzupełniac luki w danych powstałe albo na skutek awarii oprzyrza-dowania, albo wynikajace z metody pomiarów (dla pomiarów wskaz-nikowych). Propozycja takiej metody zawarta jest w niniejszej pracy5.1, inna w [20]. Prowadzone sa próby szacowania poziomów jed-nych zanieczyszczen za pomoca innych zanieczyszczen [21]. Wreszciebuduje sie modele wspomagajace dokładnosc pomiarów poziomu PM(patrz 3.5).

zródła naturalne zanieczyszczen Łagodniej traktuje sie w dyrektywie2008/50/WE zanieczyszczenia ze zródeł naturalnych (oraz zanieczysz-czenia kilku innych typów np. spowodowane nasypywaniem dróg solai piaskiem). Musza jednak istniec narzedzia dowodzace, ze przyczynaprzekroczenia były własnie takie zródła[22].

Page 19: Mgr

Rozdział 2

Przedmiot badan

On two occasions I have been asked, ’Pray, Mr.Babbage, if you put into the machine wrongfigures, will the right answers come out?’ I am notable rightly to apprehend the kind of confusion ofideas that could provoke such a question.

Charles Babbagea

aCharles Babbage projektant ’Silnika Analitycznego’— maszyny która mogła byc pierwszym działajacym urza-dzeniem równowaznym Uniwersalnej Maszynie Turinga.

Praca skupia sie na rozwinieciu i ulepszeniu metod prognozowania ste-zen zanieczyszczen powietrza. Metody modelowania mozna podzielic nadwie główne kategorie:

chemical transport model(CTM) Sa to metody oparte na analitycznych†

modelach propagacji zanieczyszczen oraz ich chemicznych przemian.Danymi wejsciowymi do modeli tego typu sa szacunki emisji bada-nych zanieczyszczen, topografia terenu, przewidywania parametrówpogodowych na kolejne dni. Kluczowa dla dokładnosci tych modelijest baza danych emisyjnych, której uzyskanie jest trudne i dosc kosz-towne.

metody oparte o eksploracje danych Sa to metody oparte oparte nazałozeniu, ze pomimo iz przebieg szeregu czasowego stezen zanie-czyszczen jest dosc chaotyczny. Da sie opracowac krótkoterminowepredykcje w oparciu o historyczne dane pomiarowe (oraz inne para-metry takie jak, historyczne parametry pogodowe, prognozy pogody,etc.).

†Analityczne jest tutaj uzyte w znaczeniu: posiadajace matematyczne modele — oczywi-scie przywidywania otrzymuje sie za pomoca numerycznych obliczen.

12

Page 20: Mgr

ROZDZIAŁ 2. PRZEDMIOT BADAN 13

2.1 Istniejace systemy modelowania o podobnymcharakterze w Polsce i Europie

Wdrozenia w Polsce

Aktualnie w Polsce WIOS-ie w niektórych województwach wdrazaja za-równo systemy oparte na modelach emisyjnych (Mazowieckie i inne), jak ieksploracji danych (Slaskie).

Model EMEP jako model pyłów zawieszonych

Geneza modelu EMEP

W roku 1979 podpisano traktat o transgranicznym przenoszeniu zanie-czyszczen powietrza na dalekie odległosci (LRTAP†), która normuje trans-graniczne przepływy niektórych zanieczyszczen powietrza oraz nakładaograniczenia na wzrosty emisji niektórych zanieczyszczen‡. W jednym zprotokołów do tego traktatu ustalono finansowanie programu monitoringui oceny długo zasiegowego transportu zanieczyszczen powietrza w Europie(EMEP††), który ma dostarczac, miedzy innymi, narzedzi do oceny trans-granicznego przepływu zanieczyszczen.

Głównym narzedziem do oceny tego przepływu jest model EMEP.

Metoda działania modelu EMEP

“Model EMEP został stworzony do obliczenia długotermino-wych zaleznosci miedzy zródłami zanieczyszczen w skali Euro-pejskiej. Opisuje emisje, transport, transformacje chemiczneoraz usuwanie poprzez suche i mokre osiadanie dla 75 rodza-jów czastek (...) i 140 reakcji chemicznych. Model EMEP byłoryginalnie stworzony do pracy w skali regionu na siatce nu-merycznej o wymiarach 50 na 50 kilometrów obejmujacej całaEurope. (...)

Model EMEP zawiera naturalne jak i antropogeniczne zró-dła pyłów zawieszonych. Zródła antropogeniczne zawieraja za-równo pierwotne zródła pyłów zawieszonych takie jak fabryki,

†LRTAP (z ang. Long Range Transbounary Air Pollution)‡Sama konwencja nie wprowadza zadnych norm — wyraza ona po prostu wole podpisu-

jacych ja stron do badania i ograniczania emisji zanieczyszczen powietrza[26], jednak pod-pisano w ramach tej konwencji osiem protokołów, które normuja, miedzy innymi, kwestieemisji wielu zanieczyszczen powietrza[27].††Programme for monitoring and evaluation of Long-Range transmission of air pollutants

in Europe

Page 21: Mgr

ROZDZIAŁ 2. PRZEDMIOT BADAN 14

osadnictwo ludzkie i rolnictwo sklasyfikowane jako zródła gru-bego i drobnego pyłu†, jak i emitentów gazowych prekursorówwtórnych nieorganicznych aerozoli, dokładniej dwutlenku siarki,tlenków azotu oraz amoniaku. Informacje o zródłach antropoge-nicznych pochodza z oficjalnie zgłaszanych, w ramach traktatuLRTAP w programie EMEP, danych. (...) Jedynym naturalnymzródłem pyłów zawieszonych, które w tej chwili zawiera modelEMEP jest sól morska‡ (...).

Istnieja wiec znane zródła pyłów zawieszonych niezawartew modelu EMEP (...) sa to:

• Wtórne organiczne aerozole powstałe w atmosferze, którepowstały z kondensacji lotnych zwiazków organicznych (wy-produkowanych zarówno przez człowieka, jak i pochodze-nia naturalnego

• Emisji pyłów zawieszonych z spalania biomasy i pozarówlasów

• Pierwotnych organicznych takich jak pyłki czy zarodnikigrzybów”[11]

Charakterystyka działania modelu EMEP

Wyniki modelu EMEP maja dobre korelacje czasowe i przestrzenne z da-nymi pomiarowym (wartosci liczbowe zawarte w tabeli 2.1). Model tenrówniez systematycznie niedoszacowuje poziom zanieczyszczen (wartosciliczbowe w tabeli 2.2).

Pouczajace sa wymienione przyczyny niedoszacowan. Jedna ze zdia-gnozowanych przyczyn niedoszacowan modelu jest nieuwzglednienie wszyst-kich zródeł zanieczyszczen. Druga, istotniejsza, przyczyna sa immanentnewłasciwosci metody pomiaru poziomów PM.

Poziomy PM mierzone sa wieloma metodami, jednak metoda referen-cyjna jest metoda grawimetryczna, która polega na pomiarze wzrostu masyfiltra, przez który przepuszczono zadana objetosc mierzonego powietrza.Na owym filtrze osadzaja sie nie tylko pyły zawieszone, ale równiez woda(czy to woda pochodzaca z atmosfery, czy woda bedaca czescia składowadanej drobiny pyłu atmosferycznego). Woda ta moze stanowic od 10 do

†Jako grube okresla sie tutaj zarówno PM10 jak i grubsze frakcje pyłów, jako drobne —PM2,5. [przyp. aut.]‡Istnieje model aerozolowy EMEP, który zawiera zródła takie jak poderwana przez wiatr

gleba w uprawach, czy pył znad Sahary [przyp. aut.][11].

Page 22: Mgr

ROZDZIAŁ 2. PRZEDMIOT BADAN 15

30% przyrostu masy filtra†. Model EMEP natomiast modeluje sucha masePM (uwzglednienie wilgotnosci daje istotna poprawe dokładnosci — patrztabela 2.2).

2.2 Porównanie modeli CTM i DMM

łatwosc implementacji Zdecydowanie łatwiej jest zaimplementowac mo-deloparty o eksploracje danych, głównie z tego powodu, ze potrzebujeon duzo mniejszej ilosci danych do poprawnego działania. Z samejswojej natury modele te oparte sa o archiwalna baze danych pomia-rowych (a bazy takie na mocy miedzynarodowych porozumien sa zbie-rane i musza byc udostepniane) i do pracy potrzebuja niewiele wie-cej. Modele CTM, natomiast, wymagaja zgromadzenia bazy danych oproducentach zanieczyszczen na danym terenie (a bazy takie czestotrzeba tworzyc od zera lub poprawiac), bazy ukształtowania terenu,czesto wymagaja własnego trójwymiarowego modelu pogody i tak da-

†O metodach pomiaru poziomu PM jak równiez o tym jakie moga one powodowac pro-blemy patrz rozdział3)

Tablica 2.1: Korelacje miedzy danymi pomiarowymi a wynikami mo-delu[12]

Rodzaj korelacji Zakres współczynników korelacjiCzasowa (0, 56; 0, 78)

Przestrzenna (0, 70; 0, 78)

Tablica 2.2: Systematyczne niedoszacowanie poziomów zanieczyszczen wmodelu EMEP[6]

Rodzaj pomiaru Niedoszacowaniec

PM10w Niemczech 66%PM10w pozostałych krajach 100%

PM2,5 50%PM2,5 uwzgledniajac porwany przez wiatr pył 28%

PM2,5 uwzgledniajac jeszczed wilgotnosc mierzonej próbki 12%a Korelacja szeregu czasowego pomiarów dziennychb Korelacja długoterminowych srednich w poszczególnych punktach prze-

strzennychc Zdefiniowana jako iloraz róznicy miedzy poziomami mierzonym i modelowa-

nym do poziomu mierzonego. 100% oznacza ze model daje dwukrotnie mniej-sze wyniki.

d Czyli uwzgledniajac pył porwany przez wiatr i wilgotnosc mierzonej próbki

Page 23: Mgr

ROZDZIAŁ 2. PRZEDMIOT BADAN 16

Rysunek 2.1: Korelacje szeregów czasowych pomiarów i wyników modeluEMEP (na osi odcietych poszczególne stacje biorace udział w programieEMEP)[11]

(a) Dla PM10a (b) Dla PM2,5

b

a Niebieska krzywa reprezentuje korelacje dla suchej masy PM, zielonareprezentuje sucha mase PM z uwzglednieniem pyłu porwanego przezwiatr, czerwona — uwzglednia dodatkowo wilgotnosc próbki.

b Niebieska krzywa reprezentuje korelacje dla suchej masy PM, czer-wona uwzglednia dodatkowo wilgotnosc próbki.W obu rysunkach na osi odcietych znajduja sie rózne stacje pomiarowe.Na osi odcietych oznaczono rózne stacie działajace w ramach programuEMEP.

Rysunek 2.2: Porównanie wyników modelu EMEP z poziomamizanieczyszczen[11]

(a) PM10 (b) PM2,5

Przerywana linia niebieska oznaczono wyniki modelowania, czerwona li-nia ciagła natomiast — wyniki pomiarów.

Page 24: Mgr

ROZDZIAŁ 2. PRZEDMIOT BADAN 17

lej. Uzyskanie wymienionych danych jest trudne†, czasochłonne i cowazniejsze, kosztowne.

mozliwosci predykcyjne Modele CTM maja duzo wieksze mozliwosciprzewidywania. Umozliwiaja przewidzenie np. wpływu nowej in-westycji na poziomy zanieczyszczen na okreslonym terenie, potrafiawyznaczac przestrzenne rozkłady zanieczyszczen, potrafia, wreszcie,powiedziec jakie sa zródła zanieczyszczen powietrza w danym punk-cie. Metody oparte o eksploracje danych nie maja natomiast takichmozliwosci. Ich mozliwosci opieraja sie na analizie przeszłych danych— nie sa w stanie zatem dac odpowiedzi na pytanie o wpływ jakiejsprzyszłej inwestycji na poziomy zanieczyszczen. Mimo to, mozna wy-korzystywac tego typu modele do przewidywania poziomów zanie-czyszczen, jednak bedzie to przewidywanie oparte na analizie danychprzeszłych, wiec niezdolne do uwzglednienia nowych uwarunkowan(natomiast, przy załozeniu braku bardzo szybkich zmian charakte-rystyki emisji, modele te beda ciagle dokładniejsze od modeli CTM).Nie ma równiez prostej metody uzycia modeli eksplorujacych danedo odtworzenia przestrzennego rozkładu zanieczyszczen na danymterenie.

systematyczny bład Wyniki modeli opartych na eksploracji danych sarzadziej obarczone systematycznym błedem. Wynika to po prostu zfaktu, ze pracuja one na danych pomiarowych wiec, w sposób natu-ralny odtwarzaja je. Nalezy jednak zauwazyc, ze ma to równiez złestrony: modele takie odtwarzaja równiez błedy detektora‡. Jesli najakiejs stacji pomiarowej, w której dokonuje sie pomiarów recznychpracuje leniwy pracownik, który nieprawidłowo przygotowuje próbkipomiarowe przed wazeniem w wyniku czego pomiary z tej stacji sasystematycznie zawyzone o np 30%, to model oparty o eksploracjedanych — wiernie odtworzy równiez ten artefakt. Jesli dla modelitych odtwarzanie danych pomiarowych przychodzi zupełnie natural-nie — dla modeli analitycznych uzyskanie wiernego odtwarzania da-nych jest bardzo trudne, wynika zarówno to z duzej trudnosci w uzy-skaniu godnych zaufania danych emisyjnych, jak i trudnosci pomia-rowych pomiaru imisji PM. Problemy z pozyskaniem wiarygodnych i

†Szczególnie w małych miejscowosciach problemem jest tzw. niska emisja — czyli emisjaz gospodarstw domowych. W typowym małym miescie emitentem zanieczyszczen jest kazdedomostwo a jego charakterystyka emisji zalezy od bardzo wielu czynników (wygody — łatwiejjest uruchomic piec gazowy niz nagrzac w kominku, cen paliw, temperatury — przy silnychmrozach czesto korzysta sie z wielu zródeł ciepła na raz).‡O ile błedy te powoduja powstawanie przewidywalnych wyników.

Page 25: Mgr

ROZDZIAŁ 2. PRZEDMIOT BADAN 18

dokładnych danych emisyjnych czesciowo moga wynikac ze złej woliemitentów zanieczyszczen†, czesciowo z immanentnych trudnosci wuzyskaniu takich baz danych‡.

dokładnosc Modele oparte o eksploracje danych sa równiez dokładniej-sze od modeli analitycznych. Model EMEP daje wyniki systematycz-nie zanizone (w najlepszym wypadku) o 40% (powody nieoszacowa-nia opisane w 2.1) . Dokładnosc tego rzedu osiagaja nawet najprost-sze modele eksplorujace dane. Przykładowo, dokładnosc tego rzeduma model zdefiniowany jako: “Dla danego punktu pomiarowego zawynik modelowania przyjmij zawsze sredni poziom zanieczyszczen zcałej historii tego punktu”.

2.3 Definicja modelu

Słowo model ma wiele znaczen i w tym miejscu okreslamy dokłade znacze-nie w jakim uzywane jest ono w dalszej czesci pracy. Model bedzie tutajuzywany w rozumieniu:

„Schematyczny opis systemu, teorii, lub fenomenu, który bie-rze pod uwage jego znane lub przewidziane własciwosci i mozebyc uzyty do dalszego badania jego charakterystyki (...)††”[35]

Dla nas cecha charakterystyczna modelu jest to ze mozna na jego podsta-wie badac pewne cechy obiektu modelowanego.

Model oparty na technikach eksploracji danych

Model oparty na technikach eksploracji danych to narzedzie, które majacpewien korpus danych historycznych jest w stanie odtwarzac dane nale-†W duzej mierze wynika to ze sprzecznosci interesów, z jednej strony róznym instytucjom

zalezy na posiadaniu miarodajnych danych o emisji, z drugiej — emitenci sa karani za prze-kraczanie norm emisji (co moze powodowac zanizanie raportowanych wyników pomiarów).Jako ciekawostke obrazujaca ten fakt podam, ze w grudniu 2010 roku sekretariat traktatuLRTAP wydał note o łamaniu przez Hiszpanie jednego z protokołów traktatu, w której to no-cie napietnowano miedzy innymi posługiwanie sie przestarzałymi danymi dotyczacymi emisjiniektórych zanieczyszczen[25].‡O ile da sie stworzyc katalog emitentów przemysłowych, o tyle dla PM przemysł nie jest

głównym emitentem, a co najmniej równie istotnymi zródłami emisji jest emisja komunika-cyjna (czyli produkty spalania paliw, zuzycie opon, hamulców i asfaltu, oraz pyły wyrzucanew góre z powierzchni drogi) oraz tak zwana niska emisja (czyli emisja z pieców domowych).Badania przeprowadzone w Finlandii sugeruja, ze emisja PM z tych kategorii zródeł ma, codo rzedu wielkosci, podobny poziom[30]. O tyle o ile charakterystyka emisji w Polsce i krajachskandynawskich jest istotnie inna — o tyle fakt, ze nie da sie zignorowac zródeł komunikacyj-nych i niskiej emisji wydaje sie obowiazywac zawsze. Polskie zródła wydaja sie potwierdzacznaczny udział zródeł nieprzemysłowych w zanieczyszczaniu powietrza [19]. Model RAINSstwierdza emisja PM2,5 ze zródeł w kategoriach niska emisja, transportu przemysł jest po-dobny — kazda z tych kategorii wnosiła wkład rzedu 24 — 35%.††Tłumaczenie własne. Tekst oryginalny na stronie 98

Page 26: Mgr

ROZDZIAŁ 2. PRZEDMIOT BADAN 19

zace do tej samej klasy, do której naleza dane z korpusu historycznego,których to jednak w owym korpusie nie ma.

Nalezy równiez zauwazyc, ze nie stawiamy znaku równosci pomiedzysiecia neuronowa a modelem opartym o eksploracje danych. Model mozeuzywac sieci neuronowej, jednak nie jest z nia tozsamy. Model moze naprzykład dokonywac pewnych przekształcen na danych wejsciowych, przedpodaniem ich sieci neuronowej.

Page 27: Mgr

Rozdział 3

Metody pomiarów poziomówPM

Dotychczas przyjmowano, ze wszelkie naszepoznanie musi sie dostosowywac do przedmiotów.Lecz wszelkie próby, by przy ich pomocy orzec cos,co by rozszerzyło poznanie nasze, obracały sie przytym załozeniu w niwecz. Próbujmyz wiec raz, czysie nam lepiej nie powiedzie przy rozwiazywaniuzadan metafizyki, jezeli przyjmiemy, ze toprzedmioty musza sie dostosowywac do naszegopoznania.

Immanuel Kant „Krytytyka czystego rozumu”

Parametrem, który jest uzywany do opisu poziomu PM jest całkowitamasa pyłu na jednostke objetosci powietrza.

Ze wzgledu na złozona nature samego mierzonego fenomenu wszyst-kie metody pomiaru masy PM sa zarówno dosc złozone, jak i obarczonesporym błedem doswiadczalnym. Zarówno w prawodawstwach UE[36, 37]jak i USA ustalono, ze referencyjna metoda pomiaru jest metoda grawime-tryczna i wszystkie inne metody nalezy kalibrowac za jej pomoca.

3.1 Regulacje prawne

Urzadzenia, które mierza poziom PM dziela sie na dwie kategorie:

odniesienia Urzadzenia uznawane sa za urzadzenia odniesienia odpo-wiednie organy regulacyjne.

20

Page 28: Mgr

ROZDZIAŁ 3. METODY POMIARÓW POZIOMÓW PM 21

równowazne Dla urzadzen równowaznych wykazano w specjalnej proce-durze testów, ze daja one wyniki spójne z urzadzeniami odniesienia†.

3.2 Metoda grawimetryczna

W biezacej legislacji tylko urzadzenia grawimetryczne sa urzadzeniami od-niesienia.

Metoda ta jest najprostsza konceptualnie i polega ona na przepuszcze-niu danej objetosci powietrza przez filtr. Powietrze wczesniej przechodziprzez system sortowników, tak by tylko czastki o odpowiedniej srednicytrafiały do filtra, na którym sie osadzaja. Po przepuszczeniu odpowiedniejilosci powietrza przez filtr (chodzi o to, by przyrost masy filtra był istotny‡)filtr jest kondycjonowany, czyli trzymany w warunkach okreslonej tempe-ratury i wilgotnosci†† przez okreslony czas (czas ten jest rzedu dni). Pookresie kondycjonowania filtr jest wazony.

Metoda ta ma dwie zasadnicze wady:

niska rozdzielczosc czasowa Czas wykonywania pomiaru jest rzedudnia — tj. powietrze jest przepuszczane przez filtr przynajmniejdzien (zdarzaja sie równiez pomiary, w których rozdzielczosc czasowajest nizsza). Nie da sie zatem za pomoca urzadzen grawimetrycznychuzyskac lepszej rozdzielczosci czasowej.

długi czas do odczytu pomiaru pomiedzy wykonaniem pomiaru (osa-dzaniem pyłu na filtrze), a jego odczytem (wazenie filtra) jest rzedudni, wiec z urzadzen grawimetrycznych nie da sie uzyskiwac danycho stanie atmosfery w trybie on line.

Prawidłowe wyniki pomiaru moga byc zaburzone przez efekty takie jak[38,39, 40]:

wilgoc osadzajaca sie na próbce Masa pyłu jest relatywnie mała w po-równaniu z masa filtra czy masa wody która moze sie na nim osadzic.Intensywnosc zmiany masy wraz z wilgotnoscia zalezy od uzywanegorodzaju filtru.

histereza wilgotnosci masa próbki nie jest funkcja wilgotnosci, zalezyjeszcze od tego czy dana wilgotnosc osiagnieto poprzez osuszanie próbkiz wysokiej wilgotnosci, czy pozwalajac osadzac sie wilgoci na suchejpróbce.

†Dokładny opis układów odniesienia oraz metody wykazywania ekwiwalentnosci w [37].‡Typowa masa filtra to 100mg, typowa masa PM osadzonego na filtrze to 0− 2mg.[39]††W Unii Europejskiej jest to 20± 1◦C przy wilgotnosci wzglednej 50± 5%.

Page 29: Mgr

ROZDZIAŁ 3. METODY POMIARÓW POZIOMÓW PM 22

rozpuszczanie i parowanie soli Czesc składników PM stanowia rozpusz-czalne sole, które moga rozpuszczac sie w wilgoci na próbce i cze-sciowo z niej parowac.

transport Filtru czesto wykonane sa z materiałów nie odpornych mecha-nicznie, ich transport moze powodowac zmiane masy.

Problemy z filtrami

Kwestie te dotycza wszystkich metod pomiarowych, w których pył jestzbierany na filtrze przed dokonaniem pomiaru masy[38, 39, 40]:

reakcje chemiczne pomiedzy składnikami PM oraz PM a filtrem. Inten-sywnosc tego rodzaju procesów zalezy od rodzaju filtru.

zapychanie sie filtrów Przy duzych poziomach PM filtry potrafia sie za-tykac. Zalezy to od rodzajów filtrów.

parowanie czesciowo lotnych substancji Zwiazki takie jak naftalenczy azotan amonu sa czesciowo lotne i moga parowac z filtra w czasieprocesu jego kondycjonowania. Podczas gdy azotan amonu zaczynaparowac dopiero w temperaturach ok 50◦C, to naftalen paruje z filtradosc szybko bez wzgledu na temperature. Temperatura parowaniaposzczególnych zwiazków wchodzacych w skład

zmniejszanie masy filtra pod wpływem przepływu powietrza. Niektórefiltry sa zbudowane z ciasno zbitych włókien, które pod wpływemprzepływu powietrza moga sie odrywac od filtra.

3.3 Osłabienie promieniowania β

W miernikach działajacych na zasadzie osłabienia promieniowania β† do-konuja pomiary przyrostu masy filtra badajac spadek jasnosci promienio-wania β. Jasnosc promieniowania β po przejsciu przez materie dana jestwzorem:

I = I0 exp (µgm) (3.1)

gdzie µ to stała zalezna od materiału, g to stała zalezna od geometriiukładu, natomiast m to przyrost masy próbki.

† (BAM, z ang. beta attenuation monitor)

Page 30: Mgr

ROZDZIAŁ 3. METODY POMIARÓW POZIOMÓW PM 23

Osłabienie promieniowania β zalezy od materiału, przez który ono prze-chodzi — jednak dla typowych zwiazków, które tworza PM† róznica pomie-dzy stałymi materiałowymi jest mniejsza niz 10%[41]. Stałe geometryczneeliminuje sie ze wzorów za pomoca wprowadzenia próbek kalibracyjnych,które maja taki kształt jak folia, przez która przepuszcza sie PM. Dodat-kowo próbki kalibracyjne czesto maja skład podobny do PM (co czescioworozwiazuje równiez problem nieokreslonosci stałej materiałowej.

Równanie z jakiego wyznaczamy mase to[42]:

m = A ln

(I0I

)(3.2)

gdzie: I0 to jasnosc wiazki elektronów przechodzacej przez fragmentprzed przepuszczeniem przez niego próbki powietrza, I jasnosc wiazki potym. A to stała wyznaczana z kalibracji.

Urzadzenia tego typu sa w stanie dokonywac pomiary srednich godzi-nowych stezen PM.

Typowy pomiar srednich godzinnych PM wyglada nastepujaco: przez 6minut trwa pomiar osłabienia promieniowania β przez filtr, na którym nieosadzono pyłu, przez 46 minut trwa osadzanie pyłu na tasmie, potem przez6 minut trwa pomiar osłabienia promieniowania β przez filtr z osadzonympyłem. Pozostałe dwie minuty rezerwowane sa na przemieszczanie tasmy.

3.4 Mierniki TEOM‡

W miernikach TEOM filtry umieszczane sa w oscylujacej rurce, która jestpobudzana do drgan. Rezonansowa czestotliwosc drgan zalezy od masy ca-łego układu (filtr, osadzony PM) oraz od temperatury. By ustabilizowactemperature powietrze wlatujace do miernika TEOM podgrzewa sie do50◦C. Podgrzewanie strumienia powietrza powoduje utrate lotnych zwiaz-ków z próbki — co powoduje, ze mierniki te mierza tylko stała czesc PM,przez to mierniki TEOM nie sa uznawane równowazne, o ile nie zastosujesie jakiejs dodatkowej metody oceny ilosci traconej lotnej masy PM††.

†Mierniki BAM moga mierzyc zarówno PM10, jak i PM2,5, sama czesc pomiarowa pozo-staje niezmieniona — nalezy tylko przed nia umiescic odpowiedni inny układ sortowników.‡(z ang. tapered element oscillating microbalance)††Jest to mozliwe w urzadzeniach działajacych wielostopniowo (oddzielny pomiar czesci

lotnej) lub poprzez absorpcje lotnej czesci PM na np. weglu aktywowanym (po uprzednimpozbyciu sie gazowej czesci NOx i O3. Tego typu rozwiazania sa dla nas mniej ciekawe— poniewaz w dalszej czesci rozdziału bedziemy sie koncentrowac na metodach wspieraniapomiarów za pomoca modelowania.

Przykładem systemu który działa w oparciu o TEOM ale jest równowazny za pomiaramigrawimetrycznymi jest system FDMS.

Page 31: Mgr

ROZDZIAŁ 3. METODY POMIARÓW POZIOMÓW PM 24

3.5 Rola modelowania w pomiarach poziomów PM

Modelowanie poziomu PM2,5 za pomoca PM10

W Polsce nie ma zbyt wielu punktów pomiaru PM2,5, poniewaz jednak po-ziom tego zanieczyszczenia jest skorelowany z poziomem PM10 oraz z pa-rametrami pogodowymi, mozliwe jest jego szacowanie za pomoca tych da-nych oraz modelu opartego o eksploracje danych. W [21] opracowano modelDMM oparty o regresje wielokrotna, który estymował poziom PM2,5 za po-moca poziomu PM10, oraz parametrów meteorologicznych i charakterystykczasowych. Podany model działał na srednich godzinowych.

Poziom PM2,5 wyznaczano ze wzoru:

PM2,5 = b0 +

N∑i=1

biXi (3.3)

gdzie Xi to odpowiednie zmienne pogodowe, a współczynniki bi wyzna-czono metoda najmniejszych kwadratów.

Po sprawdzeniu wielu zestawów parametrów autorzy wybrali modelpracujacy na nastepujacym zbiorze zmiennych Xi:

• Poziom PM10

• cosinus dnia w roku

• cosinus godziny w dobie†

• temperatura powietrza

• wilgotnosc wzgledna powietrza

Model ten z dobra dokładnoscia był w stanie (po wytrenowaniu na danychz Zabrza) prawidłowo odtwarzac dane z Dabrowy Górniczej.

Model ekstrapolujacy do uzupełniania luk w pomiarach

Mozliwe jest zbudowanie modelu dokonujacego ekstrapolacji poziomu PM10,na podstawie poziomu PM10 na pobliskich stacjach, oraz parametrów po-godowych w punkcie ekstrapolowanym. Model ten dokładnie jest opisanyw sekcji 5.1.

Model ten moze miec nastepujace zastosowania:

†Posługuje sie tutaj okresleniami zaczerpnietymi z artykułu. Najprawdopodobniej cho-dziło jednak o wzory w postaci: dla godziny — cos

(godz24

); dla dnia w roku — cos

(dzien365

).

Page 32: Mgr

ROZDZIAŁ 3. METODY POMIARÓW POZIOMÓW PM 25

• Uzupełnianie luk wynikajacych z awarii badz konserwacji urzadzenpomiarowych. W pomiarach wystepuja krótkotrwałe luki, model tenmoze z powodzeniem uzupełniac takie luki korzystajac z pomiarówna pobliskich stacjach.

• Zapewnianie pomiarów on line ze stacji grawimetrycznych. Jedna zwad mierników grawimetrycznych jest czas po jakim otrzymuje siewyniki pomiarów. Układ interpolujacy mógłby bardzo łatwo udostep-niac pierwsza estymacje pomiarów on line — tj. udostepniac esty-macje biezacego poziomu PM10 za pomoca wyników z pobliskiej stacjiautomatycznej.

Zapewnianie ekwiwalentnosci dla mierników TEOM

Główna metoda prowadzenia pomiarów PM10 on line w Wielkiej Brytaniisa mierniki TEOM. Wielka Brytania jest jednak zobowiazana do prowa-dzenia pomiarów za pomoca urzadzen równowaznych w rozumieniu normyEN 12341:1999, a mierniki TEOM nie spełniaja tego warunku. Wymianamierników, badz ich modernizacja, jednak pociaga za soba duze koszty.

Poniewaz ilosc lotnych zwiazków w PM zmienia sie w zaleznosci od se-zonu, nie da sie wprowadzic zadnego stałego czynnika korygujacego po-miary mierników TEOM tak, by były one zgodne z pomiarami referencyj-nymi, tj. nie istnieje takie Apopr które gwarantuje;

PMref = Apopr · PMTEOM (3.4)

gdzie: PMREF to poziom PM10 który jest zgodny z pomiarami referen-cyjnymi, PMTEOM to poziom mierzony miernikiem TEOM, a Apopr to staław czasie i pomiedzy róznymi miernikami TEOM wartosc.

Jednym z rodzajów mierników, który jest zgodny z pomiarami referen-cyjnymi jest sa mierniki FDMS†, które dodatkowo sa w stanie szacowacilosc substancji lotnych w PM. Opracowano wiec model który umozliwiakalibracje jednym miernikiem FDMS wielu mierników TEOM. Odległoscmiedzy stacja FDMS, a stacjami TEOM moze wynosic do 200km. Za po-moca jednego miernika FDMS mozna było kalibrowac wiele miernikówTEOM (w artykule podano, ze było to ponad 20 stacji).

Model ten jest bardzo prosty[43]:

PMref = PMTEOM − 1.87PMFDMS PURGE (3.5)

†Termin zwiazany z pomiarami pyłów zawieszonych-, wyjasnienie w dodatku w dodatkuA.

Page 33: Mgr

ROZDZIAŁ 3. METODY POMIARÓW POZIOMÓW PM 26

gdzie PMFDMS PURGE to ilosc lotnych substancji w PM mierzona za po-moca miernika FDMS.

Page 34: Mgr

Rozdział 4

Opracowanie systemumodelowania zanieczyszczen

— A gdyby, załózmy, był taki opis, który bydoskonale wiernie opisywał rzecz opisywana?— To nie byłby opis.— Aha, no tak. To byłaby wtedy rzecz opisywana.— To byłaby rzecz nie opisywana. To byłby fakt.

Edward Stachura „Fabula Rasa”

Oprogramowanie powstałe w ramach niniejszej pracy moze stanowiczreby automatycznego systemu modelowania zanieczyszczen. W nastep-nych czesciach zostanie opisana architektura takiego systemu, z zaznacze-niem, jakie jej czesci sa juz uruchomione oraz jakie prace mozna nad nimiwykonac.

4.1 Załozenia koncepcyjne

Kroki niezbedne do wykonania modelowania

By wykonac zadanie modelowania nalezy wykonac nastepujace kroki:

1. Pobrac niezbedne dane z zewnetrznych systemów. Zazwyczajniezbedne dane zawarte sa w wielu róznych systemach nalezacych doróznych organizacji† Samo ich zebranie jest problemem nastreczaja-cym pewnych trudnosci.

2. Przygotowac dane dla modelu. Po pobraniu danych nalezy spro-wadzic je do formy, która jest czytelna dla programu modelujacego.

†Takich jak: WIOS, ICM czy Wydział Fizyki Politechniki Warszawskiej.

27

Page 35: Mgr

ROZDZIAŁ 4. OPRACOWANIE SYSTEMU MODELOWANIAZANIECZYSZCZEN 28

Dane te, moga byc na przykład zbierane z rózna czestotliwoscia i na-lezy dokonac odpowiednich usrednien.

3. Uruchomic model.

4. Zapisac wyniki działania modelu.

5. Dostarczyc wyniki odbiorcom, na przykład poprzez umieszczeniena stronie WWW.

Zauwazono, ze te problemy sa od siebie oddzielne, tj. mozna je rozwia-zywac niezaleznie od siebie. Program modelujacy nie powinien zalezec odtego, w jaki sposób dane sa dostarczane przez zewnetrzne organizacje. Taksamo program pobierajacy te dane nie powinien zalezec od tego, jakie wdanej chwili uruchamiane sa modele. Schemat systemu modelowania za-warty jest na rys. 4.1.

Baza danych jako jedyne zródło danych w systemie

By oddzielic problem pobierania danych od problemu dokonywania mode-lowania nalezy załozyc, ze w systemie jest jeden punkt gromadzenia i prze-twarzania danych gromadzonych w czasie rzeczywistym, który je sprowa-dza do jednolitej formy, a nastepnie udostepnia innym czesciom systemu.Naturalnym rozwiazaniem jest wiec wprowadzenie bazy danych, która be-dzie pełnic te funkcje.

Wymagania co do bazy danych

Baza danych powinna uwzgledniac nastepujace charakterystyki zródeł da-nych z którymi musi byc integrowana:

1. Kazde zródło† danych dostarcza rózny zestaw parametrów.

2. Dane zbierane sa z rózna czestotliwoscia.

3. Zródła danych moga w trakcie swojej pracy zmieniac zestaw parame-trów, który dostarczaja.

4. W trakcie pracy systemu do systemu moga byc dodawane nowe zródładanych. Wprowadzenie nowych zródeł danych nie powinno pociagacza soba zmiany schematu‡bazy danych.

†Uzywam terminu zródło danych poniewaz dane pobieramy nie tylko ze stacji pomiaro-wych, ale zródłem danych sa dla nas wyniki modelowania z ICM.‡Termin informatyczny wyjasnienie w dodatku E.

Page 36: Mgr

ROZDZIAŁ 4. OPRACOWANIE SYSTEMU MODELOWANIAZANIECZYSZCZEN 29

5. Nalezy umozliwic reczna weryfikacje danych†, przy jednoczesnym za-chowaniu danych zebranych pierwotnie‡.

6. Baza danych powinna miec mozliwosc pracy w trybie rozproszonym,tj. powinna istniec mozliwosc przenoszenia danych miedzy oddziel-nymi serwerami bazodanowymi.

7. Oprogramowanie zarzadzajace baza danych powinno umozliwiac do-step do bazy danych z jak najwiekszej liczby jezyków programowania.

Składniki systemu

System ten powinien składac sie z nastepujacych składników:

1. Kod bazy danych. Udostepniajacy takie operacje jak usrednianie inormalizacja danych.

2. Biblioteki dostepu do bazy danych stworzone w odpowiednichjezykach. Powinny one umozliwiac nie tylko dostep do bazy danychza pomoca SQL††, ale tez zawierac wspólna logike‡‡, dostepu do bazydanych.

3. Framework∗, importu danych oddziela wspólne operacje, któremusza wykonywac wszystkie importery danych pracujace w trybieciagłym∗∗ oraz na udostepnia wspólne komendy uruchamiania im-portu.

4. Importery oddzielne podprogramy realizujace import z jakiegos zró-dła.

5. Modele równiez udostepniajace mechanizm jednolitego ich urucha-miania.

6. Oprogramowanie WWW udostepniajace wyniki odpowiednich mo-deli.

†Pomiar zanieczyszczen powietrza sprawia trudnosci eksperymentalne, wiec zdarzaja siew nim błedy.‡Ten wymóg nie jest bezwzgledny, jednak według Autora, jakosc naukowa i wiarygodnosc

prac zyska, jesli bedzie mozna powiedziec, ile danych było recznie zmienianych i w jakimzakresie dokonano zmian.††Termin informatyczny wyjasnienie w dodatku E.‡‡Termin informatyczny wyjasnienie w dodatku E.∗Termin informatyczny wyjasnienie w dodatku E.∗∗Takie jak zapis do bazy danych stanu importu.

Page 37: Mgr

ROZDZIAŁ 4. OPRACOWANIE SYSTEMU MODELOWANIAZANIECZYSZCZEN 30

Rysunek 4.1: Schemat systemu modelowania zanieczyszczen

Bib

liote

kad

ost

ęp

u

Baza

dan

ych

«tc

p/ip

»

Mod

elo

wanie

Imp

ort

dan

ych

Bib

liote

ka im

port

u

Wty

czka

im

port

u I

Wty

czka

im

port

u II

«im

port

»

«im

port

»

dan

e

pom

iaro

we/m

od

elo

we

dan

e o

sta

nie

imp

ort

u

Zew

nętr

zny s

yst

em

Zew

nętr

zny s

yst

em

Dane

Dane

Baza

dan

ych

Mod

el I

Mod

el II

dan

e

pom

iaro

we/m

od

elo

we

dan

e

pom

iaro

we/m

od

elo

we

wyn

iki m

od

eow

an

ia

wyn

iki m

od

eow

an

ia

Ap

likacj

a W

WW

Serw

er

WW

W

Op

era

tor

Uży

tkow

nik

Serw

er

em

ail

dan

e

pom

iaro

we/m

od

elo

we

Zm

ian

y w

pro

wad

zan

ep

rzez

op

era

tora

Ale

rty e

-mail

Wyn

iki m

od

elo

waia

Wyn

iki m

od

elo

waia

Pop

raw

ian

ie d

an

ych

Op

era

tor

Uru

cham

ian

ie im

port

u

Auto

maty

czn

e

uru

cham

ian

ie im

port

u

Uru

cham

ian

ie im

port

u

Sch

em

at

bazy

dan

ych

Page 38: Mgr

ROZDZIAŁ 4. OPRACOWANIE SYSTEMU MODELOWANIAZANIECZYSZCZEN 31

Rysunek 4.2: Przepływ danych w systemie

Import danych

SQL

import danych

Gotowe dane

Dane surowe

przetwarzanie

Modelowanie

Model 2Model 1

SQL

Dane dla modelu

SQL

Wyniki modelu

SQL

Dane dla modelu

Wyniki modelowania

SQLWyniki modelu

Dane poprawione

Operator

GUI

Weryfikacja danych

przetwarzanie

Baza danych

Modelowanie

Dostarczanie danych

Strona WWW

Emaile o poziomachalarmowych

Sprawdzanie jakościmodelowania

SQL

Wyniki

SQL

Dane pomiarowe

GUI

Weryfikacja modeli

Page 39: Mgr

ROZDZIAŁ 4. OPRACOWANIE SYSTEMU MODELOWANIAZANIECZYSZCZEN 32

Rysunek 4.3: Zaleznosci programistyczne w systemie

Schemat bazy danych

Baza danych

Biblioteka dostępudo bazy danych

«tcp/ip»

Framework importu

«includes»

Importer I Importer II

«includes» «includes»

Framework modelowania

«includes»

Model I Model II

«includes» «includes»

Oprogramowanie aplikacji WWW

«includes»

Page 40: Mgr

ROZDZIAŁ 4. OPRACOWANIE SYSTEMU MODELOWANIAZANIECZYSZCZEN 33

Rysunek 4.4: Jezyki w jakich wykonano poszczególne komponenty sys-temu. Na szaro czesci nie zaimplementowane.

Baza

danych

Java

JPA

Dost

ęp d

o b

azy

danych

Matl

ab Api dost

ępu d

o

bib

liote

k JA

VA

API ja

va d

la M

ATLA

BA

Modele

Pyth

on

SQ

L A

lchem

y

Opro

gra

mow

anie

st

rony W

WW

Serw

er

WW

W

dost

ęp d

o

bazy

danych

dost

ęp d

o

bazy

danych

Inte

gra

cja ś

rodow

iska

MATLA

B

z ję

zyki

em

JAVA

Page 41: Mgr

ROZDZIAŁ 4. OPRACOWANIE SYSTEMU MODELOWANIAZANIECZYSZCZEN 34

4.2 Baza danych

Biezacy rozdział jest opisem uruchomionego w ramach pracy systemu ba-zodanowego. W ostatniej czesci podane zostana prace, które według au-tora, powinny zostac jeszcze wykonane.

Podjete decyzje projektowe

Najwazniejsza decyzja jest próba jak najwiekszej normalizacji†, schematubazy danych i rezygnowanie z normalizacji tylko z przyczyn wydajnoscio-wych. Utrzymanie spójnosci danych jest w tego typu systemach zawszebardzo trudne do osiagniecia — dane te, bowiem zmieniaja sie w czasie(na przykład podczas weryfikacji danych pomiarowych przez operatora),wiec pozadanym jest minimalizacja pracy zwiazanej z utrzymaniem ichspójnosci.

Z przyczyn wydajnosciowych zdecydowano sie na przechowywanie wbazie danych równiez:

• Usrednionych wyników pomiarów

• Znormalizowanych wyników pomiarów

Podstawowe metadane

Podstawowe metadane‡ opisujace punkty pomiarowe to:

• Rodzaje parametrów pogodowych

• Zródła danych

• Inne dane słownikowe

Dane te opisane za pomoca trzech tabel: POINT_TYPE, DATA_SOURCEoraz DICTIONARY.

Schemat tych tabel na rys. 4.5.

†Termin informatyczny wyjasnienie w dodatku E.‡Termin informatyczny wyjasnienie w dodatku E.

Rysunek 4.5: Tabele opisujace dane słownikowe

TABLE: DICTIONARYID: MEDIUMINTTYPE: VARCHAR(20)NAME: VARCHAR(200)

TABLE: DATA_SOURCEID: MEDIUMINTNAME: VARCHAR

TABLE: DATA_SOURCEID: MEDIUMINTNAME: VARCHAR

TABLE: POINT_TYPEID: MEDIUMINTNAME: VARCHAR

Page 42: Mgr

ROZDZIAŁ 4. OPRACOWANIE SYSTEMU MODELOWANIAZANIECZYSZCZEN 35

Zapewnienie przenosnosci zebranych punktów miedzy bazamidanych

By umozliwic przenoszenie punktów danych pomiarowych, pomiedzy róz-nymi bazami danych nalezy: zapewnic by wiersze w tabelach opisujacychmetadane miały takie same klucze główne† w kazdej bazie danych, jeslitylko opisuja ta sama metadana. Mówiac prosciej: jesli w bazie danychA wiersz w tabeli POINT_TYPE, który reprezentuje parametr PM10, maklucz główny równy 4, to w kazdej innej bazie danych wiersz reprezentu-jacy PM10, równiez musi miec klucz główny o wartosci 4.

Dla tabeli POINT_TYPE wartosci klucza głównego jest zapisana w sa-mym kodzie biblioteki dostepu do bazy danych (zatem, by dodac nowy ro-dzaj punktu danych trzeba wprowadzac zmiane w kod biblioteki‡).

Dla pozostałych tabel, w których dane beda dodawane zdecydowanieczesciej, do tworzenia klucza głównego uzywa sie funkcji skrótu††. Dla ta-beli DATA_SOURCE wartosc klucza głównego równa jest skrótowi MD5‡‡

z nazwy danego zródła danych, na której wykonano operacje modulo takby skrócona wartosc miesciła sie w odpowiedniej kolumnie. Podobnie dlatabeli DICTIONARY, dla której wartosc klucza głównego jest równa skró-towi MD5 ciagu znaków w formacie <<TYPE>>:<<NAME>>, gdzie TYPE iNAME to wartosci odpowiednich kolumn w danym wierszu.

Przechowywanie zebranych danych

Zebrane dane przechowywane sa w tabeli DATA_POINT (schemat tabelina rysunku 4.6). Kluczami głównymi w tej tabeli sa kolumny:

DATE przechowuje ona czas, dla jakiego obowiazuje dana wartosc∗

POINT_TYPE klucz wiersza w tabeli POINT_TYPE, który odpowiada ty-powi punktu, dla którego zebrano dany pomiar

DATA_SOURCE klucz wiersza w w tabeli DATA_SOURCE, który odpowiadazródłu danych, z którego pochodzi dany pomiar

W kolumnie VALUE przechowuje sie wartosc danego pomiaru.

†Termin informatyczny wyjasnienie w dodatku E.‡Jest to wada tego rozwiazania. Jednak nie jest to wada bardzo grozna. Wydaje sie, ze

rodzaje parametrów pogodowe beda wprowadzane do systemu dosc rzadko.††Funkcja skrótu — wyjasnienie terminu w E‡‡Rodzaj funkcji skrótu. Jest to jedna z najpowszechniej uzywanych funkcji skrótu ogól-

nego zastosowania∗Dla pomiarów jest to czas zebrania pomiaru, natomiast dla modelu — chwila, dla której

wykonano modelowanie.

Page 43: Mgr

ROZDZIAŁ 4. OPRACOWANIE SYSTEMU MODELOWANIAZANIECZYSZCZEN 36

Przechowywanie danych usrednionych

Dane usrednione przechowywane sa w oddzielnej tabeli dla kazdego ro-dzaju usrednienia. Oddzielnie tworzony jest widok† danych oraz tabelazawierajaca podreczna‡ kopie danych z widoku (schemat na rys. 4.7). Ta-bele z kopiami podrecznymi danych sa tworzone ze wzgledów wydajnoscio-wych.

Metadane normalizacyjne

Metadane słuzace do normalizacji danych znajduja sie w tabeli POINT_-TYPE_METADATA (schemat tabeli na rys. 4.8). Tabela ta ma nastepujacekolumny:

POINT_TYPE typ punktu opisywany przez dany wiersz.

META_DATA_TYPE czy normalizacja zachodzi dla danych surowych czy usred-nionych.

NORMALIZATION_FACTOR_A Współczynnik a prostej normalizujacej daneo równaniu vnorm = a · vorig + b.

†Termin informatyczny wyjasnienie w dodatku E.‡albo inaczej cache

Rysunek 4.6: Schemat tabeli DATA_POINT

TABLE: POINT_TYPEID: MEDIUMINTNAME: VARCHAR

TABLE: DATA_SOURCEID: MEDIUMINTNAME: VARCHAR

TABLE: DATA_POINTDATE: DATETIMEFK: POINT_TYPEFK: DATA_SOURCEVALUE: VALUE

1DATA_SOURCE

0..nPunkt danych

1POINT_TYPE

0..nRodzaj parametru

Rysunek 4.7: Tabele i widoki przechowujace dane usrednione

TABLE: DAILY_AGGREGATE_MATERIALIZEDDATE: DATEFK: POINT_TYPEFK: DATA_SOURCEVALUE: VALUE

VIEW: HOURLY_AGGREGATEDATE: DATETIMEFK: POINT_TYPEFK: DATA_SOURCEVALUE: VALUE

VIEW: DAILY_AGGREGATEDATE: DATEFK: POINT_TYPEFK: DATA_SOURCEVALUE: VALUE

TABLE: DATA_POINTDATE: DATETIMEFK: POINT_TYPEFK: DATA_SOURCEVALUE: VALUE

TABLE: HOURLY_AGGREGATE_MATERIALIZEDDATE: DATETIMEFK: POINT_TYPEFK: DATA_SOURCEVALUE: VALUE

Wylicza dane

Wylicza dane

Cache

Cache

Dane uśrednione na godzine (projekt)

Dane uśrednione na dzień

Page 44: Mgr

ROZDZIAŁ 4. OPRACOWANIE SYSTEMU MODELOWANIAZANIECZYSZCZEN 37

NORMALIZATION_FACTOR_B Współczynnik b prostej normalizacyjnej.

LOW_BOUND Najmniejsza wartosc w zbiorze danych.

HIGH_BOUND Najwieksza wartosc w zbiorze danych.

Algorytm ustalania współczynników normalizacji opisany jest w roz-dziale 4.8.

Znormalizowane dane

Znormalizowane dane przechowywane sa w sposób analogiczny do danychusrednionych (patrz 4.2). Schemat na rysunku 4.8.

4.3 Ocena stosowanego schematu bazy danych

Podany schemat bazy danych spełnia wiekszosc kryteriów opisanych wpunkcie 4.1, pozostałe kryteria moze spełniac po dokonczeniu prac nadnim†. Jednak takie podejscie do budowania baz danych powoduje pewneproblemy ( zostały one opisane ponizej ), które jednak mozna rozwiazac.

†Stworzenie takiego systemu nie było celem pracy, udało sie to niejako przy okazji.

Rysunek 4.8: Schemat tabeli POINT_TYPE_META_DATA

TABLE: POINT_TYPEID: MEDIUMINTNAME: VARCHAR

TABLE: POINT_TYPE_METADATAPOINT_TYPE: MEDIUMINTMETA_DATA_TYPE: VARCHARNORMALIZATION_FACTOR_A: DECIMALNORMALIZATION_FACTOR_B: DECIMALLOW_BOUND: DECIMALHIGH_BOUND: DECIMAL

POINT_TYPE0..n0..1

Rodzaj punktu

Pole definiuje czy normalizacja jest dla danych uśrednionych i jak uśrednionych. Możliwe wartości: * DAILY --- dane uśrednione dziennie * HOURLY --- dane uśrednione godzinowo* NORMAL --- dane nie uśrednione

META_DATA_TYPE

Rysunek 4.9: Schemat tabel przechowujacych dane znormalizowane

TABLE: DAILY_AGGREGATE_MATERIALIZED_NORMALIZEDDATE: DATEFK: POINT_TYPEFK: DATA_SOURCEVALUE: VALUE

VIEW: HOURLY_AGGREGATE_NORMALIZEDDATE: DATETIMEFK: POINT_TYPEFK: DATA_SOURCEVALUE: VALUE

VIEW: DAILY_AGGREGATE_NORMALIZEDDATE: DATEFK: POINT_TYPEFK: DATA_SOURCEVALUE: VALUE

TABLE: DATA_POINTDATE: DATETIMEFK: POINT_TYPEFK: DATA_SOURCEVALUE: VALUE

TABLE: HOURLY_AGGREGATE_MATERIALIZED_NORMALIZEDDATE: DATETIMEFK: POINT_TYPEFK: DATA_SOURCEVALUE: VALUE

Wylicza dane

Wylicza dane

Cache

Cache

Dane uśrednione na godzine (projekt)

Dane uśrednione na dzień

Page 45: Mgr

ROZDZIAŁ 4. OPRACOWANIE SYSTEMU MODELOWANIAZANIECZYSZCZEN 38

Zalety przyjetego podejscia

• Dodanie nowego zródła danych nie powoduje zmiany sche-matu. Główna zaleta metod modelowania zanieczyszczen opartychna eksploracji danych jest relatywna łatwosc wprowadzania w no-wych miejscach. Koniecznosc modyfikacji bazy danych dla kazdegozródła pomiarów czesciowo osłabiałaby zalety tego systemu.

• Jest dosc wydajny. Przy korzystaniu z kopi podrecznych usrednio-nych danych czasy wykonania zapytan sa rzedu sekund (czasy zalezaod złozonosci zapytania — zapytanie dokonujace treningu sieci na da-nych kilkuletnich z dwóch stacji pomiarowych trwa niecała minute).

• Zapytania normalizujace/usredniajace dane sa proste i dzia-łaja szybko.

Wady przyjetego podejscia

• Niezbedne indeksy zajmuja duzo miejsca. Przykładowo w baziedanych Autora dane w tabeli DATA_POINT zajmuja ok 500mb, nato-miast indeksy do niej ok 1GB. Nie jest to wielka wada. Baza danych,podana w przykładzie, ma juz rozmiar podobny do rozmiaru bazy da-nych, która bedzie uzywana produkcyjnie. Biorac pod uwage dzisiej-sze ceny dysków twardych, rozmiar bazy danych nie bedzie proble-mem.

• Zapytania pobierajace dane dla modeli sa skomplikowane.Typowe zapytania dla modelu da sie opisac w nastepujacy sposób:„Pobierz dane usrednione dziennie, zawierajace poziomy zanieczysz-czen z poprzednich trzech dni oraz dane pogodowe z danego dnia dlacałego roku 2010“. W biezacym schemacie bazy danych tłumacze-nie tego zapytania na jezyk SQL wymaga stworzenia wielu komendJOIN, które powoduja, ze zapytanie to robi sie długie i łatwo w nimpopełnic bład. By rozwiazac ten problem w bibliotece dostepu do bazydanych udostepniono metode automatyzacji tego procesu (patrz 4.4).

Potrzebne prace

• Automatyczne tworzenie/odswiezanie danych usrednionychDowdrozenia systemu do ciagłej pracy nalezy stworzyc mechanizm au-tomatycznego wykonywania usrednionych podrecznych kopi danych.

Page 46: Mgr

ROZDZIAŁ 4. OPRACOWANIE SYSTEMU MODELOWANIAZANIECZYSZCZEN 39

W tej chwili takie usrednienia wykonuje sie poprzez reczne urucho-mienie zapytania. Metoda wdrozenia tego rozwiazania zalezy od uzy-wanego DBMS (niektóre DBMS maja taka funkcjonalnosc wbudo-wana), inne wymagaja stworzenia odpowiedniego podprogramu dzia-łajacego w bazie danych.

• Przygotowanie bazy danych do przetrzymywania srednich go-dzinowych.

• Umozliwienie recznego poprawiania danych wraz z przecho-wywaniem historii zmian poszczególnych punktów.

4.4 Biblioteka dostepu do bazy danych

Biblioteka dostepu do bazy danych oparta jest o mechanizm JPA 1.0†.

Parametryzowane zapytania SQL

Bezposrednim powodem wdrozenia funkcjonalnosci parametryzowanychzapytan SQL był fakt, ze Matlab nie udostepnia takiej funkcjonalnosci(mozna tylko wykonywac kwerendy‡podane jako całosc), a w opinii Au-tora tego typu udogodnienie, jest absolutnie fundamentalne dla komfortupracy. Dodatkowe funkcjonalnosci:

konwersja parametrów zamiast klucza głównego mozna, przy odnosze-niu sie do danych z tabel opisanych w 4.2, uzywac ich nazw, którezostana zmienione na odpowiednia wartosc klucza.

domyslne wartosci parametrów parametry moga miec domyslne war-tosci.

parametry opcjonalne nie wszystkie parametry opisane w kwerendziemusza byc podane. Jesli parametr nie został podany i jest zaznaczonyjako opcjonalny, w budowanej kwerendzie nie zostana uwzglednioneelementy wykorzystujace go.

Przykład takiej kwerendy (opisanej dodatkowo w jezyku XML) znajdujesie w listingu 4.1.

†Termin informatyczny wyjasnienie w dodatku E.‡Termin informatyczny wyjasnienie w dodatku E.

Page 47: Mgr

ROZDZIAŁ 4. OPRACOWANIE SYSTEMU MODELOWANIAZANIECZYSZCZEN 40

Automatyzacja tworzenia zapytan dla kwerend modeli

Typowe zapytania dla modelu da sie opisac w nastepujacy sposób: „Pobierzdane usrednione dziennie, zawierajace poziomy zanieczyszczen z poprzed-nich trzech dni oraz dane pogodowe z danego dnia dla całego roku 2010“.W biezacym schemacie bazy danych tłumaczenie tego zapytania na jezykSQL wymaga stworzenia wielu komend JOIN, które powoduja, ze zapyta-nie to robi sie długie i łatwo w nim popełnic bład.

Wdrozono rozwiazanie pozwalajace na automatyczne tworzenie tegotypu zapytan. Pozwala ono automatycznie tworzyc zapytania wybierajacesrednie dzienne†, róznych typów parametrów z róznymi wzglednymi prze-sunieciami.

Przykład takiej kwerendy zawarto w listingu 4.2

Generowane w locie typy danych

Funkcjonalnosc ta pozwala tez pobierac parametry z wirtualnych kolumn,takich jak składowe x i y wiatru, temperatura odczuwalna.

Zapisywanie kwerend do plików XML‡

Stworzono równiez mechanizm zapisywania wszystkich wymienionych ro-dzajów kwerend do pliku XML. Pozwala to w ogóle nie umieszczac zapytanw programach dokonujacych modelowania. Pliki XML odczytywane sa zapomoca mechanizmu JAXB††. Tego typu mechanizm powoduje, iz modelew ogóle nie odnosza sie do bazy danych i mozliwa jest zmiana jej schematubez zmian w programach modelujacych.

Przykłady dwóch zapytan, uzywanych w ramach niniejszej pracy, opi-sanych w jezyku XML zawarto na listingach 4.2 i 4.1.

4.5 Framework importu danych

Framework importu danych udostepnia nastepujace funkcjonalnosci:

uruchamianie w jednolity sposób odpowiednich importerów Pozwalazarówno uruchomic wszystkie importery, jak i uruchomic pojedynczyimporter.

†Dodanie srednich godzinnych nie bedzie stanowic problemu.‡Termin informatyczny wyjasnienie w dodatku E.††Termin informatyczny wyjasnienie w dodatku E.

Page 48: Mgr

ROZDZIAŁ 4. OPRACOWANIE SYSTEMU MODELOWANIAZANIECZYSZCZEN 41

Listing kodu 4.1: Przykład prostego zapytania zapisanego w pliku XML<query name = "GET_GARANTY_DATA"><select>

SELECT dayn.DATE, dayn.pm_10 AS ‘PM10 DAY N‘, dayn1.pm_10 AS ‘PM10 DAY N-1‘, dayn2.pm_10 AS ‘PM10 DAYN-2‘, dayn.wind_x, dayn.wind_y, dayn.temp, dayn.

wilg, dayn.cisn, dayn.weekend, dayn.monthFROM GARANTY_LEARN_MATERIALIZED daynLEFT JOIN GARANTY_LEARN_MATERIALIZED dayn1 ON(DATE(

DATE_ADD(dayn.date, INTERVAL 1 DAY)) = DATE(dayn1.date) AND dayn.data_source = dayn1.data_source)

LEFT JOIN GARANTY_LEARN_MATERIALIZED dayn2 ON(DATE(DATE_ADD(dayn.date, INTERVAL 2 DAY)) = DATE(dayn2.date) AND dayn.data_source = dayn2.data_source)

</select><order-by-set>

<orderBy>dayn.date</orderBy></order-by-set><where-set>

<where>dayn.data_source = :data_source</where><where>dayn.date &gt; :date_from</where><where>dayn.date &lt; :date_to</where>

</where-set><group-by-set/><having-set/><parameters>

<parameter name="data_source" type="data-source"required="true"/>

<parameter name="date_from" type="string"required="false"/>

<parameter name="date_to" type="string"required="false"/>

</parameters></query>

Page 49: Mgr

ROZDZIAŁ 4. OPRACOWANIE SYSTEMU MODELOWANIAZANIECZYSZCZEN 42

zapis stanu importu do bazy danych Pozwala automatycznie, łatwo, za-pisywac stan importu do bazy danych tak, by przy ponownym urucho-mieniu program importujacy wiedział gdzie zakonczył import.

4.6 Framework modelowania zanieczyszczen

Framework ten napisany jest całkowicie w Matlabie i ma na celu łatweudostepnienie modelom bibliotek stworzonych w Javie, oraz stworzeniebazy kodu, na której oparte beda pozostałe modele.

We frameworku tym osiagnieto nastepujace zamierzenia:

• Ustalenie kontraktów API dla poszczególnych elementów sys-temu

• Ustalenie ogólnych algorytmów wykonywania poszczególnychkroków modelowania. Przykłady takich algorytmów sa w roz-dziale 4.8. Pewne algorytmy sa takie same dla kazdego modelu, inne

Listing kodu 4.2: Przykład prostego zapytania zapisanego w pliku XML<aggregate name="TEST_TEMP_ODCZ_2" aggregationType="

daily"normalizationType="if-possible" acceptNulls="

exclude-row-if-null"><element pointType="PM_10" dataSource="/wios/warszawa/

warszawa_komunikacyjna" intervalOffset="0"/><element pointType="PM_10" dataSource="/wios/warszawa/

warszawa_komunikacyjna" intervalOffset="1"/><element pointType="PM_10" dataSource="/wios/warszawa/

warszawa_komunikacyjna" intervalOffset="2"/>

<element pointType="TEMP_ODCZ"dataSource="/warszawa/fizyka/"/>

<selects><select>

:main_as.DATE</select><select>

WEEKDAY(:main_as.DATE) AS WEEKDAY</select><select>

WEEKOFYEAR(:main_as.DATE) AS WEEK</select>

</selects></aggregate>

Page 50: Mgr

ROZDZIAŁ 4. OPRACOWANIE SYSTEMU MODELOWANIAZANIECZYSZCZEN 43

— dla kazdej klasy modeli. Wymuszenie stosowania takich algoryt-mów powinno powodowac uzyskanie bardziej jednorodnych wyników.

• Opakowanie biblioteki napisanej w jezyku JAVA tak, by po-szczególne modele nie musiały odnosic sie do klas JAVA. Jestto potrzebne tak na prawde dla wygody. Matlab, mimo bardzo dobrejintegracji z Java, troche inaczej odnosi sie do obiektów wbudowanych,niz do obiektów Java. Autor chciał uniknac problemów przez to spo-wodowanych.

• Separacja modeli od kodu bazodanowego. Jest to pozadanacecha kazdej aplikacji tego typu — Autor ni jest bowiem w staniewykluczyc koniecznosci wprowadzenia przyszłych zmian w bazie da-nych.

Predyktor†

Jest to klasa Matlaba, która wydziela operacje i własnosci wspólne dlakazdego modelu, oraz implementuje czesc tych operacji.

Definiowane własnosci to:

nazwa nazwa predyktora

non_model_params metaparametry modelu: sa to parametry, którychnie pobieramy bezposrednio z danych. Dla perceptronu bedzie to iloscwarstw, dla sieci SVM parametry C, γ i ε.

Te operacje to:

trening Funkcja trenujaca, która pobiera zestaw danych treningowych.

predykcja Funkcja dokonujaca modelowania

optymalizacja metaparametrów Wiekszosc modeli umozliwia optyma-lizacje metaparametrów w oparciu o testowy zbiór danych.

Dodatkowo predyktor implementuje operacje treningu i walidacji, którajest dokładniej opisana w rozdziale 4.8.

Predyktor oparty o SVM

Jest to klasa Matlaba realizujaca predyktor oparty o SVM. Jej duza zaletajest mozliwosc wydajnej (a zatem czestej) optymalizacji metaparametrów,opisana w rozdziale 4.8.†Poprawniej byłoby nazwac ta klase modelem, jednak z przyczyn technicznych, zmiana

tej nazwy w kodzie MATLABA byłaby czasochłonna.

Page 51: Mgr

ROZDZIAŁ 4. OPRACOWANIE SYSTEMU MODELOWANIAZANIECZYSZCZEN 44

Klasy managerów

Sa to klasy realizujace załozenie separacji kodu Matlaba od kodu Javy.Maja one na celu umozliwiac zarzadzanie poszczególnymi, waznymi, aspek-tami modelowania.

Sa one stworzone w jezyku Java, a kazda z nich ma blizniacza klaseMatlaba, która opakowuje kod Javy

Główna klasa, która stanowi punkt dostepu do wszystkich pozostałychfunkcjonalnosci jest klasa HajmonConnector (patrz tez rys. 4.11), klasata stanowi bezposredni punkt dostepu do kwerend SQL, oraz udostepniaone pozostałe klasy managerów. Jej poszczególne mozliwosci opisane sa wnastepnych akapitach:

zarzadza kwerendami SQL Jest to klasa zarzadzajaca zapytaniami SQL,które wykonuja podprogramy modelujace. Pozwala ona na tworze-nie parametryzowanych kwerend oraz na pobieranie kwerend zapi-sanych w pliku XML. Funkcjonalnosc ta jest dokładniej opisana wrozdziale 4.6.

udostepnia klase Database Projekt ten uzywa dwóch równoległych me-tod dostepu do bazy danych — JPA (bedacego rozwiazaniem Javy)

Rysunek 4.10: Schemat klas słuzacych do modelowania danych

PredictorWłasności: name: char non_model_params: trainded_data_path: Longtrain( predict_data, reason_data)predicted_data = predict(reason_data)train_result = train_validate(...)

«instanceOf»

SVMPredictorWłasności: name: char non_model_params: trainded_data_path: LongOperacje: train( predict_data, reason_data)predicted_data = predict(reason_data)optimize_non_model_params(...)

Taki własności powinien mieć każdy predyktor Klasa implementująca część

operacji wspólną dla każdegopredyktora

Predyktor SVM

«instanceOf»

Kontrakt predyktoraWłasności: name: charnon_model_params: Operacje: train( predict_data, reason_data)predicted_data = predict(reason_data)train_result = train_validate(...)optimize_non_model_params(...)

SVMOptimizatorDokonuje optymalizacji metaparametrów sieci SVM

SVMOptimizatorExternalDokonuje optymalizacji metaparametrów sieci SVMomijając problemy wydajnościowe przy złych zestawach parametrów

Używa

«instanceOf»

Page 52: Mgr

ROZDZIAŁ 4. OPRACOWANIE SYSTEMU MODELOWANIAZANIECZYSZCZEN 45

oraz Database Toolbox (bedacego rozwiazaniem Matlaba). Klasa Da-tabase łaczy te dwa rozwiazania i pozwala by posługiwały sie jednymzestawem konfiguracji†, co ułatwia wspólne działanie. W przypadkudostepu do bazy danych za pomoca SSL klasa database dokonuje rów-niez niezbednych konfiguracji w srodowisku JRE.

Zapytania do bazy danych

Zapytania opisane w rozdziale 4.4 udostepniane sa poprzez klase Hajmon-Connector (patrz rys. 4.13). Framework matlaba udostepnia klase Data-Query która pracujac w tandemie z jedna z klas oprogramujacych zapyta-nia w Javie, ułatwia proces wykonywania zapytania. Załozenia i działaniezapytan opisane sa w rozdziale 4.4. Proces wykonywania zapytania za-warty jest na wykresie 4.14.

†Jest to mozliwe, poniewaz obie te technologie łacza sie z baza danych za pomoca JDBC— niskopoziomowa biblioteka dostepu do bazy danych w jezyku Java.

Rysunek 4.11: Klasy managerów

HajmonConnectorquery_managerpoint_type_managerdata_source_managerdatabase

HajmonEntryPointquery_managerpoint_type_managerdata_source_managerdatabase

MATLAB JAVA

Również pozostałe managery mają swoje matlabowe odowiedniki

QueryManager

Zawiera

QueryManager

QueryManagerPointTypeManager

Udostępnia Udostępnia

Udostępnia

Udostępnia

Rysunek 4.12: Manager bazy danych

Databaseurl_jdbcnazwa_użytkownikahasłosterownik_jdbc

Konfiguracja JPAPobiera dane

JREkonfiguracja dostępu

do SSL (jeśli jest potrzebna)

API dostępu do bazy danych

matlaba

Konfiguraja

Page 53: Mgr

ROZDZIAŁ 4. OPRACOWANIE SYSTEMU MODELOWANIAZANIECZYSZCZEN 46

4.7 Analiza opracowanego systemu

Opracowany system nie jest, zadna miara, gotowy do produkcyjnego wdro-zenia — powstał on w ramach pracy magisterskiej i brakuje w nim wieluniezbednych funkcjonalnosci. Jednak jest on funkcjonujacym systemem, awdrozenie tych funkcjonalnosci nie bedzie utrudnione, poniewaz pozostałaczesc systemu była pisana z mysla o ich przyszłym w wdrozeniu.

Najwieszym brakiem jest niezaprzeczalnie (opisany juz w rozdziale 4.3),brak automatycznego usredniania danych przy ich imporcie. Głównympowodem nie zaimplementowania takiej funkcjonalnosci jest fakt, ze naj-prawdopodobniej wykracza ona poza to, co da sie osiagnac posługujac siekodem SQL, zatem taka funkcjonalnosc bedzie z koniecznosci przywiazanado konkretnego DBMS, a co za tym idzie, niejako, przywiaze projekt do da-nego DBMS. Dodatkowo tego typu funkcjonalnosci sa wbudowane w naj-bardziej zaawansowane DBMS .

Duza wage przyłozono do tego by proponowany system był elastycznyzarówno pod wzgledem łatwosci wprowadzania nowych zródeł danych, czyparametrów,jak i pod wzgledem czysto informatycznym. Poniewaz rela-cje pomiedzy poszczególnymi komponentami sa jasno zdefiniowane to wy-miana czesci elementów nie powinna zaburzac całosci systemu.

Najwieksza wada proponowanego systemu jest fakt, ze zawiera on kodw trzech jezykach (a po dodaniu mozliwosci wyswietlania wyników mode-lowania na stronie WWW dojdzie czwarty jezyk)†. Wada ta jednak, w opinii

†Tymi jezykami sa: SQL, JAVA, jezyk MATLABA i (dla aplikacji WWW) Python.

Rysunek 4.13: Schemat klas udostepniajacych parametryzowane zapyta-nia SQL.

HajmonConnectorgetQueryFromSQL(String sql)getQuery(String name)

Java: QueryUstawianie parametrów: Object = getParameter(String name)setParameter(String name, Object value) Pobieranie tekstu zapytaniaString getSQL

Matlab: QueryWłasności: query: klasa implementująca zapytanie w JavieUstawianie parametrów: Object = getParameter(String name)setParameter(String name, Object value) Wykonanie zapytaniaexecuteexecute_cell_array

Tworzy

Zawiera

Page 54: Mgr

ROZDZIAŁ 4. OPRACOWANIE SYSTEMU MODELOWANIAZANIECZYSZCZEN 47

Model

stwórzzapytanie

HajmonConnector

stwórz

Kwerenda:matlabaKwerenda:Java

returnstwórz

Query lifecycle

ustawianie parametrów

Ustaw parametr

Pobierz gotowy kod SQL

Sprawdź wartość i konwertuj parametr

Wykonaj zapytanie

Wykonaj zapytanue

Pobierz gotowy kod SQL

kod SQL

Sprawdź wartość czy wszystkie parametry

podane

Database Toolbox

Ustaw preferencje bazy danych

Wykonaj zapytanie

Zwróc wyniki Zwróc wyniki

return

Rysunek 4.14: Schemat wykonywania zapytania

Page 55: Mgr

ROZDZIAŁ 4. OPRACOWANIE SYSTEMU MODELOWANIAZANIECZYSZCZEN 48

autora, była nie do unikniecia — jezyk MATLABA jest mocno nakierowanyna obliczenia numeryczne i ma on duzo ograniczen przy innych zastosowa-niach. MATLAB ponadto ma ograniczona integracje z baza danych. Byominac wady MATLABA wprowadzono biblioteke JAVA. Ponadto jako pro-gramista który pracował zarówno przy aplikacjach webowych opartych ojezyk JAVA†, jak i tymi opartymi o Pythona, stwierdzam zdecydowanieszybciej bedzie wdrozyc tego typu rozwiazania w Pythonie.

Jedna z kluczowych decyzji, jaka musi byc podjeta w dalszym rozwojusystemu, która moze rozwiazac problem nakreslony w poprzednim para-grafie, jest odejscie od MATLABA jako srodowiska modelowania. Trafnosctakiej decyzji zalezy od bardzo wielu czynników takich jak:

• Mozliwosc odejscia od MATLABA, kluczowym elementem bedzie iloscdobrze działajacych implementacji sieci neuronowych w docelowymrozwiazaniu.

• Próbie samodzielnego wdrazania predyktorów. Jesli planuje sie za-kupic predyktory to koszt integracji predyktora z pozostałymi syste-mami poniesie zapewne instytucja dostarczajaca predyktor, ona tezpodejmie decyzje o srodowisku wdrazania predyktora.

• Osoby, które beda pracowac nad tym oprogramowaniem (i ich do-swiadczenie z Matlabem).

• Warunki finansowe — Matlab jednak jest drogim oprogramowaniem.

• Warunki sprzetowe — licencje do Matlaba obowiazuja na okreslonailosc stanowisk i przy koniecznosci uruchomieniu predyktora na du-zej ilosci komputerów moze sie okazac, ze jest to finansowo nieopła-calne.

• Ilosc osób w projekcie — im bedzie ich wiecej, tym bardziej opłacasie uzywac rozwiazan otwartych (nie tylko z przyczyn finansowych).Duze zespoły moga wiecej czasu poswiecic na tworzenie własnych na-rzedzi.

• Wprowadzanie do projektu studentów (magistrantów, inzynierantów).Łatwiej wdrazac studentów w projekt, w którym nie musza oni uzy-wac bardzo drogiego, jak na standardy studenckie, oprogramowania.

Autor osobiscie przychylałby sie do podjecia decyzji o próbie wdrozenia roz-wiazania opartego na otwarte biblioteki w jezyku Python; wiem juz, ze na

†Pracowałem równiez z bardzo wieloma frameworkami WWW.

Page 56: Mgr

ROZDZIAŁ 4. OPRACOWANIE SYSTEMU MODELOWANIAZANIECZYSZCZEN 49

pewno da sie odtworzyc zawartosc niniejszej pracy w kodzie opartym o roz-wiazania Pythonowe.

4.8 Stosowane w systemie algorytmy

Algorytm normalizacji danych

Normalizacja danych przebiega w dwóch etapach. Pierwszym jest wyzna-czenie współczynników normalizacji (ta czesc pracy wykonuje skrypt Ma-tlaba), druga sama — normalizacja wartosci. Normalizacja jest wykony-wana na poziomie bazy danych, choc istnieje równiez klasa Matlaba potra-fiaca dokonywac normalizacji i denormalizacji danych pobranych z bazydanych.

Dane sa normalizowane wzgledem punktu danych i rodzaju usrednia-nia — czyli co wazne, wszystkie zródła danych normalizowane sa razem.Docelowo lepiej byłoby normalizowac dane z poszczególnych zródeł danychoddzielnie, jednak skomplikowałoby to normalizacje i denormalizacje da-nych po stronie Matlaba i z pragmatycznych wzgledów zrezygnowano ztego.

Dany jest wektor v wartosci reprezentujacych pomiary dla konkretnegoparametru i rodzaju usredniania. Chcemy z niego uzyskac zbiór wartosciv′, który jest dosc dobrze znormalizowany na odcinku (0, 1).

Do usredniania posługujemy sie funkcja liniowa:

v′i = a · vi + b (4.1)

Nalezy zatem wyznaczyc parametry a i b. By wyznaczyc te parametryposługujemy sie wzorami:

a =1

vmax − vmin(4.2)

b =−vmin

vmax − vmin(4.3)

gdzie parametry vmax i vmin to górny i dolny przedział, który normali-zujemy do przedziału (0, 1).

Najprostsza metoda normalizacji jest wziecie odpowiednio wartosci mi-nimalnej i maksymalnej, ma to jednak jedna zasadnicza wade: praktycz-nie w tej bazie danych znajdowac sie beda wartosci błedne, w tym wartoscibardzo wysokie i bardzo niskie, których uwzglednienie moze powodowac,ze normalizacja bedzie przebiegac de facto do odcinka wezszego niz (0, 1),co moze wprowadzac SSN w bład.

Page 57: Mgr

ROZDZIAŁ 4. OPRACOWANIE SYSTEMU MODELOWANIAZANIECZYSZCZEN 50

Zdecydowano sie przyjac nastepujaca metode wyznaczania vmax i vmin:

• Dzieli sie dane na zbiór danych mniejszych od sredniej i wiekszychod sredniej (v).

• Oddzielnie wyznacza sie ich odchylenia standardowe σmin i σmax

• Odpowiednie wartosci wyznacza sie ze wzorów:

vmin = v − 5σmin (4.4)

vmax = v + 5σmax (4.5)

W ten sposób zarówno wpływ pojedynczych pomiarów na wartosci v jestmały, oraz zapewnia sie, ze wiekszosc danych bedzie w przedziale (0, 1).

Algorytm treningu i walidacji sieci

Najistotniejszym warunkiem uzyskania miarodajnych wyników dokładno-sci danej SSN jest wyznaczanie dokładnosci przy uzyciu danych wejscio-wych, które nie brały udziału w procesie uczenia.

Pierwszym krokiem algorytmu jest wiec podzielenie zbioru uzyskanychdanych na dwa podzbiory: zbiór danych do uczenia i zbiór słuzacy do te-stowania. Dane testujace nalezy wybrac w sposób losowy. Przyjeto, zestosunek danych testujacych do danych uczacych wynosi 0.2. Dane uczacesłuza do uczenia sieci, która jest wykorzystana do przewidzenia danych wserii testujacej. Schemat blokowy algorytmu podano na rys. 4.15, opis wpseudokodzie dołaczono jako alg. 4.1.

Po takiej procedurze otrzymuje sie dwa ciagi danych: ciag danych prze-widzianych przez siec oraz danych zarejestrowanych przez stacje pomia-rowa pomiarowa.

Rysunek 4.15: Schemat blokowy pojedynczej iteracji trenowania i walida-cji predyktor

Page 58: Mgr

ROZDZIAŁ 4. OPRACOWANIE SYSTEMU MODELOWANIAZANIECZYSZCZEN 51

Wybór danych do testowania ma wpływ na otrzymana dokładnosc mo-delowania. W naszym przypadku wynika to z tego ze stezenia zanieczysz-czen zmieniaja sie w sposób skokowy. Zmian tych siec działajaca na danychimisyjnych nie ma szans przewidziec. Jesli do danych testujacych dostaniesie wiecej takich punktów danych, to wyznaczona dokładnosc sieci spad-nie. By zminimalizowac takie efekty cała procedure testowania i walidacjinalezy powtórzyc kilkukrotnie. Przyjeto ze, przy otrzymywaniu wyników,które trafia do niniejszej pracy† testowanie sieci bedzie powtarzac sie dwu-dziestokrotnie. Ciagi danych otrzymanych z poszczególnych prób nalezyskonkatenowac. Opis algorytmu w pseudokodzie umieszczono na alg. 4.2.

Algorytm optymalizacji sieci SVM

Dla sieci SVM metaparametrami sa parametry C, γ i ε. Ich poprawne wy-znaczenie jest kluczowe dla otrzymania miarodajnych wyników. Jedynymalgorytmem dajacym pewne wyniki wyznaczenia parametrów jest spraw-dzenie wszystkich mozliwych kombinacji parametrów[44]‡, czyli wytreno-

†W innych przypadkach bedziemy upraszczac ta procedure. Na przykład przy optyma-lizacji parametrów sieci SVM ze wzgledu na zmniejszenie czasochłonnosci obliczen zmniej-szymy ilosc powtórzen.‡Dodatkowo algorytm ten moze działac szybko na urzadzeniach wieloprocesorowych, po-

niewaz kazdy punkt mozna wyznaczac oddzielnie. W przypadku wielu innych numerycznychalgorytmów wyznaczania minimum funkcji równoległe przeprowadzanie obliczen jest trudne.

Algorytm 4.1 Pojedyncza iteracja trenowania i walidacji predyktora

1: procedure TRAINVALIDATE(macierzDanych)2: [uczace, testowe] = DZIELDANE(macierzDanych)3: [wnioskowane,wnioskujace] = WYBIERZWNIOSKUJACE(testowe)4: model = TRENUJSIEC(uczace)5: predykcja = PREDYKCJA(model, wnioskujace)6: return wnioskowane, predykcja

1: procedure TRAINVALIDATE(macierzDanych, powtorzenia, prog =1000%)

2: wyniki← ∅3: for ii← (0 : powtorzenia) do4: wnioskowane, predykcja← TRAINVALIDATE(macierzDanych)5: wynik ← FUNKCJACELU(wnioskowane, predykcja)tu6: wyniki← CONCAT(wyniki, wynik)7: if wynik > prog then8: break9: return MEAN(wynik)

Algorithm 4.2 Pełny algorytm trenowania i predykcji

Page 59: Mgr

ROZDZIAŁ 4. OPRACOWANIE SYSTEMU MODELOWANIAZANIECZYSZCZEN 52

wanie sieci dla kazdej kombinacji i wybranie tej kombinacji, która dajenajdokładniejsze wyniki modelowania.

Przeszukiwania nalezy dokonac na dosc duzym zakresie: C ∈ (2−5; 215),γ ∈ (2−15; 23), ε ∈ (10−3, 10−1)†. Proponuje sie dwie fazy przeszukiwania:

• Powierzchowna, w której wybiera sie parametry ze zbioruC ∈ {2−5, 2−3, ..., 215}, γ ∈ {2−15, 2−13, ..., 23} i ε ∈ {10−3, 10−2, 10−1}

• Dokładna, w której przeszukuje sie region w okolicy najlepszego punktuz poszukiwania zgrubnego.

Algorytm treningu dla pojedynczego zestawu parametrów zawarty jest wpunkcie 4.8.

Zasadniczym problemem w wykonaniu tego algorytmu jest to, ze dlaniektórych zestawów parametrów procedura treningu sieci trwała zbyt długo.Postanowiono wiec, opracowac metode przerywania obliczen dla takich punk-tów, bowiem, jak sie okazywało dla tych wartosci parametrów sieci okazy-wały sie niepoprawnie modelowac. Poniewaz w srodowisku Matlab nie mametody przerwania działajacego procesu zdecydowano sie posłuzyc rozwia-zaniem opisanym ponizej.

Wykonano skrypt matlaba, który wyznacza kolejne sprawdzane punktyzapisujac do pliku zarówno fakt rozpoczecia obliczen, jak i ich wynik. Skryptten uruchamiany jest przez skrypt Pythona, który co minute przerywadziałanie skryptu Matlaba i uruchamia go ponownie. Rozwiazanie to wpraktyce powoduje, ze jeden punkt liczy sie najwyzej przez minute.

Opisuje to rozwiazanie głównie dlatego, ze ma ono jedna istotna wade— wprowadza do procesu optymalizacji sieci czynnik niedeterministyczny,tj. dla tych samych danych moga za pomoca tego algorytmu zostac wytre-nowane rózne sieci.

†W [44] proponuje sie nie przeszukiwac ε. Jednak okazuje sie ze jego uwzglednieniepoprawia dokładnosc sieci.

Page 60: Mgr

Rozdział 5

Wykorzystanie siecineuronowych

Głupota wprost wewnetrznie sprzeczna, byłobymniemanie, ze czego nigdy dotad nie robiono, tegomozna inaczej niz za pomoca dotad nieznanychsposobów.

Francis Bacon „Novum Organum”

5.1 Wstepna ekstrapolacja przestrzenna

Mozliwe jest zbudowanie modelu, który bedzie w stanie podac poziom za-nieczyszczenia w jakims punkcie (na jakies stacji pomiarowej) na pod-stawie parametrów pogodowych na pobliskich stacjach i poziomów zanie-czyszczen na pobliskich stacjach. Model ten był testowany dla PM10. Bywytrenowac ten model nalezy miec niewielka ilosc pomiarów PM10 w stacjiekstrapolowanej (dane te nazwiemy danymi wskaznikowymi), wiec modelten ma główne zastosowanie do uzupełniania luk w danych. Luki takiemoga powstawac w punktach pomiarów ciagłych na skutek np. awariitechnicznej, model ten moze tez wypełniac luki w pomiarach wskazniko-wych†.

By zbadac mozliwosci tego modelu, musimy zbadac takie charaktery-styki jak:

†By uzupełniac pomiary wskaznikowe nalezy jeszcze uzyskac dostep do danych pogodo-wych zbieranych w sposób ciagły w ekstrapolowanym punkcie. Problem ten wymaga dalszychbadan — najprawdopodobniej mozliwe jest zastapienie danych pomiarowych numerycznaanaliza pogody.

53

Page 61: Mgr

ROZDZIAŁ 5. WYKORZYSTANIE SIECI NEURONOWYCH 54

• Czy wdrozenie tego modelu wprowadza dodatkowe dane do zbiorudanych wskaznikowych — tj. czy uzupełnienie danych wskazniko-wych wynikami modelowania polepsza jakosc estymacji takich para-metrów srednie roczne, czy ilosc przekroczen w roku.

• Jaka jest maksymalna odległosc miedzy stacjami wspierajacymi eks-trapolacje i stacja ekstrapolowana.

• Jaka jest minimalna ilosc danych o poziomie zanieczyszczenia powie-trza na stacji ekstrapolowanej, która model potrzebuje do poprawnejpracy.

• Czy mozna przeprowadzac ekstrapolacje miedzy stacjami róznych ty-pów (na przykład ekstrapolowac poziomy na stacji tła regionalnegona podstawie stacji tła miejskiego).

By zbadac te informacje stworzono modele ekstrapolujace opisane na ta-beli 5.1.

Schemat sieci ekstrapolujacych

Sieci ekstrapolujace otrzymuja nastepujace dane wejsciowe:

• Poziom PM10 na stacjach wspierajacych ekstrapolacje.

• Temperature na wszystkich stacjach na biezacy dzien oraz wilgotnoscna dzien biezacy oraz poprzedni.

• Opady na stacji ekstrapolowanej na dzien biezacy oraz poprzedni†.

Schemat modelu na rys 5.1.

Badane własnosci modeli ekstrapolujacych

By odpowiedziec na pytania okreslone w powyzszym paragrafie spraw-dzimy modele według nastepujacego schematu:

1. Do testów ekstrapolacji wybierzemy stacje, które zbieraja dane w try-bie ciagłym.

2. Z pełnego zbioru danych stacji ekstrapolowanej bedziemy losowac pe-wien odsetek danych, które beda uzywane do treningu modelu. Pozo-stałe dane uzyte beda do weryfikacji.

†Wybrano takie, a nie inne parametry pogodowe tylko w celu ujednolicenia zbioru para-metrów, na których operuja rózne modele

Page 62: Mgr

ROZDZIAŁ 5. WYKORZYSTANIE SIECI NEURONOWYCH 55

3. Cała procedure testowania powtarzac bedziemy 80 razy dla róznych,wylosowanych zestawów danych treningowych (by otrzymane wynikireprezentowały sredni MAPE modeli wytrenowanych dla danego współ-czynnika wypełnienia).

Zanim wskazemy jakie rodzaje danych sprawdzimy wprowadzimy definicjeposzczególnych serii danych.

pełny zbiór danych fi cały zbiór danych z ekstrapolowanej stacji

dane wskaznikowe wi dane uzyte do treningu modeli. Uzywam tej na-zwy mimo, ze jest to merytorycznie watpliwe — dlatego, iz model tenbedzie mógł słuzyc do uzupełniania luk w danych wskaznikowych.

dane sprawdzajace si seria danych z dni, dla których mamy pomiar wpełnych danych, a które nie zostały wybrane jako dane wskaznikowe.

dane modelowane mi seria danych, w której zawieraja sie modelowanewyniki z dni znajdujacych sie w pełnym zbiorze danych a nie znajdujasie w danych wskaznikowych.

dane ekstrapolowane ei seria danych składajaca sie z danych wskazni-kowych, w których luki uzupełniono wynikami modelowana.

współczynnik wypełnienia Ff ilosc danych wybranych jako dane wskaz-nikowe w stosunku do pełnego zbioru danych Ff = wi

fi.

Model ekstrapolujący

Poziomy PM_10na stacjachwspomagającychinterpolację dla dnia N

Temperatura dla dnia N, wilgotnośćdla dni N, N-1, dla wszystkich stacji

Opady dla dni N, N-1 dla stacji ekstrapolowanej

Poziom PM_10 na dzień N dla stacjiekstrapolowanej

Rysunek 5.1: Schemat modelu ekstrapolujacego

Page 63: Mgr

ROZDZIAŁ 5. WYKORZYSTANIE SIECI NEURONOWYCH 56

Testowane własnosci sieci:

MAPE miedzy danymi sprawdzajacymi a modelowanymi

korelacja miedzy danymi sprawdzajacymi a modelowanymi

wzgledna róznica w srednim poziomie zanieczyszczen miedzy danymiekstrapolowanymi a danymi wskaznikowymi. Jesli oznaczymy przezxi srednia zbioru danych to bedzie to: ∆wsk = wi

fi, ∆extra = ei

fi. Je-

sli parametr ten dla ekstrapolowanego zbioru danych bedzie lepszyniz dla zbioru wskaznikowego — oznacza to, ze model ekstrapolujacywprowadza dodatkowe dane do zbioru danych wskaznikowego i danete polepszaja dokładnosc wyznaczenia sredniego poziomu.

wzgledna róznica miedzy iloscia przekroczen miedzy danymi ekstra-polowanymi danymi wskaznikowymi. Jesli przez p(xi) ilosc przekro-czen w serii danych xi to ∆wsk = 1

Ff

p(wi)p(fi)

, ∆extra = p(ei)p(fi)

. Ilosc prze-kroczen w zbiorze wskaznikowym wyznaczamy zakładajac, ze danewskaznikowe sa reprezentatywne dla całego zbioru danych i otrzy-mamy rozsadna estymacje. Jesli w zbiorze zawierajacym 20% danychjest 5 przekroczen, to w pełnym zbiorze mozemy oczekiwac 25.

Wszystkie te parametry zbieramy w funkcji współczynnika wypełnienia.Zbadane modele opisano w tablicy 5.1, mapke sytuacyjna przedstawia-

jaca połozenie stacji zamieszczono na rys. 5.2.

Analiza wyników

Wyniki analizowanych modeli zamieszczono w tabeli 5.1 oraz na rys. 5.3— 5.6.

Widac spadek dokładnosci ekstrapolacji wraz ze wzrostem odległoscistacji ekstrapolowanej od stacji wspierajacych — nie jest to jednak prostazaleznosc. Moga nad nia dominowac inne czynniki. Dokładnosc modeluRadom II, który pracuje na danych z Płocka i Ursynowa jest lepsza od mo-delu Radom, który opiera sie na warszawskich stacjach. Srednia odległoscod stacji wspierajacych jest nizsza dla modelu Radom, jednak zdaje sie, izwazniejszym czynnikiem jest to, ze stacja w Płocku moze byc nieczuła napewne zdarzenia wpływajace na emisje charakterystyczne dla Warszawytakie jak korki czy roboty budowlane.

Dla wszystkich stacji (nawet dla Belska) właczenie danych ekstrapolo-wanych w zbiór danych wskaznikowych podniosło dokładnosc wyznaczaniatakich parametrów jak sredni poziom pyłu zawieszonego, czy srednia iloscprzekroczen. Interpretujemy to jako potwierdzenie załozenia o tym, ze

Page 64: Mgr

ROZDZIAŁ 5. WYKORZYSTANIE SIECI NEURONOWYCH 57

Eks

trap

olow

ana

Typ

ekst

rapo

low

anej

Stac

jeO

dleg

łosc

MA

PE

wyz

nacz

ania

stac

jast

acji

wsp

iera

jace

mie

dzy

stac

jam

isr

edni

chdz

ienn

ych

20%

wyp

ełni

enia

80%

wyp

ełni

enia

1K

omun

ikac

yjna

kom

unik

acyj

naU

rsyn

ów,P

łock

7;10

020

%18

%2

Kom

unik

acyj

naII

kom

unik

acyj

naU

rsyn

ów,T

argó

wek

7;7

13%

12%

3R

adom

tła

mie

jski

ego

Urs

ynów

,Tar

gów

ek80

;101

18%

17%

4R

adom

IItł

am

iejs

kieg

oU

rsyn

ów,P

łock

80;1

6327

%23

%5

Urs

ynów

tła

mie

jski

ego

Targ

ówek

,Kom

unik

acyj

na15

;712

%11

%6

Urs

ynów

IItł

am

iejs

kieg

oTa

rgów

ek,P

łock

7;10

013

%13

%7

Bel

sktł

are

gion

alne

goTa

rgów

ek,P

łock

54;1

1045

%–

8B

elsk

IItł

are

gion

alne

goTa

rgów

ek,U

rsyn

ów54

;42

42%

44%

9P

łock

tła

mie

jski

ego

––

––

(a)P

odst

awow

eda

neo

mod

elac

hek

stra

polu

jacy

ch

Eks

trap

olow

ana

Typ

ekst

rapo

low

anej

Sred

nibł

adw

yzna

czen

iaSr

edni

bład

wyz

nacz

enia

stac

jast

acji

sred

nieg

opo

ziom

uP

M10

ilosc

iprz

ekro

czen

ekst

rapo

lacj

aw

skaz

niko

we

ekst

rapo

lacj

aw

skaz

niko

we

1K

omun

ikac

yjna

kom

unik

acyj

na2%

3.1%

6%8%

2K

omun

ikac

yjna

IIko

mun

ikac

yjna

1.5%

3%5%

8%3

Rad

omtł

am

iejs

kieg

o4.

3%4.

3%11

%15

%4

Rad

omII

tła

mie

jski

ego

2.1%

3.9%

9%12

%5

Urs

ynów

tła

mie

jski

ego

1.2%

3.6%

8%14

%6

Urs

ynów

IItł

am

iejs

kieg

o1.

9%4.

3%5%

13%

7B

elsk

tła

regi

onal

nego

2.5%

3.1%

12%

17%

8B

elsk

IItł

are

gion

alne

go1.

9%1.

9%11

%15

%(b

)Por

ówna

nie

dokł

adno

sciw

yzna

czan

iapa

ram

etró

wse

riid

anyc

hz

uzyc

iem

ekst

rapo

lacj

iiz

uzyc

iem

sam

ych

tylk

oda

nych

wsk

az-

niko

wyc

h,dl

aw

spół

czyn

nika

wyp

ełni

enia

20%

.

Tabl

ica

5.1:

Stw

orzo

nem

odel

edo

konu

jace

ekst

rapo

lacj

i

Page 65: Mgr

ROZDZIAŁ 5. WYKORZYSTANIE SIECI NEURONOWYCH 58

Warszawa Targówek

Warszawa Komunikacyjna /

Warszawa UrsynówŻyrardów

Belsko

Radom

Płock

Wydział Fizyki

Rysunek 5.2: Połozenie stacji bioracych udział w ekstrapolacji

Page 66: Mgr

ROZDZIAŁ 5. WYKORZYSTANIE SIECI NEURONOWYCH 59

model ekstrapolujacy wprowadza do zbioru danych wskaznikowych noweinformacje.

Wywnioskowanie ilosci przekroczen z danych ekstrapolowanych jesttrudne, mozliwe, ze trudnosc ta wynikała z tego, ze model ten modelo-wał srednie dzienne, z których w nastepnej kolejnosci wyznaczano faktprzekroczenia. Model, który modeluje fakt przekroczenia bezposrednio po-winien działac zdecydowanie lepiej.

Stacja w Belsku nie dostarczała danych meteorologicznych — co bardzoutrudniało ekstrapolacje.

Mozemy tez pokusic sie o stwierdzenie, ze dla długich zbiorów danychpróg ilosci danych treningowych, dla którego model zaczyna działac dobrzeto około 120 dni, natomiast ponizej 50 dni model ten nie daje sensownychwyników.

Model ten jest jeszcze na bardzo wczesnym etapie badan, jednak wydajesie, iz moze on byc z powodzeniem uzywany do uzupełniania luk w pomia-rach dla pomiarów stałych. Uzywanie go do uzupełniania luk w pomiarachwskaznikowych wymaga dodatkowych badan, w szczególnosci nalezałobystworzyc procedure wprowadzania takiego modelu do nowej stacji pomia-rowej, na której rozpoczeto dopiero pomiary wskaznikowe — tj. nalezałobyzbadac w jaki sposób nalezy prowadzic pomiary by maksymalnie szybkozgromadzic dostateczny materiał uczacy.

Rysunek 5.3: Sredni bład wyznaczania srednich dziennych dla wybranychmodeli ekstrapolujacych (dane pomiarowe z lat 2009 – 2010).

Page 67: Mgr

ROZDZIAŁ 5. WYKORZYSTANIE SIECI NEURONOWYCH 60

Rysunek 5.4: Porównanie dokładnosci wyznaczenia sredniej z całegookresu przy uzyciu modeli ekstrapolujacych i przy uzyciu samych tylkodanych wskaznikowych dla dwóch wybranych modeli (dane pomiarowe zlat 2009 – 2010).

Rysunek 5.5: Porównanie błedu w wyznaczeniu ilosci przekroczen z uzy-ciem modeli ekstrapolujacych i samych tylko danych wskaznikowych. Mo-dele pracowały na danych z lat 2009 – 2010.

Page 68: Mgr

ROZDZIAŁ 5. WYKORZYSTANIE SIECI NEURONOWYCH 61

(a) Kwiecien 2010 (b) Maj 2010

(c) Czerwiec 2010 (d) Lipiec 2010

Rysunek 5.6: Porównanie zmierzonych i modelowanych poziomówPM10 dla modelu Ursynów dwa dla czterech kolejnych miesiecy (miesiacete zostały wybrane ze wzgledu na podobny do całego zbioru danych MAPE)

Page 69: Mgr

Rozdział 6

Podsumowanie

Pył zawieszony jest jednym z najgrozniejszych zanieczyszczen powietrza,nie z powodu jego toksycznosci, lecz z powodu jego powszechnosci (poziomyPM sa przekraczane w wielu bardzo miejscowosciach).

Modele sa jednym z niezbednych narzedzi do efektywnego zarzadza-nia poziomami zanieczyszczen powietrza. Modele moga wspierac zarównodługo, jak i krótkoterminowe działania zapobiegajace przekroczeniom od-powiednich poziomów zanieczyszczen oraz wspierac proces pomiarów tychpoziomów. Ze wzgledu na rozproszona nature emisji pyłu zawieszonego(wiekszosc czesc emisji tego zanieczyszczenia pochodzi z transportu orazogrzewania domów) zanieczyszczenie to sprawia duze problemy modelomemisyjnym. Praca ta koncentrowała sie na modelach modelujacych po-ziomy PM opartych na metody eksploracji danych.

6.1 Zawartosc pracy

W pracy zbadano jeden nowy typ modelu emisyjnego — model dokonu-jacy ekstrapolacji przestrzennej poziomów zanieczyszczen. Model ten mozemiec praktyczne zastosowanie do uzupełniania luk w pomiarach pyłu za-wieszonego.

W pracy opracowano podstawy koncepcyjne systemu dedykowanego jakosrodowisko, w którym uruchamiane beda modele eksplorujace dane. Sys-tem przeznaczony jest do pracy on line. W prazy zaimplementowano duzaczesc proponowanego systemu.

Praca zawiera równiez obszerna czesc teoretyczna, w której opisane saSztuczne Sieci Neuronowe (element dokonujacy modelowania) oraz dys-kretna transformata falkowa — słuzaca do wstepnego przetwarzania da-nych dla SSN.

62

Page 70: Mgr

ROZDZIAŁ 6. PODSUMOWANIE 63

6.2 Wnioski

Modele oparte na eksploracje danych sa bardzo cennym narzedziem, którejest w stanie kompleksowo wspierac pomiar i zarzadzanie poziomami pyłuzawieszonego (oraz innych zanieczyszczen).

Zaproponowany system wymaga jeszcze wiele prac programistycznych— jednak wykorzystanie go w niniejszej pracy do stworzenia wielu modeliDMM, wykazało jego przydatnosc. Posiadanie takiego systemu powoduje:

• Znaczne zmniejszenie ilosci pracy wykonywanej przez człowieka wprzygotowywaniu serii danych uczacych model.

• Znaczne zmniejszenie ryzyka błedów wprowadzanych przez człowiekaw tym procesie.

• Umozliwienie pracy w całkowicie automatycznym trybie.

• Znaczne przyspieszenie procesu wdrazania nowych modeli opartycho eksploracje danych.

Page 71: Mgr

Dodatek A

Słownik pojec

BAM (z ang. beta attenuation monitor) mierniki mierzace poziom PMdokonujace pomiaru masy osadzonej na filtrze za pomoca pomiaru,jak ów filtr osłabia promieniowanie β. Patrz tez 3.3.

cecha Patrz sekcja B.3.

CTM (z ang. Chemical Transport Model) Sa to metody oparte na ana-litycznych modelach propagacji zanieczyszczen oraz ich chemicznychprzemian. Danymi wejsciowymi do modeli tego typu sa szacunki emi-sji badanych zanieczyszczen, topografia terenu, przewidywania para-metrów pogodowych na kolejne dni. Kluczowa dla dokładnosci tychmodeli jest baza danych emisyjnych, której uzyskanie jest trudne idosc kosztowne.

FDMS (z ang. Filter Dynamic Measurement System) system pomiaru wy-korzystujacy miernik TEOM, który jednak jest równowazny pomia-rom referencyjnym.

funkcja celu Funkcja celu† jest miara tego jak dokładnie siec odwzoro-wuje badany proces. Wyjasnienie patrz strona 75.

instancja Instancja‡ danych wejsciowych to jeden punkt danych. Iloscpojedynczych danych zawartych w instancji to jej wymiar. W przy-padku predyktora przewidujacego dzienne srednie zanieczyszczenieinstancja danych beda dzienne srednie parametry pogodowe dla da-nego dnia oraz poziomy zanieczyszczen z dni poprzednich. Terminten wprowadzam, by jasno oddzielic terminy na pojedynczy punktdanych uczacych (instancje własnie) oraz cały zbiór danych uczacych.

†Inaczej mówi sie równiez: funkcja wydajnosci/efektywnosci sieci.‡Termin ten zaczerpnałem z pismiennictwa angielskiego z tej dziedziny, nie znalazłem

odpowiednika polskiego.

64

Page 72: Mgr

DODATEK A. SŁOWNIK POJEC 65

LRTAP (z ang. Long Range Transbounary Air Pollution) miedzynaro-dowy traktat kontrolujacy pewne kwestie zwiazane z ochrona srodo-wiska w Europie. Dokładniejszy opis patrz 2.1.

MAE (z ang. mean absolute error) funkcja celu dla sieci neuronowych.Wzór patrz strona 75.

MAPE (z ang. mean absolute percentage error) funkcja celu dla sieci neu-ronowych. Wzór patrz strona 75.

metaparametr modelu Metaparametr modelu jest to parametr, którynie jest ustalany w procesie treningu — a przed nim. Nie zalezyon zatem od konkretnych danych treningowych i jest wspólny dlacałej klasy modeli, majacych ta sama strukture i pracujacych na po-dobnych zestawach danych. W SSN metaparametry okreslac bedastrukture sieci i np. rodzaj funkcji aktywacji.

MLP (z ang. Multilayer perceptron) Perceptron wielowarstwowy. RodzajSSN.

model Model oparty na technikach eksploracji danych to narzedzie, któremajac pewien korpus danych historycznych jest w stanie odtwarzacdane nalezace do tej samej klasy, do której naleza dane z korpusuhistorycznego, których to jednak w owym korpusie nie ma.

parametr modelu Jest to parametr

parametr kompozytowy (pogodowy) parametr pogody, który mozna wy-liczyc z innych parametrów pogodowych. Przykładowo moze byc topunkt rosy, czy temperatura odczuwalna.

PCA (z ang. principial component analysis) metoda obnizania ilosci wy-miarów instancji danych z minimalna utrata informacji.

PM (z ang. particulate matter) pył zawieszony to okreslenie drobin ciałastałego, które sa zawieszone w powietrzu (ze wzgledu na rozmiar pro-ces ich grawitacyjnego osiadania jest albo bardzo powolny, albo wrecznie jest głównym kanałem ich usuwania ze srodowiska).

poziom stezenie danego zanieczyszczenia w powietrzu

punkt rosy (dokładniej temperatura punktu rosy) taka temperatura, dlaktórej przy danym składzie mieszaniny gazów i ustalonym cisnieniumoze rozpoczac skraplanie sie jednego z jej składników. U nas przezten termin bedziemy rozumiec punkt rosy pary wodnej w powietrzu

Page 73: Mgr

DODATEK A. SŁOWNIK POJEC 66

— czyli temperature przy jakiej para wodna zawarta w powietrzumogłaby sie skroplic. Przyblizony wzór pozwalajacy wyznaczyc tem-perature punktu rosy to[?]:

Td =8

√H

100· [112 + (0, 9 · T )] + (0, 1 · T )− 112 (A.1)

gdzie Td to temperatura punktu rosy (◦C), H to wilgotnosc wzgledna(%) a T to temperatura (◦C).

predyktor Model słuzacy do krótkoterminowej prognozy jakiegos feno-menu.

SSN Sztuczna siec neuronowa

srednica aerodynamiczna czastki Srednica kuli o gestosci 1 gcm3 o ta-

kiej samej, jak czastka badana, predkosci opadania w nieruchomympowietrzu, w wyniku działania sił grawitacji, w identycznych warun-kach temperatury, cisnienia i wilgotnosci wzglednej[23].

srednica dyfuzyjna czastki Srednica kuli o gestosci 1 gcm3 o takim sa-

mym, jak czastka badana, współczynniku dyfuzji w identycznych wa-runkach temperatury, cisnienia i wilgotnosci wzglednej[23]

temperatura odczuwalna Temperatura odczuwalna odwzorowuje odczu-cie temperatury w danych warunkach otoczenia, jednak nie jest tocałkowicie antropomorficzny parametr — bowiem badania nad nimwzieły sie z badania predkosci zamarzania wody w danych warun-kach na arktyce (predkosc ta zalezała od temperatury otoczenia ipredkosci wiatru). Istnieje kilka wzorów pozwalajacych przyblizycta wielkosc, jednak zaden z nich nie daje dobrych wyników na całymspektrum temperatur.

TEOM (z ang. tapered element oscillating microbalance) metoda pomiarupoziomu PM

trening Operacja, w której model oparty o eksploracje danych „uczy sie“historii pomiarów. Dla SSN bedzie to operacja ustalenia wagwipredyktor

WIOS Wojewódzki Inspektorat Ochrony Srodowiska

Page 74: Mgr

DODATEK A. SŁOWNIK POJEC 67

Pojecia uzywane w rozumieniu dyrektywy 2008/50/WE[14]

wartosc dopuszczalna “Oznacza poziom substancji w powietrzu usta-lany (...) w celu zapobiegania lub ograniczenia szkodliwego wpływuna zdrowie ludzkie lub srodowisko, (...) który powinien byc osiagnietyw okreslonym terminie i po tym terminie nie powinien byc przekra-czany”

poziom krytyczny “Oznacza poziom substancji w powietrzu (...) po prze-kroczeniu, którego moga wystapic bezposrednie niepozadane skutkiw odniesieniu do niektórych receptorów, takich jak drzewa, inne ro-sliny lub ekosystemy naturalne, jednak nie w odniesieniu do czło-wieka†”

próg informowania “oznacza poziom substancji w powietrzu, powyzejktórego istnieje zagrozenie dla zdrowia ludzkiego wynikajace z krót-kotrwałego narazenia na działanie zanieczyszczen szczególnie wraz-liwych grup ludnosci i w przypadku którego niezbedna jest natych-miastowa i własciwa informacja”

pomiary stałe “oznacza pomiary przeprowadzane w stałych punktach po-miarowych, zarówno w trybie ciagłym, jak i na zasadzie wyrywko-wych prób, w celu okreslenia poziomów substancji w powietrzu zgod-nie z załozonymi stosownymi celami dotyczacymi jakosci danych”

pomiary wskaznikowe “oznaczaja pomiary, dla których wymagania do-tyczace jakosci danych sa mniej restrykcyjne w porównaniu z pomia-rami stałymi”

górny próg oszacowania “oznacza poziom substancji w powietrzu, po-nizej którego do oceny jakosci powietrza moze byc stosowana kombi-nacja pomiarów stałych i technik modelowania lub pomiarów wskaz-nikowych”

dolny próg oszacowania “oznacza poziom substancji w powietrzu, po-nizej którego do oceny jakosci powietrza moze byc stosowana kombi-nacja pomiarów stałych i technik modelowania lub pomiarów wskaz-nikowych”

†Podkreslenie moje

Page 75: Mgr

Dodatek B

Sztuczne sieci neuronowe

B.1 Wstep

Sztuczne sieci neuronowe (SSN) sa jedna z metod tworzenia systemówkomputerowych, które zdolne sa do nauki. Kanoniczna definicje uczeniamaszynowego podał T. Mitchell:

„Mówi sie, ze program uczy sie wykonywania pewnej klasy za-dan T, bazujac na doswiadczeniu E, wykonanie tych zadan jestoceniane metryka P, jesli jego wydajnosc we wszystkich zada-niach T, mierzona przez P, rosnie wraz z doswiadczeniem E[45]“

Sieci neuronowe w pierwszych swych załozeniach miały modelowac dzia-łanie układu nerwowego istot zywych, jednak w trakcie ich rozwoju po-rzucono ten pomysł. Teraz mówi sie co najwyzej o ’czerpaniu inspiracji’ zfunkcjonowania układu nerwowego†.

Poniewaz z punktu widzenia niniejszej pracy sieci neuronowe sa tylkonarzedziem, a nie przedmiotem badan, ich opis bedzie mozliwie skróconyi bedzie koncentrowac sie na praktycznych aspektach ich funkcjonowania.W tym wprowadzeniu Autor korzystał głównie z [46, 45, 51].

Cechy sieci neuronowych

• Zdolnosc do generalizacji danych. Wszystkie systemy uczace muszabyc w stanie generalizowac dane uczace, tj. umiec reagowac na danepodobne do danych uczacych, ale z nimi nie tozsame.

†Wynika to z przynajmniej dwóch powodów: po pierwsze — koncentrowano sie raczej naosiaganiu efektywnych układów uczacych sie; po drugie — samo funkcjonowanie układu ner-wowego nie jest dobrze zbadane i wcale nie jest pewne (a było to milczace załozenie wszyst-kich modeli sieci neuronowych), ze neurony nie reaguja na przykład na kształt impulsu ner-wowego — czy na całe ich sekwencje.

68

Page 76: Mgr

DODATEK B. SZTUCZNE SIECI NEURONOWE 69

• Odpornosc na błedy w danych uczacych. Sieci neuronowe potrafiasobie radzic z zaszumionymi kanałami wejsciowymi. Zarówno w da-nych uczacych, jak i danych wejsciowych podczas pracy sieci mogapojawiac sie błedy, które nie wpływaja znaczaco na zdolnosc sieci dogeneralizacji, ani na jej wydajnosc.

• Zdolnosc do równoległego przetwarzania. Sieci neuronowe zdolne sado przetwarzania sygnałów w sposób zrównoleglony†. Jako cieka-wostke mozna podac, ze ta własnie cecha układu nerwowego byłajedna z pierwszych przyczyn zainteresowania sztucznymi sieciamineuronowymi‡. Oczywiscie sieci neuronowe wykonywane na zwy-kłym komputerze moga w danym momencie wykonywac co najwy-zej tyle operacji ile komputer ten posiada rdzeni obliczeniowych, jed-nak buduje sie równiez specjalne, dedykowane do sieci neuronowych,układy sprzetowe pozwalajace na bardzo silne zrównoleglenie.

• Długie czasy treningu. Czasy treningu SSN sa generalnie dłuzszeod czasów treningu innych metod uczenia maszynowego i zawierajasie w czasie od kilku sekund do kilku dni, w zaleznosci od czynni-ków takich jak typ sieci neuronowej, metoda treningu, ilosc danychwejsciowych itp

• Szybka praca po wytrenowaniu. SSN działaja bardzo szybko po wy-trenowaniu (równiez bez uzycia zrównoleglonych układów sprzeto-wych)

• Człowiek nie jest w stanie zrozumiec sposobu, w jaki siec odwzoro-wuje dane. Siec w procesie uczenia dostosowuje odpowiednie licz-bowe wagi (te pojecia beda wyjasnione dalej). Inaczej mówiac wyni-kiem uczenia sieci jest wektor liczb obrazujacych pewne parametryneuronów i połaczen miedzy nimi. Bardzo trudno jest z takiej po-staci danych zrozumiec, jaka cecha danych wejsciowych odpowiadaza taki, a nie inny wynik. Mówiac jezykiem zwiazanym z tematyka

†Oznacza to ze poszczególne fragmenty obliczen sa od siebie niezalezne — i moga bycwykonywane w tym samym czasie.‡Bardzo dobrze obrazuje ta ceche cytat: „Czas jaki neuron potrzebuje na zmiane stanu [a

zatem na przetworzenie informacji — przyp. mój] jest rzedu 10−3s — dosc wolno w porów-naniu z systemami komputerowymi, dla których czasy te sa rzedu 10−10s. Jednak człowiekjest w stanie dokonac bardzo skomplikowanych decyzji, bardzo szybko. Dla przykładu prze-cietna osoba potrzebuje ok 10−1s by rozpoznac własna matke. Zauwazmy, ze maksymalnadługosc łancucha neuronów, który moze w tym czasie zareagowac to co najwyzej kilkaset. Taobserwacja spowodowała, ze zdolnosci do przetwarzania informacji przez biologiczne systemynerwowe musza miec swoje zródło w wysokim zrównolegleniu procesów wykonywanych nareprezentacjach rozproszonych na wielu neuronach. Jedna z motywacji SNN jest uchwycenietakiej zrównoleglonej metody obliczen (...).“[45] (tłumaczenie moje)

Page 77: Mgr

DODATEK B. SZTUCZNE SIECI NEURONOWE 70

pracy — majac wytrenowana siec neuronowa poprawnie przewidu-jaca przyszłe stezenia zanieczyszczen, nie koniecznie musimy byc wstanie powiedziec dlaczego siec przewidziała taki, a nie inny poziomzanieczyszczen. Da sie posługujac sie wieloma sieciami neuronowymiwywnioskowac takie informacje, jednak nie sa to metody ani proste,ani stuprocentowo pewne.

• Dane wejsciowe da sie przedstawic jako wektor liczb rzeczywistych.

• Dane wyjsciowe da sie przedstawic jako wektor liczb rzeczywistych.

• Poszczególne atrybuty danych wejsciowych moga byc ze soba silnieskorelowane.

Ocena SSN do zastosowania w modelowaniu zanieczyszczenpowietrza

Czesc podanych w poprzedniej czesci cech sieci neuronowych nie jest istotnadla zastosowania SSN do modelowania zanieczyszczen powietrza, inne na-tomiast przesadziły o ich wyborze do tego zadania.

Bardzo istotna jest odpornosc SSN na duze szumy w danych wejscio-wych. Dyrektywa 2008/50/WE zakłada, ze niepewnosc pomiaru poziomuPM dla pomiarów stałych musi byc mniejsza niz 25%[17], inaczej mówiac:mierniki tego zanieczyszczenia moga sie mylic własnie o tyle. Juz samfakt dopuszczenia takiej niepewnosci powoduje, ze dane wejsciowe sa bar-dzo zaszumione (jak na standardy uczenia maszynowego). Zdolnosc dogeneralizacji jest sine qua non zastosowania w tej dziedzinie jakiejkolwiekmetody.

Wymagania SSN co do postaci danych sa łatwe w tej dziedzinie do speł-nienia — dane nie wymagaja zadnej obróbki do tej postaci.

Zupełnie nie istotne sa dla nas metryki wydajnosciowe SSN — siecidziałaja wyznaczajac srednie stezenia dzienne badz godzinowe, a godzinana wyznaczenie srednich dla kilku stacji to bardzo duzo czasu.

Zasadnicza wada SSN w tym zastosowaniu jest fakt, ze bardzo trudnojest człowiekowi zrozumiec, to w jaki sposób siec odwzorowuje dane —majac działajacy predyktor chcielibysmy móc na jego podstawie wywnio-skowac proste zaleznosci (albo potwierdzic te znajdowane w literaturze).Chcielibysmy móc powiedziec: „Predkosc wiatru ma bardzo istotny wpływna poziomy zanieczyszczen powietrza“, jednak sieci neuronowe nie pozwa-laja na łatwe uzyskanie takich informacji (jeden ze sposobów wyciagnieciatakich wniosków w ??).

Page 78: Mgr

DODATEK B. SZTUCZNE SIECI NEURONOWE 71

Wreszcie sieci sa najlepiej przebadana metoda eksploracji danych dopodobnych zastosowan.

B.2 Podstawy teoretyczne

Budowa neuronu w SSN

Siec neuronowa jest w ogólnosci pewnym układem połaczonych ze sobaneuronów.

Neuron jest to struktura posiadajaca wiele wejsc oraz jedno wyjscie.Wyjscie to opisywane jest funkcja:

wout = F

(N∑i=0

wixi,p

)(B.1)

gdzie:

F to tzw. funkcja aktywacji,

p to wektor parametrów tej funkcji,

xi to wartosc sygnału wejsciowego na i-tym wejsciu,

wi to waga i-tego wejscia.

By wyznaczyc wartosc wyjsciowa neuronu musimy wysumowac wszystkiejego wejscia (po pomnozeniu ich przez współczynniki wag), a nastepniewykonac na tej liczbie jednoargumentowa funkcje aktywacji.

Mozliwe sa rózne funkcje aktywacji:

Funkcja signum Jest ona opisana wzorem

sgn(x) =

−1 x < 0

12 x = 0

1 x > 0

(B.2)

Ta funkcja aktywacji była uzywana w jednej z pierwszych prac nauko-wych na temat sieci neuronowych[84].

Funkcja skokowa Heaviside’a Jest ona opisana wzorem

H(x) =

1 x ≥ 0

0 x < 0(B.3)

Funkcji tej uzywa sie w najprostszych modelach perceptronu

Page 79: Mgr

DODATEK B. SZTUCZNE SIECI NEURONOWE 72

Funkcja sigmoidalna Jest to w zasadzie uogólnienie funkcji signum:

f(x) =1

1 + e−βx(B.4)

Jest to jedna z najczesciej uzywanych funkcji aktywacji. Ma ona jedenparametr — β.

Nieunormowana funkcja Gaussa Jest to funkcja uzywana w sieciachRBF oraz niektórych SVM:

f(x) = exp

((x− a)2

b

)(B.5)

Siec neuronowa

Rozwazmy perceptron wielowarstwowy bedacy jedna z prostszych siecineuronowych. Ma on nastepujaca strukture:

• Perceptron składa sie z kilku warstw (przynajmniej z jednej) .

• Neurony na sasiednich warstwach połaczone sa na zasadzie kazdy zkazdym.

• Neurony lezace na tej samej warstwie oraz na warstwach nie sasia-dujacych ze soba nie sa połaczone.

• Połaczenia w sieci perceptronu sa jednokierunkowe — w kierunkuwarstwy wyjsciowej, tj. stan neuronu na warstwie n nie ma wpływuna stan neuronu na warstwach m > n.

• W ostatniej warstwie, zwanej warstwa wyjsciowa, jest tyle neuronów,ile siec ma parametrów wyjsciowych.

Rysunek B.1: Symboliczny schemat neuronu

x1

x2

xn

w1

wn

wout

Page 80: Mgr

DODATEK B. SZTUCZNE SIECI NEURONOWE 73

Rysunek B.2: Przykłady funkcji sigmoidalnej dla róznych wartosci para-metrów β

−10 −8 −6 −4 −2 0 2 4 6 8 10

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

x

Funkcja sigmoidalna dla parametru β = 0.5

Funkcja sigmoidalna dla parametru β = 2

Funkcja sigmoidalna dla parametru β = 10

Rysunek B.3: Przykłady funkcji Gaussa dla róznych wartosci parametru a

−10 −8 −6 −4 −2 0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Zdenormalizowana funkcja gaussa dla parametru a = 0.5 i b = 0

Zdenormalizowana funkcja gaussa dla parametru a = 3 i b = 0

Zdenormalizowana funkcja gaussa dla parametru a = 15 i b = 0

Page 81: Mgr

DODATEK B. SZTUCZNE SIECI NEURONOWE 74

• Pozostałe warstwy nazywamy warstwami ukrytymi.

By wyznaczyc odpowiedz sieci na okreslone wejscie nalezy:

• Ustawic wartosci na wejsciu pierwszej warstwy neuronów

• Po kolei wyznaczac wartosci w poszczególnych warstwach.

By stworzyc funkcjonujaca siec neuronowa nalezy najpierw wybrac odpo-wiednia strukture sieci. W przypadku perceptronu trzeba wybrac iloscwarstw ukrytych oraz wybrac ilosc neuronu w kazdej warstwie. Nastep-nie nalezy przeprowadzic trening czyli operacje, która ustali wagi połaczenmiedzy neuronami oraz wartosci ewentualnych parametrów funkcji akty-wacji.

Budowanie struktury sieci

Jest to najtrudniejsza i najbardziej czasochłonna operacja. Jest najtrud-niejsza, poniewaz jest niewiele twierdzen, które pozwalaja rozstrzygnackiedy jaka struktura sieci jest najlepsza i w zasadzie w wiekszosc me-tod sprowadza sie do sprawdzenia wszystkich mozliwych struktur sieci.Jednak w wiekszosci przypadków sa albo twierdzenia matematyczne, albodobrze działajace heurystyczne zasady, które pozwalaja na ustalenie roz-sadnych granic problemowi poszukiwania najlepszej struktury.

Dla perceptronu nalezy najpierw ustalic ilosc warstw — a nastepnieilosc neuronów w kazdej warstwie. Przy czym dane sa nastepujace twier-dzenia matematyczne:

Twierdzenie 1 ((Hornik 1989)) Jesli ω : R → R jest funkcja aktywacjifunkcji, która nie jest funkcja stała, oraz Ψ : RN → RM to funkcja ciagła†

to istnieje siec MLP posiadajaca jedna warstwe ukryta, która aproksymujeΨ dowolnie dobrze. [56]

Dosc istotne w tym twierdzeniu jest to, ze rodzaj przyjetej funkcji akty-wacji nie gra roli. Oczywiscie w moze on ułatwiac, badz utrudniac uczeniesieci, jednak w praktyce starczy dla wszystkich neuronów wybrac funkcjesigmoidalna z „rozsadnym“ parametrem β.

Twierdzenie 2 ((Hornik 1991) Jesli ω : R → R jest funkcja aktywacjifunkcji, która nie jest funkcja stała, oraz Ψ : RN → RM to istnieje siecMLP, która aproksymuje Ψ dowolnie dobrze. [52, 53]†Dokładniej mówimy starczy zeby funkcja ta była mierzalna w sensie Borela.

Page 82: Mgr

DODATEK B. SZTUCZNE SIECI NEURONOWE 75

O ile mamy matematyczny dowód, ze dwie warstwy starczaja by aprok-symowac kazda nawet nieciagła funkcje†, to w praktyce stosuje sie sieciMLP, która maja wiecej warstw. Po prostu niejednokrotnie łatwiej jesttaka siec wytrenowac.

Twierdzenie 3 (Kurkova 1992) Jesli ω : R → R jest funkcja aktywacjifunkcji, która nie jest funkcja stała, oraz Ψ : RN → RN to funkcja ciagła todo aproksymowania istnieje siec o czterech warstwach, która aproksymujeta funkcje.

Dodatkowo Kurkova podaje ograniczenia na ilosc neuronów w poszcze-gólnych warstwach w zaleznosci od rodzaju funkcji i dokładnosci aproksy-macji. [54, 55]

Funkcja celu

Funkcja celu‡ jest miara tego jak dokładnie siec odwzorowuje badany pro-ces.

W praktyce uzywa sie kilku róznych funkcji celu.Sposób w jaki predyktor generalizuje dane uczace zalezy od zdanej mu

funkcji celu (dlatego tez nie mozna powiedziec ze istnieje jakas jedna kon-kretna funkcja celu).

Przykłady funkcji celu

We wzorach zi oznacza dana zmierzona a pi dana przewidziana.Dla klasyfikatora:

err =niepoprawne klasywikacje

wszystkie klasyfikacje(B.6)

Sredni bład absolutny (MAE††):

†W przypadku modelowania zanieczyszczen powietrza mozemy zakładac ze (o ile w ogólemozna mówic ze mamy do czynienia z funkcja) funkcja ta jest ciagła.‡Inaczej mówi sie równiez: funkcja wydajnosci/efektywnosci sieci.††Obok nazw podano obowiazujace w literaturze skróty

Require: sprawdz wektor liczb (prawdziwe dane pomiarowe dla odpowie-nich punktów)

Require: przewid wektor liczb (dane przewidziane przez model)Ensure: wynik skalar

1: wynik ← FUNKCJACELU(sprawdz, przewid)

Algorytm B.1 Deklaracja funkcji wydajnosci sieci

Page 83: Mgr

DODATEK B. SZTUCZNE SIECI NEURONOWE 76

err =1

N

N∑i=0

|pi − zi| (B.7)

Sredni bład wzgledny (MAPE):

err =1

N

N∑i=0

|pi − zi|zi

(B.8)

Jak łatwo zauwazyc, by MAPE był dobrze okreslony musi zachodziczi 6= 0, w niniejszej pracy dane wprowadzane do sieci beda normalizowanedo zakresu (0, 1], jednak sposób normalizacji danych wejsciowych† powo-duje, ze w zi moga sie trafic zerowe elementy (jednak bedzie ich niewiele).Metode liczenia MAPE nalezy wiec zmodyfikowac:

err =1

N ′

N∑i=0

|pi−zi|zi

zi 6= 0

0 zi = 0(B.9)

przy czym N ′ to liczba elementów dla których zi 6= 0.Odchylenie standardowe:

err =

√∑(zi − pi)2

N(B.10)

W niniejszej pracy głównie uzywana funkcja celu bedzie B.9.

Uczenie sieci

Uczenie sieci jest procesem takiego doboru wag połaczen pomiedzy neuro-nami (oraz ewentualnych parametrów funkcji aktywacji) by funkcja celubyła na zbiorze danych minimalna. Przy czym to, w jaki sposób siec bedzieodwzorowywac dane, zalezy od minimalizowanej funkcji celu — to jakiesiec bedzie dawała wyniki istotnie zalezy od podanej funkcji celu. Przykładdotyczacy pola tematu pracy: jesli funkcja celu bedzie MAPE, to siec be-dzie popełniała mniejsze absolutne błedy przy predykcji niskich stezen, ajesli bedzie to MAE to absolutne błedy beda podobne dla całego spektrumstezen.

W ogólnym przypadku do uczenia sieci mozna uzyc dowolnego algo-rytmu z dziedziny teorii optymalizacji, który w przypadkach praktycznychradzi sobie z silnie nieliniowymi funkcjami, które posiadaja wiele mini-mów lokalnych. W tej, wstepnej, czesci poprzestaniemy na takim opisieproblemu. Podam pewne praktyczne uwagi, które sa bardzo wazne bezwzgledu na to jaki algorytm sie stosuje.

†Opis algorytmu normalizacji w 4.8.

Page 84: Mgr

DODATEK B. SZTUCZNE SIECI NEURONOWE 77

Wybór poczatkowych wartosci wag

By móc rozpoczac trening sieci musimy miec punkt poczatkowy wartosciwag. W jezyku teorii optymalizacji — musimy miec punkt startowy, z któ-rego rozpoczynamy optymalizacje. Jedyna metoda wyboru poczatkowychwartosci wag połaczen, która działa w przypadku ogólnym, jest losowy wy-bór wag. Wartosci wag powinny byc losowane z rozkładu równomiernego,najlepsze wyznaczenie granic owego rozkładu jest przedmiotem badan teo-retycznych (w [47] podano rózne mozliwe wyznaczane przez teoretykówwartosci).

Problem przeuczenia sieci

Immanentna czescia kazdego zestawu danych empirycznych jest jakas iloscszumu, która mu towarzyszy†. O przeuczeniu mówimy kiedy siec zamiastpoprawnie generalizowac dane zaczyna przystosowywac sie do szumów,które sa ich czescia[48]. Zjawisko to jest grozne poniewaz moze powodo-wac spadek zdolnosci generalizacyjnej sieci. Praktyczna konsekwencja ist-nienia tego problemu jest koniecznosc wprowadzenia algorytmu treningui walidacji sieci, który jest opisany w sekcji 4.8.

B.3 Pojecie cechy

Rozwazmy problem modelowania zanieczyszczen powietrza. Danymi wej-sciowymi do modelowania musza byc parametry pogodowe z danej chwiliczasu oraz z chwil poprzednich (lub nastepnych). Instancja‡ bedzie miaładuzy wymiar, jednak — dane te beda ze soba w jakis sposób skorelowane.Niskie zachmurzenie, bedzie powodowało wzrost nasłonecznienia a zatemtemperatury; deszcz powoduje spadek temperatury; wysokie cisnienie be-dzie budowało układy wyzowe które wpłyna na pozostałe parametry (do-kładny opis tych zjawisk jest w tej czesci pracy nieistotny). Mówiac ogól-niej mamy problem który da sie opisac tak: dane maja wiele wymiaróworaz poszczególne wymiary sa ze soba skorelowane††. Czesto SSN gorzejgeneralizuja silnie skorelowane sygnały, wiec chcielibysmy jakos ograni-czyc wymiar instancji wejsciowej — jednak bez istotnej utraty informacji.Stosuje sie wtedy układy wstepnie przetwarzajace dane wejsciowe, które

†W przypadku modelowania zanieczyszczen srodowiska jest to szczególny problem — jakbyło wspominane dyrektywa[14] dopuszcza 25% niepewnosci pomiaru poziomu PM.‡Termin zwiazany z SSN, wyjasnienie w dodatku w dodatku A.††Przykład jest troche naciagany — stacje pomiaru zanieczyszczen powietrza czesto daja

tylko podstawowe parametry pogodowe — wiec nie mamy tutaj kleski urodzaju.

Page 85: Mgr

DODATEK B. SZTUCZNE SIECI NEURONOWE 78

dokonuja takich operacji jak kompresja stratna, odszumowanie i wyzna-czenie istotnych cech sygnału†.

Wynik pracy takiego układu dokonujacego wstepnego przetwarzaniadalej stanowi dane wejsciowe do SSN i jest nazywany instancja cech‡. Opisdziałania takiego układu na rys. B.4. Fakt, ze tego typu układy sa z róz-nych przyczyn implementowane jako SSN nie jest istotny dla dalszej ana-lizy.

Przykładami metod wstepnego przetwarzania danych sa takie metodyjak PCA, BSS, transformata falkowa. PCA i BSS sa metodami, które po-zwalaja zmniejszyc wymiar instancji z minimalna utrata informacji, wy-korzystuja one korelacje pomiedzy poszczególnymi elementami instancji.Transformata falkowa bedzie szerzej opisana w C.

B.4 Kroki potrzebne do zbudowania modeli opartegona SSN

By zbudowac działajacy model oparty o SSN††, nalezy wykonac nastepu-jace kroki:

†Zauwazmy ze wszystkie te operacje sa do siebie bardzo podobne. Dla przykładu, do do-konaniu kompresji stratnej obrazu pozbywamy sie z niego głównie szumów. Po kompresjizbioru instancji o wymiarze N do takiego o wymiarze M � N poszczególne elementy skom-presowanego zbioru beda bardziej istotne.‡Nie znalazłem w polskim pismiennictwie odpowiadajacego terminu. Słowo cecha jest

tłumaczeniem terminu feature zaczerpnietego z pismiennictwa anglojezycznego.††Ponizsze uwagi mozna równiez zastosowac do dowolnego modelu opartego na eksploracje

danych.

Rysunek B.4: Siec z układem wstepnie przetwarzajacym dane. Ilustracjapojecia cecha.

Wstępne przetwarzanie(PCA, BSS, transformata falkowa)

SSN

Instancja wejściowa danych o wymiarze np. 100 000

Instancja cech o o znacznie mniejszym wymiarze (np. 50)

Page 86: Mgr

DODATEK B. SZTUCZNE SIECI NEURONOWE 79

Ustalenie typu modelu Ustalenie jakiej sieci neuronowej uzyc itp.

Ustalenie danych wejsciowych i wyjsciowych do modelu Pierwszy krokto ustalenie z jakich danych model korzysta i jakie parametry modelbedzie modelowac.

Ustalenie przestrzeni cech które beda trafiac do SSN Model moze do-konywac pewnych przekształcen na danych wejsciowych. Na przy-kład dokonywac PCA, albo dyskretnej transformaty falkowej.

Ustalenie metaparametrów modelu Przed rozpoczeciem treningu siecineuronowej nalezy ustalic wszystkie metaparametry†modelu. Dlasieci SVM beda to parametry C, γ i ε, dla transformaty falkowej be-dzie to decyzja na ile falek dokonac rozkładu etc.

Wytrenowanie modelu Dokonanie treningu SSN.

B.5 Sieci SVM

Bede koncentrował sie na aspektach dotyczacych praktycznego wykorzy-stania tych sieci. Szczególny nacisk kładac na wskazanie jaka role pełniametaparametry w procesie budowania i treningu sieci.

Wprowadzenie do sieci SVM za [49].

Sieci SVM w zadaniu klasyfikacji problemu separowalnegoliniowo

Klasyfikacja problemu separowalnego liniowo jest najprostszym proble-mem z jakim radza sobie sieci SVM. Danych jest p par uczacych w postaci(xi, di), gdzie xi to współrzedne punktu natomiast di to wartosc ze zbioru{1,−1}.

W problemie tym mamy dwie klasy (przynaleznosc punktu xi do da-nej klasy jest determinowana przez wartosc di) punktów w przestrzeni Nwymiarowej, przy czym istnieje płaszczyzna która te klasy rozdziela — tj.płaszczyzna o równaniu:

g(x) = 0,

gdzie:

g(x) = wTx + b. (B.11)

†Termin zwiazany z SSN, wyjasnienie w dodatku w dodatku A.

Page 87: Mgr

DODATEK B. SZTUCZNE SIECI NEURONOWE 80

Płaszczyzna ta okresla przynaleznosc do dwóch grup w nastepujacytaki sposób ze jesli dla punktu ze:

di = sgn(g(xi)) (B.12)

By separacja klas była mozliwie dobra, chcielibysmy by płaszczyzna se-paracji lezała mozliwie daleko od punktów nalezacych do obu klas, wpro-wadzamy wiec tzw. margines separacji — czyli obszar wokół płaszczyznyseparacji w którym nie ma zadnych punktów. By stworzyc tzw. marginesseparacji miedzy tymi klasami zmieniamy warunek B.12 na:

di =

1 g(xi) ≥ ε

−1 g(xi) ≤ −ε(B.13)

dla zwiezłosci notacji opuszcza sie zmienna ε odpowiednio dzielac przeznia obie strony nierównosci przez, a nastepnie modyfikujac wartosci wT

oraz b. Warunek B.13 mozemy wiec zapisac jako:

di =

1 g(xi) ≥ 1

−1 g(xi) ≤ −1(B.14)

Warunek mozna przepisac do postaci do postaci:

dig(xi) ≥ 0 (B.15)

Jesli para (xi, di) spełnia warunek:

g(xi)| ∈ {−1, 1}, (B.16)

wtedy lezy ona na brzegu marginesu separacji i nazywany jest wekto-rem wsparcia†. Punkty takie sa najtrudniejsze w klasyfikacji, dodatkowotylko one uczestnicza w procesie maksymalizacji marginesu separacji.

W praktyce poszukuje sie nie dowolnej płaszczyzny separacji a optymal-nej płaszczyzny separacji, tj takiej płaszczyzny dla której margines sepa-racji jest najwiekszy. Odległosc od miedzy wektorem‡ podtrzymujacym apłaszczyzna separacji wyraza sie wzorem:

r =g(ssv)

‖x‖, (B.17)

Page 88: Mgr

DODATEK B. SZTUCZNE SIECI NEURONOWE 81

Wyznaczenie szerokosci marginesu separacji

Wprowadzmy oznaczenia g+(x) to płaszczyzna okreslajaca ’górna’ granicemarginesu separacji, g−— dolna granice. Ustalamy dowolny punkt x+ napłaszczyznie g+, oraz x− czyli najblizszy do x+ punkt na płaszczyznie g−.Podane oznaczenia równiez na rys B.5.

Stwierdzamy nastepujace fakty [65]:

w jest prostopadłe do g(x), g−(x), g+(x) (B.18)

x+ = x− + λw (B.19)

Mamy wiec:

g(x+) = 1

wTx+ + b = 1 (B.20)

wstawiamy do B.20 warunek B.19 i otrzymujemy:

†Z ang. support vector‡Mimo nazwy, wektor podtrzymujacy to punkt.

Płaszczyzna separacji

g+

g-

x+

x-

margines

separacji

szer

okoś

ć

mar

gine

su sep

arac

ji

punkt klasy Apunkt klasy Bwektor wsparciaspecjalny punkt

Rysunek B.5: Margines separacji

Page 89: Mgr

DODATEK B. SZTUCZNE SIECI NEURONOWE 82

wTx− + b︸ ︷︷ ︸=g(x−)=−1

−λwTw = 1, (B.21)

mamy zatem:

λ =2

wTw. (B.22)

Szerokosc marginesu separacji wyraza sie zatem wzorem:

M =∣∣x+ − x−

∣∣ = |λw| = λ |w| = 2 |w|wTw

=2√

wTw=

2

|w|(B.23)

Uczenie liniowego klasyfikatora SVM

Klasyfikator SVM dazy do maksymalizacji marginesu separacji, wiec by gowytrenowac nalezy rozwiazac problem:

max{M} ≡ min{wTw

}przy dodatkowym warunku B.14, który mozna zapisac tez w postaci:

dig(xi) ≥ 1. (B.24)

Jest to problem programowania kwadratowego i jest on rozwiazywanymetoda mnozników Lagrange’a, polegajacej na minimalizacji funkcji La-grange’a:

J(w, b,α) =1

2wTw −

p∑i=0

αi(di(wTxi + b

)− 1)

(B.25)

Problem ten mozna rozwiazac, rozwiazujac tzw. problem dualny†, któryokresla sie nastepujaco:

max

p∑i=0

αi −1

2

p∑i=0

p∑j=0

αiαjdidjxTi xj

(B.26)

przy warunkach:

αi ≥ 0 (B.27)

p∑i=1

αidi = 0 (B.28)

†Dokładne wyprowadzenie w [49]

Page 90: Mgr

DODATEK B. SZTUCZNE SIECI NEURONOWE 83

Rozwiazanie tego problemu pozwala wyznaczyc wektor wagw i współ-czynnik b optymalnej płaszczyzny za pomoca zaleznosci:

w =

p∑i=0

αidixi (B.29)

b = 1−wTxsv (B.30)

Liniowe klasyfikatory SVM dla problemównieseparowalnych liniowowo

Nawet dla problemów w które co do zasady powinny byc separowalne li-niowo, szum wystepujacy w danych moze spowodowac to ze pewne punktytrafia na zła strone płaszczyzny separacji. Algorytmy opisane w poprzed-nim paragrafie nie radza sobie z takim przypadkiem (warunek B.13 nieuwzglednia mozliwosci wystepowania punktów w marginesie separacji).

W problemie tym stara sie znalezc płaszczyzne która minimalizuje szansebłednej klasyfikacji, w tym celu przekształca sie równanie B.15 do postaci:

dig(xi) ≥ 1− ξi, (B.31)

Parametr ξi pozwala efektywnie zmieniac rozmiar marginesu toleran-cji dla kazdego punktu i jest z załozenia wiekszy od zera. ξi z zakresu(0; 1) oznacza ze dany punkt jest wewnatrz marginesu tolerancji, jednakpo prawidłowej stronie płaszczyzny separacji (tj. bedzie prawidłowo skla-syfikowany. Jesli ξi > 0 punkt zostanie błednie sklasyfikowany.

Problem znalezienia wag sieci sprowadza sie wiec do rozwiazania zmo-dyfikowanego problemu B.26:

min {Θ(w, ξ)} ≡ 1

2wTw + C

p∑i=1

ξi, (B.32)

przy ograniczeniach:

dig(xi) ≥ 1− ξi, (B.33)

ξi ≥ 0 (B.34)

Problem ten rozwiazujemy analogicznie jak B.26.Parametr C jest pierwszym ustalanym przez uzytkownika metapara-

metrem. Kontroluje on równowage pomiedzy dwoma członami minima-lizowanego wyrazenia B.32, im wiekszy parametr C, tym model rzadziejbedzie pozwalac punkty pojawiajace sie wewnatrz marginesu separacji.

Page 91: Mgr

DODATEK B. SZTUCZNE SIECI NEURONOWE 84

Jego poprawna wartosc zalezy od tego jak bardzo podane klasy sie prze-krywaja — tj. jak czesto w naturalny sposób punkty które sa w klasiedi = −1 trafiaja do obszaru drugiej klasy. Zbyt mała wartosc parametru Cbedzie powodowała ze model bedzie szedł ’na skróty’ i bedzie pozwalał nazbyt wiele błednych klasyfikacji, zbyt duza jego wartosc moze prowadzicdo przeuczenia sieci.

Klasyfikatory SVM dla problemów nieliniowych

Problem nieseparowalny liniowo zdefiniowany przestrzeni oryginalnej o Nwymiarach moze byc separowalny liniowo w innej przestrzeni o K wymia-rach (nazwanej przestrzenia cech†). Przy czym zazwyczaj N ≤ K.

Zastosowanie sieci SVM do problemu nieseparowalnego liniowo ma dwakroki — w pierwszym dokonuje sie transformacji do przestrzeni cech, a wdrugim rozwiazuje problem juz separowany liniowo z uzyciem algorytmówopisanych w B.5 i B.5.

W tym problemie równanie B.11 przyjmuje postac:

g′(x) = wTϕ(x) + b, (B.35)

gdzie ϕ jest funkcja wektorowa ϕ : RN → RK , która definiuje odwzo-rowanie do przestrzeni cech. Problem ten rozwiazuje sie analogicznie jakproblemy poprzednie. Problem pierwotny mozna zapisac jako (jest on takisam jak w B.32):

min {Θ(w, ξ)} ≡ 1

2wTw + C

p∑i=1

ξi, (B.36)

przy warunkach (tutaj zmiana w pierwszym warunku):

dig′(xi) ≥ 1− ξi, (B.37)

ξi ≥ 0 (B.38)

Problem dualny‡, mozna natomiast przedstawic jako:

max

p∑i=1

αi −1

2

p∑i=1

p∑j=1

αiαjdidjK(xiT ,xj)

(B.39)

przy warunkach:

†Patrz tez B.3.‡Pełne wyprowadzenie w [49]

Page 92: Mgr

DODATEK B. SZTUCZNE SIECI NEURONOWE 85

C ≥ αi ≥ 0 (B.40)

p∑i=1

αidi = 0 (B.41)

Gdzie K (xi,xj) = ϕT (xi)ϕ (xj), jest skalarna funkcja, zwana funkcjajadra†. Po rozwiazaniu problemu dualnego mozemy wrazic g′(x) w jezykuwspółczynników Lagrange’a α1oraz funkcji jadra:

g′(x) =

Nsv∑i=0

αidiK(x,xi) + b (B.42)

Wprowadzenie funkcji jadra powoduje ze nie trzeba bezposrednio obli-czac wartosci funkcji wektorowej ϕ, co przyspiesza obliczenia.

Najczesciej uzywane funkcje jadra[44]

Liniowe:

K (xi,xj) = xTi xj + γ (B.43)

Wielomianowe:

K (xi,xj) =(xTi xj + γ0

)γ1 (B.44)

Radialne:

K (xi,xj) = exp(−γ ‖xi − xj‖2

)(B.45)

Sigmoidalne:

K (xi,xj) = tgh(γ1x

Ti xj + γ0

)(B.46)

Parametry γn sa traktowane jako metaparametry sieci.

Sieci SVM dla nieliniowego problemu regresji

Do tej pory pokazano wykorzystanie sieci SVM jako klasyfikatora, tj. układuktóry jest w stanie przypisywac sygnały wejsciowe do pewnych klas. Przy-kładowo układy tego typu sa w stanie stwierdzic czy w danym dniu nastapiprzekroczenie poziomów dopuszczalnych czy nie, jednak nie sa w stanie po-dac poziomu zanieczyszczenia. Mówiac scislej róznica miedzy problememklasyfikacji a regresji jest taka ze w parach uczacych (x, di), wartosc di dla†z ang. kernel function.

Page 93: Mgr

DODATEK B. SZTUCZNE SIECI NEURONOWE 86

problemu klasyfikacji moze przyjmowac wartosci {1; 0}, podczas gdy dlaproblemu klasyfikacji di ∈ R.

By sprowadzic problem regresji do problemu programowania kwadra-towego wprowadza sie nastepujaca funkcje celu:

Lε(d, g′(x)) =

{0 dla |d− g′(x)| ≤ ε

|d− g′(x)| − ε dla |d− g′(x)| ≥ ε(B.47)

Przy czym g′(x) jest definiowane tak samo jak w B.35:

g′(x) = wTϕ(x) + b, (B.48)

Parametr ε jest metaparametrem sieci.Dalsze wyprowadzenie nie przebiega w sposób istotnie rózny od wypro-

wadzen z poprzednich paragrafów, wiec dla ustalenia uwagi ominiemy je.

Page 94: Mgr

Dodatek C

Dyskretna transformatafalkowa

Analiza falkowa została wielokrotnie niezaleznie ’odkryta’ przez specjali-stów wielu dziedzin (matematyków, fizyków, elektroników, geologów)[59],znalazła tez zastosowanie we wczesnych próbach modelowania układu per-cepcji człowieka — przy problemach takich jak: rozpoznawanie krawedzi[61],głebi i ruchu. Jest ona zwiazana ze stosowaniem SSN, tylko w tym sensie,ze jest powszechnie uzywana technika wstepnego przetwarzania złozonychsygnałów.

Współczesnie jest stosowana do:

kompresji obrazów

analizy sygnałów w przestrzeni czestotliwosci i czasu

redukcji ilosci sygnałów wejsciowych Miedzy innymi przy przetwa-rzaniu obrazów. Wysoko rozdzielcze obrazy przed podaniem sieci mu-sza byc przetworzone tak, by siec ta miała rozsadna ilosc neuronówwejsciowych.

tworzenie cech Przy złozonych problemach SSN czesto nie sa w stanieodpowiednio generalizowac

Powyzszy rozdział stanowi głównie wprowadzenie terminów i pojec, któresa niezbedne do zrozumienia dyskretnej analizy falkowej, niz samo for-malne wprowadzenie tej analizy. Zrozumienie tych pojec jest kluczowe dostosowania tego narzedzia.

Punktem wyjscia do omawiania transformaty falkowej bedzie jej pre-kursor — Transformata Fouriera†.†W dalszej czesci tekstu zakładam ze Czytelnik zna transformate Fouriera

87

Page 95: Mgr

DODATEK C. DYSKRETNA TRANSFORMATA FALKOWA 88

C.1 Transformata Fouriera

Transformata Fouriera jest narzedziem pozwalajacym przekształcic funk-cje działajaca w domenie czasu do domeny czestotliwosci. Ma ona naste-pujaca definicje:

F : C→ C (C.1)

Ff(ω) =

ˆ +∞

−∞f(x)e2πixωdx (C.2)

gdzie F to transformata Fouriera przypisujaca kazdej funkcji f(x) funk-cje Ff(ω).

Pozwala ona rozdzielic funkcje na składniki o róznych czestotliwosciach.Inaczej mówiac, pozwala ona wyrazic dowolna funkcje jako kombinacje li-niowa funkcji nalezacych do pewnej konkretnej bazy†. Wada tego narze-dzia, która spowodowała wprowadzenie do uzycia transformaty falkowej,jest fakt, ze funkcje uzywane funkcje bazowe nie maja ograniczonego no-snika‡, zatem bardzo utrudnione jest badanie przebiegów, w które zmie-niaja swój charakter w czasie, np. ich widmo czestotliwosci zmienia siew czasie, albo maja periodyczna strukture, na która nałozono punktoweszumy. Lokalne szumy w sygnale sa w stanie zaburzyc całe furierowskiewidmo. Z tego samego powodu bardzo trudno jest uzywajac tego narzedziaodtworzyc w widmie lokalne fenomeny.

Formalizm transformaty Furiera mozna zastosowac do takich proble-mów jak: wyznaczenie ciagłej transformaty funkcji ciagłej (transformataFouriera), rozkład ciagłej funkcji na przeliczalnie wiele funkcji bazowych(szereg Fouriera), rozkład dyskretnego szeregu na dyskretny szereg (dys-kretna transformata Fouriera).

Transformata falkowa działa, co do zasady, bardzo podobnie — równiezdokonuje rozkładu funkcji na funkcje bazowe, jednak te funkcje bazowemaja ograniczony nosnik. Co za tym idzie, sa w stanie wydajniej analizo-wac funkcje, których widmo czestotliwosciowe zalezy od czasu. Przykładrozkładu funkcji majacej rózne zmienne widmo czestotliwosci na rys. C.1.

†Jesli baza ta bedzie ciagła — mówimy o transformacie Fouriera, jesli baza ta bedzieskładac ze skonczonej ilosci elementów — mówimy o szeregi Fouriera.‡Nosnik (termin topologiczny): domkniecie zbioru argumentów funkcji, w których ma ona

wartosci mniejsze od zera.

Page 96: Mgr

DODATEK C. DYSKRETNA TRANSFORMATA FALKOWA 89

C.2 Porównanie transformaty Fouriera i falkowej

ilosc mozliwych baz W transformacie Fouriera jest to zawsze jedna bazazawierajace funkcje trygonometryczne. Dla transformaty falkowejistnieje wiele róznych baz funkcji.

nosnik funkcji bazowych Dla transformaty Fouriera jest to zawsze (−∞; +∞).Dla transformaty Fouriera natomiast nosnik jest zawsze ograniczonyi rózny, dla róznych funkcji bazowych.

C.3 Budowanie rodziny falek

Falka macierzysta Ψ(x) nazywamy funkcje, która spełnia nastepujace warunki[57]:

ˆ +∞

−∞Ψ(x) = 0 (C.3)

Rysunek C.1: Przykład ciagłej transformaty falkowej

t

f(t)

(a) Funkcja transformowana

t

ω

(b) Wynik transformacjia

a Kolor obrazuje wartosc transformaty w tym punkcie. Na osi odcietychdany jest czas, na osi rzednych czestotliwoscIlustracja ta jest zmodyfikowana wersja obrazu pobranego zhttp://commons.wikimedia.org/wiki/File:Continuous_wavelet_transform.svg.Plik oryginalnie wykonano za pomoca srodowiska MATLAB

Page 97: Mgr

DODATEK C. DYSKRETNA TRANSFORMATA FALKOWA 90

‖Ψ(x)‖ = 1 (C.4)

Dodatkowo wymagamy, by funkcja ta nie miała momentów o dowolniemałych czestotliwosciach, inaczej mówiac:

ˆFΨ(ω)

ω<∞ (C.5)

gdzie FΨ(ω) to transformata Fouriera falki macierzystej.Z funkcji tej budujemy rodzine falek:{Ψu,s : j, k ∈ R}, która ma naste-

pujace własciwosci:

Ψu,s = 2−s2 Ψ

(t− us

)(C.6)

Współczynniki u i s sa w ciagłej transformacie falkowej rzeczywiste.Dodatkowo wymagamy by:

〈Ψj,k; Ψu,s〉 = δ(j − u)δ(k − s) (C.7)

C.4 Ciagła transformata falkowa

Definicja ciagłej transformaty falkowej:

W : C → C (C.8)

Wf(u, s) = 〈f,Ψu,s〉 =

ˆ +∞

−∞f(t)Ψ?

(t− us

)dt (C.9)

Transformata odwrotna:

f(t) =

ˆ +∞

−∞

ˆ +∞

−∞Wf(u, s)Ψ?

(t− us

)duds (C.10)

C.5 Analiza wielorozdzielcza

Analiza wielorozdzielcza pozwala rzutowac sygnał na ciag przestrzeni funk-cyjnych (Vj), które moga aproksymowac okreslona funkcje. Przestrzenie teintuicyjnie odpowiadaja coraz wiekszym stopniom szczegółowosci analizy.Przyblizenie funkcji f w rozdzielczosci 2−j jest reprezentowane jako siatkaprzyblizen srednich funkcji f w obszarach o rozmiarze proporcjonalnym do2j . Przestrzen Vj zawiera wszystkie mozliwe przyblizenia w rozdzielczosci2−j , dodatkowo definiuje sie projekcje fj ∈ Vj , która jest funkcja taka, ze‖f − fj‖ jest najmniejsze. Funkcja ta jest interpretowana jako przyblizenief na poziomie dokładnosci Vj .

Page 98: Mgr

DODATEK C. DYSKRETNA TRANSFORMATA FALKOWA 91

Przestrzenie Vj spełniaja nastepujace aksjomaty[58]:

Vj ⊂ L2(R) (C.11)

Vj jest podprzestrzenia funkcji o skonczonej energii, tj. dla kazdej funk-cji f nalezacej do Vj spełniony jest warunek

´ +∞−∞ |f(t)|2 dt <∞.

∀j ∈ Z, f(t) ∈ Vj ⇔ f

(t

2

)∈ Vj+1 (C.12)

Intuicyjnie wraz ze wzrostem indeksu j maleje dokładnosc aproksyma-cji funkcji (rosnie czestotliwosc próbkowania). Przy dwukrotnym podnie-sieniu czestotliwosci funkcji przenosimy ja do wyzszej przestrzeni Vj .

∀j ∈ Z, Vj+1 ⊂ Vj (C.13)

Przestrzen funkcji o nizszej rozdzielczosci zawiera sie w przestrzenifunkcji o wyzszej rozdzielczosci.

∀(j, k) ∈ Z2, f(t) ∈ Vj ⇔ f(t− 2jk) ∈ Vj (C.14)

Funkcje sa niewrazliwe na translacje o 2j .

limj→+∞

Vj =

+∞⋂j=−infty

Vj = {0} (C.15)

W bardzo niskiej skali nie mozemy nic powiedziec o aproksymowanejfunkcji.

limj→−∞

Vj = domkniecie

+∞⋃j=−∞

Vj

= L2(R) (C.16)

Dla dowolnie duzej skali aproksymacje zbiegaja do aproksymowanejfunkcji f .

C.6 Funkcja skalujaca

Najlepsza aproksymacja funkcji f w rozdzielczosci 2−j jest definiowanajako ortogonalna projekcja Pvjf w Vj . Wyraza sie ona za pomoca funk-cji skalujacej Φ, której przeskalowania i przesuniecia Φj,n tworza ortonor-malna baze Vj . Metode otrzymywania Φ mozna znalezc w [58].

Φj,n(t) = 2−j2 Φ

(t− n

2j

)(C.17)

gdzie n ∈ Z.

Page 99: Mgr

DODATEK C. DYSKRETNA TRANSFORMATA FALKOWA 92

Najlepsza aproksymacja f w rozdzielczosci 2−j jest:

Pvjf =

+∞∑n=−∞

aj [n]Φj,n (C.18)

gdzie aj [n] = 〈f,Φj,n〉 =´ +∞−∞ f(t)Φj,ndt

Dodatkowo funkcje skalujace mozna powiazac z filtrami pasmowoprze-pustowymi.

Poniewaz Vj ⊂ Vj−1 oraz poniewaz Φ0,n tworza ortonormalna baze V0

mozemy napisac:

1√2

Φ

(t

2

)=∑n∈Z

h[n]Φ(t− n) (C.19)

gdzie:

h[n] = 〈f,Φ0,n〉 (C.20)

Współczynniki h[n] beda interpretowane jako filtr pasmowoprzepustowy.

Rysunek C.2: Podział przestrzeni czasu i czestotliwosci na poszczególnefunkcje bazowe w dyskretnych transformatach

ω exp(iπω)

exp(2iπω)

exp(3iπω)

exp(4iπω)

exp(5iπω)

x

(a) Zwykła transformata Furie-rowska

ω

x

exp(iπω)

exp(2iπω)

exp(3iπω)

exp(4iπω)

exp(5iπω)

(b) Okienkowa transformata Fu-rierowska

ω

xW(4,1)

W(3,1)

W(2,1)

W(3,2)

W(2,2) W(2,3) W(2,4)

W(1

,1)

W(1

,2)

W(1

,3)

W(1

,4)

W(1

,5)

W(1

,6)

W(1

,7)

W(1

,8)

(c) Dyskretna transformat fal-kowa

Page 100: Mgr

DODATEK C. DYSKRETNA TRANSFORMATA FALKOWA 93

C.7 Transformata falkowa a analiza wielorozdzielcza

Formalizm analizy falkowej jest blisko powiazany z analiza wielorozdziel-cza. Zdefiniujmy przestrzenWj , która stanowi róznice pomiedzy przestrze-niami Vj i Vj−1. Intuicyjnie przestrzenWj bedzie zawierac szczegóły aprok-symacji funkcji, które sa obecne w przestrzeni Vj−1, natomiast nie ma ichw przestrzeni Vi.

Vj−i = Vj ⊕Wj (C.21)

Zatem ortogonalna projekcja aproksymowanej funkcji f w Vj−1moze zo-stac napisana jako:

PVj−1f = PVj

f + PWjf (C.22)

Dodatkowo mozna udowodnic, ze da sie skonstruowac baze Wj za po-moca przeskalowanej i przesunietej falki Ψ. Baza ta jest:{

Ψj,n(t) = 2−j2 Ψ

(t− 2jn

2j

)}(j,n)∈Z

(C.23)

Dla funkcji falkowych da sie rowniez zbudowac powiazany z nimi filtrpasmowoprzepustowy (oznaczany g[n]), który jest scisle powiazany z fil-trem budowanym dla funkcji skalujacej.

W analizie falkowej przedstawiamy aproksymacje funkcji na poziomiej − 1 jako:

PVj−1f = PVj

f + PWjf, (C.24)

co mozna równiez zapisac jako:

PVj−1=∑k

λj,kΨj,k +∑k

γj,kΦj,k, (C.25)

gdzie element:∑k γkΦj,k (powiazany z funkcja skalujaca) interpretu-

jemy jako aproksymacja funkcji na poziomie j, natomiast element∑k λkΨj,k

powiazany z funkcja falkowa interpretujemy jako wzrost dokładnosci aprok-symacji na poziomie j + 1.

Analogicznie mozna postapic dla poziomu j, j + 1 itp, budujac w tensposób piramide wielorozdzielczych aproksymacji sygnału. Algorytm szyb-kiej transformaty falkowej pozwala badzo efektywnie wyznaczyc współ-czynniki λj,ni γj,k (złozonosc obliczeniowa O(n), gdzie n to ilosc próbek wrozkładanym sygnale).

Page 101: Mgr

DODATEK C. DYSKRETNA TRANSFORMATA FALKOWA 94

C.8 Szybka dyskretna transformata falkowa

Funkcja skalujaca

Pojecie funkcji skalujacej mozna tez wprowadzic z poziomu samej transfor-maty falkowej.

Celem naszych działan jest wprowadzenie metody rozkładu funkcji naskonczona liczbe falek. Ze wzgledu na wyrazenie 2j · x we wzorze kazdafalka ma dwa razy mniejsza czestotliwosc głównej harmonicznej oraz zaj-muje dwa razy mniejszy obszar pasma czestotliwosci. By pokryc w ten spo-sób całe pasmo czestotliwosci nalezałoby uzyc nieskonczonej ilosci falek,co w praktycznych zastosowaniach oznaczałoby koniecznosc zastosowaniazbyt duzej ilosci falek do osiagniecia rozsadnej dokładnosci aproksymacjisygnału. Stosuje sie wiec funkcje skalujaca, która przy danej ilosci falek,zapełnia luke w widmie czestotliwosciowym[61].

Dodatkowo uznajemy ze:

〈Φj,k; Ψl,m〉 = δj,lδk,m (C.26)

gdzie Φ to funkcja skalujaca.

Algorytm szybkiej transformaty falkowej

Ze wzgledu na warunek C.5 falki sa blisko powiazane z pojeciem filtrówpasmowo przepustowych. Filtry pasmowo przepustowe sa to narzedzia,które dany sygnał przekształcaja na sygnał, z którego usunieto zadaneczesci jego widma czestotliwosciowego. Intuicyjnie mozna powiedziec, zewarunek C.5, który mówi ze widmo czestotliwosciowe falki ma ograniczonynosnik powoduje, ze operacja falki działaja jak filtry pasmowoprzepustowe.

Rysunek C.3: Przykłady falek — falka Haara

−0.2 0 0.2 0.4 0.6 0.8 1 1.2−1.5

−1

−0.5

0

0.5

1

1.5

(a) Falka Haara

−0.2 0 0.2 0.4 0.6 0.8 1 1.2

−0.4

−0.2

0

0.2

0.4

0.6

0.8

1

1.2

1.4

(b) Funkcja skalujaca Haara

Page 102: Mgr

DODATEK C. DYSKRETNA TRANSFORMATA FALKOWA 95

Filtr h[n]† powiazany z funkcja skalujaca bedziemy interpretowac jakopołówkowy filtr dolnoprzepustowy, natomiast filtr g[n], bedziemy interpre-towac jako połówkowy filtr górnoprzepustowy. Sygnał bedziemy oznaczacjako f [n].

W pierwszym kroku algorytmu przepuszczamy sygnał f przez filtry g ih, po przefiltrowaniu sygnału operujemy sygnałami o połowie mniejszymwidmie czestotliwosci to zgodnie z reguła Nyquista mozemy odrzucic codrugi punkt z przefiltrowanego sygnału. Operacjom tym odpowiadaja ma-tematyczne operacje

fhigh[n′] =∑k∈Z

g[k]f [2n′ − k] (C.27)

flow[n′] =∑k∈Z

h[k]f [2n′ − k] (C.28)

gdzie n′ przebiega od 1 do n2 .

Składniki fhigh[n′] stanowia juz gotowe współczynniki rozkładu funkcjif na najwyzszym poziomie dokładnosci. Do składników flow[n′] stosujemypodany algorytm ponownie.

C.9 Praktyczne aspekty transformaty falkowej

Pierwszym krokiem jest wybranie falki‡ oraz stopnia dekompozycji (czyliilosci poziomów czestotliwosci falek††).

†Dokładniej: h[n] oznacza n-ty czynnik w ciagu definiujacym ten filtr.‡W [62] zawarto liste falek i ich własnosci i która moze stanowic dobry poczatek w tym

wyborze.††Na rysunku C.3c podano przykład transformaty falkowej dla stopnia dekompozycji rów-

nego 4.

Rysunek C.4: Przykłady funkcji falkowych — falka DB16

0 5 10 15 20 25 30 35−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

0.8

1

(a) Falka DB16

0 5 10 15 20 25 30 35−0.5

0

0.5

1

(b) Funkcja skalujaca dla falki DB16

Page 103: Mgr

DODATEK C. DYSKRETNA TRANSFORMATA FALKOWA 96

Wybór stopnia dekompozycji

W naszym przypadku wybór stopnia dekompozycji jest ograniczony ilosciadostepnych punktów pomiarowych. Dla dziesiecioletniej historii pomiarówprzy 90% uzysku danych mamy ok 3100 punktów pomiarowych. P kazdymkolejnym kroku falka ma dwa razy mniejszy nosnik — łatwo zauwazyc zeprzy tej ilosci punktów przy 13 falkach nosnik najmniejszej funkcji bedziemniejszy niz pojedynczy punkt. Wiemy równiez ze falki nie ’startuja’ z ca-łego zakresu†, wreszcie dziesiecioletnia historia pomiarów to, w polskichwarunkach, wariant bardzo optymistyczny — w praktyce pracujemy rów-niez na danych rocznych.

W praktyce wiec bedziemy stosowac rozkład na 5 — 6 falek.

†Mówiac formalniej: nosniki najwiekszej falki jest mniejszy od całego zakresu danych.

Page 104: Mgr

Dodatek D

Teksty cytatów w tłumaczeniuwłasnym w jezyku oryginału

D.1 Cytaty z rozdziału pierwszego

Cytat ze strony 4

The body of evidence on health effects of PM at levels cur-rently common in Europe has strengthened considerably overthe past few years. Both epidemiological and toxicological evi-dence has contributed to this strengthening; the latter providesnew insights into possible mechanisms for the hazardous effectsof air pollutants on human health and complements the largebody of epidemiological evidence. The evi- dence is sufficientto strongly recommend further policy action to reduce levels ofPM. It is reasonable to assume that a reduction in air pollutionwill lead to considerable health benefits. [6]

Cytat ze strony 6

According to RAINS model estimates, cur- rent exposure toPM from anthropogenic sources leads to the loss of 8.6 monthsof life expectancy in Europe. The impacts vary from around 3months in Finland to more than 13 months in Belgium.

The total number of premature deaths attributed to expo-sure amounts to around 348 000 annually in the EU (25 coun-tries).

Apart from effects on mortality, some 100 000 hospital ad-missions per year can be attributed to exposure. Several other

97

Page 105: Mgr

DODATEK D. TEKSTY CYTATÓW W TŁUMACZENIU WŁASNYM WJEZYKU ORYGINAŁU 98

impacts on morbidity are also expected to occur but the existingdatabase is weak, affecting the precision and reliability of theestimates.

Current legislation related to the emission of pollutants isexpected to reduce impacts by around one third. A further re-duction, down to around 50% of those estimated for current pol-lution levels, could be achieved by implementing all currentlyfeasible emission reduction measures (the maximum feasiblereduction (MFR) scenario).[10]

D.2 Cytaty z rozdziału drugiego

Cytat ze strony 18[35]

A schematic description of a system, theory, or phenomenonthat accounts for its known or inferred properties and may beused for further study of its characteristics: a model of genera-tive grammar; a model of an atom; an economic model.

D.3 Cytaty z dodatków

Oryginalny tekst cytatu ze strony 69

The fastest neuron switching times are known to be on theorder of 10−3seconds — quite slow compared to computer switch-ing speeds of 10−10. Yet humans are able to make surpris-ingly complex decisions, surprisingly quickly. For example, itrequires approximately 10−1 seconds to visually recognize yourmother. Notice that sequence of neuron firings that can takeplace during this 10−1second interval cannot be possibly longerthat few hundred steps, given the switching speed of single neu-rons. This observation has led many to speculate that the infor-mation processing abilities of biological neural systems mustfollow from highly parallel processed operating on representa-tions that are distributed on many neurons. One motivation forANN systems is to capture this kind of highly parallel compu-tation based on distributed representations.[45]

Page 106: Mgr

Dodatek E

Słownik terminówinformatycznych

Wszystkie okreslenia cytowane sa za Wikipedia. Autor pozwolił sobie nauzycie tego zródła tutaj poniewaz:

• Informacje te nie dotycza głównej tresci pracy, a jedynie wyjasniajainformatyczne pojecia uzywane w tym rozdziale.

• Autor uznaje, ze jest w stanie sam zweryfikowac poprawnosc tychartykułów w encyklopedii.

API (z ang Application Interface) scisle okreslony zestaw reguł, za po-moca którego programy sie komunikuja.

framework (z ang. rusztowanie) framework jest szkieletem do budowyaplikacji. Definiuje on strukture aplikacji oraz ogólny mechanizm jejdziałania, a takze dostarcza zestaw komponentów i bibliotek ogól-nego przeznaczenia do wykonywania poszczególnych zadan.

ORM (z ang. Object Relational Mapping — odwzorowywanie obiektów narelacje) to sposób odwzorowywania danych miedzy systemem napi-sanym w jezyku programowania orientowanym obiektowo, oraz rela-cyjna baza danych

JAVA Współczesny, wieloplatformowy, jezyk programowania.

JRE (z ang Java Runtime Enviorment) srodowisko uruchomieniowe pro-gramów napisanych w jezyku Java, składajace sie z maszyny wirtu-alnej oraz obszernej biblioteki klas

99

Page 107: Mgr

DODATEK E. SŁOWNIK TERMINÓW INFORMATYCZNYCH 100

JDBC (z ang Java Database connectivity) niskopoziomowe API pozwa-lajace na łaczenie sie z bazami danych z programów napisanych wjezyku Java. API to jest standardowa czescia JRE.

JPA (z ang. Java Persistence API) wysokopoziomowe API pozwalajacena łaczenie sie z bazami danych. Zapewnia ono ORM. API to jeststandardowa czescia JRE[82].

XML (z ang Extensible Markup Language) rozszerzalny format danych,który ma dobre metody integracji z wiekszoscia współczesnych jezy-ków

JAXB (z ang Java architecture for XML binding) wysokopoziomowe APIpozwalajace na przetwarzanie danych w formacie XML z poziomuprogramu Java

DBMS (z ang. database management system — system zarzadzajacy ba-zami danych) to program umozliwiajacy innym programom dostep dodanych i ich modyfikacje.[73]

SQL (z ang. structured query language — strukturalny jezyk zapytan)jezyk pozwalajacy tworzyc zapytania, które pobieraja dane z bazy da-nych, modyfikuja dane w niej zawarte oraz zmieniaja jej strukture[74]

schemat bazy danych opis systemu bazodanowego w formalnym jezykuwspieranym przez konkretny DBMS, który okresla sposób organiza-cji danych, wiezy spójnosci itp.[71]

kwerenda (inaczej zapytanie) precyzyjne okreslenie zestawu danych jakima zostac pobrany

klucz główny pojecie z zakresu baz danych. Oznacza minimalna infor-macje na temat wiersza danej tabeli która jednoznacznie ów wiers

normalizacja bazy danych Celem normalizacji bazy danych jest mini-malizowanie redundancji (nadmiarowosci) informacji czyli likwido-wanie sytuacji, w których albo ta sama informacja przechowywanajest w wielu miejscach, jak równiez minimalizowanie ilosci informa-cji, które od siebie współzaleza.

logika aplikacji (synonimicznie: logika biznesowa†) zestaw zachowan,które powoduja, ze aplikacja realizuje swoje zadania (w przypadkuaplikacji biznesowej jest to realizacja odpowiednich zadan w firmie;

†Po angielsku spotyka sie tez termin domain logic

Page 108: Mgr

DODATEK E. SŁOWNIK TERMINÓW INFORMATYCZNYCH 101

w naszym przypadku beda to zachowania powodujace, ze baza da-nych bedzie spełniac wymagania opisane w 4.1). [75, 76]

funkcja skrótu Jest to matematyczna funkcja, która dowolnie długa liczbe†

przetwarza na liczbe stałej długosci zwana skrótem[77, 78]. Funkcjeskrótu maja nastepujace własciwosci:

• pseudolosowosc: Mała zmiana w wartosci oryginalnej powo-duje duza zmiane w skrócie jej przypisanej.

• jednorodnosc: Dla rozsadnego‡ zbioru liczb wejsciowych ichskróty beda tworzyły rozkład jednorodny.

metadane Dane opisujace dane — ich pochodzenie, kontekst, zawartosc.[80]

index W bazach danych jest to metoda przyspieszajaca wykonywanie kwe-rend działajacych na jakiejs kolumnie (lub zestawie kolumn) kosztemzwolnionego zapisu do tej kolumny oraz zwiekszenia ilosci informacjiprzechowywanych na dysku.

widok danych (inaczej nazywany równiez perspektywa) Jest to wirtu-alna tabela, której wartosci wyliczane sa na biezaco z zawartosci in-nych tabel w bazie danych. [79]

†A zatem w dowolny rodzaj danych.‡W scisłym, matematycznym, sensie zawsze da sie tak wybrac dane wejsciowe, by warto-

sci skrótów tych danych miały nierównomierny rozkład. Jednak wymaga sie, by dla prawdzi-wych danych, na jakich dana funkcja skrótu ma pracowac rozkład ten był równomierny.

Page 109: Mgr

Dodatek F

Zawartosc płyty iuruchomienie projektu

F.1 Zawartosc płyty

Płyta zawiera nastepujace katalogi:

hajmon Główny projekt Java, zawierajacy główne elementy systemu do-stepne z poziomu jezyka Matlab.

hajmon-importer Projekt zawierajacy kod importujacy dane z poszcze-gólnych zródeł.

hajmon-mysql Schemat bazy danych.

hajmon-matlab Projekt matlaba.

praca-mgr Elektroniczna wersja pracy magisterskiej.

F.2 Uruchomienie projektu

Kompilacja kodu Java

Wszystkie projekty budowane sa za pomoca systemu budowania Maven.Wszystkie współczesne IDE Java zawieraja wtyczki obsługujace ten sys-tem.

By zbudowac ten konkretny projekt nalezy bedac w jego katalogu głów-nym wpisac polecenie mvn install. By zbudowac projekt hajmon nalezywykonac nastepujace polecenia:

cd hajmon

mvn install

102

Page 110: Mgr

DODATEK F. ZAWARTOSC PŁYTY I URUCHOMIENIE PROJEKTU103

By zbudowac projekt hajmon-importer nalezy najpierw zbudowac pro-jekt hajmon.

Uruchomienie bazy danych

Tworzenie podstawowego schematu bazy danych

Podstawowy schemat bazy danych tworzony jest przez projekt hajmon. Bygo stworzyc nalezy:

• w pliku hajmon/hajmondb-beans/src/main/resources/META-INF/

persistence.xml ustawic odpowiednie dane dostepowe do bazy da-nych,

• wykonac jakakolwiek czynnosc która spowoduje ze kod Java otworzypołaczenie do bazy danych (np. wykonac jakies zapytanie z poziomuMatlaba).

Stworzenie tabel usrednionych

By stworzyc tabele zawierajace usrednione dane nalezy wykonac skryptadd-to-schema.sql z katalogu hajmon-matlab.

Uruchomienie projektu matlaba

By uruchomic projekt matlaba nalezy dodac do sciezki classpath Matlabaplik entrypoint-1.0-jar-with-dependencies.jar, który znajduje siew katalogu głównym projektu.

Plik ten mozna stworzyc uruchamiajac polecenie:

cd hajmon

mvn install assembly:single

po wykonaniu tej sekwencji polecen plik ten bedzie sie znajdowac w kata-logu hajmon/target.

Page 111: Mgr

Bibliografia

[1] C A Pope 3rd: “Epidemiology of fine particulateair pollution and human health: biologic mechani-sms and who’s at risk?”; W: Enviormental HealthPerspectives [online]; Nr. 108 Sierpien 2000 str 713-723 [dostep 22 kwietnia 2011]; Dostepny w internecie:http://www.ncbi.nlm.nih.gov/pmc/articles/PMC1637679/†.

[2] Tamze str. 715

[3] Tamze str. 714 – 715

[4] C A Pope, 3rd, D V Bates oraz M E Raizenne, “He-alth effects of particulate air pollution: time forreassessment?”; W: Enviormental Health Perspecti-ves [online]; Nr. 103(5) Maj 1995 str 473-480 [do-step 22 kwietnia 2011]; Dostepny w internecie:http://www.ncbi.nlm.nih.gov/pmc/articles/PMC1523269/‡

[5] Joint WHO / Convention Task Force on the HealthAspects of Air Pollution: “Health risks of particulatematter from long-range transboundary air pollution”[online]; WHO Europe 2006 [dostep z 15 marca 2011];Dostepny w Internecie: http://www.euro.who.int/en/what-we-do/health-topics/environmental-health/air-quality/publications/pre2009/health-risks-of-particulate-matter-from-long-range-transboundary-air-pollution††

[6] Tamze str. 11

[7] Tamze str. 15

†Skrócony link: http://tinyurl.com/ehp-epid‡Skrócony link: http://tinyurl.com/pm10-health††Mozna sie tez otworzyc ten dokument za pomoca skróconego URL: http://tinyurl.

com/who-transbound.

104

Page 112: Mgr

BIBLIOGRAFIA 105

[8] Tamze str. 17

[9] Tamze str. 12 – 15

[10] Tamze str. 89

[11] Tamze rozdział 5.3 str. 44 – 49

[12] Tamze str. 46

[13] Tamze str. 51

[14] Parlament Europejski i rada Unii Europejskiej; “Dy-rektywa Parlametu Europejskiego i Rady Europy2008/50/WE z dnia 21 maja 2008 r. w sprawie jakoscipowietrza i czystszego powietrza dla Europy” [dostepz dnia 12 lutego 2011] W: Dziennik Urzedowy L 152, 11/06/2008 P. 0001 - 0044; Dostepny w Internecie:http://eur-lex.europa.eu/LexUriServ/LexUriServ.do?uri=OJ:L:2008:152:0001:0044:PL:PDF†.

[15] Tamze artykuł 1 dyrektywy; strona 152/3

[16] Tamze artykuł 2 dyrektywy; strona 152/3 — 152/6

[17] Tamze załacznik I; strona 152/14

[18] Tamze; punkt 11 na stronie 152/2

[19] Aneta Duda: „Zastosowanie modelu numerycznego do ana-lizy rozprzestrzeniania sie zanieczyszczen w Lublinie“; Po-stepy Nauki i Techniki nr 2; str. 62 — 70; 2001

[20] Ü. A. Sahin, C. Bayat, and O. N. Uçan: “Application of cel-lular neural network (CNN) to the prediction of missing airpollutant data”; Atmospheric Research, vol. 101, no. 1-2, pp.314-326, Mar. 2011.

[21] L. Osródka, M. Wojtylak, E. Krajny, and K. Klejnowski:“Proposal method of estimation PM2.5 concenrtaion on basemeasurements PM10 for application in short-range air qu-ality forecast in gornoslaska agglomeration,” in Ochrona po-wietrza w teorii i praktyce Vol. 2, vol. II, J. Konieczynski,Ed. Instytut Podstaw Inzynierii Srodowiska PAN w Zabrzu,2008, pp. 115-122.

†Link skrócony tinyurl.com/eu-pm10

Page 113: Mgr

BIBLIOGRAFIA 106

[22] J. H. García, W.-W. Li, N. Cárdenas, R. Arimoto, J. Wal-ton, and D. Trujillo, “Determination of PM2.5 sources usingtime-resolved integrated source and receptor models.,” Che-mosphere, vol. 65, no. 11, pp. 2018-27, Dec. 2006.

[23] Norma PN-ISO 7708: „Jakosc powietrza. Definicje frakcjipyłu stosowane przy pobieraniu próbek do oceny zagrozeniazdrowia.

[24] Autorzy Wikipedii; Hasło: "Particulate" [on-line],; W: Wikipedia, The Free Encyclopedia [do-step 15 marca 2011] Dostepny w Internecie:http://en.wikipedia.org/w/index.php?title=Particulate&oldid=405969186†.

[25] Sekretariat traktatu LRTAP; „Non-compliance bySpain with the Protocol on Volatile Organic Com-pounds or their Transboudary Fluxes to the Co-nvention on Long-range Transboundary Air Pollu-tion [dostep 8 sierpnia 2011]“; dostepny w Interneciehttp://live.unece.org/fileadmin/DAM/env/lrtap/ExecutiveBody/CLRTAP%20Spain%20Violation%20of%20VOC%20Protocol.edited.ae.pdf.

[26] Tekst traktatu o transgranicznym przenoszeniu za-nieczyszczen powietrza na dalekie odległosci [on-line]; Ekonomiczna Komisja ONZ dla Europy [do-step z dnia 23 kwietnia 2011]; Dostepny w Interneciehttp://www.unece.org/env/lrtap/full%20text/1979.CLRTAP.e.pdf‡

[27] Protokoły do traktatu o transgranicznym przenosze-niu zanieczyszczen powietrza na dalekie odległosci [on-line]; Ekonomiczna Komisja ONZ dla Europy; [do-step z dnia 23 kwietnia 2011]; Dostepny w interneciehttp://www.unece.org/env/lrtap/status/lrtap_s.htm††

[28] Parlament Europejski i rada Unii Europejskiej; “Dy-rektywa 2004/107/WE Parlamentu Europejskiego iRady z dnia 15 grudnia 2004 r. w sprawie arsenu,

†Link skrócony: http://tinyurl.com/wiki-particulate‡Skrócony link: http://tinyurl.com/emep-lrtap††Skrócony link: http://tinyurl.com/emep-lrtap

Page 114: Mgr

BIBLIOGRAFIA 107

kadmu, rteci, niklu i wielopierscieniowych weglo-wodorów aromatycznych w otaczajacym powietrzu”;W: Dz.U. L 23 z 26.1.2005, str. 3–16 [dostep z dnia15 marca 2011]; Dostepny w Internecie: http://eur-lex.europa.eu/LexUriServ/LexUriServ.do?uri=CELEX:32004L0107:PL:NOT†

[29] K. Siwek, S. Osowski, and M. Sowinski: “Neural PredictorEnsemble for accurate forecasting of PM10 pollution”; w In-ternational Joint conference on Neural Networks, 2010.

[30] M. Tainio et al., “Uncertainty in health risks due to anth-ropogenic primary fine particulate matter from different so-urce types in Finland,” Atmospheric Environment, vol. 44,no. 17, pp. 2125-2132, Jun. 2010.

[31] J. Hooyberghs, C. Mensink, G. Dumont, F. Fierens, and O.Brasseur: “A neural network forecast for daily average PMconcentrations in Belgium”; Atmospheric Environment, vol.39, no. 18, pp. 3279-3289, Jun. 2005.

[32] Strona internetowa Slaskiego Wojewodzkiego InspektoratuOchrony Srodowiska; http://spjp.katowice.pios.gov.pl/; Do-step z dnia 16-01-2011r

[33] Strona internetowa Slaskiego Wojewodz-kiego Inspektoratu Ochrony Srodowiska;http://spjp.katowice.pios.gov.pl/model_prognozy_jakosci_powietrza.aspx; Dostep z dnia 16-01-2011r

[34] Strona internetowa fundacji ARMAAG ;http://armaag.gda.pl/indeks_jakosci_powietrza/prognoza.htm;Dostep z dnia 16-01-2011r

[35] The Free Dictionary: „Model“ [18 sierpnia 2011];http://www.thefreedictionary.com/model

[36] Norma BS EN 12341:1999: „Air quality. Determination ofthe PM10 fraction of suspended particulate matter. Refe-rence method and field test procedure to demonstrate re-ference equivalence of measurement methods“

†Skrócony link: http://tinyurl.com/eu-arsen

Page 115: Mgr

BIBLIOGRAFIA 108

[37] Norma PN-EN 12341: „Jakosc powietrza. Oznaczanie frak-cji PM10 pyłu zawieszonego. Metoda odniesienia i procedurabadania terenowego do wykazania równowaznosci metodypomiarowej z metoda odniesienia“

[38] Andrew S. Brown, Rachel E. Yardley, Paul G. Quin-cey and David M. Butterfield: „NPL REPORT DQL-AS 015 Ambient Air Particulate Matter: Quantify-ing Errors in Gravimetric Measurements“ [online]; Sty-czen 2005; ISSN 1744-0602; Dostepny w Internecie:http://publications.npl.co.uk/npl_web/pdf/dql_as15.pdf; Do-step z dnia 14 maja 2011

[39] Paul Quincey: „Issues with »reference« PM and PM2.5 mo-nitoring methods“; Konferencja IAPSC†; 11 grudnia 2008

[40] David Butterfield, Paul Quincey: „Measurement science is-sues relating to PM10 and PM2.5 airborne particle“ [do-ste 20 sierpnia 2011], Raport NPL; Dostepny w Internecie:http://publications.npl.co.uk/npl_web/pdf/as15.pdf

[41] Peter H. McMurry: “A review of atmospheric aerosol me-asurements“; Atmospheric Environment; Volume 34; Issues12-14; 2000; Pages 1959-1999; ISSN 1352-2310;

[42] David Gobeli, Herbert Schloesser, Thomas Pottber: „MetOne Instruments BAM-1020 Beta Attenuation Mass Moni-tor US-EPA PM2.5 Federal Equivalent Method Field TestResults“; Met One Instruments Incorporated

[43] David C. Green, Gary W. Fuller, Timothy Baker: „Deve-lopment and validation of the volatile correction model forPM10 - An empirical method for adjusting TEOM measu-rements for their loss of volatile particulate matter“; Atmo-spheric Environment; Volume 43; Issue 13; April 2009; Pa-ges 2132-2141; ISSN 1352-2310

[44] Chih-Wei Hsu, Chih-Chung Chang, and Chih-Jen Lin: „APractical Guide to Support Vector Classication“ [online];http://www.csie.ntu.edu.tw/∼cjlin/papers/guide/guide.pdf;Dostep z dnia 8 maja 2011;

†Uwaga! Konferencja ta zawiera nierecenzowane materiały, jednak wiekszosc wnioskówz tej prezentacji pokrywa sie z [40].

Page 116: Mgr

BIBLIOGRAFIA 109

[45] Tom M. Mitchell: “Machine Learning”; McGraw Hill. 1997ISBN 0–07–042807–7

[46] Stanisław Osowski: “Sieci neuronowe do przetwarzania in-formacji” wydanie II; Oficyna wydawnicza Politechniki War-szawskiej 2006; ISBN 87–7207–615–4

[47] Tamze, str. 85 – 87.

[48] Tamze, rozdział 4.1 – 4.5

[49] Tamze, rozdział 6

[50] Tamze, str. 317

[51] Robert Kosinski: „Sztuczne sieci neuronowe“; WNT 2009;ISBN 8320429838

[52] Kurt Hornik: „Approximation capabilities of multilayer fe-edforward networks“; Neural Networks, Volume 4, Issue 2,1991, Pages 251-257, ISSN 0893-6080,

[53] Vera Kurkova, Kolmogorov’s theorem and multilayer neuralnetworks, Neural Networks, Volume 5, Issue 3, 1992, Pages501-506, ISSN 0893-6080,

[54] Franco Scarselli, Ah Chung Tsoi, Universal Approxima-tion Using Feedforward Neural Networks: A Survey ofSome Existing Methods, and Some New Results, Neural Ne-tworks, Volume 11, Issue 1, 12 January 1998, Pages 15-37,ISSN 0893-6080,

[55] Kurkova, V., 1992. , Kolmogorov’s theorem and multilayerneural networks. Neural Networks 5, pp.

[56] Kurt Hornik, Maxwell Stinchcombe, Halber White: „Multi-layer Feedforward Networks are Universal Approximators”;Neural Networks, vol 2 1989; ISSN: 0893-6080

[57] Mallat S: „A Wavelet Tour of Signal Processing: The SparseWay“; 2009; ISBN: 978-0-12-374370-1; str. 102;

[58] Tamze; Rozdział 7.1.1; str. 264 i nastepne

[59] Graps, A.: "An introduction to wavelets" W: ComputationalScience & Engineering IEEE; Vol.2, No.2 [Lato 1995] Strony50–61

Page 117: Mgr

BIBLIOGRAFIA 110

[60] Gargour C., Gabrea M., Ramachandran V., Lina, J.-M. : "Ashort introduction to wavelets and their applications" W:„Circuits and Systems Magazine IEEE“; Vol.9, No.2 [Drugikwartał 2009]; Strony: 57–68

[61] Mallat, S.G: "A theory for multiresolution signal decompo-sition: the wavelet representation" W: „Pattern Analysisand Machine Intelligence, IEEE Transactions on“ [Czerwiec1989]; Vol.11, No.7; str: 674-693; ISSN: 0162-8828

[62] Wavelet Browser by pyWawelets [online]; [dostep: 8 maja2011]; strona internetowa: http://wavelets.pybytes.com/

[63] Wavelet Tutorial [online]; [online]; [do-step: 8 maja 2011]; strona internetowa:http://users.rowan.edu/∼polikar/WAVELETS/WTtutorial.html

[64] Strona internetowa „The atmospheric studies group“;http://www.src.com/calpuff/calpuff1.htm; Dostep z dnia 16-01-2011r

[65] Andrew Moore: „Tutorial slides, Support Vector Machi-nes“ [dostep: 17 sierpnia 2008]; Dostepny w internecie:http://www.autonlab.org/tutorials/svm.html;

[66] Neep Hazarika, Jean Zhu Chen, Ah Chung Tsoi, Alex Serge-jew: „Classification of EEG signals using the wavelet trans-form“ W: „Signal Processing“; Vol. 59, Issue 1 [Maj 1997];strony 61–72

[67] Twórcy Wikipedii: „API“ [online];http://en.wikipedia.org/w/index.php?title=Application_programming_interface&oldid=428037577; Dostep z dnia26 kwietnia 2011

[68] Twórcy Wikipedii: „Mapowa-nie obiektowo-relacyjne“ [online];http://pl.wikipedia.org/w/index.php?title=Mapowanie_obiektowo-relacyjne&oldid=26375247; Dostep z dnia 26kwietnia 2011

[69] Twórcy Wikipedii: „JRE“ [online];http://pl.wikipedia.org/wiki/JRE; Dostep z dnia 26 kwietnia2011

Page 118: Mgr

BIBLIOGRAFIA 111

[70] Twórcy Wikipedii: „Framework“ [online];http://pl.wikipedia.org/w/index.php?title=Framework&oldid=25332682; Dostep z dnia 26 kwietnia 2011

[71] Twórcy Wikipedii: „Database schema“ [online];http://en.wikipedia.org/w/index.php?title=Database_schema&oldid=426024081; Dostep z dnia 26 kwietnia 2011

[72] Twórcy Wikipedii: „Database normalization“ [online];http://en.wikipedia.org/w/index.php?title=Database_ nor-malization&oldid=426729978; Dostep z dnia 8 maja 2011

[73] Twórcy wikipedii: „DatabaseManagement System“ [online];http://en.wikipedia.org/w/index.php?title=Database_management_system&oldid=426211233; Dostep z dnia 27kwietnia 2011

[74] Twórcy Wikipedii: „SQL“ [online];http://pl.wikipedia.org/w/index.php?title=SQL &ol-did=25953531; Dostep z dnia 1 maja 2011

[75] Twórcy Wikipedii: „Business logic“ [online];http://en.wikipedia.org/w/index.php?title=Business_logic&oldid=426360725; Dostep z dnia 1 maja 2011

[76] Twórcy Wikipedii: „Business logic layer“ [online];http://en.wikipedia.org/w/index.php?title=Business_logic_layer&oldid=403860234; Dostep z dnia 1 maja 2011

[77] Twórcy Wikipedii: „Funkcja skrótu“ [online];http://pl.wikipedia.org/w/index.php?title=Specjalna: Cy-tuj&page=Funkcja_skr%C3%B3tu &id=26224368; Dostep zdnia 1 maja 2011

[78] Twórcy Wikipedii: „Hash function“ [online];http://en.wikipedia.org/w/index.php?title=Hash_function&oldid=423702053; Dostep z dnia 1 maja 2011

[79] Twórcy Wikipedii: „View (data base)“ [online];http://en.wikipedia.org/w/index.php?title=View_(database)&oldid=425704227; Dostep z dnia 1 maja 2011

[80] Twórcy Wikipedii: „Metadata“ [online];http://en.wikipedia.org/w/index.php?title=Metadata &ol-did=426712501; Dostep z dnia 1 maja 2011

Page 119: Mgr

BIBLIOGRAFIA 112

[81] Twórcy Wikipedii: „Index“ [online];http://en.wikipedia.org/wiki/Index_(database); Dostep zdnia 1 maja 2011

[82] Bill Burke, Richard Monson–Hafel: „Enterprise JavaBeans3.0“; Helion 2007; ISBN 879-83-246-0726-6; Strony: 100 –101

[83] Ed Ort, Bhakti Mehta: „Java Architec-ture for XML Binding (JAXB)“ [online];http://www.oracle.com/technetwork/articles/javase/index-140168.html#introjb; Dostep z dnia 8 maja 2011;s

[84] W. S. McCulloch, W. H. Pitts: “A logical calculus of ideas im-manent in nervous activity”; Bulletin of Mathematical Bio-physics, vol 5 1945; ISSN: 0007-4985

[85] Konrad Garanty: „Zastosowanie sieci neuronowych do pre-dykcji zanieczyszczen atmosferycznych“; praca magisterskana Wydziale Elektrycznym Politechniki Warszawskiejp

Page 120: Mgr

Lista ilustracji

1.1 Zaleznosc wzrostu smiertelnosci przy wzroscie stezenia PM10 o10 µgm3 od sredniego stezenia PM10.[7] Wykres ten obrazuje faktistnienia w przyblizeniu liniowej zaleznosci miedzy stezeniempyłów zawieszonych a ich skutkami zdrowotnymi. . . . . . . . . 5

1.2 Skrócenie sredniej długosci zycia spowodowane ekspozycja po-pulacji na produkowany przez człowieka pył zawieszony. . . . . 7

2.1 Korelacje pomiarów i wyników modelu EMEP . . . . . . . . . . 162.2 Porównanie wyników modelu EMEP z poziomami zanieczyszczen[11] 16

4.1 Schemat systemu modelowania zanieczyszczen . . . . . . . . . 304.2 Przepływ danych w systemie . . . . . . . . . . . . . . . . . . . . 314.3 Zaleznosci programistyczne w systemie . . . . . . . . . . . . . . 324.4 Jezyki w jakich wykonano poszczególne komponenty systemu.

Na szaro czesci nie zaimplementowane. . . . . . . . . . . . . . . 334.5 Tabele opisujace dane słownikowe . . . . . . . . . . . . . . . . . 344.6 Schemat tabeli DATA_POINT . . . . . . . . . . . . . . . . . . . 364.7 Tabele i widoki przechowujace dane usrednione . . . . . . . . . 364.8 Schemat tabeli POINT_TYPE_META_DATA . . . . . . . . . . . . . 374.9 Schemat tabel przechowujacych dane znormalizowane . . . . . 374.10 Schemat klas słuzacych do modelowania danych . . . . . . . . . 444.11 Klasy managerów . . . . . . . . . . . . . . . . . . . . . . . . . . . 454.12 Manager bazy danych . . . . . . . . . . . . . . . . . . . . . . . . 454.13 Schemat klas udostepniajacych parametryzowane zapytania SQL.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 464.14 Schemat wykonywania zapytania . . . . . . . . . . . . . . . . . 474.15 Schemat blokowy pojedynczej iteracji trenowania i walidacji pre-

dyktor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

5.1 Schemat modelu ekstrapolujacego . . . . . . . . . . . . . . . . . 555.2 Połozenie stacji bioracych udział w ekstrapolacji . . . . . . . . . 58

113

Page 121: Mgr

5.3 Sredni bład wyznaczania srednich dziennych dla wybranych mo-deli ekstrapolujacych (dane pomiarowe z lat 2009 – 2010). . . . 59

5.4 Porównanie dokładnosci wyznaczenia sredniej z całego okresuprzy uzyciu modeli ekstrapolujacych i przy uzyciu samych tylkodanych wskaznikowych dla dwóch wybranych modeli (dane po-miarowe z lat 2009 – 2010). . . . . . . . . . . . . . . . . . . . . . 60

5.5 Porównanie błedu w wyznaczeniu ilosci przekroczen z uzyciemmodeli ekstrapolujacych i samych tylko danych wskaznikowych.Modele pracowały na danych z lat 2009 – 2010. . . . . . . . . . 60

5.6 Porównanie zmierzonych i modelowanych poziomów PM10 dlamodelu Ursynów dwa dla czterech kolejnych miesiecy (miesiacete zostały wybrane ze wzgledu na podobny do całego zbioru da-nych MAPE) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

B.1 Symboliczny schemat neuronu . . . . . . . . . . . . . . . . . . . 72B.2 Przykłady funkcji sigmoidalnej dla róznych wartosci parame-

trów β . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73B.3 Przykłady funkcji Gaussa dla róznych wartosci parametru a . . 73B.4 Siec z układem wstepnie przetwarzajacym dane. . . . . . . . . . 78B.5 Margines separacji . . . . . . . . . . . . . . . . . . . . . . . . . . 81

C.1 Przykład ciagłej transformaty falkowej . . . . . . . . . . . . . . 89C.2 Podział przestrzeni czasu i czestotliwosci na poszczególne funk-

cje bazowe w dyskretnych transformatach . . . . . . . . . . . . 92C.3 Przykłady falek — falka Haara . . . . . . . . . . . . . . . . . . . 94C.4 Przykłady funkcji falkowych — falka DB16 . . . . . . . . . . . . 95

Lista tabel

1.1 Wzrost zgonów podzielony na szerokie kategorie medyczne spo-wodowany wzrostem stezenia PM2,5 o 50 µgm3 (na podstawie sze-regu badan przeprowadzonych na przykładach okresów podwyz-szonych stezen zanieczyszczen w XX wieku w USA).[1] . . . . . 5

114

Page 122: Mgr

LISTA TABEL 115

2.1 Korelacje miedzy danymi pomiarowymi a wynikami modelu[12] 152.2 Systematyczne niedoszacowanie poziomów zanieczyszczen w mo-

delu EMEP[6] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

5.1 Stworzone modele dokonujace ekstrapolacji . . . . . . . . . . . 57

Page 123: Mgr

Lista algorytmów

4.1 Pojedyncza iteracja trenowania i walidacji predyktora . . . . 514.2 Pełny algorytm trenowania i predykcji . . . . . . . . . . . . 51B.1 Deklaracja funkcji wydajnosci sieci . . . . . . . . . . . . . . . 75

116

Page 124: Mgr

Listingi kodu

4.1 Przykład prostego zapytania zapisanego w pliku XML . . . . 414.2 Przykład prostego zapytania zapisanego w pliku XML . . . . 42

117

Page 125: Mgr

Indeks

zródło danychdefinicja, 28

2008/50/WEseedyrektywa 2008/50/WE, 67

analityczne modele, Porównaj CTManaliza falkowa, 87–96

funkcja skalujaca, 94

baza danych, 28–29, 34–39schemat, 34wymagania, 28

cechadefinicja, 64

celu funkcja, Porównaj funkcja celuCTM, 12

definicja, 64

dane pomiarowenormalizacja, 36usrednianie, 36

dane usredniane, 36DBMS, Porównaj baza danych

definicja, 100normalizacja, 34schemat, Porównaj schemat

bazy danychspójnosc danych, 34

dolny próg oszacowania, 67dopuszczalna wartosc, Porównaj

wartosc dopuszczalna

dyrektywa 2008/50/WE, 67Dyskretna transformata falkowa,

Porównaj analiza falkowa

EMEP, 13dokładnosc, 15Model, 13–15Program, 13

emisyjne modele, 15

funkcjacelu, 75–76Heaviside’a, 71jadra, 85sigmoidalna, 72signum, 71skrótu, 35

definicja, 101funkcja haszujaca, Porównaj funk-

cja skrótu

górny próg oszacowania, 67

Hornik, 74

instancja danych wejsciowychdefinicja, 64

klucz główny, 100

legislacja, Porównaj dyrektywa 2008/50/WElogika aplikacji

definicja, 101

118

Page 126: Mgr

INDEKS 119

LRTAP, 14

MAE, 75MAPE, 76MD5, 35metaparametr modelu, Porównaj

modelMLP, 72

definicja, 65struktura, 72

modelCTM, Porównaj CTMdefinicja, 65EMEP, 13–15metaparametr modelu, 65modele emisyjne, 15modele oparte o eksploracje

danych, 15parametr modelu, 65RAINS, 6

modelowanie, 12

neuron, 71funkcja aktywacji, 71

normalizacja danych, 36, 37

ograniczenie emisji, 6

parametr modelu, Porównaj mo-del

perceptron, Porównaj MLP, 71, Po-równaj MLP

perspektywa, 101PM, 2

definicja, 65ograniczenie emisji, 6wpływ zdrowotny, 2–6

smiertelnosc, 4oddziaływania długotermi-

nowe, 4oddziaływania krótkotermi-

nowe, 4

wnioski z badan, 3pomiary

stałe, 67wskaznikowe, 9, 67

poziom krytyczny, 67poziom zanieczyszczen

definicja, 65próg informowania, 67próg oszacowania, 67predykcja, 12predyktor

definicja, 66przeuczenie, 77punkt rosy, 65Pył zawieszony, Porównaj PM

regulacje prawnedyrektywa 2008/50/WE, 6, 70LRTAP, Porównaj LRTAPTraktat o transgranicznym prze-

noszeniu, Porównaj LRTAPwpływ na modelowanie, 9

schemat bazy danychdefinicja, 100

Sieci Neuronowe, Porównaj SSNsignum Heaviside’a, 71smiertelnosc, 4SQL, 29

definicja, 100kwerenda, 100

SSN, 68cecha, Porównaj cechacechy, 68czas treningu, 69definicja, 66funkcja aktywacji, 71–72funkcja celu, Porównaj funk-

cja celuinstancja, 64neuron, Porównaj Neuron

Page 127: Mgr

INDEKS 120

perceptron, Porównaj MLPprzeuczenie, Porównaj prze-

uczeniestruktura, 72SVM, Porównaj SVMuczenie, 76wagi, 69

SVM, 79–86funkcja jadra, Porównaj funk-

cja jadramargines separacji, 81

Sztuczne Sieci Neuronowe, Porów-naj SSN

temperaturaodczuwalna, 66punktu rosy, Porównaj punkt

rosyTEOM, 25Traktat o transgranicznym prze-

noszeniu zanieczyszczen,Porównaj LRTAP

Transformata Fouriera, 88trening

definicja, 66

Uczenie maszynowe, 68

wartosc dopuszczalna, 67widok, 36

definicja, 101WIOS

definicja, 66