Alfred Stach Instytut Badań Czwartorzędu i Geoekologii UAM Jan Tamulewicz

27
WSTĘPNA OCENA PRZYDATNOŚCI WYBRANYCH ALGORYTMÓW PRZESTRZENNEJ ESTYMACJI MIESIĘCZNYCH I ROCZNYCH SUM OPADÓW NA OBSZARZE POLSKI Alfred Stach Instytut Badań Czwartorzędu i Geoekologii UAM Jan Tamulewicz Instytut Geografii Fizycznej i Kształtowania Środowiska Przyrodniczego UAM

description

WSTĘPNA OCENA PRZYDATNOŚCI WYBRANYCH ALGORYTMÓW PRZESTRZENNEJ ESTYMACJI MIESIĘCZNYCH I ROCZNYCH SUM OPADÓW NA OBSZARZE POLSKI. Alfred Stach Instytut Badań Czwartorzędu i Geoekologii UAM Jan Tamulewicz Instytut Geografii Fizycznej i Kształtowania Środowiska Przyrodniczego UAM. Zarys treści. - PowerPoint PPT Presentation

Transcript of Alfred Stach Instytut Badań Czwartorzędu i Geoekologii UAM Jan Tamulewicz

Page 1: Alfred  Stach Instytut Badań Czwartorzędu i Geoekologii UAM Jan  Tamulewicz

WSTĘPNA OCENA PRZYDATNOŚCI WYBRANYCH ALGORYTMÓWPRZESTRZENNEJ ESTYMACJI MIESIĘCZNYCH I ROCZNYCH

SUM OPADÓWNA OBSZARZE POLSKI

Alfred StachInstytut Badań Czwartorzędu i Geoekologii UAM

Jan TamulewiczInstytut Geografii Fizycznej i Kształtowania Środowiska Przyrodniczego UAM

Page 2: Alfred  Stach Instytut Badań Czwartorzędu i Geoekologii UAM Jan  Tamulewicz

Zarys treści

• Problem

• Cel pracy

• Analizowane dane

• Metody

• Wyniki

• Wnioski

Page 3: Alfred  Stach Instytut Badań Czwartorzędu i Geoekologii UAM Jan  Tamulewicz

Problem

• Precyzyjna estymacja punktowych i obszarowych charakterystyk opadów atmosferycznych jest bardzo istotna zarówno w badaniach naukowych, jak i w różnych aspektach gospodarki wodnej i rolnictwa.

• Powszechna dostępność komputerowych implementacji różnych algorytmów estymacji przestrzennej (=interpolacji) stwarza olbrzymie szanse, ale także liczne obawy. + możliwa jest szybka i obiektywna – w sensie powtarzalności i

niezależności od tzw. doświadczenia badacza – analiza wielkich zbiorów danych

– powszechne stosowanie narzędzi matematyczno-statystycznych bez gruntownej znajomości ich podstaw, zakresu stosowania i ograniczeń

Page 4: Alfred  Stach Instytut Badań Czwartorzędu i Geoekologii UAM Jan  Tamulewicz

Problem cd.

• Żaden algorytm estymacji przestrzennych nie jest uniwersalny. Jego przydatność jest różna, w zależności nie tylko od charakteru zjawiska, którego zmienność przestrzenna jest opracowywana, ale także od zagęszczenia i konfiguracji punktów pomiarowych, błędów samego pomiaru i niedokładności określenia lokalizacji stanowisk pomiarowych.

• Opady atmosferyczne charakteryzują się nieciągłością czasową i przestrzenną oraz sezonową i przestrzenną zmienność mechanizmów je generujących.

Page 5: Alfred  Stach Instytut Badań Czwartorzędu i Geoekologii UAM Jan  Tamulewicz

Problem cd.

• Co rozumiemy pod pojęciem efektywności (przydatności) algorytmu interpolacyjnego?– optymalną estymację w punkcie?

– optymalną estymację dla obszaru?

• Czy estymator jest lepszy kiedy wiernie oddaje oryginalne dane pomiarowe?– Czy rozkład błędów pomiarowych w czasie i przestrzeni

jest losowy?

– A co z nieprecyzyjną informacją o lokalizacji punktów pomiarowych?

Page 6: Alfred  Stach Instytut Badań Czwartorzędu i Geoekologii UAM Jan  Tamulewicz

Problem cd.

• Czy istnieje możliwość podniesienia jakości automatycznej estymacji przestrzennej opadów z wykorzystaniem skorelowanych charakterystyk morfometrycznych rzeźby?

• Niestacjonarność pola opadów – algorytmy globalne kontra lokalne.

Page 7: Alfred  Stach Instytut Badań Czwartorzędu i Geoekologii UAM Jan  Tamulewicz

Cel pracy

• Czy testowane algorytmy z taką sama wiarygodnością estymują sumy roczne i miesięczne?

• Czy w zróżnicowanej efektywności uwzględnionych algorytmów znajduje odbicie sezonowa zmienność struktury przestrzennej pola opadów?

• Które algorytmy są bardziej przydatne do estymacji punktowej, a które dla obszarowej?

• Jaka jest wielkość bezwzględnych i względnych błędów estymacji, i jaki jest ich rozkład geograficzny?

Page 8: Alfred  Stach Instytut Badań Czwartorzędu i Geoekologii UAM Jan  Tamulewicz

Metody

• Wykorzystane algorytmy estymacji przestrzennych:– geostatystyczne (kriging):

• zwykły kriging z globalnym semiwariogramem (OK-gv),• zwykły kriging z lokalnymi semiwariogramami (OK-lv),• prosty kriging ze zmiennymi średnimi lokalnymi i globalnym

semiwariogramem liczonym automatycznie (SKlm-gva),• prosty kriging ze zmiennymi średnimi lokalnymi i globalnym

semiwariogramem dopasowanym „ręcznie” (SKlm-gvm),• prosty kriging ze zmiennymi średnimi lokalnymi i lokalnymi

semiwariogramami (SKlm-lv),

– odwrotności odległości z kwadratowym wykładnikiem potęgowym (ID2),

– „triangulacji” (TIN),– minimalnej krzywizny (MC).

Page 9: Alfred  Stach Instytut Badań Czwartorzędu i Geoekologii UAM Jan  Tamulewicz

Metody

• Algorytmy o charakterze lokalnym: OK-lv, SKlm-lv, ID2, TIN i MC.

• Algorytmy o charakterze globalnym: OK-gv, SKlm-gva, SKlm-gvm.

• Algorytmy uwzględniające dodatkowe dane (wysokość nad poziom morza z cyfrowego modelu rzeźby terenu): SKlm-lv, SKlm-gva, SKlm-gvm.

• Algorytmy nie uwzględniające dodatkowych danych: OK-gv, OK-lv, ID2, TIN i MC.

Page 10: Alfred  Stach Instytut Badań Czwartorzędu i Geoekologii UAM Jan  Tamulewicz

Metody

• Metoda oceny jakości algorytmu interpolacyjnego: jackknifing czyli podział zbioru danych na podzbiory: kalibracyjny i walidacyjny.

• Porównanie estymacji miar centralnych populacji (wartości obszarowych): średniej (x) i mediany (Me).

• Porównanie estymacji miar rozrzutu/rozkładu populacji (wartości obszarowych): odchylenie standardowe (SD), pierwszy i trzeci kwartyl (Q1, Q3), minimum i maksimum (min, maks) skośność (Sk) i kurtoza (K).

• Porównanie estymacji wartości lokalnych: średni błąd (ME), pierwiastek średniego błądu kwadratowego (RMSE), współczynnik korelacji (r).

Page 11: Alfred  Stach Instytut Badań Czwartorzędu i Geoekologii UAM Jan  Tamulewicz

Dane

Rok 1980Suma roczna

200 300 400 500 600 700 800

O dległość [km ]

200

300

400

500

600

700

O pad [m m ]

od 471 do 603 od 603 do 650 od 650 do 694 od 694 do 742 od 742 do 808 od 808 do 924 od 924 do 2242

Rok 1980Suma stycznia

200 300 400 500 600 700 800

O dległość [km ]

200

300

400

500

600

700

O pad [m m ]

od 2 do 12 od 12 do 15 od 15 do 18 od 18 do 21 od 21 do 24 od 24 do 30 od 30 do 104

Rok 1980Suma kwietnia

200 300 400 500 600 700 800

O dległość [km ]

200

300

400

500

600

700

O pad [m m ]

od 19 do 45 od 45 do 54 od 54 do 62 od 62 do 69 od 69 do 77 od 77 do 91 od 91 do 293

200 300 400 500 600 700 800

O dległość [km ]

200

300

400

500

600

700

O pad [m m ]

od 46 do 103 od 103 do 124 od 124 do 141 od 141 do 161 od 161 do 185 od 185 do 226 od 226 do 806

Rok 1980Suma lipca

Rok 1980Suma października

200 300 400 500 600 700 800

O dległość [km ]

200

300

400

500

600

700

O pad [m m ]

od 26 do 51 od 51 do 67 od 67 do 85 od 85 do 102 od 102 do 118 od 118 do 134 od 134 do 330

Page 12: Alfred  Stach Instytut Badań Czwartorzędu i Geoekologii UAM Jan  Tamulewicz

Metody

• Z analizowanych zbiorów danych usunięto losowo co 40 punkt pomiarowy.

• Przyjęta procedura zapewniała równomierne rozmieszczenie punktów wybranych do walidacji na terenie całego kraju.

• Ze względu na różną liczebność zbioru stacji dla poszczególnych miesięcy i całego roku (minimalnie 2385 dla całego roku, maksymalnie 2504 stacje w lipcu) wylosowano od 59 do 63 punktów pomiarowych, co stanowiło od 2,47 do 2,53% analizowanych zbiorów danych.

Page 13: Alfred  Stach Instytut Badań Czwartorzędu i Geoekologii UAM Jan  Tamulewicz

100200300400500600700800900100011001200130014001500160017001800190020002100

0 km 100 km 200 km 300 km

Dane:cyfrowymodelrzeźbyterenu(DEM)o roz-dzielczościok. 1 km

GTOPO30http://www1.gsi.go.jp/gtopo30/gtopo30.html

Page 14: Alfred  Stach Instytut Badań Czwartorzędu i Geoekologii UAM Jan  Tamulewicz

Wyniki:zależność opadu od położenia i wysokości

600

700

800

900

1000

1100

1200

1300

1400

1500

1600

1700

1800

1900

2000

2100

2200

2300

2400

rok1980

0 km 100 km 200 km 300 km15

20

25

30

35

40

45

50

55

60

65

70

styczeń 19800 km 100 km 200 km 300 km

40

50

60

70

80

90

100

110

120

130

140

150

160

170

180

190

200

210

220

230

kwiecień 1980

0 km 100 km 200 km 300 km 50

100

150

200

250

300

350

400

450

500

550

600

650

lipiec 1980

0 km 100 km 200 km 300 km 5060708090100110120130140150160170180190200210220230240250260270280290

październik 1980

0 km 100 km 200 km 300 km

Page 15: Alfred  Stach Instytut Badań Czwartorzędu i Geoekologii UAM Jan  Tamulewicz

Wyniki:estymacja średniej obszarowej

OKgvOKlv

SKlm-gvmSKlm-gva

SKlm-lvID2MCTIN

750 755 760 765 770 775

OKgvOKlvSKlm-gvmSKlm-gvaSKlm-lvID2MCTIN

20.8 21.2 21.6 22 22.4

69 70 71 72 73

OKgvOKlv

SKlm-gvmSKlm-gva

SKlm-lvID2MCTIN

Me

tod

a e

sty

ma

cji

154 156 158 160

Opad [m m ]92 92.5 93 93.5 94 94.5

OKgvOKlvSKlm-gvmSKlm-gvaSKlm-lvID2MCTIN

Rok Styczeń

Kwiecień Lipiec Październik

Page 16: Alfred  Stach Instytut Badań Czwartorzędu i Geoekologii UAM Jan  Tamulewicz

Wyniki:estymacja odchylenia standardowego rozkładu obszarowego opadów

OKgvOKlv

SKlm-gvmSKlm-gva

SKlm-lvID2MCTIN

120 140 160 180 200

OKgvOKlvSKlm-gvmSKlm-gvaSKlm-lvID2MCTIN

9.5 10 10.5 11 11.5 12 12.5

24 26 28 30

OKgvOKlv

SKlm-gvmSKlm-gva

SKlm-lvID2MCTIN

Me

tod

a e

sty

ma

cji

48 50 52 54 56

Odchylenie standardowe opadu [m m ]36.5 37 37.5 38 38.5 39

OKgvOKlvSKlm-gvmSKlm-gvaSKlm-lvID2MCTIN

Rok Styczeń

Kwiecień Lipiec Październik

Page 17: Alfred  Stach Instytut Badań Czwartorzędu i Geoekologii UAM Jan  Tamulewicz

Wyniki:estymacja skośności rozkładu obszarowego opadów

OKgvOKlv

SKlm-gvmSKlm-gva

SKlm-lvID2MCTIN

1 1.2 1.4 1.6 1.8

OKgvOKlvSKlm-gvmSKlm-gvaSKlm-lvID2MCTIN

0.8 1.2 1.6 2 2.4 2.8

1 1.2 1.4 1.6 1.8

OKgvOKlv

SKlm-gvmSKlm-gva

SKlm-lvID2MCTIN

Me

tod

a e

sty

ma

cji

0.6 0.8 1 1.2 1.4 1.6

Skośność rozkładu opadów0.3 0.4 0.5 0.6

OKgvOKlvSKlm-gvmSKlm-gvaSKlm-lvID2MCTIN

Rok Styczeń

Kwiecień Lipiec Październik

Page 18: Alfred  Stach Instytut Badań Czwartorzędu i Geoekologii UAM Jan  Tamulewicz

Wyniki:współczynnik korelacji między danymi oryginalnymi i estymowanymi

OKgvOKlv

SKlm-gvmSKlm-gva

SKlm-lvID2MCTIN

0.84 0.88 0.92 0.96

OKgvOKlvSKlm-gvmSKlm-gvaSKlm-lvID2MCTIN

0.84 0.88 0.92 0.96

0.84 0.88 0.92 0.96

OKgvOKlv

SKlm-gvmSKlm-gva

SKlm-lvID2MCTIN

Me

tod

a e

sty

ma

cji

0.84 0.88 0.92 0.96

W spółczynnik korelacji liniowej0.84 0.88 0.92 0.96

OKgvOKlvSKlm-gvmSKlm-gvaSKlm-lvID2MCTIN

Rok Styczeń

Kwiecień Lipiec Październik

Page 19: Alfred  Stach Instytut Badań Czwartorzędu i Geoekologii UAM Jan  Tamulewicz

Wyniki:średni błąd estymacji (ME)

OKgvOKlv

SKlm-gvmSKlm-gva

SKlm-lvID2MCTIN

0 4 8 12 16 20

OKgvOKlvSKlm-gvmSKlm-gvaSKlm-lvID2MCTIN

0 0.4 0.8 1.2 1.6

0 1 2 3

OKgvOKlv

SKlm-gvmSKlm-gva

SKlm-lvID2MCTIN

Me

tod

a e

sty

ma

cji

-5 -4 -3 -2 -1 0

Średni błąd estymacji opadów [mm]-1 0 1 2 3

OKgvOKlvSKlm-gvmSKlm-gvaSKlm-lvID2MCTIN

Rok Styczeń

Kwiecień Lipiec Październik

Page 20: Alfred  Stach Instytut Badań Czwartorzędu i Geoekologii UAM Jan  Tamulewicz

Wyniki:pierwiastek względnego średniego błędu kwadratowego estymacji (RRMSE)

OKgvOKlv

SKlm-gvmSKlm-gva

SKlm-lvID2MCTIN

7 8 9 10

OKgvOKlvSKlm-gvmSKlm-gvaSKlm-lvID2MCTIN

17 18 19 20 21

10.8 11.2 11.6 12

OKgvOKlv

SKlm-gvmSKlm-gva

SKlm-lvID2MCTIN

Me

tod

a e

sty

ma

cji

12.6 12.8 13 13.2 13.4 13.6

Średni względny błąd estymacji opadów [%]8.4 8.8 9.2 9.6 10

OKgvOKlvSKlm-gvmSKlm-gvaSKlm-lvID2MCTIN

Rok Styczeń

Kwiecień Lipiec Październik

Page 21: Alfred  Stach Instytut Badań Czwartorzędu i Geoekologii UAM Jan  Tamulewicz

Wyniki:błędy estymacji metodą Najmniejszej Krzywizny (MC)

200 300 400 500 600 700 800

O dległość [km ]

200

300

400

500

600

700

B łąd estym acji [% ]

od -22 do -8 od -8 do -4 od -4 do -2 od -2 do 0 od 0 do 2 od 2 do 4 od 4 do 8 od 8 do 25

Rok

200 300 400 500 600 700 800

O dległość [km ]

200

300

400

500

600

700

B łąd estym acji [% ]

od -70 do -30 od -30 do -20 od -20 do -5 od -5 do 0 od 0 do 5 od 5 do 20 od 20 do 30 od 30 do 54

Styczeń

200 300 400 500 600 700 800

O dległość [km ]

200

300

400

500

600

700

B łąd estym acji [% ]

od -47 do -20 od -20 do -10 od -10 do -4 od -4 do 0 od 0 do 4 od 4 do 10 od 10 do 20 od 20 do 34

Kwiecień

200 300 400 500 600 700 800

O dległość [km ]

200

300

400

500

600

700

B łąd estym acji [% ]

od -38 do -20 od -20 do -15 od -15 do -5 od -5 do 0 od 0 do 5 od 5 do 15 od 15 do 20 od 20 do 31

Lipiec

200 300 400 500 600 700 800

O dległość [km ]

200

300

400

500

600

700

B łąd estym acji [% ]

od -37 do -10 od -10 do -6 od -6 do -3 od -3 do 0 od 0 do 3 od 3 do 6 od 6 do 10 od 10 do 26

Październik

Page 22: Alfred  Stach Instytut Badań Czwartorzędu i Geoekologii UAM Jan  Tamulewicz

Wnioski

• Z przeprowadzonej analizy wynika że żadna z testowanych metod nie może być uważana za uniwersalną i najlepszą w każdych warunkach. Wyniki testów są nie tylko różne w przypadku poszczególnych zbiorów danych (sumy rocznej i sum miesięcznych), ale także w sytuacji różnych parametrów oceny jakości estymacji. Porównanie wyników obliczeń wykonanych na jednym jedynie zbiorze danych referencyjnych może prowadzić do fałszywych uogólnień.

• Generalnie dość słabo wypadły algorytmy (SKlm-), które uwzględniały dane z cyfrowego modelu rzeźby terenu. Zależność między wysokością nad poziom morza a opadami obliczono bowiem w postaci jednego modelu wielomianowego dla całego terytorium Polski.

Page 23: Alfred  Stach Instytut Badań Czwartorzędu i Geoekologii UAM Jan  Tamulewicz

Wnioski cd.

• Lepsze wyniki dają algorytmy oparte na lokalnym modelu struktury pola opadów niż na globalnym.

• Algorytmy TIN, SKlm-gva, SKlm-lv były nieco bardziej skuteczne przy estymacjach parametrów populacji (obszarowych), podczas gdy MC, OKgv, OKlv i SKlm-gvm – punktowych.

Page 24: Alfred  Stach Instytut Badań Czwartorzędu i Geoekologii UAM Jan  Tamulewicz

Wnioski cd.

• Zdecydowanie najlepiej wypadła metoda minimalnej krzywizny (MC). Jej średni wynik zarówno z estymacji punktowych, jak i obszarowych był znacznie lepszy niż wszystkich pozostałych metod.

• Można ją wstępnie zalecać do rutynowego wykonywania map opadów atmosferycznych, tym bardziej, że nie wymaga specjalistycznego parametryzowania.

• Metoda ta daje dobre rezultaty jedynie przy względnie równomiernym pokryciu analizowanego obszaru punktami pomiarowymi.

Page 25: Alfred  Stach Instytut Badań Czwartorzędu i Geoekologii UAM Jan  Tamulewicz

Wnioski cd.

• Zdecydowanie najgorzej w zestawieniu wypadł kriging w oparciu o globalny model struktury pola opadów (OKgv) i popularna metoda odwrotności odległości przy wykładniku kwadratowym (ID2).

• Średni błąd estymacji sumy rocznej opadów wahał się od 6,7 (SKlm-lv) do 7,9% (ID2), przy rozrzucie estymacji punktowych od –22,5 do +25,0%.

• Średnie błędy estymacji sum miesięcznych (dla wszystkich metod) wynosiły: styczeń – 18,6%, kwiecień – 10,9%, lipiec – 13,0%, październik – 9,2%. Różnice pomiędzy najlepszą a najgorszą metodą estymacji sum miesięcznych wahały się od 0,8% w lipcu do 3,4% w styczniu. Błędy estymacji punktowych mogą przy sumach miesięcznych sięgać 75%, w większości jednak przypadków oscylują w granicach 35%.

Page 26: Alfred  Stach Instytut Badań Czwartorzędu i Geoekologii UAM Jan  Tamulewicz

Wnioski cd.

Prezentowane wyniki mają charakter wstępnej oceny niektórych algorytmów estymacyjnych. Aktualnie trwają dalsze prace związane z testowaniem szerokiego spektrum metod automatycznej estymacji opadów przy wykorzystaniu większej ilości danych, zarówno wartości przeciętnych jak i uwzględniających ekstremalne wysokości opadów.

Page 27: Alfred  Stach Instytut Badań Czwartorzędu i Geoekologii UAM Jan  Tamulewicz

DziękujęZa

uwagę