Alfred Stach Instytut Paleogeografii i Geoekologii

38
GEOSTATYSTYKA Wykłady dla III roku Geografii specjalność – geoinformacja Kriging wartości kodowanych (Indicator Kriging) Alfred Stach Instytut Paleogeografii i Geoekologii Wydział Nauk Geograficznych i Geologicznych UAM

description

GEOSTATYSTYKA Wykłady dla III roku Geografii specjalność – geoinformacja Kriging wartości kodowanych ( I ndicator K riging). Alfred Stach Instytut Paleogeografii i Geoekologii Wydział Nauk Geograficznych i Geologicznych UAM. Lokalizacja stanowisk pomiarowych opadów atmosferycznych na profilu. - PowerPoint PPT Presentation

Transcript of Alfred Stach Instytut Paleogeografii i Geoekologii

Page 1: Alfred Stach Instytut Paleogeografii i Geoekologii

GEOSTATYSTYKAWykłady dla III roku Geografiispecjalność – geoinformacja

Kriging wartości kodowanych

(Indicator Kriging)

Alfred StachInstytut Paleogeografii i Geoekologii

Wydział Nauk Geograficznych i Geologicznych UAM

Page 2: Alfred Stach Instytut Paleogeografii i Geoekologii

Lokalizacja stanowisk pomiarowych opadów atmosferycznych na profilu

200000 300000 400000 500000 600000 700000 800000

W spółrzędna - X (m) - Easting

200000

300000

400000

Wsp

ółr

zęd

na

- Y

(m

) -

No

rth

ing

Kam

ienn

a G

óra

Wał

brzy

ch

Str

zelin

Dąb

rów

ka Ł

ubia

ńska

Kob

ylno

Sie

rakó

w

Mał

usy

Wie

lkie

Kon

iecp

olK

onie

czno

Pis

krzy

n

Page 3: Alfred Stach Instytut Paleogeografii i Geoekologii

Maksymalne sumy dobowe opadów zarejestrowane w maju 1980 roku na posterunkach usytuowanych na profilu

300000 400000 500000 600000 700000

W spółrzędna - X (m ) - Easting

0

10

20

30

40

50

60

Su

ma

do

bo

wa

op

adó

w -

(m

m)

- D

aily

pre

cip

itat

ion

to

tals

5.5 4.2

8.210.3

17.3

11.2

52.5

24.2

19.6

11.0

Kam

ien

na

ra

Wał

brz

ych

Str

zelin

Dąb

rów

ka Ł

ub

iań

ska

Ko

byl

no

Sie

rakó

w

Mał

usy

Wie

lkie

Ko

nie

cpo

l

Ko

nie

czn

o

Pis

krzy

n

u 1 u 2 u 3

Page 4: Alfred Stach Instytut Paleogeografii i Geoekologii

Skumulowany rozkład prawdopodobieństwa maksymalnych dobowych sum opadów zarejestrowanych w posterunkach opadowych na terenie Polski w maju 1980 rokuNa wykresie zaznaczono wysokości sum dobowych o prawdopodobieństwie przewyższenia 0,2, 0,4, 0,6, 0,8, 0,9 i 0,95 (percentyle 20, 40, …., 95%)

1 10 100M aksym alny opad dobow y w m ies iącu (m m )

M onth ly m axim um daily p recip ita tion

0

0.2

0.4

0.6

0.8

1

Per

cent

yl -

Pe

rce

ntyl

e

7,9

11,

8

15,

3

22,

2

29,

43

6,3

0.90.95

Page 5: Alfred Stach Instytut Paleogeografii i Geoekologii

Wartości progowe maksymalnych sum dobowych opadów w maju 1980 roku o prawdopodobieństwie 0,2, 0,4, 0,6, 0,8, 0,9 i 0,95 (percentyle 20, 40, 60, 80, 90 i 95%) naniesione na dane profilowe

300000 400000 500000 600000 700000

Współrzędna X układu GUGIK 92 (m)

0

10

20

30

40

50

60

Mak

sym

aln

a su

ma

do

bo

wa

op

adó

w w

maj

u 1

980

(mm

)

5.5 4.2

8.210.3

17.3

11.2

52.5

24.2

19.6

11.0 20% = 7,9m m

40% = 11,8m m

60% = 15,3m m

80% = 22,2m m

90% = 29,4m m

95% = 36,3m m

Page 6: Alfred Stach Instytut Paleogeografii i Geoekologii

Maksymalne sumy dobowe opadów zarejestrowane w maju 1980 roku na analizowanym profilu przekodowane na wektory danych binarnych w zależności od przekroczenia wartości progowych wyznaczonych z globalnej krzywej skumulowanego rozkładu prawdopodobieństwa (precentyle 20, 40, 60, 80, 90 i 95%)

300000 400000 500000 600000 700000

W spółrzędna X układu GUGIK 92 (m)

0

10

20

30

40

50

60

Mak

sym

aln

a su

ma

do

bo

wa

op

adó

ww

maj

u 1

980

(mm

)

Page 7: Alfred Stach Instytut Paleogeografii i Geoekologii

Semiwariogramy empirycznei ich modele dla wartości kodowanych (percentyle 20, 40, 60, 80, 90 i 95%) maksymalnych sum dobowych opadów na terenie Polski w maju 1980 roku

0

0.04

0.08

0.12

0.16

0.2

0

0.04

0.08

0.12

0.16

0.2

Sem

iwa

rian

cja

- (h

) -

Sem

ivar

ian

ce

0 20000 40000 60000 80000 100000

Odstęp - h (m ) - Lag

0

0.02

0.04

0.06

0.08

0 20000 40000 60000 80000 100000

p . 2 0% p . 40 %

p . 6 0% p . 80 %

p . 9 0% p . 95 %

Page 8: Alfred Stach Instytut Paleogeografii i Geoekologii

Estymowany metodą IK profil prawdopodobieństwa maksymalnych opadów dobowych w maju 1980. Pionowymi liniami przerywanymi zaznaczono lokalizację punktów pomiarowych

300000 400000 500000 600000 700000

W spółrzędna - X (m ) - Easting

0

0.2

0.4

0.6

0.8

1

Pra

wd

op

od

ob

ień

stw

o w

aru

nko

we

Co

nd

itio

nal

Pro

bab

ility

z k = 7 ,9 m m

z k = 11,8 m m

z k = 15,3 m m

z k = 22,2 m m

z k = 29,4 m m

z k = 36,3 m m

u 1 u 2 u 3

Page 9: Alfred Stach Instytut Paleogeografii i Geoekologii

Wartość oczekiwana (E-mean) maksymalnego opadu dobowego na analizowanym profilu w maju 1980 wyliczona z ccdf estymowanych metodą IK. Zacieniowany pas oznacza zakres odchylenia standardowego estymacji (Conditional Variance). Zaznaczono lokalizację punktów pomiarowych i wysokości rzeczywiście zmierzonych maksymalnych opadów dobowych

300000 400000 500000 600000 700000

W spółrzędna - X (m ) - Easting

5.5 4.2

8.210.3

17.3

11.2

52.5

24.2

19.6

11.0

0

20

40

60

80

Su

ma

do

bo

wa

op

adó

w -

(m

m)

- D

aily

pre

cip

itat

ion

to

tals

u 1 u 2 u 3

Page 10: Alfred Stach Instytut Paleogeografii i Geoekologii

Maksymalny opad dobowy na analizowanym profilu w maju 1980 o prawdopodobieństwie wystąpienia 0,9 (A) oraz prawdopodobieństwo wystąpienia opadu dobowego większego lub równego 25 mm (B). Zaznaczono lokalizację punktów pomiarowych i wysokości rzeczywiście zmierzonych maksymalnych opadów dobowych

300000 400000 500000 600000 700000

W spółrzędna - X (m ) - Easting

5.5 4.2

8.210.3

17.3

11.2

52.5

24.2

19.6

11.0

0

20

40

60

80

Su

ma

do

bo

wa

op

adó

w -

(m

m)

- D

aily

pre

cip

itat

ion

to

tals

0

0.2

0.4

0.6

0 .8

1

Praw

do

po

do

bień

stwo

- Pro

ba

bility

A

B

C

u 1 u 2 u 3

Page 11: Alfred Stach Instytut Paleogeografii i Geoekologii

Estymowane metodą IK warunkowe skumulowane rozkłady prawdopodobieństwa (ccdf) maksymalnych opadów dobowych w maju 1980 roku w trzech lokalizacjach (u1, u2 i u3) na analizowanym profilu. Zaznaczono globalne cdf (V-80) obliczone dla wszystkich danych pomiarowych z całej Polski, a także wartości sum opadów dla cdf odpowiadające prawdopodobieństwu 0,9

1 10 100M aksym alny opad dobow y w m ies iącu (m m )

M onth ly m axim um daily precip ita tion

0

0.2

0.4

0.6

0.8

1P

raw

dopo

dob

ień

stw

o -

Pro

babi

lity

1 10 100M aksym alny opad dobow y w m ies iącu (m m )

M onth ly m axim um daily precip ita tion

0

0.2

0.4

0.6

0.8

1

Pra

wd

opod

obie

ństw

o -

Pro

babi

lity

V -8 0

u 1

u 2

u 3

0,9

10,

3

29,

4

40,

6

55,

1

Błędy relacji porządkowych ccdf dla lokalizacji u2 i u3 (odpowiednio 0,000418 i 0,0068571)

Page 12: Alfred Stach Instytut Paleogeografii i Geoekologii

Błędy relacji porządkowych• Podstawową wadą krigingu wartości kodowanych (IK)

jest występowanie błędów relacji porządkowych. W dowolnej lokalizacji u, każde estymowane posteriori prawdopodobieństwo [F(u;zk(n))]* musi należeć do przedziału [0,1], a seria K takich szacunków musi być niemalejącą funkcją wielkości wartości progowej zk:

; 0,1kF z n

u

; ;k k k kF z n F z n z z

u u

Page 13: Alfred Stach Instytut Paleogeografii i Geoekologii

Błędy relacji porządkowych I• Występowanie błędów relacji porządkowych pierwszego rodzaju

wynika z samej natury algorytmu krigingu, który jest liniową, nie wypukłą, kombinacją danych pomiarowych.

• Pociąga to za sobą możliwość obliczenia ujemnych wag dla poszczególnych danych pomiarowych znajdujących się w zasięgu sąsiedztwa szukania.

• Sytuacja taka ma miejsce jeśli zachodzi zjawisko ekranowania, tj. zlokalizowany bliżej punktu estymacji u0 punkt danych u2 częściowo „niweluje” wpływ leżącego dalej na tym samym kierunku punktu u1.

• Ta cecha algorytmu ma zarówno zalety, jak i wady. Z jednej strony umożliwia uzyskanie estymacji, które wykraczają poza zakres danych pomiarowych, z drugiej mogą być to czasami wyniki nierealistyczne, takie jak ujemne stężenia, czy proporcje większe od 1.

• Błędy tego rodzaju występują częściej, i ich rozmiary są większe, w zwykłym krigingu (OK) niż w prostym krigingu (SK), oraz w wielozmiennym kokrigingu niż w krigingu. Jest to efektem występujących w owych algorytmach (OK, SCK, OCK) ograniczeń wielkości wag (wymuszających ich sumowanie do 1 lub do 0)

Page 14: Alfred Stach Instytut Paleogeografii i Geoekologii

Ekranowanie danych w krigingu0 40 80 120 160

Odstęp - Lag

0

40

80

120

(h) = 10 + 90 Sph (100)

0 100 200

0

100

200

1

2

3

4

50

1 2 3 4 5

-0,2

0

0,2

0,4

0,6

0 ,1 5 0

0 ,3 9 3

0 ,1 8 30 ,2 1 9

0 ,0 5 6

0 100 200Odległość - Distance

0

100

200

1

2

3

4

50

1 2 3 4 5Punkt danych - Data point

-0,2

0

0,2

0,4

0,6

-0,066

0,496

0,307

0,207

0,057

A

B

C

Ilustracja sytuacji występowania ujemnych wag w algorytmie zwykłego krigingu (OK).A – wykres i wzór sferycznego modelu semiwariogramu użytego w obliczeniach: wariancja nuggetowa (C0) = 10, wariancja progowa (C1) = 90, zasięg (a) = 100 jednostek.B – układ przestrzenny estymowanej lokalizacji (0) i punktów danych (1-5) oraz wartości wyliczonych dla tej konfiguracji wag OK. Sytuacja bez ekranowania.C – układ przestrzenny estymowanej lokalizacji (0) i punktów danych (1-5) oraz wartości wyliczonych dla tej konfiguracji wag OK. Sytuacja z ekranowaniem punktu 1 przez punkt 2. Cieniowany okrąg (B i C) wskazuje na zasięg autokorelacji.

Page 15: Alfred Stach Instytut Paleogeografii i Geoekologii

Błędy relacji porządkowych II• Występowanie błędów drugiego rodzaju wynika dodatkowo z

faktu, że każde z K prawdopodobieństw jest estymowane osobno, oraz że często w konkretnych klasach z (przedziałach wartości analizowanej cechy) w lokalnym sąsiedztwie brak jest danych pomiarowych. Jakie ma to konsekwencje zaprezentowano w poniższym przykładzie.

• Zakładamy że w klasie (z7, z8] nie ma danych pomiarowych. Obie estymacje IK dla wartości progowych z7 i z8 oparte są zatem na tym samym zbiorze danych kodowanych ponieważ:

• Różnice między tymi dwoma estymacjami IK są wówczas jedynie efektem liniowej kombinacji różnic pomiędzy wagami IK dla obu wartości progowych z7 i z8:

7 8; ; 1,....,i z i z n u u u

7 8 8 7

8 8 71

; , ; ;

; ; ;

IK IK IK

nIK IK

z z F z n F z n

i z z z

u

u u u

u u u

Page 16: Alfred Stach Instytut Paleogeografii i Geoekologii

Błędy relacji porządkowych II• Wartość ujemna różnicy pociąga za sobą

naruszenie relacji porządkowej. W sytuacji kiedy oba modele semiwariogramów I(h, z7) i I(h, z8) są identyczne, także oba zbiory wag IK będą takie same, ponieważ dla obu wartości progowych w obliczeniach zostaną wykorzystane te same lokalizacje danych pomiarowych:

• Różnica wynosi wówczas zero, stąd nie ma naruszenia relacji porządkowej. W przeciwnym wypadku, istotnej różnicy dwóch kolejnych modeli semiwariogramów wartości kodowanych, w tym przypadku między progami z7 i z8, powstają dwa odmienne zbiory wag IK pociągając za sobą ryzyko wystąpienia błędów relacji porządkowych.

7 8; ,IK z z u

7 8; ; 1,....,IK IKz z n u u u

Page 17: Alfred Stach Instytut Paleogeografii i Geoekologii

Sposoby eliminacji błędów relacji porządkowych• Błędy relacji porządkowych są w estymacjach IK stosunkowo częste, ale ich

rozmiar jest zazwyczaj niewielki – około 0,01. Aby ograniczyć ich ilość i rozmiar stosuje się dwie strategie:

• Błędy drugiego rodzaju w zasadzie są łatwe do wyeliminowania jeśli dla wszystkich wartości progowych użyje się tego samego modelu struktury przestrzennej – semiwariogramu.

• To dość radykalne podejście jest często stosowane pod nazwą median Indicator Kriging (mIK). Nazwa sugeruje, i rzeczywiście tak bywa najczęściej, że w algorytmie tym stosuje się model struktury przestrzennej danych kodowanych w stosunku do wartości mediany (50 percentyla). Nie jest jednakże jakaś ścisła reguła.

• Zalety mIK związane są nie tylko z eliminacją większości naruszeń relacji porządkowych. Jest to przede wszystkim metoda mniej pracochłonna – modelowanie jednego semiwariogramu zamiast kilku, czy kilkunastu, ale przede wszystkim znacznie szybsza w obliczeniach. Dla każdej lokalizacji (węzła siatki interpolacyjnej) obliczany jest bowiem tylko jeden układ równań krigingu.

• Popularność mIK wynika również z faktu, że mimo tak znacznego uproszczenia procedury, uzyskiwane wyniki są zazwyczaj tylko nieznacznie gorsze od uzyskanych za pomocą „pełnego” krigingu wartości kodowanych.

Page 18: Alfred Stach Instytut Paleogeografii i Geoekologii

Sposoby eliminacji błędów relacji porządkowych• W sytuacji kiedy nie można zastosować metody mIK zaleca się takie

modelowanie struktury przestrzennej dla kolejnych wartości progowych, aby unikać gwałtownych zmian parametrów modeli. Można to osiągnąć na przykład poprzez użycie dla wszystkich wartości progowych różnych kombinacji liniowych tych samych elementarnych struktur.

• Parametry modeli semiwariogramów danych kodowanych (wariancja progowa, zasięg, kierunek i proporcja anizotropii) powinny zmieniać się stopniowo od jednej wartości progowej do następnej. Nie jest to zazwyczaj żadne istotne ograniczenie, ponieważ w „naturze” zmiany struktury przestrzennej dla różnych klas wielkości analizowanego parametru zazwyczaj zachodzą w sposób stopniowy – płynny.

• Zupełnie inne podejście do problemu redukcji błędów relacji porządkowych zakłada nie „sztywne” ustalenie jednej serii wartości progowych zk, ale ich dynamiczną modyfikację osobno dla każdego sąsiedztwa szukania w zależności od zakresu wartości tam występujących. Unika się w ten sposób, często w tradycyjnym IK występującej sytuacji, że w pewnych klasach wielkości nie ma danych pomiarowych. Potrzebne odpowiednie modele semiwariogramów dla zmiennych wartości progowych są interpolowane z podanych wcześniej przez „operatora”.

Page 19: Alfred Stach Instytut Paleogeografii i Geoekologii

Usuwanie błędów relacji porządkowych

• Wymienione procedury redukują, ale całkowicie nie eliminują problemu naruszeń relacji porządkowych. Dlatego też konieczna jest dodatkowa, finalna operacja korekty uzyskanych za pomocą algorytmu IK wartości ccdf.

• Najczęściej stosuje się prostą procedurę uśredniana korekt wartości rosnących i malejących:

zm in z1 z2 z3 z 4 z 5 z6 z 7 z8 zm a x

wartość progowa - cutoff value

0

0,2

0,4

0,6

0,8

1

a

b

c

d

Błędy relacji porządkowych uzyskanych z obliczeń IK wartości ccdf i ich korekta.

Objaśnienia:a – „niezależne” wartości ccdf wyliczone algorytmem IK,b – korekta wartości rosnących (upward correction),c – korekta wartości malejących (downward correction),d – wynikowe ccdf uzyskane z uśrednienia obu wartości skorygowanych.

Page 20: Alfred Stach Instytut Paleogeografii i Geoekologii

Przykład korekty relacji porządkowych

A

B

Summary of order relations (number and magnitude): Threshold 1 Number = 0 Average = .0000 Maximum = -1.0000 Threshold 2 Number = 281 Average = .0121 Maximum = .0953 Threshold 3 Number = 281 Average = .0121 Maximum = .0953 Threshold 4 Number = 47 Average = .0076 Maximum = .0344 Threshold 5 Number = 249 Average = .0037 Maximum = .0063 Threshold 6 Number = 261 Average = .0040 Maximum = .0170

Total of 41.35% with an average magnitude of .0082

Summary of order relations (number and magnitude): Threshold 1 Number = 5860 Average = .0442 Maximum = .3458 Threshold 2 Number = 18149 Average = .0175 Maximum = .2356 Threshold 3 Number = 34932 Average = .0120 Maximum = .3458 Threshold 4 Number = 57824 Average = .0106 Maximum = .2984 Threshold 5 Number = 77022 Average = .0088 Maximum = .1765 Threshold 6 Number = 89273 Average = .0077 Maximum = .1760 Threshold 7 Number = 111368 Average = .0087 Maximum = .1645 Threshold 8 Number = 108059 Average = .0061 Maximum = .1576 Threshold 9 Number = 103512 Average = .0042 Maximum = .1443 Threshold10 Number = 106492 Average = .0049 Maximum = .1941 Threshold11 Number = 130464 Average = .0037 Maximum = .1443 Threshold12 Number = 138715 Average = .0056 Maximum = .3330 Threshold13 Number = 144629 Average = .0028 Maximum = .3330

Total of 22.17% with an average magnitude of .0064

Przykłady raportów dotyczące ilości i rozmiarów korekt relacji porządkowych warunkowych kumulacyjnych funkcji rozkładu maksymalnych sum dobowych opadów:A – jednowymiarowy przykład (profil) z maja 1980, B – maksymalne sumy dobowe opadów w roku 1974 na całym obszarze Polski.

Page 21: Alfred Stach Instytut Paleogeografii i Geoekologii

Przykład korekty relacji porządkowych

20 24 28 32Ilość korekt relacji porządkowych - (%)Number of order relations corrections

0

0,004

0,008

0,012

0,016

1 2 3 4 5 6 7 8 9 10 11 12 13

Numer kolejny wartości progowejTreshold sequence number

0

50000

100000

150000

200000

1 2 3 4 5 6 7 8 9 10 11 12 13

Numer kolejny wartości progowejTreshold sequence number

0

0,01

0,02

0,03

1 2 3 4 5 6 7 8 9 10 11 12 13

Numer kolejny wartości progowejTreshold sequence number

0

0,1

0,2

0,3

A B

C D

Page 22: Alfred Stach Instytut Paleogeografii i Geoekologii

Estymowane metodą IK warunkowe skumulowane rozkłady prawdopodobieństwa (ccdf) maksymalnych opadów dobowych w maju 1980 roku w trzech lokalizacjach (u1, u2 i u3) na analizowanym profilu. Zaznaczono globalne cdf (V-80) obliczone dla wszystkich danych pomiarowych z całej Polski, a także wartości sum opadów dla cdf odpowiadające prawdopodobieństwu 0,9

1 10 100M aksym alny opad dobow y w m ies iącu (m m )

M onth ly m axim um daily precip ita tion

0

0.2

0.4

0.6

0.8

1P

raw

dopo

dob

ień

stw

o -

Pro

babi

lity

1 10 100M aksym alny opad dobow y w m ies iącu (m m )

M onth ly m axim um daily precip ita tion

0

0.2

0.4

0.6

0.8

1

Pra

wd

opod

obie

ństw

o -

Pro

babi

lity

V -8 0

u 1

u 2

u 3

0,9

10,

3

29,

4

40,

6

55,

1

Błędy relacji porządkowych ccdf dla lokalizacji u2 i u3 (odpowiednio 0,000418 i 0,0068571)

Page 23: Alfred Stach Instytut Paleogeografii i Geoekologii

Interpolacja i ekstrapolacja wynikowej ccdf• Działanie algorytmu IK można porównać do

korekty, czy też modyfikacji, na podstawie informacji lokalnych, globalnego dyskretnego cdf.

• Otrzymujemy w efekcie punktową, dyskretną, warunkową funkcję rozkładu prawdopodobieństwa (ccdf).

• Aby móc ją w pełni wykorzystać do różnorodnych zastosowań, musimy w ostatnim etapie obliczeń dokonać operacji odwrotnej do tej która rozpoczynała całą procedurę – z dyskretnej, nieciągłej ccdf uzyskać z powrotem rozkład ciągły.

• Praktycznie rzecz biorąc pociąga to za sobą konieczność ustalenia sposobu za pomocą którego można oszacować dowolną wartość ccdf, a nie tylko dla K wybranych progów.

Page 24: Alfred Stach Instytut Paleogeografii i Geoekologii

Interpolacja i ekstrapolacja wynikowej ccdf

Problem ten zazwyczaj „rozbija się” na dwa cząstkowe: (1) interpolację ccdf w obrębie klas wyznaczonych przez kolejne wartości progowe, (2) ekstrapolację poza progami skrajnymi, tj. minimalnym i maksymalnym

1 10 100M aksym alny opad dobow y w m ies iącu (m m )

M onth ly m axim um daily precip ita tion

0

0,2

0,4

0,6

0,8

1

A

1 10 100M aksym alny opad dobow y w m iesiącu (m m )

M onth ly m axim um daily precip ita tion

0

0,2

0,4

0,6

0,8

1

a

b

c

dB

Budowa ciągłego ccdf dla lokalizacji u1 z jednowymiarowego przykładu obliczeń krigingu wartości kodowanych. Objaśnienia: A – ciągły cdf dla całego zbioru danych (a) i dyskretny ccdf uzyskany z obliczeń IK dla lokalizacji u1,

B – to samo co w A plus: d – ekstrapolacja potęgowa dolnego ogona rozkładu ( = 4,0), c – interpolacja liniowa pomiędzy granicami klas i, b – ekstrapolacja hiperboliczna górnego ogona rozkładu ( = 2,5).

Page 25: Alfred Stach Instytut Paleogeografii i Geoekologii

Interpolacja i ekstrapolacja wynikowej ccdf• Do interpolacji ccdf pomiędzy wartościami progowymi (zk-1,

zk) wykorzystywany jest zazwyczaj model liniowy. Używając tego modelu zakładamy istnienie w klasach rozkładu równomiernego

• Do ekstrapolacji dolnego ogona rozkładu używany jest najczęściej model potęgowy

• Do ekstrapolacji górnego ogona używany jest model potęgowy lub hiperboliczny

zm ienna - Z - variab le

0.0

1.0

fun

kcja

sku

mul

owan

ego

rozk

ładu

cum

ulat

ive

dis

trib

utio

n fu

nct

ion

(cdf

)

z k -1 z k

F * (z k -1)

F * (z k)

= 0 ,1

0 ,51 ,0

2 ,05 ,0

zm ienna - Z - variab le

0.0

1.0

z k

F * (z k)

= 5 ,0

1 ,01 ,5

2 ,5

a b

Potęgowa (a) i hiperboliczna (b) interpolacja / ekstrapolacja skumulowanego rozkładu zmiennej

Page 26: Alfred Stach Instytut Paleogeografii i Geoekologii

Estymowane metodą IK warunkowe skumulowane rozkłady prawdopodobieństwa (ccdf) maksymalnych opadów dobowych w maju 1980 roku w trzech lokalizacjach (u1, u2 i u3) na analizowanym profilu. Zaznaczono globalne cdf (V-80) obliczone dla wszystkich danych pomiarowych z całej Polski, a także wartości sum opadów dla cdf odpowiadające prawdopodobieństwu 0,9

1 10 100M aksym alny opad dobow y w m ies iącu (m m )

M onth ly m axim um daily precip ita tion

0

0.2

0.4

0.6

0.8

1P

raw

dopo

dob

ień

stw

o -

Pro

babi

lity

1 10 100M aksym alny opad dobow y w m ies iącu (m m )

M onth ly m axim um daily precip ita tion

0

0.2

0.4

0.6

0.8

1

Pra

wd

opod

obie

ństw

o -

Pro

babi

lity

V -8 0

u 1

u 2

u 3

0,9

10,

3

29,

4

40,

6

55,

1

Błędy relacji porządkowych ccdf dla lokalizacji u2 i u3 (odpowiednio 0,000418 i 0,0068571)

Page 27: Alfred Stach Instytut Paleogeografii i Geoekologii

Zestawienie wad i zalet IKWADY:• utrata części informacji ze względu dyskredytyzację ciągłej

dystrybuanty empirycznej,• pracochłonność – konieczność czasochłonnego budowania modelu

semiwariancji dla każdej wartości progowej; często występujące trudności w określeniu modeli dla wartości bardzo niskich i bardzo wysokich zmuszają do subiektywnych decyzji, a te rodzą wątpliwości co do optymalności uzyskanych estymacji,

• wykraczanie estymowanych prawdopodobieństw poza dopuszczalny zakres (0, 1), oraz błędy w ich relacjach porządkowych,

• arbitralnie przyjmowana metoda interpolacji/ekstrapolacji uzyskanej warunkowej dystrybuanty.

ZALETY:• potwierdzona w dziesiątkach zastosowań i testów metodycznych

skuteczność, • brak trudnych do weryfikacji założeń dotyczących rozkładu

statystycznego populacji (metoda nieparametryczna),• żadna z alternatywnych metod nie jest wyraźnie lepsza,• alternatywne metody są bardziej skomplikowane = bardziej „podatne”

na błędy metodyczne,• łatwa możliwość uwzględnienia danych uzupełniających („twardych” i

„miękkich”).• powszechna dostępność oprogramowania

Page 28: Alfred Stach Instytut Paleogeografii i Geoekologii

Analizowane dane

Fragment doliny lodowcaEbba na Spitsbergenie Zachodnimok. 7843’N i 1644’E

Page 29: Alfred Stach Instytut Paleogeografii i Geoekologii

Analizowane dane

Dolina Ebby –analizowany obszar:

Page 30: Alfred Stach Instytut Paleogeografii i Geoekologii

Analizowane dane

Zdjęcie satelitarneAster – Terraz 13 lipca 2002 roku

Światło widzialnei bliska podczerwień.Rozdzielczość – 15 m

Page 31: Alfred Stach Instytut Paleogeografii i Geoekologii

Analizowane dane

Fragment mapygeomorfologicznejotoczenia fiordu Petuniabukta(Karczewski 1990).

Page 32: Alfred Stach Instytut Paleogeografii i Geoekologii

Analizowane dane:

Zdjęcie z 13.VII. 2002 r.

Zdjęcie z 5.VIII. 2002 r.Oryginał i klasyfikacja

Fragment mapygeomorfologicznej

536800 537000 537200 537400 537600 537800 538000 538200 538400 538600

X [m ]

8737600

8737800

8738000

8738200

8738400

8738600

8738800

8739000

Y [

m]

obszar 1500 1950 m = 2,925 km2

(100 130 pikseli = 13000 danych)kanał 3n – bliska podczerwień

250 podstawowych losowych próbek100 dodatkowych losowych próbek

Page 33: Alfred Stach Instytut Paleogeografii i Geoekologii

Interpolacja danych jakościowych– semiwariogramy kategorii

Obraz rzeczywisty

43

21

0 70 140 210 280 350 420 490 560 6300

0.006

0.012

0.018

0.024

0.03

0.036

0.042

0.048

0.054

|h| - metry

(|h

|)

Region (klasa) 1

0 50 100 150 200 250 300 350 400 4500

0.02

0.04

0.06

0.08

0.1

0.12

0.14

|h| - metry

(|h

|)

Region (klasa) 2

0 90 180 270 360 450 540 630 720 810 9000

0.03

0.06

0.09

0.12

0.15

0.18

0.21

|h| - metry(|

h|)

Region (klasa) 3

0 90 180 270 360 450 540 630 720 810 9000

0.03

0.06

0.09

0.12

0.15

0.18

0.21

0.24

|h| - metry

(|h

|)

Region (klasa) 4

Page 34: Alfred Stach Instytut Paleogeografii i Geoekologii

Interpolacja danych jakościowych– kriging kategorii (IK)

0.5

0.6

0.7

0.8

0.9

1

1.1

0.5

0.6

0.7

0.8

0.9

1

1.1

0.5

0.6

0.7

0.8

0.9

1

1.1

0.5

0.6

0.7

0.8

0.9

1

1.1

Interpolacja IK

Prawdo-podobieństwoprzynależnoścido regionu(klasy)

klasy R %R Est %Est Es t_OK. %Est OK. %Est=R

1 815 6.3 778 6.0 675 86.8 82.82 2067 15.9 2053 15.8 1560 76.0 75.53 4163 32.0 3335 25.7 2726 81.7 65.54 5955 45.8 6347 48.8 5470 86.2 91.9Suma 13000 100 12513 96.3 10431 80.2

Statystyki klasyfikacji przestrzennej

Obraz rzeczywisty

43

21

Page 35: Alfred Stach Instytut Paleogeografii i Geoekologii

SCHEMAT OPRÓBOWANIA STOKU.

POBÓR RDZENI GLEBOWYCH.

-16 0 16 32 48 64

-96

-80

-64

-48

-32

-16

0

16

32

48

A 2A 3A 4A 5

B 1B 2B 3B 4B 5

C 1C 2C 3C 4C 5C 6

D 1D 2D 3D 4D 5D 6D 7

E 1E 2E 3E 4E 5E 6E 7

F 1F 2F 3F 4F 5F 6F 7F 8

G 1G 2G 3G 4G 5G 6G 7G 8

H 1H 2H 3H 4H 5H 6H 7H 8

I 1I 2I 3I 4I 5I 6I 7

K 1K 2K 3K 4K 5K 6K 7

L 1L 2L 3L 4L 5L 6L 7

M 1M 2M 3M 4M 5M 6M 7

N 1N 2N 3N 4N 5N 6N 7

O 2O 3O 4O 5O 6O 7

P 2P 3P 4P 5P 6P 7

R 3R 4R 5R 6R 7

S 3S 4S 5S 6S 7

0

1

2

3

4

5

6

7

8

9

10

11

Page 36: Alfred Stach Instytut Paleogeografii i Geoekologii

POBÓR RDZENIGLEBOWYCHI OPISBARWY GLEB

Page 37: Alfred Stach Instytut Paleogeografii i Geoekologii

0 20 40 60 80

Odleg łość [m ]

0

0.1

0.2

0.3

Se

miw

ari

an

cja

klasa 1

klasa 2

klasa 3

0

0.1

0.2

0.3

klasa 2

klasa 4

0 20 40 60 80

Odleg łość [m ]

0

0.1

0.2

0.3

klasa 4

klasa 5

3 k la sy 4 k la sy

5 k la s

K o d b arwy

Od

leg

łość

wią

z.

0

50

100

150

200

250

300

350

28 25 24 22 27 26 21 23 20 19 18 17 15 14 16 13 12 11 9 10 8 7 5 6 4 2 3 1

Empiryczne semiwariogramy wskaźnikowe (indicator semivariogram)dla poszczególnych klas barw poziomu akumulacyjno-próchnicznego na stoku

A

Page 38: Alfred Stach Instytut Paleogeografii i Geoekologii

Prawdopodobieństwo przynależności do klas barwpoziomu akumulacyjno-próchnicznego na stoku A

-16 0 16 32 48 64

-96

-80

-64

-48

-32

-16

0

16

32

48

0.5 0.6 0.7 0.8 0.9 10.5 0.6 0.7 0.8 0.9 1

-16 0 16 32 48 64

0.5 0.6 0.7 0.8 0.9 1

-16 0 16 32 48 64

-100

-80

-60

-40

-20

0

20

40

60

0.5 0.6 0.7 0.8 0.9 1

3 klasy 4 klasy 5 klas