GEOSTATYSTYKAWykłady dla III roku Geografiispecjalność – geoinformacja
Estymacja na podstawie danych
jednej zmiennej I
Alfred StachInstytut Paleogeografii i Geoekologii
Wydział Nauk Geograficznych i Geologicznych UAM
Podstawy krigingu
Problem:Estymacja wartości ciągłej cechy z w dowolnej lokalizacji u z wykorzystaniem jedynie istniejących n danych z na obszarze badań A : {z(u), =1, ...., n}
Rozwiązanie:Kriging to nazwa własna grupy algorytmów opartych na uogólnionej regresji metodą najmniejszych kwadratów, przyjęta przez geostatystyków dla uhonorowania pionierskich prac południowoafrykańskiego geologa Danie Krige (1951)
Podstawy krigingu
• Wszystkie estymatory krigingowe są wariantami podstawowej formuły regresji liniowej zgodnie z poniższym wzorem:
*
1
n
Z m Z m
u
u u u u u
gdzie: (u) jest wagą przypisaną do danej z(u), która jest interpretowana jako realizacja Zmiennej Losowej Z(u).Wartości m(u) i m(u) to oczekiwane wartości ZL Z(u) i Z(u).
Podstawy krigingu
Ilość danych używanych do estymacji oraz ich wagi mogą się zmieniać przy kolejnych lokalizacjach. W praktyce używane jest jedynie n(u) danych leżących najbliżej lokalizacji punktu estymacji, to jest dane znajdujące się w określonym sąsiedztwie/oknie W(u) mający swoje centrum w u.
Interpretacja nieznanej wartości z(u) i wartosci danych z(u) jako realizacji ZL Z(u) i Z(u) pozwala na zdefiniowanie błędu estymacji jako zmiennej losowej Z*(u) – Z(u). Wszystkie zalety krigingu wynikają z tego samego założenia minimalizacji wariancji (błędu) estymacji przy respektowaniu warunku nieobciążenia estymatora, czyli:
2E u
Podstawy krigingu
2 VarE Z Z u u u
jest minimalizowany przy uwzględnieniu ograniczenia, że:
E 0Z Z u u
Estymacja za pomocą krigingu może się różnić ze względu na przyjęty model Funkcji Losowej Z(u). Przyjmuje się zazwyczaj, że FL Z(u) można rozłożyć na dwa komponenty: trend m(u) i resztę R(u):
( ) ( ) ( )Z R m u u u
Podstawy krigingu
Składowa resztowa jest modelowana jako stacjonarna FL o średniej równej zero i kowariancji CR(h):
E 0
, E R
R
R R R R C
u
Cov u u h u u h h
Oczekiwana wartość ZL Z w lokalizacji u jest zatem równa wartości składowej trendu w tej lokalizacji:
E Z mu u
Podstawy kriginguW zależności od przyjętego modelu trendu m(u) możemy wyróżnić trzy warianty krigingu:
1. Prosty kriging (Simple Kriging) zakłada że średnia m(u) jest znana i stała na całym analizowanym obszarze A :
, znane m m u u A
2. Zwykły kriging (Ordinary Kriging) uwzględnia lokalne fluktuacje średniej, ograniczając domenę stacjonarności średniej do lokalnego sąsiedztwa (ruchomego okna) W(u):
stała lecz nieznana m W u u uw przeciwieństwie do SK w tym przypadku średnia jest traktowana jako nieznana.
Czy lokalna średnia jest w przypadku danych satelitarnych ze Spitsbergenu stała?
310 320 330 340 350Lokalna średnia
0
400
800
1200
Loka
lna
war
ianc
ja
Próbka losowa, zmienna b1_03b
250 260 270 280 290 300Lokalna średnia
0
400
800
1200
Loka
lna
wa
rian
cja
Próbka losowa, zmienna b3n_03b
Podstawy krigingu3. Kriging z trendem (Kriging with a Trend model) zakłada że nieznana lokalna średnia m(u´) zmienia się stopniowo wewnątrz każdego lokalnego sąsiedztwa (okna) W(u), a zatem również w całym obszarze A . Składowa trendu jest modelowana jako liniowa funkcja współrzędnych fk(u):
0
z stały lecz nieznany
K
k kk
k k
m a f
a a W
u u u
u u u
Współczynniki ak(u´) są nieznane, lecz zakłada się, że są one stałe w obrębie każdego lokalnego sąsiedztwa W(u). Przyjęto, że f0(u´) = 1, tak więc przypadek gdzie K = 0 jest odpowiednikiem zwykłego krigingu (stała lecz nieznana średnia a0).
Prosty kriging (SK)Modelowanie składowej trendu (-owej) m(u) jako znanej stacjonarnej średniej m pozwala na zapisanie formuły estymatora jako liniowej kombinacji (n(u)+1) danych: n(u) ZL Z(u) i wartości średniej m:
( )
1
( ) ( )
1 1
1
nSK
SK
n nSK SK
Z Z m m
Z m
u
u u
u u u
u u u
n(u) wag jest w taki sposób wyznaczane, aby zminimalizować wariancję błędów uwzględnia-jąc kryterium nieobciążenia estymatora.
2 *VarE SKZ Z u u u
Prosty kriging
Estymator prostego krigingu (SK) jest z góry nieobciążony ponieważ średni błąd jest równy 0. Używając pierwszej formy zapisu estymatora SK możemy stwierdzić, że:
* ( ) ( ) 0SKE Z u Z u m m
Estymacja metodą prostego krigingu wykonywana jest za pomocą układu n(u) równań liniowych znanych pod nazwą układu zwykłych równań, które można zapisać używając kowariancji zmiennej z w postaci:
( )
1
( ) ( ) ( ) 1,...., ( )n
SK C C n
u
u u u u u u
Prosty kriging
Wariancja błędu – wariancja SK:( )
2
1
( ) (0) ( ) ( )n
SKSK C C
u
u u u u
Prosty kriging – notacja macierzowa
Układ równań SK można również zapisać w postaci macierzowej:
( )SK SK SKK λ u k
Gdzie KSK jest macierzą kowariancji danych o wymiarach n(u) n(u), SK jest wektorem wag SK, a kSK jest wektorem kowariancji dane-do-nieznanej
Prosty kriging – notacja macierzowa
1 1 1 ( )
( ) 1 ( ) ( )
( ) ..... ( )
..... ..... .....
( ) ..... ( )
n
SK
n n n
C C
C C
u
u u u
u u u u
K
u u u u
1 ( )
( ) .....
( )
SK
SKSKn
u
λ u
u
1
( )
( )
.....
( )SK
n
C
C
u
u u
k
u u
Prosty kriging – notacja macierzowa
Wagi krigingowe wymagane do estymacji SK są obliczane przez mnożenie odwrotności macierzy kowariancji danych przez wektor kowariancji dane-do-nieznanej:
1( )SK SK SK λ u K k
Odpowiedni zapis macierzowy wariancji krigingowej SK jest następujący:
2 1( ) (0) ( ) (0)T TSK SK SK SK SK SKC C u λ u k k K k
Prosty krigingSystem równań SK ma jednoznaczne rozwiązanie i wynikowa wariancja krigingowa jest dodatnia, jeżeli macierz kowariancji KSK = [C(u - u)] jest pozytywnie określona, czyli w praktyce:
• żadna para danych nie ma takiej samej lokalizacji: u u dla • zastosowano dopuszczalny model kowariancji C(h) Podstawowe cechy estymatora SK• Jest to estymator wierny – to znaczy, że wartość estymowana w lokalizacji punktu danych jest jemu równa,• Jeśli lokalizacja estymacji znajduje się poza zasięgiem autokorelacji w stosunku najbliższego punktu danych wartość estymowana jest równa stacjonarnej średniej m
Prosty kriging – przykłady
Korzystając z relacji: C(h) = C(0) - (h)
Estymacja cechy w punkcie 0 za pomocą danych pomiarowych z punktów 1,2 i 3.
Prosty kriging – przykładyProsty kriging dla modelu z zerowym efektem nuggetowym i izotropowym wariogramem sferycznym o trzech różnych zasięgach.
Zasięg Waga
1 2 3
1 0,781 0,012 0,065
5 0,648 -0,027 0,001
10 0,000 0,000 0,000
Prosty kriging – przykładyProsty kriging dla modelu z izotropowym wariogramem sferycznym o zasięgu 10 jednostek odległości i trzech różnych względnych udziałach wariancji nuggetowej
Nugget= Waga
1 2 3
0% 0,781 0,012 0,065
25% 0,468 0,203 0,064
75% 0,172 0,130 0,053
100% 0,000 0,000 0,000
Prosty kriging – przykładyProsty kriging dla sferycznego modelu z 25% nuggetem i zasięgiem głównej osi wynoszącym 10 jednostek odległości w przypadku trzech różnych stosunków anizotropii
Anizo- tropia=
Waga
1 2 3
1:1 0,468 0,203 0,064
2:1 0,395 0,087 0,141
5:1 0,152 -0,055 0,232
20:1 0,000 0,000 0,239
Prosty przykład estymacji SK
Dane jednowymiarowe:profil 7 punktów b1_03bprzy Y = 240 m
0 500 1000 1500Odległość W-E (m)
280
300
320
340
360
War
tość
ce
chy
b1
_03b
0 100 200 300 400 500 600Odstęp - h (m)
0
40
80
120
160
Se
miw
ari
an
cja
– (h
)
Semiwariogramybezkierunkowe
m odel
em piryczny
G am m a(h) = 18 + 78Sph (95) + 82Sph (628)
Izotropowy model semiwariancji obliczony
dla wszystkich 256 danych
Prosty przykład estymacji SK
0 500 1000 1500Odległość W-E (m)
280
300
320
340
360
Wa
rto
ść c
ech
y b
1_0
3b
Legenda:pom iaryrzeczyw isty profilg lobalna średniaestym acja SKwaga średnie j
0
0.2
0.4
0.6
0.8
1
Dane jednowymiarowe: profil dla Y = 240 m
0 500 1000 1500Odległość W-E (m)
280
300
320
340
360
War
toś
ć c
ech
y b
1_0
3b
Legenda:pom iaryrzeczyw isty profilg lobalna średniaestym acja SKwaga średnie j
0 500 1000 1500Odległość W-E (m)
280
300
320
340
360
War
toś
ć c
ec
hy
b1
_03b
Legenda:pom iaryrzeczyw isty profilg lobalna średniaestym acja SKwaga średnie j
0 500 1000 1500Odległość W-E (m)
280
300
320
340
360
Wa
rto
ść c
ech
y b
1_0
3b
Legenda:pom iaryrzeczyw isty profilg lobalna średniaestym acja SKwaga średnie j
0
0.2
0.4
0.6
0.8
1
Prosty kriging – zmienna b1_03b
Prosty kriging – zmienna b1_03b
-60 -40 -20 0 20 40 60 80 100Błąd estymacji
0
0.1
0.2
0.3
Fre
kw
encj
a
Prosty kriging – zmienna b1_03b
-60 -40 -20 0 20 40 60 80 100Błąd estymacji
0
0.1
0.2
0.3
Fre
kw
encj
a
-50 0 50 100 150Rzeczywiste błędy estymacji SK
-50
0
50
100
150
Wa
ria
ncj
a k
rig
ing
ow
a S
K
Weryfikacja jakości modelu -kroswalidacja
Weryfikacja jakości modelu -kroswalidacja
280 320 360 400W artości rzeczywiste
300
320
340
360
War
tośc
i es
tym
ow
ane
Fit R esults
F it 1 : L inearEquation Y = 0.3890339957 * X + 200.4089956Num ber of data points used = 256Average X = 328.492Average Y = 328.204Residual sum of squares = 12069.7Regression sum of squares = 7306.45Coef of determ ination, R -squared = 0.377085Residual m ean square, sigm a-hat-sq 'd = 47.5184
Weryfikacja jakości modelu – walidacja podzbioru
Top Related