hist close ultra 100 mean · W gospodarce przedsiębiorstwa wzajemne relacje otaczaj ......

27
Wstęp Analiza korelacji Przykłady Podsumowanie Miary korelacji Janusz Miśkiewicz Instytut Fizyki Teoretycznej, Uniwersytetu Wroclawskiego, pl. M.Borna 9, 50-204 Wroclaw, Poland 5 Ogólnopolskie Sympozjum FENS Warszwa, 2010 J. Miśkiewicz IFT Miary korelacji

Transcript of hist close ultra 100 mean · W gospodarce przedsiębiorstwa wzajemne relacje otaczaj ......

Wstęp Analiza korelacji Przykłady Podsumowanie

Miary korelacji

Janusz Miśkiewicz

Instytut Fizyki Teoretycznej, Uniwersytetu Wrocławskiego,

pl. M.Borna 9, 50-204 Wrocław, Poland

5 Ogólnopolskie Sympozjum FENSWarszwa, 2010

J. Miśkiewicz IFT

Miary korelacji

Wstęp Analiza korelacji Przykłady Podsumowanie

Zagadnienie

◮ Istotą układów ekonomicznych jest ich wzajemneoddziaływanie (konkurencja, bądź współdziałanie).

◮ W fizyce zwykle budujemy model, który jest następnieweryfikowany doswiadczalnie.

◮ W gospodarce przedsiębiorstwa wzajemne relacje otaczajątajemnicą.

J. Miśkiewicz IFT

Miary korelacji

Wstęp Analiza korelacji Przykłady Podsumowanie

Zagadnienie

◮ W ekonomii istotnymi i naturalnymi są pytania o wzajemnerelacje:

◮ Czy dane podmioty są od siebie zależne?◮ Jeżeli tak to który jest dominujący?◮ Czy są niezależne wzajemnie, ale współzależne od podmiotu

trzeciego.◮ Jaki jest stopień zależności?

J. Miśkiewicz IFT

Miary korelacji

Wstęp Analiza korelacji Przykłady Podsumowanie

Zagadnienie

◮ W ekonomii istotnymi i naturalnymi są pytania o wzajemnerelacje:

◮ Czy dane podmioty są od siebie zależne?◮ Jeżeli tak to który jest dominujący?◮ Czy są niezależne wzajemnie, ale współzależne od podmiotu

trzeciego.◮ Jaki jest stopień zależności?

Korelacje

A = f (B)

J. Miśkiewicz IFT

Miary korelacji

Wstęp Analiza korelacji Przykłady Podsumowanie

Algorytm standardowy

◮ Miara odległości

◮ Macierz odległości

◮ Drzewo MST

◮ Własności otrzymanego drzewa MST: podmioty dominujące,klasyfikacja gałęzi przemysłu, analiza hierarchii itp.

J. Miśkiewicz IFT

Miary korelacji

Wstęp Analiza korelacji Przykłady Podsumowanie

Odległość ultrametryczna (UD)

◮ Definicja

DU(A,B)(t,T ) =

√1

2(1 − corr(t,T )(A,B)), (1)

corr(t,T )(A,B) =〈AB〉(t,T ) − 〈A〉(t,T )〈B〉(t,T )√

(〈A2〉(t,T ) − 〈A〉2(t,T ))(〈B2〉(t,T ) − 〈B〉2(t,T ))

,

(2)R. Mantegna, H. E. Stanley “An Introduction to

Econophysics”, Cambridge University Press, 2000

J. Miśkiewicz IFT

Miary korelacji

Wstęp Analiza korelacji Przykłady Podsumowanie

Własności UD

Zalety

◮ Właściwie klasyfikuje podmioty w kontekście optymalizacjiportfela.

◮ Wynika z teorii portfela optymalnego.

◮ Powszechnie stosowana.

◮ Weryfikuje korelacje liniowe.

J. Miśkiewicz IFT

Miary korelacji

Wstęp Analiza korelacji Przykłady Podsumowanie

Własności UD

Wady

◮ Odległość ultrametryczna rów.(1) bada korelacje liniowe◮ ai = i + w(0.5), bi = a2

i + w(0.5); g1(n) = DU(A,B)◮ ai = i + w(0.5), bi = a3

i + w(0.5); g2(n) = DU(A,B)◮ ai = i + w(0.5), bi = a4

i + w(0.5); g3(n) = DU(A,B)

0

0.05

0.1

0.15

0.2

0.25

0.3

0 200 400 600 800 1000

DU

n

g1(n)g2(n)g3(n)

J. Miśkiewicz IFT

Miary korelacji

Wstęp Analiza korelacji Przykłady Podsumowanie

Własności UD

Wady

◮ Odległość ta jest bardzo wrażliwa na zakłócenia (szum).◮ 〈A〉 = 0.5, 〈B〉 = 0.5; f1(n) = DU(A,B)◮ 〈A〉 = 0.5, 〈B〉 = 0.0; f2(n) = DU(A,B)◮ 〈A〉 = 0.5, bi = 5 ∗ ai + w(0.5); f3(n) = DU(A,B)

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

0 200 400 600 800 1000

DU

n

f1(n)f2(n)f3(n)

J. Miśkiewicz IFT

Miary korelacji

Wstęp Analiza korelacji Przykłady Podsumowanie

Własności UD

Wady

◮ Niech X będzie zmienną losową o skończonej warincji i funkcjąrozkładu pr. f (x) symetryczną względem wartości średniej tzn.f (x) = f (−x) dla x ∈ (−∞,∞). Wtedy definując zmiennąlosową Y = |X | otrzymujemy

corr(X ,Y ) = 0

J. Miśkiewicz IFT

Miary korelacji

Wstęp Analiza korelacji Przykłady Podsumowanie

Własności UD

Wady

◮ Jeżeli układ badany potraktujemy schematycznie:

Układ 1 ⇔ Układ 2

J. Miśkiewicz IFT

Miary korelacji

Wstęp Analiza korelacji Przykłady Podsumowanie

Własności UD

Wady

◮ Jeżeli układ badany potraktujemy schematycznie:

Układ 1 ⇔ Układ 2

⇑ ⇑

szum szum

J. Miśkiewicz IFT

Miary korelacji

Wstęp Analiza korelacji Przykłady Podsumowanie

Własności UD

Wady

Zakładając, że szum pojawia się w obu szeregach czasowychoraz że jest to szum biały,

A = A + WA, B = B + WB

bezpośrednim rachunkiem można pokazać, że

DU(A,B)(t,T ) =

√√√√1

2(1 −

〈AB〉 − 〈A〉〈B〉√(〈A2〉+ 〈W 2

A〉 − 〈A〉2)(〈B2〉+ 〈W 2

B〉 − 〈B〉2)

).

J. Miśkiewicz IFT

Miary korelacji

Wstęp Analiza korelacji Przykłady Podsumowanie

Odległości alternatywne

◮ Odległość Manhattan i odległości pochodne.◮ W podstawowej formie: DM(A,B) =

∑n

i=1|ai − bi |

◮ oraz uśredniona po długości szeregu:

DM(A,B) = 1

n

∑n

i=1|ai − bi |

◮ Zalety◮ Większa odporność na szum: np. dla ai > bi > 0 zakłócenie w

postaci A + W ,B + W , gdzie W jest białym szumem, ulegnie

zredukowaniu.◮ Ponadto dla miary DM należy zauważyć, że jest ona funkcją

długości szeregu czasowego.

J. Miśkiewicz IFT

Miary korelacji

Wstęp Analiza korelacji Przykłady Podsumowanie

Odległości alternatywne

Poczyńmy obserwację:

0

5

10

15

20

25

30

0 2 4 6 8 10

A,B

n

f(x)=2x, g(x)=3x

0

50

100

150

200

250

300

0 2 4 6 8 10A

,B

n

f(x)=2x, g(x)=3x2

J. Miśkiewicz IFT

Miary korelacji

Wstęp Analiza korelacji Przykłady Podsumowanie

Klasyfikacja korelacji

Aproksymując dyskretną zmienną długości ciągu zmienną ciągłą izakładając, że ai > bi

DM(A,B)(n) ≃

∫n

0

(a(t)− b(t)) dt

Wtedy funkcję korelacji można znaleźć jako:

f (n) =d(DM(A,B)(n))

dn,

J. Miśkiewicz IFT

Miary korelacji

Wstęp Analiza korelacji Przykłady Podsumowanie

Klasyfikacja korelacji

Szeregi badane:xi = ti + w(0.5),y1i= x2

i+ w(0.5),

y2i= x3

i+ w(0.5),

y3i= x4

i+ w(0.5).

-15

-10

-5

0

5

10

15

20

25

30

1 2 3 4 5 6 7 8 9 10D

Un

g1(n)g2(n)g3(n)f1(n)f2(n)f3(n)

Współczynniki kierunkowe dofitowanych prostych są:a1 ≈ 2.91, a2 ≈ 3.91, a3 ≈ 4.87, co obliczeniu pochodnej dajefunkcje wyjściowe.

◮ Miara Manhattan daje możliwość oszacowania charakterukorelacji pomiędzy podmiotami.

J. Miśkiewicz IFT

Miary korelacji

Wstęp Analiza korelacji Przykłady Podsumowanie

Przykład

Porównanie PKB Francji i Belgii – odległość DM

1970 1980 1990 20000

5.0´1011

1.0´1012

1.5´1012

2.0´1012

2.5´1012

2.4 2.6 2.8 3.0 3.2 3.4 3.6

29.0

29.5

30.0

30.5

31.0

Parametry dofitowanej prostej: y= 2.00x+ 23.82

J. Miśkiewicz IFT

Miary korelacji

Wstęp Analiza korelacji Przykłady Podsumowanie

Odległości alternatywne

◮ Odległości oparte na entropii.◮ Shanonna

S = −∑

i

pi ln pi

◮ Indeksie Theila

ThA(t,T ) =

t∑

i=t−T

(Ai∑t

j=t−T Aj

lnAi

〈A〉(t,T ))

◮ Kullbacka-Leiblera

d(p|q) =∑

pi lnpi

qi

,

J. Miśkiewicz IFT

Miary korelacji

Wstęp Analiza korelacji Przykłady Podsumowanie

Odległości alternatywne

◮ Entropia Shannona i index Theila transformują szeregi czasowedo szeregów entropii (zależne od długości okna czasowego)nastepnie do obliczenia odległości można zastosować zarównoodległość DU jak i DM.

◮ Miary oparte na entropii porównują złożoność informacyjnąszeregów czasowych.

◮ Entropia Shannona i Kullbacka-Leiblera wymaga poznaniafunkcji rozkładu prawdopodobieństwa.

J. Miśkiewicz IFT

Miary korelacji

Wstęp Analiza korelacji Przykłady Podsumowanie

Struktury sieciowe

◮ Minimalne drzewo rozpinające (MST)

◮ Łańcuch dwukierunkowy (BMLP)Konstrukcja rozpoczyna się od znalezienia najbliższychsąsiadów. Następnie poszukuje się najbliższego sąsiada dokażdego z końców i przyłączany jest bliższy z nich.

◮ Łańcuch jednokierunkowy (UMLP)Pierwszy element sieci jest narzucony, następnie do niego jestprzyłączany najbliższy sąsiad, który staje się końcem sieci.Węzły są przyłączane do końca sieci.

J. Miśkiewicz IFT

Miary korelacji

Wstęp Analiza korelacji Przykłady Podsumowanie

Ewolucja giełdy

Jako ilustrację własności odległości UD i ThD przedstawionezostaną własności sieci ewoluujących MST, BMLP i UMLP dlanastępujących grupy podmiotów giełdowych:

◮ WIG20: PEKAO, PKO BP, KGHM, PKN ORLEN, TPSA, BZWBK, ASSECO POLAND, CEZ, GETIN HOLDING, GTC,TVN, PBG, POLIMEXMS, BRE, LOTOS, CYFROWYPOLSAT, BIOTON.

◮ Wartości odpowiadają notowaniom zamkniecia w czasie od05.01.2009 do 30.04.2010.

J. Miśkiewicz IFT

Miary korelacji

Wstęp Analiza korelacji Przykłady Podsumowanie

Ewolucja giełdy

◮ S&P 500: ABB Ltd.( ABB), Apple Inc. (AAPL), Boeing Co.(BA), the Coca-Cola Company (KO), Emerson Electric Co.(EMR), General Electric Co. (GE), Hewlett-Packard Company(HPQ), Hitachi Ltd. (HIT), IBM (IBM), Intel Corporation(INTC), Johnson & Johnson (JNJ), Lockheed MartinCorporation (LMT), Microsoft Co. (MSFT), NorthropGrumman Corporation (NOC), Novartis AG (NVS),Colgate-Palmolive Co. (CL), Pepsico Inc. (PEP), Procter &Gamble Co. (PG), Tower Semiconductor LTD. (TSEM),Wisconsin Energy Corporation Co. (WEC).

◮ Wartości odpowiadają notowaniom zamkniecia w czasie od02.01.2009 to 30.04.2010.

J. Miśkiewicz IFT

Miary korelacji

Wstęp Analiza korelacji Przykłady Podsumowanie

NVS NOC LMT

HIT

JJJJJJJJJBA GE

ssssssssss

AAPL HPQ EMR ABB IBM

CL PG

ttttttttt

INTC TSEM

PEP KO JNJ MSFT

WEC

J. Miśkiewicz IFT

Miary korelacji

Wstęp Analiza korelacji Przykłady Podsumowanie

GPW

0.01

0.02

0.03

0.04

0.05

0.06

0.07

0.08

0.09

0.1

0.11

2009.06.01 2009.10.21 2010.03.15

mea

n di

stan

ce

time

ThD, WIG20, T1=50 days, T2=50 days

BMLPUMLP

MST

0.38

0.4

0.42

0.44

0.46

0.48

0.5

2009.06.01 2009.10.21 2010.03.15m

ean

dist

ance

time

UD, GPW, time window=100 days

BMLPUMLP

MST

J. Miśkiewicz IFT

Miary korelacji

Wstęp Analiza korelacji Przykłady Podsumowanie

S&P 500

0

0.01

0.02

0.03

0.04

0.05

0.06

0.07

0.08

2009.06.01 2009.10.21 2010.03.15

mea

n di

stan

ce

time

ThD, S&P 500, T1=50 days, T2=50 days

BMLPUMLP

MST

0.4

0.42

0.44

0.46

0.48

0.5

0.52

0.54

0.56

0.58

2009.06.01 2009.10.21 2010.03.15m

ean

dist

ance

time

UD, S&P 500, time window=100 days

BMLPUMLP

MST

J. Miśkiewicz IFT

Miary korelacji

Wstęp Analiza korelacji Przykłady Podsumowanie

Wnioski

◮ Odległość ultrametryczna upraszcza wybór podmiotów przykonstrukcji portfela.

◮ Odległość ultrametryczna bada czy istnieją korelacje liniowe,jest jednak wrażliwa na szum.

◮ Odległość Manchattan umożliwia kategoryzację korelacji jestteż bardziej odporna na szum.

◮ Odległości oparte na entropii pozwalają zaobserwowaćobecność czynników zewnętrznych.

J. Miśkiewicz IFT

Miary korelacji