Korelacje New

44
 Korelacje

Transcript of Korelacje New

Page 1: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 1/51

Korelacje

Page 2: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 2/51

Korelacja

• Korelacja to związek między zmiennymi- sytuacja, w której zmianom wartości

 jednej zmiennej towarzyszy zmiana

wartości drugiej – skorelowanej z niązmiennej.• Miarą siły i kierunku oraz kształtu związku

 jest współczynnik korelacji (dla

zmiennych porządkowych i ilościowych)lub współczynnik kontyngencji (dlazmiennych nominalnych)

Page 3: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 3/51

Korelacja

• Należy zwrócić uwagę, że nawet wysokawartość współczynnika korelacji(kontyngencji) nie świadczy o związku

przyczynowo – skutkowym, ale jedynie owspółwystępowaniu cech, czywspółzmienności.

Page 4: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 4/51

Współczynnik r Pearsona

• Do pomiaru siły związku międzyzmiennymi interwałowymi służyć możewspółczynnik korelacji r Pearsona.

• Przyjmuje on wartości do -1 (dla bardzosilnych związków ujemnych) do + 1 (dlabardzo silnych związków dodatnich(Uwaga stosuje się go wyłącznie do

interpretacji związków liniowych)

Page 5: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 5/51

Silny związek dodatni r ~ 1

Page 6: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 6/51

Silny związek ujemny r ~ -1

Page 7: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 7/51

Brak związku - r ~ 0

Page 8: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 8/51

Brak związku liniowego - r ~ 0

Page 9: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 9/51

Związek między zmiennymiilościowymi

Page 10: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 10/51

Związek między zmiennymiilościowymi

• Obliczamy kowariancję według wzoru:

88,610

8,68))((

cov

 N 

Y Y  X  X 

 xy

Page 11: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 11/51

Związek między zmiennymiilościowymi

• Kowariancja jest matematycznymwskaźnikiem współzmienności.Wystandaryzowanie jej pozwala na

uzyskanie współczynnika r Pearsona,który umożliwia ocenę kierunku i siłyzwiązku między zmiennymi.

Page 12: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 12/51

Związek między zmiennymiilościowymi

• Współczynnik r Pearsona

 y x

 xy

 s s

r  cov

Page 13: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 13/51

Związek między zmiennymiilościowymi

• Odchylenia standardowe dla zmiennej x i ymożemy obliczyć ze skróconego wzoru:

22

 

 

 

   N 

 X 

 N 

 X  s x

Page 14: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 14/51

Związek między zmiennymiilościowymi

Page 15: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 15/51

Związek między zmiennymiilościowymi

87,210

55

10

385222

 

  

  

  

 

 N 

 X 

 N 

 X  s x

40,210

40,84

10

84,769222

 

  

 

 

 

 

 

 N 

 N 

Y  s y

Page 16: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 16/51

Związek między zmiennymiilościowymi

99,0

40,2*87,2

88,6cov

 y x

 xy

 s s

Otrzymana wartość świadczy obardzo silnym związku dodatnim

między zmiennymi X i Y .

Page 17: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 17/51

Związek między zmiennymiilościowymi

])(][)([

))((

2222  y y N  x x N 

 y x xy N r 

Page 18: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 18/51

Page 19: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 19/51

99,040,575*825

688

)712340,7698)(30253850(

46425330

)40,8484,769*10)(55385*10(

40,84*55533*10

])(][)([

))((

22

2222

 y y N  x x N 

 y x xy N r 

Page 20: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 20/51

Związek między zmiennymiilościowymi

• Kwadrat współczynnika korelacjinazywany jest WSPÓŁCZYNNIKIEMDETERMINACJI – pokazuje ona w jakim

stopniu zmienność jednej zmiennejwyjaśniana jest przez drugą zmienną.

• W naszym przykładzie r 2 = (0,99)2=0,98lub 98 %

Page 21: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 21/51

Dane porządkowe

• Dla danych porządkowych korzystamy np..ze współczynnika r s Spearmana –opartego na różnicach rang pomiarów.

• Przed obliczeniem r s Spearmana należypomiary PORANGOWAĆ.

Page 22: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 22/51

Dane porządkowe

)1(

6

1 2

2

nn

i

 s

gdzie di – różnice między rangami w

parach, a n to liczba par.

Page 23: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 23/51

Dane porządkowe

• Współczynnik r s Spearmanapodobnie jak r Pearsonaprzyjmuje wartości do -1 (dlabardzo silnych związkówujemnych) do + 1 (dla bardzosilnych związków dodatnich.

Page 24: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 24/51

Współczynnik r s Spearmana

• Badano, czy istnieje związek międzyśrednią ocen z ostatniego semestru, aodczuwaną satysfakcją ze studiów.

• Obie zmienne wyrażone są na skaliporządkowej i przyjmują następującewartości:

Page 25: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 25/51

Współczynnik r s Spearmana

Page 26: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 26/51

Porangowano pomiary

Page 27: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 27/51

Rangi wpisano do tabeli

Page 28: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 28/51

Współczynnik r s Spearmana

71,0990

285

1

)1100(10

50,47*61

)1(

61

2

2

 s

i

 s

nn

d r 

Page 29: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 29/51

Współczynnik r s Spearmana

• Uzyskany wynik wskazuje naumiarkowanie silny związek dodatnimiędzy zmiennymi:

• r s=0,71• r s2=0,50

Page 30: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 30/51

Korelacje w SPSSKorelacje

Bieżącewynagrodz

enieStaż pracy(miesiące)

Wykształcenie(w latach

nauki)

Początkowewynagrodze

nie

Korelacja Pearsona 1 ,084 ,661(**) ,880(**)

Istotność (dwustronna),067 ,000 ,000

Bieżące wynagrodzenie

N 474 474 474 474

Korelacja Pearsona ,084 1 ,047 -,020

Istotność (dwustronna) ,067 ,303 ,668

Staż pracy (miesiące)

N 474 474 474 474

Korelacja Pearsona ,661(**) ,047 1 ,633(**)

Istotność (dwustronna) ,000 ,303 ,000

Wykształcenie (w latachnauki)

N474 474 474 474

Korelacja Pearsona ,880(**) -,020 ,633(**) 1

Istotność (dwustronna) ,000 ,668 ,000

Początkowewynagrodzenie

N 474 474 474 474

** Korelacja jest istotna na poziomie 0.01 (dwustronnie).

Gdy istotność dla współczynnika korelacji jest większa od 0,05 –

stwierdzamy, iż pomiędzy zmiennymi nie ma związku – nie interpretujemynieistniejącego związku !Gdy istotność jest mniejsza/równa od 0,05 – mówimy o istnieniuzwiązku i staramy się go opisać (jego siłę, kierunek ), a przy zmiennychnominalnych charakter związku.

Page 31: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 31/51

Poziom istotności

• Przed rozpoczęciem interpretacjiwspółczynnika korelacji badacz musirównież dokonać oceny poziomu

istotności dla danego współczynnikakorelacji. Hipoteza zerowa, którątestujemy, mówi o tym, że wartość

współczynnika korelacji wynosi 0(czyli nie ma związku międzyzmiennymi).

Page 32: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 32/51

Rodzaje błędów

błąd drugiegorodzajuOK.Przyjęcie H0

Odrzucenie H0

błąd pierwszegorodzaju

H0 jestprawdziwa

OK.

Ho jest fałszywa

Page 33: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 33/51

Poziom istotności

• Poziom  – prawdopodobieństwopopełnienia błędu pierwszego rodzaju

= poziom istotności testu

• Graniczny poziom istotności stosowanym.in. w naukach społecznych wynosi

0,05.

Page 34: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 34/51

Poziom istotności

8,1902,0

899,099,01

21099,01

222

 N r t 

2

1

2

 N r t 

• Weryfikacja hipotezy zerowej odbywa się przy pomocystatystyki testowej wyrażonej wzorem:

W naszym przykładzie (dla r Pearsona) wartość ta wyniesie:

Page 35: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 35/51

Poziom istotności

• Obliczoną statystykę t porównujemy zwartością t krytyczną odczytaną z tablicrozkładu t Studenta. Do odczytania

wartości potrzebna jest nam liczba stopniswobody (df), która jest równa

• df= 10-2 = 8

• Odczytana z tablic wartość krytyczna t dla

df= 8 i p=0,05 jest równa 2,306.

Page 36: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 36/51

Page 37: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 37/51

Poziom istotności

• Hipotezę zerową (r=0) odrzucamy wówczas, gdyspełniony jest warunek:

• Jak widać powyżej obliczone t =19,8 jestwiększe od krytycznego t =2,306 , oznacza to,że możemy odrzucić hipotezę zerową, czyliobliczony współczynnik korelacji jest istotny(prawdopodobieństwo popełnienia błędu jestniższe od założonego p=0,05).

kryt obl  t t 

Page 38: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 38/51

Poziom istotności

• Analogicznie postępujemy w przypadkudanych porządkowych. Wartość tobliczamy z wzoru:

• Obliczoną wartość porównujemy z tkrytycznym odczytanym z tablic rozkładu ti podejmujemy decyzję w sposób opisanypowyżej.

21

2

 s

 s

 N r t 

Page 39: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 39/51

Dane nominalne

• Badano sympatie polityczne w trzechwojewództwach. Respondenci wskazywalina swoją ulubioną partię.

• Sprawdź, czy istnieje związek międzymiejscem zamieszkania, a sympatiami

politycznymi

Page 40: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 40/51

Dane nominalne

201515Wojew.3

52025Wojew.2

151510Wojew.1

Opcja COpcja BOpcja A

Page 41: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 41/51

Dane nominalne• Obliczamy wartości oczekiwane dla

poszczególnych komórek

• Np.:c+f+i

i

c

g+h+ihg

Nb+e+ha+d+g

d+e+f ed

a+b+cba

 N  g d acbaea))((

Page 42: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 42/51

14,79suma:

2,2832,605,7114,2920i

0,468,18-2,8617,8615h

0,468,18-2,8617,8615g

6,0486,30-9,2914,295f 0,264,582,1417,8620e

2,8550,987,1417,8625d

1,1212,743,5711,4315c

0,040,500,7114,2915b

1,2918,40-4,2914,2910a

(o-e)2/e(o-e)2(o-e)eo

D i l

Page 43: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 43/51

Dane nominalne

Im większe różnice między wartościamioczekiwanymi (o), a obserwowanymi (e) tymsilniejszy związek między zmiennymi .

• Suma ostatniej kolumny to wartość 2 – jegowartość nie pozwala na bezpośrednieoszacowanie siły związku, dlatego na jegopodstawie obliczamy współczynniki

kontyngencji Fi Yula i V Cramera

D i l

Page 44: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 44/51

Dane nominalne• Dla tablic czteropolowych stosujemy współczynnik Fi

(φ) Yula. Przyjmuje on wartości od 0 (brak do związku)

do 1 (silny związek)

• N – liczba osób w tabeli N 

2

   

Dane nominalne

Page 45: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 45/51

Dane nominalne

• W przypadku tablic o większej liczbie pólstosujemy współczynnik V Cramera, któryinterpretujemy podobnie jak φYula.

• min (w-1:k-1) oznacza mniejszą z dwóch

wartości: liczba wierszy minus 1 lub liczbakolumn minus 1

)1;1min(

2

k w N V   

Dane nominalne

Page 46: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 46/51

Dane nominalne

• W naszym przykładzie tabela jest 9 -polowa, zatem do oceny związku międzymiejscem zamieszkania a preferencjamipolitycznymi należy użyć współczynnikkontyngencji V Cramera.

Dane nominalne

Page 47: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 47/51

Dane nominalne

23,02*14079,14

)1;1min(

2

k w N V   

Obliczona wartość współczynnika V świadczy obardzo słabym związku między zmiennymi.

Należy pamiętać, iż w przypadku danych nominalnych przyinterpretacji należy również opisać charakter związku – np. wwojewództwie 1 przeważają zwolennicy opcji B i C, a wwojewództwie 2 zwolennicy opcji A

Page 48: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 48/51

Poziom istotności

• Podobnie jak w przypadkuwspółczynników korelacji musimyokreślić poziom istotności

obliczonego współczynnika.• Pomocny nam będzie rozkład chi

kwadrat, w którym odczytamy

wartość krytyczną statystyki testowej.

Page 49: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 49/51

Poziom istotności

• W tablicy rozkładu 2 odczytujemy wartość2

dla liczby stopni swobody:

• df=(w-1*k-1) = (3-1)*(3-1) = 4

• Odczytana wartość 2 wynosi: 9,488

Page 50: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 50/51

Page 51: Korelacje New

5/17/2018 Korelacje New - slidepdf.com

http://slidepdf.com/reader/full/korelacje-new 51/51

Poziom istotności

• Wartość 2wynosi 9,488

• Wartość 2obl wynosi 14,79

• Jak widać 2

obl > 2

• oznacza to, że możemy odrzucić hipotezęzerową, czyli obliczony współczynnikkontyngencji jest istotny (prawdopodobieństwo

popełnienia błędu jest niższe od założonegop=0,05).