Post on 07-Dec-2014
description
Podstawy statystyki dla psychologów
Zajęcia 5
Karol Wolski
Korelacja i predykcja
• Korelacja – miara siły związku pomiędzy dwiema zmiennymi
• Predykcja – oszacowanie wartości jednej zmiennej na podstawie wartości drugiej zmiennej (zmienne muszą być skorelowane) – im wyższa korelacja tym dokładniejsza predykcja
Diagram rozrzutu
Diagram rozrzutu
• Pozwala nam ocenić z jakiego typu związkiem między zmiennymi mamy do czynienia
– Czy jest to związek liniowy czy krzywoliniowy
Diagram rozrzutu
• Pozwala nam ocenić z jakiego typu związkiem między zmiennymi mamy do czynienia
– Czy jest to związek dodatni czy ujemny
Korelacja
• Zakłada, że analizowane zmienne powiązane są liniowo
• Może być ujemna lub dodatnia – Korelacja dodatnia – związek liniowy, w którym
wysokie wyniki pierwszej zmiennej idą w parze z wysokimi wynikami drugiej zmienne, a niskie z niskimi
– Korelacja ujemna – związek liniowy, w którym wysokie wyniki jednej zmiennej idą w parze z niskimi wynikami drugiej zmiennej i odwrotnie
Korelacja – kierunek związku
• Korelacja dodatnia vs ujemna
Korelacja – siła związku
• Korelacje różnią się miedzy sobą nie tylko kierunkiem ale również siłą związku
Korelacja – siła związku
• Siłę związku wyraża się za pomocą współczynnika korelacji
• Najpopularniejszym współczynnikiem korelacji jest współczynnik korelacji według momentu iloczynowego
– CZYLI współczynnik r Pearsona
– Inaczej r
Korelacja – siła związku
• Współczynnik r przyjmuje wartości od -1 do +1
– -1 oznacza idealną korelacją ujemną
– +1 oznacza idealną korelację ujemną
– 0 oznacza brak korelacji
• r<0 NIE oznacza braku korelacji – oznacza korelację ujemną!
Korelacja – siła związku
Korelacja – siła związku
Jak policzyć współczynnik korelacji Pearsona
• Z wykorzystaniem wyników z
– 𝑟 = (𝑧𝑥𝑧𝑦)
𝑛
• n – liczba par wyników
• Z wykorzystaniem odchylenia wyników
– 𝑟 = 𝑋−𝑋 (𝑌−𝑌 )
𝑛 𝑆𝑥𝑆𝑦
• Z wykorzystaniem wyników surowych
– 𝑟 = 𝑋−𝑋 (𝑌−𝑌 )
(𝑋−𝑋 )2 (𝑌−𝑌 )2=
𝑋−𝑋 (𝑌−𝑌 )
(𝑆𝑆𝑋)(𝑆𝑆𝑌)
Nie tylko r Pearsona
• Współczynnik korelacji rangowej Spearmana
– 𝑟𝑠 lub rho
• 𝑟𝑠 = 1 −6 𝐷2
𝑛 (𝑛2−1)
– D – różnica między parą rang
– n – liczba par rang
• W przypadku braku rang wiązanych współczynniki Pearsona oraz Spearmana przyjmują tę samą wartość
Dygresja - rangowanie
• W przypadku rangowania powtarzających się wyników, stosujemy tak zwane rangi wiązane
– Przydzielenie każdemu wynikowi średniej wartości z tang, które przypisalibyśmy im, gdyby wyniki nie były takie same
• Zbiór danych 4 5 5 8 11 11 11 15 19
• Rangi: 1 2,5 2,5 4 6 6 6 8 9
Korelacja a przyczynowość
• Na podstawie korelacji NIE możemy wnioskować o przyczynowości
Korelacja – właściwości
• Na wielkość współczynników r oraz rho nie ma wpływu żadna liniowa transformacja wyników: dodawania, odejmowanie, mnożenie, dzielenie
Korelacja – parę uwag
• Obliczanie współczynników korelacji jest odpowiednie tylko wtedy gry mamy do czynienia ze związkami liniowymi – W przypadku związków nieliniowych, współczynnik
korelacji zostanie niedoszacowany
• Współczynnik korelacji jest wrażliwy na zakres zmienności charakteryzujący pomiaru oby zmiennych – Im mniejszy zakres zmienności tym mniejsza wartość
bezwzględna współczynnika korelacji (jeśli inne elementy pozostają niezmienione)
Korelacja – parę uwag
• Współczynnik korelacji jest wrażliwy na zmienność próby
– Im mniejsza próba tym jest on bardziej niestabilny
Korelacja – parę uwag
• Nie ma czegoś takiego jak „unikatowy” współczynnik korelacji dla jakiś dwóch zmiennych
– Korelacji zależy od wielu czynników np. sposobu pomiaru dlatego zawsze trzeba podawać dokładny opis warunków badania oraz charakterystykę zbioru danych
– Korelacja zmiennej A i B może różnić się pomiędzy badaniami
• Zajęcia opracowanie na podstawie
– Statystyka dla psychologów i pedagogów, King i Minium, PWN 2009