Korelacje, regresja prosta

19
Korelacje, regresja prosta Liniowe współzależności pomiędzy zmiennymi

description

Korelacje, regresja prosta. Liniowe współzależności pomiędzy zmiennymi. KORELACJA LINIOWA PEARSONA. Korelacja: miara powiązania pomiędzy dwiema lub większą liczbą zmiennych Wartość współczynnika korelacji liniowej Pearsona: z przedziału od -1 do +1 - PowerPoint PPT Presentation

Transcript of Korelacje, regresja prosta

Page 1: Korelacje, regresja prosta

Korelacje, regresja prosta

Liniowe współzależności pomiędzy zmiennymi

Page 2: Korelacje, regresja prosta

KORELACJA LINIOWA PEARSONA

Korelacja: miara powiązania pomiędzy dwiema lub większą liczbą zmiennych

Wartość współczynnika korelacji liniowej Pearsona:

z przedziału od -1 do +1 Wartość -1 reprezentuje doskonałą korelację

ujemną Wartość +1 reprezentuje doskonałą korelację

dodatnią Wartość 0 wyraża brak korelacji.

Page 3: Korelacje, regresja prosta

KORELACJA LINIOWA PEARSONA

Page 4: Korelacje, regresja prosta

KORELACJA LINIOWA PEARSONA

Zależność wprostproporcjonalna

Zależność odwrotnie proporcjonalna

Page 5: Korelacje, regresja prosta

KORELACJA LINIOWA PEARSONA

R2 – współczynnik determinacji:

wartość r Pearsona podniesiona do kwadratu

Wyraża proporcję wspólnej zmienności dwóch zmiennych (tzn. siłę lub wielkość powiązania).

Page 6: Korelacje, regresja prosta

KORELACJA LINIOWA PEARSONA

Aby ocenić korelację pomiędzy zmiennymi należy znać:

wartość r (siła korelacji) znak +/- przy r (zależność wprost/odwrotnie

proporcjonalna) poziom istotności p współczynnika r (określa,

czy korelacje jest/nie jest statystycznie istotna)

Page 7: Korelacje, regresja prosta

KORELACJA LINIOWA PEARSONA

Macierze korelacji:

tabela współczynników korelacji pomiędzy wieloma zmiennymi

jedna lista zmiennych -> kwadratowa macierz korelacji (każdy z każdym)

dwie listy zmiennych -> prostokątna macierz korelacji

Page 8: Korelacje, regresja prosta

REGRESJA LINIOWA

Regresja liniowa jest rozszerzeniem korelacji liniowej i pozwala na:

graficzną prezentację linii prostej dopasowanej do wykresu rozrzutu

określenie równania opisujące zależność dwóch zmiennych w postaci y = a * x + b

zmienna zależna

zmienna niezależna

współczynnik kierunkowy prostej

wyraz wolny

Page 9: Korelacje, regresja prosta

REGRESJA LINIOWA

Równanie regresji liniowej

Przedział ufności

Statystyki dopasowania

liniowego

Page 10: Korelacje, regresja prosta

REGRESJA LINIOWA

Równanie regresji liniowej

O2 ROZP = 12.72 – 0.11*TEMP

y = a*x +b

Page 11: Korelacje, regresja prosta

REGRESJA LINIOWA

W jaki sposób wyznaczana jest linia regresji liniowej?

przez minimalizację sumy kwadratów odchyleń punktów doświadczalnych od linii regresji

Page 12: Korelacje, regresja prosta

REGRESJA LINIOWA

Page 13: Korelacje, regresja prosta

KORELACJA LINIOWA PEARSONA / REGRESJA LINIOWA

Zagrożenia wiarygodności wniosków:

problem obserwacji odstających

inny kształt zależności

Page 14: Korelacje, regresja prosta

KORELACJA LINIOWA PEARSONA / REGRESJA LINIOWA

Obserwacje odstające:

wartości nietypowe, występujące rzadko

punkty nie pokrywające się z rozkładem pozostałych danych

mogą odzwierciedlać rzeczywiste własności badanego zjawiska LUB być tylko anomalią, błędem pomiarowym

Page 15: Korelacje, regresja prosta

KORELACJA LINIOWA PEARSONA / REGRESJA LINIOWA

Obserwacje odstające:

mają duży wpływ na współczynnik kierunkowy linii regresji i w konsekwencji na wartość współczynnika korelacji

Nawet jedna obserwacja odstająca może poważnie zmienić współczynnik korelacji. - sztucznie zwiększyć lub zmniejszyć jego wartość.

Page 16: Korelacje, regresja prosta

KORELACJA LINIOWA PEARSONA / REGRESJA LINIOWA

Obserwacje odstające- jak z nimi postępować?:

wyklucza się obserwację, która wychodzi poza przedział obejmujący ±2 odchylenia standardowe (lub nawet ±1,5 odchylenia standardowego) od wartości średniej

Zdefiniowanie tego, co uznajemy za obserwację odstającą, jest sprawą subiektywną i decyzję o identyfikacji odstających obserwacji musi badacz podejmować opierając się na swoim doświadczeniu oraz powszechnie akceptowanej praktyce w danej dziedzinie badań.

Page 17: Korelacje, regresja prosta

KORELACJA LINIOWA PEARSONA / REGRESJA LINIOWA

Obserwacje odstające- jak z nimi postępować?:

przekształcenie log(x+1)

Ogranicza ono rozrzut zmiennych, eliminuje wpływ wartości dominujących, błędów pomiarowych

Page 18: Korelacje, regresja prosta

KORELACJA LINIOWA PEARSONA / REGRESJA LINIOWA

Kształt zależności:

Odstępstwa od liniowości spowodują wzrost sumy kwadratów odchyleń od linii regresji, nawet jeśli reprezentują one prawdziwy i ścisły związek dwóch zmiennych

Analizowanie wykresów rozrzutu jest niezbędnym elementem analizy przy obliczaniu korelacji i regresji liniowej

Page 19: Korelacje, regresja prosta

KORELACJA LINIOWA PEARSONA / REGRESJA LINIOWA