ANALIZA KORELACJI I REGRESJI

139
Zale˙ zno´ sci korelacyjne Regresja liniowa ANALIZA KORELACJI I REGRESJI Agnieszka Rossa Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Transcript of ANALIZA KORELACJI I REGRESJI

Page 1: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

ANALIZA KORELACJI I REGRESJI

Agnieszka Rossa

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 2: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Szkic wykładu

1 Zaleznosci korelacyjne

2 Regresja liniowa

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 3: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Zaleznosci korelacyjnePrzykłady

Badajac róznego rodzaju zjawiska, np. społeczne,ekonomiczne, psychologiczne, przyrodniczne itp.stwierdzamy niemal zawsze, ze kazde z nich jestuwarunkowane działaniem innych zjawisk.

Istnienie zwiazków pomiedzy zjawiskamicharakteryzujacymi badane zbiorowosci bywa czestoprzedmiotem dociekan i eksperymentów naukowych.

Przykład: David Buss w publikacji z 2001 roku pt.”Psychologia ewolucyjna. Jak wytłumaczyc społecznezachowania człowieka?”, opisał badanie, w którymsprawdzał, czy istnieje zwiazek miedzy szybkosciachodzenia a pozycja społeczna. Okazało sie, ze zwiazekten jest dosc wyrazny wsród mezczyzn, natomiast wmniejszym stopniu wsród kobiet.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 4: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Zaleznosci korelacyjnePrzykłady

Badajac róznego rodzaju zjawiska, np. społeczne,ekonomiczne, psychologiczne, przyrodniczne itp.stwierdzamy niemal zawsze, ze kazde z nich jestuwarunkowane działaniem innych zjawisk.

Istnienie zwiazków pomiedzy zjawiskamicharakteryzujacymi badane zbiorowosci bywa czestoprzedmiotem dociekan i eksperymentów naukowych.

Przykład: David Buss w publikacji z 2001 roku pt.”Psychologia ewolucyjna. Jak wytłumaczyc społecznezachowania człowieka?”, opisał badanie, w którymsprawdzał, czy istnieje zwiazek miedzy szybkosciachodzenia a pozycja społeczna. Okazało sie, ze zwiazekten jest dosc wyrazny wsród mezczyzn, natomiast wmniejszym stopniu wsród kobiet.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 5: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Zaleznosci korelacyjnePrzykłady

Badajac róznego rodzaju zjawiska, np. społeczne,ekonomiczne, psychologiczne, przyrodniczne itp.stwierdzamy niemal zawsze, ze kazde z nich jestuwarunkowane działaniem innych zjawisk.

Istnienie zwiazków pomiedzy zjawiskamicharakteryzujacymi badane zbiorowosci bywa czestoprzedmiotem dociekan i eksperymentów naukowych.

Przykład: David Buss w publikacji z 2001 roku pt.”Psychologia ewolucyjna. Jak wytłumaczyc społecznezachowania człowieka?”, opisał badanie, w którymsprawdzał, czy istnieje zwiazek miedzy szybkosciachodzenia a pozycja społeczna. Okazało sie, ze zwiazekten jest dosc wyrazny wsród mezczyzn, natomiast wmniejszym stopniu wsród kobiet.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 6: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Zaleznosci korelacyjnePrzykłady

Inny przykład: Allison i Cicchetti w pracy ”Sleep in mammals”(Science, 194, 1976) opisali badania przeprowadzone wsródprzedstawicieli 62 gatunkach ssaków. Przedmiotem obserwacji(pomiarów) były m.in. nastepujace charakterystyki:

długosc snu w ciagu doby (godz/dobe),maksymalna długosci zycia (lata),masa ciała (kg),masa mózgu (g),czas trwania ciazy (dni).

Cel badania: Ustalenie, czy istnieja jakiekolwiek zaleznoscipomiedzy wymienionymi charakterystykami, a jesli tak, to jakajest siła tych zaleznosci.

Wyniki badan: Beda przedstawione dalej.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 7: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Zaleznosci korelacyjnePrzykłady

Inny przykład: Allison i Cicchetti w pracy ”Sleep in mammals”(Science, 194, 1976) opisali badania przeprowadzone wsródprzedstawicieli 62 gatunkach ssaków. Przedmiotem obserwacji(pomiarów) były m.in. nastepujace charakterystyki:

długosc snu w ciagu doby (godz/dobe),

maksymalna długosci zycia (lata),masa ciała (kg),masa mózgu (g),czas trwania ciazy (dni).

Cel badania: Ustalenie, czy istnieja jakiekolwiek zaleznoscipomiedzy wymienionymi charakterystykami, a jesli tak, to jakajest siła tych zaleznosci.

Wyniki badan: Beda przedstawione dalej.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 8: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Zaleznosci korelacyjnePrzykłady

Inny przykład: Allison i Cicchetti w pracy ”Sleep in mammals”(Science, 194, 1976) opisali badania przeprowadzone wsródprzedstawicieli 62 gatunkach ssaków. Przedmiotem obserwacji(pomiarów) były m.in. nastepujace charakterystyki:

długosc snu w ciagu doby (godz/dobe),maksymalna długosci zycia (lata),

masa ciała (kg),masa mózgu (g),czas trwania ciazy (dni).

Cel badania: Ustalenie, czy istnieja jakiekolwiek zaleznoscipomiedzy wymienionymi charakterystykami, a jesli tak, to jakajest siła tych zaleznosci.

Wyniki badan: Beda przedstawione dalej.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 9: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Zaleznosci korelacyjnePrzykłady

Inny przykład: Allison i Cicchetti w pracy ”Sleep in mammals”(Science, 194, 1976) opisali badania przeprowadzone wsródprzedstawicieli 62 gatunkach ssaków. Przedmiotem obserwacji(pomiarów) były m.in. nastepujace charakterystyki:

długosc snu w ciagu doby (godz/dobe),maksymalna długosci zycia (lata),masa ciała (kg),

masa mózgu (g),czas trwania ciazy (dni).

Cel badania: Ustalenie, czy istnieja jakiekolwiek zaleznoscipomiedzy wymienionymi charakterystykami, a jesli tak, to jakajest siła tych zaleznosci.

Wyniki badan: Beda przedstawione dalej.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 10: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Zaleznosci korelacyjnePrzykłady

Inny przykład: Allison i Cicchetti w pracy ”Sleep in mammals”(Science, 194, 1976) opisali badania przeprowadzone wsródprzedstawicieli 62 gatunkach ssaków. Przedmiotem obserwacji(pomiarów) były m.in. nastepujace charakterystyki:

długosc snu w ciagu doby (godz/dobe),maksymalna długosci zycia (lata),masa ciała (kg),masa mózgu (g),

czas trwania ciazy (dni).

Cel badania: Ustalenie, czy istnieja jakiekolwiek zaleznoscipomiedzy wymienionymi charakterystykami, a jesli tak, to jakajest siła tych zaleznosci.

Wyniki badan: Beda przedstawione dalej.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 11: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Zaleznosci korelacyjnePrzykłady

Inny przykład: Allison i Cicchetti w pracy ”Sleep in mammals”(Science, 194, 1976) opisali badania przeprowadzone wsródprzedstawicieli 62 gatunkach ssaków. Przedmiotem obserwacji(pomiarów) były m.in. nastepujace charakterystyki:

długosc snu w ciagu doby (godz/dobe),maksymalna długosci zycia (lata),masa ciała (kg),masa mózgu (g),czas trwania ciazy (dni).

Cel badania: Ustalenie, czy istnieja jakiekolwiek zaleznoscipomiedzy wymienionymi charakterystykami, a jesli tak, to jakajest siła tych zaleznosci.

Wyniki badan: Beda przedstawione dalej.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 12: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Zaleznosci korelacyjnePrzykłady

Inny przykład: Allison i Cicchetti w pracy ”Sleep in mammals”(Science, 194, 1976) opisali badania przeprowadzone wsródprzedstawicieli 62 gatunkach ssaków. Przedmiotem obserwacji(pomiarów) były m.in. nastepujace charakterystyki:

długosc snu w ciagu doby (godz/dobe),maksymalna długosci zycia (lata),masa ciała (kg),masa mózgu (g),czas trwania ciazy (dni).

Cel badania: Ustalenie, czy istnieja jakiekolwiek zaleznoscipomiedzy wymienionymi charakterystykami, a jesli tak, to jakajest siła tych zaleznosci.

Wyniki badan: Beda przedstawione dalej.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 13: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Zaleznosci korelacyjnePrzykłady

Inny przykład: Allison i Cicchetti w pracy ”Sleep in mammals”(Science, 194, 1976) opisali badania przeprowadzone wsródprzedstawicieli 62 gatunkach ssaków. Przedmiotem obserwacji(pomiarów) były m.in. nastepujace charakterystyki:

długosc snu w ciagu doby (godz/dobe),maksymalna długosci zycia (lata),masa ciała (kg),masa mózgu (g),czas trwania ciazy (dni).

Cel badania: Ustalenie, czy istnieja jakiekolwiek zaleznoscipomiedzy wymienionymi charakterystykami, a jesli tak, to jakajest siła tych zaleznosci.

Wyniki badan: Beda przedstawione dalej.Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 14: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Zaleznosci korelacyjnePrzykłady

Kolejny przykład:Zwiazek pomiedzy waga a wzrostem człowieka próbuje siewyrazic za pomoca tzw. wskaznika BMI (Body MassIndex):

BMI =waga

(wzrost w metrach)2

Przyjmuje sie, ze wartosc BMI dla osób z prawidłowamasa ciała zawiera sie mniej wiecej w przedziale18,5 ≤ BMI < 25. Jednak BMI kształtuje sie na poziomieindywidualnym dla konkretnych osób i moze znacznieprzekraczac wartosc 25.

Przykład ten wskazuje, ze zaleznosc miedzy waga awzrostem nie jest scisle funkcyjna. Podana formułaopisuje tylko w przyblizeniu te zaleznosci.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 15: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Zaleznosci korelacyjnePrzykłady

Kolejny przykład:Zwiazek pomiedzy waga a wzrostem człowieka próbuje siewyrazic za pomoca tzw. wskaznika BMI (Body MassIndex):

BMI =waga

(wzrost w metrach)2

Przyjmuje sie, ze wartosc BMI dla osób z prawidłowamasa ciała zawiera sie mniej wiecej w przedziale18,5 ≤ BMI < 25. Jednak BMI kształtuje sie na poziomieindywidualnym dla konkretnych osób i moze znacznieprzekraczac wartosc 25.

Przykład ten wskazuje, ze zaleznosc miedzy waga awzrostem nie jest scisle funkcyjna. Podana formułaopisuje tylko w przyblizeniu te zaleznosci.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 16: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Zaleznosci korelacyjnePrzykłady

Kolejny przykład:Zwiazek pomiedzy waga a wzrostem człowieka próbuje siewyrazic za pomoca tzw. wskaznika BMI (Body MassIndex):

BMI =waga

(wzrost w metrach)2

Przyjmuje sie, ze wartosc BMI dla osób z prawidłowamasa ciała zawiera sie mniej wiecej w przedziale18,5 ≤ BMI < 25. Jednak BMI kształtuje sie na poziomieindywidualnym dla konkretnych osób i moze znacznieprzekraczac wartosc 25.

Przykład ten wskazuje, ze zaleznosc miedzy waga awzrostem nie jest scisle funkcyjna. Podana formułaopisuje tylko w przyblizeniu te zaleznosci.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 17: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Zaleznosc korelacyjna

Przy analizie współzaleznosci pomiedzy wzrostem i waga,nie oczekujemy, aby zaleznosc ta była scisle funkcyjna,tzn. aby istniała jednoznacznie okreslona funkcjamatematyczna y = f (x), podajaca wage y konkretnejosoby z ustalonym wzrostem x .

Mimo tego wydaje sie, ze ”jakas” zaleznosc pomiedzywaga i wzrostem istnieje.Obserwujac obie cechy w duzej zbiorowosci osób,dojdziemy do przekonania, ze srednia waga jest wiekszaw grupie osób wyzszych i na odwrót.Zwiazek miedzy waga i wzrostem jest przykładem tzw.zwiazku korelacyjnego, w skrócie – korelacji.Z korelacja mamy do czynienia wtedy, gdy wraz zezmiana wartosci jednej cechy zmienia sie srednia wartoscdrugiej cechy.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 18: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Zaleznosc korelacyjna

Przy analizie współzaleznosci pomiedzy wzrostem i waga,nie oczekujemy, aby zaleznosc ta była scisle funkcyjna,tzn. aby istniała jednoznacznie okreslona funkcjamatematyczna y = f (x), podajaca wage y konkretnejosoby z ustalonym wzrostem x .Mimo tego wydaje sie, ze ”jakas” zaleznosc pomiedzywaga i wzrostem istnieje.

Obserwujac obie cechy w duzej zbiorowosci osób,dojdziemy do przekonania, ze srednia waga jest wiekszaw grupie osób wyzszych i na odwrót.Zwiazek miedzy waga i wzrostem jest przykładem tzw.zwiazku korelacyjnego, w skrócie – korelacji.Z korelacja mamy do czynienia wtedy, gdy wraz zezmiana wartosci jednej cechy zmienia sie srednia wartoscdrugiej cechy.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 19: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Zaleznosc korelacyjna

Przy analizie współzaleznosci pomiedzy wzrostem i waga,nie oczekujemy, aby zaleznosc ta była scisle funkcyjna,tzn. aby istniała jednoznacznie okreslona funkcjamatematyczna y = f (x), podajaca wage y konkretnejosoby z ustalonym wzrostem x .Mimo tego wydaje sie, ze ”jakas” zaleznosc pomiedzywaga i wzrostem istnieje.Obserwujac obie cechy w duzej zbiorowosci osób,dojdziemy do przekonania, ze srednia waga jest wiekszaw grupie osób wyzszych i na odwrót.

Zwiazek miedzy waga i wzrostem jest przykładem tzw.zwiazku korelacyjnego, w skrócie – korelacji.Z korelacja mamy do czynienia wtedy, gdy wraz zezmiana wartosci jednej cechy zmienia sie srednia wartoscdrugiej cechy.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 20: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Zaleznosc korelacyjna

Przy analizie współzaleznosci pomiedzy wzrostem i waga,nie oczekujemy, aby zaleznosc ta była scisle funkcyjna,tzn. aby istniała jednoznacznie okreslona funkcjamatematyczna y = f (x), podajaca wage y konkretnejosoby z ustalonym wzrostem x .Mimo tego wydaje sie, ze ”jakas” zaleznosc pomiedzywaga i wzrostem istnieje.Obserwujac obie cechy w duzej zbiorowosci osób,dojdziemy do przekonania, ze srednia waga jest wiekszaw grupie osób wyzszych i na odwrót.Zwiazek miedzy waga i wzrostem jest przykładem tzw.zwiazku korelacyjnego, w skrócie – korelacji.

Z korelacja mamy do czynienia wtedy, gdy wraz zezmiana wartosci jednej cechy zmienia sie srednia wartoscdrugiej cechy.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 21: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Zaleznosc korelacyjna

Przy analizie współzaleznosci pomiedzy wzrostem i waga,nie oczekujemy, aby zaleznosc ta była scisle funkcyjna,tzn. aby istniała jednoznacznie okreslona funkcjamatematyczna y = f (x), podajaca wage y konkretnejosoby z ustalonym wzrostem x .Mimo tego wydaje sie, ze ”jakas” zaleznosc pomiedzywaga i wzrostem istnieje.Obserwujac obie cechy w duzej zbiorowosci osób,dojdziemy do przekonania, ze srednia waga jest wiekszaw grupie osób wyzszych i na odwrót.Zwiazek miedzy waga i wzrostem jest przykładem tzw.zwiazku korelacyjnego, w skrócie – korelacji.Z korelacja mamy do czynienia wtedy, gdy wraz zezmiana wartosci jednej cechy zmienia sie srednia wartoscdrugiej cechy.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 22: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Zaleznosc korelacyjnaPrzykład korelacji wagi i wzrostu

Copyright Giorgio Krenkel and Alex Sandri, GNU Free Documentation License, Low ResolutionAgnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 23: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Współczynnik korelacji PearsonaPrzykład korelacji wagi i wzrostu – c.d.

Copyright Giorgio Krenkel and Alex Sandri, GNU Free Documentation License, Low ResolutionAgnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 24: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Zaleznosc korelacyjnaInne przykłady

Copyright Giorgio Krenkel and Alex Sandri, GNU Free Documentation License, Low Resolution

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 25: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Zaleznosc korelacyjnaWstepne wnioski z przedstawionych przykładów

Zwiazek korelacyjny mozna odkryc obserwujac duza liczbeprzypadków. Nie ujawnia sie w pojedycznychobserwacjach.

Zaleznosc korelacyjna moze byc prostoliniowa (w skrócie –liniowa) lub krzywoliniowa, silna lub słaba.

Na podstawie obserwacji wykresu rozproszenia mozemy wprzyblizeniu ocenic charakter zaleznosci i jej siłe.

Potrzebujemy miary, która pomógłaby wyrazic siłezaleznosci w sposób liczbowy.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 26: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Zaleznosc korelacyjnaWstepne wnioski z przedstawionych przykładów

Zwiazek korelacyjny mozna odkryc obserwujac duza liczbeprzypadków. Nie ujawnia sie w pojedycznychobserwacjach.

Zaleznosc korelacyjna moze byc prostoliniowa (w skrócie –liniowa) lub krzywoliniowa, silna lub słaba.

Na podstawie obserwacji wykresu rozproszenia mozemy wprzyblizeniu ocenic charakter zaleznosci i jej siłe.

Potrzebujemy miary, która pomógłaby wyrazic siłezaleznosci w sposób liczbowy.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 27: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Zaleznosc korelacyjnaWstepne wnioski z przedstawionych przykładów

Zwiazek korelacyjny mozna odkryc obserwujac duza liczbeprzypadków. Nie ujawnia sie w pojedycznychobserwacjach.

Zaleznosc korelacyjna moze byc prostoliniowa (w skrócie –liniowa) lub krzywoliniowa, silna lub słaba.

Na podstawie obserwacji wykresu rozproszenia mozemy wprzyblizeniu ocenic charakter zaleznosci i jej siłe.

Potrzebujemy miary, która pomógłaby wyrazic siłezaleznosci w sposób liczbowy.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 28: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Zaleznosc korelacyjnaWstepne wnioski z przedstawionych przykładów

Zwiazek korelacyjny mozna odkryc obserwujac duza liczbeprzypadków. Nie ujawnia sie w pojedycznychobserwacjach.

Zaleznosc korelacyjna moze byc prostoliniowa (w skrócie –liniowa) lub krzywoliniowa, silna lub słaba.

Na podstawie obserwacji wykresu rozproszenia mozemy wprzyblizeniu ocenic charakter zaleznosci i jej siłe.

Potrzebujemy miary, która pomógłaby wyrazic siłezaleznosci w sposób liczbowy.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 29: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Pomiar siły korelacji liniowejWspółczynnik korelacji liniowej Pearsona

Załózmy, ze miedzy cechami X i Y wystepuje zaleznosckorelacyjna o charakterze liniowym.

Współczynnikiem słuzacym do pomiaru siły tego zwiazkujest współczynnik korelacji liniowej Pearsona okreslonywzorem

r =1n∑n

i=1(xi − x)(yi − y)

sx · sy,

gdzie x , y oznaczaja srednie arytmetyczne, natomiastsx , sy – odchylenia standardowe zmiennych odpowiednioX i Y .

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 30: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Pomiar siły korelacji liniowejWspółczynnik korelacji liniowej Pearsona

Załózmy, ze miedzy cechami X i Y wystepuje zaleznosckorelacyjna o charakterze liniowym.

Współczynnikiem słuzacym do pomiaru siły tego zwiazkujest współczynnik korelacji liniowej Pearsona okreslonywzorem

r =1n∑n

i=1(xi − x)(yi − y)

sx · sy,

gdzie x , y oznaczaja srednie arytmetyczne, natomiastsx , sy – odchylenia standardowe zmiennych odpowiednioX i Y .

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 31: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Pomiar siły korelacji liniowejSrednie arytmetyczne i odchylenia standardowe – przypomnienie

Srednie arytmetyczne:

x =1n

n∑i=1

xi , y =1n

n∑i=1

yi .

Odchylenia standardowe:

sx =

√√√√1n

n∑i=1

(xi − x)2, sy =

√√√√1n

n∑i=1

(yi − y)2.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 32: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Współczynnik korelacji liniowej PearsonaWłasnosci

Współczynnik r korelacji liniowej Pearsona przyjmujezawsze wartosci z przedziału [−1,1].

Znak współczynnika informuje o kierunku korelacji (liniowaujemna lub liniowa dodatnia).

Wartosc bezwzgledna |r | informuje o sile korelacji liniowej.

W szczególnym przypadku, gdy |r | = 1, wówczas mamydo czynienia z korelacja funkcyjna (tzn. zaleznosc Y od Xmozna wyrazic za pomoca funkcji Y = aX + b, gdzie a,bsa pewnymi stałymi).

Współczynnik r mierzy tylko korelacje o charakterzeprostoliniowym.

Gdy r = 0, wówczas mówimy, ze nie ma korelacji liniowej(ale moze byc krzywoliniowa).

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 33: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Współczynnik korelacji liniowej PearsonaWłasnosci

Współczynnik r korelacji liniowej Pearsona przyjmujezawsze wartosci z przedziału [−1,1].

Znak współczynnika informuje o kierunku korelacji (liniowaujemna lub liniowa dodatnia).

Wartosc bezwzgledna |r | informuje o sile korelacji liniowej.

W szczególnym przypadku, gdy |r | = 1, wówczas mamydo czynienia z korelacja funkcyjna (tzn. zaleznosc Y od Xmozna wyrazic za pomoca funkcji Y = aX + b, gdzie a,bsa pewnymi stałymi).

Współczynnik r mierzy tylko korelacje o charakterzeprostoliniowym.

Gdy r = 0, wówczas mówimy, ze nie ma korelacji liniowej(ale moze byc krzywoliniowa).

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 34: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Współczynnik korelacji liniowej PearsonaWłasnosci

Współczynnik r korelacji liniowej Pearsona przyjmujezawsze wartosci z przedziału [−1,1].

Znak współczynnika informuje o kierunku korelacji (liniowaujemna lub liniowa dodatnia).

Wartosc bezwzgledna |r | informuje o sile korelacji liniowej.

W szczególnym przypadku, gdy |r | = 1, wówczas mamydo czynienia z korelacja funkcyjna (tzn. zaleznosc Y od Xmozna wyrazic za pomoca funkcji Y = aX + b, gdzie a,bsa pewnymi stałymi).

Współczynnik r mierzy tylko korelacje o charakterzeprostoliniowym.

Gdy r = 0, wówczas mówimy, ze nie ma korelacji liniowej(ale moze byc krzywoliniowa).

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 35: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Współczynnik korelacji liniowej PearsonaWłasnosci

Współczynnik r korelacji liniowej Pearsona przyjmujezawsze wartosci z przedziału [−1,1].

Znak współczynnika informuje o kierunku korelacji (liniowaujemna lub liniowa dodatnia).

Wartosc bezwzgledna |r | informuje o sile korelacji liniowej.

W szczególnym przypadku, gdy |r | = 1, wówczas mamydo czynienia z korelacja funkcyjna (tzn. zaleznosc Y od Xmozna wyrazic za pomoca funkcji Y = aX + b, gdzie a,bsa pewnymi stałymi).

Współczynnik r mierzy tylko korelacje o charakterzeprostoliniowym.

Gdy r = 0, wówczas mówimy, ze nie ma korelacji liniowej(ale moze byc krzywoliniowa).

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 36: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Współczynnik korelacji liniowej PearsonaWłasnosci

Współczynnik r korelacji liniowej Pearsona przyjmujezawsze wartosci z przedziału [−1,1].

Znak współczynnika informuje o kierunku korelacji (liniowaujemna lub liniowa dodatnia).

Wartosc bezwzgledna |r | informuje o sile korelacji liniowej.

W szczególnym przypadku, gdy |r | = 1, wówczas mamydo czynienia z korelacja funkcyjna (tzn. zaleznosc Y od Xmozna wyrazic za pomoca funkcji Y = aX + b, gdzie a,bsa pewnymi stałymi).

Współczynnik r mierzy tylko korelacje o charakterzeprostoliniowym.

Gdy r = 0, wówczas mówimy, ze nie ma korelacji liniowej(ale moze byc krzywoliniowa).

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 37: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Współczynnik korelacji liniowej PearsonaWłasnosci

Współczynnik r korelacji liniowej Pearsona przyjmujezawsze wartosci z przedziału [−1,1].

Znak współczynnika informuje o kierunku korelacji (liniowaujemna lub liniowa dodatnia).

Wartosc bezwzgledna |r | informuje o sile korelacji liniowej.

W szczególnym przypadku, gdy |r | = 1, wówczas mamydo czynienia z korelacja funkcyjna (tzn. zaleznosc Y od Xmozna wyrazic za pomoca funkcji Y = aX + b, gdzie a,bsa pewnymi stałymi).

Współczynnik r mierzy tylko korelacje o charakterzeprostoliniowym.

Gdy r = 0, wówczas mówimy, ze nie ma korelacji liniowej(ale moze byc krzywoliniowa).

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 38: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Współczynniki korelacji liniowej PearsonaAllison i Cicchetti – Wyniki badan ssaków

macierz współczynników masa masa czas snu maks. długosc czaskorelacji liniowej Pearsona ciała (kg) mózgu (g) (godz/dobe) zycia (lata) ciazy (dni)

masa ciała (kg) 1 0,93 -0,31 0,30 0,65

masa mózgu (g) 0,93 1 -0,36 0,51 0,75

czas snu (godz/dobe) -0,31 -0,36 1 -0,41 -0,63

maks. długosc zycia (lata) 0,30 0,51 -0,41 1 0,61

czas ciazy (dni) 0,65 0,75 -0,63 0,61 1

Kilka wybranych uwag podsumowania:

wszystkie cechy sa ze soba wzajemnie powiazane (w mniejszym lub wiekszym stopniu),mozna zauwazyc silna, dodatnia korelacje liniowa miedzy masa mózgu i ciała,umiarkowana, ujemna korelacja liniowa miedzy czasem snu a czasem zycia,dosc silna korelacja (dodatnia lub ujemna) czasu ciazy z innymi zmiennymi,Pytanie: Jak opisac zaleznosc np. czasu ciazy od wszystkich pozostałych zmiennych jednoczesnie?Odpowiedzi dostarcza analiza regresji.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 39: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Współczynniki korelacji liniowej PearsonaAllison i Cicchetti – Wyniki badan ssaków

macierz współczynników masa masa czas snu maks. długosc czaskorelacji liniowej Pearsona ciała (kg) mózgu (g) (godz/dobe) zycia (lata) ciazy (dni)

masa ciała (kg) 1 0,93 -0,31 0,30 0,65

masa mózgu (g) 0,93 1 -0,36 0,51 0,75

czas snu (godz/dobe) -0,31 -0,36 1 -0,41 -0,63

maks. długosc zycia (lata) 0,30 0,51 -0,41 1 0,61

czas ciazy (dni) 0,65 0,75 -0,63 0,61 1

Kilka wybranych uwag podsumowania:

wszystkie cechy sa ze soba wzajemnie powiazane (w mniejszym lub wiekszym stopniu),mozna zauwazyc silna, dodatnia korelacje liniowa miedzy masa mózgu i ciała,umiarkowana, ujemna korelacja liniowa miedzy czasem snu a czasem zycia,dosc silna korelacja (dodatnia lub ujemna) czasu ciazy z innymi zmiennymi,Pytanie: Jak opisac zaleznosc np. czasu ciazy od wszystkich pozostałych zmiennych jednoczesnie?Odpowiedzi dostarcza analiza regresji.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 40: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Współczynniki korelacji liniowej PearsonaAllison i Cicchetti – Wyniki badan ssaków

macierz współczynników masa masa czas snu maks. długosc czaskorelacji liniowej Pearsona ciała (kg) mózgu (g) (godz/dobe) zycia (lata) ciazy (dni)

masa ciała (kg) 1 0,93 -0,31 0,30 0,65

masa mózgu (g) 0,93 1 -0,36 0,51 0,75

czas snu (godz/dobe) -0,31 -0,36 1 -0,41 -0,63

maks. długosc zycia (lata) 0,30 0,51 -0,41 1 0,61

czas ciazy (dni) 0,65 0,75 -0,63 0,61 1

Kilka wybranych uwag podsumowania:

wszystkie cechy sa ze soba wzajemnie powiazane (w mniejszym lub wiekszym stopniu),

mozna zauwazyc silna, dodatnia korelacje liniowa miedzy masa mózgu i ciała,umiarkowana, ujemna korelacja liniowa miedzy czasem snu a czasem zycia,dosc silna korelacja (dodatnia lub ujemna) czasu ciazy z innymi zmiennymi,Pytanie: Jak opisac zaleznosc np. czasu ciazy od wszystkich pozostałych zmiennych jednoczesnie?Odpowiedzi dostarcza analiza regresji.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 41: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Współczynniki korelacji liniowej PearsonaAllison i Cicchetti – Wyniki badan ssaków

macierz współczynników masa masa czas snu maks. długosc czaskorelacji liniowej Pearsona ciała (kg) mózgu (g) (godz/dobe) zycia (lata) ciazy (dni)

masa ciała (kg) 1 0,93 -0,31 0,30 0,65

masa mózgu (g) 0,93 1 -0,36 0,51 0,75

czas snu (godz/dobe) -0,31 -0,36 1 -0,41 -0,63

maks. długosc zycia (lata) 0,30 0,51 -0,41 1 0,61

czas ciazy (dni) 0,65 0,75 -0,63 0,61 1

Kilka wybranych uwag podsumowania:

wszystkie cechy sa ze soba wzajemnie powiazane (w mniejszym lub wiekszym stopniu),mozna zauwazyc silna, dodatnia korelacje liniowa miedzy masa mózgu i ciała,

umiarkowana, ujemna korelacja liniowa miedzy czasem snu a czasem zycia,dosc silna korelacja (dodatnia lub ujemna) czasu ciazy z innymi zmiennymi,Pytanie: Jak opisac zaleznosc np. czasu ciazy od wszystkich pozostałych zmiennych jednoczesnie?Odpowiedzi dostarcza analiza regresji.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 42: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Współczynniki korelacji liniowej PearsonaAllison i Cicchetti – Wyniki badan ssaków

macierz współczynników masa masa czas snu maks. długosc czaskorelacji liniowej Pearsona ciała (kg) mózgu (g) (godz/dobe) zycia (lata) ciazy (dni)

masa ciała (kg) 1 0,93 -0,31 0,30 0,65

masa mózgu (g) 0,93 1 -0,36 0,51 0,75

czas snu (godz/dobe) -0,31 -0,36 1 -0,41 -0,63

maks. długosc zycia (lata) 0,30 0,51 -0,41 1 0,61

czas ciazy (dni) 0,65 0,75 -0,63 0,61 1

Kilka wybranych uwag podsumowania:

wszystkie cechy sa ze soba wzajemnie powiazane (w mniejszym lub wiekszym stopniu),mozna zauwazyc silna, dodatnia korelacje liniowa miedzy masa mózgu i ciała,umiarkowana, ujemna korelacja liniowa miedzy czasem snu a czasem zycia,

dosc silna korelacja (dodatnia lub ujemna) czasu ciazy z innymi zmiennymi,Pytanie: Jak opisac zaleznosc np. czasu ciazy od wszystkich pozostałych zmiennych jednoczesnie?Odpowiedzi dostarcza analiza regresji.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 43: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Współczynniki korelacji liniowej PearsonaAllison i Cicchetti – Wyniki badan ssaków

macierz współczynników masa masa czas snu maks. długosc czaskorelacji liniowej Pearsona ciała (kg) mózgu (g) (godz/dobe) zycia (lata) ciazy (dni)

masa ciała (kg) 1 0,93 -0,31 0,30 0,65

masa mózgu (g) 0,93 1 -0,36 0,51 0,75

czas snu (godz/dobe) -0,31 -0,36 1 -0,41 -0,63

maks. długosc zycia (lata) 0,30 0,51 -0,41 1 0,61

czas ciazy (dni) 0,65 0,75 -0,63 0,61 1

Kilka wybranych uwag podsumowania:

wszystkie cechy sa ze soba wzajemnie powiazane (w mniejszym lub wiekszym stopniu),mozna zauwazyc silna, dodatnia korelacje liniowa miedzy masa mózgu i ciała,umiarkowana, ujemna korelacja liniowa miedzy czasem snu a czasem zycia,dosc silna korelacja (dodatnia lub ujemna) czasu ciazy z innymi zmiennymi,

Pytanie: Jak opisac zaleznosc np. czasu ciazy od wszystkich pozostałych zmiennych jednoczesnie?Odpowiedzi dostarcza analiza regresji.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 44: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Współczynniki korelacji liniowej PearsonaAllison i Cicchetti – Wyniki badan ssaków

macierz współczynników masa masa czas snu maks. długosc czaskorelacji liniowej Pearsona ciała (kg) mózgu (g) (godz/dobe) zycia (lata) ciazy (dni)

masa ciała (kg) 1 0,93 -0,31 0,30 0,65

masa mózgu (g) 0,93 1 -0,36 0,51 0,75

czas snu (godz/dobe) -0,31 -0,36 1 -0,41 -0,63

maks. długosc zycia (lata) 0,30 0,51 -0,41 1 0,61

czas ciazy (dni) 0,65 0,75 -0,63 0,61 1

Kilka wybranych uwag podsumowania:

wszystkie cechy sa ze soba wzajemnie powiazane (w mniejszym lub wiekszym stopniu),mozna zauwazyc silna, dodatnia korelacje liniowa miedzy masa mózgu i ciała,umiarkowana, ujemna korelacja liniowa miedzy czasem snu a czasem zycia,dosc silna korelacja (dodatnia lub ujemna) czasu ciazy z innymi zmiennymi,Pytanie: Jak opisac zaleznosc np. czasu ciazy od wszystkich pozostałych zmiennych jednoczesnie?Odpowiedzi dostarcza analiza regresji.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 45: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Korelacja a zaleznosci pozorne – PrzykładCzy w krajach, w których jest wiecej bocianów rodzi sie wiecej dzieci?

Wyniki analizy korelacji liniowej dla 17 krajów europejskich(dane z 1990 roku) pomiedzy powierzchnia, liczbamieszkanców, liczba urodzen oraz liczba bocianów (!):

macierz współczynników powierzchnia liczba bocianów liczba mieszkanców liczba urodzenkorelacji liniowej Pearsona

powierzchnia 1 0,579 0,812 0,923

liczba bocianów 0,579 1 0,354 0,620

liczba mieszkanców 0,812 0,354 1 0,851

liczba urodzen 0,923 0,620 0,851 1

Zaskoczeniem moze byc dosc wysoka wartosc współczynnika korelacji liniowej dla liczby bocianów i liczby urodzen.Pytania:

Czy w krajach, w których jest wiecej bocianów rodzi sie, srednio rzecz biorac, wiecej dzieci? Odpowiedzbrzmi – tak, potwierdzaja to uzyskane wyniki.Czy na tej podstawie mozemy sadzic, ze liczba bocianów oddziałuje na liczbe noworodków (lub odwrotnie)?Odpowiedz brzmi – nie, poniewaz pomiedzy badanymi zmiennymi nie ma bezposredniej zaleznosciprzyczynowo-skutkowej. Jest to przykład zaleznosci pozornej.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 46: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Korelacja a zaleznosci pozorne – PrzykładCzy w krajach, w których jest wiecej bocianów rodzi sie wiecej dzieci?

Wyniki analizy korelacji liniowej dla 17 krajów europejskich(dane z 1990 roku) pomiedzy powierzchnia, liczbamieszkanców, liczba urodzen oraz liczba bocianów (!):

macierz współczynników powierzchnia liczba bocianów liczba mieszkanców liczba urodzenkorelacji liniowej Pearsona

powierzchnia 1 0,579 0,812 0,923

liczba bocianów 0,579 1 0,354 0,620

liczba mieszkanców 0,812 0,354 1 0,851

liczba urodzen 0,923 0,620 0,851 1

Zaskoczeniem moze byc dosc wysoka wartosc współczynnika korelacji liniowej dla liczby bocianów i liczby urodzen.

Pytania:Czy w krajach, w których jest wiecej bocianów rodzi sie, srednio rzecz biorac, wiecej dzieci? Odpowiedzbrzmi – tak, potwierdzaja to uzyskane wyniki.Czy na tej podstawie mozemy sadzic, ze liczba bocianów oddziałuje na liczbe noworodków (lub odwrotnie)?Odpowiedz brzmi – nie, poniewaz pomiedzy badanymi zmiennymi nie ma bezposredniej zaleznosciprzyczynowo-skutkowej. Jest to przykład zaleznosci pozornej.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 47: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Korelacja a zaleznosci pozorne – PrzykładCzy w krajach, w których jest wiecej bocianów rodzi sie wiecej dzieci?

Wyniki analizy korelacji liniowej dla 17 krajów europejskich(dane z 1990 roku) pomiedzy powierzchnia, liczbamieszkanców, liczba urodzen oraz liczba bocianów (!):

macierz współczynników powierzchnia liczba bocianów liczba mieszkanców liczba urodzenkorelacji liniowej Pearsona

powierzchnia 1 0,579 0,812 0,923

liczba bocianów 0,579 1 0,354 0,620

liczba mieszkanców 0,812 0,354 1 0,851

liczba urodzen 0,923 0,620 0,851 1

Zaskoczeniem moze byc dosc wysoka wartosc współczynnika korelacji liniowej dla liczby bocianów i liczby urodzen.Pytania:

Czy w krajach, w których jest wiecej bocianów rodzi sie, srednio rzecz biorac, wiecej dzieci? Odpowiedzbrzmi – tak, potwierdzaja to uzyskane wyniki.Czy na tej podstawie mozemy sadzic, ze liczba bocianów oddziałuje na liczbe noworodków (lub odwrotnie)?Odpowiedz brzmi – nie, poniewaz pomiedzy badanymi zmiennymi nie ma bezposredniej zaleznosciprzyczynowo-skutkowej. Jest to przykład zaleznosci pozornej.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 48: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Korelacja a zaleznosci pozorne – Przykład c.d.

Zaleznosc przyczynowo-skutkowa pomiedzy liczbaurodzen i liczba bocianów jest pozorna, gdyz ma tumiejsce jedynie współwystepowanie obu zjawisk (wiekszejliczbie bocianów towarzyszy na ogół wieksza liczbaurodzen i na odwrót).

Pozorna zaleznosc ma miejsce takze miedzy liczbaurodzen i powierzchnia kraju.Układ zaleznosci przyczynowo-skutkowych w tymprzykładzie mozna zilustrowac graficznie:

Copyright Giorgio Krenkel and Alex Sandri, GNU Free Documentation License, Low Resolution

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 49: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Korelacja a zaleznosci pozorne – Przykład c.d.

Zaleznosc przyczynowo-skutkowa pomiedzy liczbaurodzen i liczba bocianów jest pozorna, gdyz ma tumiejsce jedynie współwystepowanie obu zjawisk (wiekszejliczbie bocianów towarzyszy na ogół wieksza liczbaurodzen i na odwrót).Pozorna zaleznosc ma miejsce takze miedzy liczbaurodzen i powierzchnia kraju.

Układ zaleznosci przyczynowo-skutkowych w tymprzykładzie mozna zilustrowac graficznie:

Copyright Giorgio Krenkel and Alex Sandri, GNU Free Documentation License, Low Resolution

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 50: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Korelacja a zaleznosci pozorne – Przykład c.d.

Zaleznosc przyczynowo-skutkowa pomiedzy liczbaurodzen i liczba bocianów jest pozorna, gdyz ma tumiejsce jedynie współwystepowanie obu zjawisk (wiekszejliczbie bocianów towarzyszy na ogół wieksza liczbaurodzen i na odwrót).Pozorna zaleznosc ma miejsce takze miedzy liczbaurodzen i powierzchnia kraju.Układ zaleznosci przyczynowo-skutkowych w tymprzykładzie mozna zilustrowac graficznie:

Copyright Giorgio Krenkel and Alex Sandri, GNU Free Documentation License, Low ResolutionAgnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 51: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Inne miary korelacji – współczynnik korelacji rang SpearmanaPrzykład

Przypuscmy, ze porzadkujemy 4 studentów w zaleznosciod stopnia ich zdolnosci matematycznych, zaczynajac odstudenta najlepszego, któremu przydzielamy numer 1,a konczac na studencie najsłabszym, któremuprzydzielamy numer 4 (ocene zdolnosci powierzamy np.ekspertowi).

Mówimy wówczas, ze studenci zostali uporzadkowani wkolejnosci rang, a numer studenta jest jego ranga.

Oznaczmy rangi poszczególnych studentów przez ai .Przykładowo, niech: a1 = 4,a2 = 2,a3 = 3,a4 = 1, cooznacza, iz w badanej grupie, ustawionej w kolejnoscialfabetycznej, pierwszy student (oznaczmy go umownielitera A) jest najsłabszy, student B – dobry, student C –słaby, a student D – najlepszy.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 52: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Inne miary korelacji – współczynnik korelacji rang SpearmanaPrzykład

Przypuscmy, ze porzadkujemy 4 studentów w zaleznosciod stopnia ich zdolnosci matematycznych, zaczynajac odstudenta najlepszego, któremu przydzielamy numer 1,a konczac na studencie najsłabszym, któremuprzydzielamy numer 4 (ocene zdolnosci powierzamy np.ekspertowi).

Mówimy wówczas, ze studenci zostali uporzadkowani wkolejnosci rang, a numer studenta jest jego ranga.

Oznaczmy rangi poszczególnych studentów przez ai .Przykładowo, niech: a1 = 4,a2 = 2,a3 = 3,a4 = 1, cooznacza, iz w badanej grupie, ustawionej w kolejnoscialfabetycznej, pierwszy student (oznaczmy go umownielitera A) jest najsłabszy, student B – dobry, student C –słaby, a student D – najlepszy.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 53: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Inne miary korelacji – współczynnik korelacji rang SpearmanaPrzykład

Przypuscmy, ze porzadkujemy 4 studentów w zaleznosciod stopnia ich zdolnosci matematycznych, zaczynajac odstudenta najlepszego, któremu przydzielamy numer 1,a konczac na studencie najsłabszym, któremuprzydzielamy numer 4 (ocene zdolnosci powierzamy np.ekspertowi).

Mówimy wówczas, ze studenci zostali uporzadkowani wkolejnosci rang, a numer studenta jest jego ranga.

Oznaczmy rangi poszczególnych studentów przez ai .Przykładowo, niech: a1 = 4,a2 = 2,a3 = 3,a4 = 1, cooznacza, iz w badanej grupie, ustawionej w kolejnoscialfabetycznej, pierwszy student (oznaczmy go umownielitera A) jest najsłabszy, student B – dobry, student C –słaby, a student D – najlepszy.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 54: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Inne miary korelacji – współczynnik korelacji rang SpearmanaPrzykład

Załózmy, ze w podobny sposób uporzadkowalismy tychsamych studentów z punktu widzenia ich zdolnoscimuzycznych. Niech bi beda rangami poszczególnychstudentów:

b1 = 2,b2 = 1,b3 = 3,b4 = 4

W ten sposób kazdemu studentowi przyporzadkowalismypo dwie rangi ai oraz bi .Pytanie: Jak na tej podstawie mozemy ocenic, czy istniejezaleznosc miedzy zdolnosciami matematycznymi orazmuzycznymi w badanej grupie. Innymi słowy, jak ocenicstopien zgodnosci (lub niezgodnosci) rang ai ,bi?Uwaga: W przypadku danych rangowych nie mozemyzastosowac współczynnika korelacji Pearsona.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 55: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Inne miary korelacji – współczynnik korelacji rang SpearmanaPrzykład

Załózmy, ze w podobny sposób uporzadkowalismy tychsamych studentów z punktu widzenia ich zdolnoscimuzycznych. Niech bi beda rangami poszczególnychstudentów:

b1 = 2,b2 = 1,b3 = 3,b4 = 4

W ten sposób kazdemu studentowi przyporzadkowalismypo dwie rangi ai oraz bi .

Pytanie: Jak na tej podstawie mozemy ocenic, czy istniejezaleznosc miedzy zdolnosciami matematycznymi orazmuzycznymi w badanej grupie. Innymi słowy, jak ocenicstopien zgodnosci (lub niezgodnosci) rang ai ,bi?Uwaga: W przypadku danych rangowych nie mozemyzastosowac współczynnika korelacji Pearsona.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 56: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Inne miary korelacji – współczynnik korelacji rang SpearmanaPrzykład

Załózmy, ze w podobny sposób uporzadkowalismy tychsamych studentów z punktu widzenia ich zdolnoscimuzycznych. Niech bi beda rangami poszczególnychstudentów:

b1 = 2,b2 = 1,b3 = 3,b4 = 4

W ten sposób kazdemu studentowi przyporzadkowalismypo dwie rangi ai oraz bi .Pytanie: Jak na tej podstawie mozemy ocenic, czy istniejezaleznosc miedzy zdolnosciami matematycznymi orazmuzycznymi w badanej grupie. Innymi słowy, jak ocenicstopien zgodnosci (lub niezgodnosci) rang ai ,bi?

Uwaga: W przypadku danych rangowych nie mozemyzastosowac współczynnika korelacji Pearsona.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 57: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Inne miary korelacji – współczynnik korelacji rang SpearmanaPrzykład

Załózmy, ze w podobny sposób uporzadkowalismy tychsamych studentów z punktu widzenia ich zdolnoscimuzycznych. Niech bi beda rangami poszczególnychstudentów:

b1 = 2,b2 = 1,b3 = 3,b4 = 4

W ten sposób kazdemu studentowi przyporzadkowalismypo dwie rangi ai oraz bi .Pytanie: Jak na tej podstawie mozemy ocenic, czy istniejezaleznosc miedzy zdolnosciami matematycznymi orazmuzycznymi w badanej grupie. Innymi słowy, jak ocenicstopien zgodnosci (lub niezgodnosci) rang ai ,bi?Uwaga: W przypadku danych rangowych nie mozemyzastosowac współczynnika korelacji Pearsona.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 58: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Inne miary korelacji – współczynnik korelacji rang Spearmana

Jednym ze współczynników korelacji obliczanych dladanych rangowych jest współczynnik korelacji rangSpearmana, okreslony wzorem

rS = 1−6∑n

i=1 d2i

n(n2 − 1),

gdzie di = ai − bi .

Własnosci:Współczynnik rS przymuje wartosci z przedziału [−1,1].

Wartosc rS = 1 oznacza, ze istnieje całkowita zgodnoscuporzadkowan wg rang ai i bi .

Wartosc rS = −1 oznacza z kolei pełna przeciwstawnoscuporzadkowan miedzy rangami.

Wartosc rS = 0 oznacza brak korelacji rang.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 59: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Inne miary korelacji – współczynnik korelacji rang Spearmana

Jednym ze współczynników korelacji obliczanych dladanych rangowych jest współczynnik korelacji rangSpearmana, okreslony wzorem

rS = 1−6∑n

i=1 d2i

n(n2 − 1),

gdzie di = ai − bi .

Własnosci:

Współczynnik rS przymuje wartosci z przedziału [−1,1].

Wartosc rS = 1 oznacza, ze istnieje całkowita zgodnoscuporzadkowan wg rang ai i bi .

Wartosc rS = −1 oznacza z kolei pełna przeciwstawnoscuporzadkowan miedzy rangami.

Wartosc rS = 0 oznacza brak korelacji rang.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 60: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Inne miary korelacji – współczynnik korelacji rang Spearmana

Jednym ze współczynników korelacji obliczanych dladanych rangowych jest współczynnik korelacji rangSpearmana, okreslony wzorem

rS = 1−6∑n

i=1 d2i

n(n2 − 1),

gdzie di = ai − bi .

Własnosci:Współczynnik rS przymuje wartosci z przedziału [−1,1].

Wartosc rS = 1 oznacza, ze istnieje całkowita zgodnoscuporzadkowan wg rang ai i bi .

Wartosc rS = −1 oznacza z kolei pełna przeciwstawnoscuporzadkowan miedzy rangami.

Wartosc rS = 0 oznacza brak korelacji rang.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 61: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Inne miary korelacji – współczynnik korelacji rang Spearmana

Jednym ze współczynników korelacji obliczanych dladanych rangowych jest współczynnik korelacji rangSpearmana, okreslony wzorem

rS = 1−6∑n

i=1 d2i

n(n2 − 1),

gdzie di = ai − bi .

Własnosci:Współczynnik rS przymuje wartosci z przedziału [−1,1].

Wartosc rS = 1 oznacza, ze istnieje całkowita zgodnoscuporzadkowan wg rang ai i bi .

Wartosc rS = −1 oznacza z kolei pełna przeciwstawnoscuporzadkowan miedzy rangami.

Wartosc rS = 0 oznacza brak korelacji rang.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 62: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Inne miary korelacji – współczynnik korelacji rang Spearmana

Jednym ze współczynników korelacji obliczanych dladanych rangowych jest współczynnik korelacji rangSpearmana, okreslony wzorem

rS = 1−6∑n

i=1 d2i

n(n2 − 1),

gdzie di = ai − bi .

Własnosci:Współczynnik rS przymuje wartosci z przedziału [−1,1].

Wartosc rS = 1 oznacza, ze istnieje całkowita zgodnoscuporzadkowan wg rang ai i bi .

Wartosc rS = −1 oznacza z kolei pełna przeciwstawnoscuporzadkowan miedzy rangami.

Wartosc rS = 0 oznacza brak korelacji rang.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 63: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Inne miary korelacji – współczynnik korelacji rang Spearmana

Jednym ze współczynników korelacji obliczanych dladanych rangowych jest współczynnik korelacji rangSpearmana, okreslony wzorem

rS = 1−6∑n

i=1 d2i

n(n2 − 1),

gdzie di = ai − bi .

Własnosci:Współczynnik rS przymuje wartosci z przedziału [−1,1].

Wartosc rS = 1 oznacza, ze istnieje całkowita zgodnoscuporzadkowan wg rang ai i bi .

Wartosc rS = −1 oznacza z kolei pełna przeciwstawnoscuporzadkowan miedzy rangami.

Wartosc rS = 0 oznacza brak korelacji rang.Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 64: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Inne miary korelacji – współczynnik korelacji rang SpearmanaPrzykład

Student rangi ai rangi bi róznice rang di d2i

A 4 2 2 4B 2 1 1 1C 3 3 0 0D 1 4 -3 9

Razem × × × 14Zródło: Dane umowne.

Wartosc współczynnika korelacji rang Spearmana w tymprzykładzie wynosi:

rS = 1− 6 · 144(16− 1)

= −0,4

co swiadczy o stosunkowo słabej korelacji miedzyzdolnosciami matematycznymi i muzycznymi badanychstudentów.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 65: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Inne miary korelacji – współczynnik korelacji rang SpearmanaPrzykład

Student rangi ai rangi bi róznice rang di d2i

A 4 2 2 4B 2 1 1 1C 3 3 0 0D 1 4 -3 9

Razem × × × 14Zródło: Dane umowne.

Wartosc współczynnika korelacji rang Spearmana w tymprzykładzie wynosi:

rS = 1− 6 · 144(16− 1)

= −0,4

co swiadczy o stosunkowo słabej korelacji miedzyzdolnosciami matematycznymi i muzycznymi badanychstudentów.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 66: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Inne miary korelacji – współczynnik korelacji rangowej Kendalla

Innym współczynnikiem zaliczanym do mierników korelacjirangowej jest współczynnik Kendalla.

Zalózmy, ze obserwujemy dwie cechy ilosciowe X i Yw pewnej n-elementowej zbiorowosci.

Jednostki zbiorowosci łaczymy w dwuelementowepodzbiory.

Dla n-elementowej zbiorowosci mozna utworzyc łacznieN = n·(n−1) takich podzbiorów (tj. uporzadkowanych par).

Współczynnik korelacji Kendalla obliczamy na podstawiezbiorowosci dwuelementowych podzbiorów, utworzonych zelementów zbioru wyjsciowego.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 67: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Inne miary korelacji – współczynnik korelacji rangowej Kendalla

Innym współczynnikiem zaliczanym do mierników korelacjirangowej jest współczynnik Kendalla.

Zalózmy, ze obserwujemy dwie cechy ilosciowe X i Yw pewnej n-elementowej zbiorowosci.

Jednostki zbiorowosci łaczymy w dwuelementowepodzbiory.

Dla n-elementowej zbiorowosci mozna utworzyc łacznieN = n·(n−1) takich podzbiorów (tj. uporzadkowanych par).

Współczynnik korelacji Kendalla obliczamy na podstawiezbiorowosci dwuelementowych podzbiorów, utworzonych zelementów zbioru wyjsciowego.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 68: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Inne miary korelacji – współczynnik korelacji rangowej Kendalla

Innym współczynnikiem zaliczanym do mierników korelacjirangowej jest współczynnik Kendalla.

Zalózmy, ze obserwujemy dwie cechy ilosciowe X i Yw pewnej n-elementowej zbiorowosci.

Jednostki zbiorowosci łaczymy w dwuelementowepodzbiory.

Dla n-elementowej zbiorowosci mozna utworzyc łacznieN = n·(n−1) takich podzbiorów (tj. uporzadkowanych par).

Współczynnik korelacji Kendalla obliczamy na podstawiezbiorowosci dwuelementowych podzbiorów, utworzonych zelementów zbioru wyjsciowego.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 69: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Inne miary korelacji – współczynnik korelacji rangowej Kendalla

Innym współczynnikiem zaliczanym do mierników korelacjirangowej jest współczynnik Kendalla.

Zalózmy, ze obserwujemy dwie cechy ilosciowe X i Yw pewnej n-elementowej zbiorowosci.

Jednostki zbiorowosci łaczymy w dwuelementowepodzbiory.

Dla n-elementowej zbiorowosci mozna utworzyc łacznieN = n·(n−1) takich podzbiorów (tj. uporzadkowanych par).

Współczynnik korelacji Kendalla obliczamy na podstawiezbiorowosci dwuelementowych podzbiorów, utworzonych zelementów zbioru wyjsciowego.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 70: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Inne miary korelacji – współczynnik korelacji rangowej Kendalla

Niech Uj dla j = 1,2, . . . ,N beda zmiennymi przyjmujacymiwartosci 1 lub -1, zgodnie z nastepujacymi zasadami:

Uj = 1, gdy wartosc cechy X dla pierwszego elementuw j-tej parze jest wieksza niz dla drugiego elementu.Uj = −1, gdy wartosc cechy X dla pierwszego elementuw j-tej parze jest mniejsza niz dla drugiego elementu.

W podobny sposób zdefiniujmy zmienne Vj dlaj = 1,2, . . . ,N, odwołujac sie do analogicznego sposobuuporzadkowan wartosci cechy Y w poszczególnychparach.

Uwaga: Dalej zakładac bedziemy, ze zarówno wartoscicechy X , jak i cechy Y nie powtarzaja sie w badanejzbiorowosci (w przeciwnym przypadku trzeba skorzystac zpewnej skorygowanej formuły na współczynnik Kendalla,która tutaj nie bedzie przytoczona).

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 71: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Inne miary korelacji – współczynnik korelacji rangowej Kendalla

Niech Uj dla j = 1,2, . . . ,N beda zmiennymi przyjmujacymiwartosci 1 lub -1, zgodnie z nastepujacymi zasadami:

Uj = 1, gdy wartosc cechy X dla pierwszego elementuw j-tej parze jest wieksza niz dla drugiego elementu.Uj = −1, gdy wartosc cechy X dla pierwszego elementuw j-tej parze jest mniejsza niz dla drugiego elementu.

W podobny sposób zdefiniujmy zmienne Vj dlaj = 1,2, . . . ,N, odwołujac sie do analogicznego sposobuuporzadkowan wartosci cechy Y w poszczególnychparach.

Uwaga: Dalej zakładac bedziemy, ze zarówno wartoscicechy X , jak i cechy Y nie powtarzaja sie w badanejzbiorowosci (w przeciwnym przypadku trzeba skorzystac zpewnej skorygowanej formuły na współczynnik Kendalla,która tutaj nie bedzie przytoczona).

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 72: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Inne miary korelacji – współczynnik korelacji rangowej Kendalla

Niech Uj dla j = 1,2, . . . ,N beda zmiennymi przyjmujacymiwartosci 1 lub -1, zgodnie z nastepujacymi zasadami:

Uj = 1, gdy wartosc cechy X dla pierwszego elementuw j-tej parze jest wieksza niz dla drugiego elementu.Uj = −1, gdy wartosc cechy X dla pierwszego elementuw j-tej parze jest mniejsza niz dla drugiego elementu.

W podobny sposób zdefiniujmy zmienne Vj dlaj = 1,2, . . . ,N, odwołujac sie do analogicznego sposobuuporzadkowan wartosci cechy Y w poszczególnychparach.

Uwaga: Dalej zakładac bedziemy, ze zarówno wartoscicechy X , jak i cechy Y nie powtarzaja sie w badanejzbiorowosci (w przeciwnym przypadku trzeba skorzystac zpewnej skorygowanej formuły na współczynnik Kendalla,która tutaj nie bedzie przytoczona).

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 73: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Inne miary korelacji – współczynnik korelacji rangowej KendallaPrzykład

Niech P oznacza liczbe przypadków (par) zgodnieuporzadkowanych, tj. liczbe par, dla których wartosci Ujsa równe Vj .

Podobnie, niech Q oznacza liczbe przypadków (par)niezgodnie uporzadkowanych, tj. liczbe par, dla którychwartosci Uj oraz Vj sa przeciwnego znaku.Przy tych oznaczeniach współczynniki korelacji Kendallawyraza sie wzorem:

τ =P −Q

n(n − 1).

Podobnie, jak współczynnik korelacji Spearmanna,współczynnik τ (tau) przyjmuje zawsze wartosci zprzedziału [−1,1]. Jest równiez podobnie interpretowany.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 74: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Inne miary korelacji – współczynnik korelacji rangowej KendallaPrzykład

Niech P oznacza liczbe przypadków (par) zgodnieuporzadkowanych, tj. liczbe par, dla których wartosci Ujsa równe Vj .Podobnie, niech Q oznacza liczbe przypadków (par)niezgodnie uporzadkowanych, tj. liczbe par, dla którychwartosci Uj oraz Vj sa przeciwnego znaku.

Przy tych oznaczeniach współczynniki korelacji Kendallawyraza sie wzorem:

τ =P −Q

n(n − 1).

Podobnie, jak współczynnik korelacji Spearmanna,współczynnik τ (tau) przyjmuje zawsze wartosci zprzedziału [−1,1]. Jest równiez podobnie interpretowany.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 75: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Inne miary korelacji – współczynnik korelacji rangowej KendallaPrzykład

Niech P oznacza liczbe przypadków (par) zgodnieuporzadkowanych, tj. liczbe par, dla których wartosci Ujsa równe Vj .Podobnie, niech Q oznacza liczbe przypadków (par)niezgodnie uporzadkowanych, tj. liczbe par, dla którychwartosci Uj oraz Vj sa przeciwnego znaku.Przy tych oznaczeniach współczynniki korelacji Kendallawyraza sie wzorem:

τ =P −Q

n(n − 1).

Podobnie, jak współczynnik korelacji Spearmanna,współczynnik τ (tau) przyjmuje zawsze wartosci zprzedziału [−1,1]. Jest równiez podobnie interpretowany.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 76: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Inne miary korelacji – współczynnik korelacji rangowej KendallaPrzykład

Niech P oznacza liczbe przypadków (par) zgodnieuporzadkowanych, tj. liczbe par, dla których wartosci Ujsa równe Vj .Podobnie, niech Q oznacza liczbe przypadków (par)niezgodnie uporzadkowanych, tj. liczbe par, dla którychwartosci Uj oraz Vj sa przeciwnego znaku.Przy tych oznaczeniach współczynniki korelacji Kendallawyraza sie wzorem:

τ =P −Q

n(n − 1).

Podobnie, jak współczynnik korelacji Spearmanna,współczynnik τ (tau) przyjmuje zawsze wartosci zprzedziału [−1,1]. Jest równiez podobnie interpretowany.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 77: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Inne miary korelacji – współczynnik korelacji rangowej KendallaPrzykład

Wrócmy do przykładu dotyczacego zdolnosci matematycznychi muzycznych grupy studentów (A,B,C,D). W tym przykładziemozna utworzyc łacznie 4·(4− 1)=12 dwuelementowychpodzbiorów ze zbioru 4-elementowego (por. pierwsza kolumnatablicy).Dalsze kolumny prezentuja uporzadkowane w parach wartoscicech, w tym przypadku rang ai oraz bi , a takze wartosci Uj ,Vj .

Pary ai dla pierwszej uporzadkowanie Uj bi dla pierwszej uporzadkowanie Vjstudentów i drugiej osoby w parze i drugiej osoby w parze

(A,B) 4; 2 1 2; 1 1(A,C) 4; 3 1 2; 3 -1(A,D) 4; 1 1 2; 4 -1(B,A) 2; 4 -1 1; 2 -1(B,C) 2; 3 -1 1; 3 -1(B,D) 2; 1 1 1; 4 -1(C,A) 3; 4 -1 3; 2 1(C,B) 3; 2 1 3; 1 1(C,D) 3; 1 1 3; 4 -1(D,A) 1; 4 -1 4; 2 1(D,B) 1; 2 -1 4; 1 1(D,C) 1; 3 -1 4; 3 1

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 78: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Inne miary korelacji – współczynnik korelacji rangowej KendallaPrzykład

Wrócmy do przykładu dotyczacego zdolnosci matematycznychi muzycznych grupy studentów (A,B,C,D). W tym przykładziemozna utworzyc łacznie 4·(4− 1)=12 dwuelementowychpodzbiorów ze zbioru 4-elementowego (por. pierwsza kolumnatablicy).Dalsze kolumny prezentuja uporzadkowane w parach wartoscicech, w tym przypadku rang ai oraz bi , a takze wartosci Uj ,Vj .

Pary ai dla pierwszej uporzadkowanie Uj bi dla pierwszej uporzadkowanie Vjstudentów i drugiej osoby w parze i drugiej osoby w parze

(A,B) 4; 2 1 2; 1 1(A,C) 4; 3 1 2; 3 -1(A,D) 4; 1 1 2; 4 -1(B,A) 2; 4 -1 1; 2 -1(B,C) 2; 3 -1 1; 3 -1(B,D) 2; 1 1 1; 4 -1(C,A) 3; 4 -1 3; 2 1(C,B) 3; 2 1 3; 1 1(C,D) 3; 1 1 3; 4 -1(D,A) 1; 4 -1 4; 2 1(D,B) 1; 2 -1 4; 1 1(D,C) 1; 3 -1 4; 3 1

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 79: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Inne miary korelacji – współczynnik korelacji rangowej KendallaPrzykład

Liczba P przypadków (par) zgodnie uporzadkowanych wnaszym przykładzie wynosi P = 4 (oznaczone w tablicykolorem niebieskim).

Z kolei liczba Q przypadków (par) niezgodnieuporzadkowanych wynosi Q = 8 (oznaczone w tablicykolorem czerwonym).

Współczynniki Kendalla dla n = 4, P = 4, Q = 8 wynosi:

τ = − 412≈ −0,33

co wskazuje na słaba korelacje miedzy zdolnosciamimatematycznymi i muzycznymi w badanej grupiestudentów (podobna wartosc, jak współczynnika rS).

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 80: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Inne miary korelacji – współczynnik korelacji rangowej KendallaPrzykład

Liczba P przypadków (par) zgodnie uporzadkowanych wnaszym przykładzie wynosi P = 4 (oznaczone w tablicykolorem niebieskim).

Z kolei liczba Q przypadków (par) niezgodnieuporzadkowanych wynosi Q = 8 (oznaczone w tablicykolorem czerwonym).

Współczynniki Kendalla dla n = 4, P = 4, Q = 8 wynosi:

τ = − 412≈ −0,33

co wskazuje na słaba korelacje miedzy zdolnosciamimatematycznymi i muzycznymi w badanej grupiestudentów (podobna wartosc, jak współczynnika rS).

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 81: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Inne miary korelacji – współczynnik korelacji rangowej KendallaPrzykład

Liczba P przypadków (par) zgodnie uporzadkowanych wnaszym przykładzie wynosi P = 4 (oznaczone w tablicykolorem niebieskim).

Z kolei liczba Q przypadków (par) niezgodnieuporzadkowanych wynosi Q = 8 (oznaczone w tablicykolorem czerwonym).

Współczynniki Kendalla dla n = 4, P = 4, Q = 8 wynosi:

τ = − 412≈ −0,33

co wskazuje na słaba korelacje miedzy zdolnosciamimatematycznymi i muzycznymi w badanej grupiestudentów (podobna wartosc, jak współczynnika rS).

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 82: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Inne miary korelacji – współczynnik korelacji rangowej KendallaUwagi

Zauwazymy, ze jesli dla pewnej pary elementów, np. (A,B)wartosc Uj wynosi 1, to dla pary (B,A) musi byc Uj = −1.

Oznacza to, ze zamiast badac zbiorowosc wszystkichpodzbiorów dwuelementowych, wsród których niektórepary składaja sie z tych samych elementów, a róznia siejedynie ich kolejnoscia (np. (A,B) i (B,A) lub (A,C)i (C,A) itd.), mozna ograniczyc rozwazania do mniejszejzbiorowosci par, w której podzbiór o okreslonychelementach wystepuje tylko raz.Jednak w takiej zbiorowosci liczba wszystkich mozliwychpar byłaby równa n(n−1)

2 , a wartosci P i Q byłyby o połowemniejsze, a wiec wzór na współczynnik τ przyjałby postac:

τ =2(P ′ −Q′)n(n − 1)

, gdzie P ′ =12

P,Q′ =12

Q.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 83: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Inne miary korelacji – współczynnik korelacji rangowej KendallaUwagi

Zauwazymy, ze jesli dla pewnej pary elementów, np. (A,B)wartosc Uj wynosi 1, to dla pary (B,A) musi byc Uj = −1.Oznacza to, ze zamiast badac zbiorowosc wszystkichpodzbiorów dwuelementowych, wsród których niektórepary składaja sie z tych samych elementów, a róznia siejedynie ich kolejnoscia (np. (A,B) i (B,A) lub (A,C)i (C,A) itd.), mozna ograniczyc rozwazania do mniejszejzbiorowosci par, w której podzbiór o okreslonychelementach wystepuje tylko raz.

Jednak w takiej zbiorowosci liczba wszystkich mozliwychpar byłaby równa n(n−1)

2 , a wartosci P i Q byłyby o połowemniejsze, a wiec wzór na współczynnik τ przyjałby postac:

τ =2(P ′ −Q′)n(n − 1)

, gdzie P ′ =12

P,Q′ =12

Q.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 84: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Inne miary korelacji – współczynnik korelacji rangowej KendallaUwagi

Zauwazymy, ze jesli dla pewnej pary elementów, np. (A,B)wartosc Uj wynosi 1, to dla pary (B,A) musi byc Uj = −1.Oznacza to, ze zamiast badac zbiorowosc wszystkichpodzbiorów dwuelementowych, wsród których niektórepary składaja sie z tych samych elementów, a róznia siejedynie ich kolejnoscia (np. (A,B) i (B,A) lub (A,C)i (C,A) itd.), mozna ograniczyc rozwazania do mniejszejzbiorowosci par, w której podzbiór o okreslonychelementach wystepuje tylko raz.Jednak w takiej zbiorowosci liczba wszystkich mozliwychpar byłaby równa n(n−1)

2 , a wartosci P i Q byłyby o połowemniejsze, a wiec wzór na współczynnik τ przyjałby postac:

τ =2(P ′ −Q′)n(n − 1)

, gdzie P ′ =12

P,Q′ =12

Q.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 85: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Analiza regresjiWprowadzenie

Jak juz wczesniej wspomniano, na ogół powiazaniapomiedzy cechami (zmiennymi) nie maja charakterumatematycznego, który dałoby sie zapisac jednoznaczniew postaci:

Y = f (X1,X2, . . . ,Xs),

gdzie f oznacza pewna funkcje opisujaca zaleznosczmiennej Y od zmiennych X1,X2, . . . ,Xs.

Zapis taki oznaczałby, ze zaleznosc pomiedzy Y apozostałymi cechamy jest scisle funkcyjna, tj. konkretnymwartosciom obserwowanych cech X1,X2, . . . ,Xsodpowiada dokładnie jedna wartosc cechy Y .W przypadku zjawisk społecznych, ekonomicznych,przyrodniczych itp. zaleznosci funkcyjne rzadko wystepuja,czesciej natomiast wystepuja zaleznosci korelacyjne.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 86: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Analiza regresjiWprowadzenie

Jak juz wczesniej wspomniano, na ogół powiazaniapomiedzy cechami (zmiennymi) nie maja charakterumatematycznego, który dałoby sie zapisac jednoznaczniew postaci:

Y = f (X1,X2, . . . ,Xs),

gdzie f oznacza pewna funkcje opisujaca zaleznosczmiennej Y od zmiennych X1,X2, . . . ,Xs.Zapis taki oznaczałby, ze zaleznosc pomiedzy Y apozostałymi cechamy jest scisle funkcyjna, tj. konkretnymwartosciom obserwowanych cech X1,X2, . . . ,Xsodpowiada dokładnie jedna wartosc cechy Y .

W przypadku zjawisk społecznych, ekonomicznych,przyrodniczych itp. zaleznosci funkcyjne rzadko wystepuja,czesciej natomiast wystepuja zaleznosci korelacyjne.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 87: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Analiza regresjiWprowadzenie

Jak juz wczesniej wspomniano, na ogół powiazaniapomiedzy cechami (zmiennymi) nie maja charakterumatematycznego, który dałoby sie zapisac jednoznaczniew postaci:

Y = f (X1,X2, . . . ,Xs),

gdzie f oznacza pewna funkcje opisujaca zaleznosczmiennej Y od zmiennych X1,X2, . . . ,Xs.Zapis taki oznaczałby, ze zaleznosc pomiedzy Y apozostałymi cechamy jest scisle funkcyjna, tj. konkretnymwartosciom obserwowanych cech X1,X2, . . . ,Xsodpowiada dokładnie jedna wartosc cechy Y .W przypadku zjawisk społecznych, ekonomicznych,przyrodniczych itp. zaleznosci funkcyjne rzadko wystepuja,czesciej natomiast wystepuja zaleznosci korelacyjne.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 88: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Analiza regresjiWprowadzenie

W statystyce zaleznosci o charakterze korelacyjnympomiedzy zmienna Y a pewnym zespołem zmiennychX1,X2, . . . ,Xs wyraza sie czesto w postaci zblizonej doprzedstawionej powyzej, ale z pewna istotna zmiana.Mianowicie:

Y = f (x1, x2, . . . , xs) + ε

x1, x2, . . . , xs reprezentuja tu konkretne (ustalone) wartoscizmiennych X1,X2, . . . ,Xs;ε jest składnikiem losowym reprezentujacym sumaryczny(nieobserwowany) wpływ innych czynników;Dołaczenie składnika losowego ε powoduje, ze konkretnymwartosciom x1, x2, . . . , xs moga odpowiadac nie takiesame, ale rózne wartosci zmiennej Y .

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 89: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Analiza regresjiWprowadzenie

W statystyce zaleznosci o charakterze korelacyjnympomiedzy zmienna Y a pewnym zespołem zmiennychX1,X2, . . . ,Xs wyraza sie czesto w postaci zblizonej doprzedstawionej powyzej, ale z pewna istotna zmiana.Mianowicie:

Y = f (x1, x2, . . . , xs) + ε

x1, x2, . . . , xs reprezentuja tu konkretne (ustalone) wartoscizmiennych X1,X2, . . . ,Xs;

ε jest składnikiem losowym reprezentujacym sumaryczny(nieobserwowany) wpływ innych czynników;Dołaczenie składnika losowego ε powoduje, ze konkretnymwartosciom x1, x2, . . . , xs moga odpowiadac nie takiesame, ale rózne wartosci zmiennej Y .

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 90: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Analiza regresjiWprowadzenie

W statystyce zaleznosci o charakterze korelacyjnympomiedzy zmienna Y a pewnym zespołem zmiennychX1,X2, . . . ,Xs wyraza sie czesto w postaci zblizonej doprzedstawionej powyzej, ale z pewna istotna zmiana.Mianowicie:

Y = f (x1, x2, . . . , xs) + ε

x1, x2, . . . , xs reprezentuja tu konkretne (ustalone) wartoscizmiennych X1,X2, . . . ,Xs;ε jest składnikiem losowym reprezentujacym sumaryczny(nieobserwowany) wpływ innych czynników;

Dołaczenie składnika losowego ε powoduje, ze konkretnymwartosciom x1, x2, . . . , xs moga odpowiadac nie takiesame, ale rózne wartosci zmiennej Y .

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 91: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Analiza regresjiWprowadzenie

W statystyce zaleznosci o charakterze korelacyjnympomiedzy zmienna Y a pewnym zespołem zmiennychX1,X2, . . . ,Xs wyraza sie czesto w postaci zblizonej doprzedstawionej powyzej, ale z pewna istotna zmiana.Mianowicie:

Y = f (x1, x2, . . . , xs) + ε

x1, x2, . . . , xs reprezentuja tu konkretne (ustalone) wartoscizmiennych X1,X2, . . . ,Xs;ε jest składnikiem losowym reprezentujacym sumaryczny(nieobserwowany) wpływ innych czynników;Dołaczenie składnika losowego ε powoduje, ze konkretnymwartosciom x1, x2, . . . , xs moga odpowiadac nie takiesame, ale rózne wartosci zmiennej Y .

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 92: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Analiza regresjiTerminologia

Zmienna objasniana (zmienna zalezna) – zmiennabedaca przedmiotem badania. Na ogół oznaczamy jasymbolem Y .

Zmienne objasniajace (zmienne niezalezne) – zmienne,za pomoca których chcemy objasnic zmiany zmiennejzaleznej. Na ogół oznaczamy je symbolami X1,X2, . . ..

Funkcja regresji – funkcja odwzorowujaca zaleznoscpomiedzy zmienna objasniana Y a zmiennymiobjasniajacymi.

W przypadku wielu zmiennych objasniajacych mówimy oregresji wielorakiej, natomiast w przypadku jednejzmiennej objasniajacej – o regresji jednej zmiennej.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 93: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Analiza regresjiTerminologia

Zmienna objasniana (zmienna zalezna) – zmiennabedaca przedmiotem badania. Na ogół oznaczamy jasymbolem Y .

Zmienne objasniajace (zmienne niezalezne) – zmienne,za pomoca których chcemy objasnic zmiany zmiennejzaleznej. Na ogół oznaczamy je symbolami X1,X2, . . ..

Funkcja regresji – funkcja odwzorowujaca zaleznoscpomiedzy zmienna objasniana Y a zmiennymiobjasniajacymi.

W przypadku wielu zmiennych objasniajacych mówimy oregresji wielorakiej, natomiast w przypadku jednejzmiennej objasniajacej – o regresji jednej zmiennej.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 94: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Analiza regresjiTerminologia

Zmienna objasniana (zmienna zalezna) – zmiennabedaca przedmiotem badania. Na ogół oznaczamy jasymbolem Y .

Zmienne objasniajace (zmienne niezalezne) – zmienne,za pomoca których chcemy objasnic zmiany zmiennejzaleznej. Na ogół oznaczamy je symbolami X1,X2, . . ..

Funkcja regresji – funkcja odwzorowujaca zaleznoscpomiedzy zmienna objasniana Y a zmiennymiobjasniajacymi.

W przypadku wielu zmiennych objasniajacych mówimy oregresji wielorakiej, natomiast w przypadku jednejzmiennej objasniajacej – o regresji jednej zmiennej.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 95: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Analiza regresjiTerminologia

Zmienna objasniana (zmienna zalezna) – zmiennabedaca przedmiotem badania. Na ogół oznaczamy jasymbolem Y .

Zmienne objasniajace (zmienne niezalezne) – zmienne,za pomoca których chcemy objasnic zmiany zmiennejzaleznej. Na ogół oznaczamy je symbolami X1,X2, . . ..

Funkcja regresji – funkcja odwzorowujaca zaleznoscpomiedzy zmienna objasniana Y a zmiennymiobjasniajacymi.

W przypadku wielu zmiennych objasniajacych mówimy oregresji wielorakiej, natomiast w przypadku jednejzmiennej objasniajacej – o regresji jednej zmiennej.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 96: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Regresja liniowa jednej zmiennej

Dalej przyjmiemy nastepujace załozenia:Składnik losowy ε ma wartosc srednia równa 0 i pewnadodatnia wariancje oznaczana symbolem σ2.

Mamy tylko jedna zmienna objasniajaca X .

Funkcja f nalezy do klasy funkcji liniowych.

Model regresji liniowej:Przy podanych załozeniach, zaleznosc pomiedzy cechamiY i X mozemy zapisac w postaci

Y = a + bx + ε,

gdzie a i b sa pewnymi parametrami.

Model ten nazywamy modelem regresji liniowej jednejzmiennej. Parametry a i b nazywamy odpowiedniowyrazem wolnym i współczynnikiem regresji.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 97: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Regresja liniowa jednej zmiennej

Dalej przyjmiemy nastepujace załozenia:Składnik losowy ε ma wartosc srednia równa 0 i pewnadodatnia wariancje oznaczana symbolem σ2.

Mamy tylko jedna zmienna objasniajaca X .

Funkcja f nalezy do klasy funkcji liniowych.

Model regresji liniowej:Przy podanych załozeniach, zaleznosc pomiedzy cechamiY i X mozemy zapisac w postaci

Y = a + bx + ε,

gdzie a i b sa pewnymi parametrami.

Model ten nazywamy modelem regresji liniowej jednejzmiennej. Parametry a i b nazywamy odpowiedniowyrazem wolnym i współczynnikiem regresji.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 98: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Regresja liniowa jednej zmiennej

Dalej przyjmiemy nastepujace załozenia:Składnik losowy ε ma wartosc srednia równa 0 i pewnadodatnia wariancje oznaczana symbolem σ2.

Mamy tylko jedna zmienna objasniajaca X .

Funkcja f nalezy do klasy funkcji liniowych.

Model regresji liniowej:Przy podanych załozeniach, zaleznosc pomiedzy cechamiY i X mozemy zapisac w postaci

Y = a + bx + ε,

gdzie a i b sa pewnymi parametrami.

Model ten nazywamy modelem regresji liniowej jednejzmiennej. Parametry a i b nazywamy odpowiedniowyrazem wolnym i współczynnikiem regresji.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 99: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Regresja liniowa jednej zmiennej

Dalej przyjmiemy nastepujace załozenia:Składnik losowy ε ma wartosc srednia równa 0 i pewnadodatnia wariancje oznaczana symbolem σ2.

Mamy tylko jedna zmienna objasniajaca X .

Funkcja f nalezy do klasy funkcji liniowych.

Model regresji liniowej:

Przy podanych załozeniach, zaleznosc pomiedzy cechamiY i X mozemy zapisac w postaci

Y = a + bx + ε,

gdzie a i b sa pewnymi parametrami.

Model ten nazywamy modelem regresji liniowej jednejzmiennej. Parametry a i b nazywamy odpowiedniowyrazem wolnym i współczynnikiem regresji.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 100: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Regresja liniowa jednej zmiennej

Dalej przyjmiemy nastepujace załozenia:Składnik losowy ε ma wartosc srednia równa 0 i pewnadodatnia wariancje oznaczana symbolem σ2.

Mamy tylko jedna zmienna objasniajaca X .

Funkcja f nalezy do klasy funkcji liniowych.

Model regresji liniowej:Przy podanych załozeniach, zaleznosc pomiedzy cechamiY i X mozemy zapisac w postaci

Y = a + bx + ε,

gdzie a i b sa pewnymi parametrami.

Model ten nazywamy modelem regresji liniowej jednejzmiennej. Parametry a i b nazywamy odpowiedniowyrazem wolnym i współczynnikiem regresji.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 101: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Regresja liniowa jednej zmiennej

Dalej przyjmiemy nastepujace załozenia:Składnik losowy ε ma wartosc srednia równa 0 i pewnadodatnia wariancje oznaczana symbolem σ2.

Mamy tylko jedna zmienna objasniajaca X .

Funkcja f nalezy do klasy funkcji liniowych.

Model regresji liniowej:Przy podanych załozeniach, zaleznosc pomiedzy cechamiY i X mozemy zapisac w postaci

Y = a + bx + ε,

gdzie a i b sa pewnymi parametrami.

Model ten nazywamy modelem regresji liniowej jednejzmiennej. Parametry a i b nazywamy odpowiedniowyrazem wolnym i współczynnikiem regresji.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 102: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Regresja liniowa jednej zmiennej

Funkcjef (x) = a + bx

nazywamy prosta regresji.

Podstawowym problemem, jaki pojawia sie przywyznaczaniu równania prostej regresji, która opisywałabymozliwie wiernie zaleznosc pomiedzy konkretnymizmiennymi Y i X , jest okreslenie liczbowych wartosciparametrów a i b.

Dokonujemy tego na podstawie obserwacji wartosci cechY i X w badanej zbiorowosci, stosujac tzw. metodenajmniejszych kwadratów MNK.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 103: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Regresja liniowa jednej zmiennej

Funkcjef (x) = a + bx

nazywamy prosta regresji.

Podstawowym problemem, jaki pojawia sie przywyznaczaniu równania prostej regresji, która opisywałabymozliwie wiernie zaleznosc pomiedzy konkretnymizmiennymi Y i X , jest okreslenie liczbowych wartosciparametrów a i b.

Dokonujemy tego na podstawie obserwacji wartosci cechY i X w badanej zbiorowosci, stosujac tzw. metodenajmniejszych kwadratów MNK.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 104: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Regresja liniowa jednej zmiennej

Funkcjef (x) = a + bx

nazywamy prosta regresji.

Podstawowym problemem, jaki pojawia sie przywyznaczaniu równania prostej regresji, która opisywałabymozliwie wiernie zaleznosc pomiedzy konkretnymizmiennymi Y i X , jest okreslenie liczbowych wartosciparametrów a i b.

Dokonujemy tego na podstawie obserwacji wartosci cechY i X w badanej zbiorowosci, stosujac tzw. metodenajmniejszych kwadratów MNK.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 105: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Regresja liniowa jednej zmiennejPrzykład

Copyright Giorgio Krenkel and Alex Sandri, GNU Free Documentation License, Low ResolutionAgnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 106: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Regresja liniowa jednej zmiennejPrzykład

Copyright Giorgio Krenkel and Alex Sandri, GNU Free Documentation License, Low ResolutionAgnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 107: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Regresja liniowa jednej zmiennejPrzykład – jak wyznaczyc prosta regresji?

W tym przykładzie chcielibysmy, zeby prosta najlepiejprzyblizała dana chmure punktów, czyli by wartosci róznicyi − yi (tzw. wartosci resztowe lub inaczej – wartosciskładnika losowego) były jak najmniejsze dla wszystkichbadanych jednostek.

Jak łatwo zauwazyc, przesuniecie prostej w kierunkujednego z punktów moze spowodowac odsuniecie odinnych punktów. Tak wiec postulat, aby jednoczesnieminimalizowac wszystkie wartosci resztowe nie jestmozliwy do realizacji.

Jako kryterium dopasowania prostej regresji do danychempirycznych przyjmuje sie minimalizacje sumykwadratów wartosci resztowych.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 108: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Regresja liniowa jednej zmiennejPrzykład – jak wyznaczyc prosta regresji?

W tym przykładzie chcielibysmy, zeby prosta najlepiejprzyblizała dana chmure punktów, czyli by wartosci róznicyi − yi (tzw. wartosci resztowe lub inaczej – wartosciskładnika losowego) były jak najmniejsze dla wszystkichbadanych jednostek.

Jak łatwo zauwazyc, przesuniecie prostej w kierunkujednego z punktów moze spowodowac odsuniecie odinnych punktów. Tak wiec postulat, aby jednoczesnieminimalizowac wszystkie wartosci resztowe nie jestmozliwy do realizacji.

Jako kryterium dopasowania prostej regresji do danychempirycznych przyjmuje sie minimalizacje sumykwadratów wartosci resztowych.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 109: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Regresja liniowa jednej zmiennejPrzykład – jak wyznaczyc prosta regresji?

W tym przykładzie chcielibysmy, zeby prosta najlepiejprzyblizała dana chmure punktów, czyli by wartosci róznicyi − yi (tzw. wartosci resztowe lub inaczej – wartosciskładnika losowego) były jak najmniejsze dla wszystkichbadanych jednostek.

Jak łatwo zauwazyc, przesuniecie prostej w kierunkujednego z punktów moze spowodowac odsuniecie odinnych punktów. Tak wiec postulat, aby jednoczesnieminimalizowac wszystkie wartosci resztowe nie jestmozliwy do realizacji.

Jako kryterium dopasowania prostej regresji do danychempirycznych przyjmuje sie minimalizacje sumykwadratów wartosci resztowych.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 110: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Metoda najmniejszych kwadratów

Niech (y1, x1), (y2, x2), . . . , (yn, xn),bedzie n-elementowym zbiorem wartosci zmiennych Y i X .

Rozwazmy sume kwadratów wartosci resztowychn∑

i=1

(yi − yi)2 ,

lub równowaznien∑

i=1

(yi − (a + bxi))2 ,

która oznaczymy symbolem S(a,b).Funkcje regresji, dla której wartosci parametrów a,bwyznaczone zostały w drodze minimalizacji sumy S(a,b)nazywamy prosta regresji MNK i oznaczamy przez y .

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 111: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Metoda najmniejszych kwadratów

Niech (y1, x1), (y2, x2), . . . , (yn, xn),bedzie n-elementowym zbiorem wartosci zmiennych Y i X .Rozwazmy sume kwadratów wartosci resztowych

n∑i=1

(yi − yi)2 ,

lub równowaznien∑

i=1

(yi − (a + bxi))2 ,

która oznaczymy symbolem S(a,b).

Funkcje regresji, dla której wartosci parametrów a,bwyznaczone zostały w drodze minimalizacji sumy S(a,b)nazywamy prosta regresji MNK i oznaczamy przez y .

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 112: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Metoda najmniejszych kwadratów

Niech (y1, x1), (y2, x2), . . . , (yn, xn),bedzie n-elementowym zbiorem wartosci zmiennych Y i X .Rozwazmy sume kwadratów wartosci resztowych

n∑i=1

(yi − yi)2 ,

lub równowaznien∑

i=1

(yi − (a + bxi))2 ,

która oznaczymy symbolem S(a,b).Funkcje regresji, dla której wartosci parametrów a,bwyznaczone zostały w drodze minimalizacji sumy S(a,b)nazywamy prosta regresji MNK i oznaczamy przez y .

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 113: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Metoda najmniejszych kwadratówTroche matematyki, czyli jak obliczyc a i b

Po zrozniczkowaniu sumy S(a,b) wzgledem a i bi przyrównaniu obu pochodnych czastkowych do 0, mamy

∂S(a,b)

∂a= −2

n∑i=1

(yi − (a + bxi)) = 0,

∂S(a,b)

∂b= −2

n∑i=1

xi(yi − (a + bxi)) = 0.

Zapisujac inaczej, mamy układ dwóch równann∑

i=1

yi − na− bn∑

i=1

xi = 0,

n∑i=1

xiyi − an∑

i=1

xi − bn∑

i=1

x2i = 0.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 114: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Metoda najmniejszych kwadratówTroche matematyki, czyli jak obliczyc a i b

Po zrozniczkowaniu sumy S(a,b) wzgledem a i bi przyrównaniu obu pochodnych czastkowych do 0, mamy

∂S(a,b)

∂a= −2

n∑i=1

(yi − (a + bxi)) = 0,

∂S(a,b)

∂b= −2

n∑i=1

xi(yi − (a + bxi)) = 0.

Zapisujac inaczej, mamy układ dwóch równann∑

i=1

yi − na− bn∑

i=1

xi = 0,

n∑i=1

xiyi − an∑

i=1

xi − bn∑

i=1

x2i = 0.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 115: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Metoda najmniejszych kwadratówTroche matematyki

Z pierwszego równania natychmiast otrzymujemy, ze

a =1n

(n∑

i=1

yi − bn∑

i=1

xi

)= y − bx .

Po wstawieniu powyzszego wyrazenia do drugiegorównania mamy takze

n∑i=1

xiyi − (y − bx)n∑

i=1

xi − bn∑

i=1

x2i = 0,

co po przekształceniach daje

b =

∑ni=1(xi − x)(yi − y)∑n

i=1(xi − x)2 .

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 116: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Metoda najmniejszych kwadratówTroche matematyki

Z pierwszego równania natychmiast otrzymujemy, ze

a =1n

(n∑

i=1

yi − bn∑

i=1

xi

)= y − bx .

Po wstawieniu powyzszego wyrazenia do drugiegorównania mamy takze

n∑i=1

xiyi − (y − bx)n∑

i=1

xi − bn∑

i=1

x2i = 0,

co po przekształceniach daje

b =

∑ni=1(xi − x)(yi − y)∑n

i=1(xi − x)2 .

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 117: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Metoda najmniejszych kwadratówTroche matematyki

Z pierwszego równania natychmiast otrzymujemy, ze

a =1n

(n∑

i=1

yi − bn∑

i=1

xi

)= y − bx .

Po wstawieniu powyzszego wyrazenia do drugiegorównania mamy takze

n∑i=1

xiyi − (y − bx)n∑

i=1

xi − bn∑

i=1

x2i = 0,

co po przekształceniach daje

b =

∑ni=1(xi − x)(yi − y)∑n

i=1(xi − x)2 .

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 118: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Metoda najmniejszych kwadratówPodsumowanie

Równanie prostej regresji MNK y = a + bx znajdziemy,obliczajac wyraz wolny a oraz współczynnik regresji b,które sa okreslone nastepujacymi wzorami

a = y − bx ,

b =

∑ni=1(xi − x)(yi − y)∑n

i=1(xi − x)2 ,

lub równowaznie

b =1n∑n

i=1(xi − x)(yi − y)

s2x

,

gdzie(y1, x1), (y2, x2), . . . , (yn, xn),

sa wartosciami zmiennych Y i X w badanej zbiorowosci.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 119: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Relacja łaczaca współczynnik regresji i współczynnik korelacjiliniowej Pearsona

Porównajmy wzory na współczynnik regresji b orazwspółczynnik korelacji liniowej Pearsona r :

b =1n∑n

i=1(xi − x)(yi − y)

s2x

, r =1n∑n

i=1(xi − x)(yi − y)

sx · sy.

Wniosek 1: Pomiedzy współczynnikami b i r zachodzirównosc

b = r ·sy

sx

Wniosek 2: Współczynniki b i r maja zawsze ten samznak, przy czym współczynnik b nie musi nalezec doprzedziału [−1,1], w przeciwienstwie do współczynnika rkorelacji liniowej Pearsona.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 120: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Relacja łaczaca współczynnik regresji i współczynnik korelacjiliniowej Pearsona

Porównajmy wzory na współczynnik regresji b orazwspółczynnik korelacji liniowej Pearsona r :

b =1n∑n

i=1(xi − x)(yi − y)

s2x

, r =1n∑n

i=1(xi − x)(yi − y)

sx · sy.

Wniosek 1: Pomiedzy współczynnikami b i r zachodzirównosc

b = r ·sy

sx

Wniosek 2: Współczynniki b i r maja zawsze ten samznak, przy czym współczynnik b nie musi nalezec doprzedziału [−1,1], w przeciwienstwie do współczynnika rkorelacji liniowej Pearsona.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 121: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Relacja łaczaca współczynnik regresji i współczynnik korelacjiliniowej Pearsona

Porównajmy wzory na współczynnik regresji b orazwspółczynnik korelacji liniowej Pearsona r :

b =1n∑n

i=1(xi − x)(yi − y)

s2x

, r =1n∑n

i=1(xi − x)(yi − y)

sx · sy.

Wniosek 1: Pomiedzy współczynnikami b i r zachodzirównosc

b = r ·sy

sx

Wniosek 2: Współczynniki b i r maja zawsze ten samznak, przy czym współczynnik b nie musi nalezec doprzedziału [−1,1], w przeciwienstwie do współczynnika rkorelacji liniowej Pearsona.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 122: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Regresja liniowa jednej zmiennejPrzykład c.d.

Copyright Giorgio Krenkel and Alex Sandri, GNU Free Documentation License, Low Resolution

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 123: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Ocena ”dobroci” dopasowania prostej regresji MNK

Jak wiemy, zmiennosc kazdej cechy ilosciowej, a wiecrówniez zmiennej objasnianej Y , mozemy oceniac np. zapomoca wariancji s2

y :

s2y =

1n

n∑i=1

(yi − y)2,

gdzie y1, y2, . . . , yn jest n-elementowym zbioremzaobserowanych wartosci tej zmiennej.

Pomijajac składnik 1/n w powyzszym wyrazeniu,otrzymujemy wzór na tzw. całkowita sume kwadratów

SST =n∑

i=1

(yi − y)2.

Mozna pokazac, ze SST daje sie rozbic na dwie sumy,które takze interpretujemy w kategoriach zmiennosci.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 124: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Ocena ”dobroci” dopasowania prostej regresji MNK

Jak wiemy, zmiennosc kazdej cechy ilosciowej, a wiecrówniez zmiennej objasnianej Y , mozemy oceniac np. zapomoca wariancji s2

y :

s2y =

1n

n∑i=1

(yi − y)2,

gdzie y1, y2, . . . , yn jest n-elementowym zbioremzaobserowanych wartosci tej zmiennej.Pomijajac składnik 1/n w powyzszym wyrazeniu,otrzymujemy wzór na tzw. całkowita sume kwadratów

SST =n∑

i=1

(yi − y)2.

Mozna pokazac, ze SST daje sie rozbic na dwie sumy,które takze interpretujemy w kategoriach zmiennosci.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 125: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Ocena ”dobroci” dopasowania prostej regresji MNK

Jak wiemy, zmiennosc kazdej cechy ilosciowej, a wiecrówniez zmiennej objasnianej Y , mozemy oceniac np. zapomoca wariancji s2

y :

s2y =

1n

n∑i=1

(yi − y)2,

gdzie y1, y2, . . . , yn jest n-elementowym zbioremzaobserowanych wartosci tej zmiennej.Pomijajac składnik 1/n w powyzszym wyrazeniu,otrzymujemy wzór na tzw. całkowita sume kwadratów

SST =n∑

i=1

(yi − y)2.

Mozna pokazac, ze SST daje sie rozbic na dwie sumy,które takze interpretujemy w kategoriach zmiennosci.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 126: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Ocena ”dobroci” dopasowania prostej regresji MNK

Mianowicie

SST =n∑

i=1

(yi − yi)2 +

n∑i=1

(yi − y)2,

gdzie yi = a + bxi .

Pierwszy ze składników nosi nazwe sumy kwadratówbłedów, poniewaz jest suma kwadratów wartosciresztowych. Jest oznaczany przez SSE . Drugi składniknosi miano regresyjnej sumy kwadratów i jest oznaczanysymbolem SSR.Suma SSR jest czescia zmiennosci całkowitej SST , któramozna objasnic za pomoca regresji miedzy zmiennaobjasniana Y i zmienna objasniajaca X .Z kolei sume SSE traktujemy jako te czesc zmiennosciSST , która nie jest wyjasniona przez model regresji.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 127: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Ocena ”dobroci” dopasowania prostej regresji MNK

Mianowicie

SST =n∑

i=1

(yi − yi)2 +

n∑i=1

(yi − y)2,

gdzie yi = a + bxi .Pierwszy ze składników nosi nazwe sumy kwadratówbłedów, poniewaz jest suma kwadratów wartosciresztowych. Jest oznaczany przez SSE . Drugi składniknosi miano regresyjnej sumy kwadratów i jest oznaczanysymbolem SSR.

Suma SSR jest czescia zmiennosci całkowitej SST , któramozna objasnic za pomoca regresji miedzy zmiennaobjasniana Y i zmienna objasniajaca X .Z kolei sume SSE traktujemy jako te czesc zmiennosciSST , która nie jest wyjasniona przez model regresji.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 128: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Ocena ”dobroci” dopasowania prostej regresji MNK

Mianowicie

SST =n∑

i=1

(yi − yi)2 +

n∑i=1

(yi − y)2,

gdzie yi = a + bxi .Pierwszy ze składników nosi nazwe sumy kwadratówbłedów, poniewaz jest suma kwadratów wartosciresztowych. Jest oznaczany przez SSE . Drugi składniknosi miano regresyjnej sumy kwadratów i jest oznaczanysymbolem SSR.Suma SSR jest czescia zmiennosci całkowitej SST , któramozna objasnic za pomoca regresji miedzy zmiennaobjasniana Y i zmienna objasniajaca X .

Z kolei sume SSE traktujemy jako te czesc zmiennosciSST , która nie jest wyjasniona przez model regresji.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 129: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Ocena ”dobroci” dopasowania prostej regresji MNK

Mianowicie

SST =n∑

i=1

(yi − yi)2 +

n∑i=1

(yi − y)2,

gdzie yi = a + bxi .Pierwszy ze składników nosi nazwe sumy kwadratówbłedów, poniewaz jest suma kwadratów wartosciresztowych. Jest oznaczany przez SSE . Drugi składniknosi miano regresyjnej sumy kwadratów i jest oznaczanysymbolem SSR.Suma SSR jest czescia zmiennosci całkowitej SST , któramozna objasnic za pomoca regresji miedzy zmiennaobjasniana Y i zmienna objasniajaca X .Z kolei sume SSE traktujemy jako te czesc zmiennosciSST , która nie jest wyjasniona przez model regresji.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 130: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Ocena ”dobroci” dopasowania prostej regresji MNK

Iloraz

R2 =SSRSST

=

∑ni=1(yi − y)2∑ni=1(yi − y)2 ,

jest nazwany współczynnikiem determinacji.

R2 jest miara stopnia dopasowania funkcji regresji dodanych empirycznych.

W przypadku regresji liniowej jednej zmiennejwspółczynnik determinacji R2 równy jest kwadratowiwspółczynnika korelacji liniowej Pearsona.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 131: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Ocena ”dobroci” dopasowania prostej regresji MNK

Iloraz

R2 =SSRSST

=

∑ni=1(yi − y)2∑ni=1(yi − y)2 ,

jest nazwany współczynnikiem determinacji.

R2 jest miara stopnia dopasowania funkcji regresji dodanych empirycznych.

W przypadku regresji liniowej jednej zmiennejwspółczynnik determinacji R2 równy jest kwadratowiwspółczynnika korelacji liniowej Pearsona.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 132: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Ocena ”dobroci” dopasowania prostej regresji MNK

Iloraz

R2 =SSRSST

=

∑ni=1(yi − y)2∑ni=1(yi − y)2 ,

jest nazwany współczynnikiem determinacji.

R2 jest miara stopnia dopasowania funkcji regresji dodanych empirycznych.

W przypadku regresji liniowej jednej zmiennejwspółczynnik determinacji R2 równy jest kwadratowiwspółczynnika korelacji liniowej Pearsona.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 133: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Ocena ”dobroci” dopasowania prostej regresji MNKPrzykład c.d.

Copyright Giorgio Krenkel and Alex Sandri, GNU Free Documentation License, Low Resolution

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 134: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Przewidywanie na podstawie funkcji regresji

Funkcje regresji mozna wykorzystac do przewidywaniawartosci zmiennej objasnianej Y na podstawie znanychwartosci zmiennej objasniajacych (ekstrapolacja).

Tego rodzaju przewidywanie ma sens przy załozeniu, zecharakter zaleznosci i oddziaływania czynników nieuwzglednionych w modelu sa podobne do zaobserwo-wanych w badanej zbiorowosci.W naszym przykładzie otrzymalismy prosta regresji:y = 5,17 + 1,76 · x Na tej podstawie mozemy ocenic np.oczekiwany wynik z egzaminu dla osoby, która otrzymałabyz kolokwium 18 punktów. Mamy:y(x=18) = 5,17 + 1,76 · 18 = 36,85 ≈ 37 pktNalezy jednak pamietac, ze przy tego rodzaju przewidywa-niach mozemy sie mylic o pewna wartosc. W celu ocenyskali błedu obliczamy tzw. sredni bład przewidywania.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 135: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Przewidywanie na podstawie funkcji regresji

Funkcje regresji mozna wykorzystac do przewidywaniawartosci zmiennej objasnianej Y na podstawie znanychwartosci zmiennej objasniajacych (ekstrapolacja).Tego rodzaju przewidywanie ma sens przy załozeniu, zecharakter zaleznosci i oddziaływania czynników nieuwzglednionych w modelu sa podobne do zaobserwo-wanych w badanej zbiorowosci.

W naszym przykładzie otrzymalismy prosta regresji:y = 5,17 + 1,76 · x Na tej podstawie mozemy ocenic np.oczekiwany wynik z egzaminu dla osoby, która otrzymałabyz kolokwium 18 punktów. Mamy:y(x=18) = 5,17 + 1,76 · 18 = 36,85 ≈ 37 pktNalezy jednak pamietac, ze przy tego rodzaju przewidywa-niach mozemy sie mylic o pewna wartosc. W celu ocenyskali błedu obliczamy tzw. sredni bład przewidywania.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 136: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Przewidywanie na podstawie funkcji regresji

Funkcje regresji mozna wykorzystac do przewidywaniawartosci zmiennej objasnianej Y na podstawie znanychwartosci zmiennej objasniajacych (ekstrapolacja).Tego rodzaju przewidywanie ma sens przy załozeniu, zecharakter zaleznosci i oddziaływania czynników nieuwzglednionych w modelu sa podobne do zaobserwo-wanych w badanej zbiorowosci.W naszym przykładzie otrzymalismy prosta regresji:y = 5,17 + 1,76 · x Na tej podstawie mozemy ocenic np.oczekiwany wynik z egzaminu dla osoby, która otrzymałabyz kolokwium 18 punktów. Mamy:y(x=18) = 5,17 + 1,76 · 18 = 36,85 ≈ 37 pkt

Nalezy jednak pamietac, ze przy tego rodzaju przewidywa-niach mozemy sie mylic o pewna wartosc. W celu ocenyskali błedu obliczamy tzw. sredni bład przewidywania.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 137: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Przewidywanie na podstawie funkcji regresji

Funkcje regresji mozna wykorzystac do przewidywaniawartosci zmiennej objasnianej Y na podstawie znanychwartosci zmiennej objasniajacych (ekstrapolacja).Tego rodzaju przewidywanie ma sens przy załozeniu, zecharakter zaleznosci i oddziaływania czynników nieuwzglednionych w modelu sa podobne do zaobserwo-wanych w badanej zbiorowosci.W naszym przykładzie otrzymalismy prosta regresji:y = 5,17 + 1,76 · x Na tej podstawie mozemy ocenic np.oczekiwany wynik z egzaminu dla osoby, która otrzymałabyz kolokwium 18 punktów. Mamy:y(x=18) = 5,17 + 1,76 · 18 = 36,85 ≈ 37 pktNalezy jednak pamietac, ze przy tego rodzaju przewidywa-niach mozemy sie mylic o pewna wartosc. W celu ocenyskali błedu obliczamy tzw. sredni bład przewidywania.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 138: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Przewidywanie na podstawie funkcji regresji

Rozwazmy pierwiastek kwadratowy sumy kwadratówbłedów SSE podzielony przez liczebnosc zbiorowosci,pomniejszona o liczbe parametrów funkcji regresji(w przypadku regresji liniowej jednej zmiennej liczbaparametrów równa jest 2). Mamy:

Sε =

√SSEn − 2

=

√√√√ 1n − 2

n∑i=1

(yi − yi)2

Powyzsze wyrazenie nazywamy srednim błedemprzewidywania. W naszym przykładzie Sε jest równe:

Sε =

√69,2619− 2

≈ 2,02

zatem przewidujac wynik z egzaminu na podstawie wy-znaczonej prostej regresji, mylimy sie srednio o ok. 2 pkt.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI

Page 139: ANALIZA KORELACJI I REGRESJI

Zaleznosci korelacyjneRegresja liniowa

Przewidywanie na podstawie funkcji regresji

Rozwazmy pierwiastek kwadratowy sumy kwadratówbłedów SSE podzielony przez liczebnosc zbiorowosci,pomniejszona o liczbe parametrów funkcji regresji(w przypadku regresji liniowej jednej zmiennej liczbaparametrów równa jest 2). Mamy:

Sε =

√SSEn − 2

=

√√√√ 1n − 2

n∑i=1

(yi − yi)2

Powyzsze wyrazenie nazywamy srednim błedemprzewidywania. W naszym przykładzie Sε jest równe:

Sε =

√69,2619− 2

≈ 2,02

zatem przewidujac wynik z egzaminu na podstawie wy-znaczonej prostej regresji, mylimy sie srednio o ok. 2 pkt.

Agnieszka Rossa ANALIZA KORELACJI I REGRESJI