Doświadczenia 2-grupowedp.utp.edu.pl/wyklady/stat2008_2009/cw_mod4.pdf · Katedra Genetyki i...

9
Katedra Genetyki i Podstaw Hodowli Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy Ćwiczenie: Doświadczenia 2-grupowe EXCEL Do weryfikacji różnic między dwiema grupami jednostek doświadczalnych w Excelu wykorzystujemy funkcję o nazwie TEST.T. Zastosowana funkcja (test statystyczny) pozwala ocenić czy mamy podstawy do odrzucenia H o na korzyść hipotezy alternatywnej H 1 czy też podstaw tych nie ma. Informację tę otrzymujemy w formie prawdopodobieństwa popełnienia błędu I rodzaju (poziom istotności). Błąd ten informuje o tym, jakie jest prawdopodobieństwo odrzucenia H o, gdy jest ona prawdziwa. Tak też należy traktować wartości liczbowe będące skutkiem zadziałania funkcji TEST.T. Składnia funkcji TEST.T(tablica1;tablica2;ślady;typ) Tablica1 – pierwsza grupa obserwacji. Tablica2 – druga grupa obserwacji. Ślady – określenie czy użyty test statystyczny ma być jednostronny (1) czy dwustronny (2). Typ - jest to rodzaj testu t, który ma być przeprowadzony: Jeżeli typ równa się Wariant testu 1 Sparowany 2 Wariancja równa dla dwóch prób (homoscedastyczna) 3 Wariancja nierówna dla dwóch prób (heteroscedastyczna) Wartości krytyczne rozkładu t-Studenta można otrzymać w wyniku zastosowania funkcji: =rozkład.t.odw(α; ν) Przykład 1. Sprawdź czy kobiety i mężczyźni różnią się pod względem wzrostu, długości stopy oraz „indeksu” stopy. W tym celu wykorzystaj funkcję TEST.T, a ponadto moduł Analiza danych. 1. Obliczamy średnie arytmetyczne w odniesieniu do obu płci i wszystkich zmiennych. Średnie k 166.25 23.60 14.20 m 180.63 26.59 14.72 2. Zanim przejdziemy do porównania średnich musimy sprawdzić czy zmienność w porównywanych grupach jest podobna czy też różna – czy wariancje są równe? Stosujemy test Fishera (TEST.F) =test.F(E2:E88;E89:E115). Jeżeli wynik formuły jest mniejszy lub równy 0,05, to wnioskujemy że wariancje (zmienność) są nierówne. Informacja ta jest niezbędna do podjęcia decyzji o rodzaju testu t. Hipoteza zerowa o równości wariancji w porównywanych populacjach posiada następującą postać: H 0 : D 2 (X 1 ) = D 2 (X 2 ) zaś alternatywna zakładająca różnice w zakresie zmienności: H 1 : D 2 (X 1 ) D 2 (X 2 ) Statystyka i modelowanie w ochronie środowiska Strona 1 2009-04-24 11:40:00

Transcript of Doświadczenia 2-grupowedp.utp.edu.pl/wyklady/stat2008_2009/cw_mod4.pdf · Katedra Genetyki i...

Page 1: Doświadczenia 2-grupowedp.utp.edu.pl/wyklady/stat2008_2009/cw_mod4.pdf · Katedra Genetyki i Podstaw Hodowli Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy W MS

Katedra Genetyki i Podstaw Hodowli ZwierzątWydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Ćwiczenie: Doświadczenia 2-grupowe

EXCELDo weryfikacji różnic między dwiema grupami jednostek doświadczalnych w Excelu

wykorzystujemy funkcję o nazwie TEST.T. Zastosowana funkcja (test statystyczny) pozwala ocenić czy mamy podstawy do odrzucenia Ho na korzyść hipotezy alternatywnej H1 czy też podstaw tych nie ma. Informację tę otrzymujemy w formie prawdopodobieństwa popełnienia błędu I rodzaju (poziom istotności). Błąd ten informuje o tym, jakie jest prawdopodobieństwo odrzucenia Ho, gdy jest ona prawdziwa. Tak też należy traktować wartości liczbowe będące skutkiem zadziałania funkcji TEST.T.

Składnia funkcji• TEST.T(tablica1;tablica2;ślady;typ)• Tablica1 – pierwsza grupa obserwacji.• Tablica2 – druga grupa obserwacji.• Ślady – określenie czy użyty test statystyczny ma być jednostronny (1) czy dwustronny (2). • Typ - jest to rodzaj testu t, który ma być przeprowadzony:

Jeżeli typ równa się Wariant testu1 Sparowany2 Wariancja równa dla dwóch prób (homoscedastyczna)3 Wariancja nierówna dla dwóch prób (heteroscedastyczna)

Wartości krytyczne rozkładu t-Studenta można otrzymać w wyniku zastosowania funkcji:=rozkład.t.odw(α; ν)

Przykład 1. Sprawdź czy kobiety i mężczyźni różnią się pod względem wzrostu, długości stopy oraz „indeksu” stopy. W tym celu wykorzystaj funkcję TEST.T, a ponadto moduł Analiza danych.

1. Obliczamy średnie arytmetyczne w odniesieniu do obu płci i wszystkich zmiennych.

Średnie k 166.25 23.60 14.20m 180.63 26.59 14.72

2. Zanim przejdziemy do porównania średnich musimy sprawdzić czy zmienność w porównywanych grupach jest podobna czy też różna – czy wariancje są równe? Stosujemy test Fishera (TEST.F) =test.F(E2:E88;E89:E115). Jeżeli wynik formuły jest mniejszy lub równy 0,05, to wnioskujemy że wariancje (zmienność) są nierówne. Informacja ta jest niezbędna do podjęcia decyzji o rodzaju testu t.

Hipoteza zerowa o równości wariancji w porównywanych populacjach posiada następującą postać:

H0: D2(X1) = D2(X2)zaś alternatywna zakładająca różnice w zakresie zmienności:

H1: D2(X1) ≠ D2(X2)

Statystyka i modelowanie w ochronie środowiska Strona 12009-04-24 11:40:00

Page 2: Doświadczenia 2-grupowedp.utp.edu.pl/wyklady/stat2008_2009/cw_mod4.pdf · Katedra Genetyki i Podstaw Hodowli Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy W MS

Katedra Genetyki i Podstaw Hodowli ZwierzątWydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

W MS EXCEL wykonujemy następujące obliczenia:Test F =TEST.F(E2:E88;E89:E115) 0.745031382 0.664266133

Przeprowadzona analiza statystyczna dowodzi, iż nie ma podstaw do odrzucenia H0

o równości wariancji w odniesieniu do wszystkich badanych cech. Przyjmujemy zatem, że zmienność w populacji kobiet i mężczyzn jest statystycznie podobna.

3. Weryfikujemy hipotezę zerową o równości wartości oczekiwanych populacji kobiet i mężczyzn:

H0: E(X1) = E(X2); H1: E(X1) ≠ E(X2)

W MS EXCEL wykonujemy następujące obliczenia:

Test T =TEST.T(E2:E88;E89:E115;2;2

) 0.0000000 0.0000483

4. Interpretacja wyników. Przeprowadzone badania pozwalają odrzucić H0 traktującą o równości wartości oczekiwanych w odniesieniu do wzrostu, długości stopy i indeksy stopy. Wnioskujemy zatem, że płeć wpływa statystycznie bardzo wysoko istotnie na wyżej wymienione wymiary. Pomiędzy wymiarami kobiet i mężczyzn występują różnice statystycznie bardzo wysoko istotne.

Jaka różnica?????

Prawdopodobieństwo Określenie istotności różnicp > 0,05 Statystycznie nieistotnap ≤ 0,05 Statystycznie istotnap ≤ 0,01 Statystycznie wysoko istotna p ≤ 0,001 Statystycznie bardzo wysoko istotna

Statystyka i modelowanie w ochronie środowiska Strona 22009-04-24 11:40:00

Page 3: Doświadczenia 2-grupowedp.utp.edu.pl/wyklady/stat2008_2009/cw_mod4.pdf · Katedra Genetyki i Podstaw Hodowli Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy W MS

Katedra Genetyki i Podstaw Hodowli ZwierzątWydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Moduł Analiza danych

Wynik należy odczytać dla P(T<=t) dwustronny

STATISTICA PL

Przykład 2. Sprawdź czy istnieją różnice statystycznie istotne między płciami pod względem długości i szerokości pokryw lewych i prawych (ChrzaszczMK.xls). Wykonaj wykres typu ramka i wąsy.

Statystyka i modelowanie w ochronie środowiska Strona 32009-04-24 11:40:00

Page 4: Doświadczenia 2-grupowedp.utp.edu.pl/wyklady/stat2008_2009/cw_mod4.pdf · Katedra Genetyki i Podstaw Hodowli Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy W MS

Katedra Genetyki i Podstaw Hodowli ZwierzątWydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Wyniki

W zakresie wszystkich badanych wymiarów pokryw istnieją podstawy do odrzucenia hipotezy zerowej, co oznacza że samce i samice różnią się statystycznie między sobą pod tym względem. Różnice między grupami płci należy uznać za statystycznie bardzo wysoko istotne.

Statystyka i modelowanie w ochronie środowiska Strona 42009-04-24 11:40:00

Page 5: Doświadczenia 2-grupowedp.utp.edu.pl/wyklady/stat2008_2009/cw_mod4.pdf · Katedra Genetyki i Podstaw Hodowli Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy W MS

Katedra Genetyki i Podstaw Hodowli ZwierzątWydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Wykres ramka-wąsy (otrzymujemy po kliknięciu na przycisk .Wykres ramka-wąsy: bP

Średnia Średnia±Błąd std Średnia±1.96*Błąd s td

m f

Plec

4.1

4.2

4.3

4.4

4.5

4.6

4.7

4.8

4.9

bP

Przykład 3. Sprawdź czy istnieją różnice statystyczne między wymiarami pokryw lewych i prawych u chrząszczy (ChrzaszczMK.xls).

Statystyka i modelowanie w ochronie środowiska Strona 52009-04-24 11:40:00

Page 6: Doświadczenia 2-grupowedp.utp.edu.pl/wyklady/stat2008_2009/cw_mod4.pdf · Katedra Genetyki i Podstaw Hodowli Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy W MS

Katedra Genetyki i Podstaw Hodowli ZwierzątWydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Przprowadzony test t-Studenta dla par wiązanych pozwala odrzucić hipotezę zerową zakładającą jednakową długość pokryw lewych i prawych. Oznacza to, że długość pokryw lewych i prawych jest statystycznie różna. Różnice można uznać za bardzo wysoko istotne. Nie ma natomiast podstaw do odrzucenia hipotezy zerowej zakładającej tę samą szerokość pokryw.

Statystyka i modelowanie w ochronie środowiska Strona 62009-04-24 11:40:00

Page 7: Doświadczenia 2-grupowedp.utp.edu.pl/wyklady/stat2008_2009/cw_mod4.pdf · Katedra Genetyki i Podstaw Hodowli Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy W MS

Katedra Genetyki i Podstaw Hodowli ZwierzątWydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Sytuacja, jaka pojawi się gdy będziemy chcieli zrobić odrębne analizy dla poszczególnych gatunków.

Statystyka i modelowanie w ochronie środowiska Strona 72009-04-24 11:40:00

Page 8: Doświadczenia 2-grupowedp.utp.edu.pl/wyklady/stat2008_2009/cw_mod4.pdf · Katedra Genetyki i Podstaw Hodowli Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy W MS

Katedra Genetyki i Podstaw Hodowli ZwierzątWydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Przykład 5. Wykonaj wykres skategoryzowany typu Ramka-wąsy.

Ramkowy bP grupowane względem Plec; kategorie względem GatunekLchrzaszczMK 16v*256c

Plec

bP

Średnia±Odch.std Min-Maks

GatunekL: Carabus granulatus

m f3.03.54.04.55.05.56.06.57.0

GatunekL: Carabus cancellatus

m f

GatunekL: Carabus hortensis

m f

GatunekL: Carabus auratus

m f3.03.54.04.55.05.56.06.57.0

GatunekL: Carabus violaceus

m f

Statystyka i modelowanie w ochronie środowiska Strona 82009-04-24 11:40:00

Page 9: Doświadczenia 2-grupowedp.utp.edu.pl/wyklady/stat2008_2009/cw_mod4.pdf · Katedra Genetyki i Podstaw Hodowli Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy W MS

Katedra Genetyki i Podstaw Hodowli ZwierzątWydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Przykład 6. Średnia masa kretów w badanej populacji próbnej wyniosła 78,9 g. Zweryfikuj hipotezę zerową, zakładającą, iż średnia masa kretów w populacji generalnej wynosi 80 g.

H0: µ = 80 g; H1: µ ≠ 80 g

Prawdopodobieństw związane z testem T (0,425) dowodzi, iż nie mamy podstaw do odrzucenia hipotezy zerowej, zakładającej, iż średnia masa kretów wynosi 80 g. Nie oznacza to jednak, że omawiana masa właśnie tyle wynosi! Nie udało nam się wykazać, iż masa ciała jest różna aniżeli 80 kg.

Zadania1. Sprawdź czy istnieją różnice statystycznie istotne między płciami pod względem długości

i szerokości pokryw. Analizy wykonaj dla każdego gatunku oddzielnie (ChrzaszczMK.xls).2. Sprawdź czy Lipniki i Kamionki różnią się statystycznie pod względem imisji SO2 i pyłu

(babulice100.xls).3. Sprawdź czy istnieją różnice statystycznie istotne między długością i szerokością pokryw

lewych i prawych (ChrzaszczMK.xls). Obliczenia wykonaj oddzielnie dla każdego gatunku, ale tylko dla samców!

4. Zweryfikuj istotność różnic między grubością rogówki przed założeniem szkieł kontaktowych i w drugim tygodniu ich noszenia. Obliczenia wykonaj oddzielnie dla pomiarów wykonanych w centrum i na obwodzie rogówki (oczy.xls).

5. Zweryfikuj hipotezę zerową zakładającą, że średnia masa jaja srok wynosi 27 g (jajaSROK.xls).

Statystyka i modelowanie w ochronie środowiska Strona 92009-04-24 11:40:00