Podstawy statystyki dla psychologów - zajęcia 11 - test t dla dwóch średnich

Post on 05-Dec-2014

2.922 views 1 download

description

 

Transcript of Podstawy statystyki dla psychologów - zajęcia 11 - test t dla dwóch średnich

Podstawy statystyki dla psychologów

Testowanie hipotez pomiędzy dwiema niezależnymi grupami

Zajęcia 11 Karol Wolski

Dwie grupy

• W psychologii często interesuje nas odpowiedź na pytanie czy średnie różnią się wtedy gdy mierzymy jakąś zmienną w dwóch różnych warunkach – Np. czy pacjenci poddani terapii różnią się od grupy z

placebo

• Próby niezależne – próby uzyskane w taki sposób, że wybór elementów do jednej z nich, w żaden sposób nie oddziałuje na wybór elementów do drugiej grupy

Przykład

• Testujemy sposób na poprawę rozumienia tekstu przez dzieci dyslektyczne – Zastosowanie neutralnego koloru powłoki daje

rezultat średnio 56,7% rozumienia tekstu – Przy niebieskim kolorze średnia ta wynosi 75%

• Interesuje nas czy w grupie niebieskiej średnia jest wyższa

• Musimy pamiętać, że z powodu losowego doboru do prób średnie te, nawet w przypadku braku różnicy nie będę identyczne, a czy ta różnica ma znaczenie?

Przykład

• Podobnie jak przy testowaniu hipotez i jednej średniej formułujemy hipotezy

• H0 : 𝜇𝑋 − 𝜇𝑌 = 0

– Nasze pytanie dotyczy więc różnić populacyjnych, z których pobrane zostały nasze dwie próby

– Hipoteza zerowa wskazuje nam na brak różnic pomiędzy dwiema warunkami w populacji

Przykład

• Hipoteza alternatywna

• HA : 𝜇𝑋 − 𝜇𝑌 ≠ 0

• Oczywiście możemy postawić również hipotezy kierunkowe: – HA : 𝜇𝑋 − 𝜇𝑌 > 0

– HA : 𝜇𝑋 − 𝜇𝑌 < 0

• Logika dalszych działań będzie podobne jak w przypadku testowania hipotez o jednej średniej, ale…

Losowy rozkład różnic między średnimi z próby

• W przypadku hipotez o jednej średniej mówiliśmy o losowym rozkładzie średniej z próby, teraz interesuje nas nie to jak rozkładają się średnie, ale jak rozkładają się ich różnice

• Losowy rozkład różnic między średnimi z próby opisuje wszystkie możliwe różnice między średnimi, które mogłyby się pojawić gdyby hipoteza zerowa była prawdziwa

Losowy rozkład różnic między średnimi z próby

• Losowy rozkład różnic między średnimi z próby – teoretyczny rozkład częstości względnych wartości 𝑋 − 𝑌 , które mogłyby się pojawić przez przypadek w nieskończonej liczbie prób o określonej liczebności wylosowanych z populacji X i Y

• Rozkład ten tworzony jest podobnie jak losowy rozkład średniej z próby, tyle, ze tutaj losujemy dwie próby z dwóch populacji i interesuje nas różnica średnich pomiędzy nimi

Losowy rozkład różnic między średnimi z próby

• Średnia losowego rozkładu różnic między średnimi jest równa 0:

𝜇𝑋 −𝑌 = 0 Wtedy gdy

𝜇𝑋 − 𝜇𝑌 = 0 Czyli kiedy hipoteza zerowa jest prawdziwa

• Idą dalej tym tropem średnia losowego rozkładu różnic między średnimi jest równa różnicy średnich z dwóch populacji (por. poprzednie zajęcia)

𝜇𝑋 −𝑌 = 𝜇𝑋 − 𝜇𝑌

Losowy rozkład różnic między średnimi z próby

• Oczywiście alternatywną interpretacją tego rozkładu jest potraktowanie go jako teoretycznego rozkładu wszystkich możliwych wartości różnić między średnimi jakie mogą pojawić się podczas losowania wszystkich możliwych prób.

Losowy rozkład różnic między średnimi z próby - przykład

Losowy rozkład różnic między średnimi z próby - przykład

Losowy rozkład różnic między średnimi z próby - przykład

Losowy rozkład różnic między średnimi z próby - przykład

Losowy rozkład różnic między średnimi z próby - przykład

• Jeżeli rozkłady średniej z próby dla populacji X i Y są w przybliżeniu normalne, to rozkład różnic pomiędzy parami losowo wybranych średnich również będzie zbliżony do normalnego

• A jak nie to i tak będzie -> centralne twierdzenie graniczne

Losowy rozkład różnic między średnimi z próby - właściwości

• Czym będzie SD takiego rozkładu?

• Będziemy je nazywać błędem standardowym różnicy między dwiema średnimi i oznaczać symbolem: 𝜎𝑋 −𝑌

𝜎𝑋 −𝑌 = 𝜎2 + 𝜎2

• W tym momencie wracamy do znanego nam problemu skąd mamy wziąć wartości wariancji populacyjnych? …. Tak, tak, musimy je oszacować…

X Y

Oszacowanie wartości 𝜎𝑋 −𝑌

• Oszacowanie błędu standardowego różnicy między dwiema średnimi

• 𝑠𝑋 −𝑌 = 𝑠2 + 𝑠2

• Albo (przy założeniu homogeniczności wariancji)

– 𝑠𝑋 −𝑌 =𝑆𝑆𝑋+𝑆𝑆𝑌

𝑛𝑋−1 + 𝑛𝑌−1(1

𝑛𝑋+

1

𝑛𝑌)

X Y

Statystyka t

• Wartość t przy testowaniu hipotezy pomiędzy dwiema średnimi

• 𝑡 =𝑋 −𝑌 −(𝜇𝑋−𝜇𝑌)ℎ𝑖𝑝

𝑠𝑋 −𝑌

• A gdzie jest df?

• 𝑑𝑓 = (𝑛𝑋−1) + (𝑛𝑌 − 1)

Założenia

• Każda próba jest wybrana losowo z populacji przez nie reprezentowanych

• Dwie próby losowe muszą zostać wybrane niezależnie

• Próby są losowane zgodnie ze schematem losowania zwrotnego (w psychologii przeważnie niespełnione)

• Rozkład wartości 𝑋 − 𝑌 zgodny z rozkładem normalnym

A na koniec… losowy dobór do próby a losowe przydzielanie do prób

• W większości sytuacji, w których grupy są utworzone poprzez przydzielanie losowe, zastosowanie modelu doboru losowego doprowadzi do tych samych wniosków statystycznych, które uzyskalibyśmy przy użyciu właściwego modelu

• Jednak uzyskane wnioski statystyczne nie mogą być uogólnione na populację i stosują się jedynie do badanych prób

• Pytanie na koniec: Wniosek statystyczny a wniosek badawczy? Czym się różnią?