Wykład 8 Zrandomizowany plan blokowy
description
Transcript of Wykład 8 Zrandomizowany plan blokowy
Wykład 8Zrandomizowany plan blokowy
• Staramy się kontrolować efekty zróżnicowania badanych jednostek eksperymentalnych poprzez zapewnienie ich ``jednorodności’’ wewnątrz każdej grupy zabiegowej.
• Dzielimy obiekty na bloki:Blok to grupa podobnych obiektówPodobieństwo dotyczy wartości zmiennych
ubocznych (``zakłócających’’).Powinniśmy uwzględniać jedynie zmienne mogące
mieć wpływ na wynik eksperymentu.
Przykłady bloków:
• Owocówki z jednej linii wsobnej
• Pacjenci podobni pod względem wieku (płci, diagnozy i/lub historii choroby, itp.)
• Rośliny kukurydzy rosnące na tym samym stanowisku
Przyporządkowanie
• Obiekty dzielimy na jednorodne bloki, biorąc pod uwagę zmienne uboczne mogące mieć wpływ na wynik eksperymentu.
• Dokonujemy randomizacji w obrębie każdego z bloków (losowo przyporządkowujemy obiekty z bloku do poszczególnych zabiegów).
• W każdej grupie zabiegowej otrzymujemy tę samą liczbę obiektów z każdego bloku
• Tak więc rozkłady zmiennych ubocznych w grupach zabiegowych są podobne.
Przykład
Porównujemy efekt działania nowego lekarstwa z placebo:
• Obiekty – ochotniczki, u których w ciągu ostatniego roku stwierdzono raka piersi
• Niektóre miały lumpektomię, inne radykalną mastektomię (2)
• Niektóre były po naświetlaniach, inne nie (2)• U niektórych zidentyfikowano ryzyko genetyczne
BRCA1, BRCA2, u innych nie (3)
• Dzielimy pacjentki na 223=12 bloków, tzn.:
lumpektomia, naświetlania, BRCA1 lumpektomia, naświetlania, BRCA2, …. mastektomia, brak naświetlań, bez ryz.
gen.
• W każdym bloku losowo wybrana połowa kobiet otrzymuje lekarstwo, a druga--placebo
• Dlatego grupy kobiet biorących lekarstwo i placebo mają podobną strukturę
• Inne czynniki używane do blokowania:
Laboratorium lub osoba dokonująca pomiarówLaboratorium lub osoba wykonująca zabiegGeografiaGenetykaCzynniki socjo-ekonomiczne
• Blokujemy tylko względem tych czynników, które mogą mieć wpływ na odpowiedź.
Stratyfikacja
• Jest to „blokowanie” względem zmiennej ubocznej, której wartości można uporządkować (np. ilościowej).
• Dzielimy na tzw. warstwy (zamiast na bloki).• Przykłady:
– Niskie, średnie, wysokie dochody– Grupy wiekowe– Stopień rozwoju choroby
• Randomizujemy w obrębie każdej warstwy.• Czasami definiujemy warstwy przed próbkowaniem,
aby pobrać podobną liczbę obserwacji z każdej; próbkowanie warstwowe.
Powiązane pary
• Obserwacje występują w parach
• Przykłady:Układ blokowy dla dwu zabiegów, gdzie
każdy blok składa się z dwu obiektówDwa pomiary na tym samym obiekcie
(dwa kolejne dni, dwie strony, przed/po…)Obserwujemy dwie grupy w czasie
Przykłady cd.:
• Obiekty naturalnie występują w parach, takich jak pary identycznych blizniaków
• Obiekty łaczymy w pary o podobnym wieku, płci, zawodzie, stanie rozwoju choroby itd.
• Ten sam obiekt mierzony przy dwu okazjach
Test Studenta dla powiązanych par
• Do produkcji butów używamy dwóch różnych materiałów: A i B.
• Obserwacje: zużycie podeszew w butach noszonych przez 10 chłopców.– Każdy chłopiec ma podeszwę w jednym bucie
zrobioną z materiału A, a w drugim z materiału B
– Randomizujemy (A na lewy albo na prawy)
Chłopiec A B A-B
1 13.2 14.0 -0.8
2 8.2 8.8 -0.6
… … … ….
10 13.3 13.6 -0.3
średnia -0.41
s 0.38
Zużycie podeszew
boys
we
ar
2 4 6 8 10
81
01
21
4
81
01
21
4
A B
b -
a
2 4 6 8 10
-0.2
0.0
0.2
0.4
0.6
0.8
1.0
• Hipoteza– H0 : d = A - B=0– Ha : d ≠ 0
• Liczymy d= Y1- Y2, średnią(d), SD(d), SE(d)• liczymy ts = średnia(d)/SE(d) =• df = nd-1=• P-wartość=
• Tablica wartości krytycznych z książki ``Introduction to the Practice of Statistics’’,
D.S. Moore, G. P. McCabe
• Co się stanie, jeżeli wykonamy test Studenta dla prób
niezależnych ?• Ta sama hipoteza
=10.63, =11.04
• =1.11
• ts=(10.63-11.04)/1.11=-0.369
• P-wartość =
1Y 2Y
1 2Y YSE
Skąd taka rozbieżność?
• Bardzo różne SE– Test dla par : SE = 0.12– Test dla dwóch niezależnych prób: SE=1.11
• Duże zróżnicowanie między obiektami może ukryć wpływ zabiegu!
• To zróżnicowanie można zneutralizować łącząc obiekty w pary (neutralizujemy wpływ zmiennej ubocznej=ruchliwość dziecka).
Kiedy użyć testu dla par, a kiedy testu dla niezależnych prób ?
Na ogół łatwo stwierdzić, czy istnieją naturalne pary obiektów z jednej i drugiej grupy zabiegowej.
Kiedy zaplanować eksperyment w oparciu o powiązane pary ?
Trudniejsze: oczekujemy, że zmienne zakłócające mogą istotnie zwiększyć rozrzut wyników i staramy się utworzyć dwuelementowe bloki jednorodne ze względu na zmienne zakłócające.
Założenie
• Test Studenta dla par jest oparty na założeniu, że różnice mają w przybliżeniu rozkład normalny.
Test znaków
• Co zrobić jeżeli obserwacje nie mają rozkładu normalnego?
• Dla dwóch niezależnych prób liczyliśmy test Wilcoxona-Manna-Whitneya.
• Gdy występują sparowane obserwacje możemy zastosować prosty test znaków.
• Obliczamy znak różnicy między pierwszym i drugim elementem każdej pary obserwacji.
• Jeżeli zabiegi się nie różnią efektem, to p-stwo, że w dowolnej parze dostaniemy plus powinno być ½.
• Liczba plusów powinna być w przybliżeniu równa liczba minusów.
= p-stwo, że w dowolnej ustalonej parze pierwszy zabieg daje lepszy wynik niż drugi.
• H0: = .......
• HA: ........
• Dla każdej pary obserwacji zapisujemy (+) gdy y1–y2 jest dodatnie lub (–) gdy jest ujemne
• Zliczamy liczbę + (= N+) i – (= N–) (nie liczymy zer)
• Niech n = #par z niezerowymi wynikami.
• Statystyka testowa Bs = max(N+, N–)
dla testu dwustronnego
• Wartości krytyczne na kolejnym slajdzie.
(dla testu jedno i dwustronnego)
• Odrzucamy H0, gdy Bs wartości krytycznej
• Można też obliczyć p-wartości korzystając ze wzoru na rozkład dwumianowy z p=½.
CRITICAL VALUES FOR THE SIGN TEST, N = 5..44 |Alpha |1 Sided 0.05 0.025 0.01 0.005 0.0025 0.001 |2 Sided (0.10) (0.05) (0.02) (0.01) (0.005) (0.002) |------+-------------------------------------------------+---- N | ----| 5 | 5 . . . . . 6 | 6 6 . . . . 7 | 7 7 7 . . . 8 | 7 8 8 8 . . 9 | 8 8 9 9 9 . | | 10 | 9 9 10 10 10 10 11 | 9 10 10 11 11 11 12 | 10 10 11 11 12 12 13 | 10 11 12 12 12 13 14 | 11 12 12 13 13 13 | | 15 | 12 12 13 13 14 14 16 | 12 13 14 14 14 15 17 | 13 13 14 15 15 16 18 | 13 14 15 15 16 16 19 | 14 15 15 16 16 17 | | 20 | 15 15 16 17 17 18 21 | 15 16 17 17 18 18 22 | 16 17 17 18 18 19 23 | 16 17 18 19 19 20 24 | 17 18 19 19 20 20 This public domain table was made byWilliam Knight <http://www.math.unb.ca/~knight>
CRITICAL VALUES FOR THE SIGN TEST, N =25..44 |Alpha |1 Sided 0.05 0.025 0.01 0.005 0.0025 0.001 |2 Sided (0.10) (0.05) (0.02) (0.01) (0.005) (0.002) |
25 | 18 18 19 20 20 21 26 | 18 19 20 20 21 22 27 | 19 20 20 21 22 22 28 | 19 20 21 22 22 23 29 | 20 21 22 22 23 24 | | 30 | 20 21 22 23 24 24 31 | 21 22 23 24 24 25 32 | 22 23 24 24 25 26 33 | 22 23 24 25 25 26 34 | 23 24 25 25 26 27 | | 35 | 23 24 25 26 27 27 36 | 24 25 26 27 27 28 37 | 24 25 27 27 28 29 38 | 25 26 27 28 29 29 39 | 26 27 28 28 29 30 | | 40 | 26 27 28 29 30 31 41 | 27 28 29 30 30 31 42 | 27 28 29 30 31 32 43 | 28 29 30 31 32 32 44 | 28 29 31 31 32 33
• Dla testu jednostronnego
• albo HA jest < 0.5 (w dowolnej parze druga obserwacja ma większą szansę być większa) (Bs = N–),
• albo HA jest > 0.5 (w dowolnej parze pierwsza obserwacja ma większą szansę być większa) (Bs = N+)
P-wartość
• Niech Y ma rozkład dwumianowy (n, 0.5)
• Gdy HA jest > 0.5, wtedy Bs = N+, i P-wartość wynosi Pr(Y Bs )
• Gdy HA jest < 0.5, wtedy Bs = N–, i P-wartość wynosi Pr(Y Bs )
• Gdy HA jest 0.5, wtedy Bs = max(N+, N–), i P-wartość wynosi 2Pr(Y Bs )
Przykład: przeszczepy skóry
• Po dwóch stronach ciała 11 ochotników zastosowano przeszczepy skóry.
• Jeden przeszczep ma dobre dopasowanie HLA z odbiorca, drugi nie.
• Obserwujemy czas do odrzucenia przeszczepu (nie ma on rozkładu normalnego, więc nie można stosować testu Studenta).
• Czy dobre dopasowanie HLA zwiększa czas przetrwania przeszczepu ?
dobre 37 19 57 93 16 23 20 63 29 60 18
złe 29 13 15 26 11 18 26 43 18 42 19
znak + + + + + + - + + + -
• Testu znaków używamy, gdydane nie mają rozkładu normalnego, lubdane zapisane są w postaci preferencji,
a nie wielkości liczbowej, np. lepsze/gorsze, mniejsze/większe itp.
Test znakowany Wilcoxona
• Podobny do testu znaków, ale bardziej czuły• Metoda
– Liczymy różnice w parach– Znajdujemy wartość bezwzględną– Przyporządkowujemy rangi wartościom
bezwzględnym (1 dla najmniejszej, n dla największej)
– Każdej randze przyporządkowujemy jej znak (+,-)
• W+ : suma rang dodatnich
• W- : suma rang ujemnych
• Ws : min(W+, W-)
• Odrzucamy H0 gdy Ws ≤ wartość krytyczna
Tabela wartości krytycznych jest dostępna w kartotece z wykładami. Źródło: http://fsweb.berry.edu/academic/education/vbissonnette/tables/wilcox_t.pdf
Obs Y1 Y2 d |d| Ranga Ranga
Znakowana
1 33 25 8 8 6 6
2 39 38 1 1 1 1
3 25 27 -2 2 2 -2
4 29 20 9 9 7 7
5 50 54 -4 4 3 -3
6 45 40 5 5 4 4
7 36 30 6 6 5 5
Przed & Po vs. Grupa kontrolna
• Czasami obserwujemy obiekty przed i po pewnym zabiegu i mierzymy wpływ zabiegu na poszczególne obiekty
Dostajemy pary zależnych obserwacji• Czasem parujemy podobne (ze względu
na zmienne zakłócające) obiekty z grupy zabiegowej i kontrolnej
Również dostajemy pary zależnych obserwacji
• Czasami obiektów w grupie kontrolnej i zabiegowej nie można w naturalny sposób połączyć w pary
Takie obserwacje traktujemy jako dwie niezależne próby
• Niekiedy oczekujemy, że obiekty w naturalny sposób się zmieniają w trakcie eksperymentu.
Chcemy odróżnić zmiany wywołane zabiegiem od zmian wynikających z upływu czasu
Obserwujemy grupę zabiegową i kontrolną przed i po zabiegu
Obiekty w grupie kontrolnej dostarczają nam informacji, jakiej zmiany należy oczekiwać jedynie w wyniku upływu czasu. Obiekty w grupie zabiegowej dostarczają nam informacji o wpływie zabiegu
Cztery grupy obserwacji
Możemy porównać obiekty z grupy zabiegowej przed i po zabiegu za pomocą testu dla par. Podobnie obiekty z grupy kontrolnej możemy porównać przed i po zabiegu za pomocą testu dla par.
Dowiemy się czy była zmienność w każdej z grup.
Naprawdę interesuje nas jednak porównanie zmian wartości cechy (między grupą zabiegową i kontrolną)
Zwykle w takim przypadku analizujemy różnice po-przed za pomocą testu dla dwu niezależnych prób (zabiegowej i kontrolnej)