Wykład 8 Zrandomizowany plan blokowy

Wykład 8Zrandomizowany plan blokowy

• Staramy się kontrolować efekty zróżnicowania badanych jednostek eksperymentalnych poprzez zapewnienie ich ``jednorodności’’ wewnątrz każdej grupy zabiegowej.

• Dzielimy obiekty na bloki:Blok to grupa podobnych obiektówPodobieństwo dotyczy wartości zmiennych

ubocznych (``zakłócających’’).Powinniśmy uwzględniać jedynie zmienne mogące

mieć wpływ na wynik eksperymentu.

Przykłady bloków:

• Owocówki z jednej linii wsobnej

• Pacjenci podobni pod względem wieku (płci, diagnozy i/lub historii choroby, itp.)

• Rośliny kukurydzy rosnące na tym samym stanowisku

Przyporządkowanie

• Obiekty dzielimy na jednorodne bloki, biorąc pod uwagę zmienne uboczne mogące mieć wpływ na wynik eksperymentu.

• Dokonujemy randomizacji w obrębie każdego z bloków (losowo przyporządkowujemy obiekty z bloku do poszczególnych zabiegów).

• W każdej grupie zabiegowej otrzymujemy tę samą liczbę obiektów z każdego bloku

• Tak więc rozkłady zmiennych ubocznych w grupach zabiegowych są podobne.

Przykład

Porównujemy efekt działania nowego lekarstwa z placebo:

• Obiekty – ochotniczki, u których w ciągu ostatniego roku stwierdzono raka piersi

• Niektóre miały lumpektomię, inne radykalną mastektomię (2)

• Niektóre były po naświetlaniach, inne nie (2)• U niektórych zidentyfikowano ryzyko genetyczne

BRCA1, BRCA2, u innych nie (3)

• Dzielimy pacjentki na 223=12 bloków, tzn.:

lumpektomia, naświetlania, BRCA1 lumpektomia, naświetlania, BRCA2, …. mastektomia, brak naświetlań, bez ryz.

gen.

• W każdym bloku losowo wybrana połowa kobiet otrzymuje lekarstwo, a druga--placebo

• Dlatego grupy kobiet biorących lekarstwo i placebo mają podobną strukturę

• Inne czynniki używane do blokowania:

Laboratorium lub osoba dokonująca pomiarówLaboratorium lub osoba wykonująca zabiegGeografiaGenetykaCzynniki socjo-ekonomiczne

• Blokujemy tylko względem tych czynników, które mogą mieć wpływ na odpowiedź.

Stratyfikacja

• Jest to „blokowanie” względem zmiennej ubocznej, której wartości można uporządkować (np. ilościowej).

• Dzielimy na tzw. warstwy (zamiast na bloki).• Przykłady:

– Niskie, średnie, wysokie dochody– Grupy wiekowe– Stopień rozwoju choroby

• Randomizujemy w obrębie każdej warstwy.• Czasami definiujemy warstwy przed próbkowaniem,

aby pobrać podobną liczbę obserwacji z każdej; próbkowanie warstwowe.

Powiązane pary

• Obserwacje występują w parach

• Przykłady:Układ blokowy dla dwu zabiegów, gdzie

każdy blok składa się z dwu obiektówDwa pomiary na tym samym obiekcie

(dwa kolejne dni, dwie strony, przed/po…)Obserwujemy dwie grupy w czasie

Przykłady cd.:

• Obiekty naturalnie występują w parach, takich jak pary identycznych blizniaków

• Obiekty łaczymy w pary o podobnym wieku, płci, zawodzie, stanie rozwoju choroby itd.

• Ten sam obiekt mierzony przy dwu okazjach

Test Studenta dla powiązanych par

• Do produkcji butów używamy dwóch różnych materiałów: A i B.

• Obserwacje: zużycie podeszew w butach noszonych przez 10 chłopców.– Każdy chłopiec ma podeszwę w jednym bucie

zrobioną z materiału A, a w drugim z materiału B

– Randomizujemy (A na lewy albo na prawy)

Chłopiec A B A-B

1 13.2 14.0 -0.8

2 8.2 8.8 -0.6

… … … ….

10 13.3 13.6 -0.3

średnia -0.41

s 0.38

Zużycie podeszew

boys

we

ar

2 4 6 8 10

81

01

21

4

81

01

21

4

A B

b -

a

2 4 6 8 10

-0.2

0.0

0.2

0.4

0.6

0.8

1.0

• Hipoteza– H0 : d = A - B=0– Ha : d ≠ 0

• Liczymy d= Y1- Y2, średnią(d), SD(d), SE(d)• liczymy ts = średnia(d)/SE(d) =• df = nd-1=• P-wartość=

• Tablica wartości krytycznych z książki ``Introduction to the Practice of Statistics’’,

D.S. Moore, G. P. McCabe

• Co się stanie, jeżeli wykonamy test Studenta dla prób

niezależnych ?• Ta sama hipoteza

=10.63, =11.04

• =1.11

• ts=(10.63-11.04)/1.11=-0.369

• P-wartość =

1Y 2Y

1 2Y YSE

Skąd taka rozbieżność?

• Bardzo różne SE– Test dla par : SE = 0.12– Test dla dwóch niezależnych prób: SE=1.11

• Duże zróżnicowanie między obiektami może ukryć wpływ zabiegu!

• To zróżnicowanie można zneutralizować łącząc obiekty w pary (neutralizujemy wpływ zmiennej ubocznej=ruchliwość dziecka).

Kiedy użyć testu dla par, a kiedy testu dla niezależnych prób ?

Na ogół łatwo stwierdzić, czy istnieją naturalne pary obiektów z jednej i drugiej grupy zabiegowej.

Kiedy zaplanować eksperyment w oparciu o powiązane pary ?

Trudniejsze: oczekujemy, że zmienne zakłócające mogą istotnie zwiększyć rozrzut wyników i staramy się utworzyć dwuelementowe bloki jednorodne ze względu na zmienne zakłócające.

Założenie

• Test Studenta dla par jest oparty na założeniu, że różnice mają w przybliżeniu rozkład normalny.

Test znaków

• Co zrobić jeżeli obserwacje nie mają rozkładu normalnego?

• Dla dwóch niezależnych prób liczyliśmy test Wilcoxona-Manna-Whitneya.

• Gdy występują sparowane obserwacje możemy zastosować prosty test znaków.

• Obliczamy znak różnicy między pierwszym i drugim elementem każdej pary obserwacji.

• Jeżeli zabiegi się nie różnią efektem, to p-stwo, że w dowolnej parze dostaniemy plus powinno być ½.

• Liczba plusów powinna być w przybliżeniu równa liczba minusów.

= p-stwo, że w dowolnej ustalonej parze pierwszy zabieg daje lepszy wynik niż drugi.

• H0: = .......

• HA: ........

• Dla każdej pary obserwacji zapisujemy (+) gdy y1–y2 jest dodatnie lub (–) gdy jest ujemne

• Zliczamy liczbę + (= N+) i – (= N–) (nie liczymy zer)

• Niech n = #par z niezerowymi wynikami.

• Statystyka testowa Bs = max(N+, N–)

dla testu dwustronnego

• Wartości krytyczne na kolejnym slajdzie.

(dla testu jedno i dwustronnego)

• Odrzucamy H0, gdy Bs wartości krytycznej

• Można też obliczyć p-wartości korzystając ze wzoru na rozkład dwumianowy z p=½.

CRITICAL VALUES FOR THE SIGN TEST, N = 5..44 |Alpha |1 Sided 0.05 0.025 0.01 0.005 0.0025 0.001 |2 Sided (0.10) (0.05) (0.02) (0.01) (0.005) (0.002) |------+-------------------------------------------------+---- N | ----| 5 | 5 . . . . . 6 | 6 6 . . . . 7 | 7 7 7 . . . 8 | 7 8 8 8 . . 9 | 8 8 9 9 9 . | | 10 | 9 9 10 10 10 10 11 | 9 10 10 11 11 11 12 | 10 10 11 11 12 12 13 | 10 11 12 12 12 13 14 | 11 12 12 13 13 13 | | 15 | 12 12 13 13 14 14 16 | 12 13 14 14 14 15 17 | 13 13 14 15 15 16 18 | 13 14 15 15 16 16 19 | 14 15 15 16 16 17 | | 20 | 15 15 16 17 17 18 21 | 15 16 17 17 18 18 22 | 16 17 17 18 18 19 23 | 16 17 18 19 19 20 24 | 17 18 19 19 20 20 This public domain table was made byWilliam Knight <http://www.math.unb.ca/~knight>

CRITICAL VALUES FOR THE SIGN TEST, N =25..44 |Alpha |1 Sided 0.05 0.025 0.01 0.005 0.0025 0.001 |2 Sided (0.10) (0.05) (0.02) (0.01) (0.005) (0.002) |

25 | 18 18 19 20 20 21 26 | 18 19 20 20 21 22 27 | 19 20 20 21 22 22 28 | 19 20 21 22 22 23 29 | 20 21 22 22 23 24 | | 30 | 20 21 22 23 24 24 31 | 21 22 23 24 24 25 32 | 22 23 24 24 25 26 33 | 22 23 24 25 25 26 34 | 23 24 25 25 26 27 | | 35 | 23 24 25 26 27 27 36 | 24 25 26 27 27 28 37 | 24 25 27 27 28 29 38 | 25 26 27 28 29 29 39 | 26 27 28 28 29 30 | | 40 | 26 27 28 29 30 31 41 | 27 28 29 30 30 31 42 | 27 28 29 30 31 32 43 | 28 29 30 31 32 32 44 | 28 29 31 31 32 33

• Dla testu jednostronnego

• albo HA jest < 0.5 (w dowolnej parze druga obserwacja ma większą szansę być większa) (Bs = N–),

• albo HA jest > 0.5 (w dowolnej parze pierwsza obserwacja ma większą szansę być większa) (Bs = N+)

P-wartość

• Niech Y ma rozkład dwumianowy (n, 0.5)

• Gdy HA jest > 0.5, wtedy Bs = N+, i P-wartość wynosi Pr(Y Bs )

• Gdy HA jest < 0.5, wtedy Bs = N–, i P-wartość wynosi Pr(Y Bs )

• Gdy HA jest 0.5, wtedy Bs = max(N+, N–), i P-wartość wynosi 2Pr(Y Bs )

Przykład: przeszczepy skóry

• Po dwóch stronach ciała 11 ochotników zastosowano przeszczepy skóry.

• Jeden przeszczep ma dobre dopasowanie HLA z odbiorca, drugi nie.

• Obserwujemy czas do odrzucenia przeszczepu (nie ma on rozkładu normalnego, więc nie można stosować testu Studenta).

• Czy dobre dopasowanie HLA zwiększa czas przetrwania przeszczepu ?

dobre 37 19 57 93 16 23 20 63 29 60 18

złe 29 13 15 26 11 18 26 43 18 42 19

znak + + + + + + - + + + -

• Testu znaków używamy, gdydane nie mają rozkładu normalnego, lubdane zapisane są w postaci preferencji,

a nie wielkości liczbowej, np. lepsze/gorsze, mniejsze/większe itp.

Test znakowany Wilcoxona

• Podobny do testu znaków, ale bardziej czuły• Metoda

– Liczymy różnice w parach– Znajdujemy wartość bezwzględną– Przyporządkowujemy rangi wartościom

bezwzględnym (1 dla najmniejszej, n dla największej)

– Każdej randze przyporządkowujemy jej znak (+,-)

• W+ : suma rang dodatnich

• W- : suma rang ujemnych

• Ws : min(W+, W-)

• Odrzucamy H0 gdy Ws ≤ wartość krytyczna

Tabela wartości krytycznych jest dostępna w kartotece z wykładami. Źródło: http://fsweb.berry.edu/academic/education/vbissonnette/tables/wilcox_t.pdf

Obs Y1 Y2 d |d| Ranga Ranga

Znakowana

1 33 25 8 8 6 6

2 39 38 1 1 1 1

3 25 27 -2 2 2 -2

4 29 20 9 9 7 7

5 50 54 -4 4 3 -3

6 45 40 5 5 4 4

7 36 30 6 6 5 5

Przed & Po vs. Grupa kontrolna

• Czasami obserwujemy obiekty przed i po pewnym zabiegu i mierzymy wpływ zabiegu na poszczególne obiekty

Dostajemy pary zależnych obserwacji• Czasem parujemy podobne (ze względu

na zmienne zakłócające) obiekty z grupy zabiegowej i kontrolnej

Również dostajemy pary zależnych obserwacji

• Czasami obiektów w grupie kontrolnej i zabiegowej nie można w naturalny sposób połączyć w pary

Takie obserwacje traktujemy jako dwie niezależne próby

• Niekiedy oczekujemy, że obiekty w naturalny sposób się zmieniają w trakcie eksperymentu.

Chcemy odróżnić zmiany wywołane zabiegiem od zmian wynikających z upływu czasu

Obserwujemy grupę zabiegową i kontrolną przed i po zabiegu

Obiekty w grupie kontrolnej dostarczają nam informacji, jakiej zmiany należy oczekiwać jedynie w wyniku upływu czasu. Obiekty w grupie zabiegowej dostarczają nam informacji o wpływie zabiegu

Cztery grupy obserwacji

Możemy porównać obiekty z grupy zabiegowej przed i po zabiegu za pomocą testu dla par. Podobnie obiekty z grupy kontrolnej możemy porównać przed i po zabiegu za pomocą testu dla par.

Dowiemy się czy była zmienność w każdej z grup.

Naprawdę interesuje nas jednak porównanie zmian wartości cechy (między grupą zabiegową i kontrolną)

Zwykle w takim przypadku analizujemy różnice po-przed za pomocą testu dla dwu niezależnych prób (zabiegowej i kontrolnej)

Wykład 8 Zrandomizowany plan blokowy

Documents

Transcript of Wykład 8 Zrandomizowany plan blokowy