Project SAS

24

Click here to load reader

description

SAS

Transcript of Project SAS

Page 1: Project SAS

Szkoła Główna Handlowa w WarszawieStudium Magisterskie

Jadwiga BoruckaNr albumu 34210

ANALIZA WARIANCJI

PROJEKT nr 3Przedmiot: Statystyka od podstaw z wykorzystaniem narzędzi SAS

Warszawa, 2006

1

Page 2: Project SAS

Spis treści

Wstęp .................................................................................................3

I. Jednoczynnikowa analiza wariancji ..............................................................4

II. Dwuczynnikowa analiza wariancji ...............................................................7

III. Test Tukey'a ................................................ ...............................................12

IV. Omówienie procedur ...................................................................................16

2

Page 3: Project SAS

Wstęp

Niniejsza praca poświęcona jest analizie wariancji. Dane pochodzą ze zbioru danych dotyczących gospodarstw domowych gosp2004. W pierwszej części przeprowadzono jednoczynnikową analizę wariancji badającą, czy płeć (zmienna objaśniająca X) wywiera wpływ na wysokość wydatków ogółem (zmienna objaśniana Y). Część druga pracy to analiza dwuczynnikowa. Badano wpływ zarówno płci, liczby dzieci do lat 17 w gospodarstwie domowym oraz interakcji tych dwóch czynników na wysokość wydatków. Praca zawiera również opis jednego z testów umożliwiających porównania wielokrotne (wybrano test Tukey'a). Przy weryfikacji hipotez statystycznych, o ile nie zaznaczono inaczej, przyjmowano poziom istotności równy 0,05. W ostatnim rozdziale omówiono krótko wykorzystane procedury SAS.

3

Page 4: Project SAS

I. ANALIZA JEDNOCZYNNIKOWA

Analizie poddano zmienną wydatki ogółem jako zmienną objaśnianą. Jako zmienną objaśniającą przyjęto płeć, przy czym wartość tej zmiennej wynosiła 1 dla mężczyzn i 2 dla kobiet. Otrzymano następujące wyniki:

Source DFSum of Squares

Mean Square F Value Pr > F

Model 1 28207734 28207734 12.27 0.0005

Error 968 2225736128 2299314    

Corrected Total 969 2253943862      

 

R-SquareCoeff

VarRoot MSE WYDG Mean

0.012515 72.91129 1516.349 2079.718

 

Source DF Anova SS Mean Square F Value Pr > F

D47 1 28207733.89 28207733.89 12.27 0.0005

Tabela 1. Wyniki analizy jednoczynnikowej(Źródło: SAS Enterprise Guide Learning Edition, v. 1.3.0.161)

Z otrzymanych wyników wnioskujemy, iż należy odrzucić hipotezę zerową mówiącą o równości średnich w badanych podgrupach, tj. o braku wpływu płci na wysokość wydatków ogółem (obliczona wartość prawdopodobieństwa jest niższa od przyjętego poziomu istotności 0,05). Współczynnik determinacji wynosi 1,25%, w związku z czym niewielka część zmienności wydatków wyjaśniana jest przez zmienną objaśniającą płeć, zapewne należy wziąć pod uwagę jeszcze inne czynniki determinujące wysokość wydatków.

4

Page 5: Project SAS

Weryfikując założenia modelu obliczono statystyki testujące równość wariancji w badanych podgrupach. Oto otrzymane wyniki:

Levene's Test for Homogeneity of WYDG VarianceANOVA of Squared Deviations from Group Means

Source DFSum of Squares

Mean Square F Value Pr > F

D47 1 5.293E13 5.293E13 0.52 0.4689

Error 968 9.761E16 1.008E14    

Tabela 2. Wyniki testu Levena dla równości wariancji  (Źródło: SAS Enterprise Guide Learning Edition, v. 1.3.0.161)

Brown and Forsythe's Test for Homogeneity of WYDG VarianceANOVA of Absolute Deviations from Group Medians

Source DFSum of Squares

Mean Square F Value Pr > F

D47 1 2294056 2294056 1.48 0.2237

Error 968 1.498E9 1547530    

Tabela 3. Wyniki testu Browna i Forsythe'a dla równości wariancji(Źródło: SAS Enterprise Guide Learning Edition, v. 1.3.0.161)

Bartlett's Test for Homogeneityof WYDG Variance

Source DF Chi-Square Pr > ChiSq

D47 1 5.1226 0.0536

Tabela 4. Wyniki testu Bartletta dla równości wariancji(Źródło: SAS Enterprise Guide Learning Edition, v. 1.3.0.161)

Z wszystkich spośród trzech przeprowadzonych testów wynika jasno, iż nie ma podstaw do odrzucenia hipotezy zerowej mówiącej o równości wariancji wydatków ogółem w badanych podgrupach wyodrębnionych na podstawie płci. Żaden z testów nie odrzuca tej hipotezy, w związku z czym nie ma potrzeby stosowania poprawki Welcha i nie ma przeszkód w stosowaniu analizy wariancji dla badania wpływu wybranego czynnika na poziom wydatków w grupie kobiet i w grupie mężczyzn. (Uwaga: Stosując analizę wariancji dla porównania średnich w dwóch podgrupach otrzymujemy wyniki identyczne jak w przypadku weryfikacji hipotezy o równości średnich za pomocą testu t Studenta. Jednak ponieważ tematem niniejszej pracy jest analiza wariancji zastosowano tę właśnie metodę, mimo, iż nie było to w tym wypadku bezwzględnie konieczne).

5

Page 6: Project SAS

Poniżej zamieszczono graficzną ilustrację problemu:

Rysunek 1. Wykresy „pudełka z wąsami” wydatków ogółem wśród mężczyzn i kobiet(Źródło: SAS Enterprise Guide Learning Edition, v. 1.3.0.161)

Rysunek 2. Wykres średnich dla wydatków ogółem wśród kobiet i mężczyzn(Źródło: SAS Enterprise Guide Learning Edition, v. 1.3.0.161)

6

Page 7: Project SAS

II. ANALIZA DWUCZYNNIKOWA

Jako zmienną objaśnianą nadal przyjmowano wysokość wydatków ogółem. Tym razem jednak zmiennymi objaśniającymi były: płeć, jak w rozdziale pierwszym oraz – dodatkowo – liczbę dzieci powyżej 17 roku życia. Otrzymano następujące wyniki:

Source DFSum of Squares

Mean Square F Value Pr > F

Model 13 82591618 6353201 2.80 0.0006

Error 956 2171352244 2271289    

Corrected Total 969 2253943862      

 

R-SquareCoeff

VarRoot MSE WYDG Mean

0.036643 72.46558 1507.080 2079.718

 

Source DF Type III SS Mean Square F Value Pr > F

D47 1 2947504.10 2947504.10 1.30 0.2549

LD17 7 48898484.32 6985497.76 3.08 0.0033

D47*LD17 5 3711286.37 742257.27 0.33 0.8970

 Tabela 5. Wyniki analizy dwuczynnikowej(Źródło: SAS Enterprise Guide Learning Edition, v. 1.3.0.161)

Z otrzymanych wartości statystyk testujących wpływ poszczególnych czynników oraz ich interakcji na wysokość wydatków ogółem można wyciągnąć następujące wnioski: na podstawie analizy wariancji odrzucamy hipotezę zerową o równości średnich w badanych podgrupach. Ponadto odrzucić należy również hipotezę zerową zakładającą brak wpływu zmiennej liczba dzieci do 17 roku życia. Co ciekawe, tym razem statystycznie nieistotny okazał się wpływ zmiennej płeć na wysokość wydatków. Nie ma również podstaw do odrzucenia hipotezy zerowej o braku wpływu interakcji dwóch wymienionych czynników, tzn. łączny wpływ płci i liczby dzieci do lat 17 w badanym gospodarstwie. Otrzymany model wyjaśnia jedynie 3% zmienności zmiennej zależnej, o czym informuje nas współczynnik determinacji.

Poniżej przedstawiono ilustrację graficzną problemu:

7

Page 8: Project SAS

Rysunek 3. Zależność wydatków ogółem od liczby dzieci do lat 17(Źródło: SAS Enterprise Guide Learning Edition, v. 1.3.0.161)

Rysunek 4. Zależność wydatków ogółem od płci(Źródło: SAS Enterprise Guide Learning Edition, v. 1.3.0.161)

8

Page 9: Project SAS

Rysunek 5. Wykres średnich wydatków ogółem w zależności od płci i liczby dzieci do lat 17(Źródło: SAS Enterprise Guide Learning Edition, v. 1.3.0.161)(Uwaga: Dla każdej z 7 wyodrębnionych pod względem liczby dzieci do lat 17 grup narysowano wykres średnich w zależności od płci).

Weryfikując założenia modelu postawiono hipotezy zerowe o równości wariancji wydatków w wyodrębnionych podgrupach. Równość wariancji wydatków wśród kobiet i mężczyzn została zbadana w rozdziale I, pozostaje sprawdzić, czy wariancje badanej zmiennej istotnie się różnią w poszczególnych grupach wyodrębnionych na podstawie liczby dzieci do lat 17 w gospodarstwie domowym. Oto otrzymane wyniki:

Levene's Test for Homogeneity of WYDG VarianceANOVA of Squared Deviations from Group Means

Source DFSum of Squares

Mean Square F Value Pr > F

LD17 5 2.133E14 4.265E13 0.43 0.8304

Error 961 9.609E16 9.999E13  

Tabela 6. Wyniki testu Levena dla równości wariancji (Źródło: SAS Enterprise Guide Learning Edition, v. 1.3.0.161)

9

Page 10: Project SAS

Brown and Forsythe's Test for Homogeneity of WYDG VarianceANOVA of Absolute Deviations from Group Medians

Source DFSum of Squares

Mean Square F Value Pr > F

LD17 5 10762534 2152507 1.43 0.2109

Error 961 1.4466E9 1505353

Tabela 7. Wyniki testu Browna i Forsythe'a dla równości wariancji (Źródło: SAS Enterprise Guide Learning Edition, v. 1.3.0.161)

Bartlett's Test for Homogeneityof WYDG Variance

Source DF Chi-Square Pr > ChiSq

LD17 6 27.2338 0.0001

Tabela 8. Wyniki testu Bartletta dla równości wariancji (Źródło: SAS Enterprise Guide Learning Edition, v. 1.3.0.161)

Z otrzymanych wyników widać, że dwa z trzech przeprowadzonych testów nie dają podstaw do odrzucenia hipotezy zerowej zakładającej równość wariancji w badanych podgrupach. Natomiast inny wynik daje test Bartletta. W związku z tym zastosowano poprawkę Welcha, której efekty zawiera poniższa tabela:

Welch's ANOVA for WYDG

Source DF F Value Pr > F

LD17 6.0000 3.73 0.0156

Error 16.5868    

Tabela 9. Poprawka Welcha(Źródło: SAS Enterprise Guide Learning Edition, v. 1.3.0.161)

Jak widać, poprawka Welcha również prowadzi do odrzucenia hipotezy zerowej o równości wariancji w wyodrębnionych podgrupach. Należy jednak zauważyć, że już przy przyjęciu poziomu istotności równego 0,01 poprawka Welcha zostałaby przyjęta. Ponadto, test Bartletta zakłada normalność rozkładu analizowanej zmiennej, które to założenie nie jest spełnione w przypadku zmiennej wydatki ogółem (patrz tabela 10), a którego założenia nie ma w teście Levena. W związku z powyższym można zaufać bardziej testom Levena oraz Browna i Forsythe'a i badać wpływ wybranego czynnika na wielkość wydatków za pomocą analizy wariancji.

10

Page 11: Project SAS

Parameters for Normal Distribution

Parameter Symbol Estimate

Mean Mu 2079.718

Std Dev Sigma 1525.14

 

Goodness-of-Fit Tests for Normal Distribution

Test Statistic p Value

Kolmogorov-Smirnov D 0.1495654 Pr > D <0.010

Cramer-von Mises W-Sq 8.5109396 Pr > W-Sq <0.005

Anderson-Darling A-Sq 48.5248954 Pr > A-Sq <0.005

Tabela 10. Badanie zgodności rozkładu wydatków z rozkładem normalnym(Źródło: SAS Enterprise Guide Learning Edition, v. 1.3.0.161)

III. TEST TUKEY'A

11

Page 12: Project SAS

W przypadku, gdy nie odrzucamy hipotezy zerowej w analizie wariancji i stwierdzamy, że średnie w badanych grupach istotnie się od siebie nie różnią, analiza kończy się w tym miejscu. Kiedy jednak hipotezę zerową odrzucamy, co wskazuje na istnienie wpływu analizowanego czynnika na zmienną objaśnianą należy odpowiedzieć jeszcze na pytanie, które z porównywanych populacji są odpowiedzialne za odrzucenie owej hipotezy. temu służą tzw. Testy post-hoc czyli testy wielokrotnych porównań. Jednym z nich jest tzw. test Tukey'a, któremu poświęcony jest niniejszy rozdział pracy.

Omawiany test występuje w dwóch wariantach: dla równej lub różnej liczebności podgrup. Za jego pomocą porównujemy pary średnich. Test polega na sprawdzeniu, czy prawdziwa jest następująca nierówność:

, gdzie:

- K to odpowiednia wartość związana ze statystyką wykorzystywaną w tym teście,- ni, nj to odpowiednie liczebności i-tej i j-tej grupy,- ŚK reszt jest średnim kwadratem błędu występującego w analizie wariancji,- Xi oraz Xj to porównywane średnie i-tej i j-tej grupy.

Nierówność ta umożliwia utworzenie przedziału ufności dla

różnicy . Jeżeli tak skonstruowany przedział obejmuje wartość 0, to średnie nie różnią się istotnie.

Przeprowadzono analizę wariancji jednoczynnikową badającą wpływ liczby dzieci do lat 17 na wydatki ogółem gospodarstwa domowego. Wyniki zawarte są w poniższej tabeli:

Source DFSum of Squares

Mean Square F Value Pr > F

Model 7 59060615 8437231 3.70 0.0006

Error 962 2194883247 2281583    

Corrected Total 969 2253943862      

 

R-SquareCoeff

VarRoot MSE WYDG Mean

0.026203 72.62962 1510.491 2079.718

 

Source DF Anova SS Mean Square F Value Pr > F

LD17 7 59060615.13 8437230.73 3.70 0.0006

Tabela 11. Analiza jednoczynnikowa dla wpływu liczby dzieci do lat 17 na wydatki ogółem(Źródło: SAS Enterprise Guide Learning Edition, v. 1.3.0.161)

Ponieważ brak podstaw do odrzucenia hipotezy zerowej, wnioskujemy o istnieniu co najmniej jednej pary średnich istotnie różniących się od siebie pomiędzy wyróżnionymi grupami.

12

Page 13: Project SAS

W związku z powyższym przeprowadzono test Tukey'a w celu sprawdzenia która para średnich odpowiada za odrzucenie hipotezy zerowej. Otrzymane wyniki przedstawia tabela:

Alpha 0.05

Error Degrees of Freedom 962

Error Mean Square 2281583

Critical Value of Studentized Range

4.29581

 

Comparisons significant at the 0.05 level are indicatedby ***.

LD17Comparison

DifferenceBetween

Means

Simultaneous 95% Confidence

Limits 

6 - 1 2851.31 -1748.30 7450.91  

6 - 5 3087.75 -1748.70 7924.20  

6 - 2 3088.99 -1515.07 7693.04  

6 - 0 3377.02 -1215.39 7969.43  

6 - 4 3417.59 -1303.69 8138.87  

6 - 3 3534.73 -1109.15 8178.61  

6 - 7 3583.82 -2035.63 9203.27  

1 - 6 -2851.31 -7450.91 1748.30  

1 - 5 236.44 -1326.68 1799.56  

1 - 2 237.68 -261.73 737.08  

1 - 0 525.71 148.50 902.92 ***

1 - 4 566.28 -592.42 1724.98  

1 - 3 683.42 -102.51 1469.35  

1 - 7 732.51 -2527.90 3992.93  

5 - 6 -3087.75 -7924.20 1748.70  

5 - 1 -236.44 -1799.56 1326.68  

5 - 2 1.24 -1574.94 1577.41  

5 - 0 289.27 -1252.55 1831.08  

13

Page 14: Project SAS

Comparisons significant at the 0.05 level are indicatedby ***.

LD17Comparison

DifferenceBetween

Means

Simultaneous 95% Confidence

Limits 

5 - 4 329.84 -1561.58 2221.27  

5 - 3 446.98 -1241.99 2135.94  

5 - 7 496.07 -3090.74 4082.88  

2 - 6 -3088.99 -7693.04 1515.07  

2 - 1 -237.68 -737.08 261.73  

2 - 5 -1.24 -1577.41 1574.94  

2 - 0 288.03 -140.05 716.12  

2 - 4 328.61 -847.64 1504.85  

2 - 3 445.74 -365.83 1257.32  

2 - 7 494.83 -2771.86 3761.52  

0 - 6 -3377.02 -7969.43 1215.39  

0 - 1 -525.71 -902.92 -148.50 ***

0 - 5 -289.27 -1831.08 1252.55  

0 - 2 -288.03 -716.12 140.05  

0 - 4 40.57 -1089.22 1170.37  

0 - 3 157.71 -584.95 900.36  

0 - 7 206.80 -3043.45 3457.06  

4 - 6 -3417.59 -8138.87 1303.69  

4 - 1 -566.28 -1724.98 592.42  

4 - 5 -329.84 -2221.27 1561.58  

4 - 2 -328.61 -1504.85 847.64  

4 - 0 -40.57 -1170.37 1089.22  

4 - 3 117.14 -1206.43 1440.70  

4 - 7 166.23 -3263.70 3596.16  

3 - 6 -3534.73 -8178.61 1109.15  

14

Page 15: Project SAS

Comparisons significant at the 0.05 level are indicatedby ***.

LD17Comparison

DifferenceBetween

Means

Simultaneous 95% Confidence

Limits 

3 - 1 -683.42 -1469.35 102.51  

3 - 5 -446.98 -2135.94 1241.99  

3 - 2 -445.74 -1257.32 365.83  

3 - 0 -157.71 -900.36 584.95  

3 - 4 -117.14 -1440.70 1206.43  

3 - 7 49.09 -3273.49 3371.67  

7 - 6 -3583.82 -9203.27 2035.63  

7 - 1 -732.51 -3992.93 2527.90  

7 - 5 -496.07 -4082.88 3090.74  

7 - 2 -494.83 -3761.52 2771.86  

7 - 0 -206.80 -3457.06 3043.45  

7 - 4 -166.23 -3596.16 3263.70  

7 - 3 -49.09 -3371.67 3273.49

Tabela 12. Wyniki testu Tukey'a(Źródło: SAS Enterprise Guide Learning Edition, v. 1.3.0.161)

Z powyższych wyników możemy odczytać, że na poziomie istotności 0,05 statystycznie istotnie różniły się od siebie średnia wielkość wydatków w grupie zawierających gospodarstwa z jednym dzieckiem do lat 17 oraz w grupie gospodarstw, gdzie w ogóle nie ma dzieci do lat 17. To ta różnica zadecydowała o odrzuceniu hipotezy zerowej w analizie wariancji zakładającą równość średnich wydatków w tych podgrupach, a więc brak wpływu liczby dzieci do lat 17 na wysokość wydatków ogółem.

IV. PROCEDURY

1) ANOVA JEDNOCZYNIKOWA

15

Page 16: Project SAS

PROC ANOVA DATA=ECLIB000.aaa_; CLASS LD17; MODEL WYDG = LD17; MEANS LD17 / WELCH HOVTEST=BARTLETT HOVTEST=BF HOVTEST=LEVENE; MEANS LD17 / TUKEY ALPHA=0.050;RUN; QUIT;

TITLE;

/*----------------------------------------------------- Plots Section*/

TITLE1 "One-Way Analysis of Variance";TITLE2 "Plots";

/*----------------------------------------------------- For box plots, the data must be sorted by both the BY group variables and the independent variables. Then, PROC GPLOT is used with box plot interpolation to generate the plot for each dependent variable.*/

PROC SORT DATA=ECLIB000.aaa_ OUT=WORK._ANVBOX_; BY LD17;RUN;

SYMBOL1 INTERPOL=BOX VALUE=CIRCLE;

GOPTIONS PUBLISH;PROC GPLOT DATA=WORK._ANVBOX_;TITLE3 "Box Plot of WYDG by LD17"; PLOT WYDG * LD17 / DESCRIPTION="Box Plot of WYDG by LD17"; RUN;QUIT;SYMBOL1;AXIS1 OFFSET=(10 pct) WIDTH=2;AXIS2 MAJOR=(NUMBER=5) WIDTH=2;SYMBOL1 I=STD1TJ CI=BLUE CO=BLUE V=NONE H=1 CELLS WIDTH=1;

GOPTIONS PUBLISH;PROC GPLOT DATA=ECLIB000.aaa_;

TITLE3 "Means Plot of WYDG by LD17"; PLOT WYDG * LD17 / HMINOR=0 VMINOR=0 CAXIS=BLACK DESCRIPTION="Means Plot of WYDG by LD17" NAME='MEANS' HAXIS=AXIS1 VAXIS=AXIS2; RUN;QUIT;AXIS1; AXIS2; SYMBOL1;TITLE;

/*----------------------------------------------------- Remove any temporary datasets created. Reset titles and footnotes.*/

PROC DELETE DATA=WORK._ANVBOX_; RUN;TITLE;FOOTNOTE;RUN;

16

Page 17: Project SAS

2) LINIOWO

PROC GLM DATA=ECLIB000.aaa_ ; CLASS D47 LD17; MODEL WYDG= D47 LD17 D47*LD17 / SS3 ;

/* output dataset to use as input for plots */ OUTPUT OUT=WORK._PLOTOUT PREDICTED=_predicted1 RESIDUAL=_residual1 STUDENT=_student1 RSTUDENT=_rstudent1 LCL=_lcl1 LCLM=_lclm1 UCL=_ucl1 UCLM=_uclm1 COOKD=_cookd1 COVRATIO=_covratio1 DFFITS=_dffits1 H=_h1 PRESS=_press1 STDI=_stdi1 STDP=_stdp1 STDR=_stdr1 ; RUN;

RUN;QUIT;

TITLE1 "Linear Models";TITLE2 "Plots";AXIS1 MAJOR=(NUMBER=5) WIDTH=1;AXIS2 OFFSET=(10 PCT) WIDTH=1;AXIS3 MAJOR=(NUMBER=5) OFFSET=(5 PCT);GOPTIONS PUBLISH;

PROC GPLOT DATA=WORK._PLOTOUT;

WHERE WYDG IS NOT MISSING AND D47 IS NOT MISSING AND LD17 IS NOT MISSING;

/* ********* MEANS plots for observed values ********* */

TITLE9 "Means plot of WYDG by D47"; SYMBOL1 C=BLUE V=NONE HEIGHT=2PCT INTERPOL=STD1MTJ L=1 W=1; WHERE WYDG IS NOT MISSING AND D47 IS NOT MISSING; PLOT WYDG * D47 = 1 / DESCRIPTION = "Means plot of WYDG by D47" ; RUN;

TITLE9 "Means plot of WYDG by LD17"; SYMBOL1 C=BLUE V=NONE HEIGHT=2PCT INTERPOL=STD1MTJ L=1 W=1; WHERE WYDG IS NOT MISSING AND LD17 IS NOT MISSING; PLOT WYDG * LD17 = 1 / DESCRIPTION = "Means plot of WYDG by LD17" ; RUN;

TITLE9 "Means plot of WYDG by D47 and LD17"; SYMBOL1 C=BLUE V=NONE HEIGHT=2PCT INTERPOL=STD1MTJ L=1 W=1; SYMBOL2 C=CXD08C16 V=NONE HEIGHT=2PCT INTERPOL=STD1MTJ L=1 W=1; SYMBOL3 C=CXCD0369 V=NONE HEIGHT=2PCT INTERPOL=STD1MTJ L=1 W=1;

17

Page 18: Project SAS

SYMBOL4 C=CX5B768D V=NONE HEIGHT=2PCT INTERPOL=STD1MTJ L=1 W=1; SYMBOL5 C=CXFF8283 V=NONE HEIGHT=2PCT INTERPOL=STD1MTJ L=1 W=1; SYMBOL6 C=CXFF00FF V=NONE HEIGHT=2PCT INTERPOL=STD1MTJ L=1 W=1; SYMBOL7 C=CX009998 V=NONE HEIGHT=2PCT INTERPOL=STD1MTJ L=1 W=1; SYMBOL8 C=CXA05000 V=NONE HEIGHT=2PCT INTERPOL=STD1MTJ L=1 W=1; SYMBOL9 C=CX2E734F V=NONE HEIGHT=2PCT INTERPOL=STD1MTJ L=1 W=1; SYMBOL10 C=CX000080 V=NONE HEIGHT=2PCT INTERPOL=STD1MTJ L=1 W=1; WHERE WYDG IS NOT MISSING AND D47 IS NOT MISSING; PLOT WYDG * D47 = LD17 / DESCRIPTION = "Means plot of WYDG by D47 and LD17" ; RUN;

SYMBOL;QUIT;PROC DELETE DATA=WORK._PLOTOUT; RUN;

TITLE;FOOTNOTE;RUN;

3) ZGODNOSC Z ROZKLADEM NORMALNYM4)

PROC UNIVARIATE DATA=ECLIB000.aaa_ CIBASIC ( /*The default for Basic table type is two sided.*/ ALPHA=0.050 ) MU0=0 ; VAR WYDG; HISTOGRAM / NOPLOT Normal( W= 1 L= 1 COLOR=BLUE mu=EST sigma=EST ) CFRAME=CXA8A8A8 CAXES=BLACK WAXIS=1 CBARLINE=BLACK CFILL=BLUE PFILL=SOLID ; RUN;TITLE;FOOTNOTE;RUN;

18