Statistica2013 Pomoc

download Statistica2013 Pomoc

of 14

description

pomoc do statistica

Transcript of Statistica2013 Pomoc

  • cieki dostpu do STATISTICA

    Spis treci Sprawdzanie zgodnoci z rozkadem normalnym test Shapiro-Wilka: ............................................................................. 2

    Test t-Studenta w modelu zmiennych niezalenych: ........................................................................................................ 3

    Test t-Studenta w modelu zmiennych powizanych ........................................................................................................ 4

    Test Manna-Whitneya : .................................................................................................................................................... 5

    Test Wilcoxona ................................................................................................................................................................. 5

    Tabele kontyngencji skala nominalna ............................................................................................................................ 6

    Badanie zalenoci ............................................................................................................................................................ 8

    ANOVA w modelu zmiennych niezalenych.................................................................................................................... 10

    ANOVA w modelu zmiennych zalenych......................................................................................................................... 11

    Test Kruskala-Wallisa test nieparametryczny (ANOVA rang Kruskala-Wallisa) ........................................................... 12

    Test Friedmana test nieparametryczny (ANOVA rang Friedmana) .............................................................................. 12

    Regresja Wielokrotna ...................................................................................................................................................... 13

  • Sprawdzanie zgodnoci z rozkadem normalnym test Shapiro-Wilka: H0 : RDane = RNor

    H1 : RDane RNor

    Grupa pe =k

    p=0,8206 H0

    Grupa pe =m

    p=0,8077 H0

  • Test t-Studenta w modelu zmiennych niezalenych: Skala interwaowa, model zmiennych niepowizanych, zgodno z rozkadem normalnym w kadej z grup, liczba grup k=2

    H0 : 1 = 2

    H1 : 1 2

    Jednorodno wariancji test Levena

    H0 : SD2

    1 = SD2

    2

    H1 : SD2

    1 SD2

    2

    p testu Levena p=0,4991 H0 patrzymy na warto p testu t-Studenta p=0,3353

    p testu Levena p=0,0235 H1 patrzymy na warto p testu t z oddz. est. war. p=0,0042 H1 (test Welcha)

  • Test t-Studenta w modelu zmiennych powizanych Skala interwaowa, model zmiennych powizanych, zgodno z rozkadem normalnym, liczba grup k=2

    H0 : przed = po

    H1 : przed po

    Warto p testu p=0,0195 H1

  • Test Manna-Whitneya : Gdy brak zgodnoci z rozkadem normalnym skala interwaowa, lub skala porzdkowa w modelu zmiennych niepowizanych, liczba grup k=2

    H0 : 1 = 2

    H1 : 1 2

    Patrzymy na drugie p za Z popraw. (poprawka na rangi wizane) p=0,5312 H0

    Test Wilcoxona Gdy brak zgodnoci z rozkadem normalnym skala interwaowa, lub skala porzdkowa w modelu zmiennych powizanych, liczba grup k=2

    H0 : przed = po

    H1 : przed po

    Warto p testu p=0,0005 H1

  • Tabele kontyngencji skala nominalna Test Chi2 , Test Chi2 z poprawk Yatesa, test dokadny Fishera

    H0 : 1 = 2 H0 : brak zalenoci midzy badanymi parametrami

    H1 : 1 2 H1 : jest zaleno midzy badanymi parametrami

    1. Sposb

    menopauza

    Podsumowujca tabela dwudzielcza: czstoci obserwowane (Rak piersi- 2 grupy)

    Typ hist. 1

    Typ hist. 2

    Wiersz Razem

    POST 24 10 34

    MEN 6 4 10

    Og 30 14 44

  • menopauza

    Podsumowujca tabela Wyliczanie licznoci (Rak piersi- 2 grupy)

    Typ hist. 1

    Typ hist. 2

    Wiersz Razem

    POST 23,18182 10,81818 34,00000

    MEN 6,81818 3,18182 10,00000

    Og 30,00000 14,00000 44,00000

    Liczebno oczekiwana

  • Badanie zalenoci Wspczynnik korelacji Pearsona oba parametry na skali interwaowej i oba zgodne z rozkadem normalnym, bada zaleno liniow

    H0 : RP = 0 brak zalenoci linowej midzy badanymi parametrami

    H1 : RP 0 jest zaleno linowa midzy badanymi parametrami

    Gdy potwierdzona zgodno z rozkadem normalnym

    Zmn. X & Zmn. Y

    Korelacje (Zadania_3) Oznaczone wsp. korelacji s istotne z p < ,05000 (Braki danych usuwano przypadkami)

    rednia Odch.st. r(X,Y) r2 t p Wanych Staa zal: Y

    Nachyle zal: Y

    Staa zal: X

    Nachyle zal: X

    Poziom estriolu [mg/24h]

    16,20000 4,645787

    Masa urodzeniowa [g/100]

    30,36000 3,510461 0,455274 0,207275 2,452312 0,022203 25 24,78695 0,344015 -2,09237

    0,602516

    Wsp. korelacji Pearsona; wsp. determinacji y = a + b x

    p=0,0222 H1

    Wykr. rozrzutu: Masa urodzeniowa [g/100] vs. Poziom estriolu [mg/24h] (BD usuwano przypadk.)

    Poziom estriolu [mg/24h] = -2,092 + ,60252 * Masa urodzeniowa [g/100]

    Korelacja: r = ,45527

    22 24 26 28 30 32 34 36

    Masa urodzeniowa [g/100]

    6

    8

    10

    12

    14

    16

    18

    20

    22

    24

    26

    28

    Pozio

    m e

    str

    iolu

    [m

    g/2

    4h]

    0,95 Prz.Ufn.

  • Wspczynnik korelacji nieparametrycznej Spearmana oba parametry na skali interwaowej ale brak zgodnoci z rozkadem normalnym, jeden lub oba parametry na skali porzdkowej

    H0 : RS = 0 brak zalenoci monotonicznej midzy badanymi parametrami

    H1 : RS 0 jest zaleno monotoniczna midzy badanymi parametrami

    Para zmiennych

    Korelacja porzdku rang Spearmana (Zad1) BD usuwane parami Oznaczone wsp. korelacji s istotne z p

  • ANOVA w modelu zmiennych niezalenych Skala interwaowa, liczba grup >2, zgodno z rozkadem normalnym w kadej z grup, jednorodno wariancji

    H0 : 1 = 2=.=k

    H1 : i j i=1k; j=1.k; ij

    Mona wyznaczy statystyki opisowe w kadej z grup, nastpnie zakadka Testy ANOVA

    Sprawdzamy na wykresie czy rednie i odchylenia standardowe s skorelowane

    Zmienna

    Test Levene'a jednorodnoci wariancji (ANOVA1)Zaznaczone efekty s istotne z p < ,05000

    SS Efekt

    df Efekt

    MS Efekt

    SS Bd

    df Bd

    MS Bd

    F p

    zmiana cinienia 1,315070 3 0,438357 14,16468 36 0,393463 1,114098 0,356127

    Jednorodno wariancji potwierdzona

    Zmienna

    Analiza wariancji (ANOVA1) Zaznaczone efekty s istotne z p < ,05000

    SS Efekt

    df Efekt

    MS Efekt

    SS Bd

    df Bd

    MS Bd

    F p

    zmiana cinienia 58,39500 3 19,46500 50,63600 36 1,406556 13,83877 0,000004

    p< 0,0001 H1 testujemy ktre pary rednich si rni testami post-hoc

    Test Scheffe najbardziej konserwatywny, test NIR najmniej konserwatywny

    Metoda

    Test Scheffe; Zmienna: (ANOVA1) Zaznaczone rnice s istotne z p < ,05000

    1 M=,37000

    2 M=1,7300

    3 M=2,4500

    4 M=3,7100

    m1 1 0,105887 0,004688 0,000006

    m2 2 0,105887 0,610212 0,007601

    m3 3 0,004688 0,610212 0,150215

    m4 4 0,000006 0,007601 0,150215 Wykres rednich i przedz. ufnoci (95,00%)

    zmiana c inienia

    zmiana c inienia

    m1 m2 m3 m4

    Metoda

    -1

    0

    1

    2

    3

    4

    5

    Wa

    rto

    ci

  • ANOVA w modelu zmiennych zalenychSkala interwaowa, liczba grup >2, zgodno z rozkadem normalnym w kadej z grup, zaoenie sferycznoci (test Mauchleya) i symetrii poczonej

    H0 : 1 = 2=.=k

    H1 : i j i=1k; j=1.k; ij

    Efekt

    Test sferycznoci Mauchleya (ANOVA) Parametryzacja z sigma-ograniczeniami Dekompozycja efektywnych hipotez

    W Chi-kw. df p

    R1 0,943258 1,635645 2 0,441392

    Efekt

    Analiza wariancji dla powtarzanych pomiarw (ANOVA) Parametryzacja z sigma-ograniczeniami Dekompozycja efektywnych hipotez

    SS Stopnie swobody

    MS F p

    Wyraz wolny 725224,9 1 725224,9 1799,191 0,000000

    Bd 11689,4 29 403,1

    R1 447,8 2 223,9 2,079 0,134213

    Bd 6244,9 58 107,7

    p= 0,1342 H0 brak statystycznie istotnych rnic (rednie w trzech czasach nie rni si)

    R1; Oczekiwane rednie brzegowe

    Biecy efekt: F(2, 58)=2,0795, p=,13421

    Dekompozycja efektywnych hipotez

    Pionowe supki oznaczaj 0,95 przedziay ufnoci

    MAP 36g MAP 48g MAP 60g

    R1

    78

    80

    82

    84

    86

    88

    90

    92

    94

    96

    98

    100

    DV

    _1

  • Test Kruskala-Wallisa test nieparametryczny (ANOVA rang Kruskala-Wallisa) Model niezaleny, liczba grup >2, skala interwaowa ale nie spenione zaoenia ANOVA (brak normalnoci w jakiej z grup lub wariancje niejednorodne lub skorelowanie rednich z odchyleniami standardowymi), skala porzdkowa H0 : 1 = 2=.=k H1 : i j i=1k; j=1.k; ij

    Zalena: SCORAD

    Warto p dla porwna wielokrotnych (dwustronych); SCORAD (Rosiska 02062011) Zmienna niezalena (grupujca): Group Test Kruskala-Wallisa: H ( 2, N= 154) =21,14553 p =,0000

    CH-AD R:77,500

    CH-ADe R:94,186

    CH-ADi R:44,769

    CH-AD 0,114717 0,003644

    CH-ADe 0,114717 0,000013

    CH-ADi 0,003644 0,000013

    p testu Kruskala-wallisa p< 0,0001 H1 testujemy ktre rozkady si rni testem Dunna

    Test Friedmana test nieparametryczny (ANOVA rang Friedmana) Model zaleny, liczba grup >2, skala interwaowa ale nie spenione zaoenia ANOVA, skala porzdkowa H0 : 1 = 2=.=k H1 : i j i=1k; j=1.k; ij

    Zmienna

    ANOVA Friedmana i wspczynnik zgodnoci Kendalla (ANOVA) Chi kwad. ANOVA (N = 30 , df 6 ) =17,00240 p ,00928 Wspczynnik zgodnoci= ,09446 r red. rang = ,06323

    rednia Ranga

    Suma Rang

    rednia Odch.std

    TNF 0g 5,066667 152,0000 23,26800 17,46910

    TNF 12g 3,900000 117,0000 16,57667 7,54539

    TNF 24g 4,533333 136,0000 16,36600 7,21716

    TNF 36g 4,266667 128,0000 15,54200 5,84767

    TNF 48g 3,350000 100,5000 14,32033 5,03198

    TNF 60g 3,250000 97,5000 14,03867 4,26091

    TNF 5d 3,633333 109,0000 14,39967 4,46019

    p testu Friedmana p< 0,0001 H1 testujemy ktre rozkady si rni testem Dunna (Zestaw medyczny lub makro Post Hoc for Friedman)

  • Regresja Wielokrotna 1 . Regresja z jednym predykatorem y= b0 (wyraz wolny) + b1*x + e (bd estymacji)

    statystyka

    Stat.podsum.; Zmn. zal.:WZROST (Korelacje)

    Warto

    R wielorakie 0,786658889

    Wielorakie R2 0,618832207

    Skorygowane R2 0,591605936

    F(1,14) 22,7292312

    p 0,000300369924

    Bd std. estymacji 12,7245012

    N=16

    Podsumowanie regresji zmiennej zalenej: WZROST (Korelacje) R= ,78665889 R^2= ,61883221 Skoryg. R2= ,59160594 F(1,14)=22,729 p

  • Brak zgodnoci z rozkadem normalnym reszt naley sprawdzi dlaczego

    2. Regresja z wieloma predykatorami y= b0 + b1*x1 + b2 *x2 + + bk*xk + e

    Wykresy ramkowe dla zmiennych cigych

    1. Badanie zaoenia liniowoci zwizku seria wykresw rozrzutu midzy zmienn zalen a poszczeglnymi zmiennymi niezalenymi

    2. Badanie warunku wystarczajcej liczebnoci (n>>k+1 k- liczba predyktorw)

    3. Tablice korelacji liniowych wybieramy takie predykatory, ktre s silnie skorelowane ze zmienn zalen ale sabo midzy sob

    4. Wspczynnik korelacji czstkowej miara korelacji ze zmienn zalen z wyczeniem oddziaywania na ten zwizek innych

    predyktorw( czysty wkad predykatora do wyjanienia zmiennoci zmiennej opisywanej)( 1/(1+4))

    5. Wspczynnik korelacji semiczstkowej korelacja predyktora (uwzgldniajca jego powizania ze wszystkimi pozostaymi

    predyktorami ) a zmienn zalen (bez uwzgldnienia jej korelacji z innymi predyktorami ( 1/(1+2+3+4))

    6. Tolerancja (obliczana jako 1 R-kwadrat korelacji wielorakiej) miara okrelajca ile procent wariancji predyktora nie jest

    wyjaniony przez pozostae zmienne niezalene (predyktory) im warto nisza (blisza zero) tym bardziej jest w modelu zbdna

    7. Czynnik inflacji wariancji CIW = 1/Tolerancja (jeli brak wspliniowoci CIW=1. Im CIW wiksze jeden, tym zmienna jest bardziej

    nadmiarowa). Zakcajca model wspliniowo, gdy CIW>10 (R2 > 0.9)

    8. Analiza reszt 1. - ocena normalnoci histogramu rozkadu reszt ( mona uy w razie wtpliwoci testu Shapiro- Wilksa)

    9. Analiza reszt 2 - badanie autokorelacji reszt _ test Durbina Watsona ( powinien by koo wartoci 2, warto 0 silne skorelowanie

    dodatnie, warto 4 silne skorelowanie ujemne)

    10. Analiza reszt 3 ocena homoscedastycznoci ( wykres rozrzutu reszt i kwadratw reszt wzgldem wartoci przewidywanych)

    11. Analiza reszt 4 ocena rozrzutu reszt wzgldem poszczeglnych predykatorw

    statystyka

    Stat.podsum.; Zmn. zal.:masa (Korelacje)

    Warto R wielorakie 0,883168187 Wielorakie R2 0,779986047 Skorygowane R2 0,731094058 F(2,9) 15,9532483 p 0,0010990717 Bd std. estymacji 1,62162604

    N=12

    Podsumowanie regresji zmiennej zalenej: masa (Korelacje) R= ,88316819 R^2= ,77998605 Skoryg. R2= ,73109406 F(2,9)=15,953 p