WYNIKÓW BADAŃ -...

23
ANALIZA STATYSTYCZNA WYNIKÓW BADAŃ

Transcript of WYNIKÓW BADAŃ -...

ANALIZA STATYSTYCZNA

WYNIKÓW BADAŃ

Dopasowanie rozkładów

Dopasowanie rozkładów- ogólny cel

Porównanie średnich dwóch zmiennych

2 zmienne posiadają rozkład normalny ->

test parametryczny (t- studenta)

2 zmienne nie spełniają rozkładu

normalnego -> testy nieparametryczne

Dopasowanie rozkładów- ogólny cel

Cele prognostyczne

Często dla celów prognostycznych jest

wskazane zrozumienie kształtu

rozważanego rozkładu populacji.

Najczęściej używane rozkłady

-Bernoulliego

- Beta

- Dwumianowy

- Chi-kwadrat

- Wykładniczy

- F (Snedeckora)

- Gamma

- Geometryczny

- Gompertza

- Logistyczny

- Logarytmiczno- normalny

- Pareto

- Poissona

- Prostokątny

- Rayleigha

- t-studenta

- Weibulla

- NORMALNY

ROZKŁAD NORMALNY

Rozkład o charakterystycznym kształcie "krzywej dzwonowej", symetrycznej w stosunku do średniej.

ROZKŁAD NORMALNY

Ogólnie jest dobrym modelem dla rozkładu zmiennej losowej, w sytuacji gdy:

-Występuje silna tendencja do przyjmowania wartości położonych blisko środka rozkładu;

ROZKŁAD NORMALNY

Ogólnie jest dobrym modelem dla rozkładu zmiennej losowej, w sytuacji gdy:

- Dodatnie i ujemne odchylenia od środka rozkładu są jednakowo prawdopodobne;

ROZKŁAD NORMALNY

Ogólnie jest dobrym modelem dla rozkładu zmiennej losowej, w sytuacji gdy:

- Liczność odchyleń gwałtownie spada wraz ze wzrostem ich wielkości.

ROZKŁAD NORMALNY

Podstawowy mechanizm tworzący rozkład normalny: nieskończoną liczbę niezależnych zdarzeń losowych które generują wartości danej zmiennej.

Przykład: istnieje prawdopodobnie prawie nieograniczona liczba czynników determinujących wzrost człowieka (olbrzymia liczba genów, sposób odżywiania, przebyte choroby itd.). Tak więc należy spodziewać się, że w populacji wzrost podlega rozkładowi normalnemu.

JAK OKREŚLIĆ, CZY ROZKŁAD JEST

NORMALNY?

1. obliczenie skośności i kurtozy

2. analiza histogramu

3. analiza wykresów P-P

4. testy normalności

JAK OKREŚLIĆ, CZY ROZKŁAD JEST

NORMALNY?

1. obliczenie skośności i kurtozy

Skośność mierzy odchylenie rozkładu od symetrii.

Jeśli wartość skośności jest wyraźnie różna od zera, wówczas dany rozkład jest asymetryczny.

Rozkład normalny jest symetryczny!!!!!!

JAK OKREŚLIĆ, CZY ROZKŁAD JEST

NORMALNY?

1. obliczenie skośności i kurtozy

Kurtoza mierzy "spiczastość" rozkładu.

Jeśli wartość kurtozy jest wyraźnie różna od zera, wówczas rozkład jest albo bardziej płaski albo bardziej spiczasty niż rozkład normalny.

Wartość kurtozy dla rozkładu normalnego wynosi 0!

JAK OKREŚLIĆ, CZY ROZKŁAD JEST

NORMALNY?

2. Analiza histogramu

JAK OKREŚLIĆ, CZY ROZKŁAD JEST

NORMALNY?

3. Analiza wykresów P-P

Wykres prawdopodobieństwo-prawdopodobieństwo

Dystrybuanta empiryczna kreślona jest względem dystrybuanty teoretycznej.

Jeśli teoretyczny rozkład dobrze przybliża rozkład obserwowany, wówczas punkty na wykresie powinny leżeć blisko przekątnej.

JAK OKREŚLIĆ, CZY ROZKŁAD JEST

NORMALNY?

3. Analiza wykresów P-P

JAK OKREŚLIĆ, CZY ROZKŁAD JEST

NORMALNY?

4. Testy normalności

W celu zidentyfikowania rozkładu zazwyczaj

dopasowuje się rozkład empiryczny do rozkładu

teoretycznego poprzez:

porównanie częstości zaobserwowanych w

danych rzeczywistych do częstości

oczekiwanych rozkładu teoretycznego

JAK OKREŚLIĆ, CZY ROZKŁAD JEST

NORMALNY?

częstości

zaobserwowane w

danych

rzeczywistych

częstości

oczekiwane

rozkładu

teoretycznego

JAK OKREŚLIĆ, CZY ROZKŁAD JEST

NORMALNY?

4. Testy normalności

Porównania częstości zaobserwowanych w danych rzeczywistych do częstości oczekiwanych rozkładu teoretycznego dokonuje się za pomocą testów statystycznych:

- chi kwadrat

- Kołmogorowa-Smirnowa

- Lillieforsa

- Shapiro-Wilka

JAK OKREŚLIĆ, CZY ROZKŁAD JEST

NORMALNY?

4. Testy normalności

Test Kołmogorowa-Smirnowa: Wykorzystuje

maksymalną wartość różnicy między

dystrybuantą z próby, a założoną dystrybuantą

teoretyczną.

p< 0.05 -> rozkład różni się istotnie od normalnego

p> 0.05 -> rozkład jest normalny

JAK OKREŚLIĆ, CZY ROZKŁAD JEST

NORMALNY?

4. Testy normalności

Test chi-kwadrat:

Stopnie swobody: df = liczba kategorii - liczba parametrów - 1

liczba kategorii - liczba klas w tablicy liczności, w której liczności oczekiwane są wyższe niż 5,

liczba parametrów- liczba parametrów odpowiedniego rozkładu teoretycznego.

p< 0.05 -> rozkład różni się istotnie od normalnego

p> 0.05 -> rozkład jest normalny

JAK OKREŚLIĆ, CZY ROZKŁAD JEST

NORMALNY?

4. Testy normalności

Test W Shapiro-Wilka: preferowany test

normalności ze względu na jego dużą moc w

porównaniu z innymi testami.

p< 0.05 -> rozkład różni się istotnie od normalnego

p> 0.05 -> rozkład jest normalny

JAK OKREŚLIĆ, CZY ROZKŁAD JEST

NORMALNY?

4. Testy normalności

Test Lillieforsa: test oparty na badaniu

maksymalnej różnicy pomiędzy dystrybuantą

empiryczną (z próby) a dystrybuantą rozkładu

normalnego o takiej samej średniej i wariancji

jak oszacowana z próby

p< 0.05 -> rozkład różni się istotnie od normalnego

p> 0.05 -> rozkład jest normalny