Dopasowanie rozkładów

22
Dopasowanie rozkładów

description

Dopasowanie rozkładów. Dopasowanie rozkładów- ogólny cel. Porównanie średnich dwóch zmiennych 2 zmienne posiadają rozkład normalny -> test parametryczny (t- studenta ) 2 zmienne nie spełniają rozkładu normalnego -> testy nieparametryczne. Dopasowanie rozkładów- ogólny cel. - PowerPoint PPT Presentation

Transcript of Dopasowanie rozkładów

Page 1: Dopasowanie rozkładów

Dopasowanie rozkładów

Page 2: Dopasowanie rozkładów

Dopasowanie rozkładów- ogólny cel

Porównanie średnich dwóch zmiennych

2 zmienne posiadają rozkład normalny -> test parametryczny (t- studenta)

2 zmienne nie spełniają rozkładu normalnego -> testy nieparametryczne

Page 3: Dopasowanie rozkładów

Dopasowanie rozkładów- ogólny cel

Cele prognostyczne

Często dla celów prognostycznych jest wskazane zrozumienie kształtu rozważanego rozkładu populacji.

Page 4: Dopasowanie rozkładów

Najczęściej używane rozkłady

-Bernoulliego

- Beta

- Dwumianowy

- Chi-kwadrat

- Wykładniczy

- F (Snedeckora)

- Gamma

- Geometryczny

- Gompertza

- Logistyczny

- Logarytmiczno- normalny

- Pareto

- Poissona

- Prostokątny

- Rayleigha

- t-studenta

- Weibulla

- NORMALNY

Page 5: Dopasowanie rozkładów

ROZKŁAD NORMALNY

Rozkład o charakterystycznym kształcie "krzywej dzwonowej", symetrycznej w stosunku do średniej.

Page 6: Dopasowanie rozkładów

ROZKŁAD NORMALNY

Ogólnie jest dobrym modelem dla rozkładu zmiennej losowej, w sytuacji gdy:

-Występuje silna tendencja do przyjmowania wartości położonych blisko środka rozkładu;

Page 7: Dopasowanie rozkładów

ROZKŁAD NORMALNY

Ogólnie jest dobrym modelem dla rozkładu zmiennej losowej, w sytuacji gdy:

- Dodatnie i ujemne odchylenia od środka rozkładu są jednakowo prawdopodobne;

Page 8: Dopasowanie rozkładów

ROZKŁAD NORMALNY

Ogólnie jest dobrym modelem dla rozkładu zmiennej losowej, w sytuacji gdy:

- Liczność odchyleń gwałtownie spada wraz ze wzrostem ich wielkości.

Page 9: Dopasowanie rozkładów

ROZKŁAD NORMALNY

Podstawowy mechanizm tworzący rozkład normalny: nieskończoną liczbę niezależnych zdarzeń losowych które generują wartości danej zmiennej.

Przykład: istnieje prawdopodobnie prawie nieograniczona liczba czynników determinujących wzrost człowieka (olbrzymia liczba genów, sposób odżywiania, przebyte choroby itd.). Tak więc należy spodziewać się, że w populacji wzrost podlega rozkładowi normalnemu.

Page 10: Dopasowanie rozkładów

JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY?

1. obliczenie skośności i kurtozy

2. analiza histogramu

3. analiza wykresów P-P

4. testy normalności

Page 11: Dopasowanie rozkładów

JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY?

1. obliczenie skośności i kurtozy

Skośność mierzy odchylenie rozkładu od symetrii.

Jeśli wartość skośności jest wyraźnie różna od zera, wówczas dany rozkład jest asymetryczny.

Rozkład normalny jest symetryczny (skośność jest bliska 0)

Page 12: Dopasowanie rozkładów

JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY?

1. obliczenie skośności i kurtozy

Kurtoza mierzy "spiczastość" rozkładu.

Jeśli wartość kurtozy jest wyraźnie <0, wówczas rozkład jest bardziej płaski, a jeśli jest wyraźnie >0 to rozkład jest bardziej spiczasty niż rozkład normalny.

Wartość kurtozy dla rozkładu normalnego wynosi 0!

Page 13: Dopasowanie rozkładów

JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY?

2. Analiza histogramu

Page 14: Dopasowanie rozkładów

JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY?

3. Analiza wykresów P-P

Wykres prawdopodobieństwo-prawdopodobieństwo

Dystrybuanta empiryczna kreślona jest względem dystrybuanty teoretycznej.

Jeśli teoretyczny rozkład dobrze przybliża rozkład obserwowany, wówczas punkty na wykresie powinny leżeć blisko przekątnej.

Page 15: Dopasowanie rozkładów

JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY?

3. Analiza wykresów P-P

Page 16: Dopasowanie rozkładów

JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY?

4. Testy normalności

W celu zidentyfikowania rozkładu zazwyczaj dopasowuje się rozkład empiryczny do rozkładu teoretycznego poprzez:

porównanie częstości zaobserwowanych w danych rzeczywistych do częstości oczekiwanych rozkładu teoretycznego

Page 17: Dopasowanie rozkładów

JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY?

częstości zaobserwowane w danych rzeczywistych

częstości oczekiwane rozkładu teoretycznego

Page 18: Dopasowanie rozkładów

JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY?

4. Testy normalności

Porównania częstości zaobserwowanych w danych rzeczywistych do częstości oczekiwanych rozkładu teoretycznego dokonuje się za pomocą testów statystycznych:

- chi kwadrat- Kołmogorowa-Smirnowa- Lillieforsa- Shapiro-Wilka

Page 19: Dopasowanie rozkładów

JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY?

4. Testy normalności

Test Kołmogorowa-Smirnowa: Wykorzystuje maksymalną wartość różnicy między dystrybuantą z próby, a założoną dystrybuantą teoretyczną.

p< 0.05 -> rozkład różni się istotnie od normalnego

p> 0.05 -> rozkład jest normalny

Page 20: Dopasowanie rozkładów

JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY?

4. Testy normalności

Test chi-kwadrat:Stopnie swobody: df = liczba kategorii - liczba

parametrów - 1liczba kategorii - liczba klas w tablicy liczności, w

której liczności oczekiwane są wyższe niż 5,liczba parametrów- liczba parametrów

odpowiedniego rozkładu teoretycznego.

p< 0.05 -> rozkład różni się istotnie od normalnegop> 0.05 -> rozkład jest normalny

Page 21: Dopasowanie rozkładów

JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY?

4. Testy normalności

Test W Shapiro-Wilka: preferowany test normalności ze względu na jego dużą moc w porównaniu z innymi testami.

p< 0.05 -> rozkład różni się istotnie od normalnegop> 0.05 -> rozkład jest normalny

Page 22: Dopasowanie rozkładów

JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY?

4. Testy normalności

Test Lillieforsa: test oparty na badaniu maksymalnej różnicy pomiędzy dystrybuantą empiryczną (z próby) a dystrybuantą rozkładu normalnego o takiej samej średniej i wariancji jak oszacowana z próby

p< 0.05 -> rozkład różni się istotnie od normalnegop> 0.05 -> rozkład jest normalny