Rozkłady zmiennych losowych

Dane zbierane podczas pomiarów zawsze układają się w pewien określony sposób.

To w jaki, zależy przede wszystkim od zjawiska, które jest obserwowane.

Sposób, w jaki układają się dane- rozkład zmiennej losowej.

Model probabilistyczny

Opisujemy rozkład empiryczny (doświadczalny) pewną krzywą ciągłą- sprawdzamy, czy nasze wyniki można opisać rozkładem teoretycznym.

Nasze wyniki traktujemy jak zmienną losową.

Rozkłady zmiennych losowych

-Bernoulliego

- Beta

- Dwumianowy

- Chi-kwadrat

- Wykładniczy

- F (Fischera-Snedeckora)

- Gamma

- Geometryczny

- Gompertza

- Logistyczny

-Logarytmiczno-

normalny

- Pareto

-Poissona

- Prostokątny

- Rayleigha

- Średniej

- t-studenta

- Weibulla

- Normalny

Rozkład normalny

Krzywa Gaussa: Rozkład o charakterystycznym kształcie "krzywej dzwonowej", symetrycznej w stosunku do średniej.

Rozkład normalny

Ogólnie jest dobrym modelem dla rozkładu zmiennej losowej, w sytuacji gdy:

-Występuje silna tendencja do przyjmowania wartości położonych blisko środka rozkładu;

Rozkład normalny

- Dodatnie i ujemne odchylenia od środka rozkładu są jednakowo prawdopodobne;

Rozkład normalny

- Liczność odchyleń gwałtownie spada wraz ze wzrostem ich wielkości.

Rozkład normalny

Podstawowy mechanizm tworzący rozkład normalny: nieskończoną liczbę niezależnych zdarzeń losowych które generują wartości danej zmiennej.

Rozkład normalny

Przykład: istnieje prawdopodobnie prawie nieograniczona liczba czynników determinujących wzrost człowieka. Należy spodziewać się, że w populacji wzrost podlega rozkładowi normalnemu.

Rozkład normalny

Najważniejszy rozkład zmiennej losowej ciągłej, ponieważ

• przy nieograniczonym wzroście l-by niezależnych doświadczeń statystycznych WSZYSTKIE znane teoretyczne rozkłady zmiennych losowych ciągłych i dyskretnych są SZYBKO ZBIEŻNE do rozkładu normalnego

•w badaniu prób losowych popełniane są błędy przypadkowe, których rozkład jest normalny lub zbliżony do normalnego

Rozkład normalny

Gęstość prawdopodobieństwa

𝑓 𝑥 =1

𝜎 2𝜋exp(−

𝑥 − 𝜇 2

2𝜎)

m i to parametry rozkładu (mając ich wartości uzyskamy gotową krzywą Gaussa)

Rozkład ten jest określony w przedziale (-,+ )

𝑓 𝑥 =1

𝜎 2𝜋exp(−

𝑥 − 𝜇 2

2𝜎)

Rozkład normalny

Gęstość prawdopodobieństwa

𝑓 𝑥 =1

𝜎 2𝜋exp(−

𝑥 − 𝜇 2

2𝜎)

m=E(X) - wartość oczekiwana (średnia arytm.)

=D(X) - odchylenie standardowe

𝑓 𝑥 =1

𝜎 2𝜋exp(−

𝑥 − 𝜇 2

2𝜎)

Rozkład normalny

Zasada 3 :

68% wartości cechy leży w odległości od m;

95,5% wartości cechy leży w odległości 2 od m;

99,7% wartości cechy leży w odległości 3 od m;

Tablice- standaryzowany R.N.

W TABLICACH rozkład normalny sprowadza się do standaryzowanego rozkładu normalnego.

u =x − μ

Wtedy gęstość rozkładu:

f u =1

2πexp −

Wtedy m=0 i =1:

A dystrybuanta:

F u =1

2π exp −

−∞

Jeśli poszukujemy p-stwa znalezienia wyników w przedziale (x1,x2) to:

u1 =x1 − μ

σ u2 =

x2 − μ

P(x1<x<x2)=F(x2)-F(x1)=F(u2)-F(u1)

Po co jest potrzebna operacja standaryzacji?

Estymatory

Jeżeli nie wiemy, ile naprawdę wynosi m rozkładu normalnego i (dla całej populacji) a jedynie liczymy średnią arytmetyczną i odchylenie z pomiarów, to wyliczone przybliżone parametry są obarczone błędem.

E(x) = m x

D(x) = 𝜎

E(x)- wartość oczekiwana rozkładu teoretycznego D(x)- odchylenie standardowe rozkładu teoretycznego

Estymatory

Błąd standardowy średniej:

𝜎𝑥 =𝜎

Przedział, gdzie znajduje się wartość oczekiwana:

𝜇 = 𝑥 ± 𝜎𝑥

(𝑥 − 𝜎𝑥 ; 𝑥 + 𝜎𝑥 )

Rozkład t-studenta

Definicja zmiennej losowej t-studenta

Gdzie:

𝑡 =𝑥 − 𝜇

𝜎 ∙ 𝑛

Rozkład t-studenta

Lub inaczej:

Gdzie:

𝑡 =𝑥 − 𝜇

𝜎 𝑥 =𝑥 − 𝜇

𝜎∙ 𝑛 − 1

𝜎 = 1

𝑛 𝑥𝑖 − 𝑥 2

𝑖=1

Rozkład t-studenta

Rozkład t-studenta ma jeden parametr – liczbę stopni swobody – od niego zależy kształt rozkładu

f=df=n-1

𝑡 =𝑥 − 𝜇

𝜎 𝑥 =𝑥 − 𝜇

𝜎∙ 𝑛 − 1

Rozkład t-studenta

Dla df= rozkład t-studenta jest rozkładem normalnym!

Rozkład t-studenta - tablice

Przedział ufności

Definicja: Niech cecha X ma rozkład w populacji z nieznanym parametrem θ. Z populacji wybieramy próbę losową (X1, X2, ..., Xn).

Przedziałem ufności (θ - θ1, θ + θ2) o współczynniku ufności 1 - α nazywamy taki przedział (θ - θ1, θ + θ2), który spełnia warunek:

P(θ1 < θ < θ2) = 1 − α gdzie θ1 i θ2 są funkcjami wyznaczonymi na podstawie próby losowej.

Przedział ufności

Definicja:

Definicja pozwala na dowolność wyboru funkcji z próby

zazwyczaj będziemy poszukiwać przedziałów najkrótszych.

Przedział ufności

Współczynnik ufności 1-a: Prawdopodobieństwo wyznaczenia takiego przedziału, że rzeczywista wartość parametru θ w populacji znajdzie się w tym przedziale. Im większa wartość tego współczynnika, tym szerszy przedział ufności, a więc mniejsza dokładność estymacji parametru. Im mniejsza wartość 1 - α, tym większa dokładność estymacji, ale jednocześnie tym węższy przedział ufności.

Przedział ufności

Współczynnik ufności 1-a:

Wybór odpowiedniego współczynnika jest więc kompromisem pomiędzy dokładnością estymacji a ryzykiem błędu. W praktyce przyjmuje się zazwyczaj wartości 1-a:

0,99; 0,95 lub 0,90 WTEDY a (poziom ufności):

0,01; 0,05; 0,1

Przedział ufności

Współczynnik ufności 1-a:

0,95 oznacza to, że średnio na każde 100 przedziałów ustalonych na 100 prób losowych, w 95 przypadkach prawdziwa wartość parametru znajduje się wewnątrz przedziału, natomiast w 5 przypadkach znajduje się poza przedziałem

Przedział ufności

Ponieważ szukamy jak najkrótszych przedziałów ufności, to przy wyznaczaniu przedziału staramy się wykorzystać jak najwięcej dostępnych informacji o rozkładzie cechy w populacji.

Przedział ufności

• Najlepiej, gdy zmienna ma rozkład normalny z odchyleniem standardowym σ – wzór na najdokładniejszy przedział ufności

• Przy nieznanym σ – wzór wtedy stosowany daje przedział szerszy, czyli mniej dokładny

• Wzory ogólniejsze, np. dla nieznanego rozkładu, często korzystają z rozkładów granicznych estymatorów i dlatego wymagają dużej liczebności próby.

Przedział ufności

POPULACJA GENERALNA

Próba

𝑥 ,𝜎

Przedział ufności

Przedział ufności dla średniej

Znane odchylenie standardowe

populacji

Nieznane odchylenie standardowe populacji

+ mała próba (n30)

Nieznane odchylenie

standardowe + duża próba (n>30)

Przedział ufności

populacji

Nieznane odchylenie

Przedział ufności Przedział ufności dla średniej

Cecha ma w populacji rozkład normalny N(m,), przy czym odchylenie standardowe populacji jest znane:

gdzie: n - liczebność próby losowej - oznacza średnią z próby losowej σ - odchylenie standardowe populacji uα - statystyka, spełniającą warunek: P( − uα < U < uα) = 1 − α, gdzie U jest zmienną losową o rozkładzie normalnym N(0,1). CZYLI kwantyl rozkładu N(0,1) rzędu

𝑃 𝑥 − 𝑢𝛼 ∙𝜎

𝑛< 𝜇 < 𝑥 − 𝑢𝛼 ∙

𝑛 = 1 − 𝛼

𝑛< 𝜇 < 𝑥 − 𝑢𝛼 ∙

𝑛 = 1 − 𝛼

1 −𝛼

P( − uα < U < uα) = 1 − α, gdzie U jest zmienną losową o rozkładzie normalnym N(0,1). CZYLI ua to kwantyl rozkładu N(0,1) rzędu

1 −𝛼

Niech a=0,05

P( − u0,05 < U < u0,05) = 1 − 0,05 = 0,95

Jak znaleźć ua?

P( − u0,05 < U < u0,05) = 1 − 0,05 = 0,95

P(u<ua) = 1-a/2 = 1-0,05/2 = 1-0,025 = 0,975

P(u<ua) = P(-<u<ua) = F(ua) – F(-) = F(ua)

gdzie: n - liczebność próby losowej - oznacza średnią z próby losowej σ - odchylenie standardowe populacji uα - kwantyl rozkładu N(0,1) rzędu

𝑛< 𝜇 < 𝑥 − 𝑢𝛼 ∙

𝑛 = 1 − 𝛼

1 −𝛼

𝜇 = 𝑥 ± 𝑢𝛼 ∙𝜎

Taka sytuacja występuje bardzo rzadko (musieli byśmy zbadać CAŁĄ populację generalną)

Przedział ufności

populacji

Nieznane odchylenie

Cecha ma w populacji rozkład normalny N(m,), przy czym odchylenie standardowe jest nieznane a znamy tylko odchylenie stand, próbki (n30):

gdzie: n - liczebność próby losowej X - średnia z próby losowej σ - odchylenie standardowe z próby t(a,f) – kwantyl rzędu 1 - a/2 rozkładu t-studenta z df=f=n-1 stopniami swobody

𝑃 𝑥 − 𝑡 𝛼,𝑓 ∙𝜎

𝑛 − 1< 𝜇 < 𝑥 + 𝑡(𝛼,𝑓) ∙

𝑛 − 1 = 1 − 𝛼

Cecha ma w populacji rozkład normalny N(m,), przy czym odchylenie standardowe jest nieznane a znamy tylko odchylenie stand, próbki (n30):

gdzie: n - liczebność próby losowej X - średnia z próby losowej σ - odchylenie standardowe z próby t(a,f) – kwantyl rzędu 1 - a/2 rozkładu t-studenta z df=f=n-1 stopniami swobody

𝜇 = 𝑥 ± 𝑡(𝑃 = 1 − 𝛼,𝑓) ∙𝜎

𝑛 − 1

Do obliczeń wykorzystujemy tablice t-studenta dla danego a i f=df=n-1

𝜇 = 𝑥 ± 𝑡(𝑃 = 1 − 𝛼,𝑓) ∙𝜎

𝑛 − 1

Zwykle stosuje się ten wzór dla małej próby (n<30). Tak naprawdę działa on dla każdej wielkości próby, jednak dla dużych prób można przybliżyć rozkład t Studenta rozkładem normalnym, co jest łatwiejsze do wyliczenia a dające niemal takie same wartości

Przedział ufności

populacji

Nieznane odchylenie

Cecha ma w populacji rozkład normalny N(m,), przy czym odchylenie standardowe jest nieznane (znamy tylko próby) a próba jest duża (n>30):

gdzie: n - liczebność próby losowej X - oznacza średnią z próby losowej σ - odchylenie standardowe z próby ua - kwantyl rzędu 1 – a/2 standaryzowanego rozkładu normalnego N(0,1)

𝑛< 𝜇 < 𝑥 + 𝑢𝛼 ∙

𝑛 = 1 − 𝛼

Cecha ma w populacji rozkład normalny N(m,), przy czym odchylenie standardowe jest nieznane (znamy tylko próby) a próba jest duża (n>30):

Czyli: 𝜇 = 𝑥 ± 𝑢(𝑃 = 1 − 𝛼) ∙ 𝜎 𝑥

gdzie: n - liczebność próby losowej X - oznacza średnią z próby losowej – błąd standardowy średniej u(P=1-a) - kwantyl rzędu 1 – a/2 standaryzowanego rozkładu normalnego N(0,1)

𝜇 = 𝑥 ± 𝑢(𝑃 = 1 − 𝛼) ∙ 𝜎 𝑥

Do obliczeń wykorzystujemy tablice t-studenta dla danego a i f=df=

Rozkład chi-kwadrat

Definicja zmiennej losowej 2

Gdy Xi są zmiennymi losowymi losowanymi z rozkładu normalnego N(0,1), to ma rozkład chi-kwadrat o f stopniach swobody. Gdy losowanie odbywa się z rozkładu normalnego N(m,), to:

1 parametr rozkładu: f=n-1 (liczba stopni swobody)

Definicja zmiennej losowej 2

xdlaexkxf

- funkcja gamma Eulera f – liczba stopni swobody

f<2 - funkcja jest malejącą dla x>0, f>2 - funkcja ma maksimum przy x=f – 2 Dla dużych f funkcja jest zbliżona do krzywej rozkładu normalnego

Przedział ufności

Przedział ufności dla wariancji

Mała próba n30 Duża próba n>30

Przedział ufności

Mała próba n<30 Duża próba n>30

Przedział ufności

Cecha ma w populacji rozkład normalny N(m,), a n30:

gdzie: n - liczebność próby losowej σ - odchylenie standardowe z próby kwantyle rzędu a/2 i 1-a/2 rozkładu 2 z f=df=n-1 stopniami swobody

2 ˆ2ˆ

Przedział ufności

𝜎2𝑑 =

𝑛 ∙ 𝜎 2

𝜒2(𝑃 = 1 − 𝛼,𝑓 = 𝑛 − 1)

Czyli:

𝜎2𝑔 =

𝑛 ∙ 𝜎 2

𝜒2(1 − 𝑃,𝑓 = 𝑛 − 1)

Przedział ufności

Do obliczeń wykorzystujemy tablice wartości krytycznych rozkładu chi-kwadrat dla danego a i f=df=n-1

Przedział ufności

Przedział ufności dla odchylenia standardowego

Cecha ma w populacji rozkład normalny N(m,), a n30:

2 ˆˆ

Przedział ufności

Mała próba n<30 Duża próba n>30

Przedział ufności

Przedział ufności dla odch. stand, (wariancji)

Cecha ma w populacji rozkład normalny N(m,), a n>30:

gdzie: n - liczebność próby losowej σ - odchylenie standardowe z próby uα – kwantyl rzędu 1-a/2 standaryzowanego rozkładu normalnego N(0,1)

Przedział ufności

Do obliczeń wykorzystujemy tablice t-studenta dla danego a i f=df=

Przedział ufności dla odch. stand, (wariancji)

Rozkłady zmiennych losowych -...

Transcript of Rozkłady zmiennych losowych -...

Rozkłady zmiennych losowych -...

Documents

Transcript of Rozkłady zmiennych losowych -...

zintegrowane rozkłady jazdy - ikolej.pl · Plan seminarium 1. Kształtowanie stabilnej oferty przewozowej Krajowy zintegrowany rozkład jazdy pociągów Piotr Chyliński 2. Ocena

P.D.Uspieński - Fragmenty Nieznanego Nauczania

„Świąteczne zabawy” kl - · PDF filestego miejsca dla nieznanego gościa. 5. ... Każda grupa ma 1 inny rebus – nazwa potrawy wigilijnej, po rozwiązaniu dzieci przyczepiają

październik 2015za zdjęcie grobu nieznanego mężczyzny z lasów piaśnickich REGIONALNY OŚRODEK DEBATY MIĘDZYNARODOWEJ w GDAŃSKU NEWSLETTER NR 24 PAŹDZIERNIK 2015 STRONA 14

DZIEDZICTWO KULTUROWE AKSJOLOGIA, OCHRONA, … file* ochrona zabytków na wypadek zdarzeń losowych, przestępczości, sytuacji kryzysowych, konfliktów zbrojnych * dawny i współczesny

KRYTERIA OCENIANIA Z CHEMII - spolesno.plspolesno.pl/wp-content/kryteria/chemia.pdf · sprawdzian z przyczyn losowych, powinien go napisać w terminie nie przekraczającym 2 tygodnie

MOŻLIWOŚCI PRZEWOZU ŁADUNKÓW ODRZAŃSKĄ DROGĄ … · PROBABILISTYKA –nauka kojarząca statystykę z z wyznaczaniem prawdopodobieństwa zdarzeń losowych. Port Szczecin Port

Rozkłady wywodzące się z rozkładu normalnego standardowego

Stabilne rozkłady L évy'ego (Lévy Flights)

Zrozumieć prawdopodobieństwo - ldc.edu.pl · obliczać prawdopodobieństwa zdarzeń losowych na podstawie twierdzenia oprawdopodobieństwie klasycznym Wiedza i umiejętności wejściowe

Ryszard Tanaśzon8.physd.amu.edu.pl/~tanas/krypt11.pdf · 16 Zarządzanie kluczami 16.1 Generowanie kluczy • Do generowania kluczy najlepiej nadają się generatory ciągów losowych.

Generator liczb losowych a bezpieczeństwo w sieci

Wyszukiwanie informacji w Internecie · Wyszukiwanie informacji w Internecie informacje praktyczne dla każdego Cz. 1. Pociągi, autobusy, tramwaje – sprawdzamy rozkłady jazdy

Podstawowe struktury danych Tablice, macierzestaff.iiar.pwr.wroc.pl/piotr.ciskowski/dydaktyka/... · • wygeneruj rzadką macierz liczb losowych z rozkładu normalnego o wymiarach

„Wstań i chodź”. Z nieznanego pamiętnika wojewody Ostrowskiego · Pamiętnik wraz z aneksami zajmuje 221 stron folio ... — Pani przysięga spełniona, jestem zdrów, więc

UCZNIÓW WOJEWÓDZTWA ŚWIĘTOKRZYSKIEGO - OKE … · GH_2. Rozkłady wyników ... uczeń wybierał jedną z podanych odpowiedzi, ... Rzeczpospolita Obojga Narodów i jej sąsiedzi

ortorium kutury 112 - laboratoriumkultury.us.edu.pllaboratoriumkultury.us.edu.pl/wp-content/uploads/2013/01/LK_01... · Swój i obcy czy swój-obcy? O poznawaniu nieznanego i wyobcowywaniu

EGZAMIN POTWIERDZAJCY KWALIFIKACJE ZAWODOWEsosw.swiebodzin.pl/Nauka_zdalna/Zawodowe/test_zawodowy... · 2020. 3. 24. · Generator losowych testów zawodowych on-line . wersja: KIS1C2PF.

Wykład 4. Rozkłady teoretyczne

UCZNIÓW WOJEWÓDZTWA ŁÓDZKIEGO - OKE Łódź ...komisja.pl/pobierz/gimnazjum/2013/spr_gimn_2013_l.pdf · GH_2. Rozkłady wyników ... wybierał jedną z podanych odpowiedzi, ...