Post on 27-Feb-2019
2015-03-23
1
dr hab.inż. Katarzyna Zakrzewska, prof.AGH Katedra Elektroniki, AGHe-mail: zak@agh.edu.pl
http://home.agh.edu.pl/~zak
Wykład 1.Wstęp
Wstęp do probabilistyki i statystyki
Wstęp do probabilistyki i statystyki. wykład 1 1
Literatura:
● D.C. Montgomery, G.C. Runger, Applied Statistics and Probability for
Engineers, Third Edition, J. Wiley & Sons, 2003
● A. Plucińska, E. Pluciński, Probabilistyka, rachunek
prawdopodobieństwa, statystyka matematyczna, procesy
stochastyczne, WNT, 2000
● J. Jakubowski, R. Sztencel, Wstęp do teorii prawdopodobieństwa,
SCRIPT, 2000
● M. Sobczyk, Statystyka, Wydawnictwo C.H. Beck, Warszawa 2010
● A. Zięba, Analiza danych w naukach ścisłych i technice, PWN,
Warszawa 2013, 2014
Wstęp do probabilistyki i statystyki. wykład 1 2
2015-03-23
2
Plan
● Przedmiot probabilistyki i statystyki
● Rys historyczny
● Paradoks kawalera de Méré
● Statystyka - typy danych i pojęcie zmiennej losowej
● Graficzna prezentacja danych
● Znaczenie rachunku prawdopodobieństwa i statystyki
w nauce i problemach inżynierskich
Wstęp do probabilistyki i statystyki. wykład 1 3
Czym zajmuje się probabilistyka i statystyka?
Wstęp do probabilistyki i statystyki. wykład 1 4
Teoria prawdopodobieństwa (także rachunek prawdopodobieństwa lub probabilistyka) – dział matematykizajmujący się zdarzeniami losowymi. Zdarzenie losowe to wynik doświadczenia losowego.
Doświadczenie losowe może być powtarzane dowolnie wiele razy w warunkach identycznych lub bardzo zbliżonych a jego wynik nie daje się przewidzieć jednoznacznie.
Ll – oznacza ile razy zaszło dane zdarzenie gdy doświadczenie powtarzano n razy
Prawidłowość statystyczna – przy coraz większej liczbie doświadczeń losowych częstość zdarzenia dąży do pewnej stałej liczby
2015-03-23
3
Czym zajmuje się probabilistyka i statystyka?
Statystyka zajmuje się metodami zbierania informacji(liczbowych) oraz ich analizą i interpretacją.
Wstęp do probabilistyki i statystyki. wykład 1 5
• Rachunek prawdopodobieństwa zajmuje się badaniem abstrakcyjnych pojęć matematycznych stworzonych do opisu zjawisk, które nie są deterministyczne:
1. zmiennych losowych w przypadku pojedynczych zdarzeń oraz2. procesów stochastycznych w przypadku zdarzeń
powtarzających się (w czasie). • Jako matematyczny fundament statystyki, teoria
prawdopodobieństwa odgrywa istotną rolę w sytuacjach, w których konieczna jest analiza dużych zbiorów danych.
Jednym z największych osiągnięć fizyki dwudziestego wieku było odkrycie probabilistycznej natury zjawisk fizycznych w skali mikroskopowej, co zaowocowało powstaniem mechaniki kwantowej.
Statystyka
OPISOWA ANALIZA DANYCH(DESCRIPTIVE STATISTICS)
●Organizacja danych●Podsumowanie danych●Prezentacja danych
DEDUKCYJNA – MODELOWANIE STOCHASTYCZNE( STATISTICAL INFERENCE)
Podaje metody formułowania wniosków dotyczące obiektu badań (populacji generalnej) w oparciu o mniej liczny zbiór (próbę)
GRAFICZNA NUMERYCZNA
Wstęp do probabilistyki i statystyki. wykład 1 6
Czym zajmuje się probabilistyka i statystyka?
2015-03-23
4
Rys historyczny
Wstęp do probabilistyki i statystyki. wykład 1 7
• Matematyczna teoria prawdopodobieństwa sięga swoimi korzeniami do analizy gier losowych podjętej w siedemnastym wieku przez Pierre de Fermata oraz Blaise Pascala.
• Z tego powodu, początkowo teoria prawdopodobieństwa zajmowała się niemal wyłącznie zjawiskami dyskretnymi i używała metod kombinatorycznych. Zmienne ciągłezostały wprowadzone do teorii prawdopodobieństwa znacznie później.
• Za początek stworzenia współczesnej teorii prawdopodobieństwa powszechnie uważa się jej aksjomatyzację, której w 1933 dokonał Andriej Kołmogorow.
Hazard
Zdecydowana większość gier losowych opiera się na prawdopodobieństwie zdarzenia...
...oraz może być pod tym kątem analizowana.
●Prawdopodobieństwo trafienia „oczka”●Ilość unikatowych rozdań w pokerze
...najprostszy,jak rzut monetą, ...
...całkowicie losowy jak ruletka...
...złożony, jak rozdanie pokera...
Wstęp do probabilistyki i statystyki. wykład 1 8
2015-03-23
5
Rys historyczny
Blaise Pascal (1601-1662)
XVII w. , Paryż, Francja
Unieśmiertelnił kawalera de Méréoraz jego paradoks hazardowy
„Trójkąt Pascala” wykorzystywany przy potędze sumy
Wstęp do probabilistyki i statystyki. wykład 1 9
knkn
k
n bakn
ba −
=⎟⎟⎠
⎞⎜⎜⎝
⎛=+ ∑
0)(
dwumian Newtona
Trójkąt Pascala
Wstęp do probabilistyki i statystyki. wykład 1 10
166
656
1546
2036
1526
616
106
6
155
545
1035
1025
515
105
5
144
434
624
414
104
4
133
323
313
103
3
122
212
102
2
111
101
1
100
0
=⎟⎟⎠
⎞⎜⎜⎝
⎛=⎟⎟
⎠
⎞⎜⎜⎝
⎛=⎟⎟
⎠
⎞⎜⎜⎝
⎛=⎟⎟
⎠
⎞⎜⎜⎝
⎛=⎟⎟
⎠
⎞⎜⎜⎝
⎛=⎟⎟
⎠
⎞⎜⎜⎝
⎛=⎟⎟
⎠
⎞⎜⎜⎝
⎛=
=⎟⎟⎠
⎞⎜⎜⎝
⎛=⎟⎟
⎠
⎞⎜⎜⎝
⎛=⎟⎟
⎠
⎞⎜⎜⎝
⎛=⎟⎟
⎠
⎞⎜⎜⎝
⎛=⎟⎟
⎠
⎞⎜⎜⎝
⎛=⎟⎟
⎠
⎞⎜⎜⎝
⎛=
=⎟⎟⎠
⎞⎜⎜⎝
⎛=⎟⎟
⎠
⎞⎜⎜⎝
⎛=⎟⎟
⎠
⎞⎜⎜⎝
⎛=⎟⎟
⎠
⎞⎜⎜⎝
⎛=⎟⎟
⎠
⎞⎜⎜⎝
⎛=
=⎟⎟⎠
⎞⎜⎜⎝
⎛=⎟⎟
⎠
⎞⎜⎜⎝
⎛=⎟⎟
⎠
⎞⎜⎜⎝
⎛=⎟⎟
⎠
⎞⎜⎜⎝
⎛=
=⎟⎟⎠
⎞⎜⎜⎝
⎛=⎟⎟
⎠
⎞⎜⎜⎝
⎛=⎟⎟
⎠
⎞⎜⎜⎝
⎛=
=⎟⎟⎠
⎞⎜⎜⎝
⎛=⎟⎟
⎠
⎞⎜⎜⎝
⎛=
=⎟⎟⎠
⎞⎜⎜⎝
⎛=
n
n
n
n
n
n
n
!!)(!
kknn
kn
−=⎟⎟
⎠
⎞⎜⎜⎝
⎛Symbol
2015-03-23
6
Trójkąt Pascala
11 1
1 2 11 3 3 1
1 4 6 4 11 5 10 10 5 1
1 6 15 20 15 6 1
Wstęp do probabilistyki i statystyki. wykład 1 11
n = 0
n = 1
n = 2
n = 3
n = 4
n = 5
n = 6
+
Pierre de Fermat (1601-1665)
Początek XVII w., Touluse, Francja
Badał właściwości liczb pierwszych, teorię liczb, równolegle opracował metodę współrzędnych w geometrii. Razem z Pascalem stworzył podstawy pod współczesny rachunek prawdopodobieństwa.
Rys historyczny
Wstęp do probabilistyki i statystyki. wykład 1 12
2015-03-23
7
Siméon Denis Poisson (1781-1840)
XVIII-XIX w., Paryż, Francja
Przyjaciel Lagrange'a, uczeń Laplace'a na sławnej École Polytechnique.
Poza zagadnieniami fizycznymi zajmował się teorią prawdopodobieństwa.
Proces stochastyczny (podobnie jak pr. Markowa), rozkład Poissona -dystrybuanta!
Rys historyczny
Wstęp do probabilistyki i statystyki. wykład 1 13
Carl Frederich Gauss (1777-1855)
XVIII-XIX w., Getynga, Niemcy
Profesor Uniwersytetu w Getyndze
Genialny matematyk, który już w dzieciństwie wyprzedzał umiejętnościami rówieśników. W szkole podstawowej jako jedyny rozwiązał zadanie nauczyciela - zsumowanie liczb 1 do 40 –zauważając, że jest to (40+1)*20
Rozkład normalny, zwany krzywą Gaussa
Rys historyczny
Wstęp do probabilistyki i statystyki. wykład 1 14
2015-03-23
8
Paradoks kawalera de Méré
Dwaj hazardziści S1 i S2 umawiają się, że zagrają pewną serię partii i że zwycięzcą będzie ten, kto pierwszy wygra pięć partii.
Wstęp do probabilistyki i statystyki. wykład 1 15
Co należy zrobić, gdy trzeba będzie grę przedwcześnie przerwać?
Załóżmy, że S1 wygrywa cztery partie, a S2 tylko trzy. Jak sprawiedliwie podzielić stawki?Propozycja 1: podzielić stawki w stosunku 4:3
Propozycja 2: podzielić stawki w stosunku (5-3):(5-4)=2:1
wg W.R. Fuchs, Matematyka popularna, Wiedza Powszechna, Warszawa 1972
Paradoks kawalera de Méré
Blaise Pascal rozwiązał zadanie rozumując bardzo prosto. Aby rozstrzygnąć grę, należy zagrać jeszcze najwyżej dwie partie.
Wstęp do probabilistyki i statystyki. wykład 1 16
Jeżeli pierwszą partię wygra S1, to gra będzie rozstrzygnięta od razu.
Gdy pierwszą partię wygra S2, to wygranie drugiej partii przez S1przesądziłoby grę na jego korzyść.
Jednak jeśli pozostałe dwie partie wygra S2 to on zostanie zwycięzcą. Zatem sprawiedliwy podział stawki to 3:1
2015-03-23
9
Statystyka - typy danych
ILOŚCIOWE(QUANTITATIVE, NUMERICAL)
Przykłady:●Zbiór ludzi●Wiek●Wzrost●Wysokość zarobków
Obliczenia pewnych parametrów, jak np. średnia arytmetyczna, mediana, ekstrema, mają sens
JAKOŚCIOWE(QUALITATIVE, CATEGORIAL)
Przykłady:PłećStan cywilny
Można przypisać różnym cechom arbitralne wartości liczbowe.
Obliczenia parametrów nie mają sensu, można jedynie podawać np. udział procentowy
Wstęp do probabilistyki i statystyki. wykład 1 17
Pojęcie zmiennej losowej
RxeXRXee
ii ∈=→Ω
=Ω
)(:
},,{ 21 K
Zmienna losowa jest to funkcja X, która przypisuje liczbę rzeczywistą x danemu wynikowi eksperymentu losowego.
Przykłady: 1) Rzut monetą: zdarzeniu ‘orzeł’ przypisujemy 1; zdarzeniu reszka
przypisujemy 0.2) Analog. losowanie wyrobów: zdarzeniu ‘brak’ (wadliwy) - 0, dobry – 13) Rzut kostką wyrzucenie ‘1’ – 1, ‘2’ – 2 itd…4) Odcinek [a, b] na osi liczbowej – wybór punktu o współrzędnej ‘x’
przypisujemy np. wartość x ; wartość sin2(3x+17) itp.…
Wstęp do probabilistyki i statystyki. wykład 1 18
2015-03-23
10
Zmienna losowa
dyskretna
Gdy wartości zmiennej losowej X są izolowanymi punktami na osi liczbowej (obejmują skończonyprzedział wartości)
• Rzut monetą• Błędy przy transmisji• Wadliwe układy na linii produkcyjnej• Ilość połączeń przychodzących w
ciągu 5 minut
ciągła
Gdy wartości zmiennej losowej stanowią wszystkie punkty odcinka(obejmują przedziałliczb rzeczywistych)
• Natężenie prądu w przewodniku• Temperatura• Ciśnienie
Wstęp do probabilistyki i statystyki. wykład 1 19
Graficzna prezentacja danych
Dane statystyczne można prezentować na wiele sposobów, np. częstość występowania danej cechy
x Ilość wystąpień Częstotliwość
1 3 3/23 = 0,1304
2 5 5/23 = 0,2174
3 10 10/23 = 0,4348
4 4 4/23 = 0,1739
5 1 1/23 = 0,0435
Razem: 23 1,0000
Wstęp do probabilistyki i statystyki. wykład 1 20
2015-03-23
11
Graficzna prezentacja danych
Wstęp do probabilistyki i statystyki. wykład 1 21
13%
22%
44%
17%
4%
Wykres kołowy1 2 3 4 5
1 0,13043478
2 0,2173913
3 0,43
4 0,17391
5 0,04347826
graf1
Graficzna prezentacja danych
Wstęp do probabilistyki i statystyki. wykład 1 22
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
0,45
1 2 3 4 5
Wykres kolumnowy
Serie1
1 0,13043478
2 0,2173913
3 0,43
4 0,17391
5 0,04347826
2015-03-23
12
Dane ilościowe
Wyniki 34 pomiarów (np. wielkość ziaren w [nm], temperatura w kolejnych dniach o godz. 11:00 w [deg. C], czas rozmów telefonicznych w [min], itp.
3,6 13,2 12 12,8 13,5 15,2 4,8
12,3 9,1 16,6 15,3 11,7 6,2 9,4
6,2 6,2 15,3 8 8,2 6,2 6,3
12,1 8,4 14,5 16,6 19,3 15,3 19,2
6,5 10,4 11,2 7,2 6,2 2,3
Tak podane wartości są mało czytelne!
Wstęp do probabilistyki i statystyki. wykład 1 23
Histogram
Sporządzenie wykresu (histogramu):1. Uporządkować zbiór wg. rosnących (lub malejących) wartości –
program Excel ma taką opcję.
2. Wyniki próby (o liczebności n) stanowią zbiór n-liczb (niekoniecznie różniących się od siebie). Celem ich ilustracji dzieli się je na klasy, tworząc tzn. szereg rozdzielczy.
3. Szerokość poszczególnych klas nie musi być taka sama, choć zwykle stosuje się klasy o tej samej szerokości
4. Ilość klas nie może być zbyt mała ani też zbyt liczna. Najbardziej optymalną liczbę klas 'k' określa reguła Sturge'a.
Wstęp do probabilistyki i statystyki. wykład 1 24
2015-03-23
13
Histogram
0 2 8 14 200
2
4
6
8
10
12
14
16
3 klasy
x
Czę
stość
bezw
ględ
na
Wstęp do probabilistyki i statystyki. wykład 1 25
Histogram
0 2 3,5 5 6,5 8 9,5 11 12,5 14 15,5 17 18,5 200
1
2
3
4
5
6
7
8
12 klas
x
Czę
stość
bezw
zglę
dna
Wstęp do probabilistyki i statystyki. wykład 1 26
2015-03-23
14
Histogram
0 2 2,5 3 3,5 4 4,5 5 5,5 6 6,5 7 7,5 8 8,5 9 9,5 10 10,5 11 11,5 12 12,5 13 13,5 14 14,5 15 15,5 16 16,5 17 17,5 18 18,5 19 19,50
1
2
3
4
5
6
7
8
35 klas
x
Czę
stość
bezw
zglę
dna
Wstęp do probabilistyki i statystyki. wykład 1 27
Reguła Sturge'a
k=1+3,3log10 n
n= 34k=5. 59≈ 6Dla naszego przykładu:
Liczebność próbki, n Liczba klas, k< 50 5 – 7
50 – 200 7 – 9200 – 500 9 – 10500 – 1000 10 -11
1000 – 5000 11 – 135000 – 50000 13 – 17
50000 < 17 – 20
Wstęp do probabilistyki i statystyki. wykład 1 28
2015-03-23
15
Histogram optymalny
0 2 5 8 11 14 17 200
0,05
0,1
0,15
0,2
0,25
0,3
6 klas (optymalnie)
x
Czę
stość
wzg
lędn
a
Wstęp do probabilistyki i statystyki. wykład 1 29
Rachunek prawdopodobieństwa i statystyka w nauce i technice
Statystyka umożliwia analizę i modelowanie rozwoju chorób oraz pomaga zapobiegać epidemiom.
Statystyka medyczna, np. średnia liczba zachorowań w regionie
Statystyka społeczna, np. gęstość zaludnienia
Statystyka gospodarcza, np. PKB, wydatki na opiekę zdrowotną
Liczba zachorowań na świńską grypę w roku 2009 w USA(Źródło: http://commons.wikimedia.org)
Wstęp do probabilistyki i statystyki. wykład 1 30
2015-03-23
16
Meteorologia
Modele pogodowe umożliwiające przewidywanie pogody oraz wykrywanie potencjalnych kataklizmów, np. huraganów
(Źródło:stormdebris.net/Math_Forecasting.html)
Wstęp do probabilistyki i statystyki. wykład 1 31
Wstęp do probabilistyki i statystyki. wykład 1 32
Opis problemu
Identyfikacja najważ-niejszychczynników
Przeprowadzenie eksperymentów
Propozycja modelu
Modyfikacja modelu
Potwierdzenierozwiązania
Wnioski i rekomendacje
Jak rozwiązuje się problem inżynierski?
2015-03-23
17
33
Przykład: Załóżmy, że inżynier projektuje przewód paliwowy,który ma zastosowanie w silnikach samochodowych. Inżynierwybiera grubość ściany 3/32 cale ale nie jest pewny czy to jestwystarczające dla uzyskania odpowiedniej siły ciągu.
Jak rozwiązuje się problem inżynierski?
Opis problemu
Identyfikacja najważniejszych czynników
Wyprodukowano osiem elementów, dla których zmierzono siły ciągu i otrzymano następujące wartości (w funtach): 12.6, 12.9, 13.4, 12.3, 13.6, 13.5, 12.6, 13.1. Siła ciągu może być traktowana jako zmienna losowa.
Wstęp do probabilistyki i statystyki. wykład 1
34Wstęp do probabilistyki i statystyki. wykład 1
Jak rozwiązuje się problem inżynierski?
Propozycja modelu
Przyjmijmy model, w którym zmienna losowa X jest przedstawiona jako:
Stała wartość Zaburzenie (błąd, szum)
Stała µ nie zmienia się przy kolejnych pomiarach. Małe zmiany w otoczeniu, układzie pomiarowym, różnice obserwowane dla obiektu mierzonego wpływają na wartość zaburzenia ε. W świecie rzeczywistym zawsze istnieją czynniki prowadzące do niezerowego zaburzenia. Musimy je opisać w sposób ilościowy i znaleźć sposób na ograniczenie ich wpływu na wynik pomiaru.
2015-03-23
18
35
Rysunek 1-2 przedstawia uzyskane wyniki w postaci diagramu punktowego (dot diagram).
Diagramy tego typu są użyteczne dla małej ilości danych (do ok. 20 obserwacji).
Wykresy tego typu pozwalają ocenić położenie (środek) i rozproszenie (rozrzut)
Średnia wartość siły ciągu wynosi 13.0 funtów.
Wstęp do probabilistyki i statystyki. wykład 1
Jak rozwiązuje się problem inżynierski?
Przeprowadzenie eksperymentów
36
Inżynier zmienia grubość ściany do 1/8 cali zakładając, że pomoże to zwiększyć siłę ciągu. Znowu zbudowano 8 prototypów, przeprowadzono eksperymenty i otrzymano wyniki siły ciągu: 12.9, 13.7, 12.8, 13.9, 14.2, 13.2, 13.5, 13.1. Wyniki, w porównaniu z poprzednim eksperymentem, zestawiono na Rys. 1-3.
.
Średnia wartość siły ciągu wynosi 13.4 funty.
Wstęp do probabilistyki i statystyki. wykład 1
Jak rozwiązuje się problem inżynierski?
Modyfikacja (udoskonalenie) modelu
2015-03-23
19
37
Wykres stwarza wrażenie, że zwiększenie grubości ściany prowadzi do wzrostu siły ciągu.
Wstęp do probabilistyki i statystyki. wykład 1
Jak rozwiązuje się problem inżynierski?
Potwierdzenie rozwiązania?
Jednak, pozostaje pytanie czy jest tak istotnie?
38Wstęp do probabilistyki i statystyki. wykład 1
Jak rozwiązuje się problem inżynierski?
Statystyka pomoże nam udzielić odpowiedzi na pytania:
• Skąd pewność, że inna próbka elementów nie da innych wyników?
• Czy próbka 8-elementowa jest wystarczająca aby dać wyniki, którym można ufać?
• Jeżeli użyjemy wyników, które do tej pory otrzymaliśmy, aby sformułować wniosek (decyzja), że wzrost grubości ściany jest korzystny, jak oszacować ryzyko z tym związane?
• Czy jest możliwe, że pozorny wzrost siły ciągu obserwowany dla grubszych elementów ma charakter jedynie losowy? Może nie ma sensu zwiększanie grubości ścian (powiększanie kosztów produkcji)?
Wnioski (rekomendacje?)
2015-03-23
20
http://physics.nist./gov/Uncertainty
Wyrażanie Niepewności Pomiaru. Przewodnik. Warszawa, Główny Urząd Miar 1999
H. Szydłowski, Pracownia fizyczna, PWN Warszawa 1999
A.Zięba, Postępy Fizyki, tom 52, zeszyt 5, 2001, str.238-247
A.Zięba, Pracownia Fizyczna WFiTJ, Skrypt Uczelniany SU 1642, Kraków 2002
Międzynarodowa Norma Oceny Niepewności Pomiaru (Guideto Expression of Uncertainty in Measurements-Międzynarodowa Organizacja Normalizacyjna ISO)
Wstęp do probabilistyki i statystyki. wykład 1 39
Rachunek niepewności pomiaru
POMIAR
Pomiary w laboratorium można podzielić napomiary wielkości:
prostychzłożonych
Przykład 1: Pomiar długości nici przymiarem metrowym, pomiarokresu drgań wahadła – pomiary wielkości prostych – pomiarybezpośrednieWyznaczanie przyspieszenia ziemskiego na podstawie wzoru
- pomiar wielkości złożonej
gl2T π=
Wstęp do probabilistyki i statystyki. wykład 1 40
2015-03-23
21
W trakcie pomiaru uzyskujemy wartości różniące się odprzewidywań teorii. Źródłem rozbieżności między teorią ieksperymentem są niedoskonałości:-osoby wykonującej pomiar,-przyrządów pomiarowych,-obiektów mierzonych
Gdy doświadczenie staje się doskonalsze, rozbieżności temaleją. Maleje błąd pomiaru, niepewność pomiaru.
POMIAR
Wstęp do probabilistyki i statystyki. wykład 1 41
Wynik pomiaru jest zawsze obarczony błędem ipo przeprowadzeniu odpowiedniej analizybłędów podajemy go w jednej z następującychpostaci:
2s/m)28(866,9g =
C10)398(F 3⋅±=
Przykład 2: Załóżmy, że przy wyznaczaniu równoważnika elektrochemicznego pewnego pierwiastka uzyskaliśmy następujące liczby:
k=0,0010963 g/C
Δk=0,0000347 g/C
Jak podać wynik?
cyfry znaczące cyfry nieznaczące
Odp. k= (0,00110 ± 0,00004) g/C lub k= 0,00110(4) g/C Wstęp do probabilistyki i statystyki. wykład 1 42
2015-03-23
22
Błąd bezwzględny pojedynczego pomiaru:
xi – wartość zmierzona, x0 – wartość rzeczywista
Błąd względny:
0ii xxx −=Δ
0
i
xxΔ
=δ
(1)
(2)
Niepewność a błąd pomiaru
Uwaga: wartości rzeczywiście wielkości mierzonej zazwyczaj nie są znane
Wstęp do probabilistyki i statystyki. wykład 1 43
Niepewność pomiaru
Wielkości określone wzorami (1) i (2) są pojedyncząrealizacją zmiennej losowej i nie wchodzą do teoriiniepewności. W praktyce nie znamy wartości rzeczywistychwielkości mierzonych i szacujemy niepewnościpomiarowe wynikające ze statystycznych praw rozrzutupomiarów.
Niepewność pomiaru jest• związanym z rezultatem pomiaru parametrem,• charakteryzującym rozrzut wyników, który można• w uzasadniony sposób przypisać wartości mierzonej.
Wstęp do probabilistyki i statystyki. wykład 1 44
2015-03-23
23
Niepewność u (ang. uncertainty) posiada wymiar, taki sam jak wielkość mierzona
Symbolika: u lub u(x) lub u(stężenie NaCl)
Niepewność względna ur(x) to stosunek niepewności (bezwzględnej) do wielkości
mierzonej:
xxuxur)()( =
Niepewność względna jest wielkością bezwymiarową i może być wyrażona w %
Wstęp do probabilistyki i statystyki. wykład 1 45
Miary niepewności
Istnieją dwie miary niepewności pomiaru:niepewność standardowa u(x)
niepewność maksymalna ∆x
x0
x
x0-u(x) x0+u(x)
x0-Δx x0+Δx
Wstęp do probabilistyki i statystyki. wykład 1 46
2015-03-23
24
Niepewność standardowa
Jest miarą dokładności pomiaru najpowszechniej stosowaną i uznawaną obecnie za podstawową.
1. Rezultat pomiaru jest zmienną losową xi , której rozrzut wokół wartości średniej x charakteryzuje parametr zwany odchyleniem standardowym
2. Dokładnej wartości odchylenia standardowego nie znamy. Niepewność standardowa jest jego niezbyt dokładnym oszacowaniem (estymatorem, oceną).
( )n
xx 2i
nlim ∑ −
=σ∞→
Wstęp do probabilistyki i statystyki. wykład 1 47
Niepewność maksymalna
Jest miarą deterministyczną, gdyż zakłada, żemożna określić przedział wielkości mierzonej x, wktórym na pewno znajdzie się wielkość rzeczywista.
W tym przypadku staramy się określić przedział
x0 - ∆x < xi < x0 + ∆x
w którym mieszczą się wszystkie wyniki pomiaru xi, aktualnie wykonane i przyszłe.
Zaleca się obecnie niepewność maksymalną specyfikowaną przez producenta zamieniać na niepewność standardową wg wzoru:
3x)x(u Δ
=
Wstęp do probabilistyki i statystyki. wykład 1 48
2015-03-23
25
Test 117.03.2015
Różne wartości, xk
Krotności ich występowania, nkCzęstości, wk
1. Wykonano 18 pomiarów masy pewnej próbki i otrzymano następujące wyniki xk [kg]: 20, 19, 16, 18, 24, 18,19, 21,19, 22, 18, 19, 19, 20, 19, 20, 21, 20. a) Uporządkować wyniki rosnącob) Uzupełnić tabelę, w której należy zestawić różne wartości xk
pod podając liczbę nk określającą , ile razy występuje dana wartość
c) Obliczyć częstość występowania danej wartości xkd) Narysować histogram
2. Dwaj hazardziści S1 i S2 umawiają się, że zagrają pewną serię partii i że zwycięzcą będzie ten, kto pierwszy wygra sześć partii.
Wstęp do probabilistyki i statystyki. wykład 1 50
W jakim stosunku należy podzielić stawki, gdy trzeba będzie grę przedwcześnie przerwać?
Zakładamy, że S1 wygrywa cztery partie, a S2 tylko trzy.
Ile partii trzeba rozważyć aby rozwiązać teoretycznie ten problem?
Test 117.03.2015
2015-03-23
26
Podział błędów
Wyniki pomiarów podlegają pewnymprawidłowościom, tzw. rozkładom typowym dlazmiennej losowej. Z tego względu błędy dzielimyna:
Błędy grube (pomyłki), które należy eliminować
Błędy systematyczne, które można ograniczyćudoskonalając pomiar
Błędy przypadkowe, które podlegają prawomstatystyki i rachunku prawdopodobieństwa,wynikają z wielu losowych przyczynków i niedają się wyeliminować
Wstęp do probabilistyki i statystyki. wykład 1 51
Krzywe rozkładu błędu
x xx0
x x0=x
Φ(x)Φ(x)
błąd systematyczny błąd przypadkowy-rozkład Gaussa
Wstęp do probabilistyki i statystyki. wykład 1 52
2015-03-23
27
Są wynikiem pomyłki eksperymentatora np. przy odczytywaniu wartości mierzonych, przy przeliczaniu jednostek etc., nieprawidłowego stosowania przyrządu pomiarowego, poważnego i nieuświadomionego uszkodzenia przyrządu pomiarowego, zastosowania nieodpowiedniej metody pomiaru lub niewłaściwych wzorów teoretycznych do opracowania wyników. Fakt zaistnienia błędu grubego należy sobie jak najszybciej uświadomić a wynik obarczony takim błędem wykluczyć z dalszych analiz. Jeśli to możliwe, pomiar powtórzyć.
Błędy grube
Wstęp do probabilistyki i statystyki. wykład 1 53
Błędy systematyczne zawsze w ten sam sposób wpływająna wyniki pomiarów wykonanych za pomocą tej samejmetody i aparatury pomiarowej. Minimalna wartość błędusystematycznego jest określona dokładnością stosowanegoprzyrządu (lub klasą w przypadku analogowych miernikówelektrycznych). Wprowadza się pojęcie działkielementarnej czyli wartość najmniejszej działki (odległośćmiędzy sąsiednimi kreskami na skali przyrządu lub ułamektej odległości określony klasą przyrządu), która określadokładność odczytu.
Błędy systematyczne
Wstęp do probabilistyki i statystyki. wykład 1 54
2015-03-23
28
Źródłem błędu systematycznego są: skalemierników (np. niewłaściwe ustawienie „zera”),nieuświadomiony wpływ czynników zewnętrznych(temperatura, wilgotność) na wartość wielkościmierzonej, niewłaściwy sposób odczytu (błądparalaksy) lub pomiaru, przybliżony charakterwzorów stosowanych do wyznaczenia wielkościzłożonej.
Błędy systematyczne czasami można ograniczyć wprowadzając poprawki, np.
)Rr4,21(v6F +πη=
Błędy systematyczne
Wstęp do probabilistyki i statystyki. wykład 1 55
Występują zawsze w eksperymencie, lecz ujawniają się gdy wielokrotnie dokonujemy pomiaru przyrządem, którego dokładność jest bardzo duża a błędy systematyczne wynikające z innych przyczyn są bardzo małe. Wynikają one z własności obiektu mierzonego(np. wahania średnicy drutu na całej jego długości), własności przyrządu pomiarowego (np. wskazania przyrządu zależą od przypadkowych drgań budynku, fluktuacji ciśnienia czy temperatury, docisku dla suwmiarki), lub mają podłoże fizjologiczne (refleks eksperymentatora, subiektywność oceny maksimum natężenia dźwięku czy równomierności oświetlenia poszczególnych części pola widzenia)
Błędy przypadkowe
Wstęp do probabilistyki i statystyki. wykład 1 56
2015-03-23
29
Błędy przypadkowe zawsze towarzyszą eksperymentowi, nawet jeśli inne błędy zostaną wyeliminowane. W przeciwieństwie do błędu systematycznego, ich wpływ na wynik ostateczny pomiaru można ściśle określić.
Błędy przypadkowe
Wstęp do probabilistyki i statystyki. wykład 1
57
Dawniej uważano, że miarą błędusystematycznego może być tylko niepewnośćmaksymalna. Nowa Norma traktuje błądsystematyczny jako zjawisko przypadkowe, gdyżnie znamy a priori jego wielkości i znaku. Normazaleca stosowanie niepewności standardowej u.
Typy oceny niepewności wg nowej Normy
Typ AMetody wykorzystujące statystyczną analizę serii
pomiarów:•wymaga odpowiednio dużej liczby powtórzeń pomiaru
• ma zastosowanie do błędów przypadkowychTyp B
Opiera się na naukowym osądzie eksperymentatora wykorzystującym wszystkie informacje o pomiarze i
źródłach jego niepewności•stosuje się gdy statystyczna analiza nie jest możliwa•dla błędu systematycznego lub dla jednego wyniku
pomiaru
Wstęp do probabilistyki i statystyki. wykład 1 58
2015-03-23
30
TYP A
Wstęp do probabilistyki i statystyki. wykład 1 59
Przykład 3 : Seria wyników (próba)
x1,x2, ….xn obarczonych niepewnością przypadkową jest duża gdy 30<n≤100. W próbie takiej wyniki się powtarzają: nk jest liczbą pomiarów, w których wystąpił wynik xk,
nk/n jest częstością występowania wyniku
xk nk nk/n
5,2 1 0,0115,3 1 0,0115,4 2 0,0215,5 4 0,0435,6 7 0,0755,7 10 0,1065,8 14 0,1495,9 16 0,1706,0 13 0,1386,1 12 0,1286,2 6 0,0646,3 4 0,0436,4 3 0,0326,5 1 0,011
Suma 94Wstęp do probabilistyki i statystyki. wykład 1 60
2015-03-23
31
Opracowanie serii pomiarów bezpośrednich dużej próby
5,2 5 ,4 5,6 5 ,8 6,0 6 ,2 6,40
2
4
6
8
10
12
14
16
nk
xk
H is togramŚrednia arytmetyczna
x=5,9
Odchylenie standardowe
( )1
)(2
−
−== ∑
nxx
xu iσ
σ=0,2
n
xx
n
ii∑
== 1
Wstęp do probabilistyki i statystyki. wykład 1 61
Niepewność standardowa średniej ( )
)1n(nxx
)x(u2
i
−−
= ∑
Rozkład normalny Gaussa
Gęstość prawdopodobieństwa wystąpienia wielkości x lubjej błędu Δx podlega rozkładowi Gaussa
x0 jest wartością najbardziej prawdopodobną i może być nią średnia arytmetyczna, σ jest odchyleniem standardowym, σ2 jest wariancją rozkładu
⎟⎟⎠
⎞⎜⎜⎝
⎛ −−=Φ 2
20
2)(exp
21)(
σπσxxx
Wstęp do probabilistyki i statystyki. wykład 1 62
2015-03-23
32
Rozkład normalny Gaussa
2σ95.4 % 99.7 %
x
Φ(x
)
W przedziale x0-σ < x < x0+σ zawiera się 68.2 % (2/3), w przedziale x0-2σ < x < x0+2σ zawiera się 95.4 %w przedziale x0-3σ < x < x0+3σ zawiera się 99.7 %
wszystkich wyników
68.2% pow.
Wstęp do probabilistyki i statystyki. wykład 1 63
0 5 10 15 20 25 300
1
2
3
Φ(x)
x
x0=15σ=2 σ=5
Pomiar o większym σ charakteryzuje się większym rozrzutem wyników wokół wartości średniej a zatem mniejszą precyzją
Wstęp do probabilistyki i statystyki. wykład 1 64
Rozkład normalny Gaussa
2015-03-23
33
TYP B
Wstęp do probabilistyki i statystyki. wykład 1 65
Dla oceny typu B wykorzystać można m.in.:
dane z pomiarów poprzednich,doświadczenie i wiedzę na temat przyrządów i obiektów
mierzonych,informacje producenta przyrządów,niepewności przypisane danym zaczerpniętym z literatury
Gdy informacja o pomiarze i źródle jegoniepewności jest dobra, dokładność oceny typu Bjest porównywalna z dokładnością oceny typu A.
Wstęp do probabilistyki i statystyki. wykład 1 66
TYP B
2015-03-23
34
Przykład 4: Ocena niepewności typu B dla pomiaru długościwahadła.
Długość wahadła mierzymy przymiaremmilimetrowym uzyskując wartość L=140 mm.Przyjmujemy niepewność równą działceelementarnej (działka skali 1mm). A zatemu(L)=1 mm, ur(L)=u(L)/L=1/140, błądprocentowy 0,7%
Najczęściej ocena typu B dotyczy określenianiepewności wynikającej ze skończonejdokładności przyrządu.
Wstęp do probabilistyki i statystyki. wykład 1 67
TYP B
NIEPEWNOŚĆ WIELKOŚCI ZŁOŻONEJ – PRAWO PRZENOSZENIA BŁĘDU
0 2 4
0
20
40
60
80
100
120
140
y
x
u(y)
u(x)
funkcja y = f(x)
styczna dy/dx
)x(udxdy)y(u =
Wstęp do probabilistyki i statystyki. wykład 1 68
2015-03-23
35
Metoda różniczki zupełnej
Dla wielkości złożonej y=f(x1,x2,...xn) gdyniepewności maksymalne Δx1 , Δx2 , ... Δxn sąmałe w porównaniu z wartościami zmiennychx1,x2, ... xn niepewność maksymalną wielkości ywyliczamy z praw rachunku różniczkowego:
nn
xxyx
xyx
xyy Δ
∂∂
++Δ∂∂
+Δ∂∂
=Δ ...22
11
(3)
Wstęp do probabilistyki i statystyki. wykład 1 69
Prawo przenoszenia niepewności
Niepewność standardową wielkości złożonejy=f(x1,x2,...xn) obliczamy z tzw. prawaprzenoszenia niepewności jako sumęgeometryczną różniczek cząstkowych
22
22
2
11
)(...)()()( ⎥⎦
⎤⎢⎣
⎡
∂∂
++⎥⎦
⎤⎢⎣
⎡∂∂
+⎥⎦
⎤⎢⎣
⎡∂∂
= nn
c xuxyxu
xyxu
xyyu
yyuyu c
cr)()( =
Wstęp do probabilistyki i statystyki. wykład 1 70
2015-03-23
36
Przykład
W pewnym eksperymencie wyznaczono przyspieszenie ziemskie g mierząc okres T i długość L odpowiedniego wahadła matematycznego. Wyznaczona długość wahadła wynosi 1.1325±0.0014 m. Niezależnie określona niepewność względna pomiaru okresu wahadła wynosi 0,06%, tj.
4r 106
T)T(u)T(u −⋅==
Obliczyć względną niepewność pomiarową przyspieszenia ziemskiego lub niepewność procentową zakładając, że niepewności pomiarowe L i T są niezależne i mają charakter przypadkowy.
Wstęp do probabilistyki i statystyki. wykład 1 71
0 40 80 120 160 200 240 280 32060708090
100110120130140150160170180
Zasady rysowania wykresów
Czy ten wykres jest narysowany zgodnie z zasadami?
1. Należy wyraźnie zaznaczyć punkty eksperymentalne !!!
Wstęp do probabilistyki i statystyki. wykład 1 72
2015-03-23
37
2. Trzeba nanieść błąd pomiaru
0 40 80 120 160 200 240 280 32060708090
100110120130140150160170180
Wstęp do probabilistyki i statystyki. wykład 1 73
3. Dobrać zakresy osi współrzędnych odpowiednio do zakresu zmienności danych pomiarowych !!!
0 40 80 120 160 200 240 280 32060708090
100110120130140150160170180
Wstęp do probabilistyki i statystyki. wykład 1 74
2015-03-23
38
4. Właściwie opisać osie współrzędnych i dobrać skalę, tak aby łatwo można było odczytać wartości zmierzone.
160 200 240 280 32060708090
100110120130140150160170180
co jest na osiach ???Wstęp do probabilistyki i statystyki. wykład 1 75
5. Nie łączyć punktów eksperymentalnych liniąłamaną!!! Jeśli znany jest przebieg teoretycznyto dokonać dopasowania teorii dodoświadczenia (przeprowadzić fitowanie)
160 200 240 280 32060
90
120
150
180
ρ [μ
Ω c
m]
T [K]Wstęp do probabilistyki i statystyki. wykład 1 76
2015-03-23
39
160 200 240 280 32060
90
120
150
180 dane eksperymentalne dopasowanie
ρ [μ
Ω c
m]
T [K]
6. Zadbać o aspekt estetyczny wykresu (opis,zamknięcie ramką, itp.)
Wstęp do probabilistyki i statystyki. wykład 1 77
160 200 240 280 32060
90
120
150
180
dane eksperymentalne dopasowanie
ρ [μ
Ω c
m]
T [K]
Wykres 1Rezystywnosc ρ probki Bi w funkcji temperatury T
Wstęp do probabilistyki i statystyki. wykład 1 78
2015-03-23
40
Metoda najmniejszych kwadratówRegresja liniowa
4 6 8 10 12 14 160
20
40
60
f(xi)yi
x i
y
x
f(x)=ax+ba=3.23, b=-2.08
( )[ ] min2
2 =∑ +−=n
iii baxyS
Wstęp do probabilistyki i statystyki. wykład 1 79
PODSUMOWANIE
1. Każdy pomiar w laboratorium jest obarczony niepewnością pomiarową, którą eksperymentator musi określić zgodnie z pewnymi zasadami.
2. W pierwszej kolejności należy przeanalizować źródła błędów, pamiętając, aby wyeliminować wyniki obarczone błędem grubym. W laboratorium studenckim błędy systematyczne z reguły przewyższają błędy przypadkowe.
3. Wielokrotne powtarzanie pomiarów, gdy dominuje błąd systematyczny, nie ma sensu. W takim przypadku dokonujemy tylko 3-5 pomiarów w tych samych warunkach w celu sprawdzenia powtarzalności.
Wstęp do probabilistyki i statystyki. wykład 1 80
2015-03-23
41
4. Gdy błąd przypadkowy dominuje w eksperymencie, należy sprawdzić czy rozkład wyników może być opisany funkcją Gaussa czy też należy spodziewać się innego rozkładu. W tym celu dokonujemy wielokrotnego (np. 100 razy) pomiaru w tych samych warunkach, obliczamy średnią i wariancję rozkładu, rysujemy histogram, etc.)
5. Jako miarę niepewności stosujemy raczej niepewność standardową, rzadziej niepewność maksymalną.
6. W przypadku wielkości złożonej, stosujemy prawo przenoszenia błędu. Staramy się przeprowadzić analizę niepewności wielkości złożonej tak, aby uzyskać informacje dotyczące wagi przyczynków, jakie wnoszą do całkowitej niepewności pomiary poszczególnych wielkości prostych. W tym celu należy analizować niepewności względne.
Wstęp do probabilistyki i statystyki. wykład 1 81
PODSUMOWANIE
7. Ważnym elementem sprawozdania z przebiegu eksperymentu (i to nie tylko w laboratorium studenckim) jest wykres. Wykresy sporządzamy zgodnie z dobrymi zasadami, pamiętając o jednoznacznym opisie.
8. Jeżeli znane są podstawy teoretyczne badanego zjawiska, na wykresie zamieszczamy krzywą teoretyczną (linia ciągła) na tle wyraźnych punktów eksperymentalnych (dobieramy odpowiednie symbole i nanosimy niepewności eksperymentalne). Możemy wcześniej dokonać dopasowania parametrów przebiegu teoretycznego w oparciu o znane metody „fitowania”
9. Zawsze, gdy to możliwe, dokonujemy linearyzacji danych eksperymentalnych, np. rysując y vs. ln (x), lub log y vs. log x, lub y vs. 1/x itp. Do tak przygotowanych danych można zastosować metodę regresji liniowej .
Wstęp do probabilistyki i statystyki. wykład 1 82
PODSUMOWANIE