Rachunek prawdopodobieństwa - IChF PAN · Rachunek prawdopodobieństwa. Definicja klasyczna...

Post on 02-Mar-2019

244 views 0 download

Transcript of Rachunek prawdopodobieństwa - IChF PAN · Rachunek prawdopodobieństwa. Definicja klasyczna...

Rachunek prawdopodobieństwa

Definicja klasyczna (Laplace'a)

Prawdopodobieństwem zajścia zdarzenia A nazywamy iloraz liczby zdarzeń sprzyjających zdarzeniu A do liczby wszystkich możliwych przypadków, zakładając, że wszystkie przypadki wzajemnie się wykluczają i są jednakowo możliwe.

Oznaczmy zbiór wszystkich możliwych przypadków przez Ω. Elementami zbioru Ω są zdarzenia elementarne ω, zaś zbiór Ω to zbiór zdarzeń elementarnych. Zbiór zdarzeń sprzyjających A będzie w takim wypadku podzbiorem zbioru Ω: A Ω.⊂

P A=∣A∣∣∣

|A| oznacza liczbę elementów (moc) zbioru A, zaś |Ω| liczbę elementów (moc) zbioru Ω

Na przykład dla prawdopodobieństwa wyrzucenia 6 w rzucie kostką. Zbiór zdarzeń elementarnych Ω = {1, 2, 3, 4, 5, 6}, zatem liczba możliwych zdarzeń |Ω| = 6. Zbiór zdarzeń sprzyjających A = {6}, liczba zdarzeń sprzyjających |A| = 1

Prawdopodobieństwo geometryczneDefinicja klasyczna nie pozwala obliczać prawdopodobieństwa w przypadku, gdy zbiory A i Ω są nieskończone, jeśli jednak zbiory te mają interpretację geometryczną, zamiast liczebności zbiorów można użyć miary geometrycznej (długość, pole powierzchni, objętość).

Przykład: z przedziału [0,4] wybieramy losowo punkt. Jakie jest prawdopodobieństwo, że wybrany punkt będzie należał do przedziału [1,2]?

Odpowiedź: Długości przedziałów wynoszą odpowiednio: |[0,4]| = 4 i |[1,2]| = 1. Zatem prawdopodobieństwo opisanego zdarzenia wynosi:

P A =14

Definicja częstościowa

Inną próbę sformułowania definicji prawdopodobieństwa podjął w 1931 roku Richard von Mises. Zaproponował, żeby zdefiniować prawdopodobieństwo jako granicę ciągu częstości:

P A= limn∞

kn A

n

gdzie kn(A) to liczba rezultatów sprzyjających zdarzeniu A po n próbach.

Definicja ta nie mówi jednak nic o warunkach istnienia granicy

Definicja klasyczna pozwala obliczać prawdopodobieństwo w prostych przypadkach, jednak zawiera szereg wad: nie można jej stosować dla zbiorów nieskończonych, a przede wszystkim zawiera błąd logiczny. Zdarzenia elementarne muszą być jednakowo możliwe, co znaczy przecież to samo co jednakowo prawdopodobne. Okazało się więc, że w definicji użyliśmy pojęcia, które definiujemy.

Problemy z klasyczną definicją prawdopodobieństwa

Aksjomatyczna definicja prawdopodobieństwa

Nową definicję prawdopodobieństwa podał w 1933 Andriej Kołmogorow, który korzystając z teorii miary zaksjomatyzował teorię prawdopodobieństwa.

Załóżmy, że Ω jest zbiorem zdarzeń elementarnych ω, zaś M jest σ-ciałem na zbiorze Ω. Prawdopodobieństwem nazywamy funkcję P: M → R spełniającą następujące warunki:

1. P(A) ≥ 0 dla każdego A M∈2. P(Ω) = 13. jeśli (A

n) jest dowolnym ciągiem podzbiorów M parami rozłącznych, to:

P A1∪A2∪...∪An∪... =∑n=1

PAn

σ-ciało zbiorów na przestrzeni X to przeliczalnie addytywne ciało podzbiorów

Zmienna losowaZmienna losowa – funkcja przypisująca zdarzeniom elementarnym liczby

Zmienną losową jest na przykład funkcja opisującą wagę lub wzrost ciała wylosowanego z pewnej populacji osobnika. Zjawiskom o charakterze losowym, którym nie można w oczywisty sposób przypisać jakiejś miary liczbowej, także można przypisywać liczby według pewnego klucza tak, aby możliwe było ich porównywanie w interesującym nas aspekcie. Najprostszymi przykładami są: moneta (np. orłu przypisujemy zero, a reszce jedynkę) i kostka do gry (każdej ściance przypisujemy liczbę wylosowanych oczek). Innymi przykładami wziętymi z życia mogą być: stan techniczny urządzenia, czy wiedza ucznia (oceniana w skali od 1 do 6)

Rozkład zmiennej losowej – opis wartości przyjmowanych przez zmienną losową przy pomocy prawdopodobieństw (lub gęstości prawdopodobieństw) z jakimi one występują.

Wartość średnia

Wartość oczekiwana (przeciętna, średnia), nadzieja matematyczna – w rachunku prawdopodobieństwa wartość opisująca spodziewany (średnio) wynik doświadczenia losowego. Wartość oczekiwana to inaczej pierwszy moment zwykły.

⟨ x ⟩=1N∑i=1

N

x i

Wariancja

Wariancja to klasyczna miara zmienności. Intuicyjnie utożsamiana ze zróżnicowaniemzbiorowości jest średnią arytmetyczną kwadratów odchyleń poszczególnych wartościcechy od średniej arytmetycznej zbiorowości.

2=1N∑i=1

N

x i−⟨ x ⟩2

Momenty

⟨ xn⟩=∫−∞

dx xnPX x

⟨ x ⟩

⟨ x2 ⟩−⟨x ⟩2

Wartość średnia

Wariancja X

X≡⟨ x2⟩−⟨ x ⟩2 Odchylenie standardowe

n-ty moment

Rozkład normalny

f x=1

2exp−

x−2

2 2

– odchylenie standardowe – wartość oczekiwana s2 - wariancja

Metody Monte Carlo

Generowanie liczb pseudolosowych

Zły generator liczb losowych Dobry generator liczb losowych

Metoda Monte Carlo

P=ilość trafieńwczerwone polecałkowita ilość rzutów

Dokładność obliczeń wzrasta gdy wzrasta całkowita ilość rzutów

S=P⋅2r2

Metoda Monte Carlo

P=ilość trafieńwczerwone polecałkowita ilość rzutów

Dokładność obliczeń wzrasta gdy wzrasta całkowita ilość rzutów

S=4 P⋅r 2

cosx cos ycos z=0

V=122

3≈124.02511

cosx cos ycos z≠0

Monte Carlo jest metodą bardzo niedobrą; powinna być używana jedynie wtedy gdy wszystkie alternatywne metody są gorsze.

x2 y2=r2

y= r2− x2

S=4∫0

r

r2− x2dx= r2

Obliczanie pola koła

Importance sampling

I=∫a

b

dx f x

I=a−b⟨ f x⟩

<f(x)> oznacza średnią wartość funkcji f(x), obliczoną na przedziale [a,b].

W „brute force” Monte Carlo średnia <f(x)> jest oszacowana przez obliczanie funkcji f(x) dużą ilość razy (powiedzmy N) w punktach x, wybranych losowo, jednorodnie rozmieszczonych na przedziale [a,b]. Gdy liczba prób N dąży do nieskończoności to wynik obliczeń dąży do wyniku dokładnego.

f x

a bx

x2 y2=r2

f x = r2− x2

S=4 r ⟨ f x ⟩

Obliczanie pola koła

I=∫0

1

dx wx f xw x

Załóżmy dla wygody , że a=0 i b=1

Załóżmy, że w(x) jest pochodna innej znanej funkcji u(x) ( nieujemnej, niemalejącej) oraz u(0)=0 i u(1)=1. Te warunki brzegowe implikują, że funkcja u(x) jest unormowana.

I=∫0

1

duf [x u ]w [ x u ]

f x

x

a b

W następnym kroku, należy wygenerować N losowych wartości u jednorodnie rozłożonych w przedziale [0,1]. Otrzymamy w ten sposób następujące oszacowanie całki I.

I≈1N∑i=1

N f [x u i]

w [x u i]

Zysk z przeprowadzenie tej operacji zależy id dobrego wyboru funkcji w(x)

I2=

1

N 2∑i=1

N

∑j=1

N

⟨ f [x u i]w [ xu i]−⟨

fw⟩ f [ x u j]w [ x u j]

−⟨fw⟩⟩

Wariancja

Nawiasy kątowe <> oznaczają średnią gdy N dąży do nieskończoności

Jako, że próbki i oraz j są całkowicie niezależne otrzymujemy

I2=1N2∑i=1

N

⟨ f [ x ui]w [ x ui]−⟨

fw⟩ 2

I2=1N [⟨ fw

2

⟩−⟨fw⟩2

]Wariancja może być zmniejszona przez taki wybór w(x) aby f(x)/w(x) było gładką funkcją x. Najlepszy wybór to taki, w którym f(x)/w(x)= const, wtedy wariancja znika. W przypadku gdy w(x)=const, tak jak to jest w „brute force” Monte Carlo, błąd względny jest bardzo duży.

Badany układ

N - ilość cząsteczek – od kilkudziesięciu do dziesiątek milionów

Warunki brzegowe:Dla małych układów wzmacnia efekt skończonego układuWprowadza sztucznie zależność własności układu od jego brzegu

Pudełko symulacyjne

Twarde dyski (kule)

U r ={0 , r∞ , r

Potencjał twardych kul

Periodyczne warunki brzegowe

Układ jest otoczony przez repliki tego układu

Układ

Repliki

Aby badać fazy objętościowe układ jest otoczony swoimi replikami, dzięki czemu można założyć, że układ składający się z N cząsteczek jest otoczony przez nieskończoną liczbę cząsteczek.

Konfiguracja początkowa

Dla danej ilości cząsteczek Ntot

oraz gęstości płynu znaleźć rozmiar sześciennego

pudełka symulacyjnego. Znaleźć objętość V i długość krawędzi sześcianu L.

=N tot

VV=

N tot

L=Lx=Ly=Lz=V1 /3 n=nx=ny=nz=N tot

1/3

Cząsteczki układamy na sieci kubicznej prostej. Stała sieci jest dana następującym wzorem (jeśli uwzględnimy periodyczne warunki brzegowe):

=x= y=z=L/n

n=5

l = 0xo = 0.0yo = 0.0zo = 0.0

DO i = 0, n-1 DO j = 0, n-1 DO k = 0, n-1

l = l+1 x(l) = xo + i* y(l) = yo + j* z(l) = zo + k* ENDDO ENDDO ENDDO

i=0 i=n−1

j=0

j=n−1

x(i), y(i), z(i) – współrzędne cząsteczek

BCC FCCSC

TermodynamikaStatystyczna

Stan makroskopowy (makrostan) stan równowagowego układu opisany takimi parametrami jak temperatura T, objętość V, ilość moli n.

Stan mikroskopowy (mikrostan) określa się podając stan każdego z elementów tworzących układ, czyli dokładne wartości wszystkich zmiennych opisujących każdy pojedynczy element wchodzący w skład układu.

Na przykład, do ruch atomu opisywany jest przez położenie r, i prędkość v, tego atomu. Mikrostan takiego „klasycznego atomu” jest opisywany przez 6 zmiennych niezależnych.

Postulaty

I. W makroskopowym układzie izolowanym spontaniczne procesy przebiegają tak, że liczba dozwolonych mikrostanów wzrasta lub, jeśli układ był w stanie równowagi, pozostajestała

II. Jeśli układ izolowany jest w stanie równowagi, to wszystkie dozwolone mikrostany są jednakowo prawdopodobne.

III. Makrostan, któremu odpowiada największa liczba mikrostanów jest stanem równowagi

Hipoteza ergodycznaUkłady, dla których średnie po czasie obserwacji są równe średnim po zespole statystycznym są nazywane układami ergodycznymi.

Układ izolowany – zespół mikrokanoniczny

Suma stanów, całkowita ilość mikrostanów

E ,V , N

Prawdopodobieństwo wystąpienia dowolnego, dozwolonego mikrostanu

P=1

E ,V , N

E

Energia – E,Objętość – V, Ilość cząsteczek – N, są niezmienne

Statystyczna definicja entropii

S=k lnk – stała Boltzmanna

=1⋅2

ln =ln 1⋅2= ln 1ln 2

Statystyczna definicja temperatury

∂k ln∂E N , V

=1T

Dostarczamy do układu niewielką ilość ciepła Q, a następnie ponownie odizolowujemy układ.

k ln=k lnEQ −k lnE≈ ∂k ln

∂ E N ,V

Q

Porównując powyższą równość z S = Q/T otrzymujemy, że postulat S=k ln prowadzi do wyniku

Równowaga termiczna

E1E2=E=constEmax E1

P

E1 E2

Schematyczna postać prawdopodobieństwa P = (E1)/

c tego, że energia pierwszego

układu, będącego w kontakcie cieplnym z drugim układem, wynosi E1, dla typowego

układu makroskopowego. Emax

jest najbardziej prawdopodobną wartością energii

pierwszego układu. Im większy układ tym większa wartość prawdopodobieństwa dla E

1 = E

max .

E1=1E1⋅2E2

Liczby mikrostanów w pierwszym podukładzie, odpowiadające energii E1, oraz liczba

mikrostanów w drugim podukładzie, odpowiadające energii E2, oznaczamy odpowiednio

przez 1(E

1) i

2(E

2). Liczby wszystkich mikrostanów w całym układzie oznaczamy przez

c. Natomiast liczbę mikrostanów całości złożonej z obu podukładów, w obecności

więzu w postaci ustalonej energii E1 pierwszego podukładu, oznaczamy przez (E

1)

1(E

1) jest rosnącą funkcją E

1, a

2(E

2) – rosnącą funkcją E

2. Ponieważ E

2= E-E

1, a E

jest ustalone, więc 2(E

2)=

2(E-E

1) jest malejącą funkcją E

1. (E

1) jest więc iloczynem

rosnącej i malejącej funkcji E1, i dla pewnej wartości E

1 = E

max przyjmuje maksimum. E

max

jest taką energią pierwszego układu, której odpowiada największa liczba mikrostanów dla obu układów łącznie.

1=∂ ln1E1

∂ E1=∂ ln2E2

∂ E2=2

∂ ln E1

∂E1=∂ ln1 E1

∂ E1∂ ln2E−E1

∂ E1=0

∂ ln2E−E1

∂ E1=−

∂ ln2E2

∂ E2

Ponieważ pochodna funkcji znika dla argumentu, w którym funkcja przyjmuje maksimum, więc dla E=E

max zachodzi związek

Podstawiając następnie

Otrzymujemy warunek równowagi cieplnej, równoważny warunkowi równości temperatur:

Statystyczna definicja ciśnienia

V 1V 2=V=const

V 1=1V 1⋅2V 2

1 p1=∂ ln1E1 ,V 1 ,N1

∂V 1=∂ ln2E2 ,V 2 , N2

∂V 2=2 p2

Przyjęliśmy tutaj warunek konsystencji statystycznej definicji entropii z termodynamicznym związkiem między ciśnieniem i entropią

pT= ∂ S∂V

U ,N

V1 V 2

Statystyczna definicja potencjału chemicznego

N1N2=N=const

N1=1N1⋅2N2

11=−∂ ln1 E1 ,V 1 ,N1

∂ N1=−∂ ln2E2 ,V 2 ,N2

∂ N2=22

T=− ∂ S∂N

U ,V

Przyjęliśmy tutaj warunek konsystencji statystycznej definicji entropii z termodynamicznym związkiem między potencjałem chemicznym i entropią

N1 N2

Układ w równowadze z termostatem

Ecałkowita

Eotoczenia

E

E Energia mikrostanu

Ecałkowita≫E

Przy ustalonym mikrostanie, liczba mikrostanów całości jest równa liczbie mikrostanów otoczenia.

otoczeniaEcałkowita−E

lnotoczenia Ecałkowita−E≈lnotoczenia Ecałkowita− E

P=otoczeniaEcałkowita−E

całość

≈otoczenia Ecałkowita

całość

e− E

=1Ze−E

ln otoczenia

można rozwinąć wokół Ecałkowita

Gdzie wyrazy wyższych rzędów zostały zaniedbane, a parametr był wprowadzony wcześniej.

Prawdopodobieństwo mikrostanu układu o energii E obliczamy jako iloraz liczby tych

mikrostanów całości (tj. układu i otoczenia), które są zgodne z mikrostanem , i liczby wszystkich mikrostanów całości

c, zatem

P=1 Warunek normalizacyjny

Z=∑

e− E

W poprzednim wyrażeniu stała normalizacyjna Z jest niezależna od stanu układu i może być otrzymana z warunku normalizacji prawdopodobieństwa.

Stąd otrzymujemy wyrażenie na stałą normalizacyjną

Gdzie suma przebiega po wszystkich mikrostanach układu. Stała normalizacyjna zwana jest kanoniczną sumą stanów.

P=1Ze−E

Zespół statystyczny, w którym prawdopodobieństwo wystąpienia mikrostanu dane jest wzorem

to zespół kanoniczny, a

e−E

nosi nazwę czynnika Boltzmanna

U≡⟨E ⟩=∑

P E=Z−1∑

E e−E

E e−E=−

dd ∑

e−E=−

dd

Z

U=− ∂∂ln Z

Korzystając ze związku

Otrzymujemy

Pokażemy teraz, że definicja F = -kT ln Z prowadzi do znanego z termodymamiki fenomenologicznej związku

U=FTS=F−T∂F∂T

U=−∂

∂ln Z=kT

2 ∂

∂Tln Z=F−T

∂ F∂T

Co dowodzi związku między energią swobodną Helmholtza a kanoniczną sumą stanów, zapostulowanego poprzednio, czyli

F=−kT ln Z