Statystyka matematyczna dla le śników - Aktualności...

44
Statystyka matematyczna dla leśników Wydzial Leśny Kierunek „leśnictwo” Studia Stacjonarne I Stopnia Rok akademicki 2011/2012 Wyklad 1

Transcript of Statystyka matematyczna dla le śników - Aktualności...

Statystyka matematyczna

dla leśników

Wydział LeśnyKierunek „leśnictwo”

Studia Stacjonarne I StopniaRok akademicki 2011/2012

Wykład 1

Statystyka

• Nazwa pochodząca o łac. słowa „status” – stan, państwo i „statisticus” = polityczny

• Początki statystyka: spisy powszechne ludności

• Od XVIII-XIX wieku statystyka zajmowała sięopisem stanu państwa (gospodarki)

• W syntetycznym uproszczeniu: statystyka to nauka (część matematyki), której przedmiotem zainteresowania są metody pozyskiwania, analizy i prezentacji danych opisujących róŜne zjawiska, przede wszystkim zjawiska masowe

Statystyka - definicje

• nauka zajmująca się badaniem zbiorowości niejednorodnych (czyli takich, w których występują róŜnice między poszczególnymi elementami tych zbiorowości)

• nauka o metodach badania zjawisk masowych (czyli takich, które ujawniają się podczas badania większej liczby jednostek).

• dyscyplina matematyki stosowanej, zajmująca sięmetodami badania wielkości, których cechącharakterystyczną jest zmienność

Statystyka w szkole podstawowej

• Klasa IV: odczytywanie danych o otaczającym świecie, prezentowanie danych w postaci tabelek lub prostej formie graficznej, wyszukiwania konkretnych informacji

• Klasa V: korzystanie z formularzy do zbierania danych, prezentowanie danych w zorganizowany sposób, np. za pomocą diagramów słupkowych, wyciąganie prostych wniosków z zebranych danych

• Klasa VI: przygotowanie formularza do zbierania danych, graficzna prezentacja danych, wyciąganie wniosków z zebranych danych, średnia arytmetyczna

Statystyka dla leśnika

• Po co leśnikowi statystyka?– Umiejętność zbierania danych

– Umiejętność opracowywania danych

– Umiejętność stawiania i sprawdzania hipotez

– Umiejętność znajdowania zaleŜności między cechami

– Umiejętność przeprowadzania prognoz

– Zdolność do podejmowanie decyzji na podstawie posiadanych (przetworzonych) informacji

Statystyka na kierunku „leśnictwo”

• Samodzielny Zakład Dendrometrii i Nauki o Produkcyjności lasu

– Budynek 34, II piętro, pokój 2/77A

Statystyka na kierunku „leśnictwo”

• Samodzielny Zakład Dendrometrii i Nauki o Produkcyjności lasu– Budynek 34, II piętro, pokój 2/77A

• Przedmioty:– Statystyka matematyczna

– Dendrometria

– Nauka o produkcyjności lasu

– Zajęcia specjalizacyjne i fakultety (m.in. metody pomiaru biomasy, zastosowanie modeli wzrostu, dendrochronologia, biometria, …)

Statystyka na kierunku „leśnictwo”

• Wykłady (15h, środa 14:15-16:00, Aula 2)

– Dr hab. Michał Zasada, prof. SGGW

• Ćwiczenia (30h, sala 2/3 i 2/6)

– Pracownicy: dr inŜ. Rafał Wojtan, dr inŜ. Robert Tomusiak, dr Szymon Bijak

– Doktoranci: mgr inŜ. Agnieszka Bronisz, mgr

inŜ. Karol Bronisz, mgr inŜ. Maciej

Czajkowski, mgr inŜ. Łukasz Ludwisiak, mgr

inŜ. Michał Magnuszewski, mgr inŜ. Jacek

Sagan

Statystyka na kierunku „leśnictwo”

• A w razie problemów:

– Osobiście: budynek 34, II piętro, pokój 2/77A

(w gablocie obok sekretariatu - godziny

konsultacji prowadzących)

– Telefonicznie: numer wewnętrzny 38081

(sekretariat)

– E-mailowo: [email protected]

Statystyka na kierunku „leśnictwo”

• Ćwiczenia

– zaliczenie, w tym sprawozdania z

poszczególnych zajęć oraz kolokwia w trakcie

semestru

– szczegóły podadzą prowadzący na zajęciach

• Wykłady

– egzamin pisemny w sesji

– warunkiem przystąpienia do egzaminu jest

zaliczenie ćwiczeń

Literatura

• Bruchwald Arkadiusz. Statystyka matematyczna dla leśników

• Łomnicki Adam. Wprowadzenie do statystyki dla przyrodników

• Luszniewicz Andrzej, Słaby Teresa. Statystyka stosowana

• Luszniewicz Andrzej. Statystyka nie jest trudna

• Kassyk-Rokicka Helena. Statystyka nie jest trudna

• inne źródła, równieŜ internetowe

Statystyka - podział

• statystyka opisowa (zbieranie danych, ich prezentacja i sumaryczny opis)

• rachunek prawdopodobieństwa

(zdarzenia losowe)

• wnioskowanie statystyczne

(wykorzystanie teorii statystycznych do uzyskiwania informacji o całości na podstawie badania części)

Statystyka - pojęcia

• Zjawiska masowe

– to takie zjawiska, które badane w duŜej masie

zdarzeń ujawniają pewne prawidłowości,

jakich nie moŜna zaobserwować w przypadku

pojedynczych obserwacji

Statystyka - pojęcia

• Badanie statystyczne

– zespół czynności prowadzących do uzyskania

za pomocą metod statystycznych informacji o

objętej badaniami zbiorowości statystycznej

– Badanie pełne i częściowe

Statystyka - pojęcia

• Etapy badań statystycznych– Obserwacja statystyczna

• zbieranie materiału empirycznego tak, aby moŜliwe było uchwycenie stanu populacji w określonym momencie lub zmian zachodzących w czasie

– Opis• kontrola zebranego materiału, jego porządkowanie,

klasyfikację, określenie wartości róŜnych mierników. Rezultatem są tablice, wykresy i charakterystyki liczbowe

– Analiza• wykrywanie prawidłowości w badanych zjawiskach,

ich interpretacja i formułowanie wniosków

Statystyka - pojęcia

• Zbiorowość statystyczna

– zbiór elementów (obserwacji, przedmiotów,

obiektów, …) podobnych do siebie pod

względem określonych cech

– zbiór jednostek nieidentycznych, powiązanych

ze sobą logicznie

Statystyka - pojęcia

• Zbiorowość statystyczna– zbiór elementów (obserwacji, przedmiotów,

obiektów, …) podobnych do siebie pod względem określonych cech

– zbiór jednostek nieidentycznych, powiązanych ze sobą logicznie

• Populacja generalna (populacja)– Zbiorowość statystyczna podlegająca badaniu

statystycznemu

– Populacja skończona i nieskończona

Statystyka - pojęcia

• Jednostka statystyczna

– element zbiorowości statystycznej (populacji);

źródło cech

Statystyka - pojęcia

• Cecha

– własność (charakterystyka) jednostek

statystycznych będąca podstawą ich

róŜnicowania

– przedmiot badań

Statystyka - pojęcia

• Cecha

– własność (charakterystyka) jednostek

statystycznych będąca podstawą ich

róŜnicowania

– przedmiot badań

• Rodzaje cech

Statystyka - pojęcia

• Cechy mierzalne (ilościowe): moŜliwe do opisania za pomocą liczb

– ciągłe: przyjmujące dowolne wartości w

danym przedziale

– skokowe: przyjmująca określone wartości w

danym przedziale,

• Cechy niemierzalne (jakościowe): moŜna je jedynie opisać słownie lub za pomocąodpowiednich skal

Statystyka - pojęcia

• Skale pomiarowe

– sposób wyraŜenia danej cechy

– uzaleŜnione są od rodzaju opisywanych

zmiennych

– determinują, co moŜna zrobić z daną cechą /

zmienną

Statystyka - pojęcia

• Skale pomiarowe

– Zmienne jakościowe

• Skala nominalna

• Skala porządkowa (rangowa)

– Zmienne ilościowe

• Skala przedziałowe (interwałowa)

• Skala ilorazowa (stosunkowa)

Skala nominalna• Pozwala rozpoznawać obiekty jednakowe i

róŜne, bez wypowiadania się o relacjach między nimi, np. gatunek drzewa, rodzaj drewna, rębnia, płeć, itp.

• Często pomiar na skali nominalnej jest liczbowym etykietowaniem badanych obiektów, np. kody w niektórych bazach danych

• Bardzo słaba skala pomiarowa

• Graficzna prezentacja, dominanta

Skala porządkowa• Dodatkowo wprowadza relację porządku w

zbiorze zmiennych jakościowych, np. siedlisko

suche, świeŜe, wilgotne, bagienne; drewno

suche, wilgotne; uszkodzenie słabe, średnie,

silne; ...

• Jest skalą mocniejszą niŜ nominalna

• Powoduje najwięcej problemów i nieporozumień,

przedmiot powszechnie popełnianych błędów

Skala porządkowa• Przykład: skala ocen (ndst, dst, db, bdb)

• Wszelkiego rodzaju obliczenia są tutaj

naduŜyciem: nieznana jest odległość między

poszczególnymi ocenami (róŜnica w między

róŜnymi stopniami jest róŜna; często mieszane

kategorie)

• MoŜliwe jest jedynie określenie, Ŝe np. silny

stopień uszkodzenia jest mocniejszy, niŜ słaby

Skala przedziałowa• Zachowuje własności skali porządkowej, ale

dodatkowo wyposaŜona jest w stałą jednostkęmiary i umowne zero

• MoŜliwy jest pomiar odległości między

uporządkowanymi zmiennymi

• Jest skalą mocniejszą od porządkowej

Skala przedziałowa• Przykład: skala Celsjusza dla temperatury

• MoŜliwe jest określenie o ile stopni dana temperatura róŜni się od innej

• Ale nie moŜna opisać sensownie stosunku dwóch wartości zmiennych

• Np. średnia temperatura lipca w centralnej Polsce (17C) róŜni się od średniej rocznej temperatury tego obszaru (7C) o 10 stopni, ale nie oznacza to, Ŝe w lipcu jest prawie 2,5 raza cieplej, niŜ średnio w roku

Skala ilorazowa• róŜni się od skali przedziałowej tym, Ŝe jest

posiada zero absolutne, a nie umowne

• MoŜliwe jest określenie ile razy dana cecha jest

większa od innej

• Jest to najsilniejsza skala pomiarowa

Skala ilorazowa• Przykład: skala Kelwina

• Gleba o temperaturze 50C (323K) jest 1.1 raza (czyli o 10%) cieplejsza od gleby o temperaturze 20C (293K)

• Przykład: liczba kandydatów na studia

• Na WTD (100) było 3 razy mniej kandydatów na studia, niŜ na WL (300); zerem absolutnym jest tu brak kandydatów na dany kierunek studiów, na WL startowało 3x więcej kandydatów, niŜ na WTD

Statystyka opisowa

Statystyka opisowa

• Graficzna prezentacja danych

• Szeregi rozdzielcze

• Sumy i ich własności

• Miary statystyczne (miary połoŜenia, zmienności i asymetrii)

• Jednostki standardowe

Graficzna prezentacja danych

Graficzna prezentacja danych

• WaŜny element wstępnej analizy danych

• Nieodzowna ilustracja problemu i uzyskanych wyników

• Wielobok liczebności, histogram, szereg skumulowany, …– Dobór rodzaju wykresu, skali i szerokości klas

polygon

dk

freq

uen

cy

0 3 6 9 12 15 18

0

20

40

60

80

100

Histogram for dk

dk

freq

uen

cy

0 3 6 9 12 15 18

0

20

40

60

80

100

cumulative polygon

dk

freq

uen

cy

0 3 6 9 12 15 18

0

50

100

150

200

250

cumulative histogram

dk

freq

uen

cy

0 3 6 9 12 15 18

0

50

100

150

200

250

http://onlinestatbook.com/stat_sim/histogram/index.html

Szereg rozdzielczy

• Statystyczny sposób prezentacji rozkładu empirycznego.

• Uporządkowany materiał statystyczny w przedziałach klasowych utworzonych wg wartości badanej cechy

Szereg rozdzielczy

• Uzyskuje się go dzieląc dane statystyczne na pewne kategorie i podając liczebność(częstość) zbiorów danych przypadających na kaŜdą z tych kategorii

• Szereg moŜe być:– strukturalny (cecha jakościowa)

– punktowy (cecha ilościowa, skokowa)

– przedziałowy (cecha ilościowa, ciągła)

Szereg rozdzielczy

xi ni Σni pi Σpi

4

6

8

10

12

14

16

23

82

73

45

24

2

1

23

105

178

223

247

249

250

0,092

0,328

0,292

0,180

0,096

0,008

0,004

0,092

0,420

0,712

0,892

0,988

0,996

1,000

Σ 250 1,000

Dziękuję za uwagę!