Statystyka matematyczna dla le śników - Aktualności...
Transcript of Statystyka matematyczna dla le śników - Aktualności...
Statystyka matematyczna
dla leśników
Wydział LeśnyKierunek „leśnictwo”
Studia Stacjonarne I StopniaRok akademicki 2011/2012
Wykład 1
Statystyka
• Nazwa pochodząca o łac. słowa „status” – stan, państwo i „statisticus” = polityczny
• Początki statystyka: spisy powszechne ludności
• Od XVIII-XIX wieku statystyka zajmowała sięopisem stanu państwa (gospodarki)
• W syntetycznym uproszczeniu: statystyka to nauka (część matematyki), której przedmiotem zainteresowania są metody pozyskiwania, analizy i prezentacji danych opisujących róŜne zjawiska, przede wszystkim zjawiska masowe
Statystyka - definicje
• nauka zajmująca się badaniem zbiorowości niejednorodnych (czyli takich, w których występują róŜnice między poszczególnymi elementami tych zbiorowości)
• nauka o metodach badania zjawisk masowych (czyli takich, które ujawniają się podczas badania większej liczby jednostek).
• dyscyplina matematyki stosowanej, zajmująca sięmetodami badania wielkości, których cechącharakterystyczną jest zmienność
Statystyka w szkole podstawowej
• Klasa IV: odczytywanie danych o otaczającym świecie, prezentowanie danych w postaci tabelek lub prostej formie graficznej, wyszukiwania konkretnych informacji
• Klasa V: korzystanie z formularzy do zbierania danych, prezentowanie danych w zorganizowany sposób, np. za pomocą diagramów słupkowych, wyciąganie prostych wniosków z zebranych danych
• Klasa VI: przygotowanie formularza do zbierania danych, graficzna prezentacja danych, wyciąganie wniosków z zebranych danych, średnia arytmetyczna
Statystyka dla leśnika
• Po co leśnikowi statystyka?– Umiejętność zbierania danych
– Umiejętność opracowywania danych
– Umiejętność stawiania i sprawdzania hipotez
– Umiejętność znajdowania zaleŜności między cechami
– Umiejętność przeprowadzania prognoz
– Zdolność do podejmowanie decyzji na podstawie posiadanych (przetworzonych) informacji
Statystyka na kierunku „leśnictwo”
• Samodzielny Zakład Dendrometrii i Nauki o Produkcyjności lasu
– Budynek 34, II piętro, pokój 2/77A
Statystyka na kierunku „leśnictwo”
• Samodzielny Zakład Dendrometrii i Nauki o Produkcyjności lasu– Budynek 34, II piętro, pokój 2/77A
• Przedmioty:– Statystyka matematyczna
– Dendrometria
– Nauka o produkcyjności lasu
– Zajęcia specjalizacyjne i fakultety (m.in. metody pomiaru biomasy, zastosowanie modeli wzrostu, dendrochronologia, biometria, …)
Statystyka na kierunku „leśnictwo”
• Wykłady (15h, środa 14:15-16:00, Aula 2)
– Dr hab. Michał Zasada, prof. SGGW
• Ćwiczenia (30h, sala 2/3 i 2/6)
– Pracownicy: dr inŜ. Rafał Wojtan, dr inŜ. Robert Tomusiak, dr Szymon Bijak
– Doktoranci: mgr inŜ. Agnieszka Bronisz, mgr
inŜ. Karol Bronisz, mgr inŜ. Maciej
Czajkowski, mgr inŜ. Łukasz Ludwisiak, mgr
inŜ. Michał Magnuszewski, mgr inŜ. Jacek
Sagan
Statystyka na kierunku „leśnictwo”
• A w razie problemów:
– Osobiście: budynek 34, II piętro, pokój 2/77A
(w gablocie obok sekretariatu - godziny
konsultacji prowadzących)
– Telefonicznie: numer wewnętrzny 38081
(sekretariat)
– E-mailowo: [email protected]
Statystyka na kierunku „leśnictwo”
• Ćwiczenia
– zaliczenie, w tym sprawozdania z
poszczególnych zajęć oraz kolokwia w trakcie
semestru
– szczegóły podadzą prowadzący na zajęciach
• Wykłady
– egzamin pisemny w sesji
– warunkiem przystąpienia do egzaminu jest
zaliczenie ćwiczeń
Literatura
• Bruchwald Arkadiusz. Statystyka matematyczna dla leśników
• Łomnicki Adam. Wprowadzenie do statystyki dla przyrodników
• Luszniewicz Andrzej, Słaby Teresa. Statystyka stosowana
• Luszniewicz Andrzej. Statystyka nie jest trudna
• Kassyk-Rokicka Helena. Statystyka nie jest trudna
• inne źródła, równieŜ internetowe
Statystyka - podział
• statystyka opisowa (zbieranie danych, ich prezentacja i sumaryczny opis)
• rachunek prawdopodobieństwa
(zdarzenia losowe)
• wnioskowanie statystyczne
(wykorzystanie teorii statystycznych do uzyskiwania informacji o całości na podstawie badania części)
Statystyka - pojęcia
• Zjawiska masowe
– to takie zjawiska, które badane w duŜej masie
zdarzeń ujawniają pewne prawidłowości,
jakich nie moŜna zaobserwować w przypadku
pojedynczych obserwacji
Statystyka - pojęcia
• Badanie statystyczne
– zespół czynności prowadzących do uzyskania
za pomocą metod statystycznych informacji o
objętej badaniami zbiorowości statystycznej
– Badanie pełne i częściowe
Statystyka - pojęcia
• Etapy badań statystycznych– Obserwacja statystyczna
• zbieranie materiału empirycznego tak, aby moŜliwe było uchwycenie stanu populacji w określonym momencie lub zmian zachodzących w czasie
– Opis• kontrola zebranego materiału, jego porządkowanie,
klasyfikację, określenie wartości róŜnych mierników. Rezultatem są tablice, wykresy i charakterystyki liczbowe
– Analiza• wykrywanie prawidłowości w badanych zjawiskach,
ich interpretacja i formułowanie wniosków
Statystyka - pojęcia
• Zbiorowość statystyczna
– zbiór elementów (obserwacji, przedmiotów,
obiektów, …) podobnych do siebie pod
względem określonych cech
– zbiór jednostek nieidentycznych, powiązanych
ze sobą logicznie
Statystyka - pojęcia
• Zbiorowość statystyczna– zbiór elementów (obserwacji, przedmiotów,
obiektów, …) podobnych do siebie pod względem określonych cech
– zbiór jednostek nieidentycznych, powiązanych ze sobą logicznie
• Populacja generalna (populacja)– Zbiorowość statystyczna podlegająca badaniu
statystycznemu
– Populacja skończona i nieskończona
Statystyka - pojęcia
• Jednostka statystyczna
– element zbiorowości statystycznej (populacji);
źródło cech
Statystyka - pojęcia
• Cecha
– własność (charakterystyka) jednostek
statystycznych będąca podstawą ich
róŜnicowania
– przedmiot badań
Statystyka - pojęcia
• Cecha
– własność (charakterystyka) jednostek
statystycznych będąca podstawą ich
róŜnicowania
– przedmiot badań
• Rodzaje cech
Statystyka - pojęcia
• Cechy mierzalne (ilościowe): moŜliwe do opisania za pomocą liczb
– ciągłe: przyjmujące dowolne wartości w
danym przedziale
– skokowe: przyjmująca określone wartości w
danym przedziale,
• Cechy niemierzalne (jakościowe): moŜna je jedynie opisać słownie lub za pomocąodpowiednich skal
Statystyka - pojęcia
• Skale pomiarowe
– sposób wyraŜenia danej cechy
– uzaleŜnione są od rodzaju opisywanych
zmiennych
– determinują, co moŜna zrobić z daną cechą /
zmienną
Statystyka - pojęcia
• Skale pomiarowe
– Zmienne jakościowe
• Skala nominalna
• Skala porządkowa (rangowa)
– Zmienne ilościowe
• Skala przedziałowe (interwałowa)
• Skala ilorazowa (stosunkowa)
Skala nominalna• Pozwala rozpoznawać obiekty jednakowe i
róŜne, bez wypowiadania się o relacjach między nimi, np. gatunek drzewa, rodzaj drewna, rębnia, płeć, itp.
• Często pomiar na skali nominalnej jest liczbowym etykietowaniem badanych obiektów, np. kody w niektórych bazach danych
• Bardzo słaba skala pomiarowa
• Graficzna prezentacja, dominanta
Skala porządkowa• Dodatkowo wprowadza relację porządku w
zbiorze zmiennych jakościowych, np. siedlisko
suche, świeŜe, wilgotne, bagienne; drewno
suche, wilgotne; uszkodzenie słabe, średnie,
silne; ...
• Jest skalą mocniejszą niŜ nominalna
• Powoduje najwięcej problemów i nieporozumień,
przedmiot powszechnie popełnianych błędów
Skala porządkowa• Przykład: skala ocen (ndst, dst, db, bdb)
• Wszelkiego rodzaju obliczenia są tutaj
naduŜyciem: nieznana jest odległość między
poszczególnymi ocenami (róŜnica w między
róŜnymi stopniami jest róŜna; często mieszane
kategorie)
• MoŜliwe jest jedynie określenie, Ŝe np. silny
stopień uszkodzenia jest mocniejszy, niŜ słaby
Skala przedziałowa• Zachowuje własności skali porządkowej, ale
dodatkowo wyposaŜona jest w stałą jednostkęmiary i umowne zero
• MoŜliwy jest pomiar odległości między
uporządkowanymi zmiennymi
• Jest skalą mocniejszą od porządkowej
Skala przedziałowa• Przykład: skala Celsjusza dla temperatury
• MoŜliwe jest określenie o ile stopni dana temperatura róŜni się od innej
• Ale nie moŜna opisać sensownie stosunku dwóch wartości zmiennych
• Np. średnia temperatura lipca w centralnej Polsce (17C) róŜni się od średniej rocznej temperatury tego obszaru (7C) o 10 stopni, ale nie oznacza to, Ŝe w lipcu jest prawie 2,5 raza cieplej, niŜ średnio w roku
Skala ilorazowa• róŜni się od skali przedziałowej tym, Ŝe jest
posiada zero absolutne, a nie umowne
• MoŜliwe jest określenie ile razy dana cecha jest
większa od innej
• Jest to najsilniejsza skala pomiarowa
Skala ilorazowa• Przykład: skala Kelwina
• Gleba o temperaturze 50C (323K) jest 1.1 raza (czyli o 10%) cieplejsza od gleby o temperaturze 20C (293K)
• Przykład: liczba kandydatów na studia
• Na WTD (100) było 3 razy mniej kandydatów na studia, niŜ na WL (300); zerem absolutnym jest tu brak kandydatów na dany kierunek studiów, na WL startowało 3x więcej kandydatów, niŜ na WTD
Statystyka opisowa
• Graficzna prezentacja danych
• Szeregi rozdzielcze
• Sumy i ich własności
• Miary statystyczne (miary połoŜenia, zmienności i asymetrii)
• Jednostki standardowe
Graficzna prezentacja danych
• WaŜny element wstępnej analizy danych
• Nieodzowna ilustracja problemu i uzyskanych wyników
• Wielobok liczebności, histogram, szereg skumulowany, …– Dobór rodzaju wykresu, skali i szerokości klas
Szereg rozdzielczy
• Statystyczny sposób prezentacji rozkładu empirycznego.
• Uporządkowany materiał statystyczny w przedziałach klasowych utworzonych wg wartości badanej cechy
Szereg rozdzielczy
• Uzyskuje się go dzieląc dane statystyczne na pewne kategorie i podając liczebność(częstość) zbiorów danych przypadających na kaŜdą z tych kategorii
• Szereg moŜe być:– strukturalny (cecha jakościowa)
– punktowy (cecha ilościowa, skokowa)
– przedziałowy (cecha ilościowa, ciągła)
Szereg rozdzielczy
xi ni Σni pi Σpi
4
6
8
10
12
14
16
23
82
73
45
24
2
1
23
105
178
223
247
249
250
0,092
0,328
0,292
0,180
0,096
0,008
0,004
0,092
0,420
0,712
0,892
0,988
0,996
1,000
Σ 250 1,000