Wprowadzenie do obsługi programu statystycznego SAS...
Transcript of Wprowadzenie do obsługi programu statystycznego SAS...
Katedra Biotechnologii i Genetyki Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy
Dariusz Piwczyński; Materiały do ćwiczeń ze Narzędzia statystyczne w badaniach naukowych;
Strona 1
Temat:
Wprowadzenie do obsługi programu statystycznego SAS Enterprise Guide. Statystyka opisowa w SAS Enterprise Guide.
Zadania: I. 1. Załóż we własnym folderze podfolder o nazwie cw2 i przekopiuj do niego plik ams.xlsx z
S:\STAT2019\bazy_XLSX. 2. Uruchom program Enterprise Guide
3. Rozpocznij pracę z nowym projektem (Plik → Nowy → Projekt). Zapisz jego zawartość w założonym folderze cw2 pod nazwą miary.egp.
4. Zadeklaruj bibliotekę o nazwie STAT. Przypisz ją do lokalizacji własnego folderu cw2 (Narzędzia → Przypisz bibliotekę projektu).
Katedra Biotechnologii i Genetyki Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy
Dariusz Piwczyński; Materiały do ćwiczeń ze Narzędzia statystyczne w badaniach naukowych;
Strona 2
5. Importuj do EG arkusz roboczy STAT ze skoroszytu MS Excel o nazwie ams.xlsx. Importowany arkusz zapisz pod nazwą ams w bibliotece STAT.
6. Otwórz importowany zbiór danych a następnie sformatuj kolumnę DataUrodz tak, aby data była
zapisana w formacie YYYY-MM-DD. Sformatuj zawartość kolumny Dolew tak, aby liczba miejsc dziesiętnych była równa 2. Zanim zaczniesz modyfikować zawartość kolumn zdejmij z nich
ochronę: Edycja → Chroń dane! DataUrodz Wyszukaj format YYMMDDDw.d i zmień szerokość na 10
Dolew Wyszukaj format w.d i ustaw miejsca dziesiętne na 2.
Katedra Biotechnologii i Genetyki Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy
Dariusz Piwczyński; Materiały do ćwiczeń ze Narzędzia statystyczne w badaniach naukowych;
Strona 3
7. Za zmienną DataWyc1 (zaznacz tę kolumnę) wstaw nową kolumnę o nazwie KodMies1, która
będzie zawierała informację w postaci liczby porządkowej o miesiącu, w którym odbyło się wycielenie krowy. Wprowadź wyrażenie month(DatWyc1), jak na załączonym zrzucie ekranu.
8. W kolejnym kroku utwórz kolumnę wyliczaną o nazwie PoraRoku1, która zawierać będzie
informację o porze roku, w odbył się poród.
Katedra Biotechnologii i Genetyki Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy
Dariusz Piwczyński; Materiały do ćwiczeń ze Narzędzia statystyczne w badaniach naukowych;
Strona 4
Tabela 1. Kodowanie pór roku
Pora roku Miesiące (KodMies1)
zima 12, 1, 2
wiosna 3, 4, 5
lato 6, 7, 8
jesień 9, 10, 11
W tym celu zaznacz na diagramie projektu tabelę ams, a następnie z pop-menu wybierz Budowanie zapytań!
W kolejnym kroku zaznacz zmienne wchodzące w skład tabeli ams a następnie przeciągnij na położone po prawej stronie okno zatytułowane Wybierz dane
Katedra Biotechnologii i Genetyki Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy
Dariusz Piwczyński; Materiały do ćwiczeń ze Narzędzia statystyczne w badaniach naukowych;
Strona 5
Widok po przeciągnięciu zmiennych. Kliknij na przycisk Kolumny wyliczane, a potem na Nowa.
Określ typ kolumny – Kolumna przekodowana.
Katedra Biotechnologii i Genetyki Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy
Dariusz Piwczyński; Materiały do ćwiczeń ze Narzędzia statystyczne w badaniach naukowych;
Strona 6
Wybierz kolumnę (KodMies1), na podstawie której zamierzasz utworzyć zmienną PoraRoku1.
Na kolejnym etapie kliknij na Dodaj...
W celu wprowadzenia liczby 12 kliknij na Dodaj, następnie wpisz „12”. Ponów działanie, tj. kliknij na Dodaj, wpisz „1”, Kliknij na Dodaj, wpisz „2”. Wprowadź nazwę pory roku (Ujmij wartość w cudzysłów) i ostatecznie kliknij na OK.
Katedra Biotechnologii i Genetyki Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy
Dariusz Piwczyński; Materiały do ćwiczeń ze Narzędzia statystyczne w badaniach naukowych;
Strona 7
W okienku, które się pojawi kliknij na zakładkę Warunek zastąpienia. Wybierz za pomocą pola kombi operator „Na liście”. Według schematu podanego w tabeli 1 zakoduj pory roku.
Efekt naszego dotychczasowego działania (Zwróć uwagę na znakowy typ kolumny).
Katedra Biotechnologii i Genetyki Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy
Dariusz Piwczyński; Materiały do ćwiczeń ze Narzędzia statystyczne w badaniach naukowych;
Strona 8
Kolejne pory roku zakoduj w analogiczny sposób. Widok po zakodowaniu wszystkich pór roku:
W kolejnym okienku kreatora wpisz nazwę i etykietę tworzonej kolumny.
Katedra Biotechnologii i Genetyki Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy
Dariusz Piwczyński; Materiały do ćwiczeń ze Narzędzia statystyczne w badaniach naukowych;
Strona 9
Ostatni etap tworzenia kolumny wyliczanej.
Efekt kliknięcia na przycisk Koniec.
Katedra Biotechnologii i Genetyki Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy
Dariusz Piwczyński; Materiały do ćwiczeń ze Narzędzia statystyczne w badaniach naukowych;
Strona 10
Kolumna wyliczana została już zdefiniowana, naciśnij Uruchom.
Zakończenie czynności związanych z tworzeniem kolumny wyliczanej skutkuje następującym widokiem diagramu projektu:
Fragment tabeli, która powstała na podstawie ams i zawierającej zmienną PoraRoku1.
Katedra Biotechnologii i Genetyki Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy
Dariusz Piwczyński; Materiały do ćwiczeń ze Narzędzia statystyczne w badaniach naukowych;
Strona 11
Zadania do realizacji: Zadanie 1 (Przykład). Oblicz podstawowe miary położenia i zmienności w zakresie wybranych cech mleczności krów w pierwszej laktacji. Uwzględnij podział bazy danych ze względu na system doju (AMS1) (tę część zadania wykonaj już samodzielnie). Uzyskane wyniki poddaj wnikliwej interpretacji słownej! Sporządź wykres słupkowy prezentujący średnią wydajność mleka za laktację pełną w zależności od systemu doju. Wspomniane miary statystyczne obliczymy uruchamiając stosowny kreator:
W pierwszym kroku wskaż zmienne analizowane (te dla których obliczamy średnią, odchylenie standardowe) oraz klasyfikującą (AMS1).
Katedra Biotechnologii i Genetyki Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy
Dariusz Piwczyński; Materiały do ćwiczeń ze Narzędzia statystyczne w badaniach naukowych;
Strona 12
Zaznacza wybrane statystyki: średnia, odchylenie standardowe, minimum, maksimum, liczba obserwacji. Ustal maksymalną liczbę miejsc dziesiętnych wynosi na 2.
Dodatkowo wyznaczamy wartości kwartyli.
Katedra Biotechnologii i Genetyki Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy
Dariusz Piwczyński; Materiały do ćwiczeń ze Narzędzia statystyczne w badaniach naukowych;
Strona 13
oraz współczynnik zmienności Pearsona.
Ponadto wykonamy wykres histogram i pudełkowy (tzw. skrzynka z wąsami).
Katedra Biotechnologii i Genetyki Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy
Dariusz Piwczyński; Materiały do ćwiczeń ze Narzędzia statystyczne w badaniach naukowych;
Strona 14
Wpisujemy wykonawcę obliczeń
Wyniki
Objaśnienie: AMS1 = 1 okres funkcjonowania obory przed wprowadzeniem robotyzacji doju, AMS1 = 2 – okres przejściowy, tj. krowa rozpoczęła laktację w systemie konwencjonalnym, zakończyła w automatycznym; AMS1 = 3 – okres funkcjonowania obory po wprowadzeniu robotyzacji doju.
Stwierdzono znaczne zróżnicowanie cech mleczności pierwiastek w konwencjonalnym (1) i automatycznym (3) systemie doju. W efekcie wprowadzonej robotyzacji doju o 2260,67 kg zwiększyła się wydajność mleka za laktację pełną, zaś o 0,17 punktów procentowych (p. p.) zmalała zawartość tłuszczu i o 0,04 p. p. zawartość białka w mleku.
Biorąc pod uwagę wartość kwartyli obliczonych dla wydajności mleka, można stwierdzić że 25% pierwiastek w systemie konwencjonalnym charakteryzowało się wydajnością mleka poniżej 5586 kg. 50% krów nie przekroczyło pod względem produkcji mleka 7410 kg, zaś 75% charakteryzowało się produkcją mleka poniżej 9404 kg. Oznacza to jednocześnie, że 25% pierwiastek w laktacji pełnej uzyskało powyżej 9404 kg mleka. Analogiczne wartości kwartyli w odniesieniu do systemu automatycznego wyniosły: 8059 kg, 9677 kg i 11522 kg.
Katedra Biotechnologii i Genetyki Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy
Dariusz Piwczyński; Materiały do ćwiczeń ze Narzędzia statystyczne w badaniach naukowych;
Strona 15
Analizując obliczone miary rozproszenia (Vx) można stwierdzić, że wydajność mleka charakteryzowała się blisko trzykrotnie wyższą zmiennością niż zawartość tłuszczu i pięciokrotnie niż zawartość białka. Podkreślenia wymaga fakt, że krowy użytkowane w systemie konwencjonalnym charakteryzowały się nieznacznie większą zmiennością niż dojone przy użyciu robotów udojowych. Wykres skrzynka z wąsami.
Tworzenie wykres słupkowego Kreator wykresów znajdziemy w menu Zadanie.
Katedra Biotechnologii i Genetyki Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy
Dariusz Piwczyński; Materiały do ćwiczeń ze Narzędzia statystyczne w badaniach naukowych;
Strona 16
Ustal zmienne konieczne do sporządzenia wykresu.
W Zawansowane zmień rodzaj statystyki wyznaczającej słupek (Średnia).
Katedra Biotechnologii i Genetyki Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy
Dariusz Piwczyński; Materiały do ćwiczeń ze Narzędzia statystyczne w badaniach naukowych;
Strona 17
Efekt działania kreatora:
Zadanie 2. Wykonaj analogiczną analizę w zakresie biologicznego zanieczyszczenia ścieków o różnym pochodzeniu! Wcześniej jednak importuj arkusz roboczy Dane skoroszytu Excela o nazwie bakterie.xlsx. Wykonaj transformację logarytmiczną zmiennych zawierających liczbę kolonii drobnoustrojów. W wyniku transformacji zostaną dodane nowe kolumny. Zadanie 3. Importuj do EG zawartość skoroszytu Excela dziecko.xlsx (arkusz DANE). Oblicz znane Ci miary położenia klasyczne (średnia arytmetyczna)i pozycyjne (kwartyle, dominanta) oraz miary zmienności (odchylenie standardowe, współczynnik zmienności) w odniesieniu do zmiennej Apgar, masa i długość Zadanie 4. Importuj do EG zawartość skoroszytu Excela konie.xlsx. Oblicz znane Ci miary położenia klasyczne (średnia arytmetyczna)i pozycyjne (kwartyle, dominanta) oraz miary zmienności (odchylenie standardowe, współczynnik zmienności) w odniesieniu do liczby oddechów, tętna, temperatury zarejestrowanej na szyi w zależności od grupy koni i czasu wykonania badania.