Wprowadzenie do obsługi programu statystycznego SAS...

17
Katedra Biotechnologii i Genetyki Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy Dariusz Piwczyński; Materiały do ćwiczeń ze Narzędzia statystyczne w badaniach naukowych; Strona 1 Temat: Wprowadzenie do obsługi programu statystycznego SAS Enterprise Guide. Statystyka opisowa w SAS Enterprise Guide. Zadania: I. 1. Załóż we własnym folderze podfolder o nazwie cw2 i przekopiuj do niego plik ams.xlsx z S:\STAT2019\bazy_XLSX. 2. Uruchom program Enterprise Guide 3. Rozpocznij pracę z nowym projektem (Plik Nowy Projekt). Zapisz jego zawartość w założonym folderze cw2 pod nazwą miary.egp. 4. Zadeklaruj bibliotekę o nazwie STAT. Przypisz ją do lokalizacji własnego folderu cw2 (Narzędzia Przypisz bibliotekę projektu).

Transcript of Wprowadzenie do obsługi programu statystycznego SAS...

Page 1: Wprowadzenie do obsługi programu statystycznego SAS ...dp.utp.edu.pl/assets/files/statBad2_EG.pdfWprowadzenie do obsługi programu statystycznego SAS Enterprise Guide. Statystyka

Katedra Biotechnologii i Genetyki Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Dariusz Piwczyński; Materiały do ćwiczeń ze Narzędzia statystyczne w badaniach naukowych;

Strona 1

Temat:

Wprowadzenie do obsługi programu statystycznego SAS Enterprise Guide. Statystyka opisowa w SAS Enterprise Guide.

Zadania: I. 1. Załóż we własnym folderze podfolder o nazwie cw2 i przekopiuj do niego plik ams.xlsx z

S:\STAT2019\bazy_XLSX. 2. Uruchom program Enterprise Guide

3. Rozpocznij pracę z nowym projektem (Plik → Nowy → Projekt). Zapisz jego zawartość w założonym folderze cw2 pod nazwą miary.egp.

4. Zadeklaruj bibliotekę o nazwie STAT. Przypisz ją do lokalizacji własnego folderu cw2 (Narzędzia → Przypisz bibliotekę projektu).

Page 2: Wprowadzenie do obsługi programu statystycznego SAS ...dp.utp.edu.pl/assets/files/statBad2_EG.pdfWprowadzenie do obsługi programu statystycznego SAS Enterprise Guide. Statystyka

Katedra Biotechnologii i Genetyki Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Dariusz Piwczyński; Materiały do ćwiczeń ze Narzędzia statystyczne w badaniach naukowych;

Strona 2

5. Importuj do EG arkusz roboczy STAT ze skoroszytu MS Excel o nazwie ams.xlsx. Importowany arkusz zapisz pod nazwą ams w bibliotece STAT.

6. Otwórz importowany zbiór danych a następnie sformatuj kolumnę DataUrodz tak, aby data była

zapisana w formacie YYYY-MM-DD. Sformatuj zawartość kolumny Dolew tak, aby liczba miejsc dziesiętnych była równa 2. Zanim zaczniesz modyfikować zawartość kolumn zdejmij z nich

ochronę: Edycja → Chroń dane! DataUrodz Wyszukaj format YYMMDDDw.d i zmień szerokość na 10

Dolew Wyszukaj format w.d i ustaw miejsca dziesiętne na 2.

Page 3: Wprowadzenie do obsługi programu statystycznego SAS ...dp.utp.edu.pl/assets/files/statBad2_EG.pdfWprowadzenie do obsługi programu statystycznego SAS Enterprise Guide. Statystyka

Katedra Biotechnologii i Genetyki Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Dariusz Piwczyński; Materiały do ćwiczeń ze Narzędzia statystyczne w badaniach naukowych;

Strona 3

7. Za zmienną DataWyc1 (zaznacz tę kolumnę) wstaw nową kolumnę o nazwie KodMies1, która

będzie zawierała informację w postaci liczby porządkowej o miesiącu, w którym odbyło się wycielenie krowy. Wprowadź wyrażenie month(DatWyc1), jak na załączonym zrzucie ekranu.

8. W kolejnym kroku utwórz kolumnę wyliczaną o nazwie PoraRoku1, która zawierać będzie

informację o porze roku, w odbył się poród.

Page 4: Wprowadzenie do obsługi programu statystycznego SAS ...dp.utp.edu.pl/assets/files/statBad2_EG.pdfWprowadzenie do obsługi programu statystycznego SAS Enterprise Guide. Statystyka

Katedra Biotechnologii i Genetyki Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Dariusz Piwczyński; Materiały do ćwiczeń ze Narzędzia statystyczne w badaniach naukowych;

Strona 4

Tabela 1. Kodowanie pór roku

Pora roku Miesiące (KodMies1)

zima 12, 1, 2

wiosna 3, 4, 5

lato 6, 7, 8

jesień 9, 10, 11

W tym celu zaznacz na diagramie projektu tabelę ams, a następnie z pop-menu wybierz Budowanie zapytań!

W kolejnym kroku zaznacz zmienne wchodzące w skład tabeli ams a następnie przeciągnij na położone po prawej stronie okno zatytułowane Wybierz dane

Page 5: Wprowadzenie do obsługi programu statystycznego SAS ...dp.utp.edu.pl/assets/files/statBad2_EG.pdfWprowadzenie do obsługi programu statystycznego SAS Enterprise Guide. Statystyka

Katedra Biotechnologii i Genetyki Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Dariusz Piwczyński; Materiały do ćwiczeń ze Narzędzia statystyczne w badaniach naukowych;

Strona 5

Widok po przeciągnięciu zmiennych. Kliknij na przycisk Kolumny wyliczane, a potem na Nowa.

Określ typ kolumny – Kolumna przekodowana.

Page 6: Wprowadzenie do obsługi programu statystycznego SAS ...dp.utp.edu.pl/assets/files/statBad2_EG.pdfWprowadzenie do obsługi programu statystycznego SAS Enterprise Guide. Statystyka

Katedra Biotechnologii i Genetyki Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Dariusz Piwczyński; Materiały do ćwiczeń ze Narzędzia statystyczne w badaniach naukowych;

Strona 6

Wybierz kolumnę (KodMies1), na podstawie której zamierzasz utworzyć zmienną PoraRoku1.

Na kolejnym etapie kliknij na Dodaj...

W celu wprowadzenia liczby 12 kliknij na Dodaj, następnie wpisz „12”. Ponów działanie, tj. kliknij na Dodaj, wpisz „1”, Kliknij na Dodaj, wpisz „2”. Wprowadź nazwę pory roku (Ujmij wartość w cudzysłów) i ostatecznie kliknij na OK.

Page 7: Wprowadzenie do obsługi programu statystycznego SAS ...dp.utp.edu.pl/assets/files/statBad2_EG.pdfWprowadzenie do obsługi programu statystycznego SAS Enterprise Guide. Statystyka

Katedra Biotechnologii i Genetyki Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Dariusz Piwczyński; Materiały do ćwiczeń ze Narzędzia statystyczne w badaniach naukowych;

Strona 7

W okienku, które się pojawi kliknij na zakładkę Warunek zastąpienia. Wybierz za pomocą pola kombi operator „Na liście”. Według schematu podanego w tabeli 1 zakoduj pory roku.

Efekt naszego dotychczasowego działania (Zwróć uwagę na znakowy typ kolumny).

Page 8: Wprowadzenie do obsługi programu statystycznego SAS ...dp.utp.edu.pl/assets/files/statBad2_EG.pdfWprowadzenie do obsługi programu statystycznego SAS Enterprise Guide. Statystyka

Katedra Biotechnologii i Genetyki Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Dariusz Piwczyński; Materiały do ćwiczeń ze Narzędzia statystyczne w badaniach naukowych;

Strona 8

Kolejne pory roku zakoduj w analogiczny sposób. Widok po zakodowaniu wszystkich pór roku:

W kolejnym okienku kreatora wpisz nazwę i etykietę tworzonej kolumny.

Page 9: Wprowadzenie do obsługi programu statystycznego SAS ...dp.utp.edu.pl/assets/files/statBad2_EG.pdfWprowadzenie do obsługi programu statystycznego SAS Enterprise Guide. Statystyka

Katedra Biotechnologii i Genetyki Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Dariusz Piwczyński; Materiały do ćwiczeń ze Narzędzia statystyczne w badaniach naukowych;

Strona 9

Ostatni etap tworzenia kolumny wyliczanej.

Efekt kliknięcia na przycisk Koniec.

Page 10: Wprowadzenie do obsługi programu statystycznego SAS ...dp.utp.edu.pl/assets/files/statBad2_EG.pdfWprowadzenie do obsługi programu statystycznego SAS Enterprise Guide. Statystyka

Katedra Biotechnologii i Genetyki Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Dariusz Piwczyński; Materiały do ćwiczeń ze Narzędzia statystyczne w badaniach naukowych;

Strona 10

Kolumna wyliczana została już zdefiniowana, naciśnij Uruchom.

Zakończenie czynności związanych z tworzeniem kolumny wyliczanej skutkuje następującym widokiem diagramu projektu:

Fragment tabeli, która powstała na podstawie ams i zawierającej zmienną PoraRoku1.

Page 11: Wprowadzenie do obsługi programu statystycznego SAS ...dp.utp.edu.pl/assets/files/statBad2_EG.pdfWprowadzenie do obsługi programu statystycznego SAS Enterprise Guide. Statystyka

Katedra Biotechnologii i Genetyki Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Dariusz Piwczyński; Materiały do ćwiczeń ze Narzędzia statystyczne w badaniach naukowych;

Strona 11

Zadania do realizacji: Zadanie 1 (Przykład). Oblicz podstawowe miary położenia i zmienności w zakresie wybranych cech mleczności krów w pierwszej laktacji. Uwzględnij podział bazy danych ze względu na system doju (AMS1) (tę część zadania wykonaj już samodzielnie). Uzyskane wyniki poddaj wnikliwej interpretacji słownej! Sporządź wykres słupkowy prezentujący średnią wydajność mleka za laktację pełną w zależności od systemu doju. Wspomniane miary statystyczne obliczymy uruchamiając stosowny kreator:

W pierwszym kroku wskaż zmienne analizowane (te dla których obliczamy średnią, odchylenie standardowe) oraz klasyfikującą (AMS1).

Page 12: Wprowadzenie do obsługi programu statystycznego SAS ...dp.utp.edu.pl/assets/files/statBad2_EG.pdfWprowadzenie do obsługi programu statystycznego SAS Enterprise Guide. Statystyka

Katedra Biotechnologii i Genetyki Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Dariusz Piwczyński; Materiały do ćwiczeń ze Narzędzia statystyczne w badaniach naukowych;

Strona 12

Zaznacza wybrane statystyki: średnia, odchylenie standardowe, minimum, maksimum, liczba obserwacji. Ustal maksymalną liczbę miejsc dziesiętnych wynosi na 2.

Dodatkowo wyznaczamy wartości kwartyli.

Page 13: Wprowadzenie do obsługi programu statystycznego SAS ...dp.utp.edu.pl/assets/files/statBad2_EG.pdfWprowadzenie do obsługi programu statystycznego SAS Enterprise Guide. Statystyka

Katedra Biotechnologii i Genetyki Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Dariusz Piwczyński; Materiały do ćwiczeń ze Narzędzia statystyczne w badaniach naukowych;

Strona 13

oraz współczynnik zmienności Pearsona.

Ponadto wykonamy wykres histogram i pudełkowy (tzw. skrzynka z wąsami).

Page 14: Wprowadzenie do obsługi programu statystycznego SAS ...dp.utp.edu.pl/assets/files/statBad2_EG.pdfWprowadzenie do obsługi programu statystycznego SAS Enterprise Guide. Statystyka

Katedra Biotechnologii i Genetyki Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Dariusz Piwczyński; Materiały do ćwiczeń ze Narzędzia statystyczne w badaniach naukowych;

Strona 14

Wpisujemy wykonawcę obliczeń

Wyniki

Objaśnienie: AMS1 = 1 okres funkcjonowania obory przed wprowadzeniem robotyzacji doju, AMS1 = 2 – okres przejściowy, tj. krowa rozpoczęła laktację w systemie konwencjonalnym, zakończyła w automatycznym; AMS1 = 3 – okres funkcjonowania obory po wprowadzeniu robotyzacji doju.

Stwierdzono znaczne zróżnicowanie cech mleczności pierwiastek w konwencjonalnym (1) i automatycznym (3) systemie doju. W efekcie wprowadzonej robotyzacji doju o 2260,67 kg zwiększyła się wydajność mleka za laktację pełną, zaś o 0,17 punktów procentowych (p. p.) zmalała zawartość tłuszczu i o 0,04 p. p. zawartość białka w mleku.

Biorąc pod uwagę wartość kwartyli obliczonych dla wydajności mleka, można stwierdzić że 25% pierwiastek w systemie konwencjonalnym charakteryzowało się wydajnością mleka poniżej 5586 kg. 50% krów nie przekroczyło pod względem produkcji mleka 7410 kg, zaś 75% charakteryzowało się produkcją mleka poniżej 9404 kg. Oznacza to jednocześnie, że 25% pierwiastek w laktacji pełnej uzyskało powyżej 9404 kg mleka. Analogiczne wartości kwartyli w odniesieniu do systemu automatycznego wyniosły: 8059 kg, 9677 kg i 11522 kg.

Page 15: Wprowadzenie do obsługi programu statystycznego SAS ...dp.utp.edu.pl/assets/files/statBad2_EG.pdfWprowadzenie do obsługi programu statystycznego SAS Enterprise Guide. Statystyka

Katedra Biotechnologii i Genetyki Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Dariusz Piwczyński; Materiały do ćwiczeń ze Narzędzia statystyczne w badaniach naukowych;

Strona 15

Analizując obliczone miary rozproszenia (Vx) można stwierdzić, że wydajność mleka charakteryzowała się blisko trzykrotnie wyższą zmiennością niż zawartość tłuszczu i pięciokrotnie niż zawartość białka. Podkreślenia wymaga fakt, że krowy użytkowane w systemie konwencjonalnym charakteryzowały się nieznacznie większą zmiennością niż dojone przy użyciu robotów udojowych. Wykres skrzynka z wąsami.

Tworzenie wykres słupkowego Kreator wykresów znajdziemy w menu Zadanie.

Page 16: Wprowadzenie do obsługi programu statystycznego SAS ...dp.utp.edu.pl/assets/files/statBad2_EG.pdfWprowadzenie do obsługi programu statystycznego SAS Enterprise Guide. Statystyka

Katedra Biotechnologii i Genetyki Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Dariusz Piwczyński; Materiały do ćwiczeń ze Narzędzia statystyczne w badaniach naukowych;

Strona 16

Ustal zmienne konieczne do sporządzenia wykresu.

W Zawansowane zmień rodzaj statystyki wyznaczającej słupek (Średnia).

Page 17: Wprowadzenie do obsługi programu statystycznego SAS ...dp.utp.edu.pl/assets/files/statBad2_EG.pdfWprowadzenie do obsługi programu statystycznego SAS Enterprise Guide. Statystyka

Katedra Biotechnologii i Genetyki Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Dariusz Piwczyński; Materiały do ćwiczeń ze Narzędzia statystyczne w badaniach naukowych;

Strona 17

Efekt działania kreatora:

Zadanie 2. Wykonaj analogiczną analizę w zakresie biologicznego zanieczyszczenia ścieków o różnym pochodzeniu! Wcześniej jednak importuj arkusz roboczy Dane skoroszytu Excela o nazwie bakterie.xlsx. Wykonaj transformację logarytmiczną zmiennych zawierających liczbę kolonii drobnoustrojów. W wyniku transformacji zostaną dodane nowe kolumny. Zadanie 3. Importuj do EG zawartość skoroszytu Excela dziecko.xlsx (arkusz DANE). Oblicz znane Ci miary położenia klasyczne (średnia arytmetyczna)i pozycyjne (kwartyle, dominanta) oraz miary zmienności (odchylenie standardowe, współczynnik zmienności) w odniesieniu do zmiennej Apgar, masa i długość Zadanie 4. Importuj do EG zawartość skoroszytu Excela konie.xlsx. Oblicz znane Ci miary położenia klasyczne (średnia arytmetyczna)i pozycyjne (kwartyle, dominanta) oraz miary zmienności (odchylenie standardowe, współczynnik zmienności) w odniesieniu do liczby oddechów, tętna, temperatury zarejestrowanej na szyi w zależności od grupy koni i czasu wykonania badania.