BIOSTATYSTYKA

10
Katedra i Zaklad Epidemiologii Wydzial Lekarski w Katowicach Tel./Fax: (32) 2523734 Ul. Medyków 18, 40-752 Katowice Śląski Uniwersytet Medyczny E-mail: [email protected] BIOSTATYSTYKA ZAJĘCIA FAKULTATYWNE DLA STUDENTÓW WYDZIALU LEKARSKIEGO W KATOWICACH ŚLĄSKI UNIWERSYTET MEDYCZNY – 2012 R. INFORMACJA DLA STUDENTÓW UCZESTNICZĄCYCH W ZAJĘCIACH *** Zajęcia są prowadzone w Katedrze Epidemiologii (Katowice-Ligota, ul. Medyków 18, IV piętro), przez zespól w skladzie: 1. Dr hab. n. med. Malgorzata Kowalska - adiunkt 2. Dr n. med. Grzegorz BroŜek - adiunkt 3. Prof. dr hab. n. med. Jan E. Zejda – kierownik Katedry *** Zajęcia odbywają się zgodnie z harmonogramem przekazanym przez Dziekanat Wydzialu Lekarskiego w Katowicach, obejmującym cztery sesje (cztery dni dydaktyczne): Dzień I: Baza danych. Metody statystyki opisowej Dzień II: Testy statystycznej znamienności zaleŜności Dzień III: Testy statystycznej znamienności róŜnic Dzień IV: Uniwersalna strategia analizy danych. Statystyczna ocena diagnostycznej trafności testów klinicznych *** Warunkiem uzyskania zaliczenia końcowego jest realizacja zadań przewidzianych programem zajęć i udzial we wszystkich sesjach, potwierdzony listą obecności. Kwestie organizacyjne wymagające uzgodnień pomiędzy Studentami i prowadzącymi zajęcia moŜna zglaszać bezpośrednio w Sekretariacie Katedry. *** Niniejszy dokument przedstawia informacje dotyczące poszczególnych sesji i obejmujące: Cele Sesji; Organizację Sesji; Wymagania Wstępne; Warunki Zaliczenia; Materialy Dydaktyczne *** Niniejszy dokument i dodatkowe materialy (w tym sekcje metodologiczne publikowane w biuletynie Epinarium) są dostępne na stronie internetowej Katedry: epidemiologia.sum.edu.pl. (haslo dostępu zostanie przekazane Studentom, dostęp do Epinarium jest wolny)

Transcript of BIOSTATYSTYKA

Page 1: BIOSTATYSTYKA

Katedra i Zakład Epidemiologii – Wydział Lekarski w Katowicach – Tel./Fax: (32) 2523734 Ul. Medyków 18, 40-752 Katowice Śląski Uniwersytet Medyczny E-mail: [email protected]

BIOSTATYSTYKA

ZAJĘCIA FAKULTATYWNE DLA STUDENTÓW WYDZIAŁU LEKARSKIEGO W KATOWICACH ŚLĄSKI UNIWERSYTET MEDYCZNY – 2012 R.

INFORMACJA DLA STUDENTÓW UCZESTNICZ ĄCYCH W ZAJ ĘCIACH

***

Zajęcia są prowadzone w Katedrze Epidemiologii (Katowice-Ligota, ul. Medyków 18, IV piętro), przez zespół w składzie:

1. Dr hab. n. med. Małgorzata Kowalska - adiunkt 2. Dr n. med. Grzegorz BroŜek - adiunkt 3. Prof. dr hab. n. med. Jan E. Zejda – kierownik Katedry

***

Zajęcia odbywają się zgodnie z harmonogramem przekazanym przez Dziekanat Wydziału Lekarskiego w Katowicach, obejmującym cztery sesje (cztery dni dydaktyczne):

Dzień I: Baza danych. Metody statystyki opisowej Dzień II: Testy statystycznej znamienności zaleŜności Dzień III: Testy statystycznej znamienności róŜnic Dzień IV: Uniwersalna strategia analizy danych. Statystyczna ocena diagnostycznej

trafności testów klinicznych

***

Warunkiem uzyskania zaliczenia końcowego jest realizacja zadań przewidzianych programem zajęć i udział we wszystkich sesjach, potwierdzony listą obecności. Kwestie organizacyjne

wymagające uzgodnień pomiędzy Studentami i prowadzącymi zajęcia moŜna zgłaszać bezpośrednio w Sekretariacie Katedry.

***

Niniejszy dokument przedstawia informacje dotyczące poszczególnych sesji i obejmujące:

Cele Sesji; Organizację Sesji; Wymagania Wstępne; Warunki Zaliczenia; Materiały Dydaktyczne

*** Niniejszy dokument i dodatkowe materiały (w tym sekcje metodologiczne publikowane w

biuletynie Epinarium) są dostępne na stronie internetowej Katedry: epidemiologia.sum.edu.pl. (hasło dostępu zostanie przekazane Studentom, dostęp do Epinarium jest wolny)

Page 2: BIOSTATYSTYKA

DZIEŃ I

- BAZA DANYCH. METODY STATYSTYKI OPISOWEJ – sesja wstępna zajęć fakultatywnych – prowadzący:

dr hab. n. med. Małgorzata Kowalska, dr n. med. Grzegorz BroŜek

Cele Sesji: 1. Przekazanie Studentom wiedzy i umiejętności w zakresie podstawowej, praktycznej strategii konstrukcji bazy danych; 2. Przekazanie Studentom wiedzy i umiejętności w zakresie prostych metod statystyki opisowej Organizacja Sesji: 1. Prelekcja I (klasyfikacja zmiennych: zmienne ilościowe i jakościowe, wartość zmiennej i moŜliwości statystyki opisowej w arkuszu kalkulacyjnym Excel i programie Statistica 9.0) 2. Ćwiczenie I (konstruowanie bazy danych w arkuszu Excel) 3. Ćwiczenie II (statystyka opisowa: miary połoŜenia i miary zmienności) 5. Podsumowanie sesji Wymagania Wstępne: Znajomość podstawowych pojęć z zakresu statystyki opisowej: miary połoŜenia i miary zmienności, umiejętność pracy z uŜyciem komputera i zastosowania arkusza kalkulacyjnego Excel Warunki Zaliczenia Sesji: Obecność podczas sesji i wykonanie zadań opisanych w Instrukcji dla Studentów (udostępnionej podczas sesji) Materiały Dydaktyczne a) Scenariusz przygotowania bazy danych (problem do rozwiązania) - załącznik b) Instrukcja dla Studentów – tekst i kwestionariusz udostępniony w trakcie sesji

Page 3: BIOSTATYSTYKA

DZIEŃ I

SCENARIUSZ I ZAKRES ANALIZY DANYCH

SCENARIUSZ I Na wstępie studenci zostaną poproszeni o wypełnienie krótkiego kwestionariusza przygotowanego przez prowadzącego zajęcia. Treść pytań jest następująca:

1. GRUPA:………

2. PŁEĆ: M K

3. WIEK:………..lat

4. WZROST:……cm

5. MASA CIAŁA:……..kg

6. BMI :………(do obliczenia z wykorzystaniem moŜliwości arkusza Excel)

7. CIŚNIENIE ………/……..mmHg

8. CZY PAN/PANI PALI PAPIEROSY:. TAK NIE

9. JEŚLI TAK, PROSZĘ WPISAĆ ILE SZTUK DZIENNIE……………………….

10. JEŚLI TAK, PROSZĘ WPISAĆ OD KTÓREGO ROKU śYCIA………………..

11. CZY W CIĄGU OSTATNIEGO ROKU PRZYNAJMNIEJ RAZ BOLAŁA PANA/PANIĄ

GŁOWA? TAK NIE

12. JEŚLI TAK, PROSZĘ OKREŚLIĆ ILE RAZY W CIĄGU OSTATNICH 30 DNI BOLAŁA

PANA/PANIĄ GŁOWA? …………..razy

Celem zadań zaplanowanych w trakcie sesji jest opanowanie umiejętności przygotowania własnej bazy danych w oparciu o badanie kwestionariuszowe przeprowadzone na wstępie zajęć, w tym umiejętności:

1. wpisywania przypadków i zmiennych oraz ich wartości 2. korekty wpisywanych danych z wykorzystaniem moŜliwości filtrowania w arkuszu Excel 3. obliczania wartości średniej, modalnej, mediany, centyli dla zmiennych ilościowych z

wykorzystaniem arkusza Excel i programu Statistica 9.0 w całej grupie oraz w podgrupach definiowanych np. przez płeć

4. obliczania częstości zmiennych jakościowych z wykorzystaniem arkusza Excel i programu Statistica 9.0 w całej grupie oraz w podgrupach definiowanych np. przez płeć

5. prezentacji wyników analizy opisowej w postaci tabel i wykresów 6. obliczania miar rozproszenia i zmienności dla zmiennych ilościowych (zakres, odchylenie

standardowe, wariancja, odstęp międzykwartylowy, współczynnik zmienności), rozkłady zmiennych

7. przekodowywania zmiennej ilościowej na zmienną jakościową (z wykorzystaniem zadanego kryterium np. wartości mediany lub tercyli)

Page 4: BIOSTATYSTYKA

DZIEŃ I

SCENARIUSZ I ZAKRES ANALIZY DANYCH

SCENARIUSZ II

Druga sesja zajęć fakultatywnych polega na indywidualnej pracy studenta z bazą danych przygotowaną przez prowadzącego. Baza powstała w ramach projektu realizowanego w Katedrze i Zakładzie Epidemiologii ŚUM w Katowicach, którego celem była m.in. ocena uwarunkowań ciśnienia tętniczego u dzieci w wieku szkolnym. Na polecenie prowadzącego zajęcia studenci są zobowiązani zapoznać się z zakresem zebranych danych, powinni dokonać weryfikacji bazy danych pod względem poprawności wpisanych wartości (odwołanie do umiejętności nabytych w trakcie zajęć sesji I). Celem zajęć jest przygotowanie studenta do statystyki analitycznej. Zadaniem studentów jest:

1. prezentacja statystyk opisowych (miary połoŜenia i rozproszenia) dla wskazanych zmiennych ilościowych i jakościowych w postaci tabel (dla całej grupy oraz odrębnie dla uczniów szkół podstawowych, gimnazjalnych i liceów): - masa urodzeniowa, - długość urodzeniowa, - aktualna masa ciała, - wartość ciśnienia skurczowego i rozkurczowego, - częstość dziewcząt i chłopców, - częstość dzieci rodzinnie obciąŜonych nadciśnieniem tętniczym

2. prezentacja rozkładów zmiennych ilościowych i jakościowych 3. porównanie dzieci w zakresie zmienności urodzeniowej masy i długości ciała, aktualnej masy

ciała i wzrostu 4. przekodowanie zmiennej ilościowej (masa urodzeniowa w gramach) na zmienną jakościową

(prawidłowa masa urodzeniowa, mała masa urodzeniowa, duŜa masa urodzeniowa) i jej prezentacja na wykresie

Page 5: BIOSTATYSTYKA

DZIEŃ II

- TESTY STATYSTYCZNEJ ZNAMIENNOŚCI ZALEśNOŚCI – druga sesja zajęć fakultatywnych – prowadzący:

dr hab. n med. Małgorzata Kowalska, dr n. med. Grzegorz BroŜek

Cele Sesji: 1. Przekazanie Studentom wiedzy i praktycznych umiejętności w zakresie strategii stosowania testów zaleŜności wraz z umiejętnością krytycznej oceny uzyskanych wyników. Organizacja Sesji: 1. Prelekcja I (testy parametryczne i nieparametryczne, moŜliwości arkusza kalkulacyjnego Excel i programu Statistica 9.0) 2. Ćwiczenie

- obliczanie współczynników korelacji Pearsona i ich interpretacja, moŜliwości graficznej prezentacji wyników w programie Statistica 9.0 - obliczanie współczynników korelacji rang Spearmana i ich interpretacja - obliczanie współczynników Yula i ich interpretacja

3. Podsumowanie sesji Wymagania Wstępne: Znajomość podstawowych pojęć z zakresu statystyki opisowej oraz analitycznej: zmienne ilościowe i jakościowe, współczynnik korelacji i determinacji, umiejętność pracy z uŜyciem komputera i zastosowania arkusza kalkulacyjnego Excel oraz umiejętność pracy z bazą danych w programie Statistica 9.0 Warunki Zaliczenia Sesji: Obecność podczas sesji i wykonanie zadań opisanych w Instrukcji dla Studentów (udostępnionej podczas sesji) Materiały Dydaktyczne a) Scenariusz problemów do rozwiązania - załącznik b) Instrukcja dla Studentów – tekst udostępniony w trakcie sesji

Page 6: BIOSTATYSTYKA

DZIEŃ II

SCENARIUSZ I ZAKRES ANALIZY DANYCH

SCENARIUSZ I Na wstępie studenci zostaną poproszeni o wyznaczenie wartości współczynników korelacji liniowej dla wybranych zmiennych z kwestionariusza wypełnianego podczas pierwszej sesji zajęć fakultatywnych (baza danych). Treść poleceń jest następująca: 1. Proszę ocenić zaleŜność pomiędzy wielkością masy ciała, wzrostu oraz wskaźnika naleŜnej masy ciała a wartością ciśnienia skurczowego i rozkurczowego krwi w badanej grupie studentów. 2. Proszę ocenić zaleŜność pomiędzy wielkością masy ciała, wzrostu oraz wskaźnika naleŜnej masy ciała a wartością ciśnienia skurczowego i rozkurczowego krwi odrębnie dla kobiet i męŜczyzn. 3. Proszę ocenić zaleŜność pomiędzy płcią i częstością palenia tytoniu oraz pomiędzy płcią i częstością deklarowanych bólów głowy w trakcie ostatniego roku. Celem zadań zaplanowanych w trakcie sesji jest opanowanie umiejętności stosowania testów zaleŜności, w tym umiejętności:

1. obliczania wartości współczynników korelacji liniowej Pearsona wraz z poziomem istotności statystycznej, z wykorzystaniem arkusza Excel i programu Statistica 9.0 w całej grupie oraz w podgrupach definiowanych np. przez płeć

2. graficznej prezentacji zaleŜności liniowej w programie Statistica 9.0 oraz jej interpretacji 3. obliczania wartości współczynników Yula dla zmiennych jakościowych z wykorzystaniem

programu Statistica 9.0 (tabele wielodzielcze)

SCENARIUSZ II Druga sesja zajęć fakultatywnych polega na indywidualnej pracy studenta z bazą danych przygotowaną przez prowadzącego. Baza powstała w ramach projektu realizowanego w Katedrze i Zakładzie Epidemiologii ŚUM w Katowicach, którego celem była m.in. ocena uwarunkowań ciśnienia tętniczego u dzieci w wieku szkolnym. Omawiana baza była juŜ wykorzystywana przez studentów podczas pierwszej sesji zajęć fakultatywnych (baza danych) w zakresie statystyki opisowej. Na polecenie prowadzącego zajęcia studenci są zobowiązani do następujących obliczeń:

1. współczynnik korelacji liniowej (wraz z graficzną prezentacją) dla zaleŜności pomiędzy masą i długością urodzeniową a aktualną masą ciała, wartością ciśnienia skurczowego i rozkurczowego krwi ( w całej grupie dzieci oraz oddzielnie dla dziewcząt i chłopców)

2. współczynnik korelacji rang Spearmana dla zaleŜności pomiędzy wartością skali Apgar u dzieci a aktualną masą ciała, wskaźnikiem BMI, wartością ciśnienia skurczowego i rozkurczowego krwi (w całej grupie dzieci oraz oddzielnie dla dziewcząt i chłopców)

3. współczynnik Yula dla zaleŜności pomiędzy płcią, rodzinnym obciąŜeniem chorobami układu sercowo-naczyniowego, otyłością a wartością nadciśnienia tętniczego u badanych dzieci.

Page 7: BIOSTATYSTYKA

DZIEŃ III

- TESTY STATYSTYCZNEJ ZNAMIENNOŚCI RÓśNIC - trzecia sesja zajęć fakultatywnych – prowadzący:

dr n med. Grzegorz BroŜek, dr hab. n. med. Małgorzata Kowalska

Cele Sesji: Przekazanie Studentom wiedzy i praktycznych umiejętności w zakresie strategii stosowania testów statystycznej znamienności róŜnic wraz z umiejętnością krytycznej oceny uzyskanych wyników Organizacja Sesji: 1. Prelekcja: testy statystycznej znamienności róŜnic dla zmiennych jakościowych i ilościowych. 2. Ćwiczenie 1: - identyfikacja zmiennych ilościowych i jakościowych w bazie danych - sprawdzenie poprawności danych na podstawie analizy opisowej zmiennych; korekta bazy. - analiza testów róŜnic dla zmiennych ilościowych o rozkładzie normalnym -analiza testów róŜnic dla zmiennych ilościowych o rozkładzie innym niŜ normalny - analiza róŜnic dla zmiennych jakościowych - graficzna prezentacja wyników 3. Ćwiczenie 2: - samodzielna praca i uzupełnianie wyników analizy 4. Podsumowanie sesji Wymagania Wstępne: Znajomość podstawowych pojęć z zakresu statystyki opisowej. Umiejętność pracy z uŜyciem komputera i bazą danych w programie Statistica. Warunki Zaliczenia Sesji: Obecność podczas sesji i wykonywanie zadań opisanych w instrukcji dla Studentów (udostępnionej podczas sesji) Materiały Dydaktyczne: a) Baza danych b) Kwestionariusz będący słownikiem do bazy danych – załącznik c) Plik, będący opisem wyników badania, który studenci uzupełniają w trakcie zajęć

Page 8: BIOSTATYSTYKA

DZIEŃ III

SCENARIUSZ I ZAKRES ANALIZY DANYCH Trzecia sesja zajęć fakultatywnych polega na indywidualnej pracy Studenta z bazą danych przygotowana przez prowadzącego. Baza powstała w ramach projektu realizowanego w Katedrze i Zakładzie Epidemiologii SUM w Katowicach, którego celem było rozpoznanie częstości i określenie czynników ryzyka astmy i chorób alergicznych w populacji dziecięcej Celem zajęć jest przygotowanie Studenta do statystyki analitycznej w zakresie testów znamienności róŜnic. Zajęcia są zaplanowane w ten sposób, Ŝe dla kaŜdego z testów najpierw operację przeprowadza prowadzący (rzutnik), następnie studenci są proszeni o powtórzenie obliczeń na swoich komputerach, a potem o samodzielne wykonanie podobnego zadania na innych zmiennych. Zadaniem uczestników jest: A. Prawidłowa identyfikacja zmiennych ilościowych i jakościowych w bazie danych. B. Krytyczny ogląd danych w poszukiwaniu potencjalnych błędów; korekcja błędów. C. Przeprowadzenie prostych analiz opisowych – praktyczna powtórka zajęć poprzednich. D. Przeprowadzenie analizy normalności rozkładu zmiennych (test Kołmogorowa-Smirnowa, W Shapiro-Wilka, Lillieforsa) E. Analiza róŜnic dla zmiennych ilościowych – testy t-Studenta, ANOVA, U Manna-Whitneya, Wilcoxona, ANOVA Kruskala-Wallisa. F. Analiza róŜnic dla zmiennych jakościowych – test Ch-kwadrat

(szczegóły dotyczące zadań A-F będą przekazane podczas sesji)

Page 9: BIOSTATYSTYKA

DZIEŃ IV

- UNIWERSALNA STRATEGIA ANALIZY DANYCH - -STATYSTYCZNA OCENA DIAGNOSTYCZNEJ TRAFNOŚCI TESTÓW KLINICZNYCH-

sesja kończąca cykl zajęć fakultatywnych – prowadzący: prof. dr hab. med. Jan E. Zejda

Cele Sesji: 1. Przekazanie Studentom wiedzy i umiejętności w zakresie podstawowej, praktycznej strategii analizy danych; 2. Przekazanie Studentom wiedzy i umiejętności w zakresie prostych, statystycznych metod oceny trafności diagnostycznej testów klinicznych Organizacja Sesji: 1. Prelekcja I (definicja zmiennych, schemat analizy danych) 2. Ćwiczenie I (statystyka opisowa) 3. Prelekcja II (metody statystycznej oceny wartości diagnostycznej testów) 4. Ćwiczenie II (statystyka analityczna, analiza trafności diagnostycznej testu) 5. Podsumowanie sesji Wymagania Wstępne: Znajomość podstawowych metod statystyki opisowej i analitycznej, umiejętność pracy z uŜyciem komputera i zastosowania edytora tekstu Word (uwaga: umiejętność korzystania z programu statystycznego ‘Statistica’ w zakresie procedur wprowadzonych podczas sesji zostanie Studentom przekazana podczas zajęć) Warunki Zaliczenia Sesji: Obecność podczas sesji i wykonanie zadań opisanych w Instrukcji dla Studentów (udostępnionej podczas sesji) Materiały Dydaktyczne a) Scenariusz analizy danych (problem do rozwiązania) - załącznik b) Instrukcja dla Studentów – tekst udostępniony w trakcie sesji

Page 10: BIOSTATYSTYKA

DZIEŃ IV

SCENARIUSZ I ZAKRES ANALIZY DANYCH

Scenariusz*

Noworodki przedwcześnie urodzone odznaczają się niedojrzałością szeregu systemów i funkcji ustrojowych. Stosunkowo słabo poznana, aczkolwiek istotna, jest w tej grupie pacjentów funkcja tzw. bariery jelitowej. Obecność i stopień upośledzenia tej bariery (nadmierna przepuszczalność) moŜna zmierzyć przy pomocy tzw. testu absorpcji cukrów. Polega on na doŜołądkowym podaniu laktulozy (L) i mannitolu (M), w znanych dawkach. Mannitol łatwo przenika przez barierę jelitową, laktuloza – przy zachowanej funkcji nabłonka jelitowego – pozostaje w świetle jelit. W warunkach fizjologicznych mannitol jest zatem wydalany w moczu, a laktuloza znajduje się w nim w znikomych ilościach. W rezultacie, w warunkach fizjologicznych, stosunek stęŜenia laktulozy do mannitolu w moczu (wskaźnik L/M) jest mały („mały licznik” i „duŜy mianownik”). Im większa przepuszczalność bariery jelitowej tym większa jest wartość wskaźnika L/M. Badanie wskaźnika L/M jest skomplikowane. W związku z tym zasadne jest poszukiwanie innych ustrojowych markerów upośledzenia bariery jelitowej. PoniewaŜ to zaburzenie jest – w dominującym stopniu – wynikiem niedotlenienia ściany jelit potencjalnymi i pośrednimi markerami tego zaburzenia mogą być enzymy wraŜliwe na obecność niedotlenienia ustrojowego. [*Scenariusz został opracowany na podstawie protokołu projektu badawczego "Ocena przepuszczalności

błony śluzowej przewodu pokarmowego u wcześniaków z hemodynamicznie czynnym przetrwałym przewodem tętniczym", po uzyskaniu zgody kierownika projektu,

dr Ewy Musialik-Świetlińskiej - Katedra Pediatrii, WLK, Katowice] Celem zadań zaplanowanych w trakcie sesji jest odpowiedź na pytania badawcze: 1. Jaki jest zakres przepuszczalności bariery jelitowej u noworodków przedwcześnie urodzonych ? 2. Które ze zbadanych czynników wpływają na przepuszczalność bariery jelitowej ? 3. Czy istnieje zaleŜność przepuszczalności bariery jelitowej od enzymów wraŜliwych na niedotlenienie ustrojowe ? 4. Jaka jest trafność diagnostyczna wybranych enzymów w odniesieniu do upośledzenia przepuszczalności bariery jelitowej ?

Analiza Danych A. Statystyka opisowa (przegląd zmiennych, ich wybór w odniesieniu do pytań badawczych, prezentacja rozkładów) B. Wyznaczenie wartości referencyjnej Wskaźnika L/M C. Transformacja zmiennych D. Statystyka analityczna I (test t-Studenta, test chi2, analiza korelacji) E. Statystyka analityczna II (demonstracja analizy stratyfikacyjnej i wielu zmiennych) F. Statystyczna ocena trafności testu diagnostycznego

(szczegóły dotyczące zadań A-F będą przekazane podczas sesji, w Instrukcji dla Studentów)