KRAKOWSKA AKADEMIA A. F. MODRZEWSKIEGOboris.kozuh.net/uploads/1/0/0/6/10069617/opracowania_2.pdf13...
Transcript of KRAKOWSKA AKADEMIA A. F. MODRZEWSKIEGOboris.kozuh.net/uploads/1/0/0/6/10069617/opracowania_2.pdf13...
3Zpracování dat v PSPP pro společenské vědy
KRAKOWSKA AKADEMIAA. F. MODRZEWSKIEGO
BORIS KOŽUH
OPRACOWANIE DANYCH W
PSPP
KRAKÓW2013
4Boris Kožuh, Jaroslav Myslivec
9Opracowanie danych w PSPP
Opis programu PSPPProgram PSPP jest darmowym programem (shareware)
do statystycznych opracowań danych w badaniach. Jest bardzo podobny do programu SPSS, umożliwia jedynie nieco mniej statystycznych metod. Dla studentów jest jednak bardzo korzystny, ponieważ pozwala na łatwe i proste korzystanie z obydwu programu. Darmowy program PSPP możemy mieć na swoim domowym komputerze, a dodatkowe opracowania w SPSS wykonywać na uczelni. W domu można wprowadzić dane i wykonać wszystkie podstawowe opracowania, a na uczelni dodatkowo wykonać w SPSS te opracowania, których PSPP nie umożliwia. Dla zdecydowanej większości studentów (kierunków humanistycznych) możliwości programu PSPP będą w całości wystarczające do pracy dyplomowej, a często nawet i do pracy doktorskiej. Jeżeli jednak będą potrzebne bardziej skomplikowane opracowania, dane wprowadzone w PSPP i zachowane na pamięci pendrive możno opracować na uczelni w SPSS. Przynajmniej w tym zakresie oba programy są kompatybilne.
ROZDZIAŁ PIERWSZY
1 Program PSPP
10Boris Kožuh
Pobieranie programu Program SPSS, z którego korzystają zarówno profesorowie,
jak i studenci niemal na wszystkich uniwersytetach świata, jest programem profesjonalnym. Jest on jednak bardzo drogi, dlatego nie kupują go ani profesorowie, ani studenci. Kupują go tylko firmy i uniwersytety. Pierwsza wersja programu pojawiła się na rynku 1968 roku, a ostatnia wersja to 21 z roku 2012. Wraz z pojawieniem sie systemu Windows, dostosowano też program SPSS do tego systemu. Autor niniejszej książki w roku 1973 opracował dane do swojej pracy dyplomowej za pomocą jednej z pierwszych wersji (wówczas jeszcze nie było systemu Windows ani komputerów domowych PC). Podręcznik do korzystania programu zawierał wtedy ponad 2000 stron.
Program PSPP jest natomiast darmowym programem, który może legalnie posiadać każdy. Program pobiera się z witryny internetowej organizacji GNU. Do wyszukiwarki należy wprowadzić adres: www.gnu.org. Otwiera się wtedy strona organizacji GNU:
Rysunek 1. Strona internetowa organizacji GNUNależy kliknąć na Downloads. Otwiera się niemal taka sama
strona jak poprzednia.
11Opracowanie danych w PSPP
Rysunek 2. Strona internetowa organizacji GNU z listą programówNa tej stronie należy poszukać listy wszystkich dostępnych
programów. Znajduje się ona w dolnej części strony pod tytułem All Gnu Packages. Lista zawiera dużo dobrych i użytecznych programów. Wśród tych programów jest też PSPP (rysunek nr 3).
Rysunek 3. Lista programów
12Boris Kožuh
Należy kliknąć na nazwę pspp. Otwiera się następująca strona:
Rysunek 4. Strona programu PSPPNależy kliknąć na Get PSPP. Otwiera się kolejna strona tego
programu:
Rysunek 5. Wybór wersji programu PSPPGórna część tej strony jest taka sama jak poprzednia, a niżej
znajduje się lista dostępnych wersji programu PSPP. Aby pobrać
13Opracowanie danych w PSPP
wersję do Windows należy kliknąć na link: Mingw-based version (rysunek nr 5). Otwiera się wówczas następne okno:
Rysunek 6. Wybór wersji programu PSPPNajlepiej oczywiście wybrać i kliknąć na najnowszą wersję.
Program zostanie pobrany do naszego komputera. Rysunek nr 7 pokazuje ostatni etap całej procedury. Należy kliknąć na zapisz. Po zapisaniu programu należy odszukać program w komputerze, kliknąć na niego i już można korzystać z programu.
Rysunek 7. Pobieranie pliku zawierającego program PSPP
14Boris Kožuh
Istnieje oczywiście krótsza procedura. Jeżeli czytelnika nie interesują informacje o organizacji GNU, która proponuje darmowe programy, można otrzymać program PSPP bezpośrednio z adresu:
http://pspp.michelboaventura.com/en/downloads-2/?lang=en
Praca w programie PSPPOpracowanie danych za pomocą programu PSPP przebiega w
następujących fazach:
Krok pierwszy
Przygotowanie listy zmiennychZ kwestionariusza, arkuszu obserwacji,
protokołu wywiadu lub z innych narzędzi należy zrobi pełną listę zmiennych, które będą opracowywane za pomocą komputera.
Krok drugi Wprowadzanie danych do komputera Przygotowane dane należy wprowadzić do
komputera. Program PSPP ma swój podprogram do wprowadzania danych. Dane wprowadzone za pomocą programu PSPP możn bez przygotowania opracowywać takż w programie SPSS.
Krok trzeci Opis zmiennychPo wprowadzeniu danych do komputera
należy opisa zmienne: wpisa ich pełne imiona, wpisa imiona kategorii, itd.
Krok czwarty
Opracowanie danych Wybierając różne polecenia w PSPP uruchamia
się wybrane opracowania statystyczne. Po urucho-mieniu poleceń otwiera się okno dialogowe. W tym oknie ustawia się różne opcje opracowania.
15Opracowanie danych w PSPP
Krok piąty Przegląd wynikówKilka sekund po uruchomieniu końcowego
polecenia otwiera się okno Data Editor, w którym można zobaczyć wszystkie wyniki. Okno to umożliwia przegląd wyników i eksport, a następnie zachowanie wyników na dysku.
Krok szósty Dodatkowe porządkowanie danych Prawie zawsze po przeglądzie pierwszych
wyników powstaje potrzeba powrotu do danych wyjściowych po to, aby je dodatkowo uporządkować (pogrupować, selekcjonować itd.
Krok siódmy Wykorzystanie wynikówPo opracowaniu wyników i ich przeglądzie,
plik z wynikami należy zapisa na dysk. Zapis ten przebiega poprzez eksport pliku. Zapisane wyniki będzie trzeba przenieść do tekstu, w którym następnie będą analizowane, prezentowane oraz interpretowane (do pracy magisterskiej, dyplomowej, do raportu badań, artykułu itd.).
16Boris Kožuh
17Opracowanie danych w PSPP
ROZDZIAŁ DRUGI
2 Przygotowanie danych
Przed opracowaniem statystycznym należy uporządkować dane. Ułatwia ono późniejsze opracowywanie danych. Od czasu, kiedy pojawiły się komputery, procedury porządkowania danych zmieniły się w sposób zasadniczy. Przed “ręcznym” opracowaniem danych należy je uporządkować, natomiast do opracowania za pomocą komputera, wystarczy je jedynie przygotować.
Przygotowanie danych do opracowania komputerowego
W empirycznych badaniach edukacji badacz dysponuje zwykle stosunkowo prostymi danymi. Najczęściej występujące zmienne to zmienne nominalne i porządkowe. Należą do nich m. in.: wykształcenie, płeć, narodowość, zadowolenie, powodzenie, różne zdolności, życzenia, zainteresowania itd. Rzadziej spotyka się zmienne przedziałowe lub ilorazowe. Zmienne przedziałowe lub ilorazowe w tym podrozdziale (w celu łatwiejszego zrozumienia) zostaną omówione wspólnie: liczba uczniów w klasie, wiek,
18Boris Kožuh
wzrost, staż pracy, czas uczenia się, liczba przeczytanych książek, itd. Niektóre zmienne, które należą do porządkowych, często opracowuje się tak, jak zmienne przedziałowe (np. wyniki uczniów w teście).
Dla wszystkich jednostek dane zbiera się najczęściej za pomocą jednego narzędzia. Do najczęściej używanych narzędzi w badaniach pedagogicznych należą kwestionariusze ankiety, kwestionariusze wywiadu, skale postaw, skale szacowania, testy socjometryczne, testy wiadomości i protokoły obserwacji. W niniejszym opracowaniu osoby badane różnymi narzędziami określa się pojęciem „respondent”. Na końcu badania dla wszystkich respondentów istnieje taka sama ilość zmiennych, ponieważ dane dla wszystkich respondentów zbiera się prawie zawsze tymi samymi narzędziami. To ułatwia wprowadzanie danych do komputera, ich opracowywanie i prezentowanie wyników. Jeżeli zastosowano dwa kwestionariusze dla dwóch różnych grup respondentów (np. dla nauczycieli i dla rodziców), to w takich przypadkach dane wprowadza się odrębnie: do jednego pliku odpowiedzi nauczycieli, a do drugiego pliku odpowiedzi rodziców.
W przypadku prostych kwestionariuszy dane wprowadzane są bezpośrednio z kwestionariuszy do komputera. W przypadku skomplikowanych kwestionariuszy lepiej wprowadzać dane najpierw z kwestionariusza na przygotowane kartki (szablony). Każdy respondent posiada wówczas swoją kartkę lub przynajmniej swój wiersz na kartce. Z wypełnionych kartek dane wprowadza się do komputera. O tym, czy dane wprowadza się bezpośrednio czy pośrednio, decyduje doświadczenie i praktyka w posługiwaniu się komputerem. Przy bezpośrednim wprowadzaniu jest mniej pracy, ale jednocześnie pojawia się więcej błędów. Dane najlepiej wprowadzać z kimś: jedna osoba czyta dane, a druga je zapisuje w komputerze. Pozornie wydaje się, że dwie osoby potrzebują dwa razy mniej czasu na wprowadzanie danych. Prawda jest jednak zaskakująca: czas wprowadzania skraca się nawet o dziesięć razy.
19Opracowanie danych w PSPP
Najlepiej wprowadzać dane za pomocą programu PSPP. Dane wprowadzone za pomocą programu PSPP można bez przygotowania opracowywać także w programie SPSS. Z danymi wprowadzonymi za pomocą programu Excel jest nieznacznie więcej pracy, ale tylko przy opracowywaniu w SPSS. Natomiast dane wprowadzone w programie Word wymagają dość skomplikowanego przenoszenia (importu) do programów SPSS i PSPP. Z tego powodu odradza się wprowadzanie danych za pomocą programu Word pomimo, że samo wprowadzanie wymaga mniej czasu niż w pozostałych wymienionych programach.
Dane dla każdego respondenta zapisuje się w nowym wierszu. W ten sposób powstaje baza danych. W wierszach bazy umieszcza się respondentów, natomiast w kolumnach zmienne. Oto widok na bazę danych w programie PSPP.
Rysunek 8. Baza danych w programie PSPP
Baza danych w programie SPSS jest niemal identyczna:
20Boris Kožuh
Rysunek 9. Baza danych w programie SPSSBardzo podobnie wygląda też baza danych wprowadzonych za
pomocą programu Excel. Oto ona:
Rysunek 10. Baza danych w programie Excel
21Opracowanie danych w PSPP
Jeżeli dane zostały wprowadzone za pomocą programu Word (do pojawienia się programu PSPP było tak w większości przypadków), baza danych wygląda zupełnie inaczej:
Rysunek 11. Baza danych w programie WordDo opracowania takich danych używa się programów
statystycznych, takich jak np. PSPP, SPSS, Excel, Statistica, itp.
Spis zmiennychWażnym etapem przygotowania danych do wprowadzania do
komputera jest przygotowanie listy zmiennych. Lista zmiennych powstaje na początku układania narzędzia – jest to pierwszy etap układania. Niektóre zmienne mają proste i „naturalne” imiona, takie jak: wiek, płeć, czas uczenia się, ilość błędów w dyktandzie, itd. Innym trudno nadać proste imiona i (przynajmniej na początku) nadaje się im “imiona techniczne” jak np. odpowiedź na czwarte pytanie w ankiecie, pierwsza ocena, druga ocena, pogląd pierwszy,
22Boris Kožuh
itp. Do wprowadzania imion w programie PSPP należy skrócić imię każdej zmiennej do jednego słowa.
Zapisy wartościWartości większej części zmiennych z ankiet, skal szacowania,
protokołów obserwacji, itd. zostają zapisane w postaci liczb jednocyfrowych. Zilustruje to przykład pytania ankietowego zamkniętego z sześcioma proponowanymi odpowiedziami: A, B, C, D, E i F. Do komputera nie wprowadza się liter – zawsze tylko liczby. Odpowiedź A zapisana zostanie jako liczba 1. Dla respondentów, którzy zakreślili odpowiedź B - zapisana zostanie liczba 2, dla wszystkich, którzy zakreślili odpowiedź C, zostanie zapisana liczba 3 i tak dalej do odpowiedzi F. Taka zmienna będzie miała jednocyfrowy zapis i będzie zajmowała w szeregu danych tylko jedno miejsce.
Oto przykład, w którym respondenci odpowiadali na pięć takich pytań. Pierwszy respondent zakreślił przy pytaniu pierwszym odpowiedź C, przy drugim A, przy trzecim A, przy czwartym D i przy piątym C. Odpowiedzi drugiego respondenta to kolejno: B, C, A, F, B; trzeciego: B, B, B, A, D i czwartego: C, C, E, A, F.
Należy to zapisać w następujący sposób:pierwszy respondent 31143 drugi respondent 23162 trzeci respondent 22214 czwarty respondent 33516itd.Dla pięciu zmiennych istnieje pięć kolumn, ponieważ wszystkie
zapisy są jednocyfrowe.Nie ma znaczenia, że wszystkie pytania w ankiecie nie są
ilościowe (numerycznie). W ten sposób zapisuje się dane także dla wyłącznie jakościowych zmiennych. W przypadku płci należy np. dla
23Opracowanie danych w PSPP
kobiet zapisać liczbę 1, dla mężczyzn liczbę 2. Takie postępowanie nie zmienia natury zmiennych. Nie oznacza to, że nie uwzględnia się właściwości zmiennych. Łatwiejsze jest jedynie wprowadzanie danych do komputera, a także ich późniejsze opracowanie.
Proste rozwiązania są najlepsze i przynoszą najmniej błędów. Dlatego też poszczególnym odpowiedziom na pytania w ankiecie (kategoriom zmiennej) przyporządkowuje się liczby w tej samej kolejności, według której były podane w ankiecie (pierwszej odpowiedzi zawsze 1, drugiej 2, trzeciej 3, itd.). Przy takim postępowaniu możliwość wystąpienia błędów jest najmniejsza.
Nawet w przypadku, jeżeli w pytaniu ankietowym nr 8 odpowiedzi zostały umieszczone w następujący sposób:
A. zawszeB. czasamiC. nigdy
a w pytaniu nr 13:
A. nigdyB. czasamiC. zawsze
w obydwu sytuacjach odpowiedź A należy zapisać jako 1 (bez względu na to, że to dwie zupełnie przeciwne odpowiedzi).
Istnieje wprawdzie możliwość oznaczania jednakowych odpowiedzi zawsze taką samą liczbą (bez względu na fakt, czy one były w ankiecie na pierwszym, drugim, trzecim... miejscu), jednak powoduje to komplikacje i zwiększa ilość błędów. Takie dylematy należy przewidzieć i rozwiązywać wcześniej – już przy układaniu pytań ankietowych.
Narzędzia do zbierania danych nie zawsze są tak proste, jak powyżej. Problemy pojawiają się najczęściej w tych pytaniach ankietowych, w których można zakreślić jednocześnie więcej
24Boris Kožuh
niż jedną odpowiedź. Niektórzy respondenci zakreślają jedną odpowiedź, niektórzy dwie lub więcej niż dwie, natomiast niektórzy nie zakreślają żadnej. Stąd też dla niektórych respondentów pojawia się więcej wartości, dla innych natomiast tylko jedna wartość. Jak zatem zapisać odpowiedzi, aby zachować prostotę zapisu i równocześnie umieścić wszystkie dane? Najprostsze rozwiązanie jest następujące: z jednego pytania ankietowego zrobić więcej zmiennych – tyle, ile jest proponowanych odpowiedzi. Powstałe w ten sposób wszystkie zmienne będą jednocyfrowe. W przypadku, gdy respondent zakreślił pewną odpowiedź zapisuje się 1, jeżeli jej nie zakreślił zapisuje się 0. Ilustruje to przykład pytania ankietowego z sześcioma proponowanymi odpowiedziami dla ośmiu respondentów. W przykładzie istniała możliwość zakreślenia dowolnej liczby odpowiedzi.
Tabela 1. Odpowiedzi ośmiu respondentów na pytanie ankietowe
Respondencipierwszy drugi trzeci czwarty piąty szósty siódmy ósmy
A A A A A A A AB B B B B B B BC C C C C C C CD D D D D D D DE E E E E E E EF F F F F F F F
Należy to zapisać następująco:
pierwszy respondent 110101drugi respondent 011101trzeci respondent 110110czwarty respondent 111111piąty respondent 011001szósty respondent 101110
niż jedną odpowiedź. Niektórzy respondenci zakreślają jedną odpowiedź, niektórzy dwie lub więcej niż dwie, natomiast niektórzy nie zakreślają żadnej. Stąd też dla niektórych respondentów pojawia się więcej wartości, dla innych natomiast tylko jedna wartość. Jak zatem zapisać odpowiedzi, aby zachować prostotę zapisu i równocześnie umieścić wszystkie dane? Najprostsze rozwiązanie jest następujące: z jednego pytania ankietowego zrobić więcej zmiennych – tyle, ile jest proponowanych odpowiedzi. Powstałe w ten sposób wszystkie zmienne będą jednocyfrowe. W przypadku, gdy respondent zakreślił pewną odpowiedź zapisuje się 1, jeżeli jej nie zakreślił zapisuje się 0. Ilustruje to przykład pytania ankietowego z sześcioma proponowanymi odpowiedziami dla ośmiu respondentów. W przykładzie istniała możliwość zakreślenia dowolnej liczby odpowiedzi.
Tabela 1. Odpowiedzi ośmiu respondentów na pytanie ankietowe
Respondencipierwszy drugi trzeci czwarty piąty szósty siódmy ósmy
A A A A A A A AB B B B B B B BC C C C C C C CD D D D D D D DE E E E E E E EF F F F F F F F
Należy to zapisać następująco:
pierwszy respondent 110101drugi respondent 011101trzeci respondent 110110czwarty respondent 111111piąty respondent 011001szósty respondent 101110
25Opracowanie danych w PSPP
siódmy respondent 000000ósmy respondent 101101
Siódmy respondent nie zakreślił żadnej odpowiedzi, więc wpisano sześć razy zero. W ten sposób powstały wiersze danych jednakowej długości dla wszystkich respondentów.
W programie PSPP zapis ten wygląda następująco:
Rysunek 12. Baza danych w programie PSPP
Zjawisko to występuje bardzo często i z tego powodu zostanie dodatkowo wyjaśnione. W ankiecie pytano respondentów: Jakie są motywy podjęcia przez Panią/Pana studiów na kierunku pedagogika? Respondenci mogli zakreślić więcej niż jedną odpowiedź. Oto proponowane odpowiedzi:
A będę miał możliwość awansu zawodowegoB lubię pracować z dziećmiC lubię pracę grupową
26Boris Kožuh
D moi rodzice są nauczycielamiE będę miał długie wakacje
Zadano tylko jedno pytanie, jednak każdy respondent mógł udzielić kilku odpowiedzi. W celu wprowadzania i opracowywania danych pytanie to w myślach należy przekształcić w kilka podobnych pytań. Odpowiedzi traktuje się w taki sposób, jak gdyby kolejne pytania brzmiały:
“Czy Pani/Pan zdecydowała się na studia pedagogiki z powodu możliwości awansu zawodowego?
TAK NIE
“Czy Pani/Pan zdecydowała się na studia pedagogiki, bo lubi pracę z dziećmi?”
TAK NIE
„Czy Pani/Pan zdecydowała się na studia pedagogiki, bo lubi pracę grupową?”
TAK NIE
„Czy Pani/Pan zdecydowała się na studia pedagogiki, bo rodzice są nauczycielami?”
TAK NIE
„Czy Pani/Pan zdecydowała się na studia pedagogiki z powodu długich wakacji?”
TAK NIE
Jeżeli respondent zakreślił A, to tak, jak gdyby na pierwsze zasymulowane w myślach pytanie, udzielił odpowiedź TAK. W przypadku, gdy go nie zakreślił, to jakby odpowiedział NIE. Tak należy postępować od pierwszej do ostatniej proponowanej odpowiedzi.
27Opracowanie danych w PSPP
Ten rodzaj pytań można traktować jako jedną zmienną tylko w przypadkach, jeżeli opracowuje się je samodzielnie (czyli bez poszukiwania związków z innymi zmiennymi). Przy badaniu związków i zależności z innymi pytaniami lub zmiennymi ten rodzaj pytań należy traktować w powyżej opisany sposób (jako więcej zmiennych). Nie można analizować np. różnic według płci dla całego pytania, lecz dla każdej odpowiedzi oddzielnie (jedną po drugiej). Czynność ta jest skomplikowana, jednak nie istnieje inne rozwiązanie. Jeżeli współzależności nie są ważne, do kwestionariusza można włączyć podobne pytania. Jeżeli jednak współzależności są ważne dla badania, należy postępować w następujący sposób:
- w kwestionariuszu należy ograniczyć możliwość wyboru odpowiedzi do jednej (np. który, z podanych motywów, był najważniejszy przy wyborze studiów pedagogiki?),
- do kwestionariusza należy włączyć dwa podobne do siebie pytania (jedno z nich dotyczy wszystkich motywów i istnieje możliwość wyboru kilku odpowiedzi, drugie dotyczy jednego – zwykle najsilniejszego motywu).
Jeszcze bardziej złożone przypadki nie będą tu omówione, pomimo że mogą pojawić się w badaniach. Książka koncentruje się na najczęściej spotykanych problemach i sytuacjach badawczych.
Prezentacja i porządkowanie danych jakościowych Dane jakościowe porządkuje i prezentuje się tworząc
zestawy tabelaryczne. Dla każdej kategorii zmiennej należy policzyć ilość jednostek (liczebność). Liczebność zwykle wyrażana jest w postaci liczb absolutnych (np. ilu respondentów wybrało pojedyncze odpowiedzi na pytanie w ankiecie) i liczb procentowych (ile procent respondentów wybrało daną odpowiedź). Tak uporządkowane dane nadają się do kolejnych opracowań. Już samo uporządkowanie danych umożliwia pierwszą analizę.
28Boris Kožuh
Tabele zawierające jedną zmiennąTabele te pokazują stan każdej zmiennej w badanej populacji.
Oto przykład prostej tabeli, która ilustruje strukturę zmiennej „płeć” wśród badanej populacji pracowników w Centrum Kształcenia Kadr.
Tabela 2. Tabela grupy pracowników według płcipłeć f %
mężczyźni 26 39,4
kobiety 40 60,6
razem 66 100,0
Jeżeli zmienna jest porządkową i ma więcej niż dwa stopnie, można dodać kolumnę liczebności skumulowanych F (lub F%). Skumulowana liczebność jest sumą jednostek (lub %) do pewnej kategorii. Dla każdej kategorii należy zsumować wszystkie liczebności (zarówno jej, jak i niższych kategorii). Ma to jednak sens jedynie wtedy, gdy jest to niezbędne.
Tabela 3. Tabela populacji uczniów według ocen z języka polskiegoocena liczebność procent liczebności skumulowany procent
liczebności2 5 5,8 5,8
3 12 14,0 19,8
4 32 37,2 57,0
5 31 36,0 93,0
6 6 7,0 100,0
razem 86 100,0
Wyniki w statystyce na ogół zaokrągla się do dwóch miejsc po przecinku. Istnieje jednak pewien wyjątek: procenty w tabelach
29Opracowanie danych w PSPP
zaokrągla się do jednego miejsca po przecinku. Nie dotyczy to procentów, z których oblicza się kolejne wyniki. Tam znowu obowiązuje prawo dwóch miejsc po przecinku.
W taki sposób przebiega porządkowanie danych dla wszystkich nominalnych i porządkowych zmiennych w badaniu. Te tabele pokazują stan w badanej populacji.
Tabele zawierające dwie zmienneCzęsto oprócz stanu po pojedynczych zmiennych bada
się także związki między zmiennymi. Do takich celów należy sporządzić tabele, które zawierają więcej zmiennych. Są to tabele krzyżowe (korelacyjne). Najczęściej taka tabela zawiera dwie zmienne, ponieważ tabela z trzema zmiennymi jest już bardzo skomplikowaną i trudną do odczytania (nawet dla specjalistów).
Poniżej zaprezentowano przykład tabeli dwóch zmiennych: wiek i poglądy dotyczące badanego zjawiska.
Tabela 4. Tabela korelacyjna populacji studentów według wieku i poglądów
zgadzam się niezdecydowany nie zgadzam się
razem
młodszy 24 18 37 79
starszy 24 12 14 50
razem 48 30 51 129
Z tej tabeli trudno zrozumieć, jaki jest związek zmiennych. Należy wyliczyć jeszcze procenty we wszystkich komórkach tabeli. Procenty można obliczyć trzema sposobami, otrzymując w ten sposób trzy odmienne tabele. Zostały one umieszczone na kolejnych stronach.
W pierwszej z tabel procenty zostały obliczone według wieku, w drugiej według odpowiedzi dotyczących poglądów, w tabeli trzeciej z liczebności całej grupy (N=129).
30Boris Kožuh
Tabela 5. Procenty według kategorii zmiennej niezależnej
zgadzam się niezdecydowany nie zgadzam się
razem
młodszy 2430,4%
1822,8%
3746,8%
79100,0%
starszy 2448,0%
1224,0%
1428,0%
50100,0%
razem 4837,2%
3023,3%
5139,5%
129100,0%
W tej tabeli w wierszach obliczano procenty z sumy na końcu wiersza. W pierwszym wierszu liczebność 24 przedstawia 30,4% od sumy 79 (na prawym krańcu wiersza). Wszystkie procenty w tym wierszu dają razem 100,0% (30,4% + 22,8% + 46,8% = 100,0%). Tak samo oblicza się procenty we wszystkich wierszach.
Tabela 6. Procenty według kategorii zmiennej zależnej
zgadzam się niezdecydowany nie zgadzam się
razem
młodszy 2450,0%
1860,0%
3772,5%
7961,2%
starszy 2450,0%
1240,0%
1427,5%
5038,8%
razem 48100,0%
30100,0%
51100,0%
129100,0%
W tej tabeli w kolumnach obliczano procenty z sumy na dnie kolumny. W pierwszej kolumnie liczebność 24 przedstawia 50,0% od sumy 48 (na dnie kolumny). Wszystkie procenty w tej kolumnie dają razem 100,0% (50,0% + 50,0% = 100,0%). Tak samo oblicza się procenty we wszystkich kolumnach.
31Opracowanie danych w PSPP
Tabela 7. Procenty z liczebności całej populacji (N=129)
zgadzam się niezdecydowany nie zgadzam się
razem
młodszy 2418,6%
1814,0%
3728,7%
7961,2%
starszy 2418,6%
129,3%
1410,8%
5038,8%
razem 4837,2%
3023,3%
5139,5%
129100,0%
W tej tabeli w komórkach obliczano procenty z liczebności całej populacji (N=129). W pierwszej komórce (górna lewa) liczebność 24 stanowi 18,6% wszystkich respondentów. Procenty we wszystkich komórkach tworzą razem 100,0% (18,6% + 14,0% + 28,7% + 18,6% + 9,3% + 10,8% = 100,0%). Procenty w kolumnie “razem” oraz w wierszu “razem” zostały też obliczone z N=129.
Pierwsza tabela pokazuje, jaki wpływ na poglądy ma wiek respondentów. Z doświadczeń wiadomo, że ludzie w różnym wieku mają odmienne poglądy, o które pytano w ankiecie. Ponieważ obie zmienne są powiązane, należy określić, która z nich jest zmienną niezależną, a która zależną. Można założyć, że w tej parze wiek jest zmienną niezależną, a poglądy zależną. Dlatego akurat pierwsza tabela jest najbardziej odpowiednia. Przy badaniu zależności między zmiennymi, praktycznie zawsze należy obliczać procenty w przedstawiony sposób, to znaczy według zmiennej niezależnej.
Druga tabela pokazuje, jaki wpływ mają poglądy na wiek. Jest to oczywiście bezsensowny kierunek wpływu. Dlatego też nie korzysta się z takich tabel.
Trzecia tabela nie nadaje się do analizy związku między zmiennymi. Z tego powodu jest właśnie zupełnie niepotrzebna, ponieważ niepotrzebne jest włączenie niezwiązanych zmiennych do wspólnej tabeli.
32Boris Kožuh
Tabele sporządza się tak, że zmienna niezależna umieszczona jest w wierszach, a zmienna zależna w kolumnach. Wartości procentowe oblicza się w każdym wierszu odrębnie. Oto przykład takiego układu zmiennych:
Tabela 8. Tabela korelacyjna populacji zaocznych studentów
Zawsze Często Rzadko Nigdy Razem
Dziewczęta 2631,7%
3137,8%
1619,5%
911,0%
82100,0%
Chłopcy 1925,0%
2330,3%
2127,6%
1317,1%
76100%
Razem 4528,5%
5434,2%
3723,4%
2213,9%
158100,0%
Jeżeli zmienna zależna posiada tak wielką liczbę kategorii, że tabela jest za szeroka i nie pomaga nawet technika komputerowa (małe czcionki), należy odwrócić tę kolejność. W tym przypadku umieszcza się zmienną zależną w wierszach i zmienną niezależną w kolumnach. Ale uwaga: procenty należy i w tym przypadku obliczać według kategorii zmiennej niezależnej, (czyli 100, 0% znajduje się na dole każdej kolumny). Dodatkowo w tekście przed taką tabelą należy czytelnikowi zwrócić uwagę na tak odwrócony układ.
Tabela 9. Sposób spędzania czasu wolnego
Dziewczęta Chłopcy Razem
Piłka nożna 68,5%
3223,4%
3818,3%
Piłka ręczna 811,3%
118,0%
199,1%
Siatkówka 1419,7%
2719,7%
4119,7%
Koszykówka 79,9%
96,6%
167,7%
33Opracowanie danych w PSPP
Narciarstwo 68,5%
96,6%
157,2%
Atletyka 68,5%
85,8%
146,7%
Judo 34,2%
53,6%
83,8%
Pływanie 79,9%
128,6%
199,1%
Strzelectwo 57,0%
64,4%
115,3%
Inny 912,7%
1813,1%
2713,0%
Razem 71100,0%
137100,0%
208100,0%
Oto przykład upierania się przy regule: tabele sporządza się tak, że zmienna niezależna umieszczona jest po lewej stronie (w wierszach), a zmienna zależna u góry tabeli (w kolumnach).
Tabela 10. Sposób spędzania czasu wolnego
Piłka nożna
Piłka ręczna
Siatkówka Koszykówka Narciarstwo Atletyka Judo Pływanie Strzelectwo Inny Razem
Dziewczęta 68,5%
811,3%
1419,7%
79,9%
68,5%
68,5%
34,2%
79,9%
57,0%
912,7%
71100,0%
Chłopcy 3223,4%
118,0%
2719,7%
96,6%
96,6%
85,8%
53,6%
128,6%
64,4%
1813,1%
137100,0%
Razem 3818,3%
199,1%
4119,7%
167,7%
157,2%
146,7%
83,8%
199,1%
115,3%
2713,0%
208100,0%
Prezentacja i porządkowanie danych ilościowychUporządkowane dane nominalne lub porządkowe nadają się
już do interpretacji. Inaczej jest w przypadku danych ilościowych (przedziałowych i ilorazowych), które porządkuje się tylko w celach łatwiejszego opracowania. Korzystanie z komputera w opracowaniu danych przyniosło radykalną zmianę: porządkowanie danych ilościowych przed opracowaniem jest już zupełnie niepotrzebne. Dlatego też zagadnienie dotyczące porządkowania
34Boris Kožuh
danych ilościowych omawia się w sposób skrócony. Dane ilościowe porządkuje się na dwa sposoby.
1. Tworzy się szereg szczegółowy prosty. Wartości zmiennej porządkuje się rosnąco. Sposób ten, bez szczegółowego opisu, zostanie zilustrowany jednym przykładem.
Oto odpowiedzi nauczycieli na pytanie o staż pracy:Tabela 11. Staż pracy nauczycieli
x 2 4 5 6 7 9 10 11 12 14 17 21 23 24 27
R 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
2. Tworzy się szereg rozdzielczy z przedziałami klasowymi.Tego sposobu używa się w sytuacjach, gdy liczebność grupy
przewyższa liczebność zwykłej klasy szkolnej. Tabela 12. Wyniki testu z języka angielskiego
Przedziały klasowe
Liczebność Procent liczebności
Liczebnośćskumulowana
Skumulowany procent
liczebności 8 - 12 2 1,7 2 1,7
13 - 17 5 4,2 7 5,8
18 - 22 8 6,7 15 12,5
23 - 27 11 9,2 26 21,7
28 - 32 17 14,2 43 35,8
33 - 37 21 17,5 64 53,3
38 - 42 15 12,5 79 65,8
43 - 47 15 12,5 94 78,3
48 - 52 12 10,0 106 88,3
53 - 57 10 8,3 116 96,7
58 - 62 4 3,3 120 100,0
N=120
35Opracowanie danych w PSPP
Do prezentacji i interpretacji danych ilościowych nadają się końcowe wyniki opracowań statystycznych (średnie arytmetyczne, wariancje, współczynniki korelacji, itd.).
36Boris Kožuh
37Opracowanie danych w PSPP
Dane można wprowadzać za pomocą kilka programów: Excel, SPSS, PSPP, Word, itd. Do niedawna najlepszym rozwiązaniem było wprowadzanie danych za pomocą edytora Word. Jednak dane wprowadzone w programie Word wymagają złożonych operacji importowania do programów PSPP lub SPSS. Dlatego odradza się wprowadzanie danych za pomocą programu Word, pomimo że wymaga ono mniej czasu niż w pozostałych wymienionych programach.
Wprowadzanie danych w programie Excel jest proste, ale wymaga więcej pracy niż w Wordzie. Przenoszenie bazy danych do programu SPSS jest nadzwyczaj proste, ale do programu PSPP na razie niemożliwe. Być może następne wersje programu PSPP będą umożliwiały import danych z Excel.
Program PSPP posiada prosty podprogram do wprowadzania danych. Dane wprowadzone za pomocą programu PSPP można bez przygotowania opracowywać także w programie SPSS.
Trzeba jednak podkreślić jedną zaletę programu Word. W przypadku bazy danych, która zawiera wielką liczbę zmiennych,
ROZDZIAŁ TRZECI
3 Wprowadzanie danych
38Boris Kožuh
program Word oszczędza czas. Wprowadzanie za pomocą programów SPSS, PSPP lub Excel wymaga, po zapisaniu każdej wartości, użycia strzałki kursora (w prawo). Jeżeli np. badanie zawiera 200 prostych zmiennych (jednocyfrowych), przy wprowadzaniu danych dla każdego respondenta należy nacisnąć 200 razy odpowiednią cyfrę i 199 razy strzałkę kursora. W Wordzie wystarczy nacisnąć tylko 200 cyfr. Procedury wprowadzania danych za pomocą programu Word i importowania do SPSS (lub PSPP) zostały opisane w starszych podręcznikach (patrz: Kožuh 2006).
Wprowadzanie danych za pomocą programu PSPPPrzy uruchamianiu programu PSPP otwiera się okno Data
Editor. W lewym dolnym rogu okna znajdują się dwie zakładki: Data View i Variable View. Pierwsza z nich otwiera widok na dane, a druga na listę zmiennych. W oknie z widokiem na dane uruchamia się opracowania statystyczne, a w oknie z listą zmiennych określa się i opisuje zmienne.
Rysunek 13. Okno Data Editor
39Opracowanie danych w PSPP
W otwartym oknie Data Editor jest oznaczona pierwsza komórka (w lewym górnym rogu). W programie SPSS można od razu zacząć wprowadzać dane, a w programie PSPP nie jest to możliwe, ponieważ najpierw trzeba określić zmienne. Kliknij na zakładkę Variable View. Otworzy się okno:
Rysunek 14. Okno Data Editor-Variable View
I w tym oknie oznaczona jest pierwsza komórka. Od razu można wpisać imię pierwszej zmiennej. Imię nie może być dłuższe od jednego słowa (nie wolno używać spacji). Oznacza to, że można wpisać imię „ocenazmatematyki”, ale nie można wpisać „ocena z matematyki”. Najlepiej nadać niektórym zmiennym ich krótkie imiona (np. płeć, wiek, staż, itd.), a zmiennym z długimi imionami tylko skróty np. z1, z2, z3 (zmienna pierwsza, zmienna druga, zmienna trzecia, itd.). Po wpisie imienia należy kliknąć na Enter lub przejść do kolejnego wiersza za pomocą myszki. Wpiszemy imię drugiej zmiennej i tak do końca listy zmiennych. Listę dziesięciu zmiennych prezentuje następny rysunek:
40Boris Kožuh
Rysunek 15. Okno Variable View z listą dziesięciu zmiennych
Pierwsze cztery zmienne (płeć, wiek, klasa i wykształcenie matki) to dane osobowe respondentów z metryczki ankiety. Pozostałe zmienne to te, które bardzo często występują w badaniach edukacji: oceny z dwóch przedmiotów, wyniki dwóch testów i odpowiedzi na dwa pytania z kwestionariusza ankiety. Wiek i wyniki testów to zmienne ilościowe, natomiast pozostałe zmienne są zmiennymi jakościowymi.
Jeżeli wprowadzone zostało niepoprawne imię zmiennej, należy kliknąć na odpowiednią komórkę, wpisać poprawne imię i zatwierdzić klawiszem Enter. Po wpisie całej listy zmiennych, najlepiej zapisać plik na dysk. Oczywiście, plik można zapisać też później (po wprowadzeniu wszystkich danych), ale ostrożność wymaga zapisów w trakcie pracy. W oknie Data Editor należy otworzyć menu File i wybrać pozycje Save As (zapisz jako).
41Opracowanie danych w PSPP
Rysunek 16. Menu File i Save As
Otworzy się okno Save As:
Rysunek 17. Okno Save As
42Boris Kožuh
Do rybryki Name należy wprowadzić imię pliku (np. praca magisterska) i wybrać miejsce na dysku, w którym plik ma zostać zapisany. Wszystkie pozostałe ustawienia są automatyczne. Na końcu należy jeszcze kliknąć na Save.
Rysunek 18. Okno Save As
Teraz jest wszystko przygotowane i można wprowadzać dane. Należy kliknąć na zakładkę Data View. Otworzy się kolejne okno (rysunek 19 na następnej stronie).
W pierwszym wierszu znajdują się imiona wszystkich zmiennych, a pod nimi puste wiersze. Kliknij w komórce na początku pierwszego pustego wiersza i wpisuj dane pierwszego respondenta, przesuwając się po każdej wpisanej liczbie w prawo za pomocą strzałki kursora. Na rysunku 20 (na następnej stronie) pokazane są dane pierwszego respondenta.
43Opracowanie danych w PSPP
Rysunek 19. Okno Data View przed wpisem pierwszej wartości
Rysunek 20. Okno Data View po wpisie danych pierwszego respondenta
44Boris Kožuh
Po wpisie wszystkich danych pierwszego respondenta (pełny pierwszy wiersz) naciśnij klawisz Tab. Oznaczona zostanie pierwsza komórka drugiego wiersza i w taki sam sposób wprowadź dane drugiego respondenta, trzeciego, czwartego, itd. do końca. Baza danych wówczas wygląda tak, jak na rysunku 21.
Rysunek 21. Okno Data View po wpisie danych dziesięciu respondenów
W wierszach znajdują się respondenci, a w kolumnach zmienne.
Błędy powstałe przy wprowadzaniu danych są łatwo naprawialne. Tabela nr 13 zawiera instrukcje jak naprawić naj-częstsze błędy.
45Opracowanie danych w PSPP
Tabela 13. Poprawianie błędów
Co zrobić? Jak to zrobić?Poprawić niewłaściwą wartość
Kliknij na komórkę z niewłaściwą wartością.Wpisz poprawną wartość.Zatwierdź za pomocą klawisza Enter.
Usunąć cały wiersz (wszystkie dane jednego respondenta)
Kliknij prawym przyciskiem myszki na numer respondenta – otworzy się menu dwóch funkcji (Insert Cases i Clear Cases).Kliknij na Clear Cases.
Dodać nowego respondenta
Kliknij prawym przyciskiem myszki na numer respondenta, przed którym chcesz dodać nowego – otworzy się menu dwóch funkcji (Insert Cases i Clear Cases).Kliknij na Insert Cases.Otworzy się nowy pusty wiersz.Kliknij myszką w pierwszej komórce tego wiersza i wpisz stopniowo wszystkie dane nowego respondenta.Zatwierdź za pomocą klawisza Enter.
Dodać nową zmienną
Kliknij prawym przyciskiem myszki na imię tej zmiennej, przed którą chcesz dodać nową zmienną – otworzy się menu czterech funkcji. Kliknij na Insert Variable.Otworzy się nowa pusta kolumna.Kliknij myszką w pierwszej komórce tej kolumny i wpisz stopniowo dane wszystkich respondentów.Zatwierdź za pomocą klawisza Enter.
Nowych respondentów najlepiej dodawać na końcu bazy danych (za ostatnim wprowadzonym respondentem). W badaniach edukacji kolejność respondentów jest bez znaczenia i dlatego nic się nie osiąga dodawaniem respondentów pomiędzy już wprowadzonych. To samo dotyczy też kolejności zmiennych – te również najlepiej dodawać na końcu listy zmiennych.
Teraz można już zapisać plik, jednak lepiej przed tym jeszcze załatwić kilka drobnych spraw. Na rysunku 21 widać, że wszystkie
46Boris Kožuh
dane są zapisane z dokładnością do dwóch miejsc po przecinku. W przypadku zmiennej płeć zamiast K i M wprowadzono liczby 1 i 2. W bazie danych jest to zapisane jako 1,00 i 2,00. Nie ma to żadnego znaczenia przy opracowywaniu danych, ale źle to wygląda. Aby zlikwidować miejsca za przecinkiem, należy kliknąć na kolumnę Decimals i zmienić wartość 2 na zero. Taką zmianę prezentuje rysunek 22.
Rysunek 22. Okno Variable View - rubryka Decimals
W podobny sposób można zmienić też szerokość zapisu (rubryka Width). Szerokość 8 jest za duża i można ją zmniejszyć. Należy kliknąć na kolumnę Width i wprowadzić zamiast 8, mniejszą liczbę. W większości przypadków wystarczy szerokość 1. Dla zmiennych takich jak wiek, staż pracy, wyniki testowe, itd. zwykle wystarczy szerokość dwa, a bardzo rzadko więcej niż dwa.
Na końcu wprowadzania danych należy ponownie zapisać plik. Otwórz menu File i kliknij na Save.
47Opracowanie danych w PSPP
Powstała baza danych zawiera tylko krótkie imiona lub nawet skróty imion. Podobnie jest też z kategoriami zmiennych, gdzie określenia opisowe zastępowane są liczbami. W przypadku płci, zamiast kategorii kobieta i mężczyzna, w bazie danych istnieją tylko liczby 1 i 2. Dotyczy to wszystkich zmiennych. Teraz można to poprawić i dopełnić, czyli dodatkowo opisać zmienne.
W niektórych przypadkach dodatkowe określanie zmiennych jest tylko korzystne, a w innych przypadkach natomiast koniecznie. Dla zmiennych charakterystycznych w badaniach edukacji najbardziej przydatne są trzy opcje: Label, Values i Missing (imiona zmiennych, słowne opisy kategorii i brakujące dane).
Pełne imiona zmiennychOpcja Label służy do nadawania zmiennym dłuższych imion.
Pełne imiona są szczególnie ważne w momencie, gdy wyniki przenosi się do programu Word w celu interpretacji. Raz nadane pełne imię zapisuje się wszędzie, gdzie pojawi się ta zmienna. Jako
ROZDZIAŁ CZWARTY
4 Opis zmiennych
48Boris Kožuh
przykład może posłużyć zmienna, którą wprowadzono na początku pod imieniem np. ocenachemia. W każdej tabeli z wynikami tej zmiennej będzie zapisane imię ocenachemia. Po przeniesieniu tabeli do tekstu w programie Word, należy w każdej tabeli usunąć imię ocenachemia i napisać pełne imię zmiennej np. końcowa ocena z chemii w pierwszej klasie liceum. Jeszcze gorsza sytuacja jest w przypadku zmiennych oznaczonych na początku skrótami (np. z1, z2, z3, itd.). Dla doświadczonego użytkownika programu Word, być może nie przedstawia to większego problemu, ale i tak wymaga więcej pracy niż w przypadku, gdy korzysta się z opcji Label nadając pełne imię zmiennej (raz na zawsze).
Opcję Label uruchamia się w oknie z listą zmiennych:
Rysunek 23. Okno Data Editor- Variable View
Kliknij w okienku na skrzyżowaniu kolumny Label i wiersza tej zmiennej, której chcesz nadać pełne imię. Od razu można wpisać pełne imię zmiennej. Następnie należy zatwierdzić imię za pomocą
49Opracowanie danych w PSPP
klawisza Enter, kliknąć w kolejnym okienku, wprowadzić imię dalszej zmiennej itd. Oto przykład:
Rysunek 24. Okno z imionami zmiennych
Imię nie powinno przekraczać 256 znaków. Można używać też polskich znaków ą, ę, ł, ś, ó, itd. Te znaki, dopóki pracuje się w PSPP, nie będą zapisywane poprawnie, ale po przeniesieniu tabel i wyników do tekstu w programie Word, zostaną zapisane poprawnie.
Jeżeli imię jest długie i nie mieści się w komórce, to wyświetla się tylko część imienia. Można sprawdzić, czy imię jest pełne i poprawnie zapisane. Należy myszką chwycić prawą krawędź kolumny (w wierszu z imionami zmiennych) i kolumnę rozszerzyć (i później ponownie zwęzić). W komórce będzie widać tylko kilka pierwszych liter imienia, jednak pełne imię już zostało wprowadzone.
50Boris Kožuh
Rysunek 25. Okno Data Editor - Label
Pełne imiona kategoriiPrzy pomocy funkcji Values można nadać imiona poszcze-
gólnym kategoriom zmiennej. W bazie danych wszystkie wartości są zapisane w postaci liczb. W przypadku zmiennych ilościowych zapis ten odpowiada rzeczywistości. Np. na pytanie „ile godzin student się uczył”, poprawną odpowiedzią jest faktycznie 7 lub 25 lub inna liczba. W przypadku zmiennych jakościowych np. w pytaniu o płeć uczniów, liczby tylko zastępują prawdziwe odpowiedzi. W tabelach oczywiście muszą znajdować się prawdziwe kategorie, a nie zastępcze liczby. W pytaniu o płeć uczniów są to kategorie kobieta i mężczyzna a nie 1 i 2. W pytaniach ankietowych mają być umieszczone słowne odpowiedzi zamiast 1, 2, 3, 4, itd.
Kategoriom można nadać imiona używając funkcji Values (wartości). Kliknij w komórce na skrzyżowaniu kolumny Values i
51Opracowanie danych w PSPP
wiersza wybranej zmiennej (której chcesz nadać imiona kategorii). W prawym rogu komórki pojawi się szary guzik.
Rysunek 26. Okno Data Editor - ValuesKliknij na ten guzik i otworzy się okno Value Labels:
Rysunek 27. Okno Value Labels
52Boris Kožuh
W polu Value kliknij i wpisz pierwszą z wartości liczbowych (np. 1), a w Value Label pełne imię tej kategorii (np. kobieta). Następnie kliknij na przycisk Add (dodaj). Tym przyciskiem wpis się potwierdza i przenosi do listy nowych imion. Ponownie kliknij w polu Value i wpisz drugą z wartości liczbowych (np. 2), a w Value Label imię drugiej kategorii (np. mężczyzna).
Rysunek 28. Okno Value LabelsNastępnie ponownie kliknij na przycisk Add. Po wprowadzeniu
wszystkich wpisów kliknij na OK. Oto przykład okna przed kliknięciem OK:
53Opracowanie danych w PSPP
Rysunek 29. Okno Value LabelsBłędne wpisy można poprawić w każdej chwili. Na liście zmian
końcowych kliknij na błędnym wpisie, a następnie w górnych rubrykach popraw wpis i potwierdź poprawkę przyciskiem Apply. Wpis można też usunąć w następujący sposób: kliknąć na błędnym wpisie, a następnie na przycisk Remove (usuń).
Braki danychPrzy wprowadzaniu danych może nastąpić sytuacja, że
respondent nie odpowiedział na pytanie ankietowe. Wówczas komórkę zostawia się pustą (bez wpisu). Program PSPP automatycznie traktuje puste komórki jako brakujące dane.
Przy wprowadzaniu danych w programie Word na miejsce brakujących danych zapisuje się zero. Wtedy pojawia się problem podwójnego znaczenia liczby zero. Nie ma już potrzeby korzystania z programu Word do wprowadzania danych i dlatego sytuacja ta została opisana tylko krótko:
54Boris Kožuh
Na niektóre pytania zero stanowi prawdziwą (poprawną) odpowiedź! Na pytanie o płe, zero oznacza brak odpowiedzi, ale na pytanie, ile książek uczeń przeczytał, zero jest ważną odpowiedzią (prawdziwą, poprawną). W niektórych przypadkach badacz chce mieć w tabelach brakujące odpowiedzi w odrębnej kolumnie. W innych przypadkach te odpowiedzi należycałkowicie usunąć –zarówno z opracowania, jak i z tabeli. Właśnie do tego służy funkcja Missing. Wszystko, co należy zrobi, to określić, dla których zmiennych zero jest brakiem odpowiedzi.
W trakcie opracowywania danych wprowadzonych w programie PSPP może też wystąpić potrzeba określenia brakujących danych.
Dla każdej zmiennej należy odrębnie określić, jak są oznaczone brakujące dane. Dla niektórych zmiennych jest to pusta komórka, dla drugich inny znak, dla innych wcale nie jest potrzebna ta funkcja. Niekiedy istnieje potrzeba odróżnienia braku odpowiedzi od niepoprawnych odpowiedzi. Niepoprawna odpowiedź to przypadek, w którym respondent udzielił odpowiedzi, ale nie ma możliwości jej jednoznacznego określenia (np. jeżeli zakreślił kilka odpowiedzi na pytanie, gdzie wymagana jest tylko jedna odpowiedź lub jeżeli odpowiedzi są zakreślone, następnie przekreślone i w końcu nie wiadomo, której odpowiedzi respondent udzielił itd.). W tych przypadkach dla brakujących odpowiedzi zostawia się pustą komórkę, a dla niepoprawnych jakiś inny znak. Wybiera się oczywiście znak, który nie pojawia się wśród odpowiedzi. Zwykle jest to liczba 9, ponieważ wyjątkowo rzadko spotyka się pytania ankietowe z dziewięcioma kategoriami. Wówczas puste komórki będą automatycznie traktowane jako brakujące dane, a wartość 9 należy określić jako brakującą za pomocą funkcji Missing. W tabelach otrzymuje się informacje o tym, ile jest jednych, a ile drugich odpowiedzi (oczywiście obok wszystkich kategorii ważnych odpowiedzi).
Należy jeszcze raz nadmienić, iż program PSPP automatycznie traktuje puste komórki jako brak danych. Dlatego też dla zmiennych
55Opracowanie danych w PSPP
z pustymi komórkami użytkownik nie musi w ogóle korzystać z funkcji Missing (wszystko odbędzie się automatycznie).
Aby określić brak danych należy kliknąć w komórce na skrzyżowaniu kolumny Missing i wiersza tej zmiennej, której określa się brakujące dane. W komórce pojawi się szary guzik.
Rysunek 30. Okno Data Editor – Variable View
Po kliknięciu na szary guzik otworzy się okno Missing Values:
56Boris Kožuh
Rysunek 31. Okno Missing ValuesJeżeli brakujące dane były wprowadzane jako jeden lub kilka
ściśle określonych znaków, należy wybrać rubrykę Discrete missing values i w puste pole wpisać znak (jeżeli znaków jest kilka, to w każdym polu umieszcza się jeden znak). Zwykle jest to tylko 9, a pozostałe pola zostają puste. Jest to wystarczające prawie we wszystkich przypadkach. Oto przykład:
Rysunek 32. Okno Missing Values
57Opracowanie danych w PSPP
Jeżeli brakujące dane określa się jako wartości »od...do«, wtedy wybiera się rubrykę Range plus one optional discrete missing value. W pole Low wpisuje się dolną granicę, a w pole High wpisuje się górną granicę. Jeżeli jako brakujące dane określa się wszystkie wartości pomiędzy trzy i siedem, do pierwszej rubryki wpisuje się liczbę 3 i do dolnej liczbę 7 (rysunek 33).
Rysunek 33. Okno Missing ValuesJeżeli oprócz przedziału od trzy do siedem brakującą wartością
ma być też dziewięć, wówczas w trzecią rubrykę wpisuje się dodatkowo liczbę 9 (rysunek 34).
58Boris Kožuh
Rysunek 34. Okno Missing ValuesPo wprowadzeniu wszystkich wartości należy kliknąć OK.Opisane sposoby dodatkowego uporządkowania i określania
danych w pełni wystarczą w badaniach pedagogicznych. Nie jest to jednak wszystko, co umożliwia program PSPP. Jego możliwości są dużo większe, dlatego też książka, która opisywałaby wszystko, co można zrobić przy pomocy programu PSPP byłaby kilkanaście razy bardziej obszerna. Niech się Czytelnik nie boi – opisane sposoby naprawdę wystarczą pedagogowi, a tylko w incydentalnych przypadkach, będzie potrzebny lepszy podręcznik.