New Podstawowe operacje na plikach danych - Predictive Solutions · 2019. 12. 19. · PageUp)....

29

Transcript of New Podstawowe operacje na plikach danych - Predictive Solutions · 2019. 12. 19. · PageUp)....

Page 1: New Podstawowe operacje na plikach danych - Predictive Solutions · 2019. 12. 19. · PageUp). Pojedynczą zmienną zaznaczamy naciskając Ctrl+Spacja, a pojedynczą obserwację –

Podstawowe operacjena plikach danych

Standardowo w menu edytora danych znajdują się następujące polecenia:

Plik – operacje na plikach danych, wczytywanie i zapisywanie danych;

Edycja – kopiowanie, wklejanie itp.;

Widok – zarządzanie paskami narzędzi i stanu;

Dane – operacje na danych;

Przekształcenia – operacje na zmiennych;

Analiza – analizy statystyczne i raportowanie;

Wykresy – tworzenie wykresów;

Narzędzia – informacje o zmiennych, konfigurowanie rozwijanego menu;

Okno – przechodzenie między oknami, zmiana atrybutów okien;

Pomoc – uzyskiwanie pomocy.

W Edytorze danych SPSS można pracować podobnie jak w arkuszach kalkulacyj-nych – bezpośrednio usuwać, czy też wpisywać dane do komórek bazy danych.Ten styl pracy nie jest jednak godny polecenia w przypadku pracy na du-żych zbiorach danych, gdyż dokonywane w ten sposób zmiany nie są w żadensposób dokumentowane. Lepszym rozwiązaniem jest korzystanie z dostępnychw SPSS poleceń pozwalających na przekształcanie danych. Pracując w tensposób, zawsze mamy możliwość prześledzenia historii zmian dokonywanychw bazie danych (śledząc komendy w oknie języka poleceń SPSS). Jeśli jednakzdecydujemy się na pracę z danymi poprzez bezpośrednie usuwanie, wycinaniei wklejanie komórek, warto wcześniej utworzyć kopię pliku z danymi. Ostrożno-ści nigdy nie za wiele, dlatego w trakcie pracy z plikami danych należy zwracaćszczególną uwagę na komunikaty programu z ostrzeżeniami dotyczącymi kon-sekwencji przeprowadzanych przez nas operacji.

23

Page 2: New Podstawowe operacje na plikach danych - Predictive Solutions · 2019. 12. 19. · PageUp). Pojedynczą zmienną zaznaczamy naciskając Ctrl+Spacja, a pojedynczą obserwację –

Wprowadzenie do pracy z programem SPSS for Windows

4.1.Struktura zbiorów danych

Dane analizowane za pomocą pakietu SPSS for Windows zorganizowane sąw zmienne i obserwacje. Zmienne są odpowiednikiem cechy statystycznej (np.wiek, płeć itp.) i ich własności są przedmiotem analiz wykonywanych za pomo-cą pakietu SPSS for Windows; każda obserwacja to pojedynczy badany obiekt(respondent, faktura, wynik eksperymentu, itp.). Struktura danych jest podob-na do struktury danych arkuszy kalkulacyjnych (np. MS Excel, Lotus 1-2-3).

Na zawartość edytora danych składają się dwa główne elementy: dane„właściwe” i dane słownikowe opisujące ich znaczenie, formaty prezentacjiwartości itp.

Definicje danych słownikowych dla zmiennych można ustawić przechodząc dozakładki Zmienne znajdującej się w lewym dolnym rogu okna Edytora danych lubwybierając z menu Widok opcję Zmienne (rys. 4.1).

W zakładce Zmienne znajduje się tabelaryczny edytor definicji zmiennych. Licz-ba wierszy w edytorze odpowiada liczbie zmiennych w zbiorze danych. W ko-lumnach znajdują się definicje poszczególnych ustawień dla zmiennych:

Nazwa – nazwy zmiennych;

Typ – typ zmiennej (np. numeryczny, tekstowy, data);

Szerokość – liczba znaków dla zmiennej;

Dziesiętne – dopuszczalna liczba miejsc po przecinku;

Etykieta – długi opis zmiennej (np. „Kraj odbiorcy”);

Wartości – etykiety dla wartości (np. 1 – „Polska”);

Braki danych – wartości, poprzez które określane są braki danych;

Kolumny – szerokość kolumny dla wybranej zmiennej w Edytorze danych;

Wyrównanie – sposób wyrównania wartości wyświetlanych w Edytorze danych(do prawej, do lewej, wyśrodkuj);

Poziom – poziom pomiaru zmiennej.

Nazwy zmiennych mogą składać się maksymalnie z 64 znaków (dopiero od wer-sji 12 programu SPSS), mogą zawierać wszystkie znaki oprócz znaków specjal-nych (np. ∗) i muszą rozpoczynać się od litery. W zbiorze nie mogą występowaćzmienne o tych samych nazwach.

24

Page 3: New Podstawowe operacje na plikach danych - Predictive Solutions · 2019. 12. 19. · PageUp). Pojedynczą zmienną zaznaczamy naciskając Ctrl+Spacja, a pojedynczą obserwację –

Podstawowe operacje na plikach danych

zakładka „zmienne”, zawierająca definicje informacji słownikowych

Rysunek 4.1. Okno edytora definicji zmiennych

Jako nazw zmiennych nie można używać zastrzeżonych słów: ALL, AND, BY,EQ, GE, GT, LE, LT, NE, NOT, OR, TO, WITH. Duże i małe litery nie sąrozróżniane w nazwach zmiennych, tzn. nazwy zmiennych nAzWa1 i nazwa1

są dla SPSS identyczne. Nazwy zmiennych nie mogą kończyć się kropką.

W SPSS for Windows można definiować zmienne różnego typu:Numeryczny – są to liczby, np. 100.86 lub 1 000 000 – znak oddzielający częśćdziesiętną zależy od konfiguracji systemu Windows;Przecinkowy – są to liczby w formacie numerycznym, w którym przecinkamioddzielone są kolejne potęgi tysiąca, a kropka oddziela części dziesiętne, np.100.86 lub 1,000,000.15;Z kropką – części dziesiętne zapisywane są po przecinku, a tysiące po kropce,np. 100,86 lub 1.000.000,15;Notacja naukowa – liczby w postaci xEy = x · 10y, np. 1.0086E2 lub 1e + 6(zamiast litery E możemy mieć D lub znak wykładnika y);

25

Page 4: New Podstawowe operacje na plikach danych - Predictive Solutions · 2019. 12. 19. · PageUp). Pojedynczą zmienną zaznaczamy naciskając Ctrl+Spacja, a pojedynczą obserwację –

Wprowadzenie do pracy z programem SPSS for Windows

Data i czas – zmienne zawierające daty lub czas;Dolar – format zapisu waluty USD, np. $100,86;Format użytkownika – formaty liczbowe zdefiniowane przez użytkownika, np.waluty;Tekstowy – zmienne tekstowe.

SPSS pozwala na zadeklarowanie wielu dodatkowych, rzadziej używanych for-matów zmiennych z poziomu języka poleceń.

Zmiennym możemy przypisywać etykiety (Etykieta zmiennej) o długości do256 znaków. Etykietą taką może być np. treść pytania, opis zmiennej, jej peł-na nazwa itp. W wynikach analiz zamiast nazw zmiennych wykorzystywanesą etykiety, co w efekcie powoduje, że otrzymujemy raport gotowy do zapre-zentowania innym osobom. Jeżeli jednak użytkownik woli używać w raportachnazw zmiennych, może zmienić ustawienia domyślne programu dotyczące spo-sobu raportowania.

Także każdej wartości zmiennej (zwykle jakościowej) możemy przypisać etykie-tę (Etykieta wartości). Etykieta wartości może składać się z 60 znaków. Etykietyprzypisujemy i modyfikujemy w oknie dialogowym Etykiety wartości. Okno towywołujemy po kliknięciu na komórkę w kolumnie Wartości dla wybranej zmiennej,wybierając widoczny w prawym rogu tej komórki kwadracik.

W praktyce często zdarza się, że jakaś informacja nie jest dostępna lub nie mazastosowania (np. jeśli firma nie działała w styczniu, to nie poda informacjio przychodach w tym miesiącu). Sytuacji takiej w zbiorze danych odpowiadająbrakujące obserwacje. W zbiorze danych są one reprezentowane przez pustąwartość – brak danych. Wartość ta nie jest brana pod uwagę w większościanaliz (np. przy obliczaniu średniej).

W SPSS for Windows występują dwa rodzaje braków danych:

Systemowe braki danych – są to wartości automatycznie przypisywane przezSPSS for Windows pustym komórkom w zbiorze danych. W edytorze danychkomórki takie są oznaczane przez kropkę.Zdefiniowane braki danych – są to wartości wskazane przez użytkownika jakokody brakujących wartości. Zdefiniowane braki danych umożliwiają rozróżnianieprzyczyn powodujących brak informacji.

Mogą one być:dyskretne, np. 1 – „brak odpowiedzi”, 2 – „nie wiem”;należeć do pewnego przedziału, np. (−1, 9999);

26

Page 5: New Podstawowe operacje na plikach danych - Predictive Solutions · 2019. 12. 19. · PageUp). Pojedynczą zmienną zaznaczamy naciskając Ctrl+Spacja, a pojedynczą obserwację –

Podstawowe operacje na plikach danych

przybierać jedną wartość i należeć do pewnego przedziału, np. bra-kiem danych jest obserwacja, jeżeli jej wartość należy do przedziału(−1,−9999) lub jest równa 1000.

Braki danych można definiować wybierając w kolumnie Braki danych komórkęreprezentującą wybraną zmienną.

SPSS pozwala także na określenie skali pomiarowej dla każdej ze zmiennych.I tak, w kolumnie Poziom możemy zadeklarować Ilościowy, Porządkowy lub Nomi-nalny poziom pomiarowy zmiennej. W niektórych procedurach analitycznychi wykresach ustawienia te mogą mieć wpływ na sposób traktowania zmiennejw analizach i prezentacji zmiennej na wykresach.

Obok zmiennych definiowanych przez użytkownika istnieją także zmienne sys-temowe, np. zmienna numerująca obserwacje ($casenum), czy zmienna typudata. Zmienne te możemy wykorzystywać w obrębie języka poleceń programuSPSS oraz w przekształceniach realizowanych z użyciem interfejsu graficznego.

W zbiorze danych oprócz wartości zmiennych przechowywany jest równieżsłownik zawierający definicje wszystkich zmiennych i dodatkowe informacjedotyczące danych, dlatego raz zdefiniowane etykiety, typ i kody braków danychbędą pojawiać się przy każdej następnej sesji pracy z tym plikiem danych.

Pełny opis zbioru danych możemy uzyskać za pomocą polecenia Pokaż opis plikuz menu Plik. Informacje o pliku wypisywane są w oknie edytora raportów. Opisposzczególnych zmiennych uzyskujemy wykorzystując opcje Zmienne z menuNarzędzia (rys. 4.2).

przechodzi do wybranej zmiennejw oknie edytora danych

wkleja nazwę wybranej zmiennejdo okna języka poleceń

Rysunek 4.2. Informacja o zmiennych

27

Page 6: New Podstawowe operacje na plikach danych - Predictive Solutions · 2019. 12. 19. · PageUp). Pojedynczą zmienną zaznaczamy naciskając Ctrl+Spacja, a pojedynczą obserwację –

Wprowadzenie do pracy z programem SPSS for Windows

4.2.Edytor danych

Edytor danych pakietu SPSS for Windows umożliwia pracę z danymi w sposóbanalogiczny do arkusza kalkulacyjnego.

Obserwacjom w edytorze danych odpowiadają wiersze, a zmiennym – kolumny.W komórkach edytora danych znajdują się wartości zmiennych dla określonychobserwacji (rys. 4.3).

wiersz = obserwacja, np. respondent

kolumna = zmienna, np. sex

Rysunek 4.3. Edytor danych

Między komórkami możemy poruszać się za pomocą myszy, klikając na ko-mórkę, do której chcemy przejść. Możemy także wykorzystywać w tym ce-lu klawisze kursorów. Aktywna komórka jest okolona przez pogrubione linie,a jej zawartość jest wyświetlana w górnym polu okna edytora danych zwanymedytorem komórki. Po wybraniu komórki wpisujemy do niej wartość zmiennej

28

Page 7: New Podstawowe operacje na plikach danych - Predictive Solutions · 2019. 12. 19. · PageUp). Pojedynczą zmienną zaznaczamy naciskając Ctrl+Spacja, a pojedynczą obserwację –

Podstawowe operacje na plikach danych

i naciskamy Enter lub wskazujemy kursorem inną komórkę arkusza danych. Je-śli wprowadzana wartość zmiennej nie jest zgodna ze zdefiniowanym typemzmiennej, to błędna wartość nie zostanie wprowadzona.

W powyższy sposób możemy zastępować istniejące wartości zmiennych. Jeślizawartość komórki chcemy zmodyfikować (np. dopisać jedną cyfrę do wpisa-nej wcześniej liczby), to po wskazaniu komórki klikamy myszą na pole edytorakomórki lub wciskamy klawisz F2.

Edytor danych umożliwia kopiowanie, wycinanie i wstawianie fragmentów ar-kusza danych (bloków). Jeśli chcemy wykonać jakąś operację na bloku – za-znaczamy go. Aby zaznaczyć blok, przesuwamy wskaźnik myszy po przekąt-nej zaznaczanego bloku, jednocześnie przyciskając lewy klawisz myszy. Frag-ment arkusza możemy także zaznaczać za pomocą klawiatury, naciskającShift+klawisz kursora (lub inny klawisz nawigacyjny, np. PageUp). Pojedynczązmienną zaznaczamy naciskając Ctrl+Spacja, a pojedynczą obserwację – naci-skając Shift+Spacja.

Zaznaczony blok możemy kopiować do schowka naciskając Ctrl+C (Edy-cja/Kopiuj), wycinać Ctrl+X (Edycja/Wytnij) oraz usuwać (Del). Znajdujący sięw schowku blok możemy umieścić w arkuszu danych Ctrl+V (Edycja/Wklej).Przed wstawieniem bloku do arkusza zaznaczamy obszar, w który ma on byćwstawiony. Jeśli typ zmiennych w tym obszarze różni się od typu zmiennychw kopiowanym bloku, zostanie dokonana automatyczna konwersja. Operacjekopiowania, wycinania, usuwania i wklejania możemy przeprowadzić takżeprzy użyciu prawego przycisku myszy.

Wprowadzenie dowolnej wartości do komórki lub wiersza poza zakresem (poni-żej) istniejących obserwacji powoduje automatyczne dodanie nowej obserwacjido zbioru. Jeśli chcemy wstawić nową obserwację między istniejące obserwacje,to z menu Dane wybieramy polecenie Wstaw obserwację. Nowe zmienne wstawia-my poleceniem Wstaw zmienną z menu Dane. Powyższe operacje można także wy-konać za pomocą prawego przycisku myszy, klikając na numer wiersza, przedktórym chcemy wstawić obserwacje i wybierając Wstaw obserwację.

Aby wstawić nową zmienną postępujemy podobnie. Klikamy na nazwę zmien-nej, przed którą chcemy wstawić nową zmienną i wybieramy opcję Wstawzmienną. Zmienne i obserwacje usuwamy po zaznaczeniu odpowiadających imkolumn lub wierszy i wydaniu polecenia Usuń z menu Edycja lub korzystającz prawego przycisku myszy.

29

Page 8: New Podstawowe operacje na plikach danych - Predictive Solutions · 2019. 12. 19. · PageUp). Pojedynczą zmienną zaznaczamy naciskając Ctrl+Spacja, a pojedynczą obserwację –

Wprowadzenie do pracy z programem SPSS for Windows

Do wybranej obserwacji przechodzimy za pomocą polecenia Przejdź do z me-nu Dane (rys. 4.4). Natomiast do kolumny odpowiadającej wybranej zmien-nej przechodzimy wybierając opcję Zmienne z menu Narzędzia. Następniew oknie dialogowym zaznaczamy nazwę zmiennej na liście i naciskamy przyciskPrzejdź do.

Rysunek 4.4. Przeszukiwanie danych

Jeśli analizy wykonywane są dla podgrupy obserwacji, to numery obserwacjinieuwzględnianych w analizach są przekreślone.

W edytorze danych zamiast wartości zmiennych możemy wyświetlać przypi-sane wartościom etykiety. Etykiety będą wyświetlane w edytorze danych jeśliz menu Widok wybierzemy Etykiety wartości. Do arkusza danych możemy wprowa-dzać etykiety zamiast wartości zmiennych. W tym celu po wybraniu komórkiklikamy na kwadracik z prawej strony wybranej komórki, a następnie z listywybieramy żądaną etykietę. Taki tryb wprowadzania działa wyłącznie wtedy,gdy w menu Widok wybrana została opcja Etykiety wartości.

4.3.Tworzenie nowego zbioru danych

Nowy zbiór danych tworzymy wybierając z menu Plik opcję Nowy, a następnieDane. Kolejnym krokiem jest zdefiniowanie zmiennych, które będą występo-wały w zbiorze danych. Zmienne definiujemy po przejściu do zakładki Zmiennew lewym dolnym rogu Edytora danych. W oknie edytora definicji zmiennych wpi-sujemy nazwę zmiennej, typ i inne parametry opisane w rozdziale „Strukturadanych”.

Dane mogą być wprowadzane do programu SPSS analogicznie jak w przypad-ku arkuszy kalkulacyjnych lub pobierane z pliku zewnętrznego. W przypadkuwprowadzania danych bezpośrednio do okna edytora danych programu SPSSwarto pamiętać, iż istnieją też inne możliwości wprowadzania danych, np. zapomocą SPSS Data Entry.

30

Page 9: New Podstawowe operacje na plikach danych - Predictive Solutions · 2019. 12. 19. · PageUp). Pojedynczą zmienną zaznaczamy naciskając Ctrl+Spacja, a pojedynczą obserwację –

Podstawowe operacje na plikach danych

Przy definiowaniu i tworzeniu wielu zmiennych wygodnie jest korzystać z kre-atorów ułatwiających definiowanie właściwości i ich kopiowanie pomiędzyzmiennymi. Kreatory te dostępne są w menu Dane.

Pierwszy z nich uruchamiany jest po wybraniu z menu Dane opcji Definiuj zmien-ne. Kreator ten jest szczególnie użyteczny w sytuacji, gdy dane do programuSPSS wczytaliśmy z zewnętrznej aplikacji, a chcemy dokonać zmian formatów,dopisać etykiety itp.

Pierwsze okno kreatora definicji zmiennych pyta o listę zmiennych, dla którychchcemy dokonać definicji różnych własności (rys. 4.5).

lista opisywanych zmiennych

zawężenie zakresuskanowanych obserwacji

zawężenie zakresuwyświetlanych wartości zmiennych

Rysunek 4.5. Wybór zmiennych

Zmienne te zostaną następnie zeskanowane, tzn. kreator sprawdzi ich rozkład.Ponieważ w przypadku bardzo dużych zbiorów danych procedura skanowaniamoże zająć dużo czasu, możemy ograniczyć proces skanowania do zadanej licz-by rekordów (Ogranicz liczbę skanowanych obserwacji do). Ograniczeniu można takżepoddać liczbę wyświetlanych wartości zmiennych (Ogranicz liczbę wyświetlanychwartości do). Zwiększanie zadeklarowanej w tym oknie domyślnej wartości po-woduje zwiększanie obciążenia komputera. Zadeklarowana domyślnie wartość200 zwykle wystarczy, aby zorientować się co do poziomu pomiaru zmiennej.

31

Page 10: New Podstawowe operacje na plikach danych - Predictive Solutions · 2019. 12. 19. · PageUp). Pojedynczą zmienną zaznaczamy naciskając Ctrl+Spacja, a pojedynczą obserwację –

Wprowadzenie do pracy z programem SPSS for Windows

Zmienne, których definicje chcemy zmienić, wybieramy przenosząc je do listyZmienne do zeskanowania, poprzez kliknięcie na strzałkę pomiędzy listami.

W kolejnym oknie kreatora (rys. 4.6) możemy zobaczyć listę wybranych zmien-nych z sugerowanym poziomem pomiaru i informacją, czy wartości danejzmiennej posiadają etykiety (kwadrat bez krzyżyka obok poziomu pomiaruzmiennej).

informacjeo typiei dostępnościetykiet

definiowanieetykiet wartości,kodów, brakówdanych

definicjapoziomupomiaru

definicjaetykietzmiennych definicja typu zmiennej

Rysunek 4.6. Definicja własności zmiennych

W oknie tym możemy definiować etykiety zmiennych i poziom pomiaru ce-chy oraz obejrzeć rozkład zeskanowanych wartości. W tabeli etykiet i war-tości zmiennej można zaznaczyć, które wartości mają być traktowane jakobraki danych. Szczególnie użyteczne są tu opcje pozwalające na automatyczneutworzenie etykiet wartości w oparciu o wartości zmiennej (Wartości bez etykiet)i kopiowanie własności pomiędzy zmiennymi (Skopiuj własności). Po wybraniuwłaściwych opcji dla poszczególnych zmiennych klikamy OK lub Wklej, jeślichcemy by własności zdefiniowane w tym oknie zostały wklejone do okna ję-zyka poleceń.

32

Page 11: New Podstawowe operacje na plikach danych - Predictive Solutions · 2019. 12. 19. · PageUp). Pojedynczą zmienną zaznaczamy naciskając Ctrl+Spacja, a pojedynczą obserwację –

Podstawowe operacje na plikach danych

Innym przydatnym kreatorem jest kreator kopiowania własności, uruchamianypoprzez wybranie z menu Dane opcji Kopiuj własności. Kreator ten to komplek-sowe narzędzie do przejmowania informacji słownikowych, takich jak: etykiety,formaty, kodowanie braków danych itp. w obrębie jednego pliku danych lubpomiędzy plikami.

Pierwsze okno (rys. 4.7) zawiera pytanie o to, czy kopiowanie własności zmien-nych będzie się odbywać pomiędzy plikami danych (Zewnętrzny plik danych SPSS),czy w obrębie jednego pliku danych (Aktualny roboczy plik danych).

Rysunek 4.7. Wskazanie źródła danych z informacjami o kopiowanych własnościach

Jeśli chcemy kopiować własności z innego pliku danych, wskazujemy ścieżkędostępu do niego po wybraniu przycisku Przeglądaj. Plik taki można nazwaćplikiem słownikowym w stosunku do pliku roboczego.

Kolejny krok kreatora, to zdefiniowanie sposobu przejmowania własności po-między zmiennymi (rys. 4.8). Jeśli przejmowanie odbywa się pomiędzy plikami,w tym oknie kreatora aktywne będą wszystkie opcje.

33

Page 12: New Podstawowe operacje na plikach danych - Predictive Solutions · 2019. 12. 19. · PageUp). Pojedynczą zmienną zaznaczamy naciskając Ctrl+Spacja, a pojedynczą obserwację –

Wprowadzenie do pracy z programem SPSS for Windows

porównywaniepo nazwie zmiennej

kopiowaniez wybranej zmiennej

kopiowanie informacjio pliku danych

Rysunek 4.8. Wskazanie zmiennych źródłowych i docelowych dlakopiowanych własności

Pierwsza z nich: Zastosuj właściwości wybranych zmiennych źródłowych do pasującychw pliku roboczym, powoduje porównanie nazw zmiennych pomiędzy zbioramii pojawienie się na liście Zmienne źródłowe tylko tych zmiennych, których nazwyw obu zbiorach się powtarzają. Opcja ta ma podopcję: Utwórz pasujące zmiennew roboczym pliku danych, jeśli jeszcze tam nie istnieją. Po jej zaznaczeniu na liścieZmienne źródłowe pojawią się wszystkie zmienne z zewnętrznego pliku danych –także te, których nazwy nie są współdzielone pomiędzy plikami. Jeśli następniena liście tej zaznaczymy wszystkie zmienne, będzie to oznaczało, iż na końcuanalizowanego pliku danych zostaną dodane nowe, puste zmienne o nazwachi własnościach przejętych z pliku zewnętrznego.

Druga opcja: Zastosuj własności pojedynczej zmiennej źródłowej do wybranych zmiennychtego samego typu, jest aktywna niezależnie od tego, czy własności zmiennych

34

Page 13: New Podstawowe operacje na plikach danych - Predictive Solutions · 2019. 12. 19. · PageUp). Pojedynczą zmienną zaznaczamy naciskając Ctrl+Spacja, a pojedynczą obserwację –

Podstawowe operacje na plikach danych

są kopiowane pomiędzy plikami danych, czy w obrębie pojedynczego plikudanych. Pozwala ona na wskazanie dowolnej zmiennej na liście Zmienne źródłowei dowolnej liczby zmiennych na liście Zmienne pasujące z pliku roboczego. Wybórjest w tym wypadku niezależny od nazwy wybranych zmiennych, tzn. własnościmożna kopiować pomiędzy zmiennymi o dowolnych nazwach. Przykładowo,mając baterię pytań mierzonych na tej samej skali od 1 – „zdecydowanie sięzgadzam”, do 5 – „zdecydowanie się nie zgadzam”, wystarczy nadać etykietypierwszej z nich, a następnie w kreatorze wskazać, iż przejmowanie własnościz tej zmiennej ma się odbywać na wszystkie pozostałe cechy mierzone na tejsamej skali.

Ostatnia opcja: Zastosuj tylko własności zbioru danych – bez wybierania zmiennych, ak-tywna jest tylko przy kopiowaniu własności pomiędzy plikami danych. Ogra-nicza ona kopiowanie własności tylko do tych, które dotyczą ogólnie plikudanych, a nie poszczególnych zmiennych.

Po wybraniu pomiędzy jakimi zmiennych, czy zbiorami chcemy kopiować wła-sności, przechodzimy do kolejnego okna kreatora (rys. 4.9).

Rysunek 4.9. Wybór kopiowanych pomiędzy zmiennymi własności

35

Page 14: New Podstawowe operacje na plikach danych - Predictive Solutions · 2019. 12. 19. · PageUp). Pojedynczą zmienną zaznaczamy naciskając Ctrl+Spacja, a pojedynczą obserwację –

Wprowadzenie do pracy z programem SPSS for Windows

Na tym etapie decydujemy o kopiowanych pomiędzy zmiennymi własnościach.Są to:

Etykiety wartości,

Kody braków danych,

Etykieta zmiennej,

Poziom pomiaru zmiennych,

Formaty zmiennych,

Wyrównanie danych w komórkach,

Szerokość kolumny danych.

Z opcją Etykiety wartości związane są dwie podopcje: Zamień lub Połącz. Pierwszaz nich daje priorytet etykietom ze zmiennych, z których kopiujemy własności,czyli jeśli zmienna, do której dodajemy etykiety ma już etykiety, to zostanąone zastąpione. Druga z opcji powoduje nadanie etykiet tylko tym wartościomzmiennej przejmującej własności, które takich etykiet są pozbawione. Jeśli jed-nak zmienna ma dla danej wartości etykiety, to nie zostaną one zastąpione –pozostaną etykiety pierwotne tej zmiennej. Opcja ta jest wykorzystywana douzupełniania brakujących etykiet.

Kolejny krok kreatora dotyczy przejmowania własności pomiędzy zbioramidanych (rys. 4.10).

Spośród własności zbioru danych możemy kopiować:

Zestawy wielokrotnych odpowiedzi – opcja ta jest związana z wykorzystaniem de-finicji zestawów zmiennych reprezentujących pytania z możliwością wyboruwielu odpowiedzi, budowanych w ramach modułu SPSS Tables;

Zestawy zmiennych – ta opcja dotyczy zestawów zmiennych zadeklarowanychpoprzez wybranie z menu Narzędzia opcji Definiuj zestawy. Tak zdefiniowanezestawy są wykorzystywane do ograniczania liczby zmiennych prezentowa-nych w oknach dialogowych do tych, które zostały zawarte w wybranychzestawach – zestawem zmiennych mogą być np. zmienne metryczkowe.

Dokumenty – są to komentarze odnoszące się do całego pliku danych dodaneuprzednio przez użytkownika, po wybraniu z menu Narzędzia opcji Komentarzedo danych.

36

Page 15: New Podstawowe operacje na plikach danych - Predictive Solutions · 2019. 12. 19. · PageUp). Pojedynczą zmienną zaznaczamy naciskając Ctrl+Spacja, a pojedynczą obserwację –

Podstawowe operacje na plikach danych

Rysunek 4.10. Wybór kopiowanych własności pliku danych

Każda z wymienionych własności ma podopcje Zamień i Połącz. Analogicznie jakw przypadku etykiet wartości, pierwsza z opcji nadpisuje istniejące własnościw pliku roboczym, natomiast druga uzupełnia istniejące własności o te z plikusłownikowego.

Dodatkowo w tym oknie można wybrać jeszcze dwie własności:

Specyfikacja ważenia – powoduje automatyczne wskazanie zmiennej ważącejw pliku roboczym w oparciu o jej definicję w pliku słownikowym (zmiennao tej samej nazwie powinna znajdować się w pliku roboczym).

Opis pliku – jest to krótka etykieta pliku danych (max. 60 znaków), definio-wana za pomocą polecenia FILE LABELS.

Ostatnie okno kreatora jest pytaniem o to, czy wykonać zdefiniowane za jegopomocą czynności, czy też wkleić je do okna języka poleceń.

37

Page 16: New Podstawowe operacje na plikach danych - Predictive Solutions · 2019. 12. 19. · PageUp). Pojedynczą zmienną zaznaczamy naciskając Ctrl+Spacja, a pojedynczą obserwację –

Wprowadzenie do pracy z programem SPSS for Windows

4.4.Wczytywanie i zapisywanie zbioru danych

Zbiór danych wczytujemy do SPSS for Windows wybierając z menu Plik opcjeOtwórz a następnie Dane. Za pomocą tego polecenia możemy wczytywać zbioryzapisane w następujących formatach:

SPSS for Windows (*.sav) – plik danych SPSS for Windows;SPSS/PC+ (*.sys) – plik danych SPSS for DOS;SYSTAT (*.syd) – pliki programu statystycznego SYSTAT;SYSTAT (*.sys) – pliki programu statystycznego SYSTAT (starsza wersjaplików);SPSS Portable (*.por) – plik danych SPSS w formacie transportowym;Excel (*.xls) – plik arkusza kalkulacyjnego Microsoft Excel do wersji 4 włącz-nie;Lotus (*.w*) – plik arkusza kalkulacyjnego Lotus Notes do wersji 3 włącznie;SYLK (*.slk) – format plików zawierających łącza symboliczne, wykorzysty-wany przez niektóre arkusze kalkulacyjne;dBase (*.dbf ) – pliki danych dla baz danych w formacie dBase;SAS Long File Name (*.sas7bdat) – plik programu SAS od wersji 7 z długimirozszerzeniami;SAS Short File Name (*.sd7 ) – plik programu SAS od wersji 7 z krótkimirozszerzeniami;SAS v6 for Windows (*.sd2 ) – pliki programu SAS do wersji 6.08 dla Win-dows i OS2;SAS v6 for UNIX (*.ssd01 ) – wersja 6 programu SAS dla UNIX;SAS Transport (*.xpt) – pliki transportowe programu SAS;Pliki tekstowe (*.txt) lub (*.dat) – pliki tekstowe w różnych formatach.

Dodatkowo szereg rzadziej wykorzystywanych opcji wczytywania różnych po-staci plików danych dostępny jest z poziomu języka poleceń.

Po wywołaniu opcji Otwórz na ekranie otwiera się okno dialogowe Otwórz plikdanych. W oknie tym ustalamy typ i nazwę zbioru.

W przypadku plików w formacie danych SPSS (*.sav) przed otwarciem plikumożna sprawdzić jego zawartość za pomocą polecenia Plik zewnętrzny, wybie-rając z menu Plik opcję Pokaż opis pliku. Informacja o pliku wyświetlana jestw oknie raportu.

38

Page 17: New Podstawowe operacje na plikach danych - Predictive Solutions · 2019. 12. 19. · PageUp). Pojedynczą zmienną zaznaczamy naciskając Ctrl+Spacja, a pojedynczą obserwację –

Podstawowe operacje na plikach danych

Zbiór danych zapisujemy w formacie SPSS for Windows pod obecną nazwąpoleceniem Zapisz. Jeśli chcemy zmienić nazwę zbioru lub zapisać dane w innymformacie używamy polecenia Zapisz jako.

Proste zbiory tekstowe (ASCII) wczytujemy do programu poleceniem Czytajdane tekstowe z menu Plik. Wybranie tej opcji uruchamia kreator pobieraniaplików tekstowych.

Po wskazaniu ścieżki dostępu do pliku tekstowego uruchamia się pierwsze oknokreatora z podglądem zawartości wczytywanego pliku oraz z pytaniem, czyużytkownik chce wskazać predefiniowany format takiego pliku (rys. 4.11).

wybór plikuopisującego strukturędanych tekstowych

Rysunek 4.11. Pytanie o plik z predefiniowanym formatem danych

Jeśli plik o określonej strukturze był już kiedyś pobierany za pomocą kreatorai definicja jego struktury została zapisana do pliku szablonu (*.tpf ), to możemysię do niej odwołać. Wykorzystanie takiego pliku zwalnia nas z koniecznościprzechodzenia przez kolejne kroki kreatora. Jeśli nie mamy takiego szablonu,musimy przejść do kolejnego kroku kreatora.

W drugim kroku definiujemy format wczytywanego pliku (rys. 4.12).

39

Page 18: New Podstawowe operacje na plikach danych - Predictive Solutions · 2019. 12. 19. · PageUp). Pojedynczą zmienną zaznaczamy naciskając Ctrl+Spacja, a pojedynczą obserwację –

Wprowadzenie do pracy z programem SPSS for Windows

deklaracja rodzajupliku tekstowego

deklaracja wierszaz nazwami zmiennych

Rysunek 4.12. Wybór typu pliku tekstowego

pomijanie wierszyna początku pliku

deklaracja liczbyobserwacji w wierszu

pobieranie próbybądź wszystkich danych

Rysunek 4.13. Definicja sposobu i zakresu pobieranych danych

40

Page 19: New Podstawowe operacje na plikach danych - Predictive Solutions · 2019. 12. 19. · PageUp). Pojedynczą zmienną zaznaczamy naciskając Ctrl+Spacja, a pojedynczą obserwację –

Podstawowe operacje na plikach danych

Zbiory tekstowe mogą mieć format:

Separowane – wartości zmiennych są zapisywane w tej samej kolejności i od-dzielone separatorem (np. przecinek, spacja itp.);

O stałej szerokości – wartości zmiennych zapisywane są w kolumnach danycho stałej szerokości.

Na tym etapie deklarujemy także, czy w pierwszym wierszu pliku tekstowegoznajdują się nazwy zmiennych.

Trzeci krok kreatora (rys. 4.13) umożliwia bardziej szczegółową definicję spo-sobu czytania tego pliku. Możemy w nim określić, od którego wiersza masię rozpocząć czytanie danych – w opcji Pierwsza obserwacja danych rozpoczyna sięw wierszu podajemy numer wiersza.

Możemy zadeklarować też, czy jeden wiersz zajmuje jedną obserwacje, czy teżnp. w jednym wierszu zostało zapisane w pliku tekstowym kilka obserwacji– w drugim przypadku w opcji Obserwacje reprezentuje określona liczba zmiennychpodajemy liczbę zmiennych dla jednej obserwacji.

Jeśli zamiast pliku separowanego w poprzednim oknie wybraliśmy format ko-lumnowy, to zamiast tej opcji pojawi się opcja Liczba wierszy reprezentujących jednąobserwację. Opcja ta pozwala kilka wierszy pliku tekstowego traktować jako jed-ną obserwację.

W tym kroku możemy też zdecydować czy chcemy wczytać wszystkie obserwa-cje (Ile obserwacji zamierzasz zaimportować?), czy też np. pierwszych N obserwacji,lub wylosować w przybliżeniu jakiś ich procent.

Czwarty krok kreatora jest inny dla plików separowanych (rys. 4.14) i inny dlaplików w formacie kolumnowym.

Dla plików w formacie separowanym jest to pytanie o rodzaj separatora zmien-nych (Jakie separtory pojawiają się pomiędzy zmiennymi?), np. przecinek, średnik, ta-bulacja oraz o to, w obrębie jakiej pary znaków podane są wartości zmiennychtekstowych (Jaki jest kwalifikator tekstu? – apostrofów, cudzysłowów, czy innychzadeklarowanych przez użytkownika znaków).

Dla plików w formacie kolumnowym musimy za pomocą myszy wskazać, w któ-rej kolumnie kończą się wartości dla jednej zmiennej i zaczynają dla drugiej.

41

Page 20: New Podstawowe operacje na plikach danych - Predictive Solutions · 2019. 12. 19. · PageUp). Pojedynczą zmienną zaznaczamy naciskając Ctrl+Spacja, a pojedynczą obserwację –

Wprowadzenie do pracy z programem SPSS for Windows

deklaracja sposobuseparowaniaciągu znakówwartości tekstowej

rodzaje separatorawartości

Rysunek 4.14. Definicja operatora zmiennych w pliku separowanym

W kroku piątym możemy zmienić nazwy i format zmiennych na etapie ichwczytywania do Edytora danych SPSS (rys. 4.15).

deklaracja formatu

Rysunek 4.15. Definicja nazw i formatów zmiennych

42

Page 21: New Podstawowe operacje na plikach danych - Predictive Solutions · 2019. 12. 19. · PageUp). Pojedynczą zmienną zaznaczamy naciskając Ctrl+Spacja, a pojedynczą obserwację –

Podstawowe operacje na plikach danych

Ostatni, szósty krok, pozwala na zapisanie definicji utworzonych w poprzednichkrokach do postaci pliku szablonu (*.tpf ) na potrzeby późniejszego wykorzy-stania (rys. 4.16). Możemy też podjąć decyzję o wykonaniu pobierania pliku(Naciśnij przycisk Zakończ, aby zakończyć działanie kreatora) lub zapisu do okna językapoleceń (Czy wkleić składnię polecenia do okna Edytora poleceń?), w celu dokumentacjilub późniejszego wykonania zestawu instrukcji.

zapis pliku opisującegostrukturę danychtekstowych

wykonanie lub wklejeniedo okna języka poleceń

zaczytanie danychdo pamięci

Rysunek 4.16. Tworzenie pliku szablonu definicji oraz buforowanie danych

W kroku tym możemy też wybrać opcję Buforuj dane lokalnie. Jej włączenie spo-woduje utworzenie kopii pliku danych w pamięci wirtualnej, co poprawi szyb-kość dalszych analiz prowadzonych na tym pliku.

Pozostawienie tej opcji wyłączonej skutkuje czymś w rodzaju otwarcia powią-zania z tym plikiem, ale bez jego pełnego wczytania. W efekcie każda analizabędzie pobierała od początku dane z pliku tekstowego. Przykładowo, jeśli mię-dzy dwoma analizami (np. dwukrotne liczenie średniej dla tej samej zmiennej)przybędzie obserwacji w pliku tekstowym, to nowsza analiza będzie prowadzo-na na powiększonym pliku danych.

43

Page 22: New Podstawowe operacje na plikach danych - Predictive Solutions · 2019. 12. 19. · PageUp). Pojedynczą zmienną zaznaczamy naciskając Ctrl+Spacja, a pojedynczą obserwację –

Wprowadzenie do pracy z programem SPSS for Windows

Jak widać, wczytywanie danych w formacie tekstowym jest bardziej złożo-ne niż w przypadku otwierania plików danych z innych formatów i wymagadokładnej znajomości struktury pliku danych. Niemniej umiejętność wczyty-wania plików z formatu tekstowego może być niezbędna w sytuacji, gdy mamydo czynienia z systemami baz danych stworzonymi wiele lat temu, czy też nie-kiedy w przypadku korzystania z systemów baz danych osadzonych na innychplatformach systemowych. Do dziś w wielu instytucjach korzysta się z plikówtekstowych jako standardu archiwizacji danych. Wykorzystując język poleceńprogramu SPSS można wczytywać pliki tekstowe nawet o dużo bardziej złożo-nej strukturze.

4.5.Współpraca z relacyjnymi bazami danychi arkuszami kalkulacyjnymiz wykorzystaniem ODBC

Pakiet SPSS for Windows może korzystać z danych zawartych w relacyjnych ba-zach danych i arkuszach kalkulacyjnych. Dotyczy to zdecydowanej większościwspółcześnie tworzonych aplikacji bazodanowych. SPSS umożliwia jednoczesnydostęp do wielu tabel takich aplikacji jak: Access, Paradox, Oracle, MS SQL,DB2, Sybase, Progress, Informix itp.

Warunkiem koniecznym bezpośredniego pobrania danych do SPSS jest posia-danie sterowników ODBC do danego typu bazy danych. Wraz z programemSPSS dostarczany jest pakiet sterowników do wszystkich wymienionych po-wyżej baz danych. Można też skorzystać z narzędzi dostępowych oferowanychprzez producenta danej bazy danych. Mechanizm ODBC może zostać takżewykorzystany do pobierania danych z arkuszy kalkulacyjnych.

Aby wczytać bazę danych przechodzimy do menu Plik i wybieramy opcję Przej-mij bazę danych. Wybranie opcji Nowa kwerenda spowoduje uruchomienie Kreatoraprzejmowania baz danych. W pierwszym kroku pojawia się pytanie o źródło danych(rys. 4.17).

Należy wówczas z listy dostępnych źródeł danych wybrać właściwe, np. Sprze-

daż . Jeżeli na liście nie ma właściwej pozycji, należy ją dodać, wciskając przy-cisk Dodaj źródło danych.

44

Page 23: New Podstawowe operacje na plikach danych - Predictive Solutions · 2019. 12. 19. · PageUp). Pojedynczą zmienną zaznaczamy naciskając Ctrl+Spacja, a pojedynczą obserwację –

Podstawowe operacje na plikach danych

listazdefinio-wanychźródełdanych

Rysunek 4.17. Kreator przejmowania baz danych – źródła danych

Jako źródło danych możemy zdefiniować nie tylko typ bazy, ale także konkretnyplik danego typu. Jeśli nie zrobimy przypisania do konkretnej bazy danychjako źródła, pojawi się wtedy okno dialogowe pozwalające na wskazanie ścieżkidostępu do konkretnego pliku.

Jeśli na bazę danych zostały nałożone przez administratora ograniczenia do-stępu, to w następnej kolejności pojawi się okno dialogowe z pytaniem o:

nazwę użytkownika – Login;

hasło – Password;

nazwę serwera – Server.

W drugim kroku wybieramy całe tabele lub wybrane zmienne, które chcemywczytać do SPSS (rys. 4.18).

Okno dialogowe podzielone jest na dwie części – po lewej znajduje się lista do-stępnych tabel i zmiennych, po prawej lista zmiennych, które zostaną pobranedo SPSS.

45

Page 24: New Podstawowe operacje na plikach danych - Predictive Solutions · 2019. 12. 19. · PageUp). Pojedynczą zmienną zaznaczamy naciskając Ctrl+Spacja, a pojedynczą obserwację –

Wprowadzenie do pracy z programem SPSS for Windows

tabelew źródło-wej baziedanych

zmiennew źródło-wej baziedanych

Rysunek 4.18. Kreator przejmowania baz danych – pobieranie zmiennych

Aby przenieść tabelę wystarczy ją zaznaczyć i przeciągnąć do pola po prawejstronie okna, przy wciśniętym lewym przycisku myszy.

Podobnie można przenieść tylko wybrane zmienne. Aby uzyskać dostęp dozmiennych, należy w polu po lewej stronie nacisnąć na znak plus obok nazwytabeli, w której znajduje się dana zmienna. Po wskazaniu zmiennych, którechcemy wczytać do SPSS, należy nacisnąć przycisk Dalej.

W kroku trzecim definiujemy relacje między tabelami (rys. 4.19).

Wybranie opcji Automatyczne sprzęganie tabel spowoduje automatyczne połącze-nie tabel na bazie odpowiadających sobie zmiennych w różnych tabelach.

Można także zdefiniować powiązanie między tabelami samodzielnie, przecią-gając (przy wciśniętym lewym przycisku myszy) zmienną z jednej tabeli naodpowiadającą jej zmienną w drugiej tabeli.

46

Page 25: New Podstawowe operacje na plikach danych - Predictive Solutions · 2019. 12. 19. · PageUp). Pojedynczą zmienną zaznaczamy naciskając Ctrl+Spacja, a pojedynczą obserwację –

Podstawowe operacje na plikach danych

przyciskidefinio-waniarelacji

Rysunek 4.19. Kreator przejmowania baz danych – ustalanie relacji między tabelami

Korzystając ze znajdujących się w oknie po prawej stronie przycisków możnaustalić typ relacji jako:

Sprzężenie wewnętrzne – wybiera tylko odpowiadające sobie rekordy z tabel;

Lewe lub Prawe sprzężenie zewnętrzne – wybiera wszystkie rekordy z tabeli, odktórej wychodzi strzałka i odpowiadające rekordy z tabeli, do której docho-dzi strzałka.

Różnica pomiędzy Lewym sprzężeniem zewnętrznym i Prawym sprzężeniem zewnętrznymsprowadza się do wskazania, z której z dwóch połączonych tabel mają byćwczytane wszystkie obserwacje.

Kolejny krok umożliwia definiowanie warunków wczytywania obserwacji(rys. 4.20).

47

Page 26: New Podstawowe operacje na plikach danych - Predictive Solutions · 2019. 12. 19. · PageUp). Pojedynczą zmienną zaznaczamy naciskając Ctrl+Spacja, a pojedynczą obserwację –

Wprowadzenie do pracy z programem SPSS for Windows

lista funkcji, z których można skorzystać przy nakładaniu warunków pobierania danych

tworzenie okna dialogowego z zapytaniem o wartość parametru

włączenieopcjilosowaniapróby

Rysunek 4.20. Kreator przejmowania baz danych – nakładanie warunków pobieraniadanych

Można więc wczytywać obserwacje spełniające określony warunek, np. kwotasprzedaży wyższa od 1000,- PLN, data sprzedaży zawiera się w przedziale po-między styczniem a grudniem 1998 itp. Jeśli więc chcemy wczytać dane podwarunkiem, że kwota sprzedaży jest większa niż 1000,- PLN, to w polu Wyra-żenie 1 wpisujemy nazwę zmiennej kwota (lub wybieramy z listy rozwijanej),w polu Relacja wybieramy lub wpisujemy operator >, a w polu Wyrażenie 2 –wartość 1000.

Na tym etapie można też zdefiniować pytania o wartości, które będą wyświetlaneprzy uruchomieniu kwerendy. Na przykład, jeśli tworzymy kwerendę do bazydanych sprzedaży, z której będziemy korzystać wielokrotnie, ale chcemy miećmożliwość za każdym razem wybrania innego miesiąca, dla którego zostanąwczytane dane, to skorzystanie z opcji Pytanie o wartość pozwoli nam zdefiniowaćokno dialogowe z pytaniem, dla jakiego miesiąca dane mają być pobrane.

48

Page 27: New Podstawowe operacje na plikach danych - Predictive Solutions · 2019. 12. 19. · PageUp). Pojedynczą zmienną zaznaczamy naciskając Ctrl+Spacja, a pojedynczą obserwację –

Podstawowe operacje na plikach danych

W ramach tego okna można także dokonać losowania próby. Po wybraniu opcjiZastosuj losowanie próby aktywują się dwie opcje kluczowe: SPSS wylosuje próbęoraz Losowanie próby w bazie danych. Druga z opcji jest aktywna tylko wtedy, gdyźródłowa baza danych obsługuje losowanie prób. Jeśli opcja ta jest aktywna,to zazwyczaj szybsze jest losowanie z jej wykorzystaniem, gdyż w przypad-ku pierwszej opcji konieczne jest pobranie całości danych do programu SPSS,a następnie dokonanie losowania z użyciem jego algorytmów.

W przypadku losowania próby w bazie danych, SPSS wydaje tylko polecenieSQL bazie danych. Dodatkowo pozwala to wykorzystać do tego zadania mocobliczeniową serwera bazy danych, jeśli jest on zainstalowany na lepszym kom-puterze niż SPSS. Po wybraniu programu, który ma dokonać losowania może-my zdecydować, czy chcemy wylosować określony procent obserwacji (w przy-bliżeniu), czy dokładnie określoną liczbę obserwacji, np. pierwszych 100 tys.obserwacji.

W kroku piątym możemy zmienić nazwy pobieranych zmiennych (rys. 4.21).

włączenieopcjiautoma-tycznegorekodo-wania

nazwazmiennej;w SPSSmożliwajest jejedycjaw tympolu

Rysunek 4.21. Kreator przejmowania baz danych – zmiana nazw kolumn

49

Page 28: New Podstawowe operacje na plikach danych - Predictive Solutions · 2019. 12. 19. · PageUp). Pojedynczą zmienną zaznaczamy naciskając Ctrl+Spacja, a pojedynczą obserwację –

Wprowadzenie do pracy z programem SPSS for Windows

W oknie dialogowym po lewej stronie znajdują się nazwy tabel i zmiennychw źródłowej bazie danych. W prawej części okna znajdują się nazwy, jakie zo-staną nadane zmiennym po wczytaniu ich do programu SPSS (Nazwa zmiennej).W oknie tym można też zdecydować o konwersji zmiennej przyjmującej w ba-zie danych wartości tekstowe na wartości numeryczne. Konwersji dokonuje siępoprzez zaznaczenie kwadratu dla danej zmiennej w kolumnie Etykiety.

W wyniku konwersji zmiennej kraj przyjmującej wartości Albania, Bułgaria

itp. otrzymamy zmienną kraj , przyjmującą wartość 1 dla Albanii i 2 dla Bułga-rii, natomiast wartości tekstowe posłużą do automatycznego stworzenia etykietdla tych zmiennych, czyli wartość 1 będzie miała etykietę Albania, a wartość 2– Bułgaria. Dokonanie takiej transformacji zapewni później szybsze operacjena danych w obrębie programu SPSS, niż w sytuacji, gdy pozostawimy takązmienną jako zmienną tekstową.

Ostatni, szósty krok, pozwala na zapisanie kwerendy w postaci komend w okniejęzyka poleceń SPSS jako zapytania SQL, lub jako pliku (rys. 4.22).

kod SQL

wykonanielubwklejeniedo oknajęzykapoleceń

Rysunek 4.22. Kreator przejmowania baz danych – kwerenda w postaci SQL

50

Page 29: New Podstawowe operacje na plikach danych - Predictive Solutions · 2019. 12. 19. · PageUp). Pojedynczą zmienną zaznaczamy naciskając Ctrl+Spacja, a pojedynczą obserwację –

Podstawowe operacje na plikach danych

Z zapisanej kwerendy możemy skorzystać, wybierając z menu Plik opcję Przejmijbazę danych, a następnie opcję Uruchom kwerendę. W kroku tym możemy też wy-brać opcję Buforuj dane lokalnie. Jej włączenie spowoduje utworzenie kopii plikudanych w pamięci wirtualnej. Wybranie tej opcji poprawia szybkość dalszychanaliz prowadzonych na tym pliku. Pozostawienie tej opcji wyłączonej skutkujeotwarciem powiązania z tym plikiem, ale bez jego pełnego wczytania.

51