Wielowymiarowa analiza kompetencji zawodowych według grup ...
ANALIZY WIELOZMIENNOWE - dr Agnieszka Figiel | analityk ... · Zmienna wielowymiarowa Wskaźnik...
-
Upload
duongthien -
Category
Documents
-
view
236 -
download
1
Transcript of ANALIZY WIELOZMIENNOWE - dr Agnieszka Figiel | analityk ... · Zmienna wielowymiarowa Wskaźnik...
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
1
ANALIZY WIELOZMIENNOWE
WPROWADZENIE DO TEMATYKI BUDOWY INDEKSÓW I SKAL
W trakcie prowadzenia badania, a potem analizowania jego wyników dość często posługujemy się
zmiennymi wielowymiarowymi. A raczej nie samymi zmiennymi, ale ich zoperacjonalizowanym
odwzorowaniem, czyli złożonymi wskaźnikami i odpowiadającymi im pytaniami kwestionariusza. W
praktyce wygląda to tak:
Zmienna jednowymiarowa Wskaźnik prosty Kwestionariusz – 1 pytanie
Wiek Rok urodzenia - deklaracja Chciał(a)bym teraz poprosić Pana(ią)
– dla celów statystycznych – o datę
Pana(i) urodzenia?
Zmienna wielowymiarowa Wskaźnik złożony Kwestionariusz – wiele pytań
Zaufanie do religii – opinia o
jej roli w życiu człowieka
Deklaracja dotycząca tego, czy
religia może pomóc w
określonych sytuacjach
życiowych:
- odnalezienie wewnętrznego
spokoju i szczęścia;
- zawieranie przyjaźni;
- uzyskanie pocieszenia w
kłopotach lub chwilach smutku;
- spotykanie właściwych ludzi.
Czy się Pan(i) zgadza czy też nie
zgadza, że praktykowanie religii
pomaga ludziom w ...
a. odnalezieniu wewnętrznego spokoju
i szczęścia
b. zawieraniu przyjaźni
c. uzyskaniu pocieszenia w kłopotach
lub chwilach smutku
d. spotykaniu właściwych ludzi
Gdybyśmy więc chcieli sprawdzić, czy np. kobiety i mężczyźni różnią się pod względem zaufania do religii
(opinii o jej roli w życiu człowieka) to dotychczas poznane sposoby analizy statystycznej nam nie
wystarczą. W każdym poznanym teście (chi-kwadrat, t-Studenta, Manna-Whitenya, Kruskala-Wallisa,
ANOVA) po stronie zmiennej zależnej i niezależnej mogło być tylko po jednej zmiennej. Tymczasem tutaj
zmienna zależna (nastawienie do religii) składa się z 4 mniejszych zmiennych. Nie pomoże nam też analiza
regresji, bo tam wiele mogło być zmiennych niezależnych – zależna była tylko jedna.
Rozwiązania są dwa:
Budowa indeksu
Budowa skali z wykorzystaniem analizy czynnikowej i analizy rzetelności.
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
2
Dla przypomnienia, podobieństwa i różnice pomiędzy indeksem i skalą.
Podobieństwa:
Indeksy i skale są porządkowymi miernikami zmiennych. Porządkują jednostki analizy w
kategoriach konkretnych zmiennych.
Mogą być stworzone jedynie dla zmiennych ilościowych (interwałowych i ilorazowych);
Wynik danej osoby na przykład na skali lub indeksie religijności stanowi wskazanie co do względnej
religijności tej osoby w porównaniu z innymi badanymi.
Są złożonymi miernikami zmiennych – wynik jest uzależniony od odpowiedzi na kilka (kilkanaście)
pytań.
Różnice: skala:
Taki zestaw powiązanych ze sobą merytorycznie i statystycznie twierdzeń, by przy ich pomocy dało
się zmierzyć natężenie danej zmiennej (opinii, postawy) u badanych;
Skalę uzyskuje się poprzez operacje matematyczne, a jej wynikiem jest pewna liczba odwzorowujaca
natężenie badanej zmiennej.
Uwzględnia intensywność obrazowania danej zmiennej przez różne pytania;
Podczas budowy skali uwzględniany jest stopień skorelowania zmiennych cząstkowych.
Różnice: indeks:
Mniej precyzyjne od skal;
Formułowane na bardziej liberalnych zasadach;
Wskaźniki (pytania) wchodzące w skład indeksu nie muszą być aż tak ściśle ze sobą powiązane
merytorycznie i statystycznie;
Wynik powstaje dzięki operacjom matematycznym: dodawaniu, mnożeniu, dzieleniu;
Z jednej strony mniej precyzyjne, z drugiej – czasem łatwiejsze w konstrukcji i przez to nadużywane.
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
3
BUDOWA INDEKSU
Przykład:
Filtr: rok 2010
Zmienna niezależna:
o q8 płeć
Zmienna zależna – wielowymiarowa, składająca się z pytań:
o re34a – Czy praktykowanie religii może pomóc w: odnalezieniu wewnętrznego spokoju i
szczęścia;
o re34b – Czy praktykowanie religii może pomóc w: zawieraniu przyjaźni;
o re34c – Czy praktykowanie religii może pomóc w: uzyskaniu pocieszenia w kłopotach lub
chwilach smutku;
o re34d – Czy praktykowanie religii może pomóc w: spotykaniu właściwych ludzi.
Indeks zbudujemy więc na podstawie pytań re34a-re34d.
Przed przystąpieniem do budowy indeksu należy upewnić się, czy:
a) wybrane zmienne są ilościowe lub zero-jedynkowe (dychotomiczne, wskazujące na występowanie
lub brak występowania cechy, np. tak/nie);
b) w przypadku kafeterii likertowskich jest zachowana interwałowość (kafeteria jest nieparzysta,
symetryczna, z wyraźnym środkiem);
c) wszystkie pytania mają takie same kafeterie;
d) porządek odpowiedzi uwzględnia jeden kierunek natężenia zmiennej.
Ad. a)
Wybrane przez nas zmienne są mierzone na poziomie ilościowym.
Ad. b) i c)
Kafeteria wszystkich wybranych przez nas pytań wygląda następująco:
Zdecydowanie się zgadzam (kod 1)
Zgadzam się (kod 2)
Ani się zgadzam, ani nie zgadzam (kod 3)
Nie zgadzam się (kod 4)
Zdecydowanie się nie zgadzam (kod 5)
Trudno powiedzieć (kod 8)
Interwałość kafeterii zakłóca odpowiedź „trudno powiedzieć”, która musi zostać przekodowana jako brak
danych.
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
4
Ad d)
Sprawdzamy, czy kolejność odpowiedzi będzie w każdym pytaniu wskazywała ten sam kierunek natężenia
zmiennej:
re34a – „Religia sprzyja odnalezieniu wewnętrznego spokoju i szczęścia”:
o im wyższy kod odpowiedzi, tym mniejsze zaufanie do religii;
re34b – „Religia sprzyja zawieraniu przyjaźni”:
o im wyższy kod odpowiedzi, tym mniejsze zaufanie do religii;
re34c – „Religia sprzyja uzyskaniu pocieszenia w kłopotach lub chwilach smutku”:
o im wyższy kod odpowiedzi, tym mniejsze zaufanie do religii;
re34d – „Religia sprzyja spotykaniu właściwych ludzi”:
o im wyższy kod odpowiedzi, tym mniejsze zaufanie do religii.
We wszystkich wybranych pytaniach jest ten sam porządek. Gdyby któreś pytanie „wyłamywało się”, to
trzeba by było je przekodować odwracając kolejność kodów odpowiedzi (wtedy „zdecydowanie się
zgadzam” miało by kod 5) – w naszym przypadku nie ma jednak potrzeby przekodowywania.
Analiza porządku odpowiedzi pokazuje nam też jak będziemy analizować wynik indeksu. Skoro we
wszystkich pytaniach, które wejdą w skład indeksu im wyższy kod odpowiedzi, tym mniejsze zaufanie do
religii, to identycznie będzie w indeksie. Tam też im wyższy wynik respondenta, tym mniejsze zaufanie do
religii. Gdybyśmy chcieli aby interpretacja indeksu była bardziej intuicyjna (im wyższy kod, tym większe
zaufanie) to dla wszystkich pytań należałoby odwrócić porządek odpowiedzi przez rekodowanie (wtedy
„zdecydowanie się zgadzam” miało by kod 5).
Budowa indeksu – wariant 1.
PRZEKSZTAŁCENIA -> OBLICZ WARTOSCI
w polu „zmienna wynikowa” podajemy nazwę naszej nowej zmiennej-indeksu, np. re34_ind
klikając na „typ i etykieta” możemy od razy nadać zmiennej etykietę, np. „Zaufanie do religii –
indeks”
w polu wyrażenie numeryczne wpisujemy, posługując się klawiaturą komputera lub klawiaturą w
oknie dialogowym i listą zmiennych po lewej stronie:
re34a + re34b + re34c + re34d
Syntax:
COMPUTE re34_ind=re34a + re34b + re34c + re34d.
VARIABLE LABELS re34_ind 'Zaufanie do religii - indeks'.
EXECUTE.
Po wywołaniu polecenia w bazie na samym końcu listy zmiennych pojawi się nowa zmienna – nasz indeks.
Ma on postać ilościową, nie wymaga definiowania wartości.
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
5
Po zmianie miejsc dziesiętnych na „0” i wyliczeniu częstości dla indeksu mamy tabelę:
Zaufanie do religii - indeks
Częstość Procent Procent
ważnych
Procent
skumulowany
Ważne
4 123 9,7 10,7 10,7
5 32 2,5 2,8 13,4
6 54 4,3 4,7 18,1
7 69 5,5 6,0 24,1
8 313 24,8 27,1 51,2
9 106 8,4 9,2 60,4
10 142 11,2 12,3 72,7
11 80 6,4 7,0 79,7
12 123 9,8 10,7 90,3
13 29 2,3 2,5 92,8
14 31 2,5 2,7 95,5
15 17 1,4 1,5 97,0
16 26 2,0 2,2 99,2
17 2 ,2 ,2 99,4
18 1 ,1 ,1 99,5
20 5 ,4 ,5 100,0
Ogółem 1154 91,4 100,0
Braki danych Systemowe braki danych 109 8,6
Ogółem 1263 100,0
Jak widać wartości indeksu mieszczą się między 4 a 20.
Wartość „4” uzyskali ci respondenci, którzy na każde z czterech pytań cząstkowych odpowiedzieli
„zdecydowanie się zgadzam” – ta odpowiedź miała kod 1, więc 1+1+1+1 dało wynik „4”.
Wartość „20” uzyskali ci respondenci, którzy na każde z czterech pytań cząstkowych odpowiedzieli
„zdecydowanie się nie zgadzam” – ta odpowiedź miała kod 5, więc 5+5+5+5 dało wynik „20”.
Z analizy kierunku natężenia zmiennej wiemy, że im niższy wynik indeksu (czyli im bliżej wartości
minimalnej „4”), tym wyższe zaufanie do religii. A im wyższy wynik indeksu (czyli im bliżej do
wartości maksymalnej „20”), tym niższe zaufanie do religii.
Kłopot może sprawić analiza wartości pośrednich. Bo co oznacza np. wynik indeksu „13”? Można
sobie z tym poradzić tworząc na użytek interpretacji przedziały, np.
o 4 – 8 = duże zaufanie do religii
o 9 – 14 = umiarkowane zaufanie do religii
o 15 – 20 = małe zaufanie do religii.
Powyższe przedziały to tylko propozycja – tak naprawdę możliwości jest bardzo wiele i decyzja, jak
to zrobić zależy tylko i wyłącznie od analityka.
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
6
Budowa indeksu – wariant 2.
PRZEKSZTAŁCENIA -> OBLICZ WARTOSCI
w polu „zmienna wynikowa” podajemy nazwę naszej nowej zmiennej-indeksu, np. re34_ind_2
klikając na „typ i etykieta” możemy od razy nadać zmiennej etykietę, np. „Zaufanie do religii –
indeks”
w polu wyrażenie numeryczne wpisujemy, posługując się klawiaturą komputera lub klawiaturą w
oknie dialogowym i listą zmiennych po lewej stronie:
(re34a + re34b + re34c + re34d)/4
Syntax:
COMPUTE re34_ind_2=(re34a + re34b + re34c + re34d)/4.
VARIABLE LABELS re34_ind_2 'Zaufanie do religii - indeks'.
EXECUTE.
Po wywołaniu polecenia w bazie na samym końcu listy zmiennych pojawi się nowa zmienna – nasz indeks
w wersji 2. Ma on postać ilościową, nie wymaga definiowania wartości.
Po wyliczeniu częstości dla indeksu mamy tabelę:
Zaufanie do religii - indeks
Częstość Procent Procent
ważnych
Procent
skumulowany
Ważne
1,00 123 9,7 10,7 10,7
1,25 32 2,5 2,8 13,4
1,50 54 4,3 4,7 18,1
1,75 69 5,5 6,0 24,1
2,00 313 24,8 27,1 51,2
2,25 106 8,4 9,2 60,4
2,50 142 11,2 12,3 72,7
2,75 80 6,4 7,0 79,7
3,00 123 9,8 10,7 90,3
3,25 29 2,3 2,5 92,8
3,50 31 2,5 2,7 95,5
3,75 17 1,4 1,5 97,0
4,00 26 2,0 2,2 99,2
4,25 2 ,2 ,2 99,4
4,50 1 ,1 ,1 99,5
5,00 5 ,4 ,5 100,0
Ogółem 1154 91,4 100,0
Braki danych Systemowe braki danych 109 8,6
Ogółem 1263 100,0
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
7
Tym razem wartości indeksu mieszczą się między 1 a 5 – czyli tak, jak to było w kafeteriach pytań
cząstkowych.
Wartość „1” uzyskali ci respondenci, którzy na każde z czterech pytań cząstkowych odpowiedzieli
„zdecydowanie się zgadzam” – ta odpowiedź miała kod 1, więc (1+1+1+1)/4 dało wynik „1”.
Wartość „5” uzyskali ci respondenci, którzy na każde z czterech pytań cząstkowych odpowiedzieli
„zdecydowanie się nie zgadzam” – ta odpowiedź miała kod 5, więc (5+5+5+5)/4 dało wynik „5”.
Z analizy kierunku natężenia zmiennej wiemy, że im niższy wynik indeksu (czyli im bliżej wartości
minimalnej „1”), tym wyższe zaufanie do religii. A im wyższy wynik indeksu (czyli im bliżej do
wartości maksymalnej „5”), tym niższe zaufanie do religii.
Tym razem analiza wartości pośrednich jest trochę prostsza, bo możemy odnieść je do oryginalnej
kafeterii pytań cząstkowych, czyli np.:
o 1 (i okolice) = bardzo duże zaufanie do religii
o 2 (i okolice) = duże zaufanie do religii
o 3 (i okolice) = umiarkowane zaufanie do religii
o 4 (i okolice) = małe zaufanie do religii
o 5 (i okolice) = bardzo małe zaufanie do religii
Dla określenia czym są wskazane przed chwilą „okolice” można posłużyć się matematyczną zasadą
zaokrąglania liczb. Lub scedować to na SPSS – jeśli w zakładce „zmienne” bazy dla tej właśnie
zmiennej „dziesiętne” ustawimy na „0”, to program sam dokona zaokrągleń i w efekcie dostaniemy
coś takiego:
Zaufanie do religii - indeks
Częstość Procent Procent
ważnych
Procent
skumulowany
Ważne
1 123 9,7 10,7 10,7
1 32 2,5 2,8 13,4
2 54 4,3 4,7 18,1
2 69 5,5 6,0 24,1
2 313 24,8 27,1 51,2
2 106 8,4 9,2 60,4
3 142 11,2 12,3 72,7
3 80 6,4 7,0 79,7
3 123 9,8 10,7 90,3
3 29 2,3 2,5 92,8
4 31 2,5 2,7 95,5
4 17 1,4 1,5 97,0
4 26 2,0 2,2 99,2
4 2 ,2 ,2 99,4
5 1 ,1 ,1 99,5
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
8
5 5 ,4 ,5 100,0
Ogółem 1154 91,4 100,0
Braki danych Systemowe braki danych 109 8,6
Ogółem 1263 100,0
Oba przedstawione warianty tworzenia indeksu są sobie równorzędne. Decyzja o posługiwaniu się jednym z
nich należy zawsze do analityka.
Wynik indeksu jest liczbą, co oznacza, że jest to zmienna na poziomie ilościowym i można dla niej wyliczyć
wszystkie statystyki opisowe.
Indeks może być również z powodzeniem stosowany zarówno jako zmienna zależna (częściej), jak i
niezależna (rzadziej).
W naszym przykładzie potraktujemy indeks jako zmienną zależną i sprawdzimy, czy kobiety i mężczyźni
różnią się pod względem zaufania do religii (opinii o jej roli w życiu człowieka). Nie ma znaczenia, czy
wykorzystamy wariant 1 czy 2 indeksu – wynik zawsze będzie taki sam.
Test t-Studenta t(1152) = 2,649; p<0,05 wykazał, że płeć różnicuje zaufanie do religii. Kobiety (średnia 2,19)
częściej niż mężczyźni (średnia 2,30) deklarowały większe zaufanie do religii, wskazując, że jej praktykowanie
może pomóc w wybranych sytuacjach życiowych.
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
9
ANALIZA CZYNNIKOWA
Zbudowanie indeksu było bardzo proste: ot, trzeba tylko sprawdzić parę rzeczy, dodać do siebie kody
odpowiednich pytań, a potem zinterpretować uzyskane wartości.
Tyle, że przy okazji pominęliśmy kilka ważnych kwestii:
Czy wszystkie podpytania były ze sobą połączone merytorycznie i statystycznie?
Czy wszystkie podpytania mierzyły tak naprawdę to samo?
Czy wszystkie podpytania były jednakowo ważne dla wskaźnika?
Analiza czynnikowa pomaga rozwiać powyższe wątpliwości i w rezultacie dzięki niej można stworzyć o
wiele bardziej precyzyjny niż indeks wskaźnik: skalę.
Przykład:
Dane dla roku 2010
Chcemy utworzyć skalę stosunku do religii (opinii o religii)
Wybieramy z dostępnych danych następujące zmienne:
o re11b „Zbyt ufamy nauce, za mało religii”
o re11c „Religia-więcej konfliktów niż pokoju”
o re11d „Osoby religijne często zbyt nietolerancyjne”
o re19a „Bóg zajmuje się osobiście każdą istotą”
o re19c „Życie ma sens bo istnieje Bóg”
o re34a „Religia sprzyja odnalezieniu wewnętrznego spokoju i szczęścia”
o re34b „Religia sprzyja zawieraniu przyjaźni”
o re34c „Religia sprzyja uzyskaniu pocieszenia w kłopotach lub chwilach smutku”
o re34d „Religia sprzyja spotykaniu właściwych ludzi”
Przy wyborze zmiennych należy zwrócić uwagę na te same kwestie co, przy indeksie:
a) wybrane zmienne są ilościowe lub zero-jedynkowe (dychotomiczne, wskazujące na występowanie
lub brak występowania cechy, np. tak/nie);
b) w przypadku kafeterii likertowskich jest zachowana interwałowość (kafeteria jest nieparzysta,
symetryczna, z wyraźnym środkiem);
c) wszystkie pytania mają takie same kafeterie – chodzi przede wszystkim o liczbę itemów: jeśli jest
różna należy najpierw dokonać standaryzacji zmiennych;
d) porządek odpowiedzi uwzględnia jeden kierunek natężenia zmiennej.
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
10
Ad. a)
Wszystkie wybrane przez nas zmienne są mierzone na poziomie ilościowym.
Ad b)
We wszystkich wybranych pytaniach kafeterie są interwałowe, o ile odpowiedź „trudno powiedzieć”
przekoduje się jako brak danych:
Zdecydowanie się zgadzam (kod 1)
Zgadzam się (kod 2)
Ani się zgadzam, ani nie zgadzam (kod 3)
Nie zgadzam się (kod 4)
Zdecydowanie się nie zgadzam (kod 5)
Trudno powiedzieć (kod 8)
Ad c)
Wszystkie wybrane pytania mają takie same kafeterie pod względem uporządkowania (wszystkie są
likertowskie) i liczby itemów (wszystkie mają po 5 itemów).
Gdyby było inaczej (np. kilka kafeterii byłoby 5-elementowych a kilka 7-elementowych) to zamiast
redukować większą kafeterię do mniejszej liczby itemów, lepiej dokonać standaryzacji wszytskich branych
pod uwagę zmiennych (czyli przełożenia kodów na wartości z rozkładu normalnego):
ANALIZA -> OPIS STATYSTYCZNY -> STATYSTYKI OPISOWE -> ZAPISZ STANDARYZOWANE
WARTOŚCI JAKO ZMIENNE
Syntax (np. dla zmiennej re19a)
DESCRIPTIVES VARIABLES=re19a
/SAVE
/STATISTICS=MEAN STDDEV MIN MAX.
Po wywołaniu polecenia policzą się statystyki opisowe, ale ważniejsze jest, że na końcu naszej listy
zmiennych w bazie pojawi się nowa zmienna „Zre19a” (nazwa nadana przez SPSS – zawsze przy
standaryzacji jest tak samo: do oryginalnej nazwy zmiennej program dodaje na początku dużą literę „Z”).
Wartości nowej zmiennej odniesione są do rozkładu tej zmiennej: im bliżej 0 tym bliżej średniej, a wartości
mniejsze/większe od zera wskazują na oddalanie się od średniej o wartość odchylenia standardowego
(wartości z minusem do te mniejsze od średniej; wartości z plusem to te większe od średniej).
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
11
Ad d)
Sprawdzamy, czy kolejność odpowiedzi będzie w każdym pytaniu wskazywała ten sam kierunek natężenia
zmiennej:
re11b „Zbyt ufamy nauce, za mało religii”:
o im wyższy kod odpowiedzi, tym mniejsze zaufanie do religii;
re11c „Religia-więcej konfliktów niż pokoju”:
o im wyższy kod odpowiedzi, tym większe zaufanie do religii;
re11d „Osoby religijne często zbyt nietolerancyjne”:
o im wyższy kod odpowiedzi, tym większe zaufanie do religii;
re19a „Bóg zajmuje się osobiście każdą istotą”:
o im wyższy kod odpowiedzi, tym mniejsze zaufanie do religii;
re19c „Życie ma sens bo istnieje Bóg”:
o im wyższy kod odpowiedzi, tym mniejsze zaufanie do religii;
re34a „Religia sprzyja odnalezieniu wewnętrznego spokoju i szczęścia”:
o im wyższy kod odpowiedzi, tym mniejsze zaufanie do religii;
re34b „Religia sprzyja zawieraniu przyjaźni”:
o im wyższy kod odpowiedzi, tym mniejsze zaufanie do religii;
re34c „Religia sprzyja uzyskaniu pocieszenia w kłopotach lub chwilach smutku”:
o im wyższy kod odpowiedzi, tym mniejsze zaufanie do religii;
re34d „Religia sprzyja spotykaniu właściwych ludzi”:
o im wyższy kod odpowiedzi, tym mniejsze zaufanie do religii;
W naszym przypadku dwa pytania na 9 wybranych mają inny porządek odpowiedzi: tam wskazywanie
odpowiedzi wysokokodowanych będzie wskazywało na większe zaufanie do religii. Ponieważ te
„odmienne” pytania są w mniejszości, to przekodujemy je wg wzoru:
Stary porządek kafeterii Nowy porządek kafeterii
Zdecydowanie się zgadzam (kod 1)
Zgadzam się (kod 2)
Ani się zgadzam, ani nie zgadzam (kod 3)
Nie zgadzam się (kod 4)
Zdecydowanie się nie zgadzam (kod 5)
Zdecydowanie się nie zgadzam (kod 1)
Nie zgadzam się (kod 2)
Ani się zgadzam, ani nie zgadzam (kod 3)
Zgadzam się (kod 4)
Zdecydowanie się zgadzam (kod 5)
UWAGA: rekodujemy korzystając z opcji „rekoduj na inne zmienne” (by nie tracić oryginałów) i
pamiętamy, by przy definiowaniu wartości źródłowych i wynikowych rekodowania zaznaczyć opcję
„systemowy lub zdefiniowany brak danych -> systemowy brak danych”.
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
12
Po zrekodowaniu zmiennych re11c i re11d nasza lista wybranych zmiennych przedstawia się następująco:
re11b „Zbyt ufamy nauce, za mało religii”:
o im wyższy kod odpowiedzi, tym mniejsze zaufanie do religii;
re11c_rek „Religia-więcej konfliktów niż pokoju - rekodowane”:
o im wyższy kod odpowiedzi, tym mniejsze zaufanie do religii;
re11d_rek „Osoby religijne często zbyt nietolerancyjne - rekodowane”:
o im wyższy kod odpowiedzi, tym mniejsze zaufanie do religii;
re19a „Bóg zajmuje się osobiście każdą istotą”:
o im wyższy kod odpowiedzi, tym mniejsze zaufanie do religii;
re19c „Życie ma sens bo istnieje Bóg”:
o im wyższy kod odpowiedzi, tym mniejsze zaufanie do religii;
re34a „Religia sprzyja odnalezieniu wewnętrznego spokoju i szczęścia”:
o im wyższy kod odpowiedzi, tym mniejsze zaufanie do religii;
re34b „Religia sprzyja zawieraniu przyjaźni”:
o im wyższy kod odpowiedzi, tym mniejsze zaufanie do religii;
re34c „Religia sprzyja uzyskaniu pocieszenia w kłopotach lub chwilach smutku”:
o im wyższy kod odpowiedzi, tym mniejsze zaufanie do religii;
re34d „Religia sprzyja spotykaniu właściwych ludzi”:
o im wyższy kod odpowiedzi, tym mniejsze zaufanie do religii;
Możemy teraz przystąpić do wykonywania analizy czynnikowej.
Analiza pokaże nam:
czy wszystkie wybrane przez nas zmiennej są powiązane nie tylko merytorycznie, ale i statystycznie;
jak bardzo dla tworzonej przez nas skali jest istotna każda ze zmiennych;
czy w ramach wybranego zestawu zmiennych są czynniki – czyli podskale powiązanych ze sobą
statystycznie zmiennych
ANALIZA -> REDUKCJA WYMIARÓW -> ANALIZA CZYNNIKOWA
do okienka po prawej stronie przerzucamy wszystkie interesujące nas zmienne;
pole pod spodem „Zmienna filtrująca” to nie zmienna niezależna! Tutaj nie ma takowej! To
możliwość ograniczenia analizy tylko do osób, które na pewne pytanie udzieliły konkretnej
wypowiedzi (np. tylko kobiety albo tylko „bardzo religijni” itp.) – to zwykły filtr!
Analiza czynnikowa wymaga zdefiniowania szeregu dodatkowych opcji – są one „ukryte” po przyciskami
po prawej stronie okna dialogowego.
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
13
1. WYODRĘBNIANIE
a) Metoda:
Głównych składowych (domyślna)
o Tylko ona pozwala uzyskać takie czynniki, które będą wyjaśniały maksymalny procent
wariancji wyjściowych zmiennych.
b) Analiza:
Macierz korelacji – gdy analizujemy dane surowe, niestandaryzowane;
Macierz kowariancji – gdy analizujemy dane po standaryzacji.
Ponieważ nie robiliśmy standaryzacji, to zostawiamy zaznaczoną domyślnie „macierz korelacji”.
c) Pokaż
Nierotowane rozwiązania czynnikowe – zostawiamy domyślnie zaznaczone.
Wykres osypiska (metoda Catella) – gdybyśmy chcieli o liczbie czynników (czyli tych potencjalnych
podskal decydować na podstawie metody wykresu osypiska – my tutaj nie chcemy, a
zainteresowanych odsyłam do literatury)
d) Wyodrębnianie
Na podstawie wartości własnej większej niż… (metoda Kaisera) - zostawiamy domyślnie wpisaną
liczbę „1”
o Liczbę czynników wyliczy nam SPSS;
o Wartość własna określa procent wyjaśnianych przez dany czynnik wariancji;
o Jeśli czynnik nie wyjaśnia więcej wariancji niż pojedyncza zmienna to nie ma sensu –
oznacza, że „nie wchodzi w reakcję” z innymi zmiennymi i sam tworzy podskalę, co
oznacza, że można go analizować osobno, bez bawienia się analizą czynnikową.
Ustalona liczba czynników
o Opcja alternatywna do poprzedniej, gdy sami decydujemy ile czynników ma ustalić SPSS;
o Do wykorzystania, gdy:
Analizowaliśmy wykres osypiska i wiemy ile chcemy czynników;
Analizowaliśmy już raz przeprowadzoną analizę czynnikową, gdzie SPSS pokazał
nam, że można na podstawie własności własnej większej niż 1 wyodrębnić np. 4
czynniki, a my chcemy zmusić go by pokazał nam rozwiązanie z np. 3 czynnikami.
e) Maksimum iteracji dla uzyskania zbieżności zostawiamy domyślnie ustawiona na 25.
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
14
2. ROTACJA
Rotacja rozwiązań czynnikowych pozwala zwiększyć dopasowanie modelu i porządkuje prezentację
wyników (co ułatwia ich późniejszą interpretację)
a) Metoda - najpopularniejsze:
Varimax
o Rotacja ortogonalna;
o Zakłada brak korelacji pomiędzy czynnikami (podskale nie są ze sobą powiązane);
o Przydaje się, gdy przygotowujemy predyktory do analizy regresji (tam jest zalecenie, by
predyktory nie korelowały ze sobą);
o Trzeba zdawać sobie sprawę, że będzie to trochę sztuczne rozwiązanie – rzeczywistość
społeczna jest zbyt skomplikowana, by móc oczekiwać całkowitego braku pomiędzy
występującymi w niej zjawiskami.
Prosta Oblimin
o Rotacja nieortogonalna (ukośna);
o Zakłada, że istnieje korelacja pomiędzy czynnikami;
o Pokazuje czy i jak silna jest to zależność (może się zdarzyć, że wskaże brak zależności, a
wtedy dobrze policzyć analizę czynnikową jeszcze raz, wybierając rotację Varimax);
o Wybierając ją zostawiamy domyślnie wpisane wartości Delta i Kappa.
b) Reszta opcji – pozostawiona domyślnie.
UWAGA: Policzymy analizę czynnikową dwukrotnie:
najpierw z rotacją Varimax, a potem z rotacją Oblimin.
3. OPCJE
a) Brak danych
Zostawiamy domyślnie zaznaczone „wyłączanie wszystkich obserwacji z brakami”;
Oznacza to, że jeśli ktoś na którekolwiek z branych przez nas pod uwagę pytań udzielił odpowiedzi
równoznacznej z brakiem danych (np. trudno powiedzieć), to jego odpowiedzi nie będą
uwzględniane przy wyliczeniach analizy czynnikowej.
b) Format wyświetlania współczynników
Sortuj według wartości ładunków czynnikowych
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
15
o Zaznaczamy;
o To jest opcja, która porządkuje tabelę wyników i ułatwia interpretację.
Ukryj małe współczynniki
o Zaznaczamy;
o W pole „wartość bezwzględna poniżej” wpisujemy „0,4”;
o Przyjmuje się, że jest to minimalna wartość z jaką czynnik ładuje zmienną – czyli liczba
pokazująca jak mocno dana zmienna przynależy do danego czynnika.
4. STATYSTYKI
a) Statystyki
Statystyki opisowe – zaznaczamy, mogą się przydać przy interpretacji;
Rozwiązania wstępne – zostawiamy zaznaczone domyślnie
b) Macierz korelacji – z dostępnych opcji zaznaczamy:
K-M-O i test sferyczności Bartletta
o K-M-O to miara adekwatności doboru próby
o To stosunek korelacji zmiennych do ich korelacji częściowej, czyli wielkość unikalnego
związku;
o Najlepiej, gdy ma wartość bliską 1;
o Za minimum przyjmuje się 0,5 – jeśli jest poniżej, to analiza czynnikowa nie jest wiarygodna
(zmienne są słabo ze sobą pokorelowane);
5. OCENY
W tym momencie nie zaznaczamy tu żadnej z opcji.
a) Zapisz jako zmienne
Metoda: Anderson-Rubin
Każdy wyodrębniony czynnik zostanie zapisany jako nowa zmienna
Wartości będą wystandaryzowane do rozkładu normalnego
Należy je interpretować w kategoriach odległości od średniej:
o Ujemne – niski wynik na skali (poniżej średniej)
o Okolice zera – wynik przeciętny (średni)
o Dodatnie – wysoki wynik na skali (powyżej średniej)
Tak utworzone zmienne mogą być traktowane jako niezależne lub zależne w innych obliczeniach;
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
16
Syntax:
FACTOR
/VARIABLES re11b re11c_rek re11d_rek re19a re19c re34a re34b re34c re34d
/MISSING LISTWISE
/ANALYSIS re11b re11c_rek re11d_rek re19a re19c re34a re34b re34c re34d
/PRINT UNIVARIATE INITIAL KMO EXTRACTION ROTATION
/FORMAT SORT BLANK(0.4)
/CRITERIA MINEIGEN(1) ITERATE(25)
/EXTRACTION PC
/CRITERIA ITERATE(25)
/ROTATION VARIMAX
/METHOD=CORRELATION.
Gdzie w linii kodu:
/VARIABLES – lista nazw zmiennych
/MISSING LISTWISE - wyłączanie wszystkich obserwacji z brakami
/ANALYSIS - lista zmiennych przy liczeniu statystyk opisowych
/PRINT UNIVARIATE INITIAL KMO EXTRACTION ROTATION - pokazuje rozwiązania początkowe
(nierotowane) oraz miarę K-M-O
/FORMAT SORT BLANK(0.4) - zdefiniowana wartość minimalna ładunku czynnikowego pokazywanego
w tabeli i sortowanie wg wartości ładunków czynnikowych
/CRITERIA MINEIGEN(1) ITERATE(25) - kryterium Kaisera z własnością własną min. 1
/EXTRACTION PC – nazwa metody: głównych składowych
/CRITERIA ITERATE(25) - metoda oparta na korelacji
/ROTATION VARIMAX – wybrana rotacja: Varimax (jeśli wybralibyśmy Oblimin to byłyby dwie linie:
/CRITERIA ITERATE(25) DELTA(0)
/ROTATION OBLIMIN
/METHOD=CORRELATION. – metoda oparta na macierzy korelacji (jeśli wybralibyśmy macierz
kowariancji, to linia wyglądałaby:
/METHOD=COVARIANCE
Jeśli chcielibyśmy zapisać czynniki jako zmienne to w przedostatniej linii trzeba by było dopisać nową
linijkę kodu:
/SAVE AR(ALL)
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
17
Po wywołaniu polecenia (analiza czynnikowa z rotacją Varimax) otrzymujemy następujące tabele:
a)
Statystyki opisowe
Średnia Odchylenie
standardowe
Analizowane
obserwacje N
Zbyt ufamy nauce, za mało religii 3,55 1,000 973
Religia-więcej konfliktów niż pokoju 3,26 1,052 973
Osoby religijne często zbyt nietolerancyjne 3,58 1,060 973
Bóg zajmuje się osobiście każdą istotą 2,37 1,130 973
Życie ma sens bo istnieje Bóg 3,00 1,133 973
odnalezieniu wewnętrznego spokoju i szczęścia 1,99 ,796 973
zawieraniu przyjaźni 2,51 ,971 973
uzyskaniu pocieszenia w kłopotach lub chwilach smutku 1,96 ,803 973
spotykaniu właściwych ludzi 2,56 ,995 973
Tabela informuje nas:
O średniej wartości odpowiedzi (a pamiętamy, że im niższa wartość tym większe zaufanie do religii)
O odchyleniu standardowym (im wyższe, tym większe rozbieżności w odpowiedziach badanych)
Analizowanych obserwacjach (wiemy dla ilu osób została policzona analiza czynnikowa)
b)
Testy Kaisera-Mayera-Olkina i Bartletta
Miara KMO adekwatności doboru próby ,768
Test sferyczności Bartletta
Przybliżone chi-kwadrat 3352,786
df 36
Istotność ,000
Wartość miary K-M-O to 0,768:
Jest powyżej 0,5 – czyli nasza analiza czynnikowa jest wiarygodna
Do wartości 1 trochę brakuje, ale to nic nie szkodzi.
Test sferyczności Bartletta
Jest istotny: p<0,05
Co oznacza, że macierz korelacji zawiera istotne współczynniki korelacji – innymi słowy: brane
przez nas pod uwagę zmienne są ze sobą powiązane (a to bardzo dobrze)
Jeśli obie miary (K-M-O i test Bartletta) dadzą niesatysfakcjonujące wyniki, to należy przemyśleć
rekonstrukcję zestawu zmiennych – może jest tam zmienna, która „psuje”, bo jest nieskorelowana z
pozostałymi?
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
18
c)
Zasoby zmienności wspólnej
Początkowe Po
wyodrębnieniu
Zbyt ufamy nauce, za mało religii 1,000 ,615
Religia-więcej konfliktów niż pokoju 1,000 ,768
Osoby religijne często zbyt nietolerancyjne 1,000 ,727
Bóg zajmuje się osobiście każdą istotą 1,000 ,567
Życie ma sens bo istnieje Bóg 1,000 ,678
odnalezieniu wewnętrznego spokoju i szczęścia 1,000 ,714
zawieraniu przyjaźni 1,000 ,671
uzyskaniu pocieszenia w kłopotach lub chwilach smutku 1,000 ,724
spotykaniu właściwych ludzi 1,000 ,708
Metoda wyodrębniania czynników – głównych składowych.
Określa ile procent wariancji zmiennej wyjściowej udało się odtworzyć w nowo powstałych
czynnikach;
Im więcej, tym lepiej – oznacza to, że zmienna dobrze wpisuje się w tworzone czynniki.
d)
Całkowita wyjaśniona wariancja
Składowa Początkowe wartości własne Sumy kwadratów ładunków
po wyodrębnieniu
Sumy kwadratów ładunków po rotacji
Ogółem %
wariancji
% skum. Ogółem %
wariancji
% skum. Ogółem % wariancji % skumulowany
1 3,736 41,514 41,514 3,736 41,514 41,514 2,788 30,983 30,983
2 1,353 15,033 56,547 1,353 15,033 56,547 1,802 20,020 51,002
3 1,083 12,028 68,576 1,083 12,028 68,576 1,582 17,573 68,576
4 ,778 8,639 77,215
5 ,685 7,609 84,824
6 ,485 5,386 90,210
7 ,402 4,462 94,671
8 ,286 3,183 97,854
9 ,193 2,146 100,000
Metoda wyodrębniania czynników – głównych składowych.
Tabela informuje nas:
Ile wyodrębniono czynników o wartości własnej większej niż 1 – na podstawie ostatniej części tabeli
(sumy kwadratów ładunków po rotacji) widać, że są to trzy czynniki (tu nazwane składowymi za
względu na to, że metodą wyodrębniania była metoda głównych składowych);
Ile procent wariancji wyjaśniają w sumie te trzy czynniki: u nas to 68,576% wariancji. To ponad 2/3
wszystkich analizowanych przez nas przypadków, a więc całkiem sporo.
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
19
e)
Macierz składowycha
Składowa
1 2 3
spotykaniu właściwych ludzi ,811
zawieraniu przyjaźni ,774
odnalezieniu wewnętrznego spokoju i szczęścia ,749
uzyskaniu pocieszenia w kłopotach lub chwilach smutku ,719
Bóg zajmuje się osobiście każdą istotą ,680
Życie ma sens bo istnieje Bóg ,653 ,482
Osoby religijne często zbyt nietolerancyjne ,744
Religia-więcej konfliktów niż pokoju ,412 ,696
Zbyt ufamy nauce, za mało religii ,435 ,653
Metoda wyodrębniania czynników - Głównych składowych.
a. 3 – liczba wyodrębnionych składowych.
Nierotowana macierz składowych (wyodrębnionych czynników) – pomijamy.
f)
Macierz rotowanych składowycha
Składowa
1 2 3
uzyskaniu pocieszenia w kłopotach lub chwilach smutku ,846
odnalezieniu wewnętrznego spokoju i szczęścia ,831
spotykaniu właściwych ludzi ,766
zawieraniu przyjaźni ,763
Zbyt ufamy nauce, za mało religii ,779
Życie ma sens bo istnieje Bóg ,763
Bóg zajmuje się osobiście każdą istotą ,610
Religia-więcej konfliktów niż pokoju ,862
Osoby religijne często zbyt nietolerancyjne ,834
Metoda wyodrębniania czynników - Głównych składowych.
Metoda rotacji - Varimax z normalizacją Kaisera.
a. Rotacja osiągnęła zbieżność w 4 iteracjach.
Macierz po rotacji, uszeregowaniu czynników i ukryciu niskich wartości ładunków czynnikowych.
Mamy trzy wyodrębnione czynniki:
o Czynnik nr 1 to podpytania dotyczące tego, w czym może pomóc religia;
o Czynnik nr 2 to podpytania dotyczące wielkości Boga (opinii nt. Boga);
o Czynnik nr 3 to podpytania dotyczące religii jako pewnego zjawiska społecznego.
Każdy z czynników to osobna podskala.
Zgodnie z założeniem rotacji Varimax te podskale uznajemy za nieskorelowane ze sobą.
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
20
Teraz wykonamy analizę czynnikową z rotacją Oblimin – czyli przy założeniu korelacji pomiędzy
czynnikami.
a)
Statystyki opisowe – interpretacja jak poprzednio.
b)
Miara K-M-O i test sferyczności Bartletta – interpretacja jak poprzednio.
c)
Zasoby zmienności wspólnej – interpretacja jak poprzednio.
d)
Całkowita wyjaśniona wariancja
Składowa Początkowe wartości własne Sumy kwadratów ładunków po wyodrębnieniu Sumy
kwadratów
ładunków po
rotacjia
Ogółem % wariancji % skumulowany Ogółem % wariancji % skumulowany Ogółem
1 3,736 41,514 41,514 3,736 41,514 41,514 3,292
2 1,353 15,033 56,547 1,353 15,033 56,547 1,897
3 1,083 12,028 68,576 1,083 12,028 68,576 2,308
4 ,778 8,639 77,215
5 ,685 7,609 84,824
6 ,485 5,386 90,210
7 ,402 4,462 94,671
8 ,286 3,183 97,854
9 ,193 2,146 100,000
Metoda wyodrębniania czynników – głównych składowych.
a. Dodawanie sum kwadratów ładunków w celu otrzymania ogólnej wariancji nie jest możliwe, gdy składowe są skorelowane.
Tabela informuje nas:
O liczbie wyodrębnionych czynników: 3.
O procencie wariancji wyjaśniającym w sumie te trzy czynniki: 68,576%.
Tak więc podobnie jak w przypadku rotacji Varimax mamy wyodrębnione trzy czynniki i taki sam procent
wyjaśnionych wariancji.
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
21
e)
Macierz składowycha
Składowa
1 2 3
spotykaniu właściwych ludzi ,811
zawieraniu przyjaźni ,774
odnalezieniu wewnętrznego spokoju i szczęścia ,749
uzyskaniu pocieszenia w kłopotach lub chwilach smutku ,719
Bóg zajmuje się osobiście każdą istotą ,680
Życie ma sens bo istnieje Bóg ,653 ,482
Osoby religijne często zbyt nietolerancyjne ,744
Religia-więcej konfliktów niż pokoju ,412 ,696
Zbyt ufamy nauce, za mało religii ,435 ,653
Metoda wyodrębniania czynników - Głównych składowych.
a. 3 – liczba wyodrębnionych składowych.
Nierotowana macierz składowych (wyodrębnionych czynników) – pomijamy.
f)
Macierz modelowaa
Składowa
1 2 3
uzyskaniu pocieszenia w kłopotach lub chwilach smutku ,894
odnalezieniu wewnętrznego spokoju i szczęścia ,862
zawieraniu przyjaźni ,759
spotykaniu właściwych ludzi ,750
Religia-więcej konfliktów niż pokoju ,876
Osoby religijne często zbyt nietolerancyjne ,850
Zbyt ufamy nauce, za mało religii ,823
Życie ma sens bo istnieje Bóg ,745
Bóg zajmuje się osobiście każdą istotą ,553
Metoda wyodrębniania czynników - Głównych składowych.
Metoda rotacji - Oblimin z normalizacją Kaisera.
a. Rotacja osiągnęła zbieżność w 5 iteracjach.
Macierz po rotacji, uszeregowaniu czynników i ukryciu niskich wartości ładunków czynnikowych.
Mamy trzy wyodrębnione czynniki:
o Czynnik nr 1 to podpytania dotyczące tego, w czym może pomóc religia;
o Czynnik nr 2 to podpytania dotyczące religii jako pewnego zjawiska społecznego;
o Czynnik nr 3 to podpytania dotyczące wielkości Boga (opinii nt. Boga).
Każdy z czynników to osobna podskala.
Zgodnie z założeniem rotacji Oblimin te podskale uznajemy za skorelowane ze sobą.
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
22
g)
Macierz korelacji składowych
Składowa 1 2 3
1 1,000 ,261 ,380
2 ,261 1,000 ,210
3 ,380 ,210 1,000
Metoda wyodrębniania czynników - Głównych składowych.
Metoda rotacji - Oblimin z normalizacją Kaisera.
Pokazuje korelacje pomiędzy poszczególnymi czynnikami:
o Czynnik 1 i 2 – korelacja 0,261 czyli słaba;
o Czynnik 1 i 3 – korelacja 0,38 czyli umiarkowana;
o Czynnik 2 i 3 – korelacja 0,21 czyli słaba.
Nie są to korelacje zbyt wysokie, ale mimo wszystko pokazują, że czynniki są współzależne.
Na podstawie przeprowadzonej analizy czynnikowej (niezależnie od metody rotacji) wiemy, że następująca
lista zmiennych:
re11b „Zbyt ufamy nauce, za mało religii”
re11c_rek „Religia-więcej konfliktów niż pokoju”
re11d_rek „Osoby religijne często zbyt nietolerancyjne”
re19a „Bóg zajmuje się osobiście każdą istotą”
re19c „Życie ma sens bo istnieje Bóg”
re34a „Religia sprzyja odnalezieniu wewnętrznego spokoju i szczęścia”
re34b „Religia sprzyja zawieraniu przyjaźni”
re34c „Religia sprzyja uzyskaniu pocieszenia w kłopotach lub chwilach smutku”
re34d „Religia sprzyja spotykaniu właściwych ludzi”
nie tworzy jednej spójnej skali (jednego spójnego wskaźnika).
Mamy tak naprawdę trzy skale, które za każdym razem mierzą trochę inne rzeczy:
zaufania do religii (re34a, re34b, re34c, re34d)
o im wyższy wynik na skali tym mniejsze zaufanie
stosunku do Boga (re11b, re19a, re19c)
o im wyższy wynik na skali tym silniejsza negacja Boga
opinii o religii jako zjawisku społecznym (re11c_rek, re11d_rek)
o im wyższy wynik na skali tym silniejsza opinia negatywna nt. religii jako zjawiska
społecznego
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
23
Zanim jednak utworzymy te skale (na razie wiemy, że można je wyróżnić, ale jako osobne zmienne jeszcze
nie istnieją), warto sprawdzić ich rzetelność – czyli jak bardzo są spójne i czy usunięcie któregokolwiek
itemu nie poprawiłoby jakości skali.
ANALIZA -> SKALOWANIE -> ANALIZA RZETELNOŚCI
1. Przykład: dla skali zaufania do religii (re34a, re34b, re34c, re34d)
interesujące nas zmienne przerzucamy do okienka po prawej
w „statystyki” zaznaczamy:
o pozycja testowa
o skala przy wykluczeniu pozycji
Syntax:
RELIABILITY
/VARIABLES=re34a re34b re34c re34d
/SCALE('ALL VARIABLES') ALL
/MODEL=ALPHA
/STATISTICS=DESCRIPTIVE
/SUMMARY=TOTAL.
Po wywołaniu polecenia otrzymujemy kilka tabel , z których interpretujemy tylko dwie:
a)
Statystyki rzetelności
Alfa Cronbacha Liczba pozycji
,851 4
wartość Alfa Cronbacha jest miarą rzetelności skali:
o minimum powinno być 0,5 – poniżej skala jest kiepska
o najlepiej by było w okolicach 0,7
o ale im bliżej 1 tym lepiej
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
24
b)
Statystyki pozycji Ogółem
Średnia skali po
usunięciu
pozycji
Wariancja skali
po usunięciu
pozycji
Korelacja
pozycji Ogółem
Alfa Cronbacha
po usunięciu
pozycji
odnalezieniu wewnętrznego spokoju i szczęścia 6,99 5,748 ,662 ,824
zawieraniu przyjaźni 6,46 4,818 ,721 ,798
uzyskaniu pocieszenia w kłopotach lub chwilach smutku 7,01 5,705 ,663 ,823
spotykaniu właściwych ludzi 6,43 4,712 ,737 ,791
interesuje nas tylko wynik z ostatniej kolumny;
pokazuje on, jaką wartość przyjęłaby miara Alfa Cronbacha, gdyby ze skali usunięto daną zmienną;
patrzymy, czy w którymkolwiek przypadku Alfa byłaby większa – gdyby tak było, to warto ze skali
usunąć „psującą” ją zmienną;
w naszym przypadku usunięcie którejkolwiek ze zmiennych nie zwiększy wartości Alfa – skala jest
więc dobra w takiej postaci, w jakiej jest.
2. A teraz przyjmijmy, że nie mamy wiedzy, którą dostarczyła nam analiza czynnikowa.
Wybraliśmy zestaw 9 zmiennych, które wg nas mogą tworzyć skalę:
re11b „Zbyt ufamy nauce, za mało religii”
re11c_rek „Religia-więcej konfliktów niż pokoju”
re11d_rek „Osoby religijne często zbyt nietolerancyjne”
re19a „Bóg zajmuje się osobiście każdą istotą”
re19c „Życie ma sens bo istnieje Bóg”
re34a „Religia sprzyja odnalezieniu wewnętrznego spokoju i szczęścia”
re34b „Religia sprzyja zawieraniu przyjaźni”
re34c „Religia sprzyja uzyskaniu pocieszenia w kłopotach lub chwilach smutku”
re34d „Religia sprzyja spotykaniu właściwych ludzi”
Wykonujemy analizę rzetelności, żeby zobaczyć, jak dobra jest to skala.
Syntax:
RELIABILITY
/VARIABLES=re11b re11c_rek re11d_rek re19a re19c re34a re34b re34c re34d
/SCALE('ALL VARIABLES') ALL
/MODEL=ALPHA
/STATISTICS=DESCRIPTIVE
/SUMMARY=TOTAL.
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
25
Po wywołaniu polecenia zaglądamy do tabeli z Alfą Cronbacha:
Statystyki rzetelności
Alfa Cronbacha Liczba pozycji
,804 9
Nie jest źle: Alfa ma wartość 0,804, czyli jest zdecydowanie powyżej zakładanego progu minimum (0,5).
Zobaczmy, czy taką skalę da się poprawić:
Statystyki pozycji Ogółem
Średnia skali po
usunięciu
pozycji
Wariancja skali
po usunięciu
pozycji
Korelacja
pozycji Ogółem
Alfa Cronbacha
po usunięciu
pozycji
Zbyt ufamy nauce, za mało religii 21,23 27,120 ,333 ,806
Religia-więcej konfliktów niż pokoju 21,52 26,686 ,349 ,805
Osoby religijne często zbyt nietolerancyjne 21,20 26,668 ,346 ,805
Bóg zajmuje się osobiście każdą istotą 22,41 23,949 ,575 ,774
Życie ma sens bo istnieje Bóg 21,78 24,148 ,552 ,778
odnalezieniu wewnętrznego spokoju i szczęścia 22,79 26,197 ,583 ,778
zawieraniu przyjaźni 22,27 24,733 ,612 ,770
uzyskaniu pocieszenia w kłopotach lub chwilach smutku 22,81 26,475 ,540 ,782
spotykaniu właściwych ludzi 22,22 24,112 ,664 ,763
wyrzucenie pierwszych trzech zmiennych mogłoby nam lekko podnieść wartość Alfa: o 0,001-0,002
czyli naprawdę niewiele – to zmiana w zasadzie nieistotna;
wyrzucenie którejkolwiek z pozostałych zmiennych wartość Alfa zmniejszy – czyli skala będzie
słabsza.
UWAGA:
analiza rzetelności nie pokazała nam wyraźnie, że zestaw 9 wybranych zmiennych rozpada się na
podskale;
gdybyśmy kierowali się tylko i wyłącznie jej wynikiem, to zbudowaliśmy wskaźnik z wszystkich 9
zmiennych;
biorąc więc pod uwagę taki scenariusz warto jednak najpierw wykonywać analizę czynnikową, która
sięga „głębiej” w dane i jest w stanie ujawnić ukryte w nich struktury;
analiza rzetelności może więc:
o albo pomóc w dopracowaniu wyników analizy czynnikowej;
o albo zasugerować jedynie, że wśród wybranych zmiennych mamy podskale – z całkowitą
pewnością jednak ich nie ujawni – to zrobi dopiero analiza czynnikowa.
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
26
Wróćmy do wyodrębnionej skali zaufania do religii. Przypomnijmy, że składa się ona z czterech zmiennych:
re34a „Religia sprzyja odnalezieniu wewnętrznego spokoju i szczęścia”
re34b „Religia sprzyja zawieraniu przyjaźni”
re34c „Religia sprzyja uzyskaniu pocieszenia w kłopotach lub chwilach smutku”
re34d „Religia sprzyja spotykaniu właściwych ludzi”
I w bazie te zmienne wciąż widnieją osobno.
Jak zamienić je na jeden wskaźnik-skalę?
Sposób 1
Na podstawie zmiennych, które wchodzą w skład wyodrębnionej skali budujemy wskaźnik
sumaryczny, którego wartość będzie wartością uzyskaną przez respondenta na skali;
Innymi słowy: dokonujemy tej samej operacji co przy indeksie: dodajemy do siebie wybrane pytania,
które tworzą skalę;
Wynik uzyskany przez respondenta interpretujemy tak samo, jak to robiliśmy w przypadku indeksu:
zgodnie z natężeniem wartości zmiennych w kafeteriach;
Uzyskany wskaźnik możemy wykorzystywać jako zmienną niezależna lub zależną;
Co w takim razie jest inaczej niż wtedy, gdy robiliśmy indeks?
o Tym razem mamy mocne podstawy, by sądzić, że zmienne wchodzące w skład wskaźnika-
skali są ze sobą powiązane merytorycznie i statystycznie.
o W przypadku, gdy od razu budowaliśmy indeks (dodawaliśmy do siebie pytania) my tylko
zakładaliśmy, że tak jest – dowodów jednak nie było. Dostarczyła ich dopiero analiza
czynnikowa.
Wadą tego sposobu budowy wskaźnika-skali jest to, że:
o wszystkie pytania traktujemy jako jednakowo ważne dla skali – a to nieprawda. Analiza
czynnikowa pokazywała nam, że czynniki w różny sposób ładują konkretne zmienne.
Zaletą tego sposobu jest prostota: i wykonania, i interpretacji wyniku.
Sposób 2
Wykonujemy jeszcze raz analizę czynnikową z rotacją Oblimin (bo wiemy już, że czynniki są ze
sobą skorelowane)
Tym razem w OCENY zaznaczamy
o Zapisz jako zmienne
o Metoda: Anderson-Rubin
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
27
Analiza czynnikowa wykonała się ponownie, a to co jest nowego znajdziemy w bazie – na końcu
pojawiły się trzy nowe zmienne:
o FAC1_1 „A-R factor score 1 for analysis 1”
o FAC2_1 „A-R factor score 2 for analysis 1”
o FAC3_1 „A-R factor score 3 for analysis 1”
Za tymi nazwami ukrywają się wyniki respondentów dla poszczególnych podskal:
o FAC1_1 - zaufania do religii
o FAC2_1 - opinii o religii jako zjawisku społecznym
o FAC3_1 – stosunku do Boga
Można w bazie zmienić ich nazwy na te przyjaźniejsze do operowania nimi;
Jeśli zajrzymy do zakładki „dane” to zobaczymy, że wartości nowych zmiennych są trochę inne – to
dlatego, że są zestandaryzowane do rozkładu normalnego.
I tak, jeśli respondent uzyskał:
o FAC1_1 - zaufania do religii: -0,40498 -> to jego wynik jest poniżej średniej (znak „-”) o
około pół odchylenia standardowego (0,5), co oznacza, że uzyskał raczej niski wynik na skali
i jest osobą ufającą religii;
o FAC2_1 - opinii o religii jako zjawisku społecznym: -1,76189 -> to jego wynik jest
poniżej średniej (znak „-”) o prawie 2 odchylenia standardowe (1,7), co oznacza, że uzyskał
bardzo niski wynik na skali i jest osobą bardzo mocno aprobującą Boga;
o FAC3_1 – stosunku do Boga: 0,34743 -> to jego wynik jest powyżej średniej (znak „+”)
i około 1/3 odchylenia standardowego (0,3), co oznacza, że uzyskał raczej wysoki wynik na
skali i nie ma raczej dobrego zdania o religii jako zjawisku społecznych.
Podobnie możemy interpretować wyniki skal nie tylko dla pojedynczych respondentów, ale i dla
całych grup;
Nowo uzyskane zmienne mogą służyć w dalszych analizach jako zmienne niezależne lub zależne.
o Gdybyśmy zrobili analizę czynnikową z rotacją Varimax i jednoczesnym zapisaniem
wyników jako nowych zmiennych, to mielibyśmy gotowe predyktory do analizy regresji.
Wadą takiego sposobu budowy wskaźnika-skali jest kłopot z interpretacją jego wartości – jest to
trochę mało intuicyjne i trzeba pamiętać, że odnosimy się do rozkładu normalnego;
Zaletą jest z kolei o wiele bardziej precyzyjny wynik niż w przypadku budowy na zasadzie
indeksowej.