ANALIZY WIELOZMIENNOWE - dr Agnieszka Figiel | analityk ... · Zmienna wielowymiarowa Wskaźnik...

Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)

1

ANALIZY WIELOZMIENNOWE

WPROWADZENIE DO TEMATYKI BUDOWY INDEKSÓW I SKAL

W trakcie prowadzenia badania, a potem analizowania jego wyników dość często posługujemy się

zmiennymi wielowymiarowymi. A raczej nie samymi zmiennymi, ale ich zoperacjonalizowanym

odwzorowaniem, czyli złożonymi wskaźnikami i odpowiadającymi im pytaniami kwestionariusza. W

praktyce wygląda to tak:

Zmienna jednowymiarowa Wskaźnik prosty Kwestionariusz – 1 pytanie

Wiek Rok urodzenia - deklaracja Chciał(a)bym teraz poprosić Pana(ią)

– dla celów statystycznych – o datę

Pana(i) urodzenia?

Zmienna wielowymiarowa Wskaźnik złożony Kwestionariusz – wiele pytań

Zaufanie do religii – opinia o

jej roli w życiu człowieka

Deklaracja dotycząca tego, czy

religia może pomóc w

określonych sytuacjach

życiowych:

- odnalezienie wewnętrznego

spokoju i szczęścia;

- zawieranie przyjaźni;

- uzyskanie pocieszenia w

kłopotach lub chwilach smutku;

- spotykanie właściwych ludzi.

Czy się Pan(i) zgadza czy też nie

zgadza, że praktykowanie religii

pomaga ludziom w ...

a. odnalezieniu wewnętrznego spokoju

i szczęścia

b. zawieraniu przyjaźni

c. uzyskaniu pocieszenia w kłopotach

lub chwilach smutku

d. spotykaniu właściwych ludzi

Gdybyśmy więc chcieli sprawdzić, czy np. kobiety i mężczyźni różnią się pod względem zaufania do religii

(opinii o jej roli w życiu człowieka) to dotychczas poznane sposoby analizy statystycznej nam nie

wystarczą. W każdym poznanym teście (chi-kwadrat, t-Studenta, Manna-Whitenya, Kruskala-Wallisa,

ANOVA) po stronie zmiennej zależnej i niezależnej mogło być tylko po jednej zmiennej. Tymczasem tutaj

zmienna zależna (nastawienie do religii) składa się z 4 mniejszych zmiennych. Nie pomoże nam też analiza

regresji, bo tam wiele mogło być zmiennych niezależnych – zależna była tylko jedna.

Rozwiązania są dwa:

Budowa indeksu

Budowa skali z wykorzystaniem analizy czynnikowej i analizy rzetelności.


2

Dla przypomnienia, podobieństwa i różnice pomiędzy indeksem i skalą.

Podobieństwa:

Indeksy i skale są porządkowymi miernikami zmiennych. Porządkują jednostki analizy w

kategoriach konkretnych zmiennych.

Mogą być stworzone jedynie dla zmiennych ilościowych (interwałowych i ilorazowych);

Wynik danej osoby na przykład na skali lub indeksie religijności stanowi wskazanie co do względnej

religijności tej osoby w porównaniu z innymi badanymi.

Są złożonymi miernikami zmiennych – wynik jest uzależniony od odpowiedzi na kilka (kilkanaście)

pytań.

Różnice: skala:

Taki zestaw powiązanych ze sobą merytorycznie i statystycznie twierdzeń, by przy ich pomocy dało

się zmierzyć natężenie danej zmiennej (opinii, postawy) u badanych;

Skalę uzyskuje się poprzez operacje matematyczne, a jej wynikiem jest pewna liczba odwzorowujaca

natężenie badanej zmiennej.

Uwzględnia intensywność obrazowania danej zmiennej przez różne pytania;

Podczas budowy skali uwzględniany jest stopień skorelowania zmiennych cząstkowych.

Różnice: indeks:

Mniej precyzyjne od skal;

Formułowane na bardziej liberalnych zasadach;

Wskaźniki (pytania) wchodzące w skład indeksu nie muszą być aż tak ściśle ze sobą powiązane

merytorycznie i statystycznie;

Wynik powstaje dzięki operacjom matematycznym: dodawaniu, mnożeniu, dzieleniu;

Z jednej strony mniej precyzyjne, z drugiej – czasem łatwiejsze w konstrukcji i przez to nadużywane.


3

BUDOWA INDEKSU

Przykład:

Filtr: rok 2010

Zmienna niezależna:

o q8 płeć

Zmienna zależna – wielowymiarowa, składająca się z pytań:

o re34a – Czy praktykowanie religii może pomóc w: odnalezieniu wewnętrznego spokoju i

szczęścia;

o re34b – Czy praktykowanie religii może pomóc w: zawieraniu przyjaźni;

o re34c – Czy praktykowanie religii może pomóc w: uzyskaniu pocieszenia w kłopotach lub

chwilach smutku;

o re34d – Czy praktykowanie religii może pomóc w: spotykaniu właściwych ludzi.

Indeks zbudujemy więc na podstawie pytań re34a-re34d.

Przed przystąpieniem do budowy indeksu należy upewnić się, czy:

a) wybrane zmienne są ilościowe lub zero-jedynkowe (dychotomiczne, wskazujące na występowanie

lub brak występowania cechy, np. tak/nie);

b) w przypadku kafeterii likertowskich jest zachowana interwałowość (kafeteria jest nieparzysta,

symetryczna, z wyraźnym środkiem);

c) wszystkie pytania mają takie same kafeterie;

d) porządek odpowiedzi uwzględnia jeden kierunek natężenia zmiennej.

Ad. a)

Wybrane przez nas zmienne są mierzone na poziomie ilościowym.

Ad. b) i c)

Kafeteria wszystkich wybranych przez nas pytań wygląda następująco:

Zdecydowanie się zgadzam (kod 1)

Zgadzam się (kod 2)

Ani się zgadzam, ani nie zgadzam (kod 3)

Nie zgadzam się (kod 4)

Zdecydowanie się nie zgadzam (kod 5)

Trudno powiedzieć (kod 8)

Interwałość kafeterii zakłóca odpowiedź „trudno powiedzieć”, która musi zostać przekodowana jako brak

danych.


4

Ad d)

Sprawdzamy, czy kolejność odpowiedzi będzie w każdym pytaniu wskazywała ten sam kierunek natężenia

zmiennej:

re34a – „Religia sprzyja odnalezieniu wewnętrznego spokoju i szczęścia”:

o im wyższy kod odpowiedzi, tym mniejsze zaufanie do religii;

re34b – „Religia sprzyja zawieraniu przyjaźni”:


re34c – „Religia sprzyja uzyskaniu pocieszenia w kłopotach lub chwilach smutku”:


re34d – „Religia sprzyja spotykaniu właściwych ludzi”:

o im wyższy kod odpowiedzi, tym mniejsze zaufanie do religii.

We wszystkich wybranych pytaniach jest ten sam porządek. Gdyby któreś pytanie „wyłamywało się”, to

trzeba by było je przekodować odwracając kolejność kodów odpowiedzi (wtedy „zdecydowanie się

zgadzam” miało by kod 5) – w naszym przypadku nie ma jednak potrzeby przekodowywania.

Analiza porządku odpowiedzi pokazuje nam też jak będziemy analizować wynik indeksu. Skoro we

wszystkich pytaniach, które wejdą w skład indeksu im wyższy kod odpowiedzi, tym mniejsze zaufanie do

religii, to identycznie będzie w indeksie. Tam też im wyższy wynik respondenta, tym mniejsze zaufanie do

religii. Gdybyśmy chcieli aby interpretacja indeksu była bardziej intuicyjna (im wyższy kod, tym większe

zaufanie) to dla wszystkich pytań należałoby odwrócić porządek odpowiedzi przez rekodowanie (wtedy

„zdecydowanie się zgadzam” miało by kod 5).

Budowa indeksu – wariant 1.

PRZEKSZTAŁCENIA -> OBLICZ WARTOSCI

w polu „zmienna wynikowa” podajemy nazwę naszej nowej zmiennej-indeksu, np. re34_ind

klikając na „typ i etykieta” możemy od razy nadać zmiennej etykietę, np. „Zaufanie do religii –

indeks”

w polu wyrażenie numeryczne wpisujemy, posługując się klawiaturą komputera lub klawiaturą w

oknie dialogowym i listą zmiennych po lewej stronie:

re34a + re34b + re34c + re34d

Syntax:

COMPUTE re34_ind=re34a + re34b + re34c + re34d.

VARIABLE LABELS re34_ind 'Zaufanie do religii - indeks'.

EXECUTE.

Po wywołaniu polecenia w bazie na samym końcu listy zmiennych pojawi się nowa zmienna – nasz indeks.

Ma on postać ilościową, nie wymaga definiowania wartości.


5

Po zmianie miejsc dziesiętnych na „0” i wyliczeniu częstości dla indeksu mamy tabelę:

Zaufanie do religii - indeks

Częstość Procent Procent

ważnych

Procent

skumulowany

Ważne

4 123 9,7 10,7 10,7

5 32 2,5 2,8 13,4

6 54 4,3 4,7 18,1

7 69 5,5 6,0 24,1

8 313 24,8 27,1 51,2

9 106 8,4 9,2 60,4

10 142 11,2 12,3 72,7

11 80 6,4 7,0 79,7

12 123 9,8 10,7 90,3

13 29 2,3 2,5 92,8

14 31 2,5 2,7 95,5

15 17 1,4 1,5 97,0

16 26 2,0 2,2 99,2

17 2 ,2 ,2 99,4

18 1 ,1 ,1 99,5

20 5 ,4 ,5 100,0

Ogółem 1154 91,4 100,0

Braki danych Systemowe braki danych 109 8,6

Ogółem 1263 100,0

Jak widać wartości indeksu mieszczą się między 4 a 20.

Wartość „4” uzyskali ci respondenci, którzy na każde z czterech pytań cząstkowych odpowiedzieli

„zdecydowanie się zgadzam” – ta odpowiedź miała kod 1, więc 1+1+1+1 dało wynik „4”.


„zdecydowanie się nie zgadzam” – ta odpowiedź miała kod 5, więc 5+5+5+5 dało wynik „20”.

Z analizy kierunku natężenia zmiennej wiemy, że im niższy wynik indeksu (czyli im bliżej wartości

minimalnej „4”), tym wyższe zaufanie do religii. A im wyższy wynik indeksu (czyli im bliżej do

wartości maksymalnej „20”), tym niższe zaufanie do religii.

Kłopot może sprawić analiza wartości pośrednich. Bo co oznacza np. wynik indeksu „13”? Można

sobie z tym poradzić tworząc na użytek interpretacji przedziały, np.

o 4 – 8 = duże zaufanie do religii

o 9 – 14 = umiarkowane zaufanie do religii

o 15 – 20 = małe zaufanie do religii.

Powyższe przedziały to tylko propozycja – tak naprawdę możliwości jest bardzo wiele i decyzja, jak

to zrobić zależy tylko i wyłącznie od analityka.


6

Budowa indeksu – wariant 2.

PRZEKSZTAŁCENIA -> OBLICZ WARTOSCI

w polu „zmienna wynikowa” podajemy nazwę naszej nowej zmiennej-indeksu, np. re34_ind_2

klikając na „typ i etykieta” możemy od razy nadać zmiennej etykietę, np. „Zaufanie do religii –

indeks”

w polu wyrażenie numeryczne wpisujemy, posługując się klawiaturą komputera lub klawiaturą w

oknie dialogowym i listą zmiennych po lewej stronie:

(re34a + re34b + re34c + re34d)/4

Syntax:

COMPUTE re34_ind_2=(re34a + re34b + re34c + re34d)/4.

VARIABLE LABELS re34_ind_2 'Zaufanie do religii - indeks'.

EXECUTE.

Po wywołaniu polecenia w bazie na samym końcu listy zmiennych pojawi się nowa zmienna – nasz indeks

w wersji 2. Ma on postać ilościową, nie wymaga definiowania wartości.

Po wyliczeniu częstości dla indeksu mamy tabelę:



ważnych

Procent

skumulowany

Ważne

1,00 123 9,7 10,7 10,7

1,25 32 2,5 2,8 13,4

1,50 54 4,3 4,7 18,1

1,75 69 5,5 6,0 24,1

2,00 313 24,8 27,1 51,2

2,25 106 8,4 9,2 60,4

2,50 142 11,2 12,3 72,7

2,75 80 6,4 7,0 79,7

3,00 123 9,8 10,7 90,3

3,25 29 2,3 2,5 92,8

3,50 31 2,5 2,7 95,5

3,75 17 1,4 1,5 97,0

4,00 26 2,0 2,2 99,2

4,25 2 ,2 ,2 99,4

4,50 1 ,1 ,1 99,5

5,00 5 ,4 ,5 100,0

Ogółem 1154 91,4 100,0


Ogółem 1263 100,0


7

Tym razem wartości indeksu mieszczą się między 1 a 5 – czyli tak, jak to było w kafeteriach pytań

cząstkowych.


„zdecydowanie się zgadzam” – ta odpowiedź miała kod 1, więc (1+1+1+1)/4 dało wynik „1”.


„zdecydowanie się nie zgadzam” – ta odpowiedź miała kod 5, więc (5+5+5+5)/4 dało wynik „5”.

Z analizy kierunku natężenia zmiennej wiemy, że im niższy wynik indeksu (czyli im bliżej wartości

minimalnej „1”), tym wyższe zaufanie do religii. A im wyższy wynik indeksu (czyli im bliżej do

wartości maksymalnej „5”), tym niższe zaufanie do religii.

Tym razem analiza wartości pośrednich jest trochę prostsza, bo możemy odnieść je do oryginalnej

kafeterii pytań cząstkowych, czyli np.:

o 1 (i okolice) = bardzo duże zaufanie do religii

o 2 (i okolice) = duże zaufanie do religii

o 3 (i okolice) = umiarkowane zaufanie do religii

o 4 (i okolice) = małe zaufanie do religii

o 5 (i okolice) = bardzo małe zaufanie do religii

Dla określenia czym są wskazane przed chwilą „okolice” można posłużyć się matematyczną zasadą

zaokrąglania liczb. Lub scedować to na SPSS – jeśli w zakładce „zmienne” bazy dla tej właśnie

zmiennej „dziesiętne” ustawimy na „0”, to program sam dokona zaokrągleń i w efekcie dostaniemy

coś takiego:



ważnych

Procent

skumulowany

Ważne

1 123 9,7 10,7 10,7

1 32 2,5 2,8 13,4

2 54 4,3 4,7 18,1

2 69 5,5 6,0 24,1

2 313 24,8 27,1 51,2

2 106 8,4 9,2 60,4

3 142 11,2 12,3 72,7

3 80 6,4 7,0 79,7

3 123 9,8 10,7 90,3

3 29 2,3 2,5 92,8

4 31 2,5 2,7 95,5

4 17 1,4 1,5 97,0

4 26 2,0 2,2 99,2

4 2 ,2 ,2 99,4

5 1 ,1 ,1 99,5


8

5 5 ,4 ,5 100,0

Ogółem 1154 91,4 100,0


Ogółem 1263 100,0

Oba przedstawione warianty tworzenia indeksu są sobie równorzędne. Decyzja o posługiwaniu się jednym z

nich należy zawsze do analityka.

Wynik indeksu jest liczbą, co oznacza, że jest to zmienna na poziomie ilościowym i można dla niej wyliczyć

wszystkie statystyki opisowe.

Indeks może być również z powodzeniem stosowany zarówno jako zmienna zależna (częściej), jak i

niezależna (rzadziej).

W naszym przykładzie potraktujemy indeks jako zmienną zależną i sprawdzimy, czy kobiety i mężczyźni

różnią się pod względem zaufania do religii (opinii o jej roli w życiu człowieka). Nie ma znaczenia, czy

wykorzystamy wariant 1 czy 2 indeksu – wynik zawsze będzie taki sam.

Test t-Studenta t(1152) = 2,649; p<0,05 wykazał, że płeć różnicuje zaufanie do religii. Kobiety (średnia 2,19)

częściej niż mężczyźni (średnia 2,30) deklarowały większe zaufanie do religii, wskazując, że jej praktykowanie

może pomóc w wybranych sytuacjach życiowych.


9

ANALIZA CZYNNIKOWA

Zbudowanie indeksu było bardzo proste: ot, trzeba tylko sprawdzić parę rzeczy, dodać do siebie kody

odpowiednich pytań, a potem zinterpretować uzyskane wartości.

Tyle, że przy okazji pominęliśmy kilka ważnych kwestii:

Czy wszystkie podpytania były ze sobą połączone merytorycznie i statystycznie?

Czy wszystkie podpytania mierzyły tak naprawdę to samo?

Czy wszystkie podpytania były jednakowo ważne dla wskaźnika?

Analiza czynnikowa pomaga rozwiać powyższe wątpliwości i w rezultacie dzięki niej można stworzyć o

wiele bardziej precyzyjny niż indeks wskaźnik: skalę.

Przykład:

Dane dla roku 2010

Chcemy utworzyć skalę stosunku do religii (opinii o religii)

Wybieramy z dostępnych danych następujące zmienne:

o re11b „Zbyt ufamy nauce, za mało religii”

o re11c „Religia-więcej konfliktów niż pokoju”

o re11d „Osoby religijne często zbyt nietolerancyjne”

o re19a „Bóg zajmuje się osobiście każdą istotą”

o re19c „Życie ma sens bo istnieje Bóg”

o re34a „Religia sprzyja odnalezieniu wewnętrznego spokoju i szczęścia”

o re34b „Religia sprzyja zawieraniu przyjaźni”

o re34c „Religia sprzyja uzyskaniu pocieszenia w kłopotach lub chwilach smutku”

o re34d „Religia sprzyja spotykaniu właściwych ludzi”

Przy wyborze zmiennych należy zwrócić uwagę na te same kwestie co, przy indeksie:

a) wybrane zmienne są ilościowe lub zero-jedynkowe (dychotomiczne, wskazujące na występowanie

lub brak występowania cechy, np. tak/nie);

b) w przypadku kafeterii likertowskich jest zachowana interwałowość (kafeteria jest nieparzysta,

symetryczna, z wyraźnym środkiem);

c) wszystkie pytania mają takie same kafeterie – chodzi przede wszystkim o liczbę itemów: jeśli jest

różna należy najpierw dokonać standaryzacji zmiennych;

d) porządek odpowiedzi uwzględnia jeden kierunek natężenia zmiennej.


10

Ad. a)

Wszystkie wybrane przez nas zmienne są mierzone na poziomie ilościowym.

Ad b)

We wszystkich wybranych pytaniach kafeterie są interwałowe, o ile odpowiedź „trudno powiedzieć”

przekoduje się jako brak danych:






Trudno powiedzieć (kod 8)

Ad c)

Wszystkie wybrane pytania mają takie same kafeterie pod względem uporządkowania (wszystkie są

likertowskie) i liczby itemów (wszystkie mają po 5 itemów).

Gdyby było inaczej (np. kilka kafeterii byłoby 5-elementowych a kilka 7-elementowych) to zamiast

redukować większą kafeterię do mniejszej liczby itemów, lepiej dokonać standaryzacji wszytskich branych

pod uwagę zmiennych (czyli przełożenia kodów na wartości z rozkładu normalnego):

ANALIZA -> OPIS STATYSTYCZNY -> STATYSTYKI OPISOWE -> ZAPISZ STANDARYZOWANE

WARTOŚCI JAKO ZMIENNE

Syntax (np. dla zmiennej re19a)

DESCRIPTIVES VARIABLES=re19a

/SAVE

/STATISTICS=MEAN STDDEV MIN MAX.

Po wywołaniu polecenia policzą się statystyki opisowe, ale ważniejsze jest, że na końcu naszej listy

zmiennych w bazie pojawi się nowa zmienna „Zre19a” (nazwa nadana przez SPSS – zawsze przy

standaryzacji jest tak samo: do oryginalnej nazwy zmiennej program dodaje na początku dużą literę „Z”).

Wartości nowej zmiennej odniesione są do rozkładu tej zmiennej: im bliżej 0 tym bliżej średniej, a wartości

mniejsze/większe od zera wskazują na oddalanie się od średniej o wartość odchylenia standardowego

(wartości z minusem do te mniejsze od średniej; wartości z plusem to te większe od średniej).


11

Ad d)

Sprawdzamy, czy kolejność odpowiedzi będzie w każdym pytaniu wskazywała ten sam kierunek natężenia

zmiennej:

re11b „Zbyt ufamy nauce, za mało religii”:


re11c „Religia-więcej konfliktów niż pokoju”:

o im wyższy kod odpowiedzi, tym większe zaufanie do religii;

re11d „Osoby religijne często zbyt nietolerancyjne”:

o im wyższy kod odpowiedzi, tym większe zaufanie do religii;

re19a „Bóg zajmuje się osobiście każdą istotą”:


re19c „Życie ma sens bo istnieje Bóg”:


re34a „Religia sprzyja odnalezieniu wewnętrznego spokoju i szczęścia”:


re34b „Religia sprzyja zawieraniu przyjaźni”:


re34c „Religia sprzyja uzyskaniu pocieszenia w kłopotach lub chwilach smutku”:


re34d „Religia sprzyja spotykaniu właściwych ludzi”:


W naszym przypadku dwa pytania na 9 wybranych mają inny porządek odpowiedzi: tam wskazywanie

odpowiedzi wysokokodowanych będzie wskazywało na większe zaufanie do religii. Ponieważ te

„odmienne” pytania są w mniejszości, to przekodujemy je wg wzoru:

Stary porządek kafeterii Nowy porządek kafeterii











UWAGA: rekodujemy korzystając z opcji „rekoduj na inne zmienne” (by nie tracić oryginałów) i

pamiętamy, by przy definiowaniu wartości źródłowych i wynikowych rekodowania zaznaczyć opcję

„systemowy lub zdefiniowany brak danych -> systemowy brak danych”.


12

Po zrekodowaniu zmiennych re11c i re11d nasza lista wybranych zmiennych przedstawia się następująco:

re11b „Zbyt ufamy nauce, za mało religii”:


re11c_rek „Religia-więcej konfliktów niż pokoju - rekodowane”:


re11d_rek „Osoby religijne często zbyt nietolerancyjne - rekodowane”:


re19a „Bóg zajmuje się osobiście każdą istotą”:


re19c „Życie ma sens bo istnieje Bóg”:


re34a „Religia sprzyja odnalezieniu wewnętrznego spokoju i szczęścia”:


re34b „Religia sprzyja zawieraniu przyjaźni”:


re34c „Religia sprzyja uzyskaniu pocieszenia w kłopotach lub chwilach smutku”:


re34d „Religia sprzyja spotykaniu właściwych ludzi”:


Możemy teraz przystąpić do wykonywania analizy czynnikowej.

Analiza pokaże nam:

czy wszystkie wybrane przez nas zmiennej są powiązane nie tylko merytorycznie, ale i statystycznie;

jak bardzo dla tworzonej przez nas skali jest istotna każda ze zmiennych;

czy w ramach wybranego zestawu zmiennych są czynniki – czyli podskale powiązanych ze sobą

statystycznie zmiennych

ANALIZA -> REDUKCJA WYMIARÓW -> ANALIZA CZYNNIKOWA

do okienka po prawej stronie przerzucamy wszystkie interesujące nas zmienne;

pole pod spodem „Zmienna filtrująca” to nie zmienna niezależna! Tutaj nie ma takowej! To

możliwość ograniczenia analizy tylko do osób, które na pewne pytanie udzieliły konkretnej

wypowiedzi (np. tylko kobiety albo tylko „bardzo religijni” itp.) – to zwykły filtr!

Analiza czynnikowa wymaga zdefiniowania szeregu dodatkowych opcji – są one „ukryte” po przyciskami

po prawej stronie okna dialogowego.


13

1. WYODRĘBNIANIE

a) Metoda:

Głównych składowych (domyślna)

o Tylko ona pozwala uzyskać takie czynniki, które będą wyjaśniały maksymalny procent

wariancji wyjściowych zmiennych.

b) Analiza:

Macierz korelacji – gdy analizujemy dane surowe, niestandaryzowane;

Macierz kowariancji – gdy analizujemy dane po standaryzacji.

Ponieważ nie robiliśmy standaryzacji, to zostawiamy zaznaczoną domyślnie „macierz korelacji”.

c) Pokaż

Nierotowane rozwiązania czynnikowe – zostawiamy domyślnie zaznaczone.

Wykres osypiska (metoda Catella) – gdybyśmy chcieli o liczbie czynników (czyli tych potencjalnych

podskal decydować na podstawie metody wykresu osypiska – my tutaj nie chcemy, a

zainteresowanych odsyłam do literatury)

d) Wyodrębnianie

Na podstawie wartości własnej większej niż… (metoda Kaisera) - zostawiamy domyślnie wpisaną

liczbę „1”

o Liczbę czynników wyliczy nam SPSS;

o Wartość własna określa procent wyjaśnianych przez dany czynnik wariancji;

o Jeśli czynnik nie wyjaśnia więcej wariancji niż pojedyncza zmienna to nie ma sensu –

oznacza, że „nie wchodzi w reakcję” z innymi zmiennymi i sam tworzy podskalę, co

oznacza, że można go analizować osobno, bez bawienia się analizą czynnikową.

Ustalona liczba czynników

o Opcja alternatywna do poprzedniej, gdy sami decydujemy ile czynników ma ustalić SPSS;

o Do wykorzystania, gdy:

Analizowaliśmy wykres osypiska i wiemy ile chcemy czynników;

Analizowaliśmy już raz przeprowadzoną analizę czynnikową, gdzie SPSS pokazał

nam, że można na podstawie własności własnej większej niż 1 wyodrębnić np. 4

czynniki, a my chcemy zmusić go by pokazał nam rozwiązanie z np. 3 czynnikami.

e) Maksimum iteracji dla uzyskania zbieżności zostawiamy domyślnie ustawiona na 25.


14

2. ROTACJA

Rotacja rozwiązań czynnikowych pozwala zwiększyć dopasowanie modelu i porządkuje prezentację

wyników (co ułatwia ich późniejszą interpretację)

a) Metoda - najpopularniejsze:

Varimax

o Rotacja ortogonalna;

o Zakłada brak korelacji pomiędzy czynnikami (podskale nie są ze sobą powiązane);

o Przydaje się, gdy przygotowujemy predyktory do analizy regresji (tam jest zalecenie, by

predyktory nie korelowały ze sobą);

o Trzeba zdawać sobie sprawę, że będzie to trochę sztuczne rozwiązanie – rzeczywistość

społeczna jest zbyt skomplikowana, by móc oczekiwać całkowitego braku pomiędzy

występującymi w niej zjawiskami.

Prosta Oblimin

o Rotacja nieortogonalna (ukośna);

o Zakłada, że istnieje korelacja pomiędzy czynnikami;

o Pokazuje czy i jak silna jest to zależność (może się zdarzyć, że wskaże brak zależności, a

wtedy dobrze policzyć analizę czynnikową jeszcze raz, wybierając rotację Varimax);

o Wybierając ją zostawiamy domyślnie wpisane wartości Delta i Kappa.

b) Reszta opcji – pozostawiona domyślnie.

UWAGA: Policzymy analizę czynnikową dwukrotnie:

najpierw z rotacją Varimax, a potem z rotacją Oblimin.

3. OPCJE

a) Brak danych

Zostawiamy domyślnie zaznaczone „wyłączanie wszystkich obserwacji z brakami”;

Oznacza to, że jeśli ktoś na którekolwiek z branych przez nas pod uwagę pytań udzielił odpowiedzi

równoznacznej z brakiem danych (np. trudno powiedzieć), to jego odpowiedzi nie będą

uwzględniane przy wyliczeniach analizy czynnikowej.

b) Format wyświetlania współczynników

Sortuj według wartości ładunków czynnikowych


15

o Zaznaczamy;

o To jest opcja, która porządkuje tabelę wyników i ułatwia interpretację.

Ukryj małe współczynniki

o Zaznaczamy;

o W pole „wartość bezwzględna poniżej” wpisujemy „0,4”;

o Przyjmuje się, że jest to minimalna wartość z jaką czynnik ładuje zmienną – czyli liczba

pokazująca jak mocno dana zmienna przynależy do danego czynnika.

4. STATYSTYKI

a) Statystyki

Statystyki opisowe – zaznaczamy, mogą się przydać przy interpretacji;

Rozwiązania wstępne – zostawiamy zaznaczone domyślnie

b) Macierz korelacji – z dostępnych opcji zaznaczamy:

K-M-O i test sferyczności Bartletta

o K-M-O to miara adekwatności doboru próby

o To stosunek korelacji zmiennych do ich korelacji częściowej, czyli wielkość unikalnego

związku;

o Najlepiej, gdy ma wartość bliską 1;

o Za minimum przyjmuje się 0,5 – jeśli jest poniżej, to analiza czynnikowa nie jest wiarygodna

(zmienne są słabo ze sobą pokorelowane);

5. OCENY

W tym momencie nie zaznaczamy tu żadnej z opcji.

a) Zapisz jako zmienne

Metoda: Anderson-Rubin

Każdy wyodrębniony czynnik zostanie zapisany jako nowa zmienna

Wartości będą wystandaryzowane do rozkładu normalnego

Należy je interpretować w kategoriach odległości od średniej:

o Ujemne – niski wynik na skali (poniżej średniej)

o Okolice zera – wynik przeciętny (średni)

o Dodatnie – wysoki wynik na skali (powyżej średniej)

Tak utworzone zmienne mogą być traktowane jako niezależne lub zależne w innych obliczeniach;


16

Syntax:

FACTOR

/VARIABLES re11b re11c_rek re11d_rek re19a re19c re34a re34b re34c re34d

/MISSING LISTWISE

/ANALYSIS re11b re11c_rek re11d_rek re19a re19c re34a re34b re34c re34d

/PRINT UNIVARIATE INITIAL KMO EXTRACTION ROTATION

/FORMAT SORT BLANK(0.4)

/CRITERIA MINEIGEN(1) ITERATE(25)

/EXTRACTION PC

/CRITERIA ITERATE(25)

/ROTATION VARIMAX

/METHOD=CORRELATION.

Gdzie w linii kodu:

/VARIABLES – lista nazw zmiennych

/MISSING LISTWISE - wyłączanie wszystkich obserwacji z brakami

/ANALYSIS - lista zmiennych przy liczeniu statystyk opisowych

/PRINT UNIVARIATE INITIAL KMO EXTRACTION ROTATION - pokazuje rozwiązania początkowe

(nierotowane) oraz miarę K-M-O

/FORMAT SORT BLANK(0.4) - zdefiniowana wartość minimalna ładunku czynnikowego pokazywanego

w tabeli i sortowanie wg wartości ładunków czynnikowych

/CRITERIA MINEIGEN(1) ITERATE(25) - kryterium Kaisera z własnością własną min. 1

/EXTRACTION PC – nazwa metody: głównych składowych

/CRITERIA ITERATE(25) - metoda oparta na korelacji

/ROTATION VARIMAX – wybrana rotacja: Varimax (jeśli wybralibyśmy Oblimin to byłyby dwie linie:

/CRITERIA ITERATE(25) DELTA(0)

/ROTATION OBLIMIN

/METHOD=CORRELATION. – metoda oparta na macierzy korelacji (jeśli wybralibyśmy macierz

kowariancji, to linia wyglądałaby:

/METHOD=COVARIANCE

Jeśli chcielibyśmy zapisać czynniki jako zmienne to w przedostatniej linii trzeba by było dopisać nową

linijkę kodu:

/SAVE AR(ALL)


17

Po wywołaniu polecenia (analiza czynnikowa z rotacją Varimax) otrzymujemy następujące tabele:

a)

Statystyki opisowe

Średnia Odchylenie

standardowe

Analizowane

obserwacje N

Zbyt ufamy nauce, za mało religii 3,55 1,000 973

Religia-więcej konfliktów niż pokoju 3,26 1,052 973

Osoby religijne często zbyt nietolerancyjne 3,58 1,060 973

Bóg zajmuje się osobiście każdą istotą 2,37 1,130 973

Życie ma sens bo istnieje Bóg 3,00 1,133 973

odnalezieniu wewnętrznego spokoju i szczęścia 1,99 ,796 973

zawieraniu przyjaźni 2,51 ,971 973

uzyskaniu pocieszenia w kłopotach lub chwilach smutku 1,96 ,803 973

spotykaniu właściwych ludzi 2,56 ,995 973

Tabela informuje nas:

O średniej wartości odpowiedzi (a pamiętamy, że im niższa wartość tym większe zaufanie do religii)

O odchyleniu standardowym (im wyższe, tym większe rozbieżności w odpowiedziach badanych)

Analizowanych obserwacjach (wiemy dla ilu osób została policzona analiza czynnikowa)

b)

Testy Kaisera-Mayera-Olkina i Bartletta

Miara KMO adekwatności doboru próby ,768

Test sferyczności Bartletta

Przybliżone chi-kwadrat 3352,786

df 36

Istotność ,000

Wartość miary K-M-O to 0,768:

Jest powyżej 0,5 – czyli nasza analiza czynnikowa jest wiarygodna

Do wartości 1 trochę brakuje, ale to nic nie szkodzi.

Test sferyczności Bartletta

Jest istotny: p<0,05

Co oznacza, że macierz korelacji zawiera istotne współczynniki korelacji – innymi słowy: brane

przez nas pod uwagę zmienne są ze sobą powiązane (a to bardzo dobrze)

Jeśli obie miary (K-M-O i test Bartletta) dadzą niesatysfakcjonujące wyniki, to należy przemyśleć

rekonstrukcję zestawu zmiennych – może jest tam zmienna, która „psuje”, bo jest nieskorelowana z

pozostałymi?


18

c)

Zasoby zmienności wspólnej

Początkowe Po

wyodrębnieniu

Zbyt ufamy nauce, za mało religii 1,000 ,615

Religia-więcej konfliktów niż pokoju 1,000 ,768

Osoby religijne często zbyt nietolerancyjne 1,000 ,727

Bóg zajmuje się osobiście każdą istotą 1,000 ,567

Życie ma sens bo istnieje Bóg 1,000 ,678

odnalezieniu wewnętrznego spokoju i szczęścia 1,000 ,714

zawieraniu przyjaźni 1,000 ,671

uzyskaniu pocieszenia w kłopotach lub chwilach smutku 1,000 ,724

spotykaniu właściwych ludzi 1,000 ,708

Metoda wyodrębniania czynników – głównych składowych.

Określa ile procent wariancji zmiennej wyjściowej udało się odtworzyć w nowo powstałych

czynnikach;

Im więcej, tym lepiej – oznacza to, że zmienna dobrze wpisuje się w tworzone czynniki.

d)

Całkowita wyjaśniona wariancja

Składowa Początkowe wartości własne Sumy kwadratów ładunków

po wyodrębnieniu

Sumy kwadratów ładunków po rotacji

Ogółem %

wariancji

% skum. Ogółem %

wariancji

% skum. Ogółem % wariancji % skumulowany

1 3,736 41,514 41,514 3,736 41,514 41,514 2,788 30,983 30,983

2 1,353 15,033 56,547 1,353 15,033 56,547 1,802 20,020 51,002

3 1,083 12,028 68,576 1,083 12,028 68,576 1,582 17,573 68,576

4 ,778 8,639 77,215

5 ,685 7,609 84,824

6 ,485 5,386 90,210

7 ,402 4,462 94,671

8 ,286 3,183 97,854

9 ,193 2,146 100,000



Ile wyodrębniono czynników o wartości własnej większej niż 1 – na podstawie ostatniej części tabeli

(sumy kwadratów ładunków po rotacji) widać, że są to trzy czynniki (tu nazwane składowymi za

względu na to, że metodą wyodrębniania była metoda głównych składowych);

Ile procent wariancji wyjaśniają w sumie te trzy czynniki: u nas to 68,576% wariancji. To ponad 2/3

wszystkich analizowanych przez nas przypadków, a więc całkiem sporo.


19

e)

Macierz składowycha

Składowa

1 2 3

spotykaniu właściwych ludzi ,811

zawieraniu przyjaźni ,774

odnalezieniu wewnętrznego spokoju i szczęścia ,749

uzyskaniu pocieszenia w kłopotach lub chwilach smutku ,719

Bóg zajmuje się osobiście każdą istotą ,680

Życie ma sens bo istnieje Bóg ,653 ,482

Osoby religijne często zbyt nietolerancyjne ,744

Religia-więcej konfliktów niż pokoju ,412 ,696

Zbyt ufamy nauce, za mało religii ,435 ,653

Metoda wyodrębniania czynników - Głównych składowych.

a. 3 – liczba wyodrębnionych składowych.

Nierotowana macierz składowych (wyodrębnionych czynników) – pomijamy.

f)

Macierz rotowanych składowycha

Składowa

1 2 3





Zbyt ufamy nauce, za mało religii ,779

Życie ma sens bo istnieje Bóg ,763


Religia-więcej konfliktów niż pokoju ,862



Metoda rotacji - Varimax z normalizacją Kaisera.

a. Rotacja osiągnęła zbieżność w 4 iteracjach.

Macierz po rotacji, uszeregowaniu czynników i ukryciu niskich wartości ładunków czynnikowych.

Mamy trzy wyodrębnione czynniki:

o Czynnik nr 1 to podpytania dotyczące tego, w czym może pomóc religia;

o Czynnik nr 2 to podpytania dotyczące wielkości Boga (opinii nt. Boga);

o Czynnik nr 3 to podpytania dotyczące religii jako pewnego zjawiska społecznego.

Każdy z czynników to osobna podskala.

Zgodnie z założeniem rotacji Varimax te podskale uznajemy za nieskorelowane ze sobą.


20

Teraz wykonamy analizę czynnikową z rotacją Oblimin – czyli przy założeniu korelacji pomiędzy

czynnikami.

a)

Statystyki opisowe – interpretacja jak poprzednio.

b)

Miara K-M-O i test sferyczności Bartletta – interpretacja jak poprzednio.

c)

Zasoby zmienności wspólnej – interpretacja jak poprzednio.

d)

Całkowita wyjaśniona wariancja

Składowa Początkowe wartości własne Sumy kwadratów ładunków po wyodrębnieniu Sumy

kwadratów

ładunków po

rotacjia

Ogółem % wariancji % skumulowany Ogółem % wariancji % skumulowany Ogółem

1 3,736 41,514 41,514 3,736 41,514 41,514 3,292

2 1,353 15,033 56,547 1,353 15,033 56,547 1,897

3 1,083 12,028 68,576 1,083 12,028 68,576 2,308

4 ,778 8,639 77,215

5 ,685 7,609 84,824

6 ,485 5,386 90,210

7 ,402 4,462 94,671

8 ,286 3,183 97,854

9 ,193 2,146 100,000


a. Dodawanie sum kwadratów ładunków w celu otrzymania ogólnej wariancji nie jest możliwe, gdy składowe są skorelowane.


O liczbie wyodrębnionych czynników: 3.

O procencie wariancji wyjaśniającym w sumie te trzy czynniki: 68,576%.

Tak więc podobnie jak w przypadku rotacji Varimax mamy wyodrębnione trzy czynniki i taki sam procent

wyjaśnionych wariancji.


21

e)

Macierz składowycha

Składowa

1 2 3






Życie ma sens bo istnieje Bóg ,653 ,482


Religia-więcej konfliktów niż pokoju ,412 ,696

Zbyt ufamy nauce, za mało religii ,435 ,653


a. 3 – liczba wyodrębnionych składowych.

Nierotowana macierz składowych (wyodrębnionych czynników) – pomijamy.

f)

Macierz modelowaa

Składowa

1 2 3





Religia-więcej konfliktów niż pokoju ,876


Zbyt ufamy nauce, za mało religii ,823

Życie ma sens bo istnieje Bóg ,745



Metoda rotacji - Oblimin z normalizacją Kaisera.

a. Rotacja osiągnęła zbieżność w 5 iteracjach.

Macierz po rotacji, uszeregowaniu czynników i ukryciu niskich wartości ładunków czynnikowych.

Mamy trzy wyodrębnione czynniki:

o Czynnik nr 1 to podpytania dotyczące tego, w czym może pomóc religia;

o Czynnik nr 2 to podpytania dotyczące religii jako pewnego zjawiska społecznego;

o Czynnik nr 3 to podpytania dotyczące wielkości Boga (opinii nt. Boga).

Każdy z czynników to osobna podskala.

Zgodnie z założeniem rotacji Oblimin te podskale uznajemy za skorelowane ze sobą.


22

g)

Macierz korelacji składowych

Składowa 1 2 3

1 1,000 ,261 ,380

2 ,261 1,000 ,210

3 ,380 ,210 1,000


Metoda rotacji - Oblimin z normalizacją Kaisera.

Pokazuje korelacje pomiędzy poszczególnymi czynnikami:

o Czynnik 1 i 2 – korelacja 0,261 czyli słaba;

o Czynnik 1 i 3 – korelacja 0,38 czyli umiarkowana;

o Czynnik 2 i 3 – korelacja 0,21 czyli słaba.

Nie są to korelacje zbyt wysokie, ale mimo wszystko pokazują, że czynniki są współzależne.

Na podstawie przeprowadzonej analizy czynnikowej (niezależnie od metody rotacji) wiemy, że następująca

lista zmiennych:

re11b „Zbyt ufamy nauce, za mało religii”

re11c_rek „Religia-więcej konfliktów niż pokoju”

re11d_rek „Osoby religijne często zbyt nietolerancyjne”

re19a „Bóg zajmuje się osobiście każdą istotą”

re19c „Życie ma sens bo istnieje Bóg”

re34a „Religia sprzyja odnalezieniu wewnętrznego spokoju i szczęścia”

re34b „Religia sprzyja zawieraniu przyjaźni”

re34c „Religia sprzyja uzyskaniu pocieszenia w kłopotach lub chwilach smutku”

re34d „Religia sprzyja spotykaniu właściwych ludzi”

nie tworzy jednej spójnej skali (jednego spójnego wskaźnika).

Mamy tak naprawdę trzy skale, które za każdym razem mierzą trochę inne rzeczy:

zaufania do religii (re34a, re34b, re34c, re34d)

o im wyższy wynik na skali tym mniejsze zaufanie

stosunku do Boga (re11b, re19a, re19c)

o im wyższy wynik na skali tym silniejsza negacja Boga

opinii o religii jako zjawisku społecznym (re11c_rek, re11d_rek)

o im wyższy wynik na skali tym silniejsza opinia negatywna nt. religii jako zjawiska

społecznego


23

Zanim jednak utworzymy te skale (na razie wiemy, że można je wyróżnić, ale jako osobne zmienne jeszcze

nie istnieją), warto sprawdzić ich rzetelność – czyli jak bardzo są spójne i czy usunięcie któregokolwiek

itemu nie poprawiłoby jakości skali.

ANALIZA -> SKALOWANIE -> ANALIZA RZETELNOŚCI

1. Przykład: dla skali zaufania do religii (re34a, re34b, re34c, re34d)

interesujące nas zmienne przerzucamy do okienka po prawej

w „statystyki” zaznaczamy:

o pozycja testowa

o skala przy wykluczeniu pozycji

Syntax:

RELIABILITY

/VARIABLES=re34a re34b re34c re34d

/SCALE('ALL VARIABLES') ALL

/MODEL=ALPHA

/STATISTICS=DESCRIPTIVE

/SUMMARY=TOTAL.

Po wywołaniu polecenia otrzymujemy kilka tabel , z których interpretujemy tylko dwie:

a)

Statystyki rzetelności

Alfa Cronbacha Liczba pozycji

,851 4

wartość Alfa Cronbacha jest miarą rzetelności skali:

o minimum powinno być 0,5 – poniżej skala jest kiepska

o najlepiej by było w okolicach 0,7

o ale im bliżej 1 tym lepiej


24

b)

Statystyki pozycji Ogółem

Średnia skali po

usunięciu

pozycji

Wariancja skali

po usunięciu

pozycji

Korelacja

pozycji Ogółem

Alfa Cronbacha

po usunięciu

pozycji

odnalezieniu wewnętrznego spokoju i szczęścia 6,99 5,748 ,662 ,824

zawieraniu przyjaźni 6,46 4,818 ,721 ,798

uzyskaniu pocieszenia w kłopotach lub chwilach smutku 7,01 5,705 ,663 ,823

spotykaniu właściwych ludzi 6,43 4,712 ,737 ,791

interesuje nas tylko wynik z ostatniej kolumny;

pokazuje on, jaką wartość przyjęłaby miara Alfa Cronbacha, gdyby ze skali usunięto daną zmienną;

patrzymy, czy w którymkolwiek przypadku Alfa byłaby większa – gdyby tak było, to warto ze skali

usunąć „psującą” ją zmienną;

w naszym przypadku usunięcie którejkolwiek ze zmiennych nie zwiększy wartości Alfa – skala jest

więc dobra w takiej postaci, w jakiej jest.

2. A teraz przyjmijmy, że nie mamy wiedzy, którą dostarczyła nam analiza czynnikowa.

Wybraliśmy zestaw 9 zmiennych, które wg nas mogą tworzyć skalę:

re11b „Zbyt ufamy nauce, za mało religii”

re11c_rek „Religia-więcej konfliktów niż pokoju”

re11d_rek „Osoby religijne często zbyt nietolerancyjne”

re19a „Bóg zajmuje się osobiście każdą istotą”

re19c „Życie ma sens bo istnieje Bóg”





Wykonujemy analizę rzetelności, żeby zobaczyć, jak dobra jest to skala.

Syntax:

RELIABILITY

/VARIABLES=re11b re11c_rek re11d_rek re19a re19c re34a re34b re34c re34d

/SCALE('ALL VARIABLES') ALL

/MODEL=ALPHA

/STATISTICS=DESCRIPTIVE

/SUMMARY=TOTAL.


25

Po wywołaniu polecenia zaglądamy do tabeli z Alfą Cronbacha:

Statystyki rzetelności

Alfa Cronbacha Liczba pozycji

,804 9

Nie jest źle: Alfa ma wartość 0,804, czyli jest zdecydowanie powyżej zakładanego progu minimum (0,5).

Zobaczmy, czy taką skalę da się poprawić:

Statystyki pozycji Ogółem

Średnia skali po

usunięciu

pozycji

Wariancja skali

po usunięciu

pozycji

Korelacja

pozycji Ogółem

Alfa Cronbacha

po usunięciu

pozycji

Zbyt ufamy nauce, za mało religii 21,23 27,120 ,333 ,806

Religia-więcej konfliktów niż pokoju 21,52 26,686 ,349 ,805

Osoby religijne często zbyt nietolerancyjne 21,20 26,668 ,346 ,805

Bóg zajmuje się osobiście każdą istotą 22,41 23,949 ,575 ,774

Życie ma sens bo istnieje Bóg 21,78 24,148 ,552 ,778

odnalezieniu wewnętrznego spokoju i szczęścia 22,79 26,197 ,583 ,778

zawieraniu przyjaźni 22,27 24,733 ,612 ,770

uzyskaniu pocieszenia w kłopotach lub chwilach smutku 22,81 26,475 ,540 ,782

spotykaniu właściwych ludzi 22,22 24,112 ,664 ,763

wyrzucenie pierwszych trzech zmiennych mogłoby nam lekko podnieść wartość Alfa: o 0,001-0,002

czyli naprawdę niewiele – to zmiana w zasadzie nieistotna;

wyrzucenie którejkolwiek z pozostałych zmiennych wartość Alfa zmniejszy – czyli skala będzie

słabsza.

UWAGA:

analiza rzetelności nie pokazała nam wyraźnie, że zestaw 9 wybranych zmiennych rozpada się na

podskale;

gdybyśmy kierowali się tylko i wyłącznie jej wynikiem, to zbudowaliśmy wskaźnik z wszystkich 9

zmiennych;

biorąc więc pod uwagę taki scenariusz warto jednak najpierw wykonywać analizę czynnikową, która

sięga „głębiej” w dane i jest w stanie ujawnić ukryte w nich struktury;

analiza rzetelności może więc:

o albo pomóc w dopracowaniu wyników analizy czynnikowej;

o albo zasugerować jedynie, że wśród wybranych zmiennych mamy podskale – z całkowitą

pewnością jednak ich nie ujawni – to zrobi dopiero analiza czynnikowa.


26

Wróćmy do wyodrębnionej skali zaufania do religii. Przypomnijmy, że składa się ona z czterech zmiennych:





I w bazie te zmienne wciąż widnieją osobno.

Jak zamienić je na jeden wskaźnik-skalę?

Sposób 1

Na podstawie zmiennych, które wchodzą w skład wyodrębnionej skali budujemy wskaźnik

sumaryczny, którego wartość będzie wartością uzyskaną przez respondenta na skali;

Innymi słowy: dokonujemy tej samej operacji co przy indeksie: dodajemy do siebie wybrane pytania,

które tworzą skalę;

Wynik uzyskany przez respondenta interpretujemy tak samo, jak to robiliśmy w przypadku indeksu:

zgodnie z natężeniem wartości zmiennych w kafeteriach;

Uzyskany wskaźnik możemy wykorzystywać jako zmienną niezależna lub zależną;

Co w takim razie jest inaczej niż wtedy, gdy robiliśmy indeks?

o Tym razem mamy mocne podstawy, by sądzić, że zmienne wchodzące w skład wskaźnika-

skali są ze sobą powiązane merytorycznie i statystycznie.

o W przypadku, gdy od razu budowaliśmy indeks (dodawaliśmy do siebie pytania) my tylko

zakładaliśmy, że tak jest – dowodów jednak nie było. Dostarczyła ich dopiero analiza

czynnikowa.

Wadą tego sposobu budowy wskaźnika-skali jest to, że:

o wszystkie pytania traktujemy jako jednakowo ważne dla skali – a to nieprawda. Analiza

czynnikowa pokazywała nam, że czynniki w różny sposób ładują konkretne zmienne.

Zaletą tego sposobu jest prostota: i wykonania, i interpretacji wyniku.

Sposób 2

Wykonujemy jeszcze raz analizę czynnikową z rotacją Oblimin (bo wiemy już, że czynniki są ze

sobą skorelowane)

Tym razem w OCENY zaznaczamy

o Zapisz jako zmienne

o Metoda: Anderson-Rubin


27

Analiza czynnikowa wykonała się ponownie, a to co jest nowego znajdziemy w bazie – na końcu

pojawiły się trzy nowe zmienne:

o FAC1_1 „A-R factor score 1 for analysis 1”



Za tymi nazwami ukrywają się wyniki respondentów dla poszczególnych podskal:

o FAC1_1 - zaufania do religii

o FAC2_1 - opinii o religii jako zjawisku społecznym

o FAC3_1 – stosunku do Boga

Można w bazie zmienić ich nazwy na te przyjaźniejsze do operowania nimi;

Jeśli zajrzymy do zakładki „dane” to zobaczymy, że wartości nowych zmiennych są trochę inne – to

dlatego, że są zestandaryzowane do rozkładu normalnego.

I tak, jeśli respondent uzyskał:

o FAC1_1 - zaufania do religii: -0,40498 -> to jego wynik jest poniżej średniej (znak „-”) o

około pół odchylenia standardowego (0,5), co oznacza, że uzyskał raczej niski wynik na skali

i jest osobą ufającą religii;

o FAC2_1 - opinii o religii jako zjawisku społecznym: -1,76189 -> to jego wynik jest

poniżej średniej (znak „-”) o prawie 2 odchylenia standardowe (1,7), co oznacza, że uzyskał

bardzo niski wynik na skali i jest osobą bardzo mocno aprobującą Boga;

o FAC3_1 – stosunku do Boga: 0,34743 -> to jego wynik jest powyżej średniej (znak „+”)

i około 1/3 odchylenia standardowego (0,3), co oznacza, że uzyskał raczej wysoki wynik na

skali i nie ma raczej dobrego zdania o religii jako zjawisku społecznych.

Podobnie możemy interpretować wyniki skal nie tylko dla pojedynczych respondentów, ale i dla

całych grup;

Nowo uzyskane zmienne mogą służyć w dalszych analizach jako zmienne niezależne lub zależne.

o Gdybyśmy zrobili analizę czynnikową z rotacją Varimax i jednoczesnym zapisaniem

wyników jako nowych zmiennych, to mielibyśmy gotowe predyktory do analizy regresji.

Wadą takiego sposobu budowy wskaźnika-skali jest kłopot z interpretacją jego wartości – jest to

trochę mało intuicyjne i trzeba pamiętać, że odnosimy się do rozkładu normalnego;

Zaletą jest z kolei o wiele bardziej precyzyjny wynik niż w przypadku budowy na zasadzie

indeksowej.

ANALIZY WIELOZMIENNOWE - dr Agnieszka Figiel | analityk ... · Zmienna wielowymiarowa Wskaźnik...

Documents

Transcript of ANALIZY WIELOZMIENNOWE - dr Agnieszka Figiel | analityk ... · Zmienna wielowymiarowa Wskaźnik...