Analiza czynnikowa - dr Agnieszka Figiel | analityk, badacz, · PDF file ·...
Transcript of Analiza czynnikowa - dr Agnieszka Figiel | analityk, badacz, · PDF file ·...
Analiza czynnikowa
• Kolejna z analiz wielozmiennowych • Jej celem jest eksploracja danych, poszukiwanie pewnych struktur, które mogą utworzyć wskaźniki
Budowa wskaźnika
• Indeks był banalny • I miał wady:
o Czy wszystkie podpytania były ze sobą połączone merytorycznie i statystycznie? o Czy wszystkie podpytania mierzyły tak naprawdę to samo? o Czy wszystkie podpytania były jednakowo ważne dla wskaźnika?
• Analiza czynnikowa jest bardziej skomplikowana, ale eliminuje ww. problemy Jest kilka metod określania liczby czynników; najpopularniejsze:
• Metoda Kaisera o przyjmuje istnienie tylu czynników, ile czynników ma wartość własną większą niż 1 o wartość własna określa procent wyjaśnianych przez dany czynnik wariancji o jeśli czynnik nie wyjaśnia więcej wariancji niż pojedyncza zmienna to nie ma sensu
• metoda Catella o z wykresem osypiska o wyszukuje się punkt reprezentujący czynnik, za którym kończy się stromizna o zlicza się czynniki powyżej tego punktu – tyle ich właśnie trzeba wyodrębnić
• !!! korzystamy tu także z metody głównych składowych o Tylko ona pozwala uzyskać takie czynniki, które będą wyjaśniały maksymalny procent
wariancji wyjściowych zmiennych Jest kilka metod obliczania ładunków czynnikowych
• metoda osi głównych o rekomendowana o stara się zmaksymalizować powiązania pomiędzy czynnikami a stwierdzeniami skali o nie wymaga rozkładu normalnego
• metoda największej wiarygodności o wymaga rozkładu normalnego o podaje poziom istotności różnicy między strukturą idealną (modelową) w strukturą uzyskaną
w badaniu Rotacja by zwiększyć dopasowanie
• rotacje ortogonalne o najpopularniejsza: Varimax o zakładamy brak korelacji między czynnikami o przydaje się, gdy przygotowujemy predyktory dla regresji
• rotacje nieortogonalne (ukośne) o najpopularniejsza: Oblimin o zakładamy pewien stopień skorelowania czynników o pokaże nam też, jeśli tej korelacji nie będzie
Analizę możemy prowadzić na
• danych surowych -> macierz korelacji • danych zestandaryzowanych -> macierz kowariancji
[standaryzacja: Analiza -> opis statystyczny -> statystyki opisowe -> zapisz standaryzowane wartości jako zmienne ]
Przy wyborze zmiennych trzeba uważać na: • związki merytoryczne • kierunek pytania • braki odpowiedzi
R11b „Zbyt ufamy nauce, za mało religii”
• 1 zdec. zgoda, 5 zdec. niezgoda -> zaufanie spada R11c „Religia-więcej konfliktów niż pokoju”
• 1 zdec. zgoda, 5 zdec. niezgoda -> rośnie zaufanie R11d „Osoby religijne często zbyt nietolerancyjne”
• 1 zdec. zgoda, 5 zdec. niezgoda -> rośnie zaufanie R19a „Bóg zajmuje się osobiście każdą istotą”
• 1 zdec. zgoda, 5 zdec. niezgoda -> zaufanie spada R19c „Życie ma sens bo istnieje Bóg”
• 1 zdec. zgoda, 5 zdec. niezgoda -> zaufanie spada R34a „Religia sprzyja odnalezieniu wewnętrznego spokoju i szczęścia”
• 1 zdec. zgoda, 5 zdec. niezgoda -> zaufanie spada R34b „Religia sprzyja zawieraniu przyjaźni”
• 1 zdec. zgoda, 5 zdec. niezgoda -> zaufanie spada R34c „Religia sprzyja uzyskaniu pocieszenia w kłopotach lub chwilach smutku”
• 1 zdec. zgoda, 5 zdec. niezgoda -> zaufanie spada R34d „Religia sprzyja spotykaniu właściwych ludzi”
• 1 zdec. zgoda, 5 zdec. niezgoda -> zaufanie spada Kontrola braków danych Odwrócenie R11c i R11d Analiza -> redukcja wymiarów -> analiza czynnikowa
• Zmienne -> wszystkie brane pod uwagę zmienne • Statystyki
o Statystyki opisowe o Rozwiązania wstępne o K-M-O
• Wyodrębnianie o Domyślne głównych składowych o Macierz korelacji, bo mamy dane surowe o Pokaż nierotowane rozwiązania czynnikowe o Wyodrębnianie na podstawie wartości własnej większe niż 1
• Rotacja o Wersja pierwsza: Varimax o Wersja druga: Oblimin
• Opcje o Sortuj wg wartości ładunków czynnikowych o Ukryj małe współczynniki (wartość bezwzględna poniżej 0,4)
Interpretacja tabel: a)
Całkowita wyjaśniona wariancja
Skład
owa
Początkowe wartości własne Sumy kwadratów ładunków po
wyodrębnieniu
Sumy kwadratów ładunków po rotacji
Ogółem %
wariancji
%
skumulowa
ny
Ogółem % wariancji %
skumulowa
ny
Ogółem % wariancji %
skumulowany
1 3,736 41,514 41,514 3,736 41,514 41,514 2,788 30,983 30,983
2 1,353 15,033 56,547 1,353 15,033 56,547 1,802 20,020 51,002
3 1,083 12,028 68,576 1,083 12,028 68,576 1,582 17,573 68,576
4 ,778 8,639 77,215 5 ,685 7,609 84,824 6 ,485 5,386 90,210 7 ,402 4,462 94,671 8 ,286 3,183 97,854 9 ,193 2,146 100,000
Metoda wyodrębniania czynników – głównych składowych.
• Wartość własna powyżej 1 to 3 czynniki • Wyjaśniają w sumie (po rotacji) 68,6% wariancji (czyli 2/3 przypadków) – to sporo
b)
Macierz składowycha Składowa
1 2 3
spotykaniu właściwych ludzi ,811 zawieraniu przyjaźni ,774 odnalezieniu wewnętrznego
spokoju i szczęścia
,749
uzyskaniu pocieszenia w
kłopotach lub chwilach
smutku
,719
Bóg zajmuje się osobiście
każdą istotą
,680
Życie ma sens bo istnieje
Bóg
,653 ,482
Osoby religijne często zbyt
nietolerancyjne
,744
Religia-więcej konfliktów niż
pokoju
,412 ,696
Zbyt ufamy nauce, za mało
religii
,435 ,653
Metoda wyodrębniania czynników - Głównych składowych.
a. 3 – liczba wyodrębnionych składowych.
• Nie rotowana macierz składowych • Pomijamy
c)
Macierz rotowanych składowycha Składowa
1 2 3
uzyskaniu pocieszenia w
kłopotach lub chwilach
smutku
,846
odnalezieniu wewnętrznego
spokoju i szczęścia
,831
spotykaniu właściwych ludzi ,766 zawieraniu przyjaźni ,763 Zbyt ufamy nauce, za mało
religii
,779
Życie ma sens bo istnieje
Bóg
,763
Bóg zajmuje się osobiście
każdą istotą
,610
Religia-więcej konfliktów niż
pokoju
,862
Osoby religijne często zbyt
nietolerancyjne
,834
Metoda wyodrębniania czynników - Głównych składowych.
Metoda rotacji - Varimax z normalizacją Kaisera.
a. Rotacja osiągnęła zbieżność w 4 iteracjach.
• Rotowana macierz • Pokazuje, co „ładuje każdy czynnik” • Czy można te czynniki nazwać?
d)
Testy Kaisera-Mayera-Olkina i Bartletta
Miara KMO adekwatności doboru próby ,768
Test sferyczności Bartletta
Przybliżone chi-kwadrat 3352,786
df 36
Istotność ,000
• Test istotny (p<0,05) pokazuje, że między zmiennymi są istotne współczynniki korelacji • Miara większa nić 0,5 wskazuje na dobre własności danych, a im bliżej 1 tym lepiej
e)
Zasoby zmienności wspólnej Początkowe Po
wyodrębnieniu
Zbyt ufamy nauce, za mało
religii
1,000 ,615
Religia-więcej konfliktów niż
pokoju
1,000 ,768
Osoby religijne często zbyt
nietolerancyjne
1,000 ,727
Bóg zajmuje się osobiście
każdą istotą
1,000 ,567
Życie ma sens bo istnieje
Bóg
1,000 ,678
odnalezieniu wewnętrznego
spokoju i szczęścia
1,000 ,714
zawieraniu przyjaźni 1,000 ,671
uzyskaniu pocieszenia w
kłopotach lub chwilach
smutku
1,000 ,724
spotykaniu właściwych ludzi 1,000 ,708
Metoda wyodrębniania czynników – głównych składowych.
• Określa ile procent wariancji zmiennej wyjściowej udało się odtworzyć w nowo powstałych
czynnikach • Im wyższa -> tym lepiej zmienna wpisuje się w czynnik
To samo dla rotacji Oblimin
a) Całkowita wyjaśniona wariancja b) Macierz składowa – bez rotacji c) Macierz modelowa – po rotacji, pokazuje czynniki
Macierz modelowaa Składowa
1 2 3
uzyskaniu pocieszenia w
kłopotach lub chwilach
smutku
,894
odnalezieniu wewnętrznego
spokoju i szczęścia
,862
zawieraniu przyjaźni ,759 spotykaniu właściwych ludzi ,750 Religia-więcej konfliktów niż
pokoju
,876
Osoby religijne często zbyt
nietolerancyjne
,850
Zbyt ufamy nauce, za mało
religii
,823
Życie ma sens bo istnieje
Bóg
,745
Bóg zajmuje się osobiście
każdą istotą
,553
Metoda wyodrębniania czynników - Głównych składowych.
Metoda rotacji - Oblimin z normalizacją Kaisera.
a. Rotacja osiągnęła zbieżność w 5 iteracjach.
d)
Macierz korelacji składowych
Składowa 1 2 3
1 1,000 ,261 ,380
2 ,261 1,000 ,210
3 ,380 ,210 1,000
Metoda wyodrębniania czynników - Głównych
składowych.
Metoda rotacji - Oblimin z normalizacją Kaisera.
• Korelacje pomiędzy czynnikami • Pokazuje, że to lepsza rotacja, bo korelacje są całkiem całkiem
e) Test K-M-O f) Zasób zmienności wspólnej
Aby utworzyć wskaźnik
a) Można postępować jak w przypadku indeksu, ale dodając teraz do siebie tylko składowe danego czynnika
b) Albo wykorzystać opcję automatycznego tworzenia wskaźnika o Która uwzględnia, że poszczególne zmienne nie ładują czynnika w takim samym stopniu
Oceny -> zapisz jako zmienne -> metoda Anderson-Rubin Na końcu bazy nowe zmienne
• Są wystandaryzowane do rozkładu normalnego • Wartości należy interpretować w kategoriach odległości od średniej (o ile części odchylenia
standardowego w obie strony) • Ujemne – niski wynik na skali • Okolice zera – przeciętny • Dodatni – wysoki wynik na skali • Zapisany w ten sposób wskaźnik można wykorzystać przy innych analizach jako zmienną
Analiza rzetelności
• Wiemy, że pyt re34 w całości utworzyło jeden czynnik, jest więc dobrym materiałem na wskaźnik (skalę)
• O tym, jak bardzo dobra jest to skala mówi nam analiza rzetelności Analiza -> skalowanie -> analiza rzetelności
• Statystyki o Pozycja testowa o Skala przy wykluczeniu
Statystyki rzetelności
Alfa Cronbacha Liczba pozycji
,851 4
• Min 0,5 • 0,7 i wyżej – skala jest rzetelna
Statystyki pozycji Ogółem Średnia skali po
usunięciu
pozycji
Wariancja skali
po usunięciu
pozycji
Korelacja
pozycji Ogółem
Alfa Cronbacha
po usunięciu
pozycji
odnalezieniu wewnętrznego
spokoju i szczęścia
6,99 5,748 ,662 ,824
zawieraniu przyjaźni 6,46 4,818 ,721 ,798
uzyskaniu pocieszenia w
kłopotach lub chwilach
smutku
7,01 5,705 ,663 ,823
spotykaniu właściwych ludzi 6,43 4,712 ,737 ,791
• Czy dałoby się jeszcze poprawić rzetelność skali?
Analiza czynnikowa a analiza rzetelności
• Można je wykonywać w dowolnej kolejności • Jeśli najpierw czynnikowa, to rzetelności potem nas tylko upewnia • Jeśli najpierw rzetelności, to czynnikowa może pokazać, czy nie ma podskal
Dla re18
• Trudno powiedzieć -> jako środek skali • Analiza rzetelności • Analiza czynnikowa z rotację oblimin • Analiza rzetelności dla podskal