Analiza czynnikowa - dr Agnieszka Figiel | analityk, badacz, · PDF file ·...

7
Analiza czynnikowa Kolejna z analiz wielozmiennowych Jej celem jest eksploracja danych, poszukiwanie pewnych struktur, które mogą utworzyć wskaźniki Budowa wskaźnika Indeks był banalny I miał wady: o Czy wszystkie podpytania były ze sobą połączone merytorycznie i statystycznie? o Czy wszystkie podpytania mierzyły tak naprawdę to samo? o Czy wszystkie podpytania były jednakowo ważne dla wskaźnika? Analiza czynnikowa jest bardziej skomplikowana, ale eliminuje ww. problemy Jest kilka metod określania liczby czynników; najpopularniejsze: Metoda Kaisera o przyjmuje istnienie tylu czynników, ile czynników ma wartość własną większą niż 1 o wartość własna określa procent wyjaśnianych przez dany czynnik wariancji o jeśli czynnik nie wyjaśnia więcej wariancji niż pojedyncza zmienna to nie ma sensu metoda Catella o z wykresem osypiska o wyszukuje się punkt reprezentujący czynnik, za którym kończy się stromizna o zlicza się czynniki powyżej tego punktu – tyle ich właśnie trzeba wyodrębnić !!! korzystamy tu także z metody głównych składowych o Tylko ona pozwala uzyskać takie czynniki, które będą wyjaśniały maksymalny procent wariancji wyjściowych zmiennych Jest kilka metod obliczania ładunków czynnikowych metoda osi głównych o rekomendowana o stara się zmaksymalizować powiązania pomiędzy czynnikami a stwierdzeniami skali o nie wymaga rozkładu normalnego metoda największej wiarygodności o wymaga rozkładu normalnego o podaje poziom istotności różnicy między strukturą idealną (modelową) w strukturą uzyskaną w badaniu Rotacja by zwiększyć dopasowanie rotacje ortogonalne o najpopularniejsza: Varimax o zakładamy brak korelacji między czynnikami o przydaje się, gdy przygotowujemy predyktory dla regresji rotacje nieortogonalne (ukośne) o najpopularniejsza: Oblimin o zakładamy pewien stopień skorelowania czynników o pokaże nam też, jeśli tej korelacji nie będzie Analizę możemy prowadzić na danych surowych -> macierz korelacji danych zestandaryzowanych -> macierz kowariancji [standaryzacja: Analiza -> opis statystyczny -> statystyki opisowe -> zapisz standaryzowane wartości jako zmienne ]

Transcript of Analiza czynnikowa - dr Agnieszka Figiel | analityk, badacz, · PDF file ·...

Page 1: Analiza czynnikowa - dr Agnieszka Figiel | analityk, badacz, · PDF file · 2014-04-24Przy wyborze zmiennych trzeba uważać na: • związki merytoryczne • kierunek pytania •

Analiza czynnikowa

• Kolejna z analiz wielozmiennowych • Jej celem jest eksploracja danych, poszukiwanie pewnych struktur, które mogą utworzyć wskaźniki

Budowa wskaźnika

• Indeks był banalny • I miał wady:

o Czy wszystkie podpytania były ze sobą połączone merytorycznie i statystycznie? o Czy wszystkie podpytania mierzyły tak naprawdę to samo? o Czy wszystkie podpytania były jednakowo ważne dla wskaźnika?

• Analiza czynnikowa jest bardziej skomplikowana, ale eliminuje ww. problemy Jest kilka metod określania liczby czynników; najpopularniejsze:

• Metoda Kaisera o przyjmuje istnienie tylu czynników, ile czynników ma wartość własną większą niż 1 o wartość własna określa procent wyjaśnianych przez dany czynnik wariancji o jeśli czynnik nie wyjaśnia więcej wariancji niż pojedyncza zmienna to nie ma sensu

• metoda Catella o z wykresem osypiska o wyszukuje się punkt reprezentujący czynnik, za którym kończy się stromizna o zlicza się czynniki powyżej tego punktu – tyle ich właśnie trzeba wyodrębnić

• !!! korzystamy tu także z metody głównych składowych o Tylko ona pozwala uzyskać takie czynniki, które będą wyjaśniały maksymalny procent

wariancji wyjściowych zmiennych Jest kilka metod obliczania ładunków czynnikowych

• metoda osi głównych o rekomendowana o stara się zmaksymalizować powiązania pomiędzy czynnikami a stwierdzeniami skali o nie wymaga rozkładu normalnego

• metoda największej wiarygodności o wymaga rozkładu normalnego o podaje poziom istotności różnicy między strukturą idealną (modelową) w strukturą uzyskaną

w badaniu Rotacja by zwiększyć dopasowanie

• rotacje ortogonalne o najpopularniejsza: Varimax o zakładamy brak korelacji między czynnikami o przydaje się, gdy przygotowujemy predyktory dla regresji

• rotacje nieortogonalne (ukośne) o najpopularniejsza: Oblimin o zakładamy pewien stopień skorelowania czynników o pokaże nam też, jeśli tej korelacji nie będzie

Analizę możemy prowadzić na

• danych surowych -> macierz korelacji • danych zestandaryzowanych -> macierz kowariancji

[standaryzacja: Analiza -> opis statystyczny -> statystyki opisowe -> zapisz standaryzowane wartości jako zmienne ]

Page 2: Analiza czynnikowa - dr Agnieszka Figiel | analityk, badacz, · PDF file · 2014-04-24Przy wyborze zmiennych trzeba uważać na: • związki merytoryczne • kierunek pytania •

Przy wyborze zmiennych trzeba uważać na: • związki merytoryczne • kierunek pytania • braki odpowiedzi

R11b „Zbyt ufamy nauce, za mało religii”

• 1 zdec. zgoda, 5 zdec. niezgoda -> zaufanie spada R11c „Religia-więcej konfliktów niż pokoju”

• 1 zdec. zgoda, 5 zdec. niezgoda -> rośnie zaufanie R11d „Osoby religijne często zbyt nietolerancyjne”

• 1 zdec. zgoda, 5 zdec. niezgoda -> rośnie zaufanie R19a „Bóg zajmuje się osobiście każdą istotą”

• 1 zdec. zgoda, 5 zdec. niezgoda -> zaufanie spada R19c „Życie ma sens bo istnieje Bóg”

• 1 zdec. zgoda, 5 zdec. niezgoda -> zaufanie spada R34a „Religia sprzyja odnalezieniu wewnętrznego spokoju i szczęścia”

• 1 zdec. zgoda, 5 zdec. niezgoda -> zaufanie spada R34b „Religia sprzyja zawieraniu przyjaźni”

• 1 zdec. zgoda, 5 zdec. niezgoda -> zaufanie spada R34c „Religia sprzyja uzyskaniu pocieszenia w kłopotach lub chwilach smutku”

• 1 zdec. zgoda, 5 zdec. niezgoda -> zaufanie spada R34d „Religia sprzyja spotykaniu właściwych ludzi”

• 1 zdec. zgoda, 5 zdec. niezgoda -> zaufanie spada Kontrola braków danych Odwrócenie R11c i R11d Analiza -> redukcja wymiarów -> analiza czynnikowa

• Zmienne -> wszystkie brane pod uwagę zmienne • Statystyki

o Statystyki opisowe o Rozwiązania wstępne o K-M-O

• Wyodrębnianie o Domyślne głównych składowych o Macierz korelacji, bo mamy dane surowe o Pokaż nierotowane rozwiązania czynnikowe o Wyodrębnianie na podstawie wartości własnej większe niż 1

• Rotacja o Wersja pierwsza: Varimax o Wersja druga: Oblimin

• Opcje o Sortuj wg wartości ładunków czynnikowych o Ukryj małe współczynniki (wartość bezwzględna poniżej 0,4)

Page 3: Analiza czynnikowa - dr Agnieszka Figiel | analityk, badacz, · PDF file · 2014-04-24Przy wyborze zmiennych trzeba uważać na: • związki merytoryczne • kierunek pytania •

Interpretacja tabel: a)

Całkowita wyjaśniona wariancja

Skład

owa

Początkowe wartości własne Sumy kwadratów ładunków po

wyodrębnieniu

Sumy kwadratów ładunków po rotacji

Ogółem %

wariancji

%

skumulowa

ny

Ogółem % wariancji %

skumulowa

ny

Ogółem % wariancji %

skumulowany

1 3,736 41,514 41,514 3,736 41,514 41,514 2,788 30,983 30,983

2 1,353 15,033 56,547 1,353 15,033 56,547 1,802 20,020 51,002

3 1,083 12,028 68,576 1,083 12,028 68,576 1,582 17,573 68,576

4 ,778 8,639 77,215 5 ,685 7,609 84,824 6 ,485 5,386 90,210 7 ,402 4,462 94,671 8 ,286 3,183 97,854 9 ,193 2,146 100,000

Metoda wyodrębniania czynników – głównych składowych.

• Wartość własna powyżej 1 to 3 czynniki • Wyjaśniają w sumie (po rotacji) 68,6% wariancji (czyli 2/3 przypadków) – to sporo

b)

Macierz składowycha Składowa

1 2 3

spotykaniu właściwych ludzi ,811 zawieraniu przyjaźni ,774 odnalezieniu wewnętrznego

spokoju i szczęścia

,749

uzyskaniu pocieszenia w

kłopotach lub chwilach

smutku

,719

Bóg zajmuje się osobiście

każdą istotą

,680

Życie ma sens bo istnieje

Bóg

,653 ,482

Osoby religijne często zbyt

nietolerancyjne

,744

Religia-więcej konfliktów niż

pokoju

,412 ,696

Zbyt ufamy nauce, za mało

religii

,435 ,653

Metoda wyodrębniania czynników - Głównych składowych.

a. 3 – liczba wyodrębnionych składowych.

Page 4: Analiza czynnikowa - dr Agnieszka Figiel | analityk, badacz, · PDF file · 2014-04-24Przy wyborze zmiennych trzeba uważać na: • związki merytoryczne • kierunek pytania •

• Nie rotowana macierz składowych • Pomijamy

c)

Macierz rotowanych składowycha Składowa

1 2 3

uzyskaniu pocieszenia w

kłopotach lub chwilach

smutku

,846

odnalezieniu wewnętrznego

spokoju i szczęścia

,831

spotykaniu właściwych ludzi ,766 zawieraniu przyjaźni ,763 Zbyt ufamy nauce, za mało

religii

,779

Życie ma sens bo istnieje

Bóg

,763

Bóg zajmuje się osobiście

każdą istotą

,610

Religia-więcej konfliktów niż

pokoju

,862

Osoby religijne często zbyt

nietolerancyjne

,834

Metoda wyodrębniania czynników - Głównych składowych.

Metoda rotacji - Varimax z normalizacją Kaisera.

a. Rotacja osiągnęła zbieżność w 4 iteracjach.

• Rotowana macierz • Pokazuje, co „ładuje każdy czynnik” • Czy można te czynniki nazwać?

d)

Testy Kaisera-Mayera-Olkina i Bartletta

Miara KMO adekwatności doboru próby ,768

Test sferyczności Bartletta

Przybliżone chi-kwadrat 3352,786

df 36

Istotność ,000

• Test istotny (p<0,05) pokazuje, że między zmiennymi są istotne współczynniki korelacji • Miara większa nić 0,5 wskazuje na dobre własności danych, a im bliżej 1 tym lepiej

Page 5: Analiza czynnikowa - dr Agnieszka Figiel | analityk, badacz, · PDF file · 2014-04-24Przy wyborze zmiennych trzeba uważać na: • związki merytoryczne • kierunek pytania •

e)

Zasoby zmienności wspólnej Początkowe Po

wyodrębnieniu

Zbyt ufamy nauce, za mało

religii

1,000 ,615

Religia-więcej konfliktów niż

pokoju

1,000 ,768

Osoby religijne często zbyt

nietolerancyjne

1,000 ,727

Bóg zajmuje się osobiście

każdą istotą

1,000 ,567

Życie ma sens bo istnieje

Bóg

1,000 ,678

odnalezieniu wewnętrznego

spokoju i szczęścia

1,000 ,714

zawieraniu przyjaźni 1,000 ,671

uzyskaniu pocieszenia w

kłopotach lub chwilach

smutku

1,000 ,724

spotykaniu właściwych ludzi 1,000 ,708

Metoda wyodrębniania czynników – głównych składowych.

• Określa ile procent wariancji zmiennej wyjściowej udało się odtworzyć w nowo powstałych

czynnikach • Im wyższa -> tym lepiej zmienna wpisuje się w czynnik

To samo dla rotacji Oblimin

a) Całkowita wyjaśniona wariancja b) Macierz składowa – bez rotacji c) Macierz modelowa – po rotacji, pokazuje czynniki

Macierz modelowaa Składowa

1 2 3

uzyskaniu pocieszenia w

kłopotach lub chwilach

smutku

,894

odnalezieniu wewnętrznego

spokoju i szczęścia

,862

zawieraniu przyjaźni ,759 spotykaniu właściwych ludzi ,750 Religia-więcej konfliktów niż

pokoju

,876

Page 6: Analiza czynnikowa - dr Agnieszka Figiel | analityk, badacz, · PDF file · 2014-04-24Przy wyborze zmiennych trzeba uważać na: • związki merytoryczne • kierunek pytania •

Osoby religijne często zbyt

nietolerancyjne

,850

Zbyt ufamy nauce, za mało

religii

,823

Życie ma sens bo istnieje

Bóg

,745

Bóg zajmuje się osobiście

każdą istotą

,553

Metoda wyodrębniania czynników - Głównych składowych.

Metoda rotacji - Oblimin z normalizacją Kaisera.

a. Rotacja osiągnęła zbieżność w 5 iteracjach.

d)

Macierz korelacji składowych

Składowa 1 2 3

1 1,000 ,261 ,380

2 ,261 1,000 ,210

3 ,380 ,210 1,000

Metoda wyodrębniania czynników - Głównych

składowych.

Metoda rotacji - Oblimin z normalizacją Kaisera.

• Korelacje pomiędzy czynnikami • Pokazuje, że to lepsza rotacja, bo korelacje są całkiem całkiem

e) Test K-M-O f) Zasób zmienności wspólnej

Aby utworzyć wskaźnik

a) Można postępować jak w przypadku indeksu, ale dodając teraz do siebie tylko składowe danego czynnika

b) Albo wykorzystać opcję automatycznego tworzenia wskaźnika o Która uwzględnia, że poszczególne zmienne nie ładują czynnika w takim samym stopniu

Oceny -> zapisz jako zmienne -> metoda Anderson-Rubin Na końcu bazy nowe zmienne

• Są wystandaryzowane do rozkładu normalnego • Wartości należy interpretować w kategoriach odległości od średniej (o ile części odchylenia

standardowego w obie strony) • Ujemne – niski wynik na skali • Okolice zera – przeciętny • Dodatni – wysoki wynik na skali • Zapisany w ten sposób wskaźnik można wykorzystać przy innych analizach jako zmienną

Page 7: Analiza czynnikowa - dr Agnieszka Figiel | analityk, badacz, · PDF file · 2014-04-24Przy wyborze zmiennych trzeba uważać na: • związki merytoryczne • kierunek pytania •

Analiza rzetelności

• Wiemy, że pyt re34 w całości utworzyło jeden czynnik, jest więc dobrym materiałem na wskaźnik (skalę)

• O tym, jak bardzo dobra jest to skala mówi nam analiza rzetelności Analiza -> skalowanie -> analiza rzetelności

• Statystyki o Pozycja testowa o Skala przy wykluczeniu

Statystyki rzetelności

Alfa Cronbacha Liczba pozycji

,851 4

• Min 0,5 • 0,7 i wyżej – skala jest rzetelna

Statystyki pozycji Ogółem Średnia skali po

usunięciu

pozycji

Wariancja skali

po usunięciu

pozycji

Korelacja

pozycji Ogółem

Alfa Cronbacha

po usunięciu

pozycji

odnalezieniu wewnętrznego

spokoju i szczęścia

6,99 5,748 ,662 ,824

zawieraniu przyjaźni 6,46 4,818 ,721 ,798

uzyskaniu pocieszenia w

kłopotach lub chwilach

smutku

7,01 5,705 ,663 ,823

spotykaniu właściwych ludzi 6,43 4,712 ,737 ,791

• Czy dałoby się jeszcze poprawić rzetelność skali?

Analiza czynnikowa a analiza rzetelności

• Można je wykonywać w dowolnej kolejności • Jeśli najpierw czynnikowa, to rzetelności potem nas tylko upewnia • Jeśli najpierw rzetelności, to czynnikowa może pokazać, czy nie ma podskal

Dla re18

• Trudno powiedzieć -> jako środek skali • Analiza rzetelności • Analiza czynnikowa z rotację oblimin • Analiza rzetelności dla podskal