ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA...

52
ANALIZA CZYNNIKOWA ... stanowi zespół metod i procedur statystycznych pozwalających na badanie wzajemnych relacji między dużą liczbą zmiennych i wykrywanie ukrytych uwarunkowań, ktore wyjaśniają ich występowanie. Pozwala na sprowadzenie dużej liczby badanych zmiennych do znacznie mniejszej liczby wzajemnie niezależnych (nieskorelowanych) czynników. Wyodrębnione czynniki mają inną interpretację merytoryczną jednocześnie zachowują znaczną część informacji zawartych w zmiennych pierwotnych.

Transcript of ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA...

Page 1: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

ANALIZA CZYNNIKOWA

... stanowi zespół metod i procedur statystycznych pozwalających na

badanie wzajemnych relacji między dużą liczbą zmiennych i wykrywanie

ukrytych uwarunkowań, ktore wyjaśniają ich występowanie.

Pozwala na sprowadzenie dużej liczby badanych zmiennych do znacznie

mniejszej liczby wzajemnie niezależnych (nieskorelowanych) czynników.

Wyodrębnione czynniki mają inną interpretację merytoryczną jednocześnie

zachowują znaczną część informacji zawartych w zmiennych pierwotnych.

Page 2: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

ANALIZA CZYNNIKOWA

Przykład 1

Ocena nowej czekolady za pomocą zestawu 20 pytań, w których

badani oceniali wiele jej różnych cech (smak, zapach, konsystencja,

kolor, kształt, opakowanie itp.)

Wykorzystując analizę czynnikową można sprawdzić, czy możliwe

jest wyodrębnienie kilku ogólnych, ukrytych czynników,

warunkujących stosunek respondentów do nowego produktu (np.

wymiary "łącznej oceny smaku i zapachu" czy wyglądu).

Page 3: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

ANALIZA CZYNNIKOWA

Przykład 2

kwestionariusz dotyczący satysfakcji klientów zwykle zawiera wiele

pytań dotyczących różnych aspektów działania firmy – analizowanie

każdego pytania osobno pozwala uzyskać wiele szczegółowych

informacji. Natomiast zastosowanie analizy czynnikowej pozwala na

uzyskanie ogólnego, syntetycznego obrazu powodów wpływających

na satysfakcję klientów.

Page 4: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

CELE ANALIZY CZYNNIKOWEJ

Redukcja liczby zmiennych bez istotnej straty zawartych

w nich informacji

Wykrywanie ukrytych związków między zmiennymi –

formułowanie i weryfikacja hipotez dotyczących istnienia i

charakteru prawidłowości kształtujących związki między

zmiennymi

Page 5: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

CELE ANALIZY CZYNNIKOWEJ

Tworzenie skal i miar złożonych z kilku pytań

Ustalanie wag określających znaczenie, jakie należy przypisać

poszczególnym zmiennym i czynnikom w trakcie analiz

Ortogonalizacja przestrzeni, w której rozpatrywane są obiekty,

będące przedmiotem badań

Opis zjawisk w kontekście nowych kategorii zdefiniowanychprzez czynniki

Prezentacja graficzna zbioru obserwacji wielowymiarowych

Page 6: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

CELE ANALIZY CZYNNIKOWEJ

Kiedy stosować?

Analiza eksploracyjnaczynniki są początkowo nieznane i zostają wyodrębnione dzięki analizie: dane grupowane są w zbiory zmiennych najsilniej ze sobą skorelowanych → wykrywanie związków między zmiennymi bez wstępnych założeń

Analiza konfirmacyjna → weryfikacja hipotez co do określonej z góry struktury czynników i estymacja parametrów założonego modelu

Page 7: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

OGÓLNY PODZIAŁ METOD ANALIZY CZYNNIKOWEJ

A. Model "klasyczny" analizy czynnikowej (podział wariancjicałkowitej zmiennych na dwie części: wariancję wspólną i wariancjęspecyficzną)‏

klasyczna analiza czynnikowa

analiza kanoniczna

B. Model "komponentowy" analizy czynnikowej (nieuwzględnianie

struktury wariancji)

metoda głównych składowych

analiza współzależności

Page 8: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

PROCEDURA

Wybór zmiennych do analizy

Wyznaczenie macierzy korelacji (kowariancji)

Wyznaczenie głównych składowych /czynników

Rotacja głównych składowych /czynników

Interpretacja głównych składowych /czynników

Page 9: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali
Page 10: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

METODA GŁÓWNYCH SKŁADOWYCH

Analiza głównych składowych (principal components

analysis)‏jest metodą transformacji obserwowalnych

zmiennych pierwotnych w nowe, wzajemnie

ortogonalne zmienne, tzw. główne składowe.

Głównych składowych można wyznaczyć tyle, ile było

zmiennych pierwotnych.

Page 11: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

Własności głównych składowych

- są liniową kombinacją obserwowalnych zmiennych

- są ortogonalne względem siebie

- kolejne składowe wyjaśniają malejącą ilość łącznej

wariancji zmiennych

- suma wariancji składowych jest równa sumie wariancji

zmiennych pierwotnych

Page 12: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

METODA GŁÓWNYCH SKŁADOWYCH

W praktyce chodzi o sprawdzenie, czy kilka nowych

zmiennych wyjaśnia maksymalnie dużo zmienności

wyjściowego układu przy zachowaniu

nieskorelowania, co daje w efekcie redukcję

wymiaru.

Page 13: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

METODA GŁÓWNYCH SKŁADOWYCH

Redukcja wymiaru przestrzeni cech, uporządkowanie ich na

podzbiory (główne składowe) jest przydatna głównie ze

względu na możliwość:

zmniejszenia liczby zmiennych w dalszych analizach

interpretacji relacji między składowymi

graficznej prezentacji konfiguracji porównywanych zmiennych

uporządkowania zmiennych według przyjętych cech

Page 14: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

METODA GŁÓWNYCH SKŁADOWYCH

W analizie głównych składowych rozwiązywany problem można

przedstawić następująco:

Page 15: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

METODA GŁÓWNYCH SKŁADOWYCH

Zmienne pierwotne są zestandaryzowane.

Nowa zmienna powinna wyjaśniać maksymalną ilość

wariancji zmiennych pierwotnych (jej wariancja jest

przedstawiona na rysunku obszarem zacieniowanym).

Wariancja tej nowej zmiennej wyjaśniającej pewną ilość zmienność

zmiennych pierwotnych jest nazywana jej wartością własną (eigenvalue).

Page 16: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

PROCEDURA METODY GŁÓWNYCH SKŁADOWYCH

Przedmiot analizy:

macierz danych, zawierająca n realizacji m zmiennych:

Po standaryzacji:

ni

mjxxX ijij

,...,2,1

,...,2,1,0,

Z= [ zij]

Page 17: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

PROCEDURA METODY GŁÓWNYCH SKŁADOWYCH

Podstawowe równanie metody głównych składowych można zapisać

w postaci układu równań liniowych:

ZT = AGT

G = AT Z

gdzie:

Z - macierz j standaryzowanych zmiennych pierwotnych

A - macierz współczynników składowych głównych

G - macierz składowych głównych

Page 18: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

PROCEDURA METODY GŁÓWNYCH SKŁADOWYCH

Podstawą do wyznaczania elementów macierzy

współczynników składowych głównych jest macierz korelacji:

mjpzzn

ZZn

rR ij

n

i

ipij ...1,1

'1

1

Wariancje na głównej przekątnej są miarą zasobów

informacyjnych zmiennych pierwotnych.

Page 19: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

PROCEDURA METODY GŁÓWNYCH SKŁADOWYCH

Każdą z głównych składowych Glmożna przedstawić jako liniową

kombinację pierwotnych zmiennych Z:

Gl= ∑i= 1

k

∑j= 1

m

a i j Z j

gdzie:m – liczba zmiennych pierwotnychk – liczba składowych głównychZ

j– j-ta zmienna standaryzowana (pierwotna)

Gl– l-ta skłądowa główna

ajl

– ładunki czynnikowe

Page 20: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

METODA GŁÓWNYCH SKŁADOWYCH

Pierwsza główna składowa G1

jest taką kombinacją zmiennych

pierwotnych, dla której wariancja próbkowa wyraża się wzorem:

ijj1i1

1 1

2

G1 S a a = S

m

i

m

j

i jest największa wśród wszystkich kombinacji liniowych takich, że:

a1

Ta1=1

(warunek jednoznacznego wyznaczenia wektora współczynników).

Page 21: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

METODA GŁÓWNYCH SKŁADOWYCH

Druga główną składową można przedstawić w sposób analogiczny.

Jest ona kombinacją liniową zmiennych pierwotnych

maksymalizującą wariancję przy warunkach:

a1

Ta1=1 oraz a

1

Ta2= 0

Drugi z nich zapewnia ortogonalność powstałych składowych.

Konsekwencją tego jest sumowanie się kolejnych wariancji głównych

składowych do wariancji całkowitej.

Page 22: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

PROCEDURA METODY GŁÓWNYCH SKŁADOWYCH

Każda l-ta główna składowa jest liniowa kombinacją zmiennych

pierwotnych i wyjaśnia i-tą część całkowitej zmienności.

Główne składowe są tak wyznaczane, aby wariancje kolejnych

składowych były coraz mniejsze.

Można wyznaczyć tyle głównych składowych, ile mamy zmiennych

wyjściowych, jednak zazwyczaj kilka pierwszych wystarcza do

wyjaśnienia większości wariancji układu zmiennych.

Page 23: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

METODA GŁÓWNYCH SKŁADOWYCH

Znaczenie i użyteczność składowej głównej jest mierzona wielkością

wyjaśnianej przez nią całkowitej zmienności. I tak, jeśli w układzie

sześciu zmiennych pierwsza składowa wyjaśnia np. 85% zmienności,

to znaczy to, że niemal cała zmienność tego układu da się

przedstawić na prostej zamiast w sześciu wymiarach.

Page 24: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

METODA GŁÓWNYCH SKŁADOWYCH

W efekcie powstaje nam tyle głównych składowych, ile było

początkowo zmiennych: nadal mamy układ m-wymiarowy. Ale

w praktyce ograniczamy się do kilku pierwszych głównych

składowych, które wyjaśniają z góry ustaloną część wariancji

całkowitej, np. 75%.

Page 25: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali
Page 26: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

PROCEDURA ANALIZY CZYNNIKOWEJ

Analiza czynnikowa to metoda modelowania liniowego – zakłada

się, że zmienne można przedstawić za pomocą liniowej funkcji

zmiennych nieobserwowalnych (czynników), przy czym wszystkie

zmienne przedstawiane są jako funkcje tych samych czynników.

Bazuje na korelacji lub kowariancji między zmiennymi.

Page 27: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

PROCEDURA ANALIZY CZYNNIKOWEJ

Przedmiot analizy: macierz danych, zawierająca n realizacji m zmiennych:

Po standaryzacji :

ni

mjxxX ijij

,...,2,1

,...,2,1,0,

Z= [ zij]

Page 28: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

PROCEDURA ANALIZY CZYNNIKOWEJ

Zakładamy, że pomiędzy zmiennymi Xjzachodzą związki, których

siłę i kierunek określają współczynniki korelacji liniowej Pearsona

zawarte w macierzy korelacji:

mjpzzn

ZZn

rR ij

n

i

ipij ...1,1

'1

1

Page 29: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

PROCEDURA ANALIZY CZYNNIKOWEJ

Zakładamy, że źródłem wzajemnych zależności między zmiennymi

są ukryte wspólne czynniki, które można uznać za nośniki tej

samej informacji, chcemy zatem je wyodrębnić w formie nowych,

syntetycznych zmiennych.

Jednak zakładamy też, że nie cała wariancja zmiennych jest

powodowana tymi ukrytymi wspólnymi czynnikami – każda

zmienna pierwotna charakteryzuje się też pewnymi specyficznymi

właściwościami.

Page 30: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

PROCEDURA ANALIZY CZYNNIKOWEJ

Podstawą identyfikacji składników wspólnych i specyficznych jest wanalizie czynnikowej podział wariancji poszczególnych zmiennych nawariancję wspólną i specyficzną:

h j2

- zasób zmienności wspólnej - część wariancji objaśnionaprzez czynniki wspólne

- zasób zmienności swoistej - pozostałość po odjęciu zasobuzmienności wspólnej od wariancji całkowitejw j

2

Page 31: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

PROCEDURA ANALIZY CZYNNIKOWEJ

Założenia:

- czynniki wspólne nie są skorelowane ze sobą

- czynniki specyficzne również nie są ze sobą skorelowane

- czynniki wspólne nie są skorelowane z czynnikami

specyficznymi

Page 32: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

PROCEDURA ANALIZY CZYNNIKOWEJ

Model analizy czynnikowej można zapisać w postaciw postaci układurównań liniowych:

Z = AF + BU

gdzie:

Z - macierz j standaryzowanych zmiennych pierwotnych

A - macierz ładunków czynnikowych czynników wspólnych

F - macierz czynników wspólnych

B – macierz (disgonalna) ładunków czynnikowych czynników

specyficznych

U - macierz czynników specyficznych

Page 33: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

PROCEDURA ANALIZY CZYNNIKOWEJ

Zatem każda z obserwowalnych zmiennych Z jest funkcją liniową zmiennych nieobserwowalnych (czynników wspólnych) orazpojedynczej zmiennej specyficznej:

Z j= ∑l=1

k

a jl F l b jU j

gdzie:m - liczba zmiennych pierwotnychk - liczba czynników głównych (wspólnych)Z

j- j-ta zmienna standaryzowana (pierwotna)

Fl- l-ty czynnik wspólny

Uj- j-ty czynnik swoisty

ajl

– ładunek czynnikowy l-tego czynnika Fl w j-tej zmiennej obserwowalnej

Page 34: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

PROCEDURA ANALIZY CZYNNIKOWEJ

Dążymy do eliminacji wpływu czynników specyficznych na rzecz

czynników wspólnych. W tym celu zastępujemy w macierzy R

współczynniki korelacji na głównej przekątnej zasobami zmienności

wspólnej, otrzymując tzw. zredukowaną macierz korelacji :

~~

~Rr r dla i j

r h dla i j

ij ij

ij j

2

Page 35: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

PROCEDURA ANALIZY CZYNNIKOWEJ

Wartości hj

2 ustala się na poziomie:

średniej arytmetycznej współczynników korelacji danej zmiennej z

innymi zmiennymi: hj

2 =

najwyższego co do modułu współczynnika korelacji j-tej zmiennej

z pozostałymi: hj

2 = max [|rij |], i ≠ j

współczynnik determinacji wielorakiej R2 danej zmiennej z innymi

zmiennymi

m

i

ijrm 1

1

Page 36: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

PROCEDURA ANALIZY CZYNNIKOWEJ

Zatem podstawowe zadanie analizy czynnikowej sprowadza się do

rozwiązania równania:

ze względu na macierz A, czyli wyznaczenia ładunków czynnikowych

czynników wspólnych.

TAAR~

Page 37: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

PROCEDURA ANALIZY CZYNNIKOWEJ

Uporządkowane malejąco wartości własne macierzy~R

oraz odpowiadające im wektory własne V:

posłużą do wyznaczenia ładunków czynnikowych l-tego czynnikaw zmiennych pierwotnych:

m

j

jl

jl

jl

v

va

1

2/121

] [

1...m)(j ][ jll vV

1...m)(l ][ l

Page 38: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

PROCEDURA ANALIZY CZYNNIKOWEJ

Kolejne wartości i wektory własne posłużą do uzyskania ładunkówczynnikowych kolejnych czynników.

Ładunki te odzwierciedlają korelację pomiędzy j-tą zmienną

pierwotną i l-tym wspólnym czynnikiem.

Znalezienie tego rozwiązania kończy właściwą analizę czynnikową.

Page 39: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali
Page 40: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

ROTACJA CZYNNIKÓW

Uzyskana macierz ładunków czynnikowych A nie jest jednymmożliwym rozwiązaniem analizy czynnikowej.

Poprzez obrót układu wzajemnie ortogonalnych osi - czynników

głównych - można wygenerować nieskończenie wiele różnych

macierzy ładunków.

Dokonanie takiej rotacji pozwala często na takie ustalenie osi, aby

odpowiadająca mu macierz ładunków zapewniła możliwie

najłatwiejszą interpretację czynników.

Page 41: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

ROTACJA CZYNNIKÓW

Rotacja polega na znalezieniu ortogonalnej macierzy S (macierzy transformacji) spełniającej warunek:

A1

T = S A0

T

gdzie:

A0 ,A1 - to wyjściowa i końcowa macierz ładunków,

Page 42: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

ROTACJA CZYNNIKÓW

Elementy macierzy transformacji S określają kąty, o jakie należyobrócić układ osi - czynników wspólnych tak, aby:

- zmaksymalizować liczbę ładunków zerowych w każdej kolumnie

macierzy czynników

- zmaksymalizować korelacje między jak najmniejszą liczbą

zmiennych, a każdym wyodrębnionym czynnikiem głównym

Page 43: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

ROTACJA CZYNNIKÓW

Innymi słowy - rotacja polega na sprowadzeniu struktury ładunków czynnikowych do prostej struktury, w której punkty reprezentujące zmienne skupiają się wokół osi czynników.

Istotne jest, że wskutek rotacji zasoby zmienności wspólnej hj2

określające udział wszystkich czynników wspólnych w wyjaśnianiu

wariancji zmiennej Xj nie ulegają zmianie.

Page 44: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

ROTACJA CZYNNIKÓW

Najczęściej stosuje się procedury rotacji ortogonalnej, z których najbardziej znanymi są varimax i quartimax.

VARIMAX upraszcza interpretację czynników (minimalizuje liczbę

zmiennych potrzebnych do wyjaśnienia danego czynnika)

QUARTIMAX upraszcza interpretację zmiennych (minimalizuje liczbę

czynników potrzebnych do wyjaśnienia danej zmiennej).

Page 45: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

WYZNACZENIE WARTOŚCI CZYNNIKÓW

Na koniec najczęściej potrzebny jest sposób wyznaczeniawartości poszczególnych czynników dla kolejnych obserwacji.Obliczanie realizacji czynników wspólnych odbywa się woparciu o formułę:

F = AT Z

Page 46: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

ILE CZYNNIKÓW?

Problemem w stosowaniu analizy czynnikowej jest określenie liczby czynników głównych

Najczęściej spotykane techniki określania liczby czynników

wspólnych to:

a/ metoda "wartości własnej (lambda) większej od jedności"

b/ metoda procentu wariancji tłumaczonej przez czynniki główne

c/ metoda testu osypiska

Page 47: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

ILE CZYNNIKÓW?

a/ metoda "wartości własnej (lambda) większej od jedności"

najczęściej spotykana – jej podstawą jest to, że każdy czynnik

powinien wyjaśniać zmienność co najmniej jednej zmiennej

pierwotnej. Metoda ta powinna być stosowana gdy ilość zmiennych

jest większa od 20. Gdy liczba zmiennych jest mniejsza istnieje

tendencja wyodrębniania zbyt małej ilości czynników.

Page 48: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

ILE CZYNNIKÓW?

b/ metoda procentu wariancji tłumaczonej przez czynniki główne

do ogólnej liczby wybranych czynników zalicza się te czynniki, które

w sumie wyjaśniają 75%, 80% lub 90% wariancji, a żaden następny

nie tłumaczy więcej niż 5% wariancji.

Page 49: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

ILE CZYNNIKÓW?

c/ metoda testu osypiska

polega na sporządzeniu wykresu, na którym na osi poziomej

wyznaczana jest ilość czynników a na osi pionowej - uzyskane

wartości własne. Podstawowym zadaniem jest znalezienie "punktów

załamania", w których rozpoczynają się kolejne "rumowiska" (w tych

punktach zmienia się kąt załamania krzywej). Punkty te określają

liczbę czynników kwalifikujących się do dalszej analizy. Metoda ta

jest nieco bardziej "liberalna" niż metoda >1, pozwala włączyć do

dalszej analizy nieco większą liczbę czynników.

Page 50: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

INTERPRETACJA CZYNNIKÓW

Interpretacja nowych zmiennych (czynników) odbywa się na bazie

ładunków czynnikowych: należy wyodrębnić zmienne o najwyższych

ładunkach czynnikowych względem danych czynników i znaleźć

wspólne ich odniesienie do danego czynnika.

Page 51: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

PCA / FA

Obie służą sprowadzaniu informacji zawartych w wielu

zmiennych do stosunkowo niewielkiej liczby

wyjaśniających je wymiarów.

Pomimo że w praktyce wyniki uzyskiwane przy pomocy obu

z nich są zbliżone, to nie są to warianty tej samej

metody, ale różne metody oparte na odmiennych

założeniach.

Page 52: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/~jcieciel/FA_PCA_prezentacja v2.pdfANALIZA CZYNNIKOWA Przykład1 Ocena nowej czekolady za pomocązestawu 20 pytań, w których badani oceniali

PCA / FA

Analiza czynnikowa Analiza głównych składowych

Ch. Spearman (1904), L.L. Thurstone (1913) H. Hotteling (1933)

Obejmuje pewną część wariancji zmiennych, zwaną wariancją wspólną

Obejmuje wariancję całkowitą zmiennych

orientacja kowariancyjna: punktem wyjścia jest zredukowana macierz korelacji

orientacja wariancyjna: punktem wyjścia jest zwykła macierz korelacji

Zmienna pierwotna jest funkcją czynników wspólnych i swoistych

Główna składowa jest funkcją zmiennych pierwotnych

Celem analizy jest identyfikacja ukrytych zmiennych

Celem analizy jest uproszczenie struktury danych

Czynniki mogą być zarówno niezależne, jak i skorelowane

Główne składowe są zawsze niezależne