ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA...

ANALIZA CZYNNIKOWA

... stanowi zespół metod i procedur statystycznych pozwalających na badanie wzajemnych relacji między dużą liczbą zmiennych i wykrywanie ukrytych uwarunkowań, ktore wyjaśniają ich występowanie.

Pozwala na sprowadzenie dużej liczby badanych zmiennych do znacznie

mniejszej liczby wzajemnie niezależnych (nieskorelowanych) czynników.

Wyodrębnione czynniki mają inną interpretację merytoryczną jednocześnie

zachowując znaczną część informacji zawartych w zmiennych pierwotnych.

ANALIZA CZYNNIKOWA

Przykład 1.

Ocena nowej czekolady za pomocą zestawu 20 pytań, w których

badani oceniali wiele jej różnych cech (smak, zapach, konsystencja,

kolor, kształt, opakowanie itp.)

Wykorzystując analizę czynnikową można sprawdzić, czy możliwe

jest wyodrębnienie kilku ogólnych, ukrytych czynników,

warunkujących stosunek respondentów do nowego produktu (np.

wymiary "łącznej oceny smaku i zapachu" czy wyglądu).

ANALIZA CZYNNIKOWA

Przykład 2.

kwestionariusz dotyczący satysfakcji klientów danej firmy

zwykle zawiera wiele pytań dotyczących różnych aspektów działania

firmy – analizowanie każdego pytania osobno pozwala uzyskać wiele

szczegółowych informacji

Zastosowanie analizy czynnikowej pozwala zaś na uzyskanie

ogólnego, syntetycznego obrazu powodów wpływających na

satysfakcję klientów / identyfikujących generalne nastawienie

klientów.

CELE ANALIZY CZYNNIKOWEJ

Redukcja liczby zmiennych bez istotnej straty zawartych w nich informacji Transformacja układu zmiennych w jakościowo nowy układ

czynników głównych Tworzenie skal i miar złożonych z kilku pytań Ustalanie wag określających znaczenie, jakie należy przypisać

poszczególnym zmiennym i czynnikom w trakcie analiz Ortogonalizacja przestrzeni, w której rozpatrywane są obiekty,

będące przedmiotem badań


Wykrywanie ukrytych związków między zmiennymi – formułowanie i weryfikacja hipotez dotyczących istnienia i charakteru prawidłowości kształtujących związki między zjawiskami Opis zjawisk w kontekście nowych kategorii zdefiniowanych przez

czynniki Prezentacja graficzna zbioru obserwacji wielowymiarowych


Kiedy stosować? cel eksploracyjny – rozpoznanie struktury zbioru danych

gdy nie dysponujemy potencjalnym modelem „głębokiej” struktury

czynników wyjaśniających związki między danymi

dla zastosowania wykrytych czynników w dalszych analizach

wielowymiarowych

dla jednoznacznego wyliczenia wartości skal reprezentujących

wymiary mierzone przez zestaw zmiennych

OGÓLNY PODZIAŁ METOD ANALIZY CZYNNIKOWEJ

A. Model "klasyczny" analizy czynnikowej (podział wariancji całkowitej zmiennych na dwie części: wariancję wspólną i wariancję specyficzną) klasyczna analiza czynnikowa analiza kanoniczna

B. Model "komponentowy" analizy czynnikowej (nieuwzględnianie

struktury wariancji) metoda głównych składowych analiza współzależności

PROCEDURA ANALIZY CZYNNIKOWEJ

Kroki:

1. wyodrębnienie czynników

2. rotacja czynników w celu łatwiejszej interpretacji

Analiza czynnikowa to metoda modelowania liniowego

Wymaga danych mierzonych na skali interwałowej, ale mogą być

też skale Likerta (min. 5-cio punktowe)

Bazuje na korelacji i kowariancji między zmiennymi.


Przedmiot analizy: macierz danych, zawierająca n realizacji m zmiennych:

W wyniku standaryzacji wartości zmiennych uzyskujemy zmienne o wartości oczekiwanej równej zero i jednostkowym odchyleniu standardowym:

[ ]nimj

xxX ijij ,...,2,1,...,2,1

,0,==

≥=

Z=[ zij ]


Zakładamy, że pomiędzy zmiennymi Xj zachodzą związki, których siłę i kierunek określają współczynniki korelacji liniowej Pearsona zawarte w macierzy korelacji:

[ ] ( )mjpzzn

ZZn

rR ij

n

iipij ...1,1'1

1==== ∑

=


W analizie czynnikowej przyjmuje się, że źródłem wzajemnych zależności między zmiennymi są ukryte wspólne czynniki, które można uznać za nośniki tej samej informacji.

Możliwe jest zatem ich wyodrębnienie i zastąpienie nowymi,

syntetycznymi zmiennymi.

Ale zakładamy też, że nie cała wariancja zmiennych jest

powodowana tymi ukrytymi czynnikami – każda zmienna pierwotna

charakteryzuje się też pewnymi specyficznymi właściwościami.


Podstawą identyfikacji składników wspólnych i specyficznych jest w analizie czynnikowej podział wariancji poszczególnych zmiennych na wariancję wspólną i specyficzną:

h j2 - zasób zmienności wspólnej - część wariancji objaśniona

przez czynniki wspólne

- zasób zmienności swoistej - pozostałość po odjęciu zasobu zmienności wspólnej od wariancji całkowitejw j

2


Dalsze założenia:

- czynniki wspólne nie są skorelowane ze sobą

- czynniki specyficzne również nie są ze sobą skorelowane

- czynniki wspólne nie są skorelowane z czynnikami

specyficznymi

- czynniki wspólne są zestandaryzowane,

E(Fj)=0 i Var(Fj)=1


Model analizy czynnikowej można zapisać w postaciw postaci układu równań liniowych:

Z = AF + BUgdzie:

Z - macierz j standaryzowanych zmiennych pierwotnych

A - macierz ładunków czynnikowych czynników wspólnych

F - macierz czynników wspólnych

B - macierz ładunków czynnikowych czynników specyficznych

U - macierz czynników specyficznych


Zatem każda z obserwowalnych zmiennych Z jest funkcją liniową zmiennych nieobserwowalnych (czynników wspólnych) oraz pojedynczej zmiennej specyficznej:

Z j=∑l=1

k

a jl F lb jU j

gdzie:m - liczba zmiennych pierwotnychk - liczba czynników głównych (wspólnych)Zj - j-ta zmienna standaryzowana (pierwotna)Fl - l-ty czynnik wspólnyUj - j-ty czynnik swoistyajl – ładunek czynnikowy l-tego czynnika Fl w j-tej zmiennej obserwowalnej


W celu wyznaczenia współczynników modelu – ładunków czynnikowych – w kolejnym kroku zastępuje się w macierzy R elementy głównej przekątnej zasobami zmienności wspólnej (usuwamy z równania składnik reprezentujący wariancję specyficzną)

~ ~~Rr r dla i jr h dla i j

ij ij

ij j=

= ≠= =

2

i otrzymujemy tzw. zredukowaną macierz korelacji R


hj2 ustala się na poziomie:

średniej arytmetycznej najwyższego co do modułu współczynnika korelacji j-tej zmiennej

z pozostałymi hj2 = max [|rij |], i <> j

korelacji przeciętnej hj2 = 1

1 1mrij

i

k

− =∑


Zatem podstawowe zadanie analizy czynnikowej sprowadza się do rozwiązania równania:

ze względu na macierz A, czyli wyznaczenia ładunków czynnikowych składników wspólnych.

TAAR =~


Uporządkowane malejąco wartości własne macierzy ~R

oraz odpowiadające im wektory własne V:

posłużą do wyznaczenia ładunków czynnikowych l-tego czynnika w zmiennych pierwotnych:

∑=

= m

jjl

jljl

v

va

1

2/121

][λ

][ jll vV = )...1( mj =

1...m)(l ][ == lλλ


Kolejne wartości i wektory własne posłużą do uzyskania ładunków czynnikowych kolejnych czynników.

Ładunki te odzwierciedlają korelację pomiędzy j-tą zmienną

pierwotną i l-tym wspólnym czynnikiem.

Znalezienie tego rozwiązania kończy właściwą analizę czynnikową.

ROTACJA CZYNNIKÓW

Uzyskana macierz ładunków czynnikowych A nie jest jednym możliwym rozwiązaniem analizy czynnikowej.

Poprzez obrót układu wzajemnie ortogonalnych osi - czynników

głównych - można wygenerować nieskończenie wiele różnych

macierzy ładunków.

Dokonanie takiej rotacji pozwala często na takie ustalenie osi, aby

odpowiadająca mu macierz ładunków zapewniła możliwie

najłatwiejszą interpretację czynników.

ROTACJA CZYNNIKÓW

Rotacja polega na znalezieniu ortogonalnej macierzy S (macierzy transformacji) spełniającej warunek:

A1

T = S A0

T

gdzie:

A0 ,A1 - to wyjściowa i końcowa macierz ładunków,

ROTACJA CZYNNIKÓW

Elementy macierzy transformacji S określają kąty, o jakie należy obrócić układ osi - czynników wspólnych tak, aby:

- zmaksymalizować liczbę ładunków zerowych w każdej kolumnie

macierzy czynników

- zmaksymalizować korelacje między jak najmniejszą liczbą

zmiennych, a każdym wyodrębnionym czynnikiem głównym

ROTACJA CZYNNIKÓW

Innymi słowy - rotacja polega na sprowadzeniu struktury ładunków czynnikowych do prostej struktury, w której punkty reprezentujące zmienne skupiają się wokół osi czynników.

Istotne jest, że wskutek rotacji zasoby zmienności wspólnej hj2

określające udział wszystkich czynników wspólnych w wyjaśnianiu

wariancji zmiennej Xj nie ulegają zmianie.

ROTACJA CZYNNIKÓW

Najczęściej stosuje się procedury rotacji ortogonalnej, z których najbardziej znanymi są varimax i quartimax.

VARIMAX upraszcza interpretację czynników (minimalizuje liczbę

zmiennych potrzebnych do wyjaśnienia danego czynnika)

QUARTIMAX upraszcza interpretację zmiennych (minimalizuje liczbę

czynników potrzebnych do wyjaśnienia danej zmiennej).

WYZNACZENIE WARTOŚCI CZYNNIKÓW

Na koniec najczęściej potrzebny jest sposób wyznaczenia wartości poszczególnych czynników dla kolejnych obserwacji. Obliczanie realizacji czynników wspólnych odbywa się w oparciu o formułę:

F = AT Z

ILE CZYNNIKÓW?

Problemem w stosowaniu analizy czynnikowej jest określenie liczby czynników głównych

Najczęściej spotykane techniki określania liczby czynników

wspólnych to:

a/ metoda "wartości własnej (lambda) większej od jedności"b/ metoda procentu wariancji tłumaczonej przez czynniki głównec/ metoda testu osypiska

ILE CZYNNIKÓW?

a/ metoda "wartości własnej (lambda) większej od jedności"

najczęściej spotykana – jej podstawą jest to, że każdy czynnik

powinien wyjaśniać zmienność co najmniej jednej zmiennej

pierwotnej. Metoda ta powinna być stosowana gdy ilość zmiennych

jest większa od 20. Gdy liczba zmiennych jest mniejsza istnieje

tendencja wyodrębniania zbyt małej ilości czynników.

ILE CZYNNIKÓW?

b/ metoda procentu wariancji tłumaczonej przez czynniki główne

do ogólnej liczby wybranych czynników zalicza się te czynniki, które

w sumie wyjaśniają 75%, 80% lub 90% wariancji, a żaden następny

nie tłumaczy więcej niż 5% wariancji.

ILE CZYNNIKÓW?

c/ metoda testu osypiska

polega na sporządzeniu wykresu, na którym na osi poziomej

wyznaczana jest ilość czynników a na osi pionowej - uzyskane

wartości własne. Podstawowym zadaniem jest znalezienie "punktów

załamania", w których rozpoczynają się kolejne "rumowiska" (w tych

punktach zmienia się kąt załamania krzywej). Punkty te określają

liczbę czynników kwalifikujących się do dalszej analizy. Metoda ta

jest nieco bardziej "liberalna" niż metoda >1, pozwala włączyć do

dalszej analizy nieco większą liczbę czynników.

NAZWY CZYNNIKÓW

Nadawanie nazw nowym zmiennym (czynnikom)

– na bazie ładunków czynnikowych:

należy wyodrębnić zmienne o najwyższych ładunkach czynnikowych

względem danych czynników i poprzez analizę nazw zmiennych

znaleźć wspólne ich odniesienie do danego, głębszego wymiaru

METODA GŁÓWNYCH SKŁADOWYCH

A n al i z a g ó w n y c h sk ad o w y c h ł ł (ang. principal components analysis)

j est m et o d t r an sf o rm ac j i zm i en n y c h p i er w o tn y c h w e w zaj em n i e ą

o r t o g o n a l n e, n o w e zm i en n e, t zw . główne składowe.


Redukcja wymiaru przestrzeni cech, uporządkowanie ich na

podzbiory (główne składowe) jest przydatna głównie ze względu na

możliwość zinterpretowania relacji między składowymi, graficznej

prezentacji konfiguracji porównywanych zmiennych, a wreszcie

uporządkowania tych zmiennych według przyjętych cech.


W analizie głównych składowych rozwiązywany problem można

przedstawić następująco:


Wszystkie zmienne pierwotne są poddane standaryzacji, a to

oznacza, że ich wariancje są równe jedności (koła reprezentujące

zmienne pierwotne mają jednakową średnicę). Nowa zmienna

powinna wyjaśniać maksymalną ilość wariancji zmiennych

pierwotnych (jej wariancja jest przedstawiona na rysunku obszarem

zacieniowanym).

Wariancja tej nowej zmiennej wyjaśniającej pewną ilość zmienność

zmiennych pierwotnych jest nazywana jej wartością własną

(eigenvalue).

PROCEDURA METODY GŁÓWNYCH SKŁADOWYCH

Przedmiot analizy – jak poprzednio:

macierz danych, zawierająca n realizacji m zmiennych:

W wyniku standaryzacji wartości zmiennych uzyskujemy zmienne o wartości oczekiwanej równej zero i jednostkowym odchyleniu standardowym:

[ ]nimj

xxX ijij ,...,2,1,...,2,1

,0,==

≥=

Z=[ zij ]


Zakładamy, że pomiędzy zmiennymi Xj zachodzą związki,

których siłę i kierunek określają współczynniki korelacji liniowej

Pearsona zawarte w macierzy korelacji:

[ ] ( )mjpzzn

ZZn

rR ij

n

iipij ...1,1'1

1==== ∑

=

Przy czym punkt wyjścia stanowi nieprzekształcona macierz

korelacji


Podstawowe równanie metody głównych składowych można zapisać

w postaciw postaci układu równań liniowych:

ZT = AGT

G = AT Zgdzie:

Z - macierz j standaryzowanych zmiennych pierwotnych

A - macierz ładunków czynnikowych składowych głównych

G - macierz składowych głównych


Zatem każdy z wyodrębnionych czynników głównych Gl jest liniową kombinacją obserwowalnych zmiennych Z:

Gl=∑i=1

k

∑j=1

m

a i j Z j

gdzie:m – liczba zmiennych pierwotnychk – liczba składowych głównych (wszystkich skłądowych jest tyle ile zmiennych pierwotnych)

Zj – j-ta zmienna standaryzowana (pierwotna)Gl – l-ta skłądowa głównaajl – ładunki czynnikowe


Rozwiązanie polega, podobnie jak poprzednio, na wyznaczeniu

ładunków ajl, tak aby składowa główna wyjaśniała maksymalną

część wariancji zmiennych pierwotnych.

Każda l-ta główna składowa jest liniowa kombinacją zmiennych

pierwotnych i wyjaśnia i-tą część całkowitej zmienności.


Pierwsza główna składowa G1 jest taką kombinacją dla której

wariancja próbkowa jest największa i wyraża się wzorem:

ijj1i11 1

2G1 S a a = S ∑ ∑

= =

m

i

m

j

i jest największa wśród wszystkich kombinacji liniowych takich, że: a1

Ta1=1(warunek jednoznacznego wyznaczenia wektora współczynników).


Druga główną składową można przedstawić w sposób analogiczny.

Jest ona kombinacja liniową zmiennych pierwotnych

maksymalizującą wariancję przy warunkach:a1

Ta1=1 oraz a1Ta2 = 0

Drugi z nich zapewnia ortogonalność powstałych składowych.

Konsekwencją tego jest sumowanie się kolejnych wariancji głównych

składowych do wariancji całkowitej.


Znaczenie i użyteczność składowej głównej jest mierzona wielkością

wyjaśnianej przez nią całkowitej zmienności. I tak, jeśli w układzie

sześciu zmiennych pierwsza składowa wyjaśnia np. 85% zmienności,

to znaczy to, że prawie cała zmienność tego układu da się

przedstawić na prostej zamiast w sześciu wymiarach.


W efekcie powstaje nam tyle głównych składowych, ile było

początkowo zmiennych (podobnie jak czynników w klasycznej

analizie czynnikowej): nadal mamy układ m-wymiarowy. Ale w

praktyce ograniczamy się do kilku pierwszych głównych

składowych, które wyjaśniają z góry ustaloną część wariancji

całkowitej, np. 75%.

Własności głównych składowych

- są liniową kombinacją obserwowalnych zmiennych

- są ortogonalne względem siebie

- kolejne składowe wyjaśniają malejącą ilość łącznej wariancji zmiennych

- suma wariancji składowych jest równa sumie wariancji zmiennych pierwotnych

PCA / FA

Obie służą sprowadzaniu informacji zawartych w wielu

zmiennych do stosunkowo niewielkiej liczby wyjaśniających

je wymiarów.

Pomimo że w praktyce wyniki uzyskiwane przy pomocy obu z

nich są zbliżone, to nie są to warianty tej samej metody, ale

różne metody oparte na odmiennych założeniach.

PCA / FA

Analiza czynnikowa Analiza głównych składowych

Ch. Spearman (1904), L.L. Thurstone (1913) H. Hotteling (1933)

Obejmuje wariancję całkowitą zmiennych

Główne składowe są zawsze niezależne

Obejmuje pewną część wariancji zmiennych, zwaną wariancją wspólną

orientacja kowariancyjna: punktem wyjścia jest zredukowana macierz korelacji

orientacja wariancyjna: punktem wyjścia jest zwykła macierz korelacji

Zmienna pierwotna jest funkcją czynników wspólnych i swoistych

Główna składowa jest funkcją zmiennych pierwotnych

Celem analizy jest identyfikacja ukrytych zmiennych

Celem analizy jest uproszczenie struktury danych

Czynniki mogą być zarówno niezależne, jak i skorelowane

ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA...

Documents

Transcript of ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA...