ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA...

47
ANALIZA CZYNNIKOWA ... stanowi zespół metod i procedur statystycznych pozwalających na badanie wzajemnych relacji między dużą liczbą zmiennych i wykrywanie ukrytych uwarunkowań, ktore wyjaśniają ich występowanie. Pozwala na sprowadzenie dużej liczby badanych zmiennych do znacznie mniejszej liczby wzajemnie niezależnych (nieskorelowanych) czynników. Wyodrębnione czynniki mają inną interpretację merytoryczną jednocześnie zachowując znaczną część informacji zawartych w zmiennych pierwotnych.

Transcript of ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA...

Page 1: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

ANALIZA CZYNNIKOWA

... stanowi zespół metod i procedur statystycznych pozwalających na badanie wzajemnych relacji między dużą liczbą zmiennych i wykrywanie ukrytych uwarunkowań, ktore wyjaśniają ich występowanie.

Pozwala na sprowadzenie dużej liczby badanych zmiennych do znacznie

mniejszej liczby wzajemnie niezależnych (nieskorelowanych) czynników.

Wyodrębnione czynniki mają inną interpretację merytoryczną jednocześnie

zachowując znaczną część informacji zawartych w zmiennych pierwotnych.

Page 2: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

ANALIZA CZYNNIKOWA

Przykład 1.

Ocena nowej czekolady za pomocą zestawu 20 pytań, w których

badani oceniali wiele jej różnych cech (smak, zapach, konsystencja,

kolor, kształt, opakowanie itp.)

Wykorzystując analizę czynnikową można sprawdzić, czy możliwe

jest wyodrębnienie kilku ogólnych, ukrytych czynników,

warunkujących stosunek respondentów do nowego produktu (np.

wymiary "łącznej oceny smaku i zapachu" czy wyglądu).

Page 3: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

ANALIZA CZYNNIKOWA

Przykład 2.

kwestionariusz dotyczący satysfakcji klientów danej firmy

zwykle zawiera wiele pytań dotyczących różnych aspektów działania

firmy – analizowanie każdego pytania osobno pozwala uzyskać wiele

szczegółowych informacji

Zastosowanie analizy czynnikowej pozwala zaś na uzyskanie

ogólnego, syntetycznego obrazu powodów wpływających na

satysfakcję klientów / identyfikujących generalne nastawienie

klientów.

Page 4: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

CELE ANALIZY CZYNNIKOWEJ

Redukcja liczby zmiennych bez istotnej straty zawartych w nich informacji Transformacja układu zmiennych w jakościowo nowy układ

czynników głównych Tworzenie skal i miar złożonych z kilku pytań Ustalanie wag określających znaczenie, jakie należy przypisać

poszczególnym zmiennym i czynnikom w trakcie analiz Ortogonalizacja przestrzeni, w której rozpatrywane są obiekty,

będące przedmiotem badań

Page 5: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

CELE ANALIZY CZYNNIKOWEJ

Wykrywanie ukrytych związków między zmiennymi – formułowanie i weryfikacja hipotez dotyczących istnienia i charakteru prawidłowości kształtujących związki między zjawiskami Opis zjawisk w kontekście nowych kategorii zdefiniowanych przez

czynniki Prezentacja graficzna zbioru obserwacji wielowymiarowych

Page 6: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

CELE ANALIZY CZYNNIKOWEJ

Kiedy stosować? cel eksploracyjny – rozpoznanie struktury zbioru danych

gdy nie dysponujemy potencjalnym modelem „głębokiej” struktury

czynników wyjaśniających związki między danymi

dla zastosowania wykrytych czynników w dalszych analizach

wielowymiarowych

dla jednoznacznego wyliczenia wartości skal reprezentujących

wymiary mierzone przez zestaw zmiennych

Page 7: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

OGÓLNY PODZIAŁ METOD ANALIZY CZYNNIKOWEJ

A. Model "klasyczny" analizy czynnikowej (podział wariancji całkowitej zmiennych na dwie części: wariancję wspólną i wariancję specyficzną) klasyczna analiza czynnikowa analiza kanoniczna

B. Model "komponentowy" analizy czynnikowej (nieuwzględnianie

struktury wariancji) metoda głównych składowych analiza współzależności

Page 8: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

PROCEDURA ANALIZY CZYNNIKOWEJ

Kroki:

1. wyodrębnienie czynników

2. rotacja czynników w celu łatwiejszej interpretacji

Analiza czynnikowa to metoda modelowania liniowego

Wymaga danych mierzonych na skali interwałowej, ale mogą być

też skale Likerta (min. 5-cio punktowe)

Bazuje na korelacji i kowariancji między zmiennymi.

Page 9: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

PROCEDURA ANALIZY CZYNNIKOWEJ

Przedmiot analizy: macierz danych, zawierająca n realizacji m zmiennych:

W wyniku standaryzacji wartości zmiennych uzyskujemy zmienne o wartości oczekiwanej równej zero i jednostkowym odchyleniu standardowym:

[ ]nimj

xxX ijij ,...,2,1,...,2,1

,0,==

≥=

Z=[ zij ]

Page 10: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

PROCEDURA ANALIZY CZYNNIKOWEJ

Zakładamy, że pomiędzy zmiennymi Xj zachodzą związki, których siłę i kierunek określają współczynniki korelacji liniowej Pearsona zawarte w macierzy korelacji:

[ ] ( )mjpzzn

ZZn

rR ij

n

iipij ...1,1'1

1==== ∑

=

Page 11: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

PROCEDURA ANALIZY CZYNNIKOWEJ

W analizie czynnikowej przyjmuje się, że źródłem wzajemnych zależności między zmiennymi są ukryte wspólne czynniki, które można uznać za nośniki tej samej informacji.

Możliwe jest zatem ich wyodrębnienie i zastąpienie nowymi,

syntetycznymi zmiennymi.

Ale zakładamy też, że nie cała wariancja zmiennych jest

powodowana tymi ukrytymi czynnikami – każda zmienna pierwotna

charakteryzuje się też pewnymi specyficznymi właściwościami.

Page 12: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

PROCEDURA ANALIZY CZYNNIKOWEJ

Podstawą identyfikacji składników wspólnych i specyficznych jest w analizie czynnikowej podział wariancji poszczególnych zmiennych na wariancję wspólną i specyficzną:

h j2 - zasób zmienności wspólnej - część wariancji objaśniona

przez czynniki wspólne

- zasób zmienności swoistej - pozostałość po odjęciu zasobu zmienności wspólnej od wariancji całkowitejw j

2

Page 13: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

PROCEDURA ANALIZY CZYNNIKOWEJ

Dalsze założenia:

- czynniki wspólne nie są skorelowane ze sobą

- czynniki specyficzne również nie są ze sobą skorelowane

- czynniki wspólne nie są skorelowane z czynnikami

specyficznymi

- czynniki wspólne są zestandaryzowane,

E(Fj)=0 i Var(Fj)=1

Page 14: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

PROCEDURA ANALIZY CZYNNIKOWEJ

Model analizy czynnikowej można zapisać w postaciw postaci układu równań liniowych:

Z = AF + BUgdzie:

Z - macierz j standaryzowanych zmiennych pierwotnych

A - macierz ładunków czynnikowych czynników wspólnych

F - macierz czynników wspólnych

B - macierz ładunków czynnikowych czynników specyficznych

U - macierz czynników specyficznych

Page 15: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

PROCEDURA ANALIZY CZYNNIKOWEJ

Zatem każda z obserwowalnych zmiennych Z jest funkcją liniową zmiennych nieobserwowalnych (czynników wspólnych) oraz pojedynczej zmiennej specyficznej:

Z j=∑l=1

k

a jl F lb jU j

gdzie:m - liczba zmiennych pierwotnychk - liczba czynników głównych (wspólnych)Zj - j-ta zmienna standaryzowana (pierwotna)Fl - l-ty czynnik wspólnyUj - j-ty czynnik swoistyajl – ładunek czynnikowy l-tego czynnika Fl w j-tej zmiennej obserwowalnej

Page 16: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

PROCEDURA ANALIZY CZYNNIKOWEJ

W celu wyznaczenia współczynników modelu – ładunków czynnikowych – w kolejnym kroku zastępuje się w macierzy R elementy głównej przekątnej zasobami zmienności wspólnej (usuwamy z równania składnik reprezentujący wariancję specyficzną)

~ ~~Rr r dla i jr h dla i j

ij ij

ij j=

= ≠= =

2

i otrzymujemy tzw. zredukowaną macierz korelacji R

Page 17: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

PROCEDURA ANALIZY CZYNNIKOWEJ

hj2 ustala się na poziomie:

średniej arytmetycznej najwyższego co do modułu współczynnika korelacji j-tej zmiennej

z pozostałymi hj2 = max [|rij |], i <> j

korelacji przeciętnej hj2 = 1

1 1mrij

i

k

− =∑

Page 18: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

PROCEDURA ANALIZY CZYNNIKOWEJ

Zatem podstawowe zadanie analizy czynnikowej sprowadza się do rozwiązania równania:

ze względu na macierz A, czyli wyznaczenia ładunków czynnikowych składników wspólnych.

TAAR =~

Page 19: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

PROCEDURA ANALIZY CZYNNIKOWEJ

Uporządkowane malejąco wartości własne macierzy ~R

oraz odpowiadające im wektory własne V:

posłużą do wyznaczenia ładunków czynnikowych l-tego czynnika w zmiennych pierwotnych:

∑=

= m

jjl

jljl

v

va

1

2/121

][λ

][ jll vV = )...1( mj =

1...m)(l ][ == lλλ

Page 20: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

PROCEDURA ANALIZY CZYNNIKOWEJ

Kolejne wartości i wektory własne posłużą do uzyskania ładunków czynnikowych kolejnych czynników.

Ładunki te odzwierciedlają korelację pomiędzy j-tą zmienną

pierwotną i l-tym wspólnym czynnikiem.

Znalezienie tego rozwiązania kończy właściwą analizę czynnikową.

Page 21: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

ROTACJA CZYNNIKÓW

Uzyskana macierz ładunków czynnikowych A nie jest jednym możliwym rozwiązaniem analizy czynnikowej.

Poprzez obrót układu wzajemnie ortogonalnych osi - czynników

głównych - można wygenerować nieskończenie wiele różnych

macierzy ładunków.

Dokonanie takiej rotacji pozwala często na takie ustalenie osi, aby

odpowiadająca mu macierz ładunków zapewniła możliwie

najłatwiejszą interpretację czynników.

Page 22: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

ROTACJA CZYNNIKÓW

Rotacja polega na znalezieniu ortogonalnej macierzy S (macierzy transformacji) spełniającej warunek:

A1

T = S A0

T

gdzie:

A0 ,A1 - to wyjściowa i końcowa macierz ładunków,

Page 23: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

ROTACJA CZYNNIKÓW

Elementy macierzy transformacji S określają kąty, o jakie należy obrócić układ osi - czynników wspólnych tak, aby:

- zmaksymalizować liczbę ładunków zerowych w każdej kolumnie

macierzy czynników

- zmaksymalizować korelacje między jak najmniejszą liczbą

zmiennych, a każdym wyodrębnionym czynnikiem głównym

Page 24: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

ROTACJA CZYNNIKÓW

Innymi słowy - rotacja polega na sprowadzeniu struktury ładunków czynnikowych do prostej struktury, w której punkty reprezentujące zmienne skupiają się wokół osi czynników.

Istotne jest, że wskutek rotacji zasoby zmienności wspólnej hj2

określające udział wszystkich czynników wspólnych w wyjaśnianiu

wariancji zmiennej Xj nie ulegają zmianie.

Page 25: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

ROTACJA CZYNNIKÓW

Najczęściej stosuje się procedury rotacji ortogonalnej, z których najbardziej znanymi są varimax i quartimax.

VARIMAX upraszcza interpretację czynników (minimalizuje liczbę

zmiennych potrzebnych do wyjaśnienia danego czynnika)

QUARTIMAX upraszcza interpretację zmiennych (minimalizuje liczbę

czynników potrzebnych do wyjaśnienia danej zmiennej).

Page 26: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

WYZNACZENIE WARTOŚCI CZYNNIKÓW

Na koniec najczęściej potrzebny jest sposób wyznaczenia wartości poszczególnych czynników dla kolejnych obserwacji. Obliczanie realizacji czynników wspólnych odbywa się w oparciu o formułę:

F = AT Z

Page 27: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

ILE CZYNNIKÓW?

Problemem w stosowaniu analizy czynnikowej jest określenie liczby czynników głównych

Najczęściej spotykane techniki określania liczby czynników

wspólnych to:

a/ metoda "wartości własnej (lambda) większej od jedności"b/ metoda procentu wariancji tłumaczonej przez czynniki głównec/ metoda testu osypiska

Page 28: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

ILE CZYNNIKÓW?

a/ metoda "wartości własnej (lambda) większej od jedności"

najczęściej spotykana – jej podstawą jest to, że każdy czynnik

powinien wyjaśniać zmienność co najmniej jednej zmiennej

pierwotnej. Metoda ta powinna być stosowana gdy ilość zmiennych

jest większa od 20. Gdy liczba zmiennych jest mniejsza istnieje

tendencja wyodrębniania zbyt małej ilości czynników.

Page 29: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

ILE CZYNNIKÓW?

b/ metoda procentu wariancji tłumaczonej przez czynniki główne

do ogólnej liczby wybranych czynników zalicza się te czynniki, które

w sumie wyjaśniają 75%, 80% lub 90% wariancji, a żaden następny

nie tłumaczy więcej niż 5% wariancji.

Page 30: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

ILE CZYNNIKÓW?

c/ metoda testu osypiska

polega na sporządzeniu wykresu, na którym na osi poziomej

wyznaczana jest ilość czynników a na osi pionowej - uzyskane

wartości własne. Podstawowym zadaniem jest znalezienie "punktów

załamania", w których rozpoczynają się kolejne "rumowiska" (w tych

punktach zmienia się kąt załamania krzywej). Punkty te określają

liczbę czynników kwalifikujących się do dalszej analizy. Metoda ta

jest nieco bardziej "liberalna" niż metoda >1, pozwala włączyć do

dalszej analizy nieco większą liczbę czynników.

Page 31: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

NAZWY CZYNNIKÓW

Nadawanie nazw nowym zmiennym (czynnikom)

– na bazie ładunków czynnikowych:

należy wyodrębnić zmienne o najwyższych ładunkach czynnikowych

względem danych czynników i poprzez analizę nazw zmiennych

znaleźć wspólne ich odniesienie do danego, głębszego wymiaru

Page 32: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

METODA GŁÓWNYCH SKŁADOWYCH

A n al i z a g ó w n y c h sk ad o w y c h ł ł (ang. principal components analysis)

j est m et o d t r an sf o rm ac j i zm i en n y c h p i er w o tn y c h w e w zaj em n i e ą

o r t o g o n a l n e, n o w e zm i en n e, t zw . główne składowe.

Page 33: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

METODA GŁÓWNYCH SKŁADOWYCH

Redukcja wymiaru przestrzeni cech, uporządkowanie ich na

podzbiory (główne składowe) jest przydatna głównie ze względu na

możliwość zinterpretowania relacji między składowymi, graficznej

prezentacji konfiguracji porównywanych zmiennych, a wreszcie

uporządkowania tych zmiennych według przyjętych cech.

Page 34: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

METODA GŁÓWNYCH SKŁADOWYCH

W analizie głównych składowych rozwiązywany problem można

przedstawić następująco:

Page 35: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

METODA GŁÓWNYCH SKŁADOWYCH

Wszystkie zmienne pierwotne są poddane standaryzacji, a to

oznacza, że ich wariancje są równe jedności (koła reprezentujące

zmienne pierwotne mają jednakową średnicę). Nowa zmienna

powinna wyjaśniać maksymalną ilość wariancji zmiennych

pierwotnych (jej wariancja jest przedstawiona na rysunku obszarem

zacieniowanym).

Wariancja tej nowej zmiennej wyjaśniającej pewną ilość zmienność

zmiennych pierwotnych jest nazywana jej wartością własną

(eigenvalue).

Page 36: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

PROCEDURA METODY GŁÓWNYCH SKŁADOWYCH

Przedmiot analizy – jak poprzednio:

macierz danych, zawierająca n realizacji m zmiennych:

W wyniku standaryzacji wartości zmiennych uzyskujemy zmienne o wartości oczekiwanej równej zero i jednostkowym odchyleniu standardowym:

[ ]nimj

xxX ijij ,...,2,1,...,2,1

,0,==

≥=

Z=[ zij ]

Page 37: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

PROCEDURA METODY GŁÓWNYCH SKŁADOWYCH

Zakładamy, że pomiędzy zmiennymi Xj zachodzą związki,

których siłę i kierunek określają współczynniki korelacji liniowej

Pearsona zawarte w macierzy korelacji:

[ ] ( )mjpzzn

ZZn

rR ij

n

iipij ...1,1'1

1==== ∑

=

Przy czym punkt wyjścia stanowi nieprzekształcona macierz

korelacji

Page 38: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

PROCEDURA METODY GŁÓWNYCH SKŁADOWYCH

Podstawowe równanie metody głównych składowych można zapisać

w postaciw postaci układu równań liniowych:

ZT = AGT

G = AT Zgdzie:

Z - macierz j standaryzowanych zmiennych pierwotnych

A - macierz ładunków czynnikowych składowych głównych

G - macierz składowych głównych

Page 39: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

PROCEDURA METODY GŁÓWNYCH SKŁADOWYCH

Zatem każdy z wyodrębnionych czynników głównych Gl jest liniową kombinacją obserwowalnych zmiennych Z:

Gl=∑i=1

k

∑j=1

m

a i j Z j

gdzie:m – liczba zmiennych pierwotnychk – liczba składowych głównych (wszystkich skłądowych jest tyle ile zmiennych pierwotnych)

Zj – j-ta zmienna standaryzowana (pierwotna)Gl – l-ta skłądowa głównaajl – ładunki czynnikowe

Page 40: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

PROCEDURA METODY GŁÓWNYCH SKŁADOWYCH

Rozwiązanie polega, podobnie jak poprzednio, na wyznaczeniu

ładunków ajl, tak aby składowa główna wyjaśniała maksymalną

część wariancji zmiennych pierwotnych.

Każda l-ta główna składowa jest liniowa kombinacją zmiennych

pierwotnych i wyjaśnia i-tą część całkowitej zmienności.

Page 41: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

METODA GŁÓWNYCH SKŁADOWYCH

Pierwsza główna składowa G1 jest taką kombinacją dla której

wariancja próbkowa jest największa i wyraża się wzorem:

ijj1i11 1

2G1 S a a = S ∑ ∑

= =

m

i

m

j

i jest największa wśród wszystkich kombinacji liniowych takich, że: a1

Ta1=1(warunek jednoznacznego wyznaczenia wektora współczynników).

Page 42: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

METODA GŁÓWNYCH SKŁADOWYCH

Druga główną składową można przedstawić w sposób analogiczny.

Jest ona kombinacja liniową zmiennych pierwotnych

maksymalizującą wariancję przy warunkach:a1

Ta1=1 oraz a1Ta2 = 0

Drugi z nich zapewnia ortogonalność powstałych składowych.

Konsekwencją tego jest sumowanie się kolejnych wariancji głównych

składowych do wariancji całkowitej.

Page 43: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

METODA GŁÓWNYCH SKŁADOWYCH

Znaczenie i użyteczność składowej głównej jest mierzona wielkością

wyjaśnianej przez nią całkowitej zmienności. I tak, jeśli w układzie

sześciu zmiennych pierwsza składowa wyjaśnia np. 85% zmienności,

to znaczy to, że prawie cała zmienność tego układu da się

przedstawić na prostej zamiast w sześciu wymiarach.

Page 44: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

METODA GŁÓWNYCH SKŁADOWYCH

W efekcie powstaje nam tyle głównych składowych, ile było

początkowo zmiennych (podobnie jak czynników w klasycznej

analizie czynnikowej): nadal mamy układ m-wymiarowy. Ale w

praktyce ograniczamy się do kilku pierwszych głównych

składowych, które wyjaśniają z góry ustaloną część wariancji

całkowitej, np. 75%.

Page 45: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

Własności głównych składowych

- są liniową kombinacją obserwowalnych zmiennych

- są ortogonalne względem siebie

- kolejne składowe wyjaśniają malejącą ilość łącznej wariancji zmiennych

- suma wariancji składowych jest równa sumie wariancji zmiennych pierwotnych

Page 46: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

PCA / FA

Obie służą sprowadzaniu informacji zawartych w wielu

zmiennych do stosunkowo niewielkiej liczby wyjaśniających

je wymiarów.

Pomimo że w praktyce wyniki uzyskiwane przy pomocy obu z

nich są zbliżone, to nie są to warianty tej samej metody, ale

różne metody oparte na odmiennych założeniach.

Page 47: ANALIZA CZYNNIKOWAcoin.wne.uw.edu.pl/jcieciel/FA_PCA_prezentacja_OK_calosc.pdfANALIZA CZYNNIKOWA Przykład 1. Ocena nowej czekolady za pomocą zestawu 20 pytań, w których badani

PCA / FA

Analiza czynnikowa Analiza głównych składowych

Ch. Spearman (1904), L.L. Thurstone (1913) H. Hotteling (1933)

Obejmuje wariancję całkowitą zmiennych

Główne składowe są zawsze niezależne

Obejmuje pewną część wariancji zmiennych, zwaną wariancją wspólną

orientacja kowariancyjna: punktem wyjścia jest zredukowana macierz korelacji

orientacja wariancyjna: punktem wyjścia jest zwykła macierz korelacji

Zmienna pierwotna jest funkcją czynników wspólnych i swoistych

Główna składowa jest funkcją zmiennych pierwotnych

Celem analizy jest identyfikacja ukrytych zmiennych

Celem analizy jest uproszczenie struktury danych

Czynniki mogą być zarówno niezależne, jak i skorelowane