predavanje 3 ivan rimac doktorski … f2 f3 test1 ,778 -,231 -,584 1 test2 ,578 ,811 ,089 1 test3...

42
PREDAVANJE 3 IVAN RIMAC DOKTORSKI STUDIJ SOCIJALNOG RADA Mutilvarijatne analize 1

Upload: buiphuc

Post on 21-Mar-2019

216 views

Category:

Documents


2 download

TRANSCRIPT

P R E D A V A N J E 3

I V A N R I M A C

D O K T O R S K I S T U D I J S O C I J A L N O G R A D A

Mutilvarijatne analize1

Faktorska analiza

Generalna statistička procedura za analizu empirijskih podataka. (Rummel)

U osnovi mnoge definicije faktorske analize ističu: Analizu korelacijskih relacija varijabli koje ulaze analizu Determiniranje “latentne strukture” dimenzija koje opisuju

korelacije varijabli Parsimonijsku ulogu faktorske analize koja na osnovi manjeg broja

faktora objašnjava kovarijabilitet izmjerenih varijabli.

Faktorskoj analizi se ponekad pridaju i mistična svojstva, očekujući da će ona razriješiti sve dileme koje nisu razriješene u teorijskom konceptu ili operacionalizaciji mjerenja.

A istina je …

2

Charles Spearman - početna ideja

Na početku 20.st. Charles Spearman analizirajući veći broj testova mentalnih sposobnosti (kasnije nazvanih inteligencija) uočava da svi ti testovi koreliraju u izvjesnoj mjeri, ali ne potpuno.

Ako su svi ti testovi mjerili inteligenciju, zašto ne koreliraju potpuno? Koji test je bolji za mjerenje inteligencije, a koji lošiji?

Umjesto da krene u procjenu koji je test bolji, a koji lošiji na osnovi uvida u mjerne postupke, Spearmankreće nešto drugačijim putem.

3

Charles Spearman – model pravih rezultata

U svojem članku “General Intelligence’ Objectivity Determined and Measured” iz 1904. Spearmanpretpostavlja da se svaki rezultat u testu inteligencije sastoji od dijela koji je determiniran generalnom sposobnošću – faktorom inteligencije i dijela koji je posljedica slučajnih fluktuacija u procesu mjerenja.

X = X∞ + Xe

Prema tom modelu o pravim rezultatima (true scoretheory) korelacije među testovima su determinirane udjelom pravog rezultata X∞ u ukupnom rezultatu, dok komponenta Xe ne može korelirati ni sa čim (osim sa samim sobom) jer je proizvod slučajnih varijacija u procesu mjerenja.

4

Charles Spearman – udio pravog rezultata

Određivanje koliko je udjela u testovnom rezultatu determinirano s X∞ , a koliko s Xe nije moguće samo na osnovi jednog mjerenja jer se jedan mjerni rezultat može arbitrarno razložiti na beskonačno mnogo pribrojnika.

No korištenjem više mjerenja na testovima koji su namijenjeni mjerenju istog fenomena (u ovom slučaju inteligencije) možemo iz kombinacija odnosa među varijablama utvrditi u kojem testu je mjerena sposobnost više, a u kojem manje prisutna.

Testovi koji su imaju više korelacije sa svim drugim testovima imaju duguju to svojstvo većem udjelu faktora inteligencije, a testovi koji u prosjeku niže koreliraju s drugim testovima, imaju manje zastupljen faktor inteligencije u svom rezultatu, a veći udio slučajnog variranja.

5

Charles Spearman – udio pravog rezultata

Spearman je dao i prvo rješenje kako determinirati koliki je udio faktora inteligencije u svakoj od varijabli koje su uključene u analizu.

Preduvjet za analizu je da smo u mogućnosti izračunati korelacije između svih varijabli koje želimo analizirati –što podrazumijeva da smo primijenili sve postupke mjerenja na istim ispitanicima.

Prema početnoj Spearmanovoj ideji, nakon izdvajanja kovarijabiliteta koji je uzrokovan faktorom inteligencije u korelacijskoj matrici bi trebale ostati samo procjene udjela slučajne varijance (error varijance) u dijagonali matrice, dok bi izvandijagonalni elementi trebali iznositi 0,0.

6

Korelacije varijabli

V1 V2 V3 V4

V1 r11 r12 r13 r14

V2 r21 r22 r23 r24

V3 r31 r32 r33 r34

V4 r41 r42 r43 r44

r11 je po definiciji uvijek 1,0 jer u potpunosti koreliraju i pravi rezultat i posebna konstelacija slučajnih rezultata u tom mjerenju.

rxy kombinira različite varijable pa će se u korelacija biti proporcionalna umnošku udjela pravog rezultata u tzv. bruto rezultatu jer će komponente pogreške biti nekorelirane.

7

Udjeli pravog rezultata

V1 V2 V3 V4

V1 h1√h1 * √h2

√h1 * √h3

√h1 * √h4

V2√h2 * √h1

h2√h2 * √h3

√h2 * √h4

V3√h3 * √h1

√h3 * √h2

h3√h3 * √h4

V4√h4 * √h1

√h4 * √h2

√h4 * √h3

h4

Cijelu varijancu prema modelu pravih rezultata možemo iskazati kao:

v = s2 = h2 + e2

Umnožak drugog korijena iz h2 iz dvije različite varijable daje udio podudarne varijance u dvije varijable tj. korelaciju.

r12 = √h12 + √h2

2

8

Rezidualna matrica korelacija

V1 V2 V3 V4

V1 e1 0,0 0,0 0,0

V2 0,0 e2 0,0 0,0

V3 0,0 0,0 e3 0,0

V4 0,0 0,0 0,0 e4

Uklonimo li iz matrice korelacija procijenjene udjele pravog rezultatau dijagonali će ostati

Iz: v = s2 = h2 + e2

e2 = v - h2

Izvan dijagonale ne bi trebalo ostati ništa

Iz : r12 = √h12 * √ h2

2

r12 - √h12 * √ h2

2 = 0,0

To bi prema Spearmanu bio nedvosmislen dokaz da su svi testovi mjerili inteligenciju, ali da su pojedine operacionalizacije dopuštale veću ili manju slučajnu varijaciju koja je prisutna u rezultatu (pogreška mjerenja).

9

Generalni faktor inteligencije?

Spearmanova hipoteza o generalnom faktoru inteligencije nije se pokazala točnom. U rezidualnoj matrici je i u izvandijagonalnim elementima ostajalo još kovarijabilitetanakon što se ukloni dio ovise o generalnom faktoru.

Revizija hipoteze, da bi izvan dijagonale trebale biti neznačajne korelacije – one koje bi mogle po teoriji pogreške uzorka pripadati populaciji u kojoj je korelacija 0,0 , također se nije pokazala točnom.

Pojavila se potreba za teoretskim postuliranjem još nekih izvora varijabiliteta koji su predstavljeni u korelacijskoj matrici. Prema Spearman-u to su grupni faktori koji opisuju sličnosti testova prema postupku mjerenja, ili prema materijalu na kojem se izvode intelektualne operacije i sl.

10

Kako se izračunavaju udjeli u faktorima

Faktori su ustvari varijate u kojima varijable participiraju prema množiteljima kojima smo ili apriorno ili analitički odredili veličine.

Spearman je svoje proračune zasnivao na maksimalnoj korelaciji prema zbroju varijabli, što je početna aproksimacija točno utvrđenih odnosa.

Hotelling je 1933. predložio metodu ekstrakcije faktora kojom je postupak izračunavanja udjela faktora u varijablama izjednačen s matematičkim problemom traženja karakterističnih korijena (eigen-vrijednosti, lambda ) i karakterističnih vektora neke matrice.

11

Hotellingov postupak iscrpljivanja varijance (1)

12

Postupak kreće od arbitrarnog vektora sumacije u1

čijom bi upotrebom kao množitelja matrice korelacija zbrojili koeficijente korelacija po stupcima.

Vektor normaliziramo tako da sve elemente podijelimo s drugim korijenom zbroja kvadrata elemenata vektora a1 .

Hotellingov postupak iscrpljivanja varijance (2)

13

Normaliziranim vektorom množimo matricu korelacija i time dobijamo zbroj po stupcima elemenata matrice i elemenata vektora a1 .

Rezultirajući vektor je vektor u2 s kojim ćemo krenuti u novi ciklus normizacije i množenja matrice korelacija.

Hotellingov postupak iscrpljivanja varijance (3)

14

Kada vektor ai+1 = a1 , tj. kada se vektor ne promijeni došlo je do stabilizacije vrijednosti. Izračunali smo prvi karakteristični vektor matrice korelacija.

Izračunamo li p1 dobit ćemo prvi karakteristični korijen (to je vrijednost pod korijenom kojom normaliziramo vektor u).

Korelacije varijabli i prvog faktora (saturacije varijabli faktorom) izračunamo tako da vrijednosti u karakterističnom vektoru pomnožimo s korijenom iz karakterističnom korijena.

Hotellingov postupak iscrpljivanja varijance (4)

15

Nakon što se iz matrice korelacija izuzme varijabilitet objašnjen prvim faktorom, s preostalim dijelom se kreće u izračun drugog faktora.

Svu varijancu iz korelacijske matrice iscrpit ćemo kad odredimo sve faktore kojih ima koliko i varijabli u matrici R. Tada u rezidualnoj matrici neće niti izvan dijagonale niti u dijagonali ostati ništa drugo nego vrijednosti nula.

Hotellingov postupak zorno ilustrira i kriterij maksimalizacije varijance faktora. Veći zbroj će proizaći iz stupca matrice u kojem su veće korelacije, što će biti dodatno potencirano korištenjem zbrojeva u narednom ciklusu.

Normizacija služi traženju relativnog udjela, jer bi u protivnom vrijednosti u vektoru težile beskonačno velikim brojevima.

Karakteristični korijen – varijanca faktora

Karakteristični korijen predstavlja varijancu faktora, i po definiciji je najveća moguća varijanca za varijatukoja se može formirati iz danog skupa varijabli.

Kako ekstrahiramo nove faktore, njihova varijanca će biti sve manja, jer uvijek izdvajamo faktor najveće varijance iz preostalog varijabiliteta.

Grafički prikaz veličina varijance faktora () na ordinati, a rednog broja faktora u procesu ekstrakcije nazivamo scree plot.

16

Faktorska struktura

F1 f2 f3

V1 f11 f12 f13 v1

V2 f21 f22 f23 v2

V3 f31 f32 f33 v3

vf1 vf2 vf3 Totalv

f1 f2 f3

Test1 ,778 -,231 -,584 1

Test2 ,578 ,811 ,089 1

Test3 ,750 -,385 ,537 1

1,5033 0,8595 0,6373 3

Zbroj kvadriranih f po redovima daje varijancu varijable

Zbroj kvadriranih f po stupcima daje varijancu faktora

Zbroj umnožaka korespodentnih f iz dva reda daje korelaciju te dvije varijable

Zbroj umnožaka korespodentnihumnožaka f iz dva stupca daje korelaciju dva faktora

17

Parsimonijsko rješenje u FA18

Proširena faktorska jednadžba razlaže varijancu varijable na više komponenti koje grupiramo u tri skupine c2 – komunalitet – zajedničku varijancu varijabli razloženu na više nezavisnih faktora, s2 – specificitet - varijancu specifičnu za realizaciju mjerenja u nekoj varijabli i e2 –varijancu pogreške.

v= c2 + s2 + e2

Komponente s2 + e2 nazivaju se unikvitet, i odgovaraju Spearmanovoj ideji o pogrešci mjerenja, samo što je Spearmanov e2 razložen na dio uniknevarijance varijable koja se dosljedno ponavlja od mjerenja do mjerenja (s2) i dio koji se mijenja u ponavljanju mjerenja jer ovisi o slučajnim utjecajima u procesu mjerenja (e2 ).

Broj komponenti svake od skupina ovisi o tipu faktora utvrđenih u analizi i broju faktora koji odgovara broju varijabli u analizi.

Kako su elementi s2 + e2 s teorijskog gledišta nevažni potrebno je utvrditi, koliko se faktora (prvih po redu) odnosi na faktore koji su zajednički većem broju varijabli.

Grafički prikaz faktorske strukture s dva faktora

19

-1.000

-.800

-.600

-.400

-.200

.000

.200

.400

.600

.800

1.000

-1.000 -.800 -.600 -.400 -.200 .000 .200 .400 .600 .800 1.000

Faktor 1

Faktor 2

Test 3

Test 2

Test 1

Određivanje broja faktora koji čine komunalitet

20

Broj faktora koji će biti smatrani komunalitetom nije jasno određen.

Postoje dvije generalne koncepcije za određivanje komunaliteta koje tvore dvije različite tehnike faktorske analize.

Metoda zajedničkih faktora podrazumijeva da ćemo veličinu komunaliteta odrediti prije ekstrakcije faktora, te ćemo u FA objašnjavati samo kovarijabilitet koji je nastao iz komunaliteta.

Metoda glavnih komponenata smatra da je moguće naknadno uvidom u faktorsku strukturu odrediti koji faktori opisuju kovariranje, a koji su unikvitetni jer saturiraju samo jednu varijablu.

Metoda zajedničkih faktora21

Kako su za komunalitet presudne korelacije među različitim varijablama, veličinu komunaliteta procijenit ćemo prije faktorske analize metodom multiple korelacije.

Kriterij će varijabla kojoj procjenjujemo komunalitet, a prediktori sve ostale varijable. Postupak ćemo ponoviti za procjenu svih komunaliteta.

U korelacijskoj matrici će puna varijanca (1,0) biti zamijenjena procjenom komunaliteta.

Tako u analizu ulazi samo komunalitet varijabli i u dijagonali i izvan dijagonale, te unikvitet nije predmet analize.

Zbog redukcije dijagonale broj faktora će biti manji od broja varijabli, a svi faktori koji imaju pozitivne eigen vrijednosti (pozitivno definiranu varijancu) su važni za analizu.

Metoda glavnih komponenata22

U analizu ulazi puna korelacijska matrica s varijancama (1,0) bez prethodne procjene komunaliteta.

Komunalitet je procijenjen “tehnički” na osnovi varijance reproducirane na osnovi faktora zadržanih u analizi.

Umjesto uvida u strukturu faktora, koriste se različiti kriteriji za određivanje broja faktora koje treba zadržati: apriorni (teorijski) – zadržava se broj faktora koji je predviđen teorijom koju

koristimo u interpretaciji faktora; matematički – zadržavaju se faktori čija varijanca je veća od prosjeka (prosjek je

jednak 1) – Guttman-Kaiserov kriterij, statistički – zadržavaju se samo faktori koji su statistički veći sljedećih (Bartlettov

kriterij), grafički - zadržavaju se faktori koji su veći od naglog pada veličine faktora prema

pravcu koji definiraju manje značajni faktori (Cattell), Monte-carlo metode - zadržavaju se faktori čije su veličine veće od faktora koji bi

nastali da provodimo komponentnu analizu slučajno generiranih varijabli, ili prvih m faktora koji se podudara po konfiguraciji u dva ili više slučajnih subuzoraka iz istraživačkog skupa, itd.

Prednosti i nedostaci23

Glavne komponente (+) Simuliraju formiranje varijata zbrajanjem varijabli. (+) Dobra determiniranost ostalih postupaka nakon ekstrakcije faktora, jednostavnija

računska rješenja. (-) Pokazalo se da dio unikviteta prelazi u faktore, tako da metoda precjenjuje saturacije. (-) Velik broj kriterija za zadržavanje faktora bez jasnih prednosti pojedinih kriterija.

Zajednički faktori (-) Složen i ne u svim elementima definiran matematički model. (-) Danas se procjene komunaliteta vrše iterativnim postpcima u kojima se u višekratnim

primjenama FA poboljšavaju procjene komunaliteta. Početna procjena je na osnovi tehničke procjene metodom glavnih komponenata.

(+) Precizna metoda koja u saturacijama ne sadrži unikvitetnu varijancu. (+) Otporna na promjene rješenja u slučaju dodavanja novih varijabli (samo za postupke s

rotacijom).

Zajednički faktori se koriste kada je potrebno u svrhu analize procijeniti točne saturacije faktora u varijablama (teorijska primjena), dok se glavne komponente koriste uglavnom kada se planira koristiti faktore kao sumarne varijable u kasnijim analizama (praktična primjena).

Interpretacija faktora24

Interpretacija faktora sastoji se u imenovanju faktora na osnovi zajedničkih karakteristika varijabli koje su dobro saturirane tim faktorom. Geometrijski gledano to je rezultanta smjerova po principu paralelograma, kao u geometriji sila.

Faktorska struktura uglavnom slijedi logiku da je prvi faktor sumativni pogled na gotovo sve varijable, dok naredni faktori (ortogonalni na prethodni) prave distinkcije među grupama varijabli ističući redom najveće skupine varijabli koje su kontrastirane.

Ovakav bifurkacijski oblik rješenja prisutan je u ranim teorijama inteligencije.

Osnovni problem je što položaj prvog faktora ovisi o skupu varijabli koje su u analizi, i mijenja se dodavanjem novih varijabli. Svi ostali faktori također ovise o položaju prvog faktora.

Navedeni problem otežavaj je komparacije rezultata različitih empirijskih studija te je napravljen pokušaj da se faktorske osi postave u položaj kojim se ciljaju pojedine skupine varijabli. Time se napušta ideja o generalnom faktoru.

Prvi zagovornik takve ideje je L.L. Thurstone koji definira i kriterije jednostavne sturukture kojima bi rotacije trebale težiti.

Grafički prikaz rotacije faktora25

-1.000

-.800

-.600

-.400

-.200

.000

.200

.400

.600

.800

1.000

-1.000 -.800 -.600 -.400 -.200 .000 .200 .400 .600 .800 1.000

Faktor 1

Faktor 2

Test 3

Test 2

Test 1

Rotacija faktorskih osi26

Cilj je rotacije faktorskih osi postići jednostavniju i interpretabilnijustrukturu faktora.

Interpretabilnost se povećava zadovoljenjem kriterija da su varijable saturirane samo jednim faktorom.

Rotacije se vrše tako da se parovima osi (faktora) u svim kombinacijama određuju novi položaji koji su bliži vektorima varijabli. Rotacije se vrše u ciklusima u kojima se u svakom ciklusu rotiraju svi parovi osi, sve dok se ne dođe do stabilnog rješenja.

Rotacije su se radile grafički (geometrijski) od četrdesetih godina 20. st. sve do kraja pedesetih kada počinje intenzivnija primjena računala i kada se definiraju kriteriji za analitičke rotacije.

U osnovi u rotacijama razlikujemo dvije strategije: Ortogonalne rotacije koje zadržavaju kriterij da su faktori bez međusobnih

korelacija. Kosokutne rotacije koje dopuštaju da faktori budu u međusobnim korelacijama

ako to znači bolje pogađanje skupova varijabli.

Ortogonalne analitičke rotacije27

Ortogonalne rotacije pokušavaju postići jednostavnu strukturu bez narušavanja ortogonalnosti faktora (faktori ostaju u nultim međusobnim korelacijama).

Ortogonalno rješenje je poželjno rješenje sa stanovišta parsimonije(nema redundancije u sadržaju faktora), interpretativno je jednostavnije, a pri upotrebi faktorskih bodova lakše.

Matematički gledano, matrica faktorske strukture se transformira tako da se preraspodjeljuju saturacije u redovima uz uvjet zadržavanja iste veličine komunaliteta (suma kvadriranih saturacija).

Rotacija mijenja sume kvadrata po stupcima (varijance faktora), tako da se ne mogu više koristiti kao deskriptor varijance faktora.

Među više predloženih kriterija uglavnom su se iskristalizirale strategije koje daju najbolju simplifikaciju redaka ili stupaca (jedna značajna saturacija, a ostale nulte) ako je ona moguća.

Ortogonalne analitičke rotacije28

Najčešće se upotrebljavaju varimax kriterij (Kaiser) kojim se simplificira faktore. Postupak ujedno ujednačava veličine faktora, tako da je preferiran od većine autora koji ne zagovaraju postojanje generalnog faktora.

Quartimax procedura simplificira varijable (retke) i zbog toga često završava rješenjem u kojem se pojavljuje generalni faktor, tj. rotirana solucija daleko od nerotirane. Stoga je preferirana uglavnom od autora koji su skloni interpretaciji skupa varijabli u terminima generalnog faktora i grupnih faktora.

Equamax procedura pokušava simultano simplificirati i retke i stupce, čineći hibrid između varimax i quartimax procedure.

Saunders je ponudio opći model ortogonalnih rotacija u kojima se upotrebom dva parametra mogu varirati strategije i provoditi varimax, quartimax, equamax, ali i druge manje popularne rotacije.

Kosokutne analitičke rotacije29

Kose rotacije pokušavaju postići jednostavnu strukturu kroz simplifikaciju redaka i stupaca, dopuštajući faktorima da budu međusobno korelirani.

Upotreba neortogonalnih referentnih osi, donekle komplicira interpretaciju jer se razlaganje komunaliteta varijabli usložnjava preklapanjem faktora.

Međusobna korelacija faktora, proizvodi dvije matrice odnosa varijabli i faktora. Matrica faktorske strukture opisuje korelacije varijabli i faktora, dok matrica faktorskog sklopa opisuje množitelje. Pored toga rotacija generira i matricu korelacija među faktorima.

Interpretacija faktora počiva na analogiji s MRA, struktura sadrži korelacije (r), sklop množitelje (ekvivalent β), a varijanca faktora je predstavljena zbrojem umnožaka r*β. No zbog jednostavnosti, u interpretaciji se uglavnom koriste matrice faktorskog sklopa (kao što se u MRA uglavnom koriste samo β).

Iako se naizgled kosokutne rotacije mogu smatrati primjerenijim rješenjem od ortogonalnih, razlike u rješenjima su uglavnom vrlo malene u prvom redu stoga što kosokutne rotacije koriste ograničenja u koreliranosti faktora kako ne bi došlo do kolinearnosti faktora (najčešće negdje oko 0,30).

Kosokutne analitičke rotacije30

I kosokutne rotacije su prošle kroz niz ponuđenih rješenja od kojih su se zadržala najefikasnija.

Direkt oblimin je najčešće korištena izvorna kosokutna procedura, i po strategiji simplifikacije faktora podudara se s varimax pristupom.

Quartimin kriterij ekvivalent je quartimax pristupa.

Orthoblique rotacija (Kaiser) je postupak kojim se ne ograničava korelacije među faktorima jer procedura ne koristi uobičajeni model minimiziranja krospordukata redaka, već se služi ortogonalnim postupcima za postizanje kosog rješenja.

Promax procedura koristi se postupkom kosokutne ciljne rotacije u kojem je kao matrica cilja definirano ortogonalno rješenje (varimax, quartimax) podignuto na neku parnu potenciju. Time se postiže ekstremizacija ciljnog zahtjeva naglašavanjem velikih i postavljanjem na nulu malih saturacija iz ortogonalne rotacije. Niti ova rotacija ne ograničava korelacije među faktorima, a vodi se varimaxom u aproksimaciji cilja rotacije.

Ciljne rotacije31

Ciljne rotacije nastale su iz potrebe sa se rotacija usmjeri prema nekom teorijskom očekivanju ili prije postignutom empirijskom rješenju.

Upotreba analitičkih rotacija u potpunosti je podređena konfiguraciji podataka u konkretnom uzorku, pa komparacija rješenja iz različitih studija bila otežana.

Postupci ciljne rotacije rotiraju empirijsku strukturu prema nekoj unaprijed zadanoj strukturi kako bi se provjerilo koliko su podudarne strukture faktora iz dvije empirijske studije ili koliko se empirijska studija podudara s teorijskim očekivanjima.

Postupci rotacije mogu sadržavati ograničenje ortogonalnostifaktora ili to ograničenje može biti ukinuto i time omogućeno da faktori budu međusobno korelirani.

Ciljne rotacije približavaju, inače potpuno eksploratornu proceduru FA, konfirmatornoj faktorskoj analizi.

Faktorski bodovi32

Martica faktorske strukture sadrži udjele faktora u varijablama iskazane kao korelacije varijable i faktora. Kao nam je poznata matrica korelacija među varijablama i korelacije varijabli s faktorima moguće je proračunati množitelje za izračun vrijednosti faktorskih bodova.

Postupak je matematički određen za model glavnih komponenata.

U modelu zajedničkih faktora, zbog izuzimanja unikvitetne varijance iz analize, nije moguće točno proračunati faktorske bodove već se koristimo regresijskim postupkom koji daje najpribližniju procjenu faktorskih bodova. U tom modelu varijable su prediktori, a faktori kriterij (kako imamo korelacije prediktora s kriterijem, ne smeta što nemamo rezultate u kriterijskoj varijabli).

Zbog aproksimativnosti postupka računanja faktorskih bodova u modelu zajedničkih faktora, procjene faktorskih bodova mogu biti u korelaciji. Bartlett i Anderson & Rubin ponudili su postupke kojima se takve procjene naknadno ortogonaliziraju.

Preduvjeti za računanje FA

Kako i svaka druga analiza faktorska analiza ima neke preduvjete za koje smatramo da su ispunjeni:

Sve varijable moraju biti intervalne po mjernoj skali i normalno distribuirane.

Normalnost distribucije smatra se dostatnim uvjetom pretpostavke o linearnoj povezanosti.

U analizi koristimo koeficijente linearne povezanosti produkt-moment tipa – Pearsonov koeficijent korelacije.

33

Posebni slučajevi – gramianska svojstva34

Matrica korelacija može biti nepodobna za faktorsku analizi.

Matrice korelacije nastale iz nezavisnih mjerenja uglavnom imaju tzv. gramianska svojstva koja su preduvjet za matematičko razrješenje karakterističnih korijena i karakterističnih vektora.

Matrice koje nisu nastale koreliranjem mjerenih varijabli mogu biti bez tih svojstava.

Matrica bez gramianskih svojstava po svojim informacijama daje kontradiktorne podatke o varijablama čije odnose predstavlja.

Posebni slučajevi – kolinearnost varijabli35

U slučaju sa se u matrici korelacija nalazi makar jedna varijabla čiji se rezultati mogu u potpunosti reproducirati iz preostalih varijabli (R=1), k0relacijska matrica je singularna (nema inverza) i nije pogodna za faktorsku analizu.

Takvu varijablu treba ukloniti iz sustava varijabli za analizu. Kolinearnost prepoznajemo po tome što je determinanta matrice

korelacija jednaka 0,0, a tada je i posljednji karakteristični korijen jednak 0,0.

Veći broj karakterističnih korijena s vrijednošću 0,0 ukazuje na više kolinearnih varijabli.

Procedure za uklanjanje varijable koja uzrokuje kolinearnostuglavnom nisu dio statističkih softwarea, stoga je istraživač u situaciji da pokuša zaključiti koja je varijabla izazvala kolinearnost.

Geometrijska interpretacija kolinearnosti zasniva se na ideji da varijable opisuju manje koordinatnih dimenzija nego što je dimenzija matrice korelacija.

Determinanta matrice korelacija36

Determinanta matrice korelacija se može interpretirati kao umnožak devijacija od ishodišta koordinatnog sustava po svim koordinatama.

Time nam determinanta pokazuje kolika je dimenzionalnost sustava koji analiziramo. Kako u metodi glavnih komponenata po definiciji očekujemo dimenzionalnost (rang) jednaku broju varijabli determinanta ukazuje na manju dimenzionalnost ako je jednaka 0,0.

Determinanta se koristi i kod statističkih testova podobnosti matrice korelacija za faktorsku analizu. Bartlett je 1950. predložio test kojim se testira ima li u matrica dovoljno korelacija da bi mogla biti podvrgnuta faktorskoj analizi.

Rezime

Faktorska analiza omogućila je razlaganje i analizu varijabilitetavarijabli te omogućila empirijsku provjeru valjanosti mjerenja.

Postupci faktorske analize bili su poticaj za učestalije korištenje metode višestrukih operacionalizacija u empirijskim provjerama, te analizu uloge mjerenja u definiranju valjanosti.

Kroz razlaganje komunaliteta i unikviteta, FA je omogućila procjenu pouzdanosti mjerenja bez korištenja modela višestrukih ponavljanja mjerenja.

No raznovrsnost varijanti, te eksporatorni karakter metode nije omogućio konvergenciju spoznaje prema parsimoniji.

Pored toga nedovoljno istražen odnos prema uzorkovanju (gotovo da nema statističkih testova) te odstupanju od pretpostavki doveli su do velikih varijacija u ishodima empirijskih testova.

37

Sugestije za razmišljanje – zadatak 1

Napravite analizu istog skupa varijabli metodom glavnih komponenata i metodom zajedničkih faktora. Rotirajte faktorsku strukturu varimaxrotacijom.

Usporedite rezultate dva postupka i odredite razlike. Razlikuju li se dvije analize u brojčanim ishodima? Koliko je različita interpretacija dvije analize.

38

Sugestije za razmišljanje – zadatak 2

U obje metode iz prethodnog zadatka izračunajte faktorske bodove.

Izračunajte korelacije među faktorskim bodovima za svaki od modela faktorske analize.

Formirajte onoliko zbrojeva varijabli koliko je faktora. Zbrojeve formirajte kao jednostavne zbrojeve z-vrijednosti varijabli tako da u zbrojeve dodajete one varijable koje su imale visoke saturacije nekim faktorom, a izostavljate iz zbroja one koje su imale niske saturacije.

Kolike su korelacije faktorskih bodova s jednostavnim zbrojevima koji ne vode računa o nijansiranju udjela na osnovi razlikovanja veličine saturacija?

39

Sugestije za razmišljanje – zadatak 3

Usporedite faktorsku strukturu skupa varijabli iz kojeg je izbačena jedna varijabla sa faktorskom strukturom skupa varijabli sa zadržanom varijablom.

Usporedite faktorsku strukturu za nerotiranu i rotiranu soluciju, posebno za metodu glavnih komponenata, a posebno za metodu zajedničkih faktora.

Koja metoda je pokazuje manje kolebanje.

40

Sugestije za razmišljanje – zadatak 4

Na izabrani skup varijabli dodajte još jednu varijablu koja je nastala zbrajanjem dvije varijable koje su već u skupu.

Usporedite pokazatelje podobnosti matrice korelacija za faktorsku analizu, sa i bez zbrojene varijable.

41

Reference

R.J. Rummel (1970) Applied Factor Analysis. Evanston: Northwestern University Press.

A. Fulgosi (1988) Faktorska analiza. Zagreb: Školska knjiga.

42