FactoranalyseFactoranalyse is een multivariate statistische techniek die voor een groot aantal geobserveerde variabelen een kleiner aantal achterliggende variabelen identificeert. Deze niet geobserveerde, achterliggende variabelen worden factoren genoemd. Belangrijk is dat de factoren bijna evenveel van de variatie verklaren als de geobserveerde variabelen. Factoranalyse wordt gebruikt voor datareductie en om inzicht te krijgen in de structuur van de dataset. Een goede factoroplossing bepaalt een relatief klein aantal factoren die samen een groot deel van de variantie die in de oorspronkelijke variabelen aanwezig is, verklaren. Matrixalgebra is een essentieel onderdeel van factoranalyse. De factoroplossing wordt verkregen door manipulatie van de correlatiematrix. VoorbeeldEen zeer vereenvoudigd voorbeeld verduidelijkt een en ander. Stel dat een groep proefpersonen van een vragenlijst twee vragen, A en B, beantwoordt. Uit analyse blijkt dat er een verband is tussen A en B. Dan kan dit komen door de invloed van A op B, door de invloed van B op A, of doordat er nog een andere onbekende variabele C in het spel is. Met factoranalyse kan de onbekende variabele C opgespoord worden. Duidelijk is te zien dat de beide variabelen A en B gecorreleerd zijn. De lijn die goed bij de puntenwolk past geeft deze samenhang tussen A en B weer. De grootste variatie vindt plaats langs de lijn, de kleinste loodrecht daarop. De lijn stelt een nieuwe variabele, in dit geval factor genaamd, voor, die de plaats van A en B kan innemen. Een lage score op die variabele komt overeen met een lage score op zowel A als B en een hoge score met een hoge score op A en B. Het doel van factoranalyse is in dit geval het bepalen van deze lijn en daarmee de onbekende factor. Als voorbeeld nemen we een proef waarbij van een aantal personen de lengte van de armen en de lengte van de benen worden gemeten. Deze blijken goed gecorreleerd te zijn. De onbekende factor zou hier de grootte van de persoon kunnen zijn. DoelHet vinden van een of meer achterliggende (mogelijk hypothetische) variabelen is het doel van factoranalyse. In theorie kan het aantal factoren uiteenlopen van een tot het aantal oorspronkelijke variabelen. Als vuistregel geldt vaak dat een derde tot een vijfde van het aantal oorspronkelijke variabelen een nuttige factoroplossing kan betekenen. Bij het uitvoeren van een factoranalyse wordt op elk moment in het proces veel eigen interpretatie van de uitvoerder gevraagd. Twee verschillende personen kunnen daardoor met exact dezelfde dataset tot andere conclusies komen. Waar de ene persoon drie factoren meent te onderscheiden, kan een ander van mening zijn dat het in werkelijkheid om vijf factoren gaat. Om deze reden heeft factoranalyse in een aantal wetenschappelijke disciplines aan belang ingeboet. Factoranalyse lijkt erg op hoofdcomponentenanalyse. Wat in factoranalyse factoren genoemd wordt, wordt in hoofdcomponentenanalyse componenten genoemd. Het verschil tussen beide analysetechnieken is dat bij factoranalyse alleen naar de gemeenschappelijke variantie in de oorspronkelijke variabelen wordt gekeken, terwijl hoofdcomponentenanalyse ook naar de unieke variantie kijkt. In de meeste gevallen zijn de verschillen tussen beide methoden niet erg groot. Mochten er wel verschillen zijn, dan komt dit dus door de unieke variantie binnen (sommige van) de geobserveerde variabelen. Een derde analysetechniek die zoekt naar achterliggende variabelen is de correspondentieanalyse, waarbij niet a priori wordt uitgegaan van lineaire verbanden.
ModelHet factoranalysemodel stelt dat de waargenomen variabelen , op een onverklaarbaar deel, de uniciteit , na, uitgedrukt kunnen worden als lineaire combinaties van een geringer aantal variabelen, de factoren . Daarin is de vector van de variabelen, de vector met verwachtingswaarden van de variabelen, de vector met de factoren, de matrix met coëfficiënten, factorladingen genoemd, en de vector van uniciteiten. De factoren worden verondersteld gestandaardiseerd te zijn en onderling ongecorreleerd. De uniciteiten worden verondersteld verwachting 0 te hebben en ongecorreleerd te zijn met de factoren. Voor de covariantiematrix van de variabelen volgt dan: waarin de covariantiematrix van de uniciteiten is. Het is de opgave van factoranalyse de dimensie en de factorladingen zo te bepalen dat de bijdrage aan de variantie door de uniciteiten klein blijft. Het deel van de variantie van een variabele dat voor rekening van de factoren komt, heet communaliteit ; het wordt gevormd door de som van de kwadraten van de betrokken factorladingen: Een gebruikelijke analyse is de hoofdcomponenten van te bepalen, en daarvan de belangrijkste als factoren te benoemen. |