Post on 05-Sep-2015
description
ANLISE DE COMPONENTES PRINCIPAIS 2014
ANLISE DE COMPONENTES PRINCIPAIS
I S C T E - I U L H e l e n a C a r v a l h o ,
2 0 1 4
Apresentao dos principais
conceitos; Interpretao de um
exemplo e como reportar os
resultados de uma ACP
ANLISE DE COMPONENTES PRINCIPAIS 2014
Helena Carvalho, ISCTE-IUL 2014 Pgina | 1
ANLISE DE COMPONENTES PRINCIPAIS 2014
Helena Carvalho, ISCTE-IUL 2014 Pgina | 2
A ANLISE FACTORIAL engloba um conjunto de mtodos de anlise quantitativa e
multivariada, os quais permitem identificar a estrutura que subjaz matriz dos dados,
tendo por base a anlise das inter-relaes entre as mltiplas variveis. O objectivo
definir um conjunto de dimenses comuns os e que esto inerentes (i.e. FACTORES
latentes) matriz dos dados.
Com a Anlise Factorial possvel identificar as diferentes dimenses da estrutura e
ainda, determinar em quanto cada uma das variveis originais explicada por essas
dimenses (factores).
Porque est em causa a anlise das correlaes entre as variveis a Anlise Factorial
promove a anlise das interdependncias.
A Anlise Factorial prev dois usos primrios:
1. Sumariar: porque ao identificar os factores permite descrever os dados segundo
um menor nmero de conceitos, face dimensionalidade da matriz original;
2. Reduzir: porque permite calcular os scores para as novas dimenses (factores),
substituindo os valores das variveis originais;
Do ponto de vista terico-substantivo, relativamente problemtica em estudo, as
variveis de input podem admitir uma partio em diversos subgrupos que reflectem
diferentes dimenses analticas.
A Anlise Factorial pode permitir por via da definio dos factores a identificao
dessas dimenses. Trata-se assim de tornar medveis variveis latentes.
A Anlise Factorial pode ser exploratria quando usada para procurar a estrutura que
subjaz ao conjunto de variveis em anlise. Neste caso o investigador no tem hipteses
de partida para testar. Quando efectivamente dispe de suporte terico sobre como
devem estar agrupadas as variveis originais, bem como sobre o nmero de factores,
ento deve desenvolver-se a ANLISE FACTORIAL CONFIRMATRIA.
ANLISE DE COMPONENTES PRINCIPAIS 2014
Helena Carvalho, ISCTE-IUL 2014 Pgina | 3
ALGUNS REQUISITOS PARA REALIZAR UMA ANLISE FACTORIAL
As variveis de input devem ser variveis mtricas (ou tratadas como tal, i.e., variveis
em escala tipo likert).
desejvel que as variveis de input apresentem algum nvel de multicolinearidade (i.e.
correlaes entre si), na medida em que se pretende identificar conjuntos de variveis. A
avaliao deste requisito pode ser feito atravs da anlise da matriz de correlaes, da
estatstica Kaiser-Meyer-Olkin (KMO) e do Teste de Bartlett.
Outro aspecto importante remete para a dimenso da amostra desejvel para a
realizao de uma anlise factorial. A literatura faz diversas recomendaes e que
apontam no sentido de garantir um nmero mnimo de observaes por referncia ao
nmero de variveis. Algumas vo no sentido de se dispor de pelo menos cinco vezes
mais casos relativamente ao nmero de variveis.
ANLISE DA ADEQUABILIDADE DA MATRIZ DE INPUT ATRAVS DA
ESTATSTICA DE KAISER-MEYER-OLKIN E DO TESTE DE BARTLETT
Por defeito, o SPSS no apresenta estes resultados; caso se pretenda proceder sua
interpretao necessrio activar a opo assinalada;
ANLISE DE COMPONENTES PRINCIPAIS 2014
Helena Carvalho, ISCTE-IUL 2014 Pgina | 4
1. ESTATSTICA DE KAISER-MEYER-OLKIN (KMO): esta estatstica quantifica o nvel de
intercorrelaes entre as variveis:
i j i j
ijij
i j
ij
ar
r
KMO22
2
legenda:
ijr coeficiente de correlao observado entre as variveis i e j;
ija coeficiente de correlao parcial1 entre as mesmas variveis i e j e que
simultaneamente, uma estimativa das correlaes entre os factores (Elizabeth
Reis, 1977:279). Atendendo a que as componentes so ortogonais ento esperar-
se- que os ija sejam prximos de zero.
Este ndice varia entre 0 e 1 e pode basear-se a sua interpretao nesta grelha:
KMO ACP
1 0,90 Muito Boa
0,80 0,90 Boa
0,70 0,80 Mdia
0,60 0,70 Razovel
0,50 0,60 M
< 0,50 Inaceitvel
in Elizabeth Reis (1997), Estatstica Multivariada, pg:279.
Resultados do exemplo:
KMO and Bart lett's Test
,692
307,886
55
,000
Kaiser-Meyer-Olkin Measure of Sampling Adequacy.
Approx. Chi-Square
df
Sig.
Bartlett's Test of Sphericity
1 A correlao parcial entre duas variveis Xi e Xj a correlao entre elas, estando controlada a correlao
entre essas e as restantes variveis em anlise.
ANLISE DE COMPONENTES PRINCIPAIS 2014
Helena Carvalho, ISCTE-IUL 2014 Pgina | 5
2. O TESTE DE ESFERICIDADE DE BARTLETT permite testar a hiptese da matriz de correlaes
na populao ser uma matriz identidade. Nesse sentido interessar rejeitar Ho sob
pena de no existirem correlaes significativas entre as variveis, pelo menos entre
algumas variveis;
R: como p
ANLISE DE COMPONENTES PRINCIPAIS 2014
Helena Carvalho, ISCTE-IUL 2014 Pgina | 6
ANLISE DE COMPONENTES PRINCIPAIS
Numa perspectiva mais terico-matemtica tem-se ento que
: a Anlise de Componentes Principais permite que a partir de m variveis originais
correlacionadas entre si sejam definidas p novas variveis [com pm] no
correlacionadas e que se designam por componentes principais (definindo
variveis compsitas).
Porqu p m?
: considerem-se, por exemplo, trs variveis de input X1, X2 e X3 a partir das quais
possvel definir trs componentes principais:
Como o esquema explicita (e lendo no sentido esquerda/direita) cada varivel de input
vai relacionar-se com cada uma das componentes principais, embora com diferentes
coeficientes. E, por sua vez, (lendo agora no sentido direita/esquerda) cada componente
principal vai estar relacionada com cada uma das variveis de input. Cada componente
explica uma proporo da varincia de cada uma dessas variveis.
X1 Cp
1
X2 Cp
2
X3 Cp
3
ANLISE DE COMPONENTES PRINCIPAIS 2014
Helena Carvalho, ISCTE-IUL 2014 Pgina | 7
A ACP pretende definir uma combinao linear das trs variveis X1, X2 e X3 procurando
extrair o mximo de varincia. Exemplificando as combinaes lineares para Cp1, Cp2 e
Cp3:
3312211111 X u X u X u Cp
3322221122 X u X u X u Cp
3332231133 X u X u X u Cp
A matriz que identifica os coeficientes das variveis nas diferentes componentes a
seguinte:
321
333231
232221
131211
3
2
1
C pC pC p
uuu
uuu
uuu
X
X
X
A definio das componentes principais (em igual nmero relativamente ao nmero de
variveis originais) obedece a duas restries:
1. as componentes principais so perpendiculares (ortogonais);
2. a 1componente tem associada a maior proporo de varincia das variveis
originais, a 2 ter a maior proporo do que ainda falta e assim sucessivamente,
at que com a ltima componente toda a varincia ser explicada.
De notar que quando se realiza uma ACP com o objectivo
: de identificar as dimenses inerentes s variveis de input;
: ou de reduzir a multidimensionalidade do input no sentido de definir um novo
conjunto de variveis (compsitas) de mais fcil operacionalizao;
est em causa determinar um nmero inferior de componentes, ou seja, obter uma
soluo do tipo p
ANLISE DE COMPONENTES PRINCIPAIS 2014
Helena Carvalho, ISCTE-IUL 2014 Pgina | 8
SELECO DAS COMPONENTES PRINCIPAIS2
CRITRIOS DE EXTRACO
1. CRITRIO DE KAISER seleco das componentes com valor prprio superior :
unidade3 (ver quadro Variance Total Explained). So extradas as componentes com
valores prprios superiores mdia. Cada componente deve assim contribuir para a
varincia, pelo menos como se de uma varivel de input se tratasse. Como se poder
observar no quadro Communalities, a varincia inicial de cada varivel 1 (a explicar
oportunamente)
2. : este critrio baseia-se na percentagem de CRITRIO DA PERCENTAGEM DE VARINCIA
varincia acumulada pelas sucessivas componentes principais. Esse limiar depende
em grande medida da natureza do fenmeno em anlise. Por exemplo, nas cincias
naturais habitual considerarem-se um conjunto de componentes que expliquem
pelo menos 95%, enquanto nas cincias sociais habitual j considerar satisfatria
uma soluo que explique 60% de varincia total;
3. : este critrio foi sugerido por Cattell (1966) e concretizado CRITRIO DO SCREE TEST
a partir da representao grfica dos valores prprios Scree plot para as p
componentes principais. a partir da forma da curva que se decide sobre o nmero
de componentes a reter.
A ideia que subjaz ao scree test consiste em tomar por referncia o ponto (assinalado
na figura seguinte) a partir do qual a curva tenda a ficar paralela ao eixo das abcissas.
Esse ponto corresponde ao nmero mximo de componentes a reter, pois, a partir
da, elas deixam de ser significativas.
2 Apesar de aqui estar em destaque o mtodo das Componentes Principais, importa referir que estes
critrios de extraco so tambm extensveis ao mtodo da Anlise Factorial. 3 Este o critrio que o SPSS usa por defeito.
ANLISE DE COMPONENTES PRINCIPAIS 2014
Helena Carvalho, ISCTE-IUL 2014 Pgina | 9
Scree Plot
Component Number
1110987654321
Eig
enva
lue
4,0
3,5
3,0
2,5
2,0
1,5
1,0
,5
0,0
Segundo Cattell in the use of the scree test the issue will arise whether the last non-
trivial factor is that immediately beyond or at the end of the straight scree line
(Cattell, 1966:250).
Segundo a proposta de Cattell, neste exemplo reter-se-iam quatro componentes. a
partir da 4 componente que a curva tende a ficar paralela. No obstante, convm
referir que a interpretao deste critrio no consensual. Outros autores s retm as
componentes at ao ponto em que em que a linda tende a ficar paralela e portanto,
neste caso, apontariam para a extraco de trs componentes.
Refira-se que normalmente o critrio do scree test sugere uma soluo com mais uma,
duas ou mesmo trs componentes relativamente ao critrio de Kaiser.
4. CRITRIO A PRIORI este critrio pode ser usado em situaes nas quais o investigador :
sabe a priori quantas so as componentes a extrair e assim, poder indicar
previamente o nmero desejado.
ANLISE DE COMPONENTES PRINCIPAIS 2014
Helena Carvalho, ISCTE-IUL 2014 Pgina | 10
COMUNALIDADES E VALORES PRPRIOS
A a varincia de cada varivel explicada por todas componentes COMUNALIDADE INICIAL
principais. Numa Anlise de Componentes Principais sempre igual a 14, desde que a
matriz de input para a ACP seja a matriz (R) de correlaes.
Communalities
1,000 ,802
1,000 ,755
1,000 ,467
1,000 ,536
1,000 ,526
1,000 ,598
1,000 ,526
1,000 ,699
1,000 ,402
1,000 ,584
1,000 ,701
P5A L-se facilmente
P5B Leitura agradvel
P5C Assuntos/temas bem arrumados
P5D Tem boa ilustrao (fotografias/desenhos)
P5E A 1 pgina sugestiva
P5F Formato adequado
P5G Tamanho adequado (n pginas)
P5H Periodicidade correcta
P5I Papel de boa qualidade
P5J Informao actualizada
P5K Temas tratados de grande interesse
Initial Extraction
Extraction Method: Principal Component Analysis.
A a varincia de cada varivel explicada pelas componentes COMUNALIDADE EXTRADA
principais que integram a soluo em anlise.
Como pode verificar-se, a partir do momento em que existe extraco das componentes
principais (p
ANLISE DE COMPONENTES PRINCIPAIS 2014
Helena Carvalho, ISCTE-IUL 2014 Pgina | 11
seguinte. Quando as comunalidades so muito baixas pode admitir-se retirar as variveis
nessas condies.
Communalities
1,000 ,802
1,000 ,755
1,000 ,467
1,000 ,536
1,000 ,526
1,000 ,598
1,000 ,526
1,000 ,699
1,000 ,402
1,000 ,584
1,000 ,701
P5A L-se facilmente
P5B Leitura agradvel
P5C Assuntos/temas bem arrumados
P5D Tem boa ilustrao (fotografias/desenhos)
P5E A 1 pgina sugestiva
P5F Formato adequado
P5G Tamanho adequado (n pginas)
P5H Periodicidade correcta
P5I Papel de boa qualidade
P5J Informao actualizada
P5K Temas tratados de grande interesse
Initial Extraction
Extraction Method: Principal Component Analysis.
O valor prprio (Total do quadro Variance Total Explained) corresponde varincia das
variveis em anlise que explicada por cada uma das componentes principais.
A percentagem de varincia explicada a percentagem de varincia explicada por cada
componente, relativamente ao total da varincia de todas as variveis. As componentes
principais so determinadas por ordem decrescente de importncia. Isto significa que a
1 componente explica a percentagem de varincia mais elevada, a 2 explica o mximo
do que ainda est por explicar e assim sucessivamente:
pCPVarCPVarCPVar ...21
sendo a soma dos valores prprios igual a m 1 [m = nmero de variveis originais e
1=varincia unitria]. Este valor corresponde varincia total das variveis (estan-
dardizadas).
Varincia total = 11 variveis x 1 (varincia unitria)
Baixas comunalidades
ANLISE DE COMPONENTES PRINCIPAIS 2014
Helena Carvalho, ISCTE-IUL 2014 Pgina | 12
QUADRO COM OS VALORES PRPRIOS EIGENVALUES DE CADA UMA DAS COMPONENTES, PERCENTAGEM DE VARINCIA TOTAL EXPLICADA POR CADA UMA DELAS E PERCENTAGEM DE
VARINCIA ACUMULADA
Trs fases
Valores prprios
Cp1 3,406
Cp2 1,668
Cp3 1,523
Cp4 0,931
Cp5 0,805
Cp6 0,685
Cp7 0,496
Cp8 0,472
Cp9 0,416
Cp10 0,324
Cp11 0,275
11,000
Total Variance Explained
3,406 30,963 30,963 3,406 30,963 30,963 2,795 25,411 25,411
1,668 15,165 46,128 1,668 15,165 46,128 2,073 18,843 44,253
1,523 13,845 59,973 1,523 13,845 59,973 1,729 15,719 59,973
,931 8,461 68,434
,805 7,320 75,754
,685 6,227 81,981
,496 4,508 86,488
,472 4,288 90,776
,416 3,778 94,555
,324 2,947 97,501
,275 2,499 100,000
Component
1
2
3
4
5
6
7
8
9
10
11
Total
% of
Variance
Cumulative
% Total
% of
Variance
Cumulative
% Total
% of
Variance
Cumulative
%
Initial Eigenvalues
Extraction Sums of Squared
Loadings
Rotation Sums of Squared
Loadings
Extraction Method: Principal Component Analysis.
Nmero de componentes = ao nmero de variveis de input.
As 11 componentes explicam em 100% a varincia total das 11 variveis de input.
Opcional
ANLISE DE COMPONENTES PRINCIPAIS 2014
Helena Carvalho, ISCTE-IUL 2014 Pgina | 13
Um indcio da qualidade da anlise prende-se com a varincia explicada pelas primeiras
componentes. Repare-se que as trs primeiras componentes s por si explicam cerca de
60% da varincia total das variveis em anlise.
A percentagem de varincia explicada por cada componente corresponde ao quociente
entre cada valor prprio e a varincia total x 100, como se exemplifica para a Cp1:
% 30,96310011
3,406
INTERPRETAO DAS COMPONENTES
Para proceder interpretao das componentes necessrio ler a matriz das
componentes Matrix Component. Em cada coluna esto dispostos os pesos factor
loadings das variveis de input para cada uma das componentes extradas. Esses pesos
medem as correlaes entre as componentes e as variveis originais estandardizadas5
(Elizabeth Reis, 1997: 270).
5 De notar que os loadings so iguais s correlaes somente quando:
1) as variveis esto estandardizadas e
2) as componentes so independentes (perpendiculares).
Component Matrixa
,695 ,134 -,186
.665 .166 -.237
.628 .040 -.360
.606 .334 -.347
.588 .236 .007
.581 -.193 -.303
.573 -.442 .244
.519 -.597 .269
.445 -.569 .423
.323 .500 .669
.367 .539 .575
Tem boa ilustrao (fotografias/desenhos)
Tamanho adequado (n pginas)
A 1 pgina sugestiva
Formato adequado
Papel de boa qualidade
Assuntos/temas bem arrumados
Informao actualizada
Periodicidade correcta
Temas tratados de grande interesse
L-se facilmente
Leitura agradvel
1 2 3
Component
Extraction Method: Principal Component Analysis.
3 components extracted.a.
ANLISE DE COMPONENTES PRINCIPAIS 2014
Helena Carvalho, ISCTE-IUL 2014 Pgina | 14
Para interpretar as componentes seleccionam-se para cada uma delas as variveis que
apresentarem pesos mais elevados. QUANTO MAIS PERTO DE |1| MAIS FORTE A ASSOCIAO
, ou seja, mais representativa a varivel nessa ENTRE CADA VARIVEL E A COMPONENTE
componente.
Em relao ao sinal dos pesos tem-se que:
1. pesos >0 significam a existncia de uma associao positiva entre a varivel e a
componente;
2. pesos
ANLISE DE COMPONENTES PRINCIPAIS 2014
Helena Carvalho, ISCTE-IUL 2014 Pgina | 15
1. quanto maior a dimenso da amostra, menores podem ser os loadings a
considerar como significativos;
2. quanto maior o nmero de variveis em anlise, menores podem ser os loadings
a considerar como significativos;
3. quanto maior o nmero de componentes (factores), maiores devem ser os
loadings, nos ltimas componentes, a considerar como significativos;
RELAO ENTRE OS LOADINGS DA MATRIZ DAS COMPONENTES (FACTORES) E AS
COMUNALIDADES E OS VALORES PRPRIOS
Because factor loading is the correlation of the variable and the factor, the squared
loading is the amount of the variables total variance accounted for by the factor (Hair,
Anderson, Tatham e Black, 1998:111).
Pode ento demonstrar-se que
1. A soma dos quadrados dos pesos das componentes, para cada varivel soma em
linha indica a PROPORO DE VARINCIA DE CADA VARIVEL QUE EXPLICADA PELAS
COMPONENTES NA SOLUO. Esse valor corresponde COMUNALIDADE
Exemplificando para a varivel Ter boa ilustrao
0,5360,18637-0,1344770,694995 222
2. Por sua vez, a soma dos quadrados dos pesos das variveis para cada componente
soma em coluna corresponde VARINCIA DE CADA COMPONENTE, como se exemplifica
no quadro seguinte para a componente 1:
ANLISE DE COMPONENTES PRINCIPAIS 2014
Helena Carvalho, ISCTE-IUL 2014 Pgina | 16
Variveis Loadings - aij -
na Cp1 aij
2
Var 1 0,6950 0,4830
Var 2 0,6653 0,4426
Var 3 0,6284 0,3949
Var 4 0,6055 0,3666
Var 5 0,5882 0,3459
Var 6 0,5811 0,3377
Var 7 0,5731 0,3284
Var 8 0,5189 0,2693
Var 9 0,4451 0,1981
Var 10 0,3233 0,1045
Var 11 0,3672 0,1349
3,4060
MATRIZ DAS COMPONENTES APS A ROTAO
Existem situaes nas quais a soluo extrada difcil de interpretar. Isto ocorre quando
existe alguma ou algumas variveis com pesos relativamente elevados em mais de uma
componente (como acontece no exemplo em anlise).
Nesses casos possvel efectuar a rotao das componentes, com o objectivo de obter
uma estrutura simplificada, facilitando a interpretao. A rotao pode reduzir algumas
das ambiguidades detectadas na matriz das componentes.
Existem mtodos de rotao ortogonal e mtodos de rotao oblquos sendo, no
entanto, os primeiros os mais utilizados. Os mtodos de rotao ortogonal garantem que
as componentes principais (e os factores) rodados permanecem independentes entre si,
i.e., mantm-se no correlacionados, enquanto nos mtodos de rotao oblquos as
componentes (factores) passam a estar correlacionados entre si.
ANLISE DE COMPONENTES PRINCIPAIS 2014
Helena Carvalho, ISCTE-IUL 2014 Pgina | 17
ROTAO ORTOGONAL VERSUS ROTAO OBLQUA
Um dos mtodos de rotao mais usado o VARIMAX, proposto por Kaiser. um
mtodo ortogonal que se centra na simplificao das colunas da matriz. O objectivo
definir uma soluo na qual cada varivel tenha um loading prximo de 1 ou de 1
numa nica componente e os restantes sejam prximos de 0;
Est subjacente a lgica de que a interpretao mais fcil quando a correlao varivel-
componente est prxima de 1 ou de 1 indicando uma clara associao entre ambas,
ou quando est prxima de 0 denotando uma ausncia de associao.
A varincia total explicada pelas componentes extradas mantm-se inalterada aps a
rotao, ainda que apresente uma nova distribuio pelas componentes. A rotao no
afecta, obviamente, as comunalidades.
Nos MTODOS OBLQUOS deixa de ser garantida a independncia entre as componentes,
estas passam a estar correlacionadas. Como refere Elizabeth Reis permitido s
componentes que rodem livremente de maneira a simplificarem o agrupamento das
variveis e a interpretao das componentes (Elizabeth Reis, 1997: 277);
A opo por um mtodo de rotao oblquo decorre fundamentalmente do problema
em estudo.
Componente 1
Componente 2 Componente 2
(depois da rotao)
Componente 1 (depois da rotao)
--------- rotao ortogonal
........... rotao oblqua
ANLISE DE COMPONENTES PRINCIPAIS 2014
Helena Carvalho, ISCTE-IUL 2014 Pgina | 18
MTODOS DE ROTAO DISPONVEIS NO SPSS
MTODOS ORTOGONAIS:
VARIMAX
: An orthogonal rotation method that minimizes the number of variables that have
high loadings on each factor. It simplifies the interpretation of the factors.
[o mtodo Varimax centra-se na simplificao das colunas da matriz das componen-
tes (ou factores)]
QUARTIMAX
: A rotation method that minimizes the number of factors needed to explain each
variable. It simplifies the interpretation of the observed variables.
[o mtodo Quartimax centra-se na simplificao das linhas da matriz das
componentes (ou factores)]
Equamax
: A rotation method that is a combination of the varimax method, which simplifies
the factors, and the quartimax method, which simplifies the variables. The number of
variables that load highly on a factor and the number of factors needed to explain a
variable are minimized.
[mtodo pouco usado]
MTODOS NO-ORTOGONAIS:
Direct Oblimin
: A method for oblique (nonorthogonal) rotation.
Promax
: An oblique rotation, which allows factors to be correlated. It can be calculated more
quickly than a direct oblimin rotation, so it is useful for large datasets.
Para o exemplo em anlise, observe-se a matriz das componentes aps a rotao
ortogonal Rotated Component Matrix segundo o mtodo Varimax. Obteve-se de
facto uma estrutura mais simplificada, na medida, em que cada varivel tende a ter um
loading elevado numa nica componente.
ANLISE DE COMPONENTES PRINCIPAIS 2014
Helena Carvalho, ISCTE-IUL 2014 Pgina | 19
Tomando por referncia o contedo temtico de cada uma das variveis pode ento
ensaiar-se uma designao para cada uma das trs componentes. Ainda que no seja o
caso, podem ocorrer situaes nas quais no seja possvel designar uma(s)
componente(s) em particular. Nesse caso pode optar-se pela designao: indefinida. No
entanto, quando sistematiza e descreve as componentes da soluo obtida deve fazer-
lhe(s) referncia, embora no a(s) interprete.
Quando se realiza uma ROTAO OBLQUA so disponibilizadas duas matrizes de loadings: a
PATTERN MATRIX e a STRUCTURE MATRIX e a COMPONENT CORRELATION MATRIX. Para o exemplo
em anlise ter-se-iam estas trs matrizes:
Rotated Component Matrixa
,758 -,099 ,120
,711 ,128 -,064
,709 ,105 ,115
,699 ,165 ,142
,586 ,304 -,177
,536 ,118 ,317
,005 ,832 ,091
,139 ,824 -,019
,234 ,724 ,073
,041 ,073 ,892
,135 ,025 ,858
Formato adequado
A 1 pgina sugestiva
Tamanho adequado (n pginas)
Tem boa ilustrao (fotografias/desenhos)
Assuntos/temas bem ar rumados
Papel de boa qualidade
Temas tratados de grande interesse
Periodicidade correcta
Informao actualizada
L-se facilmente
Leitura agradvel
1 2 3
Component
Extraction Method: Principal Component Analysis.
Rotation Method: Varimax with Kaiser Normalization.
Rotation converged in 5 iterations.a.
ANLISE DE COMPONENTES PRINCIPAIS 2014
Helena Carvalho, ISCTE-IUL 2014 Pgina | 20
Os loadings desta matriz representam a contribuio nica de
cada varivel para cada componente (factor). ESTA A MATRIZ QUE
HABITUALMENTE USADA NA INTERPRETAO DAS COMPONENTES QUANDO SE
. REALIZA UMA ROTAO OBLQUA
Esta matriz mostra as correlaes simples entre as variveis e as
componentes (factores). Estas correlaes (loadings) contm as
correlaes variveis-componentes mas tambm as correlaes
entre as componentes. Por esta razo a interpretao da Structure
Matrix no muito simples.
Pattern Matrixa
,793 ,208 ,059
,725 -,031 -,126
,713 -,008 ,055
,692 -,072 ,082
,576 -,230 -,232
,518 -,047 ,273
-,122 -,857 ,080
,025 -,829 -,042
,133 -,713 ,043
-,031 -,074 ,895
,077 -,010 ,853
Formato adequado
A 1 pgina sugestiva
Tamanho adequado (n pginas)
Tem boa ilustrao (fotografias/desenhos)
Assuntos/temas bem arrumados
Papel de boa qualidade
Temas tratados de grande interesse
Periodicidade correcta
Informao actualizada
L-se facilmente
Leitura agradvel
1 2 3
Component
Extraction Method: Principal Component Analysis.
Rotation Method: Oblimin with Kaiser Normalization.
Rotation converged in 6 iterations.a.
Structure Matrix
,745 -,012 ,171
,724 -,265 ,190
,723 -,206 ,163
,714 -,225 -,014
,604 -,379 -,135
,572 -,200 ,353
,246 -,835 -,005
,125 -,827 ,096
,335 -,751 ,093
,125 -,102 ,893
,209 -,066 ,865
Formato adequado
Tem boa ilustrao (fotografias/desenhos)
Tamanho adequado (n pginas)
A 1 pgina sugestiva
Assuntos/temas bem arrumados
Papel de boa qualidade
Periodicidade correcta
Temas tratados de grande interesse
Informao actualizada
L-se facilmente
Leitura agradvel
1 2 3
Component
Extraction Method: Principal Component Analysis.
Rotation Method: Oblimin with Kaiser Normalization.
ANLISE DE COMPONENTES PRINCIPAIS 2014
Helena Carvalho, ISCTE-IUL 2014 Pgina | 21
a partir desta matriz que se pode concluir se as componentes esto ou no correlacionadas.
Component Correlation Matrix
1.000 -.274 .152
-.274 1.000 -.041
.152 -.041 1.000
Component
1
2
3
1 2 3
Extraction Method: Principal Component Analysis.
Rotation Method: Oblimin with Kaiser Normalization.
ANLISE DE COMPONENTES PRINCIPAIS 2014
Helena Carvalho, ISCTE-IUL 2014 Pgina | 22
COMO REPORTAR OS RESULTADOS DA ACP?
Vai comear por se fazer alguma anlise prvia s variveis de input e depois
sistematizar-se-o os principais resultados da ACP aplicada a essas variveis.
Exemplo de Relatrio
No sentido de avaliar as caractersticas dos jornais mais valorizadas pelos indivduos foi
solicitado a uma amostra de 100 leitores que indicassem o seu grau de concordncia a
propsito destes onze aspectos:
L-se facilmente Leitura agradvel Assuntos/temas bem arrumados Tem boa ilustrao (fotografias/desenhos) A 1 pgina sugestiva Formato adequado Tamanho adequado (n pginas) Periodicidade correcta Papel de boa qualidade Informao actualizada Temas tratados de grande interesse
Sugesto:
Fazer uma anlise descritiva dos itens, designadamente no que se refere ao nvel
de concordncia indicado pelos inquiridos, tomando por referncia a informao
disponvel no Quadro 1.
No suposto ler todos os resultados; devem destacar-se os mais relevantes.
claro que a leitura substantivamente sustentada ser a mais interessante.
ANLISE DE COMPONENTES PRINCIPAIS 2014
Helena Carvalho, ISCTE-IUL 2014 Pgina | 23
Quadro 1 Avaliao das diversas caractersticas dos jornais
Outra sugesto:
Interpretao dos nveis de concordncia em funo de medidas de sntese como
sejam a mdia o desvio-padro. Recorde-se que se est a admitir tratar estas
escalas como variveis quantitativas;
Poder acrescentar-se por exemplo a representao grfica das mdias.
Quadro 2 Nvel de concordncia com as caractersticas dos jornais
Itens Mdia Desvio-padro
L-se facilmente 3.43 1.037
Leitura agradvel 3.65 0.968
Assuntos/temas bem arrumados 4.13 0.800
Tem boa ilustrao (fotografias/desenhos) 4.41 0.805
A 1 pgina sugestiva 3.85 0.989
Formato adequado 4.12 0.902
Tamanho adequado (n pginas) 4.04 0.852
Periodicidade correcta 4.36 0.759
Papel de boa qualidade 4.40 0.995
Informao actualizada 4.18 0.821
Temas tratados de grande interesse 3.87 1.143
2 2.0 17 17 35 35.0 28 28.0 18 18.0 100 100.0
4 4.0 7 7.0 25 25.0 48 48.0 16 16.0 100 100.0
1 1.0 2 2.0 14 14.0 49 49.0 34 34.0 100 100.0
1 1.0 0 .0 14 14.0 27 27.0 58 58.0 100 100.0
1 1.0 8 8.0 27 27.0 33 33.0 31 31.0 100 100.0
0 .0 4 4.0 23 23.0 30 30.0 43 43.0 100 100.0
1 1.0 4 4.0 16 16.0 48 48.0 31 31.0 100 100.0
0 .0 1 1.0 14 14.0 33 33.0 52 52.0 100 100.0
3 3.0 3 3.0 10 10.0 19 19.0 65 65.0 100 100.0
0 .0 1 1.0 23 23.0 33 33.0 43 43.0 100 100.0
4 4.0 9 9.0 21 21.0 28 28.0 38 38.0 100 100.0
L-se facilmente
Leitura agradvel
Assuntos/temas bem arrumados
Tem boa ilustrao (fotografias/desenhos)
A 1 pgina sugestiva
Formato adequado
Tamanho adequado (n pginas)
Periodicidade correcta
Papel de boa qualidade
Informao actualizada
Temas tratados de grande interesse
N %
Discordo
completamente
N %
Discordo
N %
Nao concordo
nem discordo
N %
Concordo
N %
Concordo
completamente
N %
Total
ANLISE DE COMPONENTES PRINCIPAIS 2014
Helena Carvalho, ISCTE-IUL 2014 Pgina | 24
Figura 1 Nvel de concordncia com as caractersticas dos jornais
Sugesto de interpretao posterior
Aps diagnosticada a avaliao feita pelos leitores da amostra, a propsito das diversas
caractersticas dos jornais, vai proceder-se a uma anlise de interdependncia entre elas.
O objectivo identificar as diferentes dimenses, susceptveis de agregar as
caractersticas dos jornais.
Da realizao de uma Anlise em Componentes Principais cujos resultados indicam
uma adequabilidade razovel/mdia (KMO=0,692)6 foram extradas trs componentes
que combinam os diferentes aspectos avaliados pelos indivduos, e que explicam cerca
de 60% da varincia global.
6 Para informao mais detalhada consultar Anexo (pg..) Exemplo de referncia ao Anexo do Relatrio.
ANLISE DE COMPONENTES PRINCIPAIS 2014
Helena Carvalho, ISCTE-IUL 2014 Pgina | 25
No Quadro 3 podem identificar-se os itens que mais contribuem para cada uma das trs
componentes extradas:
Quadro 3 Avaliao dos jornais: identificao de dimenses
(Anlise de Componentes Principais com rotao Varimax)
Itens Componentes
Imagem Contedos Leitura
Formato adequado 0,758 -0,099 0,120
A 1 pgina sugestiva 0,711 0,128 -0,064
Tamanho adequado (n pginas) 0,709 0,105 0,115
Tem boa ilustrao (fotografias/desenhos) 0,699 0,165 0,142
Assuntos/temas bem arrumados 0,586 0,304 -0,177
Papel de boa qualidade 0,536 0,118 0,317
Temas tratados de grande interesse 0,005 0,832 0,091
Periodicidade correcta 0,139 0,824 -0,019
Informao actualizada 0,234 0,724 0,073
L-se facilmente 0,041 0,073 0,892
Leitura agradvel 0,135 0,025 0,858
Varincia explicada 25,41% 18,84% 15,72%
Varincia total explicada 59,97
Em funo dos itens com peso preponderante em cada uma das trs componentes
(valores assinalados no Quadro 3), pode ento admitir-se a definio de trs dimenses
tematicamente distintas: imagem, contedos e leitura e de confirmada consistncia
(com alphas de 0,77, 0,73 e 0,78 respectivamente).
Outra sugesto:
Cruzamento das componentes com outros indicadores.
Isso pressupe a definio das componentes enquanto novas variveis. Explica-o disponvel neste documento nas pgs. 27 a 31)
ANLISE DE COMPONENTES PRINCIPAIS 2014
Helena Carvalho, ISCTE-IUL 2014 Pgina | 26
Sugesto de interpretao posterior
Verifica-se que as dimenses imagem e contedos so as que os indivduos parecem
valorizar mais, j que assumem nveis mdios de concordncia mais elevados (Quadro 4)
e tambm as que expressam opinies mais consensuais dado registarem os desvios-
padro mais baixos.
Quadro 4 Nvel mdio de concordncia com as dimenses de avaliao dos jornais segundo a
idade dos leitores
Veja-se tambm a relao entre o semanrio preferido pelos leitores inquiridos e o nvel
de concordncia atribudo a cada uma das trs dimenses (Figura 2).
Figura 2 Nvel mdio de concordncia com as dimenses de avaliao dos jornais
em funo do Semanrio preferido
4,2 ,64 4,0 ,83 3,5 1,00
4,3 ,57 4,1 ,77 3,5 ,92
3,8 ,74 4,1 ,51 3,6 ,71
4,3 ,52 4,3 ,81 3,4 1,01
4,2 ,63 4,1 ,75 3,5 ,92
25-29
30-34
35-39
40-50
Total
Idade
Mdia Desvio-padro
Nvel concordncia atribudo
Imagem
Mdia Desvio-padro
Nvel concordncia atribudo
a Contedos
Mdia Desvio-padro
Nvel concordncia atribudo
Leitura
ANLISE DE COMPONENTES PRINCIPAIS 2014
Helena Carvalho, ISCTE-IUL 2014 Pgina | 27
DEFINIO DAS COMPONENTES ENQUANTO NOVAS VARIVEIS
A) VIA SCORES FACTORIAIS
possvel determinar para cada indivduo um score factorial para cada uma das
componentes extradas. Para o clculo dos scores factoriais so usadas:
a) as respostas dadas pelos indivduos s variveis originais (estandardizadas);
b) e os coeficientes que ponderam cada uma dessas variveis. Esses coeficientes
esto sistematizados na matriz COMPONENT SCORE COEFFICIENT MATRIX.
Refira-se que esta matriz s apresentada pelo SPSS quando solicitada
E assim definem-se as componentes
enquanto novas variveis
ANLISE DE COMPONENTES PRINCIPAIS 2014
Helena Carvalho, ISCTE-IUL 2014 Pgina | 28
Esta a matriz dos coeficientes para o exemplo em anlise. Refira-se que os coeficientes
mais elevados correspondem aos pesos tambm mais elevados na matriz das
componentes (neste caso, aps rotao7).
Como as variveis esto estandardizadas os scores factoriais sero valores tambm
estandardizados.
Tendo em conta a forma como so determinados os scores factoriais, ter-se- ento que
Valores elevados nas variveis (originais) com pesos elevados numa
certa componente resultam em scores factoriais elevados.
Exemplo do clculo do score factorial de um indivduo na Cp1:
1110987654321 121,0011,0174,0055,0265,0313,0280,0250,0214,0028,0076,0 ZZZZZZZZZZZ
NOTA: CADA ZI CORRESPONDE A CADA VARIVEL XI ESTANDARDIZADA.
7 Compare-se os loadings assinalados na matriz da pg. 19 com os coeficientes aqui assinalados.
Component Score Coefficient Matrix
-,076 ,011 ,535
-,028 -,027 ,507
,214 ,086 -,169
,250 -,012 ,017
,280 -,028 -,108
,313 -,160 ,005
,265 -,044 ,001
-,055 ,422 -,045
,174 -,019 ,139
-,011 ,352 ,004
-,121 ,442 ,034
L-se facilmente
Leitura agradvel
Assuntos/temas bem arrumados
Tem boa ilustrao (fotografias/desenhos)
A 1 pgina sugestiva
Formato adequado
Tamanho adequado (n pginas)
Periodicidade correcta
Papel de boa qualidade
Informao actualizada
Temas tratados de grande interesse
1 2 3
Component
Extraction Method: Principal Component Analysis.
Rotation Method: Var imax with Kaiser Normalization.
ANLISE DE COMPONENTES PRINCIPAIS 2014
Helena Carvalho, ISCTE-IUL 2014 Pgina | 29
B) VIA NDICES (SUMMATED SCALES)
Relativamente definio das componentes enquanto novas variveis ainda possvel
usar uma outra alternativa e que consiste em definir NDICES (summated scales). Estas
definem-se combinando diversas variveis originais.
Para cada uma dessas novas variveis compsitas so seleccionadas as variveis com
pesos mais elevados para cada componente e, habitualmente, a nova varivel uma
mdia das variveis originais, como se exemplifica (via SPSS) para, por exemplo, a
componente 1:
Estas so as variveis com loadings mais elevados na componente 1, como evidencia a matriz das componentes aps a rotao
ANLISE DE COMPONENTES PRINCIPAIS 2014
Helena Carvalho, ISCTE-IUL 2014 Pgina | 30
Quando se pretende definir por este processo as novas variveis compsitas
importante analisar a consistncia de cada uma delas, no sentido de aferir se os
diferentes itens ou indicadores medem o mesmo constructo. Para esse efeito calcula-se
um COEFICIENTE DE RELIABILIDADE (exemplo, Alpha de Cronbach).
Se os itens tiverem escalas diferentes ento necessrio calcular o alpha com os itens estandardizados. Para esse efeito escolhe-se a opo assinalada. Veja-se o resultado.
ANLISE DE COMPONENTES PRINCIPAIS 2014
Helena Carvalho, ISCTE-IUL 2014 Pgina | 31
O quadro seguinte apresenta o valor do alpha considerando os 6 itens:
Os valores assinalados a negrito no 2 quadro permitem perceber qual ser o alpha admitindo
que se retiraria cada um dos itens (de per si).
Se o valor de alpha diminuir com a retirada de algum dos itens ento isso significa que a
consistncia diminui, logo o item em questo importante para melhorar a consistncia do
ndice que se pretende construir.
Neste exemplo qualquer que seja o item que se retirasse o resultado seria sempre o mesmo:
diminuiria sempre a consistncia.
Concluso: todos os itens so de reter para a nova varivel compsita.
Reliability Statistics
.768 .772 6
Cronbach's
Alpha
Cronbach's Alpha
Based on Standardized
Items N of Items