Transcript of Carlos Alberto Alves Varella Doutor em Engenharia Agrícola Universidade Federal Rural do Rio de...
- Slide 1
- Carlos Alberto Alves Varella Doutor em Engenharia Agrcola
Universidade Federal Rural do Rio de Janeiro Ps-Graduao em
Agronomia Cincia do Solo: CPGA-CS Novembro 2011
- Slide 2
- Introduo a tcnica mais conhecida da estatstica multivariada;
Pode ser utilizada para gerao de ndices e agrupamento de indivduos;
Cada componente principal uma combinao linear de todas as variveis
originais; So independentes entre si; importante ter uma viso
conjunta de todas ou quase todas as tcnicas da estatstica
multivariada para resolver a maioria dos problema prticos.
- Slide 3
- Construo da matriz de dados (Matriz X) Matriz de dados para p
variveis e n indivduos; Caractersticas observadas so : X 1, X 2, X
3,..., X p ; A matriz de ordem n x p.
- Slide 4
- Matriz de Covarincia, S Obtida a partir da matriz X de dados de
ordem n x p; uma estimativa da matriz de covarincia da populao ; A
matriz S simtrica e de ordem p x p.
- Slide 5
- Padronizao dos dados Mdia zero e varincia 1 Mdia qualquer e
varincia 1
- Slide 6
- Variveis Padronizadas A matriz Z igual a matriz de correlao R
da matriz de dados X;
- Slide 7
- Consideraes sobre a padronizao Normalmente partimos da matriz
padronizada; O resultado a partir da matriz S pode ser diferente do
resultado a partir da matriz R. A padronizao s dever ser feita
quando as unidades das variveis observadas no so as mesmas.
- Slide 8
- Determinao dos Componentes Principais Os componentes principais
so determinados resolvendo-se a equao caracterstica da matriz S ou
R, isto :
- Slide 9
- Autovalores da matriz R 1, 2, 3,..., p so as razes da equao
caracterstica da matriz R ou S, ento: 1, 2, 3,..., p podem se
autovalores da matriz R ou S;
- Slide 10
- Autovetores Para cada autovalor i existe um autovetor: ip 2i 1i
i a a a a ~
- Slide 11
- Componente principal Y i Sendo o autovalor = i, ento o i-simo
componente principal dado por: pip22i11ii XaXaXaY
- Slide 12
- Propriedades dos Componentes Principais A varincia do
componente principal Y i igual ao valor do autovalor i : O primeiro
componente o que apresenta maior varincia e assim por diante: ii
YarV )Y(arV )Y( V )Y( V p21
- Slide 13
- Propriedades dos Componentes Principais Total de varincia das
variveis originais = somatrio dos autovalores = total de varincia
dos componentes principais: )Y(arV )X( V iii Os componentes
principais no so correlacionados entre si: 0Y,YovC ji
- Slide 14
- Importncia de cada componente principal Medida pela porcentagem
de varincia de cada componente em relao ao total 100 Strao 100 YarV
Y V C i p 1i i i p 1i i i i
- Slide 15
- Nmero de componentes No existe um modelo estatstico; O nmero de
ser aquele que acumula 70% ou mais de proporo da varincia total.
pkonde%70100 YarV Y V Y V k 1i i k1
- Slide 16
- Interpretao dos componentes Verifica-se o Grau de influncia que
cada varivel Xj tem sobre o componente Yi. j j1 1 j 1 j11YXj1,j
XarV a X V Y V arYXCorr
- Slide 17
- Interpretao dos componentes Verifica-se o peso ou loading de
cada varivel sobre o componente p p1 p 2 12 2 1 11 1 XarV a w, X V
a w, X V a w
- Slide 18
- Escores dos componentes Organizao dos dados Trat (Indiv)
Variveis Escores dos componentes principais X1X1 X2X2...XpXp Y1Y1
Y2Y2 YkYk 1X 11 X 12...X 1p Y 11 Y 12...Y 1k 2X 21 X 22...X 2p Y 21
Y 22...Y 2k nX n1 X n2 X np Y n1 Y n2...Y nk
- Slide 19
- Escores do primeiro componente para n tratamentos e p variveis
O escore o valor da cominao linear; Y n1 =componente 1 do
tratamento n para p variveis.
- Slide 20
- Exemplo de Aplicao Variveis originais observadas (X1 e X2) e
padronizados (Z1 e Z2). Duas variveis para cinco tratamentos (k=5).
Tratamentos Variveis originaisVariveis padronizadas X1X1 X2X2 Z1Z1
Z2Z2 110296 24,38276,9554 210487 24,86086,3033 310162 24,14364,4920
49368 22,23134,9268 510077 23,90465,5788 Varincia17,50190,50
11
- Slide 21
- Padronizao da Varincia Os dados sero padronizados para varincia
1:
- Slide 22
- Matriz de Correlao Elementos da diagonal principal igual a 1.
Significa a correlao entre mesmas variveis; Elementos fora da
diagonal principal igual a 0,5456. Significa a correlao entre as
variveis (X1,X2).
- Slide 23
- Autovalores da matriz de correlao So os elementos fora da
diagonal principal da matriz. Significa a varincia de cada
componente principal. 1 = 1,5456 e 2 = 0,4544
- Slide 24
- Trao da matriz de correlao Somatrio dos elementos da diagonal
da matriz. Significa o total de varincia. Trao(R) = 1+1=2
- Slide 25
- Primeiro autovetor da matriz de correlao So os coeficientes das
variveis padronizadas Z1, Z2. Y1 a combinao linear de Z1, Z2 que
denominamos de primeiro componente principal
- Slide 26
- Resultados da anlise Varincia, ponderao, correlao, % de
varincia e % de varincia acumulada dos componentes principais.
CPVarincia () PonderaoCorrelao entre Zj eYi % de varincia % de
varincia acumulada dos Y i Z1Z1 Z2Z2 Z1Z1 Z2Z2 Y11,54560,707 0,879
77,28 Y20,4544-0,7070,707-0,4760,47622,72100,00
- Slide 27
- Escores dos componentes principais Tratamentos Componentes
principais Y1Y1 Y2Y2 122,16-12,32 222,04-13,12 320,25-13,90
419,20-12,24 520,85-12,96
- Slide 28
- Grfico de disperso Permite visualizar se os componentes
principais (Y is ) so capazes de discriminar indivduos da populao (
) utilizando caractersticas (X i ). 19 20 21 22 23
-14-13.5-13-12.5-12 Segundo componente (Y2) Primeiro componente
(Y1)
- Slide 29
- Aula prtica com o programa computacional SAS Material didtico:
http://www.ufrrj.br/institutos/it/deng/varella/multivariada.htm
http://www.ufrrj.br/institutos/it/deng/varella/multivariada.htm
Disciplina: Anlise Multivariada Aplicada as Cincias Agrrias.Aula
prtica: 14-17 com SAS.