Download - Análise Multivariada - trabalho

Transcript

UNIVERSIDADE FEDERAL DO PARANÁ

Programa de

Pós-Graduação em Métodos Numéricos em Engenharia

Trabalho de

Análise Multivariada Aplicada à Pesquisa

Prof. D. Jair Mendes Marques

Aluna

Marina Vargas R. P. G. Ferreira

Curitiba - PR

2010

Sumário

1 Lista 1 - Álgebra matricial, vetores aleatórios e amostras aleatórias 3

2 Lista 2 - Distribuição Normal Multivariada 33

3 Lista 3 - Inferência sobre o vetor de médias e MANOVA 48

4 Lista 4: Análise de Componentes Principais 75

5 Lista 5: Análise Fatorial 99

6 Lista 6: Análise Discriminante 121

7 Lista 7: Regressão Logística 135

8 Lista 8: Análise de Agrupamento 146

9 Lista 9: Análise de Correlação Canônica 169

1 Lista 1 - Álgebra matricial, vetores aleatórios e amostras aleatórias

Resolver os problemas 1 até 16, com uso do MATLAB

1. Dadas as matrizes

A =

⎡⎢⎢⎢⎢⎢⎢⎣

−7 0 5 4

3 −3 −2 3

7 5 4 1

2 2 7 −3

⎤⎥⎥⎥⎥⎥⎥⎦, B =

⎡⎢⎢⎢⎢⎢⎢⎣

8 5 7 5

−1 −3 −3 −1

−1 3 −2 5

1 1 3 6

⎤⎥⎥⎥⎥⎥⎥⎦

e C =

⎡⎢⎢⎢⎢⎢⎢⎣

−5 5 0 −5

2 −3 2 2

2 3 −1 1

0 4 1 −3

⎤⎥⎥⎥⎥⎥⎥⎦,

calcular:

(a) A+B;

>> A+B

ans =

1 5 12 9

2 -6 -5 2

6 8 2 6

3 3 10 3

(b) C −B;

>> C-B

ans =

-13 0 -7 -10

3 0 5 3

3 0 1 -4

-1 3 -2 -9

>> (-5)*B

ans =

-40 -25 -35 -25

5 15 15 5

5 -15 10 -25

-5 -5 -15 -30

(d) A+ 3 ⋅B − 5 ⋅ C;

>> A+3*B-5*C

ans =

42 -10 26 44

-10 3 -21 -10

-6 -1 3 11

5 -15 11 30

(e) B ⋅A;

>> B*A

ans =

18 30 93 39

-25 -8 -18 -13

12 -9 16 -12

29 24 57 -8

(f) (C ⋅A) ⋅B;

>> (C*A)*B

ans =

425 75 525 -65

-106 15 -195 112

-62 20 -9 75

164 51 246 85

(g) A ⋅ (B − C);

>> A*(B-C)

ans =

-102 -12 -46 -14

57 -9 44 58

65 -3 22 80

-4 9 -9 15

(h) A−1;

>> inv(A)

ans =

-0.0507 0.0941 0.0404 0.0400

0.0097 -0.2008 0.1365 -0.1423

0.0526 0.0658 -0.0132 0.1316

0.0955 0.0824 0.0872 -0.0945

(i) (B ⋅ C)−1

>> inv(B*C)

ans =

-0.0568 0.0389 0.0019 0.1170

0.0181 -0.0776 -0.0252 -0.0256

0.0487 -0.1005 0.0613 -0.1177

0.0393 -0.1723 -0.0316 -0.1184

(j) tr(A);

>> trace(A)

ans =

-9

(k) tr(B + C);

>> trace(B+C)

ans =

-3

(l) B2;

>> B^2

ans =

57 51 42 100

-3 -6 5 -23

-4 -15 3 12

10 17 16 55

(m) C3;

>> C^3

ans =

-285 570 -75 -440

114 -257 52 180

50 -44 -12 66

-84 197 -28 -142

(n) tr(A+B)−1;

>> trace(inv(A+B))

ans =

-0.4004

(o) A′;

>> A’

ans =

-7 3 7 2

0 -3 5 2

5 -2 4 7

4 3 1 -3

(p) (B +A− C ′)′;

>> (B+A-C’)’

ans =

6 -3 6 8

3 -3 6 1

10 -8 3 9

9 -2 5 6

(q) det(B);

>> det(B)

ans =

613

(r) det(A−B).

>> det(A-B)

ans =

-152

2. Dados os vetores: u = [0, 3,−1, 0, 5], v = [−5, 1,−5, 1, 4] e w = [1,−1,−3, 0, 2], calcular:

(a) u ∙ v;

u ∙ v = 28

(b) w ∙ v;

w ∙ v = 17

u ∙ (v + w) = 38

(d) u ∙ (v − w).

u ∙ (v − w) = 18

3. Dados os vetores: u1 = [2,−1, 3, 2], u2 = [−1, 3, 2, 1], u3 = [−4, 2,−6,−4] e u4 =

[6,−3, 9, 6], verifique se são L.D. ou L.I.:

(a) u1 e u2;

Como

M =

⎡⎢⎢⎢⎢⎢⎢⎣

2 −1

−1 3

3 2

2 1

⎤⎥⎥⎥⎥⎥⎥⎦

e rank(MA) = 2, então os vetores u1 e u2 são Linearmente Independentes.

(b) u1 e u3;

Como

MM =

⎡⎢⎢⎢⎢⎢⎢⎣

2 −4

−1 2

3 −6

2 −4

⎤⎥⎥⎥⎥⎥⎥⎦

e rank(MM) = 1, então os vetores u1 e u3 são Linearmente Dependentes.

Como

TT =

⎡⎢⎢⎢⎢⎢⎢⎣

2 −1 −4

−1 3 2

3 2 −6

2 1 −4

⎤⎥⎥⎥⎥⎥⎥⎦

e rank(TT ) = 2, então os vetores u1, u2 e u3 são Linearmente Dependentes.

(d) u1, u3 e u4;

Como

TH =

⎡⎢⎢⎢⎢⎢⎢⎣

2 −4 6

−1 2 −3

3 −6 9

2 −4 6

⎤⎥⎥⎥⎥⎥⎥⎦

e rank(TH) = 1, então os vetores u1, u3 e u4 são Linearmente Dependentes.

(e) u1, u2 , u3 e u4.

Como

GG =

⎡⎢⎢⎢⎢⎢⎢⎣

2 −1 −4 6

−1 3 2 −3

3 2 −6 9

2 1 −4 6

⎤⎥⎥⎥⎥⎥⎥⎦

e rank(GG) = 2, então os vetores u1, u2, u3 e u4 são Linearmente Dependentes.

4. Calcular a norma ou comprimento de cada um dos vetores do item 2.

- ∥u∥ = 5.9161

- ∥v∥ = 8.2462

- ∥w∥ = 3.8730

5. Determinar os autovalores e autovetores normalizados das matrizes:

A =

⎡⎢⎢⎢⎣

9 −1 3

−1 5 1

3 1 7

⎤⎥⎥⎥⎦

Matriz de autovetores

e =

⎡⎢⎢⎢⎣

0.441225 0.374359 0.815583

0.687013 −0.725619 −0.0386051

−0.57735 −0.57735 0.57735

⎤⎥⎥⎥⎦

Matriz de autovalores

L =

⎡⎢⎢⎢⎣

3.51739 0 0

0 6.31158 0

0 0 11.171

⎤⎥⎥⎥⎦

Assim

Autovalores Autovetores

¸1 = 3.51739 e1 = [0.441225 0.687013 -0.57735]’

¸2 = 6.31158 e2 = [0.374359 -0.725619 -0.57735]’

¸3 = 11.171 e3 = [0.815583 -0.0386051 0.57735]’

B =

⎡⎢⎢⎢⎢⎢⎢⎣

−3 5 1 3

5 −3 1 5

1 1 3 −4

3 5 −4 6

⎤⎥⎥⎥⎥⎥⎥⎦

Matriz de autovetores

e =

⎡⎢⎢⎢⎢⎢⎢⎣

0.627122 −0.598371 0.408248 0.286361

−0.76064 −0.340226 0.408248 0.372836

0.0667588 0.469299 0.816497 −0.329599

0.153909 0.553133 1.69362e−017 0.818752

⎤⎥⎥⎥⎥⎥⎥⎦

Matriz de autovalores

L =

⎡⎢⎢⎢⎢⎢⎢⎣

−8.22181 0 0 0

0 −3.71455 0 0

0 0 4 0

0 0 0 10.9364

⎤⎥⎥⎥⎥⎥⎥⎦

Assim

Page 10: Análise Multivariada - trabalho

Autovalores Autovetores

¸1 = -8.2218 e1 = [0.627122 -0.76064 0.0667588 0.153909]’

¸2 = -3.7146 e2 = [ -0.598371 -0.340226 0.469299 0.553133]’

¸3 = 4.0000 e3 = [0.408248 0.408248 0.816497 1.69362e−017]’

¸4 = 10.9364 e4 = [ 0.286361 0.372836 -0.329599 0.818752 ]’

6. Determine as matrizes A1/2 e B1/2, se existirem, para as matrizes do item 5.

>> A=[9 -1 3; -1 5 1; 3 1 7]

A =

9 -1 3

-1 5 1

3 1 7

>> [e,L]=eig(A)

e =

0.4412 0.3744 0.8156

0.6870 -0.7256 -0.0386

-0.5774 -0.5774 0.5774

L =

3.5174 0 0

0 6.3116 0

0 0 11.1710

>> AR=e*(sqrt(L))*e’

AR =

2.9404 -0.2192 0.5531

-0.2192 2.2130 0.2341

0.5531 0.2341 2.5767

>> AR=sqrtm(A)

AR =

2.9404 -0.2192 0.5531

-0.2192 2.2130 0.2341

0.5531 0.2341 2.5767

Page 11: Análise Multivariada - trabalho

A1/2 =

⎡⎢⎢⎢⎣

2.94042 −0.21917 0.553062

−0.21917 2.21295 0.234092

0.553062 0.234092 2.57669

⎤⎥⎥⎥⎦

>> B=[-3 5 1 3;5 -3 1 5;1 1 3 -4;3 5 -4 6]

B =

-3 5 1 3

5 -3 1 5

1 1 3 -4

3 5 -4 6

>> [e,L]=eig(B)

e =

0.6271 -0.5984 0.4082 0.2864

-0.7606 -0.3402 0.4082 0.3728

0.0668 0.4693 0.8165 -0.3296

0.1539 0.5531 0.0000 0.8188

L =

-8.2218 0 0 0

0 -3.7146 0 0

0 0 4.0000 0

0 0 0 10.9364

B1/2 Não existe, pois B1/2 =k∑

i=1

√¸ieie

′i = PΛ1/2P ′, dependendo assim dos autovalores,

onde dois deles são negativos.

7. Para a matriz B do item 6 verifique se é possível: (B1/2)−1 = PΛ−1/2P ′.

Temos que(A1/2

)−1=

k∑i=′

1√¸ieie

′i = PΛ−1/2P ′, como existem autovalores negativos, não é

possível encontrar (B1/2)−1.

8. Verificar se existe alguma matriz positiva definida entre as matrizes A e B do item 6.

(a) Do item 6, temos

Page 12: Análise Multivariada - trabalho

Autovalores A B

¸1 3.5174 -8.2218

¸2 6.3116 -3.7146

¸3 11.1710 4.0000

¸4 10.9364

A matriz A é positiva definida, pois seus autovalores são positivos, já a matriz B não é

positiva definida.

9. Calcular o comprimento ou norma de cada vetor coluna das matrizes A e B do item 6.

Matriz A

>> A=[9 -1 3; -1 5 1; 3 1 7];

>> u1=[9 -1 -3]

u1 =

9 -1 -3

>> u2=[-1 5 1]

u2 =

-1 5 1

>> u3=[3 1 7]

u3 =

3 1 7

>> norm(u1)

ans =

9.5394

>> norm(u2)

ans =

5.1962

>> norm(u3)

ans =

7.6811

>> B=[-3 5 1 3;5 -3 1 5;1 1 3 -4;3 5 -4 6];

>> u1=[-3 5 1 3]

u1 =

Page 13: Análise Multivariada - trabalho

-3 5 1 3

>> u2=[5 -3 1 5]

u2 =

5 -3 1 5

>> u3=[1 1 3 -4]

u3 =

1 1 3 -4

>> u4=[3 5 -4 6]

u4 =

3 5 -4 6

>> norm(u1)

ans =

6.6332

>> norm(u2)

ans =

7.7460

>> norm(u3)

ans =

5.1962

>> norm(u4)

ans =

9.2736

Vetores Coluna A B

u1 9.5394 6.6332

u2 5.1962 7.7460

u3 7.6811 5.1962

u4 9.2736

10. Considere a matriz de covariância

Σ =

⎡⎢⎢⎢⎢⎢⎢⎣

9 0 0 0

0 16 0 0

0 0 20 0

0 0 0 25

⎤⎥⎥⎥⎥⎥⎥⎦,

Page 14: Análise Multivariada - trabalho

determine:

(a) Σ−1;

>> sigma=[9 0 0 0;0 16 0 0;0 0 20 0;0 0 0 25]

sigma =

9 0 0 0

0 16 0 0

0 0 20 0

0 0 0 25

>> InvSigma=inv(sigma)

InvSigma =

0.1111 0 0 0

0 0.0625 0 0

0 0 0.0500 0

0 0 0 0.0400

(b) Os autovalores e autovetores normalizados de Σ;

>> [e,L]=eig(sigma)

e =

1 0 0 0

0 1 0 0

0 0 1 0

0 0 0 1

L =

9 0 0 0

0 16 0 0

0 0 20 0

0 0 0 25

Autovalores Autovetores

¸1 = 9 e1 = [1 0 0 0]’

¸2 = 16 e2 = [0 1 0 0]’

¸3 = 20 e3 = [0 0 1 0]’

¸4 = 25 e4 = [0 0 0 1 ]’

Page 15: Análise Multivariada - trabalho

>> [einv,Linv]=eig(InvSigma)

einv =

0 0 0 1

0 0 1 0

0 1 0 0

1 0 0 0

Linv =

0.0400 0 0 0

0 0.0500 0 0

0 0 0.0625 0

0 0 0 0.1111

Autovalores Autovetores

¸1 = 0.0400 e1 = [0 0 0 1]’

¸2 = 0.0500 e2 = [0 0 1 0]’

¸3 = 0.0625 e3 = [0 1 0 0]’

¸4 = 0.1111 e4 = [1 0 0 0 ]’

11. Dada a matriz covariância

Σ =

⎡⎢⎢⎢⎢⎢⎢⎣

4 −1 3 4

−1 5 2 1

3 2 4 5

4 1 5 5

⎤⎥⎥⎥⎥⎥⎥⎦

determine:

(a) A matriz de correlação ½;

>> Sigma=[4 -1 3 4;-1 5 2 1;3 2 4 5;4 1 5 5]

>> V=diag(diag(Sigma))

V =

4 0 0 0

0 5 0 0

0 0 4 0

0 0 0 5

>> Vraiz=sqrtm(V)

Page 16: Análise Multivariada - trabalho

Vraiz =

2.0000 0 0 0

0 2.2361 0 0

0 0 2.0000 0

0 0 0 2.2361

>> IVraiz=inv(Vraiz)

IVraiz =

0.5000 0 0 0

0 0.4472 0 0

0 0 0.5000 0

0 0 0 0.4472

>> Corre=IVraiz*Sigma*IVraiz

Matriz de Correlação =

1.0000 -0.2236 0.7500 0.8944

-0.2236 1.0000 0.4472 0.2000

0.7500 0.4472 1.0000 1.1180

0.8944 0.2000 1.1180 1.0000

(b) Verifique a relação V 1/2½V 1/2 = Σ;

>> Corre=IVraiz*Sigma*IVraiz

Corre =

1.0000 -0.2236 0.7500 0.8944

-0.2236 1.0000 0.4472 0.2000

0.7500 0.4472 1.0000 1.1180

0.8944 0.2000 1.1180 1.0000

>> Sigma=Vraiz*Corre*Vraiz

Sigma =

4.0000 -1.0000 3.0000 4.0000

-1.0000 5.0000 2.0000 1.0000

3.0000 2.0000 4.0000 5.0000

4.0000 1.0000 5.0000 5.0000

Sigma =

4.0000 -1.0000 3.0000 4.0000

Page 17: Análise Multivariada - trabalho

-1.0000 5.0000 2.0000 1.0000

3.0000 2.0000 4.0000 5.0000

4.0000 1.0000 5.0000 5.0000

>> [e,L]=eig(Sigma)

e =

0.0997 -0.7697 0.4143 0.4754

-0.1147 -0.3916 -0.8967 0.1715

0.7156 0.3704 -0.1434 0.5745

-0.6817 0.3421 0.0609 0.6438

L =

-0.6656 0 0 0

0 0.2695 0 0

0 0 5.7140 0

0 0 0 12.6821

>> Auto=e*L*e’

Auto =

4.0000 -1.0000 3.0000 4.0000

-1.0000 5.0000 2.0000 1.0000

3.0000 2.0000 4.0000 5.0000

4.0000 1.0000 5.0000 5.0000

Então, vê-se que A = PAP ′. A= matriz dos Autovalores de sigma P= matriz dos

Autovetores de sigma

12. Uma amostra multivariada aleatória X (com 12 observações e 6 variáveis) é dada a seguir:

Page 18: Análise Multivariada - trabalho

X =

⎡⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣

39 51 53 42 55 48

47 51 53 48 53 57

43 45 46 44 44 51

49 46 49 45 48 57

51 55 44 57 49 56

52 49 39 50 44 47

57 52 55 44 43 44

48 50 47 50 55 50

53 47 52 44 50 48

54 47 51 43 47 46

55 52 50 49 54 52

43 43 45 56 52 56

⎤⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦

(a) o vetor de médias;

>> X=[39 51 53 42 55 48;47 51 53 48 53 57; 43 45 46 44 44 51; 49 46 49 45 48 57;51 55 44 57 49 56;52 49 39 50 44 47;57 52 55 44 43 44;48 50 47 50 55 50;53 47 52 44 50 48;54 47 51 43 47 46;55 52 50 49 54 52;43 43 45 56 52 56]

X =

39 51 53 42 55 48

47 51 53 48 53 57

43 45 46 44 44 51

49 46 49 45 48 57

51 55 44 57 49 56

52 49 39 50 44 47

57 52 55 44 43 44

48 50 47 50 55 50

53 47 52 44 50 48

54 47 51 43 47 46

55 52 50 49 54 52

43 43 45 56 52 56

>> mean(X)

ans =

49.2500 49.0000 48.6667 47.6667 49.5000 51.0000

(b) a matriz covariância estimada S;

S=cov(X)

Page 19: Análise Multivariada - trabalho

ans =

30.0227 6.4545 3.0000 -0.7273 -9.3182 -9.0909

6.4545 12.0000 2.8182 2.7273 2.7273 -1.3636

3.0000 2.8182 21.3333 -14.4848 4.6364 -4.6364

-0.7273 2.7273 -14.4848 24.6061 4.5455 12.8182

-9.3182 2.7273 4.6364 4.5455 19.1818 7.5455

-9.0909 -1.3636 -4.6364 12.8182 7.5455 21.0909

>> M=diag(diag(S))

M =

30.0227 0 0 0 0 0

0 12.0000 0 0 0 0

0 0 21.3333 0 0 0

0 0 0 24.6061 0 0

0 0 0 0 19.1818 0

0 0 0 0 0 21.0909

>> raizM=sqrtm(M)

raizM =

5.4793 0 0 0 0 0

0 3.4641 0 0 0 0

0 0 4.6188 0 0 0

0 0 0 4.9604 0 0

0 0 0 0 4.3797 0

0 0 0 0 0 4.5925

>> invRM=inv(raizM)

invRM =

0.1825 0 0 0 0 0

0 0.2887 0 0 0 0

0 0 0.2165 0 0 0

0 0 0 0.2016 0 0

0 0 0 0 0.2283 0

0 0 0 0 0 0.2177

>> R=invRM*S*invRM

R =

1.0000 0.3401 0.1185 -0.0268 -0.3883 -0.3613

0.3401 1.0000 0.1761 0.1587 0.1798 -0.0857

0.1185 0.1761 1.0000 -0.6322 0.2292 -0.2186

-0.0268 0.1587 -0.6322 1.0000 0.2092 0.5627

-0.3883 0.1798 0.2292 0.2092 1.0000 0.3751

-0.3613 -0.0857 -0.2186 0.5627 0.3751 1.0000

Page 20: Análise Multivariada - trabalho

(d) a matriz desvio padrão D1/2.

>> DM=diag(diag(S))

DM =

30.0227 0 0 0 0 0

0 12.0000 0 0 0 0

0 0 21.3333 0 0 0

0 0 0 24.6061 0 0

0 0 0 0 19.1818 0

0 0 0 0 0 21.0909

>> DeM=sqrtm(DM)

DeM =

5.4793 0 0 0 0 0

0 3.4641 0 0 0 0

0 0 4.6188 0 0 0

0 0 0 4.9604 0 0

0 0 0 0 4.3797 0

0 0 0 0 0 4.5925

13. O problema a seguir envolve áreas de plantio de trigo e feijão, com os resultados de imagens

obtidas por satélite. A área de estudo compreendeu as regiões de Barretos e Guaíra,

situadas no Estado de São Paulo. A tabela a seguir mostra as variáveis e as áreas de

estudo (T = trigo e F = feijão) obtidas em 17/06/86, sendo consideradas 10 áreas para

cada cultura. As siglas de identificação das 10 variáveis e seus significados são: CTM1, ...

, CTM7 - correspondem, respectivamente, aos níveis de cinza nas bandas TM1, ... , TM7;

COB - percentagem de cobertura do solo; IAF - índice de área foliar (definido como área

total de folhas por área unitária de solo); CLT - clorofila total (quantidade de clorofila a e

b (mg/10g)).

Page 21: Análise Multivariada - trabalho

Áreas CTM1 CTM2 CTM3 CTM4 CTM5 CTM7 COB IAF CLT

1. T1 4.50 6.75 5.25 71.00 45.50 8.75 97.9 5.12 18.00

2. T2 8.75 9.50 11.50 43.50 53.75 14.50 52.4 1.91 15.22

3. T7 5.75 8.25 8.50 51.25 42.00 9.50 50.6 2.74 15.61

4. T14 7.75 9.75 11.75 50.25 41.25 10.25 49.3 0.89 14.44

5. T15 5.50 6.50 5.0 73.25 40.50 6.50 96.5 6.68 17.90

6. T22 9.50 12.00 28.50 31.50 61.75 31.25 11.1 0.27 12.73

7. T26 9.00 10.25 9.25 61.75 48.00 10.00 90.2 3.71 14.82

8. T28 6.75 7.75 6.25 82.00 44.50 6.75 96.7 5.36 17.32

9. T33 6.25 6.50 5.25 80.25 46.75 6.75 96.0 6.55 15.09

10. T43 8.50 10.00 8.25 74.75 55.50 10.50 97.9 2.05 16.28

11. F3A 9.00 11.50 20.50 43.75 58.00 22.25 19.7 0.81 10.25

12. F9 5.75 7.00 11.0 28.25 31.00 9.00 14.3 0.62 12.35

13. F10 6.25 7.50 17.5 22.00 31.00 13.50 4.2 0.15 8.26

14. F17 7.00 9.75 9.75 61.25 53.75 11.75 55.3 1.96 14.36

15. F18 8.25 10.50 9.0 83.00 60.00 11.75 85.8 6.64 11.39

16. F36 6.75 8.25 8.0 59.00 46.75 9.75 45.5 2.20 12.29

17. F6A 8.00 10.00 11.0 49.25 48.00 14.00 16.9 1.17 13.27

18. F40 6.75 8.00 10.75 43.75 42.00 10.00 38.1 1.58 14.40

19. F41 7.75 10.25 15.50 45.25 58.75 20.50 29.2 0.74 15.62

20. F42 8.25 11.00 16.75 31.25 46.75 18.25 21.5 9.63 10.37

(a) montar a matriz de dados X;

>> X=[4.50 6.75 5.25 71.00 45.50 8.75 97.9 5.12 18.00; 8.75 9.50 11.50 43.50 53.75 14.50 52.4 1.91 15.22;5.75 8.25 8.50 51.25 42.00 9.50 50.6 2.74 15.61;7.75 9.75 11.75 50.25 41.25 10.25 49.3 0.89 14.44;5.50 6.50 5.0 73.25 40.50 6.50 96.5 6.68 17.90;9.50 12.00 28.50 31.50 61.75 31.25 11.1 0.27 12.73;9.00 10.25 9.25 61.75 48.00 10.00 90.2 3.71 14.82;6.75 7.75 6.25 82.00 44.50 6.75 96.7 5.36 17.32;6.25 6.50 5.25 80.25 46.75 6.75 96.0 6.55 15.09;8.50 10.00 8.25 74.75 55.50 10.50 97.9 2.05 16.28;9.00 11.50 20.50 43.75 58.00 22.25 19.7 0.81 10.25;5.75 7.00 11.0 28.25 31.00 9.00 14.3 0.62 12.35;6.25 7.50 17.5 22.00 31.00 13.50 4.2 0.15 8.26;7.00 9.75 9.75 61.25 53.75 11.75 55.3 1.96 14.36;8.25 10.50 9.0 83.00 60.00 11.75 85.8 6.64 11.39;6.75 8.25 8.0 59.00 46.75 9.75 45.5 2.20 12.29;8.00 10.00 11.0 49.25 48.00 14.00 16.9 1.17 13.27;6.75 8.00 10.75 43.75 42.00 10.00 38.1 1.58 14.40;7.75 10.25 15.50 45.25 58.75 20.50 29.2 0.74 15.62;8.25 11.00 16.75 31.25 46.75 18.25 21.5 9.63 10.37]

X =

4.50 6.75 5.25 71.00 45.50 8.75 97.90 5.12 18.00

8.75 9.50 11.50 43.50 53.75 14.50 52.40 1.91 15.22

5.75 8.25 8.50 51.25 42.00 9.50 50.60 2.74 15.61

7.75 9.75 11.75 50.25 41.25 10.25 49.30 0.89 14.44

5.50 6.50 5.00 73.25 40.50 6.50 96.50 6.68 17.90

9.50 12.00 28.50 31.50 61.75 31.25 11.10 0.27 12.73

9.00 10.25 9.25 61.75 48.00 10.00 90.20 3.71 14.82

6.75 7.75 6.25 82.00 44.50 6.75 96.70 5.36 17.32

6.25 6.50 5.25 80.25 46.75 6.75 96.00 6.55 15.09

8.50 10.00 8.25 74.75 55.50 10.50 97.90 2.05 16.28

9.00 11.50 20.50 43.75 58.00 22.25 19.70 0.81 10.25

Page 22: Análise Multivariada - trabalho

5.75 7.00 11.00 28.25 31.00 9.00 14.30 0.62 12.35

6.25 7.50 17.50 22.00 31.00 13.50 4.20 0.15 8.26

7.00 9.75 9.75 61.25 53.75 11.75 55.30 1.96 14.36

8.25 10.50 9.00 83.00 60.00 11.75 85.80 6.64 11.39

6.75 8.25 8.00 59.00 46.75 9.75 45.50 2.20 12.29

8.00 10.00 11.00 49.25 48.00 14.00 16.90 1.17 13.27

6.75 8.00 10.75 43.75 42.00 10.00 38.10 1.58 14.40

7.75 10.25 15.50 45.25 58.75 20.50 29.20 0.74 15.62

8.25 11.00 16.75 31.25 46.75 18.25 21.50 9.63 10.37

(b) estimar o vetor de médias;

>> M=mean(X)

M =

7.30 9.05 11.46 54.31 47.77 12.77 53.45 3.04 13.99

>> S=cov(X)

S =

1.89 2.13 4.73 -4.94 8.22 5.53 -11.35 -0.72 -1.22

2.13 2.92 6.72 -8.54 10.94 8.06 -20.95 -0.90 -1.72

4.73 6.72 33.94 -80.04 16.73 33.67 -150.59 -6.78 -9.38

-4.94 -8.54 -80.04 352.20 40.52 -65.53 590.45 26.02 30.46

8.22 10.94 16.73 40.52 76.05 31.28 31.42 0.06 1.18

5.53 8.06 33.67 -65.53 31.28 37.74 -132.46 -5.62 -7.25

-11.35 -20.95 -150.59 590.45 31.42 -132.46 1160.39 51.43 63.90

-0.72 -0.90 -6.78 26.02 0.06 -5.62 51.43 7.30 1.41

-1.22 -1.72 -9.38 30.46 1.18 -7.25 63.90 1.41 6.91

(d) determinar os autovalores e autovetores da matriz de covariâncias;

Matriz dos autovetores. Cada coluna é um autovetor.

>> [e,L]=eig(S)

e =

0.71 0.23 0.58 0.31 -0.07 -0.01 0.05 -0.09 -0.01

-0.50 -0.50 0.64 0.24 -0.11 -0.01 0.04 -0.13 -0.02

-0.31 0.49 0.09 0.15 0.40 0.56 0.28 -0.26 -0.12

0.02 -0.01 0.07 -0.06 0.18 0.25 -0.78 -0.27 0.46

-0.10 0.19 -0.17 0.06 -0.28 -0.42 0.08 -0.81 0.03

0.37 -0.57 -0.09 -0.36 0.22 0.33 0.27 -0.41 -0.10

0.00 -0.03 -0.04 0.07 0.00 -0.00 0.47 0.08 0.87

-0.04 0.17 0.13 -0.42 -0.75 0.45 0.02 0.01 0.04

-0.09 0.23 0.43 -0.72 0.31 -0.37 0.06 0.02 0.05

Page 23: Análise Multivariada - trabalho

A matriz de autovalores, onde estes se localizam na sua diagonal é:

L =

0.15 0 0 0 0 0 0 0 0

0 0.17 0 0 0 0 0 0 0

0 0 0.92 0 0 0 0 0 0

0 0 0 3.12 0 0 0 0 0

0 0 0 0 5.11 0 0 0 0

0 0 0 0 0 7.40 0 0 0

0 0 0 0 0 0 38.16 0 0

0 0 0 0 0 0 0 109.79 0

0 0 0 0 0 0 0 0 1514.51

(e) estimar a matriz de correlações.

X =

4.5000 6.7500 5.2500 71.0000 45.5000 8.7500 97.9000 5.1200 18.0000

8.7500 9.5000 11.5000 43.5000 53.7500 14.5000 52.4000 1.9100 15.2200

5.7500 8.2500 8.5000 51.2500 42.0000 9.5000 50.6000 2.7400 15.6100

7.7500 9.7500 11.7500 50.2500 41.2500 10.2500 49.3000 0.8900 14.4400

5.5000 6.5000 5.0000 73.2500 40.5000 6.5000 96.5000 6.6800 17.9000

9.5000 12.0000 28.5000 31.5000 61.7500 31.2500 11.1000 0.2700 12.7300

9.0000 10.2500 9.2500 61.7500 48.0000 10.0000 90.2000 3.7100 14.8200

6.7500 7.7500 6.2500 82.0000 44.5000 6.7500 96.7000 5.3600 17.3200

6.2500 6.5000 5.2500 80.2500 46.7500 6.7500 96.0000 6.5500 15.0900

8.5000 10.0000 8.2500 74.7500 55.5000 10.5000 97.9000 2.0500 16.2800

9.0000 11.5000 20.5000 43.7500 58.0000 22.2500 19.7000 0.8100 10.2500

5.7500 7.0000 11.0000 28.2500 31.0000 9.0000 14.3000 0.6200 12.3500

6.2500 7.5000 17.5000 22.0000 31.0000 13.5000 4.2000 0.1500 8.2600

7.0000 9.7500 9.7500 61.2500 53.7500 11.7500 55.3000 1.9600 14.3600

8.2500 10.5000 9.0000 83.0000 60.0000 11.7500 85.8000 6.6400 11.3900

6.7500 8.2500 8.0000 59.0000 46.7500 9.7500 45.5000 2.2000 12.2900

8.0000 10.0000 11.0000 49.2500 48.0000 14.0000 16.9000 1.1700 13.2700

6.7500 8.0000 10.7500 43.7500 42.0000 10.0000 38.1000 1.5800 14.4000

7.7500 10.2500 15.5000 45.2500 58.7500 20.5000 29.2000 0.7400 15.6200

8.2500 11.0000 16.7500 31.2500 46.7500 18.2500 21.5000 9.6300 10.3700

>> S=cov(X)

S =

1.0e+003 *

0.0019 0.0021 0.0047 -0.0049 0.0082 0.0055 -0.0113 -0.0007 -0.0012

0.0021 0.0029 0.0067 -0.0085 0.0109 0.0081 -0.0209 -0.0009 -0.0017

0.0047 0.0067 0.0339 -0.0800 0.0167 0.0337 -0.1506 -0.0068 -0.0094

-0.0049 -0.0085 -0.0800 0.3522 0.0405 -0.0655 0.5905 0.0260 0.0305

0.0082 0.0109 0.0167 0.0405 0.0761 0.0313 0.0314 0.0001 0.0012

0.0055 0.0081 0.0337 -0.0655 0.0313 0.0377 -0.1325 -0.0056 -0.0072

-0.0113 -0.0209 -0.1506 0.5905 0.0314 -0.1325 1.1604 0.0514 0.0639

-0.0007 -0.0009 -0.0068 0.0260 0.0001 -0.0056 0.0514 0.0073 0.0014

Page 24: Análise Multivariada - trabalho

-0.0012 -0.0017 -0.0094 0.0305 0.0012 -0.0072 0.0639 0.0014 0.0069

>> V=diag(diag(S))

V =

1.0e+003 *

0.0019 0 0 0 0 0 0 0 0

0 0.0029 0 0 0 0 0 0 0

0 0 0.0339 0 0 0 0 0 0

0 0 0 0.3522 0 0 0 0 0

0 0 0 0 0.0761 0 0 0 0

0 0 0 0 0 0.0377 0 0 0

0 0 0 0 0 0 1.1604 0 0

0 0 0 0 0 0 0 0.0073 0

0 0 0 0 0 0 0 0 0.0069

>> RV=sqrtm(V)

RV =

1.3755 0 0 0 0 0 0 0 0

0 1.7083 0 0 0 0 0 0 0

0 0 5.8255 0 0 0 0 0 0

0 0 0 18.7671 0 0 0 0 0

0 0 0 0 8.7208 0 0 0 0

0 0 0 0 0 6.1435 0 0 0

0 0 0 0 0 0 34.0645 0 0

0 0 0 0 0 0 0 2.7021 0

0 0 0 0 0 0 0 0 2.6285

>> IRV=inv(RV)

IRV =

0.7270 0 0 0 0 0 0 0 0

0 0.5854 0 0 0 0 0 0 0

0 0 0.1717 0 0 0 0 0 0

0 0 0 0.0533 0 0 0 0 0

0 0 0 0 0.1147 0 0 0 0

0 0 0 0 0 0.1628 0 0 0

0 0 0 0 0 0 0.0294 0 0

0 0 0 0 0 0 0 0.3701 0

0 0 0 0 0 0 0 0 0.3804

>> R=IRV*S*IRV

R =

1.0000 0.9074 0.5897 -0.1913 0.6849 0.6546 -0.2421 -0.1940 -0.3388

0.9074 1.0000 0.6755 -0.2664 0.7343 0.7681 -0.3599 -0.1956 -0.3820

0.5897 0.6755 1.0000 -0.7321 0.3293 0.9408 -0.7588 -0.4304 -0.6124

-0.1913 -0.2664 -0.7321 1.0000 0.2476 -0.5683 0.9236 0.5131 0.6175

0.6849 0.7343 0.3293 0.2476 1.0000 0.5839 0.1058 0.0025 0.0513

0.6546 0.7681 0.9408 -0.5683 0.5839 1.0000 -0.6329 -0.3383 -0.4488

-0.2421 -0.3599 -0.7588 0.9236 0.1058 -0.6329 1.0000 0.5588 0.7137

-0.1940 -0.1956 -0.4304 0.5131 0.0025 -0.3383 0.5588 1.0000 0.1984

-0.3388 -0.3820 -0.6124 0.6175 0.0513 -0.4488 0.7137 0.1984 1.0000

14. Uma amostra multivariada X de tamanho n = 12 foi obtida de um vetor aleatório p =

Page 25: Análise Multivariada - trabalho

[alturas pesos], resultando

Indivíduo Altura Peso

1 165 83

2 180 82

3 178 67

4 167 72

5 190 95

6 175 70

7 178 75

8 183 80

9 169 70

10 177 73

11 184 85

12 170 68

(a) Construir a matriz de dados;

>> X=[165 83;180 82; 178 67; 167 72;190 95; 175 70;178 75;183 80;169 70;177 73;184 85;170 68]

X =

165 83

180 82

178 67

167 72

190 95

175 70

178 75

183 80

169 70

177 73

184 85

170 68

(b) calcular o vetor de médias;

>> EX=mean(X)

EX =

176.3333 76.6667

Page 26: Análise Multivariada - trabalho

165 170 175 180 185 19065

Altura

Pes

Resolver os problemas 15 até 21, sem uso do MATLAB.

15. Determinar os autovalores e autovetores normalizados da matriz A =

⎡⎣ 9 −3

−3 9

⎤⎦ .

Seja Ae = ¸e, então (A− ¸I)e = 0, assim

∣ A− ¸I ∣= 0 ⇒∣∣∣∣∣∣9− ¸ −3

−3 9− ¸

∣∣∣∣∣∣= 0 ⇒ (9− ¸)2 − 9 = 0 ⇒ (¸− 6)(¸− 12) = 0

Para ¸1 = 6 Para ¸2 = 12⎛⎝ 3 −3

−3 3

⎞⎠

⎛⎝ e11

e21

⎞⎠ =

⎛⎝ 0

⎞⎠

⎛⎝ −3 −3

−3 −3

⎞⎠

⎛⎝ f11

f21

⎞⎠ =

⎛⎝ 0

⎞⎠

⎧⎨⎩

3e11 − 3e21 = 0

−3e11 + 3e21 = 0

⎧⎨⎩

−3f11 − 3f21 = 0

3e11 = 3e21 ⇒ e11 = e21 −3f11 = 3f21 ⇒ f11 = −f21

Para autovetores normalizados, tem-se: Para autovetores normalizados, tem-se:√(e11)2 + (e11)2 = 1

√(f11)2 + (−f11)2 = 1

Assim e11 =1√2e e21 =

1√2

Assim f11 =1√2e f21 = − 1√

¸1 = 6, autovetor e =

⎛⎝

1√2

⎞⎠ ¸2 = 12, autovetor f =

⎛⎝

1√2

− 1√2

⎞⎠

16. Pesquisar o que é uma pseudo-inversa. Exemplificar e dar suas propriedades.

Definição: Dada a matriz A : mxn, m ≥ n com posto(A) = r e sua fatoração em de-

composição em valores singulares (SVD), chama-se pseudo-inversa de Moore-Penrose de

Page 27: Análise Multivariada - trabalho

A, a matriz A+ ∈ IRnxm, A+ = V Σ+UT , onde Σ+ = diag

Ã1

¾1, ...1

¾r,0...,0

)∈ IRnxm,

U = [u1, ..., um] e v = [v1, ..., vn]. Se posto(A) = n, então A+ = (ATA)−1AT . Se

m = n = posto(A), então A+ = A−1.

Teorema:(Pseudo-Inversa) Para toda matriz A ∈ IRmxn, existe uma única matriz

A+ ∈ IRnxm, denominada pseudo-inversa de A, satisfazendo as condições de Moore-

Penrose.

(a) AA+A = A

(b) (A+A)T = A+A

(d) (AA+)T = AA+

Demonstração: Seja A = UΣV T uma SVD da matriz A. Sabemos que A+ = V Σ+UT .

Assim:

(a) AA+A = UΣV TV Σ+UTUΣV T = UΣΣ+ΣV T = UΣV T = A

(b) (A+A)T = (V Σ+UTUΣV T )T = V (Σ+Σ)TV T = V (Σ+Σ)V T = V Σ+UTUΣV T =

A+A

(d) (AA+)T = (UΣV TV Σ+UT )T = U(ΣΣ+)TUT = U(ΣΣ+)UT = UΣV TV Σ+UT =

AA+

17. Dar um exemplo de uma matriz ortogonal 3 X 3 e calcular o determinante associado. Em

Álgebra linear, uma matriz ortogonal é uma matriz real M cuja inversa coincide com a sua

transposta, isto é: M−1 = MT , isto é, MMT = MTM = I Ex:

- A matriz Identidade, A =

⎛⎜⎜⎜⎝

1 0 0

0 1 0

0 0 1

⎞⎟⎟⎟⎠, det(A) = 1.

- B =

⎛⎜⎜⎜⎝

0 1√2

− 1√2

43√2

− 13√2

⎞⎟⎟⎟⎠, det(B) = −1

18. Provar as propriedades da transposta de uma matriz.

Page 28: Análise Multivariada - trabalho

(a) (AT )T = A

- O elemento (i, j) da matriz A é o elemento aji.

- O elemento (i, j) da matriz AT é o elemento ®ij = aji.

- Portanto, o elemento (i, j) de (AT )T é o elemento ®ji = aij

(b) (A+B)T = AT +BT

Seja C = A + B então cij = aij + bij . Logo cij ∈ CT = (A + B)T . Por outro lado,

aij ∈ A ⇒ aij ∈ AT

bij ∈ B ⇒ bij ∈ BT

⎫⎬⎭ = aij + bij ∈ AT +BT .

Logo cij = aij + bij .

é uma matriz mxn e o seu elemento (i, j) é dado por cij =p∑

k=1

aikbkj .

a matriz (AB)T é portanto uma matriz nxm e nela, o elemento cij ocupa a i-ésima

coluna e a j-ésima linha. Por outro lado, a matriz BTAT também é de ordem nxm.

O elemento (i, j) de AT é o elemento ®ij = aji, assim como o elemento (i, j) de BT

é o elemento ¯ij = bji. Logo, o elemento de BTAT que ocupa a i-ésima coluna e a

j-ésima linha é dado por

p∑

k=1

¯jk®ki =

p∑

k=1

bkjaik = cij

(d) (kA)T = kAT

Seja C = kA, logo o elemento (i, j) de C é dado por cij = kaij . Na matriz (kA)T , o

elemento cij ocupa a i-ésima coluna e a j-ésima linha.

Por outro lado, o elemento (i, j) de AT é o elemento ®ij = aij . Logo, o elemento de

kAT que ocupa a i-ésima coluna e a jésima linha é dado por

k®ji = kaij = cij .

19. Provar as propriedades comutativa e associativa da adição de matrizes.

(a) Comutativa ⇒ A+B = B +A

Dada as matrizes A = [aij ]mxn e B = [bij ]mxn, tem-se:

Page 29: Análise Multivariada - trabalho

A =

⎛⎜⎜⎜⎜⎜⎜⎝

a11 a12 . . . a1n

a21 a22 . . . a2n...

.... . .

...

am1 am2 . . . amn

⎞⎟⎟⎟⎟⎟⎟⎠, B =

⎛⎜⎜⎜⎜⎜⎜⎝

b11 b12 . . . b1n

b21 b22 . . . b2n...

.... . .

...

bm1 bm2 . . . bmn

⎞⎟⎟⎟⎟⎟⎟⎠, assim

A+B =

⎛⎜⎜⎜⎜⎜⎜⎝

a11 + b11 a12 + b12 . . . a1n + b1n

a21 + b21 a22 + b22 . . . a2n + b2n...

.... . .

...

am1 + bm1 am2 + bm2 . . . amn + bmn

⎞⎟⎟⎟⎟⎟⎟⎠

⎛⎜⎜⎜⎜⎜⎜⎝

b11 + a11 b12 + a12 . . . b1n + a1n

b21 + a21 b22 + a22 . . . b2n + a2n...

.... . .

...

bm1 + am1 bm2 + am2 . . . bmn + amn

⎞⎟⎟⎟⎟⎟⎟⎠

= B +A,

logo

A+B = B +A

(b) Associativa ⇒ (A+B) + C = A+ (B + C)

Dada as matrizes A = [aij ]mxn, B = [bij ]mxn e C = [cij ]mxn, tem-se:

A =

⎛⎜⎜⎜⎜⎜⎜⎝

a11 a12 . . . a1n

a21 a22 . . . a2n...

.... . .

...

am1 am2 . . . amn

⎞⎟⎟⎟⎟⎟⎟⎠, B =

⎛⎜⎜⎜⎜⎜⎜⎝

b11 b12 . . . b1n

b21 b22 . . . b2n...

.... . .

...

bm1 bm2 . . . bmn

⎞⎟⎟⎟⎟⎟⎟⎠

C =

⎛⎜⎜⎜⎜⎜⎜⎝

c11 c12 . . . c1n

c21 c22 . . . c2n...

.... . .

...

cm1 cm2 . . . cmn

⎞⎟⎟⎟⎟⎟⎟⎠, assim:

(A+B)+C =

⎛⎜⎜⎜⎜⎜⎜⎝

a11 + b11 a12 + b12 . . . a1n + b1n

a21 + b21 a22 + b22 . . . a2n + b2n...

.... . .

...

am1 + bm1 am2 + bm2 . . . amn + bmn

⎞⎟⎟⎟⎟⎟⎟⎠+

⎛⎜⎜⎜⎜⎜⎜⎝

c11 c12 . . . c1n

c21 c22 . . . c2n...

.... . .

...

cm1 cm2 . . . cmn

⎞⎟⎟⎟⎟⎟⎟⎠

⎛⎜⎜⎜⎜⎜⎜⎝

a11 + b11 + c11 a12 + b12 + c12 . . . a1n + b1n + c1n

a21 + b21 + c21 a22 + b22 + c22 . . . a2n + b2n + c2n...

.... . .

...

am1 + bm1 + cm1 am2 + bm2 + cm2 . . . amn + bmn + cmn

⎞⎟⎟⎟⎟⎟⎟⎠

Page 30: Análise Multivariada - trabalho

⎛⎜⎜⎜⎜⎜⎜⎝

a11 a12 . . . a1n

a21 a22 . . . a2n...

.... . .

...

am1 am2 . . . amn

⎞⎟⎟⎟⎟⎟⎟⎠

⎛⎜⎜⎜⎜⎜⎜⎝

b11 + c11 b12 + c12 . . . b1n + c1n

b21 + c21 b22 + c22 . . . b2n + c2n...

.... . .

...

bm1 + cm1 bm2 + cm2 . . . bmn + cmn

⎞⎟⎟⎟⎟⎟⎟⎠

= A+ (B + C)

Portanto, (A+B) + C = A+ (B + C)

20. Provar as propriedades comutativa, associativa e distributiva da multiplicação de escalar

por matriz.

(a) Comutativa ⇒ kA = Ak

Seja A uma matriz mxn, tal que A =

⎛⎜⎜⎜⎜⎜⎜⎝

a11 a12 . . . a1n

a21 a22 . . . a2n...

.... . .

...

am1 am2 . . . amn

⎞⎟⎟⎟⎟⎟⎟⎠

e seja k ∈ IR, assim

kA = k

⎛⎜⎜⎜⎜⎜⎜⎝

a11 a12 . . . a1n

a21 a22 . . . a2n...

.... . .

...

am1 am2 . . . amn

⎞⎟⎟⎟⎟⎟⎟⎠

⎛⎜⎜⎜⎜⎜⎜⎝

ka11 ka12 . . . ka1n

ka21 ka22 . . . ka2n...

.... . .

...

kam1 kam2 . . . kamn

⎞⎟⎟⎟⎟⎟⎟⎠

⎛⎜⎜⎜⎜⎜⎜⎝

a11k a12k . . . a1nk

a21k a22k . . . a2nk...

.... . .

...

am1k am2k . . . amnk

⎞⎟⎟⎟⎟⎟⎟⎠

⎛⎜⎜⎜⎜⎜⎜⎝

a11 a12 . . . a1n

a21 a22 . . . a2n...

.... . .

...

am1 am2 . . . amn

⎞⎟⎟⎟⎟⎟⎟⎠

k = Ak

(b) Associativa ⇒ k1(k2A) = (k1k2)A

Seja A uma matriz mxn, tal que A =

⎛⎜⎜⎜⎜⎜⎜⎝

a11 a12 . . . a1n

a21 a22 . . . a2n...

.... . .

...

am1 am2 . . . amn

⎞⎟⎟⎟⎟⎟⎟⎠

e seja k1, k2 ∈ IR,

assim

k1(k2A) = k1

⎛⎜⎜⎜⎜⎜⎜⎝

k2a11 k2a12 . . . k2a1n

k2a21 k2a22 . . . k2a2n...

.... . .

...

k2am1 k2am2 . . . k2amn

⎞⎟⎟⎟⎟⎟⎟⎠

⎛⎜⎜⎜⎜⎜⎜⎝

k1k2a11 k1k2a12 . . . k1k2a1n

k1k2a21 k1k2a22 . . . k1k2a2n...

.... . .

...

k1k2am1 k1k2am2 . . . k1k2amn

⎞⎟⎟⎟⎟⎟⎟⎠

Page 31: Análise Multivariada - trabalho

⎛⎜⎜⎜⎜⎜⎜⎝

(k1k2) a11 (k1k2) a12 . . . (k1k2) a1n

(k1k2) a21 (k1k2) a22 . . . (k1k2) a2n...

.... . .

...

(k1k2) am1 (k1k2) am2 . . . (k1k2) amn

⎞⎟⎟⎟⎟⎟⎟⎠

= (k1k2)

⎛⎜⎜⎜⎜⎜⎜⎝

a11 a12 . . . a1n

a21 a22 . . . a2n...

.... . .

...

am1 am2 . . . amn

⎞⎟⎟⎟⎟⎟⎟⎠

k1k2A

Logo k1(k2A) = (k1k2)A

- k(A+B) = kA+ kB

Dada as matrizes A = [aij ]mxn, B = [bij ]mxn e k ∈ IR tem-se:

k(A+B) = k

⎛⎜⎜⎜⎜⎜⎜⎝

a11 + b11 a12 + b12 . . . a1n + b1n

a21 + b21 a22 + b22 . . . a2n + b2n...

.... . .

...

am1 + bm1 am2 + bm2 . . . amn + bmn

⎞⎟⎟⎟⎟⎟⎟⎠

⎛⎜⎜⎜⎜⎜⎜⎝

k (a11 + b11) k (a12 + b12) . . . k (a1n + b1n)

k (a21 + b21) k (a22 + b22) . . . k (a2n + b2n)...

.... . .

...

k (am1 + bm1) k (am2 + bm2) . . . k (amn + bmn)

⎞⎟⎟⎟⎟⎟⎟⎠

⎛⎜⎜⎜⎜⎜⎜⎝

(ka11 + kb11) (ka12 + kb12) . . . (ka1n + kb1n)

(ka21 + kb21) (ka22 + kb22) . . . (ka2n + kb2n)...

.... . .

...

(kam1 + kbm1) (kam2 + kbm2) . . . (kamn + kbmn)

⎞⎟⎟⎟⎟⎟⎟⎠

⎛⎜⎜⎜⎜⎜⎜⎝

ka11 ka12 . . . ka1n

ka21 ka22 . . . ka2n...

.... . .

...

kam1 kam2 . . . kamn

⎞⎟⎟⎟⎟⎟⎟⎠

⎛⎜⎜⎜⎜⎜⎜⎝

kb11 kb12 . . . kb1n

kb21 kb22 . . . kb2n...

.... . .

...

kbm1 kbm2 . . . kbmn

⎞⎟⎟⎟⎟⎟⎟⎠

= kA+ kB. Portanto, k(A+B) = kA+ kB

- (k1 + k2)A = k1A+ k2A

Dada a matriz A = [aij ]mxn e k1, k2 ∈ IR, tem-se:

(k1 + k2)A = (k1 + k2)

⎛⎜⎜⎜⎜⎜⎜⎝

a11 a12 . . . a1n

a21 a22 . . . a2n...

.... . .

...

am1 am2 . . . amn

⎞⎟⎟⎟⎟⎟⎟⎠

Page 32: Análise Multivariada - trabalho

⎛⎜⎜⎜⎜⎜⎜⎝

(k1 + k2)a11 (k1 + k2)a12 . . . (k1 + k2)a1n

(k1 + k2)a21 (k1 + k2)a22 . . . (k1 + k2)a2n...

.... . .

...

(k1 + k2)am1 (k1 + k2)am2 . . . (k1 + k2)amn

⎞⎟⎟⎟⎟⎟⎟⎠

⎛⎜⎜⎜⎜⎜⎜⎝

(k1a11 + k2a11) (k1a12 + k2a12) . . . (k1a1n + k2a1n)

(k1a21 + k2a21) (k1a22 + k2a22) . . . (k1a2n + k2a2n)...

.... . .

...

(k1am1 + k2am1) (k1am2 + k2am2) . . . (k1amn + k2amn)

⎞⎟⎟⎟⎟⎟⎟⎠

⎛⎜⎜⎜⎜⎜⎜⎝

(k1)a11 (k1)a12 . . . (k1)a1n

(k1)a21 (k1)a22 . . . (k1)a2n...

.... . .

...

(k1)am1 (k1)am2 . . . (k1)amn

⎞⎟⎟⎟⎟⎟⎟⎠+

⎛⎜⎜⎜⎜⎜⎜⎝

(k2)a11 (k2)a12 . . . (k2)a1n

(k2)a21 (k2)a22 . . . (k2)a2n...

.... . .

...

(k2)am1 (k2)am2 . . . (k2)amn

⎞⎟⎟⎟⎟⎟⎟⎠

= k1A+ k2A.

Portanto, (k1 + k2)A = k1A+ k2A.

21. Provar todas as propriedades da multiplicação de duas matrizes.

(a) Distributividade da soma à direita, (A+B)C = AC +BC

Seja D = A+B

- elemento (i, k) de D:

dik = aik + bik (1)

- elemento (i, j) da matriz ((A+B)C)

((A+B)C)ij = (DC)ij =

p∑

k=1

dikckj =

p∑

k=1

aikckj + bikckj (2)

- elemento (i, j) da matriz (AC + BC) ≡ soma dos elementos (i, j) das matrizes

AC e BC.

((AC +BC))ij = (AC)ij + (BC)ij =

Ãp∑

k=1

aikckj

Ãp∑

k=1

bikckj

p∑

k=1

aikckj + bikckj = ((A+B)C)ij (3)

(b) Associatividade, A(BC) = (AB)C Seja D = BC

Page 33: Análise Multivariada - trabalho

- elemento (k, j) de D:

dkj =

q∑

l=1

bklclj (4)

- elemento (i, j) de AD:

(AD)ij =

p∑

k=1

aikdkj (5)

Substituindo (4) em (5):

(AD)ij =

p∑

k=1

p∑

l=1

aikbklclj (6)

Seja Z = AB ≡ elemento (i, j) de (AB)C:

((AB)C)ij = (ZC)ij =

q∑

l=1

zilclj =

q∑

l=1

Ãp∑

k=1

aikbkl

)clj =

q∑

l=1

p∑

k=1

aikbklclj = (A(BC))ij

2 Lista 2 - Distribuição Normal Multivariada

1. Utilizando a função Matlab (que gera amostras aleatórias normais multivariadas): Xi =

mvnrnd(¹,Σ, n), i = 1, 2, 3, . . . sendo: ¹ = [4.5 6.0 8.5 10.0 12.5 15.0] o vetor de médias,

Σ =

⎡⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣

15.0000 1.5000 3.0000 2.3000 5.1000 0.9000

1.5000 13.0000 2.7000 3.6000 4.7000 2.8000

3.0000 2.7000 13.9000 5.2000 6.2000 3.2000

2.3000 3.6000 5.2000 25.0000 3.1000 5.2000

5.1000 4.7000 6.2000 3.1000 36.0000 4.8000

0.9000 2.8000 3.2000 5.2000 4.8000 48.0000

⎤⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦

a matriz de covariâncias e n o tamanho das amostras, gerar as amostras aleatórias normais

multivariadas X1, X2 e X3 do vetor de médias ¹ e Σ a matriz de covariâncias com tamanho:

(a) n = 10, calculando em seguida, para X1, o vetor de médias amostrais (X) e a matriz

de covariâncias amostrais (S), comparando esses valores com os parâmetros ¹ e Σ.

Discutir as diferenças.

>> MI=[4.5 6 8.5 10 12.5 15]

MI =

4.5000 6.0000 8.5000 10.0000 12.5000 15.0000

Page 34: Análise Multivariada - trabalho

>> Cov=[15 1.5 3.0 2.3 5.1 0.9; 1.5 13.0 2.7 3.6 4.7 2.8; 3.0 2.7 13.9 5.2 6.2 3.2; 2.3 3.6 5.2 25.0 3.1 5.2;5.1 4.7 6.2 3.1 36.0 4.8;0.9 2.8 3.2 5.2 4.8 48.0]

Cov =

15.0000 1.5000 3.0000 2.3000 5.1000 0.9000

1.5000 13.0000 2.7000 3.6000 4.7000 2.8000

3.0000 2.7000 13.9000 5.2000 6.2000 3.2000

2.3000 3.6000 5.2000 25.0000 3.1000 5.2000

5.1000 4.7000 6.2000 3.1000 36.0000 4.8000

0.9000 2.8000 3.2000 5.2000 4.8000 48.0000

>> X1=mvnrnd(MI,Cov,10)

X1 =

6.5824 1.3693 10.4200 14.0294 11.8459 9.3273

11.6026 17.5895 7.6237 7.1229 15.6737 16.4204

-4.2485 7.7255 9.8072 5.0986 13.0840 6.6432

7.8392 6.1079 14.9699 8.4866 17.3463 8.2866

5.7346 8.6856 10.9781 -2.5282 9.6254 13.2773

-0.5647 4.7588 11.0591 17.0322 11.5824 26.7321

2.8207 5.3871 10.6869 12.0000 11.7389 10.2523

5.8270 11.4728 8.6750 7.6792 17.8671 18.2602

18.3591 12.4369 13.2687 20.2792 25.2909 17.1399

15.2260 12.1528 8.7717 3.9651 23.1206 23.0164

>> mean(X1)

ans =

6.9178 8.7686 10.6260 9.3165 15.7175 14.9356

>> S=cov(X1)

S =

46.9874 18.2327 1.3555 6.9462 28.3493 12.9910

18.2327 22.2742 -4.3880 -7.6632 13.6887 10.4479

1.3555 -4.3880 4.7934 5.2097 1.4845 -4.0889

6.9462 -7.6632 5.2097 44.8926 9.2218 9.3750

28.3493 13.6887 1.4845 9.2218 27.2998 11.1871

12.9910 10.4479 -4.0889 9.3750 11.1871 43.5201

Para n = 10, tanto o vetor de médias X como a matriz de covariâncias amostrais S

têm seus valores bem distantes dos valores originais do vetor de médias ¹ e da matriz

Page 35: Análise Multivariada - trabalho

de covariâncias Σ, respectivamente.

(b) n = 100, calculando em seguida, para X2, o vetor de médias amostrais (X) e a matriz

de covariâncias amostrais (S), comparando esses valores com os parâmetros ¹ e Σ.

Discutir as diferenças.

>> X2=mvnrnd(MI,Cov,100);

>> mean(X2)

ans =

4.5417 7.0864 8.6808 10.0058 13.0134 14.8672

>> S2=cov(X2)

S2 =

14.6431 2.7541 3.6464 3.1158 5.3392 -1.2280

2.7541 13.6900 3.0848 3.5469 6.8503 0.3377

3.6464 3.0848 13.7587 6.0858 4.9247 5.7381

3.1158 3.5469 6.0858 26.5766 6.0904 6.3325

5.3392 6.8503 4.9247 6.0904 33.3137 2.5282

-1.2280 0.3377 5.7381 6.3325 2.5282 41.0911

Para n = 100, o vetor de médias X tem seus valores bem próximos do vetor de

médias¹, diferindo em apenas algumas unidades. Quanto a matriz de covariâncias

amostrais S seus valores estão bem distantes dos valores originais da matriz de covar-

iâncias Σ.

matriz de covariâncias amostrais (S), comparando esses valores com os parâmetros ¹

e Σ. Discutir as diferenças.

>> X3=mvnrnd(MI,Cov,1000);

>> mean(X3)

ans =

4.4758 6.1065 8.5225 9.8296 12.4343 14.8078

>> S3=cov(X3)

S3 =

14.4039 1.5281 2.7079 2.1403 3.7544 0.6423

1.5281 11.8247 2.6428 2.5697 4.0056 4.2034

2.7079 2.6428 12.7488 4.3487 5.2230 3.1401

Page 36: Análise Multivariada - trabalho

2.1403 2.5697 4.3487 24.2446 2.5543 7.5897

3.7544 4.0056 5.2230 2.5543 32.5033 3.3190

0.6423 4.2034 3.1401 7.5897 3.3190 46.9719

Para n = 1000, tanto o vetor de médias X como a matriz de covariâncias amostrais S

têm seus valores bem próximos dos valores originais do vetor de médias ¹ e da matriz

de covariâncias Σ, respectivamente.

(d) Para os itens (a), (b) e (c) verificar a normalidade de cada amostra.

Usar:

function [ d2,q2 ] = normult( x )

%d2 = distâncias quadráticas

%q2 = qui-quadrado

%x= amostra multivariada

%função destinada a averiguar a normalidade multivariada

%Qual a dimensão de x?

[n,p]=size(x);

m=mean(x);

S=cov(x);

% cálculo das distâncias generalizadas, d2

for i=1:n

d2(i)=(x(i,:)-m)*inv(S)*(x(i,:)-m)’;

end

%ordem crescente

d2=sort(d2);

%calculo dos q2

for i=1:n

q2(i)=chi2inv(((i-0.5)/n),p);

end

%grafico

plot(d2,q2,’*K’)

xlabel(’d^2’)

ylabel(’chi^2’)

grid

Page 37: Análise Multivariada - trabalho

end

Para o item (a)

[d2j , Â

Ãj − 1

)]=

q2 =

1.6354 2.6613 3.4546 4.1973 4.9519 5.7652 6.6948 7.8408 9.4461 12.5916

ans =

2.5302 3.3036 4.4551 4.8674 5.3506 5.6743 6.5874 6.6517 7.2706 7.3091

2.5 3 3.5 4 4.5 5 5.5 6 6.5 7 7.50

chi2

Para o item (b)

[d2j , Â

Ãj − 1

100

)]=

>> normult(X2);

q2 =

0.6757 1.0160 1.2373 1.4140 1.5659 ... 14.4494 15.7774 18.5476

ans =

0.8834 0.9080 1.2236 1.6460 ... 13.0529 14.7759 16.1014 18.2444

Page 38: Análise Multivariada - trabalho

0 5 10 15 200

chi2

Para o item (c)

[d2j , Â

Ãj − 1

1000

)]=

q2 =

0.2994 0.4394 0.5266 0.5940 0.6504 ... 19.4271 20.2494 21.4857 24.1028

ans =

0.4914 0.6709 0.7719 0.7788 0.9040 ... 19.6546 20.1195 20.5514 20.7033

0 5 10 15 20 250

chi2

2. Uma amostra aleatória de n = 70 indivíduos do vetor aleatório: X = [X1, X2, X3]′, onde:

X1 = idade (anos), X2 = peso (kg) e X3 = altura (cm), é dada a seguir:

Page 39: Análise Multivariada - trabalho

X1 X2 X3

29 71 170

25 65 158

30 69 170

31 69 175

27 61 155

34 72 172

34 73 176

30 71 174

31 77 177

31 69 165

29 72 172

32 75 178

28 73 174

37 71 173

30 71 170

33 68 169

30 67 171

30 74 174

28 67 161

31 72 175

26 67 161

32 69 170

35 72 173

28 70 171

33 68 171

34 77 180

25 68 159

26 63 159

32 70 176

29 64 165

Page 40: Análise Multivariada - trabalho

32 62 156

32 76 179

32 70 168

34 75 175

32 73 171

34 73 177

26 63 157

30 66 165

30 68 166

25 61 154

31 66 167

27 74 175

34 74 184

28 63 155

32 71 169

31 66 168

27 62 157

23 63 154

30 74 176

27 68 171

32 74 179

32 66 172

35 72 177

32 70 177

28 63 159

31 65 161

27 72 170

30 70 174

30 67 163

30 73 176

29 70 168

33 68 172

24 71 165

Page 41: Análise Multivariada - trabalho

31 72 174

33 79 176

32 77 178

32 68 170

30 65 162

32 71 177

Verificar a normalidade do vetor aleatório X.

d2j Â23

Ãj − 1

)

>> normult(X)

d2 =

Columns 1 through 11

0.2556 0.3173 0.3326 0.3326 0.4465 0.4606 0.6031 0.6491 0.7674 0.8370 1.0962

Columns 12 through 16

1.1121 1.1979 1.4144 1.5191 1.6057

Columns 17 through 27

1.6646 1.6969 1.7103 1.7106 1.7351 1.7416 1.7570 1.8258 1.8387 1.8826 1.9208

Columns 28 through 32

1.9396 1.9992 2.0073 2.0530 2.1582

Columns 33 through 43

2.3807 2.4055 2.4649 2.5009 2.5071 2.6760 2.7943 2.8713 2.9153 3.0750 3.0953

Columns 44 through 48

3.1039 3.1289 3.1679 3.1837 3.1871

Columns 49 through 59

3.2703 3.6031 3.6705 3.6872 3.7317 3.8597 3.9231 4.0450 4.2108 4.2481 4.5922

Columns 60 through 64

5.0297 5.3688 5.5681 5.6340 5.9425

Columns 65 through 70

6.0255 6.8449 7.7218 7.8503 9.3072 10.8191

Page 42: Análise Multivariada - trabalho

0 2 4 6 8 10 120

chi2

3. Os dados da tabela seguinte foram obtidos tomando-se 4 medidas diferentes de dureza,

X1, X2, X3 e X4, de cada uma das n = 50 bordas de chapas. A primeira medida envolve

a transmissão de uma onda de choque sobre as bordas, a segunda medida é determinada

enquanto as bordas estão vibrando, e as últimas são obtidas a partir de testes estáticos.

>> Y=[1949 1842 1666 1437;1814 1719 1647 1388;1901 1893 1668 1527;2084 1916 1808 1489;1991 1894 1753 1481;2030 1919 1640 1491;2076 1934 1666 1586;1830 1816 1605 1444;1948 1855 1661 1436;1944 1782 1632 1415;1919 1799 1667 1523;1985 1903 1671 1571;2122 1912 1701 1592;1997 1881 1682 1447;2098 1913 1724 1517;1944 1807 1654 1457;2001 1849 1715 1500;1937 1842 1683 1450;2047 1937 1660 1482;1980 1882 1714 1474;2038 1977 1776 1569;2053 1920 1744 1607;1994 1820 1709 1488;2071 1944 1747 1517;2185 2017 1766 1597;2042 1942 1723 1501;1999 1924 1618 1576;2073 2009 1785 1586;2004 1875 1693 1448;1911 1859 1641 1444;2039 1923 1694 1565;2000 1871 1644 1507;1978 1993 1740 1534;2102 1950 1758 1470;2149 1921 1725 1547;1958 1963 1704 1532;2008 1921 1711 1483;1935 1804 1634 1424;2054 1964 1705 1521;1811 1848 1689 1406;2079 1904 1733 1516;2018 1917 1761 1519;2021 1906 1688 1558;2097 1901 1676 1528;1978 1946 1750 1486;1989 1893 1696 1558

1898 1865 1635 1500;1867 1783 1614 1450;1944 1833 1579 1495

2022 1929 1760 1494]

Y =

1949 1842 1666 1437

1814 1719 1647 1388

1901 1893 1668 1527

2084 1916 1808 1489

1991 1894 1753 1481

2030 1919 1640 1491

2076 1934 1666 1586

1830 1816 1605 1444

1948 1855 1661 1436

1944 1782 1632 1415

1919 1799 1667 1523

1985 1903 1671 1571

2122 1912 1701 1592

1997 1881 1682 1447

2098 1913 1724 1517

1944 1807 1654 1457

2001 1849 1715 1500

1937 1842 1683 1450

2047 1937 1660 1482

1980 1882 1714 1474

Page 43: Análise Multivariada - trabalho

2038 1977 1776 1569

2053 1920 1744 1607

1994 1820 1709 1488

2071 1944 1747 1517

2185 2017 1766 1597

2042 1942 1723 1501

1999 1924 1618 1576

2073 2009 1785 1586

2004 1875 1693 1448

1911 1859 1641 1444

2039 1923 1694 1565

2000 1871 1644 1507

1978 1993 1740 1534

2102 1950 1758 1470

2149 1921 1725 1547

1958 1963 1704 1532

2008 1921 1711 1483

1935 1804 1634 1424

2054 1964 1705 1521

1811 1848 1689 1406

2079 1904 1733 1516

2018 1917 1761 1519

2021 1906 1688 1558

2097 1901 1676 1528

1978 1946 1750 1486

1989 1893 1696 1558

1898 1865 1635 1500

1867 1783 1614 1450

1944 1833 1579 1495

2022 1929 1760 1494

Verificar a normalidade do vetor aleatório X = [X1, X2, X3, X4]′.

d2j Â24

Ãj − 1

)

d2 q2

0.7185 0.2971

1.1178 0.5351

1.1429 0.7107

1.3561 0.8616

1.3988 0.9987

1.5479 1.1268

1.5542 1.2488

1.5869 1.3665

1.6037 1.4810

1.8767 1.5933

1.9487 1.7039

Page 44: Análise Multivariada - trabalho

1.9792 1.8136

2.1394 1.9226

2.2011 2.0313

2.2267 2.1402

2.2886 2.2494

2.3910 2.3593

2.4764 2.4701

2.5079 2.5821

2.5619 2.6955

2.5626 2.8106

2.5688 2.9277

3.0283 3.0469

3.1915 3.1687

3.4710 3.2933

3.6621 3.4209

3.7459 3.5521

3.8643 3.6871

4.2957 3.8265

4.4187 3.9706

4.5159 4.1201

4.5229 4.2755

4.9482 4.4377

5.0309 4.6074

5.0393 4.7857

5.1432 4.9738

5.2379 5.1730

5.3510 5.3853

5.6204 5.6127

5.8405 5.8581

5.9066 6.1251

5.9812 6.4185

6.0689 6.7449

6.9324 7.1137

7.0571 7.5390

7.3377 8.0434

7.5011 8.6664

7.5174 9.4877

9.1262 10.7119

9.8881 13.2767

Page 45: Análise Multivariada - trabalho

0 2 4 6 8 100

chi2

4. Representar graficamente uma distribuição normal bivariada com vetor de médias ¹ =

[10 15]′ e matriz covariância Σ =

⎡⎣ 4 0

0 9

⎤⎦ .

Como ¹1 = 10, ¹2 = 15, ¾1 = 2 e ¾2 = 3, temos

f(x1) =1

2√2¼

e−(x1 − 10)2

2 ⋅ 22

f(x2) =1

3√2¼

e−(x2 − 15)2

2 ⋅ 32

logo a f.d.p. conjunta é dada por:

f(x1, x2) = f(x1) ⋅ f(x2)

2√2¼

e−(x1 − 10)2

2 ⋅ 22 ⋅ 1

3√2¼

e−(x2 − 15)2

2 ⋅ 32

12¼e−⎡⎣(x1 − 10)2

(x2 − 15)2

⎤⎦

>> x1=3:0.1:17;

>> x2=10:0.1:24;

>> [x1,x2]=meshgrid(x1,x2);

>> z=(1/(12*pi))*exp(((-1/8)*(x1-10).^2)+(-(1/18)*(x2-15).^2));

>> mesh(x1,x2,z)

Page 46: Análise Multivariada - trabalho

1015

250

0.005

0.01

0.015

0.02

0.025

0.03

5. Seja X ∼ N3(¹,Σ) com ¹ = [−3, 1, 4]′ e Σ =

⎡⎢⎢⎢⎣

1 −2 0

−2 5 0

0 0 2

⎤⎥⎥⎥⎦. Quais das seguintes var-

iáveis são independentes? Justifique.

Substituir a matriz de covariância pela matriz de correlação

>> S=[1 -2 0;-2 5 0;0 0 2]

S =

1 -2 0

-2 5 0

0 0 2

>> V=diag(diag(S))

V =

1 0 0

0 5 0

0 0 2

>> RV=sqrtm(V)

RV =

1.0000 0 0

0 2.2361 0

Page 47: Análise Multivariada - trabalho

0 0 1.4142

>> IRV=inv(RV)

IRV =

1.0000 0 0

0 0.4472 0

0 0 0.7071

>> R=IRV*S*IRV

R =

1.0000 -0.8944 0

-0.8944 1.0000 0

0 0 1.0000

A matriz de correlação nos dá justamente a relação de dependência entre as variáveis, logo

(a) X1 e X2 são dependestes, pois ½12 = ½21 ∕= 0.

(b) X2 e X3 são independentes, pois ½23 = ½32 = 0.

6. Seja X ∼ N3(¹,Σ) com ¹ =

⎡⎢⎢⎢⎣

¹1

¹2

¹3

⎤⎥⎥⎥⎦ e Σ =

⎡⎢⎢⎢⎣

¾21 ¾12 ¾13

¾21 ¾22 ¾23

¾31 ¾32 ¾23

⎤⎥⎥⎥⎦. Determine a f.d.p.

f(x1, x2, x3) padronizada.

Como ½12 =¾12¾1¾2

e ½13 =¾13¾1¾3

∴ ¾12 = ¾21 = ½12¾1¾2, ¾13 = ¾31 = ½13¾1¾3

e ¾23 = ¾32 = ½23¾2¾3, tem-se a matriz de correlação: R =

⎡⎢⎢⎢⎣

¾21 ½12¾1¾2 ½13¾1¾3

½12¾1¾2 ¾22 ½23¾2¾3

½13¾1¾3 ½23¾2¾3 ¾23

⎤⎥⎥⎥⎦

f(x1, x2, x3) =1√

(2¼)3¾1¾2¾3exp

Ã−1

3∑

i=1

(xi − ui

¾i

)2)

ou em notação matricial

f(x) =1√

(2¼)3∣Σ∣ 12exp

[−1

2(x− ¹)′Σ−1(x− ¹)

]

A fdp normal padronizada pode ser obtida fazendo-se zi =xi − ¹i

¾i

Page 48: Análise Multivariada - trabalho

3 Lista 3 - Inferência sobre o vetor de médias e MANOVA

1. Para o problema 2 da lista 2, testar a hipótese: H0: ¹ = [30 60 170]′ contra a alternativa

H1: ¹ ∕= [30 60 170]′, aos níveis de significância:

(a) de 1%;Temos que H0: ¹ = [30 60 170]′, H1: ¹ ∕= [30 60 170]′, n = 70, assim

>> X=[ 29 71 170; 25 65 158; 30 69 170;31 69 175; 27 61 155;

34 72 172;

34 73 176; 30 71 174; 31 77 177; 31 69 165; 29 72 172;

32 75 178; 28 73 174; 37 71 173; 30 71 170; 30 71 170;

33 68 169; 30 67 171; 30 74 174; 28 67 161; 31 72 175;

26 67 161; 32 69 170; 35 72 173; 28 70 171; 33 68 171;

34 77 180; 25 68 159; 26 63 159; 32 70 176; 29 64 165;

32 62 156; 32 76 179; 32 70 168; 34 75 175; 32 73 171;

34 73 177; 26 63 157; 30 66 165; 30 68 166; 25 61 154;

31 66 167; 27 74 175; 34 74 184; 28 63 155; 32 71 169;

31 66 168; 27 62 157; 23 63 154; 30 74 176; 27 68 171;

32 74 179; 32 66 172; 35 72 177; 32 70 177; 28 63 159;

31 65 161; 27 72 170; 30 70 174; 30 67 163; 30 73 176;

29 70 168; 33 68 172; 24 71 165; 31 72 174; 33 79 176;

32 77 178; 32 68 170; 30 65 162; 32 71 177];

>> mi=mean(X)

mi =

30.2857 69.5286 169.4000

Sem o uso do computador usaríamos assim:

>> S=(1/2)*((X(1,:)-mi)’*(X(1,:)-mi)+(X(2,:)-mi)’*(X(2,:)-mi)+(X(3,:)-mi)’*(X(3,:)-mi))...

Com o uso do Matlab, faz-se:

>> S=cov(X)

S =

8.2070 6.1222 13.9855

6.1222 17.9340 27.0464

13.9855 27.0464 53.6638

>> InvS=inv(S)

InvS =

0.2292 0.0494 -0.0846

0.0494 0.2430 -0.1354

-0.0846 -0.1354 0.1089

Logo

>> T2=70*((mi-([30 60 170]))*InvS*(mi-([30 60 170]))’)

T2 =

1.6779e+003

Page 49: Análise Multivariada - trabalho

Como

>> F=(((70-1)*3)/(70-3))*finv(0.99,3,67)

F =

12.6306

Como T 2 é maior que F então, rejeita-se H0, portanto ¹ é diferente de [30 60 170]′

(b) de 5%.

>> F=(((70-1)*3)/(70-3))*finv(0.95,3,67)

F =

8.4702

Com 5% de significância, temos que, F = 12.6306, logo T 2 > F2,1(0, 05), sendo assim,

rejeitamos a hipótese de que ¹ = ¹0.

2. A transpiração de 20 mulheres sadias foram analisadas. Três componentes, X1 = taxa de

suor, X2 = conteúdo de sódio e X3 = conteúdo de potássio, foram medidos, e os resultados,

aos quais chamamos “dados do suor”, são apresentados na tabela seguinte:

Identificação X1 X2 X3

1 3.7 48.5 9.3

2 5.7 65.1 8

3 3.8 47.2 10.9

4 3.2 53.2 12

5 3.1 55.5 9.7

6 4.6 36.1 7.9

7 2.4 24.8 14

8 7.2 33.1 7.6

9 6.7 47.4 8.5

10 5.4 54.1 11.3

11 3.9 36.9 12.7

12 4.5 58.8 12.3

13 3.5 27.8 9.8

14 4.5 40.2 8.4

15 1.5 13.5 10.1

Page 50: Análise Multivariada - trabalho

16 8.5 56.4 7.1

17 4.5 71.6 8.2

18 6.5 52.8 10.9

19 4.1 44.1 11.2

20 5.5 40.9 9.4

Testar a hipótese: H0: ¹ = [4 50 10]’ contra a alternativa H1: ¹ ∕= [4 50 10]’, ao nível designificância de 1%.

>> M=[3.7 48.5 9.3;5.7 65.1 8.0;3.8 47.2 10.9;3.2 53.2 12.0;3.1 55.5 9.7;

4.6 36.1 7.9;2.4 24.8 14.0;7.2 33.1 7.6;6.7 47.4 8.5;5.4 54.1 11.3;

3.9 36.9 12.7;4.5 58.8 12.3;3.5 27.8 9.8;4.5 40.2 8.4;1.5 13.5 10.1;

8.5 56.4 7.1;4.5 71.6 8.2;6.5 52.8 10.9;4.1 44.1 11.2;5.5 40.9 9.4];

M =

3.7000 48.5000 9.3000

5.7000 65.1000 8.0000

3.8000 47.2000 10.9000

3.2000 53.2000 12.0000

3.1000 55.5000 9.7000

4.6000 36.1000 7.9000

2.4000 24.8000 14.0000

7.2000 33.1000 7.6000

6.7000 47.4000 8.5000

5.4000 54.1000 11.3000

3.9000 36.9000 12.7000

4.5000 58.8000 12.3000

3.5000 27.8000 9.8000

4.5000 40.2000 8.4000

1.5000 13.5000 10.1000

8.5000 56.4000 7.1000

4.5000 71.6000 8.2000

6.5000 52.8000 10.9000

4.1000 44.1000 11.2000

5.5000 40.9000 9.4000

>> Vmi=mean(M)

Page 51: Análise Multivariada - trabalho

Vmi =

4.6400 45.4000 9.9650

>> S=cov(M)

S =

2.8794 10.0100 -1.8091

10.0100 199.7884 -5.6400

-1.8091 -5.6400 3.6277

>> InvS=inv(S)

InvS =

0.5862 -0.0221 0.2580

-0.0221 0.0061 -0.0016

0.2580 -0.0016 0.4018

>> T2=20*((Vmi-H0)*InvS*(Vmi-H0)’)

T2 =

9.7388

Sabendo que

H0: ¹ = [4 50 10]′,

H1: ¹ ∕= [4 50 10]′,

n = 20,

>> F=(((20-1)*3)/(20-3))*finv(0.99,3,17)

F =

17.3850

Temos que(n− 1) ⋅ pn− p

ℱ3,17(0.01) = 17.3850, logo T 2 <(n− 1) ⋅ p

n− pℱ3,17(0.01), sendo assim,

aceita-se H0, ou seja, com 1% de significância aceitamos a hipótese de que ¹ = [4 50 10]′.

3. Os dados da tabela seguinte foram obtidos tomando-se 4 medidas diferentes de dureza,

X1, X2, X3 e X4, de cada uma das n = 30 bordas de chapas. A primeira medida envolve

a transmissão de uma onda de choque sobre as bordas, a segunda medida é determinada

enquanto as bordas estão vibrando, e as últimas são obtidas a partir de testes estáticos.

Observações X1 X2 X3 X4

Page 52: Análise Multivariada - trabalho

1 1874 1722 1420 1371

2 1535 1393 1299 1220

3 1754 1566 1296 1309

4 2211 2069 1742 1599

5 1977 1903 1533 1545

6 2076 1832 1524 1513

7 2189 1972 1633 1620

8 1576 1376 1245 1184

9 1871 1732 1542 1408

10 1859 1520 1436 1382

11 1796 1687 1586 1417

12 1964 1783 1555 1550

13 2304 2083 1668 1651

14 1992 1874 1623 1605

15 2245 1997 1773 1711

16 1861 1669 1531 1339

17 2002 1717 1622 1422

18 1843 1553 1580 1378

19 2117 1856 1612 1542

20 1950 1775 1597 1479

21 2096 1848 1654 1584

22 2134 1829 1606 1519

23 1984 1857 1826 1525

24 2178 1909 1683 1585

25 2462 2203 1783 1758

26 2105 1892 1849 1614

27 1998 1781 1625 1544

28 2183 1986 1626 1622

29 2011 1792 1664 1445

30 1779 1496 1534 1389

Testar a hipótese: H0: ¹ = [2000 1700 1500 1400]’, ao nível de significância de 5%.

Temos que

Page 53: Análise Multivariada - trabalho

H0: ¹ = [2000 1700 1500 1400]’,

H1: ¹ ∕= [2000 1700 1500 1400]′,

n = 30,

>> Mi_O=mean(O)

Media =

1.0e+003 *

1.9975 1.7891 1.5889 1.4943

>> S=cov(O)

S =

1.0e+004 *

4.1962 3.8593 2.3421 2.6239

3.8593 3.9383 2.2569 2.5497

2.3421 2.2569 2.0993 1.6417

2.6239 2.5497 1.6417 1.8725

>> IS=inv(S)

IS =

1.0e-003 *

0.2922 -0.1788 -0.0126 -0.1549

-0.1788 0.3241 0.0007 -0.1914

-0.0126 0.0007 0.1523 -0.1169

-0.1549 -0.1914 -0.1169 0.6336

>> T2=30*((Media-([2000 1700 1500 1400]))*IS*(Media-([2000 1700 1500 1400]))’)

T2 =

132.1786

>> F=(((30-1)*4)/(30-4))*finv(0.95,4,26)

F =

12.2362

Temos que(n− 1) ⋅ pn− p

ℱ4,26(0.05) = 12.2362, logo T 2 >(n− 1) ⋅ p

n− pℱ4,26(0.05), sendo assim,

rejeita-se H0, ou seja, com 5% de significância rejeitamos a hipótese de que ¹ = ¹0.

4. As amostras de tamanhos n1 = 60 e n2 = 75 foram obtidas das avaliações de 4 disciplinas

(Matemática, História, Geografia e Ciências) das Escolas A e B, resultando nos vetores

Page 54: Análise Multivariada - trabalho

de médias: x1 =[5.0 7.0 6.5 7.5

]′e x2 =

[6.0 6.5 7.5 6.0

]′e nas matrizes de

covariâncias:

S1 =

⎡⎢⎢⎢⎢⎢⎢⎣

1.00 0.20 0.30 0.28

0.20 0.25 0.27 0.12

0.30 0.27 0.36 0.12

0.28 0.12 0.12 0.16

⎤⎥⎥⎥⎥⎥⎥⎦

e S2 =

⎡⎢⎢⎢⎢⎢⎢⎣

1.00 0.18 0.24 0.24

0.18 0.36 0.19 0.17

0.24 0.19 0.16 0.08

0.24 0.17 0.08 0.16

⎤⎥⎥⎥⎥⎥⎥⎦

Testar a hipótese:

H0 : ¹1 = ¹2 contra a alternativa

H1 : ¹1 ∕= ¹2,

ao nível de significância de 5%, considerando que Σ1 = Σ2.

>> x1=[5 7 6.5 7.5]

x1 =

5.0000 7.0000 6.5000 7.5000

>> x2=[6 6.5 7.5 6]

x2 =

6.0000 6.5000 7.5000 6.0000

>> S1=[];

>> S2=[];

Calcular a matriz de covariância ponderada

>> Sp=((n1-1)*S1+(n2-1)*S2)/(n1+n2-2)

Sp =

1.0000 0.1889 0.2666 0.2577

0.1889 0.3112 0.2255 0.1478

0.2666 0.2255 0.2487 0.0977

0.2577 0.1478 0.0977 0.1600

>> T2=(x1-x2)*(inv(9/300*(Sp)))*(x1-x2)’

T2 =

1.4616e+003

>> Fteste=(T2*(120+100-3-1))/((120+100-2)*3)

F =

9.6959

>> F=finv(0.95,4,130)

Page 55: Análise Multivariada - trabalho

F =

2.4414

Temos que(n1 + n2 − 2) ⋅ pn1 + n2 − p− 1

ℱ4,130(0.05) = 2.4414, logo Festatistico >(n1 + n2 − 2) ⋅ pn1 + n2 − p− 1

ℱ4,130(0.05),

sendo assim, rejeita-se H0, ou seja, com 5% de significância a hipótese H0 : mu1 = ¹2 é

rejeitada.

5. Observações com duas respostas (variáveis) foram obtidas para três tratamentos. Os vetores

observados foram:

Tratamento 1:

⎡⎣ 6

⎤⎦,

⎡⎣ 5

⎤⎦,

⎡⎣ 8

⎤⎦,

⎡⎣ 4

⎤⎦,

⎡⎣ 7

⎤⎦,

⎡⎣ 6

⎤⎦;

Tratamento 2:

⎡⎣ 3

⎤⎦,

⎡⎣ 1

⎤⎦,

⎡⎣ 2

⎤⎦,

⎡⎣ 1

⎤⎦;

Tratamento 3:

⎡⎣ 2

⎤⎦,

⎡⎣ 5

⎤⎦,

⎡⎣ 3

⎤⎦,

⎡⎣ 2

⎤⎦,

⎡⎣ 4

⎤⎦.

Aplicar a MANOVA para testar a igualdade de tratamentos, usando um nível de significân-

cia de 5%. Repita o teste usando o qui-quadrado aproximado de Bartlett. Compare os

resultados.

>> T1=[6 7;5 9;8 6;4 9;7 9;6 8]

T1 =

6 7

5 9

8 6

4 9

7 9

6 8

>> T2=[3 3;1 6;2 3;1 4]

T2 =

3 3

1 6

2 3

1 4

>> T3=[2 3;5 1;3 1;2 3;4 2]

Page 56: Análise Multivariada - trabalho

T3 =

2 3

5 1

3 1

2 3

4 2

Calcular a média de cada amostra

>> x1=mean(T1)

x1 =

6 8

>> x2=mean(T2)

x2 =

1.7500 4.0000

>> x3=mean(T3)

x3 =

3.2000 2.0000

Calcular a média ponderada global

>> xg=(6*x1+4*x2+5*x3)/(15)

xg =

3.9333 4.9333

>> B=6*(x1-xg)’*(x1-xg)+4*(x2-xg)’*(x2-xg)+5*(x3-xg)’*(x3-xg)

B =

47.3833 56.9333

56.9333 102.9333

>> W=(T1(1,:)-x1)’*(T1(1,:)-x1)+(T1(2,:)-x1)’*(T1(2,:)-x1)+(T1(3,:)-x1)’*(T1(3,:)-x1)+

(T1(4,:)-x1)’*(T1(4,:)-x1)+(T1(5,:)-x1)’*(T1(5,:)-x1)+(T1(6,:)-x1)’*(T1(6,:)-x1)+

(T2(1,:)-x2)’*(T2(1,:)-x2)+(T2(2,:)-x2)’*(T2(2,:)-x2)+(T2(3,:)-x2)’*(T2(3,:)-x2)+

(T2(4,:)-x2)’*(T2(4,:)-x2)+(T3(1,:)-x3)’*(T3(1,:)-x3)+(T3(2,:)-x3)’*(T3(2,:)-x3)+

(T3(3,:)-x3)’*(T3(3,:)-x3)+(T3(4,:)-x3)’*(T3(4,:)-x3)+(T3(5,:)-x3)’*(T3(5,:)-x3)

W =

19.5500 -13.0000

-13.0000 18.0000

>> B+W

ans =

66.9333 43.9333

Page 57: Análise Multivariada - trabalho

43.9333 120.9333

Lambda de Wilks

>> L=det(W)/(det(B+W))

L =

0.0297

>> Fteste=((15-3-1)/(3-1))*((1-sqrt(L))/(sqrt(L)))

Fteste =

26.4300

>> F=finv(0.95,4,22)

F =

2.8167

Como F2(g−1),2(n−g−1) = F4,22 = 2.8167 < Festatstico = 26.4300, então pelo menos um vetor

de médias é diferente dos demais.

Se fôssemos fazer a comparação por Barlett, teríamos (n− 1− p+g2 ) lnΛ X2

p (g − 1)

>> B=(15-1-(2+3))*log(L)

B =

-31.6584

>> X=chi2inv(0.95,4)

X =

9.4877

6. Um pesquisador deseja testar a igualdade dos vetores médios de duas populações. Os re-

sultados de suas pesquisas para o vetor aleatório X = [X1, X2, X3]′ forneceu as estatísticas:

n1 = 120, X1 =

⎡⎢⎢⎢⎣

44.3

53.8

60.5

⎤⎥⎥⎥⎦ , S1 =

⎡⎢⎢⎢⎣

22.5 4.4 −3.9

4.4 122.6 −17.5

−3.9 −17.5 214.7

⎤⎥⎥⎥⎦

n2 = 100, X2 =

⎡⎢⎢⎢⎣

49.2

56.5

65.2

⎤⎥⎥⎥⎦ , S2 =

⎡⎢⎢⎢⎣

95.7 10.2 −50.7

10.2 152.7 −7.1

−50.7 −7.1 302.3

⎤⎥⎥⎥⎦

Qual seria sua conclusão ao nível de significância de 1%? Considerar que Σ1 = Σ2.

H0 : ¹1 = ¹2

Page 58: Análise Multivariada - trabalho

H0 : ¹1 ∕= ¹2

>> x1=[44.3 53.8 60.5]

x1 =

44.3000 53.8000 60.5000

>> x2=[49.2 56.5 65.2]

x2 =

49.2000 56.5000 65.2000

>> S1=[22.5 4.4 -3.9;4.4 122.6 -17.5;-3.9 -17.5 214.7]

S1 =

s 22.5000 4.4000 -3.9000

4.4000 122.6000 -17.5000

-3.9000 -17.5000 214.7000

>> S2=[95.7 10.2 -50.7;10.2 152.7 -7.1;-50.7 -7.1 302.3]

S2 =

95.7000 10.2000 -50.7000

10.2000 152.7000 -7.1000

-50.7000 -7.1000 302.3000

>> Sp=(((120-1)*S1)+((100-1)*S2))/(120+100-2)

Sp =

55.7422 7.0339 -25.1532

7.0339 136.2693 -12.7771

-25.1532 -12.7771 254.4817

>> T2=(x1-x2)*(inv(((1/120)+(1/100))*(Sp)))*(x1-x2)’

T2 =

36.4501

>> Fteste=(T2*(120+100-3-1))/((120+100-2)*3)

Fteste =

12.0386

>> F=finv(0.99,3,216)

F =

3.8735

Sendo Festatstico = 12.0386 maior que F3,216(0.01) = 3.8735, então rejeita-se a hipótese

Page 59: Análise Multivariada - trabalho

H0 : ¹1 = ¹2.

Considerar que Σ1 ∕= Σ2. H0 : ¹1 = ¹2

H0 : ¹1 ∕= ¹2

>> x1=[44.3 53.8 60.5]

x1 =

44.3000 53.8000 60.5000

>> x2=[49.2 56.5 65.2]

x2 =

49.2000 56.5000 65.2000

>> S1=[22.5 4.4 -3.9;4.4 122.6 -17.5;-3.9 -17.5 214.7]

S1 =

22.5000 4.4000 -3.9000

4.4000 122.6000 -17.5000

-3.9000 -17.5000 214.7000

>> S2=[95.7 10.2 -50.7;10.2 152.7 -7.1;-50.7 -7.1 302.3]

S2 =

95.7000 10.2000 -50.7000

10.2000 152.7000 -7.1000

-50.7000 -7.1000 302.3000

>> (x1-x2)*inv(((1/120)*S1)+((1/100)*S2))*(x1-x2)’

ans =

33.9250

>> X=chi2inv(0.99,3)

X =

11.3449

Ao nível de significância de 1%, considerando Σ1 ∕= Σ2, rejeita-se a hipótese H0 onde

considera-se ¹1 = ¹2

7. Para o problema 1 da lista 2, testar a igualdade dos vetores médios resultantes das amostrasaleatórias obtidas (n1 = 10, n2 = 100 e n3 = 1000). Qual seria sua conclusão ao nível designificância de 5%? H0 : ¹1 = ¹2 = ¹3 H1 : Algum dos vetores difere dos outros

Sigma =

Page 60: Análise Multivariada - trabalho

15.0000 1.5000 3.0000 2.3000 5.1000 0.9000

1.5000 13.0000 2.7000 3.6000 4.7000 2.8000

3.0000 2.7000 13.9000 5.2000 6.2000 3.2000

2.3000 3.6000 5.2000 25.0000 3.1000 5.2000

5.1000 4.7000 6.2000 3.1000 36.0000 4.8000

0.9000 2.8000 3.2000 5.2000 4.8000 48.0000

>> mi=[4.5 6.0 8.5 10.0 12.5 15.0]

mi =

4.5000 6.0000 8.5000 10.0000 12.5000 15.0000

>> mx1=[6.9178 8.7686 10.6260 9.3165 15.7175 14.9356]

mx1 =

6.9178 8.7686 10.6260 9.3165 15.7175 14.9356

>> mx2=[4.5417 7.0864 8.6808 10.0058 13.0134 14.8672]

mx2 =

4.5417 7.0864 8.6808 10.0058 13.0134 14.8672

>> mx3=[4.4758 6.1065 8.5225 9.8296 12.4343 14.8078]

mx3 =

4.4758 6.1065 8.5225 9.8296 12.4343 14.8078

>> X1=mvnrnd(mi,Sigma,10);

>> S1=cov(X1);

>> X2=mvnrnd(mi,Sigma,100);

>> S2=cov(X2);

>> X3=mvnrnd(mi,Sigma,1000);

>> S3=cov(X3);

>> Sp=((10-1)*S1+(100-1)*S2+(1000-1)*S3)/(10+100+1000-3)

Sp =

15.6287 1.9193 3.0319 1.4114 5.1191 -0.5561

1.9193 13.0521 2.6940 3.2722 3.9318 3.3664

3.0319 2.6940 13.2001 4.4627 6.9650 2.0574

1.4114 3.2722 4.4627 24.2386 2.3232 5.1255

5.1191 3.9318 6.9650 2.3232 35.6304 4.9712

-0.5561 3.3664 2.0574 5.1255 4.9712 46.5597

>> X=[X1;X2;X3];

>> n=[10 100 1000]

n =

10 100 1000

>> manova(X,n)

***********************************

* AMOSTRAS MULTIVARIADAS - GRUPOS *

***********************************

* E MÉDIAS DOS GRUPOS *

***********************************

X1 =

6.5824 1.3693 10.4200 14.0294 11.8459 9.3273

11.6026 17.5895 7.6237 7.1229 15.6737 16.4204

-4.2485 7.7255 9.8072 5.0986 13.0840 6.6432

7.8392 6.1079 14.9699 8.4866 17.3463 8.2866

Page 61: Análise Multivariada - trabalho

5.7346 8.6856 10.9781 -2.5282 9.6254 13.2773

-0.5647 4.7588 11.0591 17.0322 11.5824 26.7321

2.8207 5.3871 10.6869 12.0000 11.7389 10.2523

5.8270 11.4728 8.6750 7.6792 17.8671 18.2602

18.3591 12.4369 13.2687 20.2792 25.2909 17.1399

15.2260 12.1528 8.7717 3.9651 23.1206 23.0164

xm1 =

6.9178

8.7686

10.6260

9.3165

15.7175

14.9356

xm2 =

4.1854

5.7971

8.0434

9.6145

12.3953

14.9631

xm3 =

4.5368

6.1124

8.6809

10.1606

12.5119

14.9485

**********************************

* FONTE DE VARIAÇÃO: TRATAMENTOS *

**********************************

* MATRIZ B *

**********************************

68.9232 74.2750 68.2612 -1.5521 80.6297 -0.8068

74.2750 80.4771 71.5727 -5.4796 88.9140 -0.7975

68.2612 71.5727 76.7049 15.8803 70.5974 -1.1282

-1.5521 -5.4796 15.8803 33.3743 -19.5365 -0.6119

80.6297 88.9140 70.5974 -19.5365 103.7436 -0.6089

-0.8068 -0.7975 -1.1282 -0.6119 -0.6089 0.0213

**********************************

* GRAUS DE LIBERDADE *

**********************************

* FONTE DE VARIAÇÃO: RESIDUAL *

**********************************

* MATRIZ W *

Page 62: Análise Multivariada - trabalho

**********************************

1.0e+004 *

1.7301 0.2125 0.3356 0.1562 0.5667 -0.0616

0.2125 1.4449 0.2982 0.3622 0.4353 0.3727

0.3356 0.2982 1.4613 0.4940 0.7710 0.2278

0.1562 0.3622 0.4940 2.6832 0.2572 0.5674

0.5667 0.4353 0.7710 0.2572 3.9443 0.5503

-0.0616 0.3727 0.2278 0.5674 0.5503 5.1542

**********************************

* GRAUS DE LIBERDADE *

**********************************

2204

**********************************

* FONTE DE VARIAÇÃO: TOTAL *

**********************************

* MATRIZ B + W *

**********************************

1.0e+004 *

1.7370 0.2199 0.3425 0.1561 0.5747 -0.0616

0.2199 1.4529 0.3054 0.3617 0.4441 0.3726

0.3425 0.3054 1.4689 0.4956 0.7781 0.2276

0.1561 0.3617 0.4956 2.6865 0.2552 0.5673

0.5747 0.4441 0.7781 0.2552 3.9547 0.5503

-0.0616 0.3726 0.2276 0.5673 0.5503 5.1542

**********************************

* GRAUS DE LIBERDADE *

**********************************

2216

**********************************

* LÂMBDA DE WILKS *

**********************************

0.9864

**********************************

* ESTATÍSTICA DO TESTE *

**********************************

F =

1.2615

**********************************

* VALOR DE p *

**********************************

0.2349

Como o teste p = 0.2349 > 0.05 então, aceita-se a hipótese H0 : em que considera-se a

igualdade dos vetores médios resultantes das amostras aleatórias.

8. A tabela seguinte mostra 9 variáveis referentes a 5 espécies de cães da Tailândia.

Page 63: Análise Multivariada - trabalho

Ident. X1 X2 X3 X4 X5 X6 X7 X8 X9

Cães Modernos da Tailândia

1 123 10.1 23 23 19 7.8 32 33 5.6

2 137 9.6 19 22 19 7.8 32 40 5.8

3 121 10.2 18 21 21 7.9 35 38 6.2

4 130 10.7 24 22 20 7.9 32 37 5.9

5 149 12 25 25 21 8.4 35 43 6.6

6 125 9.5 23 20 20 7.8 33 37 6.3

7 126 9.1 20 22 19 7.5 32 35 5.5

8 125 9.7 19 19 19 7.5 32 37 6.2

9 121 9.6 22 20 18 7.6 31 35 5.3

10 122 8.9 10 20 19 7.6 31 35 5.7

11 115 9.3 19 19 20 7.8 33 34 6.5

12 112 9.1 19 20 19 6.6 30 33 5.1

13 124 9.3 21 21 18 7.1 30 36 5.5

14 128 9.6 22 21 19 7.5 32 38 5.8

15 130 8.4 23 20 19 7.3 31 40 5.8

16 127 10.5 25 23 20 8.7 32 35 6.1

Chacais Dourados

1 120 8.2 18 17 18 7 32 35 5.2

2 107 7.9 17 17 20 7 32 34 5.3

3 110 8.1 18 16 19 7.1 31 32 4.7

4 116 8.5 20 18 18 7.1 32 33 4.7

5 114 8.2 19 18 19 7.9 32 33 5.1

6 111 8.5 19 16 18 7.1 30 33 5

7 113 8.5 17 18 19 7.1 30 34 4.6

8 117 8.7 20 17 18 7 30 34 5.2

9 114 9.4 21 19 19 7.5 31 35 5.3

10 112 8.2 19 17 19 6.8 30 34 5.1

11 110 8.5 18 17 19 7 31 33 4.9

12 111 7.7 20 18 18 6.7 30 32 4.5

13 107 7.2 17 16 17 6 28 35 4.7

14 108 8.2 18 16 17 6.5 29 33 4.8

Page 64: Análise Multivariada - trabalho

15 110 7.3 19 15 17 6.1 30 33 4.5

16 105 8.3 19 17 17 6.5 29 32 4.5

17 107 8.4 18 17 18 6.2 29 31 4.3

18 106 7.8 19 18 18 6.2 31 32 4.4

19 111 8.4 17 16 18 7 30 34 4.7

20 111 7.6 19 17 18 6.5 30 35 4.6

Cuons

1 123 9.7 22 21 20 7.8 27 36 6.1

2 135 11.8 25 21 23 8.9 31 38 7.1

3 138 11.4 25 25 22 9 30 38 7.3

4 141 10.8 26 25 21 8.1 29 39 6.6

5 135 11.2 25 25 21 8.5 29 39 6.7

6 136 11 22 24 22 8.1 31 39 6.8

7 131 10.4 23 23 23 8.7 30 36 6.8

8 137 10.6 25 24 21 8.3 28 38 6.5

9 135 10.5 25 25 21 8.4 29 39 6.9

10 131 10.9 25 24 21 8.5 29 35 6.2

11 130 11.3 22 23 21 8.7 29 37 7

12 144 10.8 24 26 22 8.9 30 42 7.1

13 139 10.9 26 23 22 8.7 30 39 6.9

14 123 9.8 23 22 10 8.1 26 34 5.6

15 137 11.3 27 26 23 8.7 30 39 6.5

16 128 10 22 23 22 8.7 29 37 6.6

17 122 9.9 22 22 20 8.2 26 36 5.7

Lobos Indianos

1 167 11.5 29 28 25 9.5 41 45 7.2

2 164 12.3 27 26 25 10 42 47 7.9

3 150 11.5 21 24 25 9.3 41 46 8.5

4 145 11.3 28 24 24 9.2 36 41 7.2

5 177 12.4 31 27 27 10.5 43 50 7.9

6 166 13.4 32 27 26 9.5 40 47 7.3

7 164 12.1 27 24 25 9.9 42 45 8.3

8 165 12.6 30 26 25 7.7 40 43 7.9

Page 65: Análise Multivariada - trabalho

9 131 11.8 20 24 23 8.8 38 40 6.5

10 163 10.8 27 24 24 9.2 39 48 7

11 164 10.7 24 23 26 9.5 43 47 7.6

12 141 10.4 20 23 23 8.9 38 43 6

13 148 10.6 26 21 24 8.9 39 40 7

14 158 10.7 25 25 24 9.8 41 45 7.4

Cães Pré-históricos Tailandeses

1 112 10.1 17 18 19 7.7 31 33 5.8

2 115 10 18 23 20 7.8 33 36 6

3 136 11.9 22 25 21 8.5 36 39 7

4 111 9.9 19 20 18 7.3 29 34 5.3

5 130 11.2 23 27 20 9.1 35 35 6.6

6 125 10.7 19 26 20 8.4 33 37 6.3

7 132 9.6 19 20 19 9.7 35 38 6.6

8 121 10.7 21 23 19 7.9 32 35 6

9 122 9.8 22 23 18 7.9 32 35 6.1

19 124 9.5 20 24 19 7.6 32 37 6

Nota: As variáveis são X1 = comprimento da mandíbula; X2 = largura da mandíbula abaixo do

primeiro molar; X3 = largura do côndilo articular; X4 = altura da mandíbula abaixo do primeiro

molar; X5 = comprimento do primeiro molar; X6 = largura do primeiro molar; X7 = comprimento

do primeiro ao terceiro molar, inclusive (primeiro ao segundo para o cuon); X8 = comprimento do

primeiro ao quarto premolar, inclusive; X9 = largura do canino inferior.

(a) Através da MANOVA, testar a existência de diferenças significativas, ao nível designificância de 5%, entre tratamentos para as cinco raças de cães.

>> Y=[Y1;Y2;Y3;Y4;Y5]

Y =

123.0000 10.1000 23.0000 23.0000 19.0000 7.8000 32.0000 33.0000 5.6000

137.0000 9.6000 19.0000 22.0000 19.0000 7.8000 32.0000 40.0000 5.8000

121.0000 10.2000 18.0000 21.0000 21.0000 7.9000 35.0000 38.0000 6.2000

130.0000 10.7000 24.0000 22.0000 20.0000 7.9000 32.0000 37.0000 5.9000

149.0000 12.0000 25.0000 25.0000 21.0000 8.4000 35.0000 43.0000 6.6000

125.0000 9.5000 23.0000 20.0000 20.0000 7.8000 33.0000 37.0000 6.3000

126.0000 9.1000 20.0000 22.0000 19.0000 7.5000 32.0000 35.0000 5.5000

125.0000 9.7000 19.0000 19.0000 19.0000 7.5000 32.0000 37.0000 6.2000

121.0000 9.6000 22.0000 20.0000 18.0000 7.6000 31.0000 35.0000 5.3000

122.0000 8.9000 10.0000 20.0000 19.0000 7.6000 31.0000 35.0000 5.7000

Page 66: Análise Multivariada - trabalho

115.0000 9.3000 19.0000 19.0000 20.0000 7.8000 33.0000 34.0000 6.5000

112.0000 9.1000 19.0000 20.0000 19.0000 6.6000 30.0000 33.0000 5.1000

124.0000 9.3000 21.0000 21.0000 18.0000 7.1000 30.0000 36.0000 5.5000

128.0000 9.6000 22.0000 21.0000 19.0000 7.5000 32.0000 38.0000 5.8000

130.0000 8.4000 23.0000 20.0000 19.0000 7.3000 31.0000 40.0000 5.8000

127.0000 10.5000 25.0000 23.0000 20.0000 8.7000 32.0000 35.0000 6.1000

120.0000 8.2000 18.0000 17.0000 18.0000 7.0000 32.0000 35.0000 5.2000

107.0000 7.9000 17.0000 17.0000 20.0000 7.0000 32.0000 34.0000 5.3000

110.0000 8.1000 18.0000 16.0000 19.0000 7.1000 31.0000 32.0000 4.7000

116.0000 8.5000 20.0000 18.0000 18.0000 7.1000 32.0000 33.0000 4.7000

114.0000 8.2000 19.0000 18.0000 19.0000 7.9000 32.0000 33.0000 5.1000

111.0000 8.5000 19.0000 16.0000 18.0000 7.1000 30.0000 33.0000 5.0000

113.0000 8.5000 17.0000 18.0000 19.0000 7.1000 30.0000 34.0000 4.6000

117.0000 8.7000 20.0000 17.0000 18.0000 7.0000 30.0000 34.0000 5.2000

114.0000 9.4000 21.0000 19.0000 19.0000 7.5000 31.0000 35.0000 5.3000

112.0000 8.2000 19.0000 17.0000 19.0000 6.8000 30.0000 34.0000 5.1000

110.0000 8.5000 18.0000 17.0000 19.0000 7.0000 31.0000 33.0000 4.9000

111.0000 7.7000 20.0000 18.0000 18.0000 6.7000 30.0000 32.0000 4.5000

107.0000 7.2000 17.0000 16.0000 17.0000 6.0000 28.0000 35.0000 4.7000

108.0000 8.2000 18.0000 16.0000 17.0000 6.5000 29.0000 33.0000 4.8000

110.0000 7.3000 19.0000 15.0000 17.0000 6.1000 30.0000 33.0000 4.5000

105.0000 8.3000 19.0000 17.0000 17.0000 6.5000 29.0000 32.0000 4.5000

107.0000 8.4000 18.0000 17.0000 18.0000 6.2000 29.0000 31.0000 4.3000

106.0000 7.8000 19.0000 18.0000 18.0000 6.2000 31.0000 32.0000 4.4000

111.0000 8.4000 17.0000 16.0000 18.0000 7.0000 30.0000 34.0000 4.7000

111.0000 7.6000 19.0000 17.0000 18.0000 6.5000 30.0000 35.0000 4.6000

123.0000 9.7000 22.0000 21.0000 20.0000 7.8000 27.0000 36.0000 6.1000

135.0000 11.8000 25.0000 21.0000 23.0000 8.9000 31.0000 38.0000 7.1000

138.0000 11.4000 25.0000 25.0000 22.0000 9.0000 30.0000 38.0000 7.3000

141.0000 10.8000 26.0000 25.0000 21.0000 8.1000 29.0000 39.0000 6.6000

135.0000 11.2000 25.0000 25.0000 21.0000 8.5000 29.0000 39.0000 6.7000

136.0000 11.0000 22.0000 24.0000 22.0000 8.1000 31.0000 39.0000 6.8000

131.0000 10.4000 23.0000 23.0000 23.0000 8.7000 30.0000 36.0000 6.8000

137.0000 10.6000 25.0000 24.0000 21.0000 8.3000 28.0000 38.0000 6.5000

135.0000 10.5000 25.0000 25.0000 21.0000 8.4000 29.0000 39.0000 6.9000

131.0000 10.9000 25.0000 24.0000 21.0000 8.5000 29.0000 35.0000 6.2000

130.0000 11.3000 22.0000 23.0000 21.0000 8.7000 29.0000 37.0000 7.0000

144.0000 10.8000 24.0000 26.0000 22.0000 8.9000 30.0000 42.0000 7.1000

139.0000 10.9000 26.0000 23.0000 22.0000 8.7000 30.0000 39.0000 6.9000

123.0000 9.8000 23.0000 22.0000 10.0000 8.1000 26.0000 34.0000 5.6000

137.0000 11.3000 27.0000 26.0000 23.0000 8.7000 30.0000 39.0000 6.5000

128.0000 10.0000 22.0000 23.0000 22.0000 8.7000 29.0000 37.0000 6.6000

122.0000 9.9000 22.0000 22.0000 20.0000 8.2000 26.0000 36.0000 5.7000

167.0000 11.5000 29.0000 28.0000 25.0000 9.5000 41.0000 45.0000 7.2000

164.0000 12.3000 27.0000 26.0000 25.0000 10.0000 42.0000 47.0000 7.9000

150.0000 11.5000 21.0000 24.0000 25.0000 9.3000 41.0000 46.0000 8.5000

145.0000 11.3000 28.0000 24.0000 24.0000 9.2000 36.0000 41.0000 7.2000

177.0000 12.4000 31.0000 27.0000 27.0000 10.5000 43.0000 50.0000 7.9000

Page 67: Análise Multivariada - trabalho

166.0000 13.4000 32.0000 27.0000 26.0000 9.5000 40.0000 47.0000 7.3000

164.0000 12.1000 27.0000 24.0000 25.0000 9.9000 42.0000 45.0000 8.3000

165.0000 12.6000 30.0000 26.0000 25.0000 7.7000 40.0000 43.0000 7.9000

131.0000 11.8000 20.0000 24.0000 23.0000 8.8000 38.0000 40.0000 6.5000

163.0000 10.8000 27.0000 24.0000 24.0000 9.2000 39.0000 48.0000 7.0000

164.0000 10.7000 24.0000 23.0000 26.0000 9.5000 43.0000 47.0000 7.6000

141.0000 10.4000 20.0000 23.0000 23.0000 8.9000 38.0000 43.0000 6.0000

148.0000 10.6000 26.0000 21.0000 24.0000 8.9000 39.0000 40.0000 7.0000

158.0000 10.7000 25.0000 25.0000 24.0000 9.8000 41.0000 45.0000 7.4000

112.0000 10.1000 17.0000 18.0000 19.0000 7.7000 31.0000 33.0000 5.8000

115.0000 10.0000 18.0000 23.0000 20.0000 7.8000 33.0000 36.0000 6.0000

136.0000 11.9000 22.0000 25.0000 21.0000 8.5000 36.0000 39.0000 7.0000

111.0000 9.9000 19.0000 20.0000 18.0000 7.3000 29.0000 34.0000 5.3000

130.0000 11.2000 23.0000 27.0000 20.0000 9.1000 35.0000 35.0000 6.6000

125.0000 10.7000 19.0000 26.0000 20.0000 8.4000 33.0000 37.0000 6.3000

132.0000 9.6000 19.0000 20.0000 19.0000 9.7000 35.0000 38.0000 6.6000

121.0000 10.7000 21.0000 23.0000 19.0000 7.9000 32.0000 35.0000 6.0000

122.0000 9.8000 22.0000 23.0000 18.0000 7.9000 32.0000 35.0000 6.1000

124.0000 9.5000 20.0000 24.0000 19.0000 7.6000 32.0000 37.0000 6.0000

>> n=[16 20 17 14 10]

n =

16 20 17 14 10

>> manova(Y,n)