Post on 07-Apr-2016
Análise de Variância (ANOVA)
Leandro Sauer – Administração/UFMS
Objetivo
• Testar igualdade de médias em mais de dois grupos– Através de fatores (variáveis independentes
podem ser quanti ou qualitativas)– Produzem mudanças sistemáticas em alguma
variável de interesse (variável dependente quantitativa)
Experimento com um fator
• Modelo aplicado a projetos experimentais, no qual amostras aleatórias independentes são retiradas de k populações normais com médias respectivamente, e variância
• n= n1 + n2 + . . . + nk • Populações são denominados tratamentos ou
níveis do fator
Experimento com um fator
• Verificar se determinado fator é possível causa dos efeitos observados em certa variável de estudo.
• H0 :
• HA : Pelo menos duas médias são diferentes
• Se o teste estatístico indicar rejeição de H0 podemos concluir com risco que o fator tem influencia sobre a variável de estudo.
Estimadores da Variância Comum
• No caso de uma variável independente (um fator), a variância poderá ser estimada de três maneiras:– Variância Total (S2
t );
– Variância devida a tratamentos (S2 e );
– Variância devida aos erros (S2 r )
Variância Total
11
)(1 1
2
2
nQ
n
xxS t
k
i
n
jij
t
i
Estimador Não viciado de , se H0 verdadeira
Variância devido aos Tratamentos
11
)(1
2
2
kQ
k
xxnS e
k
iii
e
Estimador Não viciado de , se H0 verdadeira
Variância devida aos erros
knQ
kn
xxS r
k
i
n
jiij
r
i
1 1
2
2
)(
Estimador Não viciado de , independente de H0 verdadeira ou falsa
Lógica da ANOVA
• Pode-se demonstrar que cada uma das variâncias das variáveis independentes é um estimador justo (não viciado) de quando essas variáveis não tem influência sobre a variável de estudo (H0 ser V).
• Por outro lado a variância do erro é um estimador justo (não viciado) de independente de H0 ser verdadeira ou não.
Quadro de Análise da VariânciaFonte de Variação
Soma de Quadrados
Graus de liberdade
Quadrado Médio
Teste F
Entre Tratamentos
Qe K-1
Dentro das Amostras (Residual)
Qr = Qt - Qe N-k
Total Qt N-1
12
kQS e
e
2
2
r
ecalc S
SF
A tabela abaixo mostra a quantia gasta anualmente com leitura (em US$) por uma amostra aleatória de consumidores norte-americanos, residentes em quatro regiões distintas. Sendo você pode concluir que as médias de gasto são diferentes?
Oeste223184221269199171
Sul10314316411999
Meio-Oeste24616924615816776 214
Nordeste30858
141109220144316 108 204
1. Estabeleça as hipóteses nula e alternativa.
Exemplo
H0: (Todas as médias populacionais são iguais.)Ha: Ao menos uma das médias difere das demais.
0,10,
Uma distribuição F com g.l.N = 3, g.l.D = 23
0 1 2 3 4 50,00,10,20,30,40,50,60,70,8 4. Determine o valor crítico.
2,34
5. Determine a região de rejeição.
0,10
2. Estabeleça o nível de significância.
3. Determine a distribuição amostral.
0,10
Oeste223184221269199171
Sul10314316411999
Meio-Oeste24616924615816776 214
Nordeste30858
141109220144316 108 204
177,00
4.050,05
135,71
1.741,39
210,14 1.020,80
Calcule a média e a variância de cada amostra.
Calcule , a média de todos os valores.
6. Determine a estatística teste.
185,149.838,66
4.779
Média n
1 185,14 7 66,26 463,8 2 177,00 6 0,00 0,0 3 135,71 7 1.704,86 11.934,0 4 210,14 7 1.098,26 7.687,8
Quadrado médio entre
20.0866.695,33
n s2
1 7 9.838,66 59.031,9 2 6 4.050,05 20.250,2 3 7 1.741,39 10.448,4 4 7 1.020,80 6.124,8
95.8554.167,61
6.955,334.167,61
1,669
7. Tome sua decisão.
8. Interprete sua decisão.
0,100 1 2 3 4 50,0
0,10,20,30,40,50,60,70,8
Como F = 1,669 não cai na região de rejeição, não rejeite a hipótese nula.
Não há evidência suficiente para aceitar a alegação de que as médias não são iguais. Os gastos com leitura são os mesmos nas quatro regiões.
2,34
Análise de variância de um fator
Análise de variânciaSource DF SS MS F PFactor 3 20085 6695 1.61 0.215Error 23 95857 4168Total 26 15942
Pelo método do valor P, você não rejeitaria a hipótese nula, já que 0,215 > 0,10. Não há evidência suficiente para acreditar que o gasto com leitura é diferente nas regiões distintas.
Resultado no Minitab
Analise de Variância com dois fatores
Em uma experiência agrícola, foram usados cinco diferentes fertilizantes em duas variedades de trigo. A produção está indicada a seguir. Verificar ao nível de 5% se:
1. Há diferença na produção devido ao fertilizante;2. Há diferença na safra devido á variedade do trigo.
Fertilizante A B C D E
Variedade 1 54 38 46 50 44
Variedade 2 57 42 45 53 50
Quadro de Analise de Variância dois fatores
Fonte de Variação
S S G.L. Q.M. Teste F
Entre colunas Qc K-1 Qc /(k-1) Fc=
Entre Linhas QE L-1 QE /(L-1) FL=
Residual Qr n – k – L +1 Qr/(n-k-L-1)
Total QT n-1 QT/(n-1)
Nosso Exemplo
Fonte de Variação
S S G.L. Q.M. Teste F
Entre colunas 279,4 4 69,85
Fc = 69,85/3,25 = 21,49Fcritico=6,388
FL = 22,5 / 3,25 = 6,92Fcritico=7,709
Entre Linhas 22,5 1 22,5
Residual 13 4 3,25
Total 314,9 9
Teste de Scheffé
Fator Único
knkBA
rBA Fnn
kSXX ,,)11)(1( 12
Teste de Scheffé
Fator DuploPara as colunas
Fator DuploPara as linhas
Teste de Scheffé (exemplo)Fertilizante A B C D EVariedade 1
54 38 46 50 44
Variedade 2
57 42 45 53 50
Média 55,5 40 45,5 51,5 47
Modelo de Apresentação
1. Introdução;2.Apresentação dos Dados3.Quadro de Analise de Variância4.Teste de Scheffé (se for necessário)5.Conclusões
Análise de Variância com dois fatores com repetição
Teste de Scheffé (Fator Duplo com repetição)
)1(12 ,,)1(2
RkLLrBA FRkLSXX
Para as linhas
)1(12 ,,)1(2
RkLkrBA FRLkSXX
Para as colunas
Exemplo ANOVA fator duplo com repetição
As compras de chá –mate de 18 famílias estão dadas a seguir. Cada família esta classificada segundo a cidade em que reside e o numero de vezes que foi exposta a propaganda sobre chá noticiada pela TV. Para se conhecer a evolução do efeito da propaganda, deseja-se saber, ao nivel de 5%:a)Se há alguma relação entre propaganda noticiada e consumo do produto;b)Se há alguma diferença significativa no consumo entre as cidades;c)Se há alguma relação entre propaganda noticiada e as cidades, refletida no consumo.
Dados Brutos
CidadesNúmero de vezes de colocação da propaganda
De 1 a 5 vezes De 6 a 10 vezes Mais de 10 vezes
A 19 27 18 20 30 18
B 18 26 27 19 25 32
C 24 21 19 31 25 30