ANOVA: Análise de Variância APLICAÇÃO. Prof. Hani Camille YehiaHani Camille Yehia Alunos:...
Transcript of ANOVA: Análise de Variância APLICAÇÃO. Prof. Hani Camille YehiaHani Camille Yehia Alunos:...
ANOVA: Análise de Variância
APLICAÇÃO.
Prof. Hani Camille Yehia
Alunos: Augusto Filho
Cléia do N. Cavalcante
Programa de Pós-Graduação em Engenharia Elétrica
Disciplina: Introdução ao Processo Estocástico
Roteiro
• Modelo de ANOVA
• Verificação da suposição do Modelo
• Simulação
• Exemplo Prático
• Conclusão
• Bibliografia
Modelo ANOVA
Yij ; é valor da variável resposta na j-ésima observação do i-ésimo tratamento.
: é a a média geral de todos os tratamentos;
i : é o efeito do i-ésimo tratamento;
eij: é o erro aleatório.
ijiij ey i = 1, 2, 3, ...,kj = 1, 2, ..., n
As amostra são aleatórias e independentes;
As populações têm distribuições normais;
As populações têm a mesma variância.
Pressuposições Básicas:
Hipóteses e modelo subjacente
Sob H0: 1 = 2 =...= k = 0
ijiij ey ijij ey
Hipóteses e modelo subjacente
Sob H1: i 0 para algum i
ijiij ey
Tabela de Análise de Variância – (ANOVA)
Tabela de Análise de Variância – (ANOVA)
Fonte de Variação
Soma de Quadrados
glQuadrados
MédiosF
Tratamentos k-1
Erro K(n-1)
Total Kn -1
N
y
n
ySQ
k
i i
iTRAT
2..
1
2.
k
i
n
jijTotal N
yySQ
1 1
2..2
1
k
SQQM TRAT
TRAT
)1(
nk
SQQM ERRO
ERRO
ERRO
TRAT
QM
QMF
SQERRO = SQTotal - SQTRAT
SimulaçãoSimulações em populações normais:
Três populações;
Tamanho da amostra: n=30, n=50 e n=1000;
Estrutura de Média
Critério 1 - Médias diferentes com Variâncias Iguais.
Critério 2 – Médias Iguais com Variâncias Iguais;
Simulação
Simulação
Simulação
Rejeito Ho se: F > F (k – 1; k(n - 1)
Não rejeita Ho se: F F (k – 1; k(n - 1)
Valor-p
Regra de decisão: Abordagem Clássica
Regra de decisão: Abordagem Valor-p
Valor-p
Valor-p >
rejeita H0 (prova-se estatisticamente H1)
Não rejeita H0 (os dados não mostram evidência para afirmar H1)
= nível de significância (probab. tolerável de se rejeitar Ho quando esta for verdadeira)
Usual: = 5%
Verificação da Adequação do Modelo
Um resíduo é definido como:
Resíduo: A diferença entre uma observação e a média do
tratamento correspondente.
iijij yye
As suposições associadas ao modelo, é feita através da analise dos resíduos:
1. Os erros tem média zero e a mesma variância 2;
2. Os erros são independentes, ou seja, um valor de um erro não depende
de qualquer outro erro;
3. Os erros têm distribuição normal.
Logo, os erros são iid N(0, 2).
Verificação da Adequação do Modelo
• Suposição de Independência
Gráfico de Resíduos vs Ordem
• Suposição de Igualdade de Variância
Gráfico de Resíduos vs Médias dos
Tratamentos
• Suposição de Normalidade
Gráfico de Probabilidade Normal
Exemplo:Um fabricante de papel usado para fabricar sacos de papel pardo está interessado em melhorar a resistência do produto à tensão. A engenharia de produto pensa que a resistência à tensão seja uma função da concentração de madeira de lei na polpa e que a faixa pratica de interesse das concentrações de madeira de lei esteja entre 5 e 20%. Um time de engenheiros responsáveis pelo estudo decide investigar quatro níveis de concentração de madeira de lei: 5%, 10%, 15% e 20%. Eles decidem fabricar seis corpos de prova, para cada nível de concentração, usando uma planta piloto. Todos os 24 corpos de prova são testados, em uma ordem aleatória, em um equipamento de teste de laboratório. Os dados desse experimento são:
Box-Plot
Concentracao
Madeir
a
2015105
25
20
15
10
5
Boxplot of Madeira vs Concentracao
Hipóteses:
Continuação do teste de hipóteses:
Final do teste
Análise dos Resíduos
Standardized Residual
Perc
ent
210-1-2
99
90
50
10
1
Fitted Value
Sta
ndard
ized R
esi
dual
20,017,515,012,510,0
2
1
0
-1
-2
Standardized Residual
Fre
quency
2,01,51,00,50,0-0,5-1,0-1,5
4,8
3,6
2,4
1,2
0,0
Observation Order
Sta
ndard
ized R
esi
dual
24222018161412108642
2
1
0
-1
-2
Normal Probability Plot of the Residuals Residuals Versus the Fitted Values
Histogram of the Residuals Residuals Versus the Order of the Data
Residual Plots for Madeira
Programa usado no Software R.
n<-30mi1<-19mi2<-19mi3<-19sd<-3
a1<-rnorm(n,mi1,sd)a2<-rnorm(n,mi2,sd)a3<-rnorm(n,mi3,sd)a=c(a1,a2,a3)n=rep(n,3) #tamanho das amostrasgroup=rep(1:3,n) #Cuidado aqui.data = data.frame(a = a, group = factor(group))fit = lm(a ~ group, data)anova(fit)
tmpfn = function(x) c(sum = sum(x), mean = mean(x), var = var(x),n = length(x))tapply(a, group, tmpfn)tmpfn(a)
Conclusão
Logo a analise de variância pode ser usada para testar a diferença entre médias de várias populações, mostrando-se que a base usada para os testes estatisticos em analise de variancia é o desenvolvimento de duas estimativas independentes da variancia da população sigma ao quadrado, ao computar a razao destas duas estimativas, desenvolvemos uma regra de rejeijão para determinar se rejeitamos a hipotese nula de que as medias das populações são iguais.
Referência:Analysis of Variance Tables Based on Experimental Structure C. J. Brien, Biometrics, Vol. 39, No. 1 (Mar., 1983), pp. 53-59 FISHER, R. A. The logic of inductive inference. J. R. Stat. Soc., v.98, p.34-54, 1935. MONTGOMERY, D.C. 1988. Design and analysis of experiments. 2nd. John Wiley & Sons, New York, USA. SNEDECOR, C.W. and W.G. COCHRAN, 1980. Statistical Methods. 7ed. Iowa State University Press, Amer. Iowa. USA. FISHER, R.A. Statistical Methods for Research Workers. 11ª ed. Oliver & Boyd, Edinburgo. 1950. Gamerman, D. & Migon, H. (1993). Inferência estatística: uma abordagem integrada, Textos de métodos matemáticos, UFRJ. James F. Reed III: Analysis of Variance (ANOVA) Models in Emergency Medicine. The Internet Journal of Emergency and Intensive Care Medicine. 2004. Volume 7 Number 2. http://www.ispub.com/ostia/index.php?xmlFilePath=journals/ijeicm/vol7n2/anova.xml