ANOVA: Análise de Variância APLICAÇÃO. Prof. Hani Camille YehiaHani Camille Yehia Alunos:...

ANOVA: Análise de Variância

APLICAÇÃO.

Prof. Hani Camille Yehia

Alunos: Augusto Filho

Cléia do N. Cavalcante

Programa de Pós-Graduação em Engenharia Elétrica

Disciplina: Introdução ao Processo Estocástico

Roteiro

• Modelo de ANOVA

• Verificação da suposição do Modelo

• Simulação

• Exemplo Prático

• Conclusão

• Bibliografia

Modelo ANOVA

Yij ; é valor da variável resposta na j-ésima observação do i-ésimo tratamento.

: é a a média geral de todos os tratamentos;

i : é o efeito do i-ésimo tratamento;

eij: é o erro aleatório.

ijiij ey i = 1, 2, 3, ...,kj = 1, 2, ..., n

As amostra são aleatórias e independentes;

As populações têm distribuições normais;

As populações têm a mesma variância.

Pressuposições Básicas:

Hipóteses e modelo subjacente

Sob H0: 1 = 2 =...= k = 0

ijiij ey ijij ey

Hipóteses e modelo subjacente

Sob H1: i 0 para algum i

ijiij ey

Tabela de Análise de Variância – (ANOVA)

Tabela de Análise de Variância – (ANOVA)

Fonte de Variação

Soma de Quadrados

glQuadrados

MédiosF

Tratamentos k-1

Erro K(n-1)

Total Kn -1

N

y

n

ySQ

k

i i

iTRAT

2..

1

2.

k

i

n

jijTotal N

yySQ

1 1

2..2

1

k

SQQM TRAT

TRAT

)1(

nk

SQQM ERRO

ERRO

ERRO

TRAT

QM

QMF

SQERRO = SQTotal - SQTRAT

SimulaçãoSimulações em populações normais:

Três populações;

Tamanho da amostra: n=30, n=50 e n=1000;

Estrutura de Média

Critério 1 - Médias diferentes com Variâncias Iguais.

Critério 2 – Médias Iguais com Variâncias Iguais;

Simulação

Rejeito Ho se: F > F (k – 1; k(n - 1)

Não rejeita Ho se: F F (k – 1; k(n - 1)

Valor-p

Regra de decisão: Abordagem Clássica

Regra de decisão: Abordagem Valor-p

Valor-p

Valor-p >

rejeita H0 (prova-se estatisticamente H1)

Não rejeita H0 (os dados não mostram evidência para afirmar H1)

= nível de significância (probab. tolerável de se rejeitar Ho quando esta for verdadeira)

Usual: = 5%

Verificação da Adequação do Modelo

Um resíduo é definido como:

Resíduo: A diferença entre uma observação e a média do

tratamento correspondente.

iijij yye

As suposições associadas ao modelo, é feita através da analise dos resíduos:

1. Os erros tem média zero e a mesma variância 2;

2. Os erros são independentes, ou seja, um valor de um erro não depende

de qualquer outro erro;

3. Os erros têm distribuição normal.

Logo, os erros são iid N(0, 2).

Verificação da Adequação do Modelo

• Suposição de Independência

Gráfico de Resíduos vs Ordem

• Suposição de Igualdade de Variância

Gráfico de Resíduos vs Médias dos

Tratamentos

• Suposição de Normalidade

Gráfico de Probabilidade Normal

Exemplo:Um fabricante de papel usado para fabricar sacos de papel pardo está interessado em melhorar a resistência do produto à tensão. A engenharia de produto pensa que a resistência à tensão seja uma função da concentração de madeira de lei na polpa e que a faixa pratica de interesse das concentrações de madeira de lei esteja entre 5 e 20%. Um time de engenheiros responsáveis pelo estudo decide investigar quatro níveis de concentração de madeira de lei: 5%, 10%, 15% e 20%. Eles decidem fabricar seis corpos de prova, para cada nível de concentração, usando uma planta piloto. Todos os 24 corpos de prova são testados, em uma ordem aleatória, em um equipamento de teste de laboratório. Os dados desse experimento são:

Box-Plot

Concentracao

Madeir

a

2015105

25

20

15

10

5

Boxplot of Madeira vs Concentracao

Hipóteses:

Continuação do teste de hipóteses:

Final do teste

Análise dos Resíduos

Standardized Residual

Perc

ent

210-1-2

99

90

50

10

1

Fitted Value

Sta

ndard

ized R

esi

dual

20,017,515,012,510,0

2

1

0

-1

-2

Standardized Residual

Fre

quency

2,01,51,00,50,0-0,5-1,0-1,5

4,8

3,6

2,4

1,2

0,0

Observation Order

Sta

ndard

ized R

esi

dual

24222018161412108642

2

1

0

-1

-2

Normal Probability Plot of the Residuals Residuals Versus the Fitted Values

Histogram of the Residuals Residuals Versus the Order of the Data

Residual Plots for Madeira

Programa usado no Software R.

n<-30mi1<-19mi2<-19mi3<-19sd<-3

a1<-rnorm(n,mi1,sd)a2<-rnorm(n,mi2,sd)a3<-rnorm(n,mi3,sd)a=c(a1,a2,a3)n=rep(n,3) #tamanho das amostrasgroup=rep(1:3,n) #Cuidado aqui.data = data.frame(a = a, group = factor(group))fit = lm(a ~ group, data)anova(fit)

tmpfn = function(x) c(sum = sum(x), mean = mean(x), var = var(x),n = length(x))tapply(a, group, tmpfn)tmpfn(a)

Conclusão

Logo a analise de variância pode ser usada para testar a diferença entre médias de várias populações, mostrando-se que a base usada para os testes estatisticos em analise de variancia é o desenvolvimento de duas estimativas independentes da variancia da população sigma ao quadrado, ao computar a razao destas duas estimativas, desenvolvemos uma regra de rejeijão para determinar se rejeitamos a hipotese nula de que as medias das populações são iguais.

Referência:Analysis of Variance Tables Based on Experimental Structure C. J. Brien, Biometrics, Vol. 39, No. 1 (Mar., 1983), pp. 53-59 FISHER, R. A. The logic of inductive inference. J. R. Stat. Soc., v.98, p.34-54, 1935. MONTGOMERY, D.C. 1988. Design and analysis of experiments. 2nd. John Wiley & Sons, New York, USA. SNEDECOR, C.W. and W.G. COCHRAN, 1980. Statistical Methods. 7ed. Iowa State University Press, Amer. Iowa. USA. FISHER, R.A. Statistical Methods for Research Workers. 11ª ed. Oliver & Boyd, Edinburgo. 1950. Gamerman, D. & Migon, H. (1993). Inferência estatística: uma abordagem integrada, Textos de métodos matemáticos, UFRJ. James F. Reed III: Analysis of Variance (ANOVA) Models in Emergency Medicine. The Internet Journal of Emergency and Intensive Care Medicine. 2004. Volume 7 Number 2. http://www.ispub.com/ostia/index.php?xmlFilePath=journals/ijeicm/vol7n2/anova.xml

ANOVA: Análise de Variância APLICAÇÃO. Prof. Hani Camille YehiaHani Camille Yehia Alunos:...

Documents

Transcript of ANOVA: Análise de Variância APLICAÇÃO. Prof. Hani Camille YehiaHani Camille Yehia Alunos:...