Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região...

45
Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste para a média de uma distr. normal conhecida) valor de prova -teste para a média de uma distr. normal desconhecida) -teste de igualdade de duas médias de distr. normal conhecida) -teste de igualdade de duas médias de distr. normal desconhecida) -teste do “t” para dados emparelhados -teste para a variância de populações normais, Pontos mais importantes:

Transcript of Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região...

Page 1: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

Teste de Hipóteses

1

-objectivo

-nível de significância, região crítica, erros

-construção de testes de hipóteses

-teste para a média de uma distr. normal conhecida) valor de prova

-teste para a média de uma distr. normal desconhecida)

-teste de igualdade de duas médias de distr. normal conhecida)

-teste de igualdade de duas médias de distr. normal desconhecida)

-teste do “t” para dados emparelhados

-teste para a variância de populações normais, comparação de duas variâncias, distribuição F

Pontos mais importantes:

Page 2: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

2

Objectivo:

Verificar a consistência de uma hipótese estatística (sobre um parâmetro da distribuição em estudo) com os dados disponíveis (amostra).

e.g.: -os filtros que a minha empresa comprou conseguem resistir uma pressão de 5 Bar?

-o número de células numa água contaminada diminuiu,

por um factor de 10-5/ml, após o nosso tratamento?-A pasteurização de leite com um permutador de calor mais barato não resultou numa qualidade inferior em relação ao processo com um permutador de calor mais caro?...

Page 3: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

3

Hipóteses

rejeitar

muito improvável

Aceitar verdadeira

Aceitar um hipótese não significa que esta é verdadeira, só significa que os dados aparecem consistentes com a nossa hipótese (provável)

Page 4: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

4

Nível de significância

Suponha que temos uma população com distribuição F. Queremos testar um hipótese sobre da F. Este hipótese chama-se “hipótese nula”.

a) H0: =5 Bar (N~(

b) H0: <5 Bar (N~(

Caso a) é um hipótese simples: determina completamente F

Caso b) é um hipótese complexo: não determina F

Baseado numa mostra de tamanho n, podemos aceitar ou rejeitar H0

Page 5: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

5

aceitar H0 se

rejeitar H0 se

CX,...X,X n21

CX,...X,X n21

H0 é rejeitada se a amostra (estatística) fizer parte da região crítica ,C, do espaço amostral:

Erro de tipo I: rejeitar erradamente H0 quando é verdadeira

Erro de tipo II: aceitar erradamente H0 quando é falsa

Quando H0 é verdadeira, a nossa hipótese só deve ser rejeitada se os valores observados forem muito improváveis. A probabilidade de cometer erro de tipo I não deve ultrapassar um valor especificado, (geralmente baixo).

Page 6: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

6

chama-se nível de significância. Existem alguns níveis convencionais, mas a escolha depende do objectivo:

=0.2 -é suficiente ser suspeitoso que H0 seja falsa

=0.1 -moderadamente convencido que H0 é falsa

=0.05 -bastante convencido que H0 é falsa

=0.005 -muito convencido que H0 é falsa

Page 7: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

7

Construção de um teste de hipótese

1) Escolha da estatística para o teste: geralmente um estimador e.g. média amostral

2) Escolha de um nível de significância

3) Determinação da distribuição de probabilidade da estatística e a correspondente região crítica

Page 8: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

8

Testar a média de uma distribuição normal de variância conhecida

H0 : Hipótese nula:

Hipótese alternativa: H1 :

(média é igual com um dado valor)

Estatística (óbvia):n

XX

n

1i i

Região crítica: )cX(C 0

Nos queremos determinar c em concordância de uma tal que

cXP 00

(e.g. =5%, só 5 vezes em 100 amostras, a diferença entre a média amostral e a média ultrapassa c se H0 for verdadeira)

Page 9: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

9

Se for verdade que , nos podemos dizer:

)1,0(N~X

nZ 0

Assim,

cn

ZP0

Aplicando simetria temos, 2cn

ZP0

Também sabemos que, 2zZP 20

O resultado,n

zc 2

Page 10: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

10

aceitar H0 se n

zX 2

0

rejeitar H0 se n

zX 2

0

Page 11: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

11

H0 :

H1 :

96.1z68.15.12

5X

n025.00

Exemplo: Pretende-se re-calibrar uma balança. O erro das medições da balança tem uma g2) e, desejavelmente, média 0. Fazendo 5 medições com peso calibrados a média amostral do erro é 1.5 g. Pode ser que o erro da balança continue, em média, a ser 0 (=0.05)

H0 é aceite com 5% de nível de significância.

Page 12: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

12

Uma alternativa ao procedimento anterior é primeiro calcular:

0X

nzP2

p

p chama-se valor de prova e dá o nível de significância crítica. H0 rejeita-se para todos valores de que verifica p

Exemplo: Determine p para o exemplo anterior

%65.468.1zPXn

zP2p

0

Assim para qualquer nível de significância superior de 2*0.0465=0.093 H0: erro do balanço=0 seria rejeitado (e.g. =0.1)

Page 13: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

13

Page 14: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

14

Erro de tipo II: qual é a probabilidade de aceitar erradamente H0 quando a verdadeira média ?

H0 verdadeira H0 falsa

H0 rejeitada Erro tipo I

(probabilidade Correcta

(probabilidade 1-

H0 aceite Correcta

(probabilidade 1-Erro tipo II

(probabilidade

Resultados possíveis

Page 15: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

022

0

022

0

20

2

nzZznP

nzX

nznP

nznX

nnzP)(

para calcular

15

20

2 zX

nzP)(

Esta probabilidade (aceitar H0) é uma função da média verdadeira (,

Page 16: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

16

= 0+= 0+2

= 0+3

Page 17: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

17

522

5n 0

392.096.15196.4

96.15196.151

96.15596.1)2(

Exemplo: Pretende-se re-calibrar uma balança. O erro das medições da balança tem uma g2) e, desejavelmente, média 0. Fazendo 5 medições com pesos calibrados qual é a probabilidade de aceitarmos erradamente H0, se o factor de calibração verdadeiro era 2g

; z0.025=1.96

Page 18: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

18

No exemplo anterior é óbvio que a probabilidade de cometer o erro tipo II só depende do tamanho da mostra (para um dado ). Assim a função podia ser usada para determinar o tamanho da mostra maximizando a probabilidade de aceitar H0: 0 à , quando a verdadeira média é .

Infelizmente não existe solução analítica mas pode ser usada a seguinte aproximação (sem prova):

2

10

222 zz

n

Page 19: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

19

O teste de hipótese discutido agora resultou uma rejeição de H0 quando o valor média da amostra ficou longe da média “hipotética” da população em qualquer sentido. O que acontece e.g. se a única alternativa é que 0 ou:

H0 : (ou )

H1 :

Região crítica: )cX(C 0

Nos queremos determinar c em concordância de uma tal que

cXP 00

Neste caso o teste chama-se teste unilateral.

Page 20: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

20

zc

nZP

0

n

zc

Assim podemos escrever:

ou

aceitar H0 se n

zX 0

rejeitar H0 se n

zX 0

A probabilidade do erro tipo II é dado

00 nznzZP)(

H0 : (ou )H1 :

Page 21: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

21

H0 :

H1 :

645.1z68.15.12

5X

n05.00

H0 é rejeitado com 5% de nível de significância.

A mesma forma podemos construir testes de hipótese unilateral para:

H0 : (ou )

H1 :

aceitar H0 se n

zX 0

rejeitar H0 se n

zX 0

Exemplo: Considere o exemplo de calibração da balança(g2)). Agora sabemos que se existe um erro, não pode ser negativo. Poderá o erro da balança em média continuar a ser 0 em média (=0.05)?

Page 22: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

22

Nota: Existe uma analogia directa entre os intervalos da confiança e os testes de hipóteses

aceitar H0 se n

zX 2

0

n

zX

n

z 20

2

n

zXX

n

z 20

2

o intervalo de confiança:

1n

ZXn

ZXP 2/2/

n

zX

n

zX 2

02

ou

Se fica no intervalo da confiança com nível de conf. 1-, H0 é aceitado

Page 23: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

23

Testar a média de uma distribuição normal de variância desconhecida-Teste do “t” de Student

H0 : Hipótese nula:

Hipótese alternativa: H1 :

Estatística:

t~S

XnT 0

Assim:aceitar H0 se

n

StX 1n,2

0

rejeitar H0 se n

StX 1n,2

0

(média é igual a um dado valor)

Page 24: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

24

340 344 362 375 356 386 354 364 332 402 340 355 362 322 372 324 318 360 338 370

H0 : H1 :

7778.0s

XnT 0

2231.07778.0tPTtP2p

191n

ou p=0.4462

e.g. com H0 é aceitado (p>).

Exemplo: Suspeita-se que nos EUA o consumo diário de água num domicilio seja de 350 (10-1) gal/dia. Realizou-se uma experiência, que envolveu 20 famílias, e observaram-se os seguintes resultados:

Page 25: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

25

0.22

Page 26: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

26

H0 : (ou )

H1 :

aceitar H0 se n

StX 1n,

0

rejeitar H0 se n

StX 1n,

0

A)

B) H0 : (ou )

H1 :

aceitar H0 se n

StX 1n,

0

rejeitar H0 se n

StX 1n,

0

Podemos efectuar os testes unilaterais:

Page 27: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

27

Teste da igualdade das médias de duas populações normais com as variâncias conhecidas

H0 : XYHipótese nula:

Hipótese alternativa:

Estatística:

mn,N~

m

Y

n

XYX

2Y

2X

YX

m

1i i

n

1i i

H1 : X Y

Assim se Ho for verdade:

1,0N~

mn

YX2Y

2X

Page 28: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

Assim podemos facilmente construir um teste de hipóteses porque,

aceitar H0 se 22Y

2X

z

mn

YX

rejeitar H0 se 22Y

2X

z

mn

YX

28

Page 29: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

A B 61.1 62.2 58.2 56.6 62.3 66.4 64 56.2

59.7 57.5 66.2 58.4 57.8 57.6 61.4 65.4 62.2 63.6 61.7 60

H0 : AB H1 : A

B

H0 está aceitado com 5% nível de significância

96.1z688.047.2

7.1

836

1016

607.61Z 025.0

29

Exemplo: Temos dois métodos, um barato (B) e um caro (A), para imobilizar enzimas. Medimos o tempo (em horas) que as enzimas imobilizadas mantém a sua capacidade catalítica. Determine se o método mais barato pode ser considerado como uma boa alternativa ao método A com 5% nível de significância com B=4 e B=6.

Page 30: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

30

Page 31: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

Teste da igualdade das médias de duas populações normais com as variâncias desconhecidas

H0 : XYHipótese nula:

Hipótese alternativa:

Estatística:

H1 : X Y

Assim se Ho for verdade: T~tn+m-2

Suponha que: X= Y

2mnS)1m(S)1n(

m1

n1

)(YXT

2Y

2X

YX

aceitar H0 se |T|<tn+m-2

rejeitar H0 se |T|>tn+m-2 31

Page 32: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

Exemplo: Considere o exemplo anterior, mas agora suponha que as variâncias são também desconhecidos

A B 61.1 62.2 58.2 56.6 62.3 66.4 64 56.2

59.7 57.5 66.2 58.4 57.8 57.6 61.4 65.4 62.2 63.6 61.7 60

H0 : AB H1 : A

B

H0 está aceitado com 5% nível de significância

12.2t02.147.0*33.3

7.1T 16,025.0

32

Page 33: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

33

Page 34: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

Teste do “t” para dados emparelhados

Muitas vezes estamos interessados em avaliar, se uma alteração qualquer no nosso sistema, melhorou ou não o sistema (menos custo, mais produção, melhor qualidade etc.) Para saber isso, compara-se o sistema antes (X) e após (Y) a alteração feita.

Com n pares da amostra (Xi, Yi) podem ser usados para obter uma nova v.a. Wi= Xi-Yi

Assim: H0 : WHipótese nula:

Hipótese alternativa: H1 : W

Estatística: t~S

WnT

W

34

Page 35: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

Assim:aceitar H0 se

n

StW W1n,2

rejeitar H0 se n

StW W1n,2

Vantagem: O teste do “t” emparelhado pode ser utilizada, apresar as amostras não serem independentes ou não tiveram variâncias iguais, garantido que n1=n2.

Desvantagem: o grau de liberdade em vez que 2n-2 fica apenas n-1.

35

Page 36: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

Antes Depois W 30.5 23 7.5 18.5 21 -2.5 24.5 22 2.5 32 28.5 3.5 16 14.5 1.5 15 15.5 -0.5

23.5 24.5 -1 25.5 21 4.5 28 23.5 4.5 18 16.5 1.5

H0 : W

H1 : W

aceitar H0 se ,1nW

tS

Wn

rejeitar H0 se ,1nW

tS

Wn

833.1t67.23

15.210

3S

15.2W05.0,9

W

36

Exemplo: Recentemente um novo programa de segurança do trabalho foi introduzido na industria de produção de latas. O tempo (em horas) médio perdido na produção de cada semana por causa de acidentes foi medido em 10 empresas. Determine se o programa teve um efeito positivo com 5% de nível de significância.

Assim H0 é rejeitado, o programa teve um efeito positivo com 5% de nível de significância

Page 37: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

37

Page 38: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

Teste de hipóteses para a variância de populações normais

H0 : Hipótese nula:

Hipótese alternativa: H1 :

(variância é igual com um dado valor)

Estatística: 21n2

0

2

~S)1n(

Sabemos:

aceitar H0 se

38

1

s)1n(P 1n,2/

22

0

2

1n,2/12

1n,2/2

20

2

1n,2/12 s

)1n(

rejeitar H0 para outros

Page 39: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

H0 :

H1 :

%) 33.07(p 2.27111.210225.0

025.0*19S)1n(1.0,192

0

2

39

Exemplo: Uma nova máquina de encher garrafas da água foi instalada numa empresa de água. A máquina pode ser considerada eficiente se o desvio padrão do volume da água engarrafada não ultrapassar 0.15l (garrafas de 15l). 20 amostras indicaram uma variância amostral 0.025l2. O que podemos dizer sobre a máquina?

H0 é aceite com 10% nível de significância (e qualquer nível de significância <p=33.07%).

Page 40: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

40

21.1

Page 41: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

Teste da igualdade de variâncias de duas populações normais

H0 : X

YHipótese nula:

Hipótese alternativa:

Estatística: F~S

S1m,1n2

Y

2X

H1 : X

Y

1m

)YY(S ;

1n

)XX(S

m

1i

2i2

Y

n

1i

2i2

X

Então:

aceitar H0 se

rejeitar H0 para outros

1F

S

SFP 1m,1n,22

Y

2X

1m,1n,21

1m,1n,22Y

2X

1m,1n,21 FS

SF

41

Page 42: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

Distribuição F: Sejam e

duas v.a. com distribuição chi-quadrado a v.a. F definida:

2

1F 22

21

2,1

tem uma distribuição F com e graus de liberdade

42

- f(x) muito complicado

-tabelas para calcular probabilidades

Page 43: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

43

Page 44: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

H0 : X

YHipótese nula:

Hipótese alternativa: H1 : X

Y

5.0S

S2

Y

2X 26.0

F

1F

9,11,025.011,9,025.01

59.3F 11,9,025.0

59.35.026.0

Exemplo: Existem dois catalisadores utilizados num processo químico. A quantidade de produto formado usando qualquer um dos catalisadores não tem uma diferença significativa em termos do valor da média. Mas também queremos testar, se as variâncias podem ser considerados iguais com 5% nível de significância. As mostras indicaram que S2

1=0.14 (n=10) e S22=0.28 (n=12).

assim o hipótese de variâncias iguais é aceite.

44

Page 45: Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste.

EstatísticaTeste de hipóteses

45

4