Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região...

Post on 22-Apr-2015

152 views 5 download

Transcript of Estatística Teste de hipóteses Teste de Hipóteses 1 -objectivo -nível de significância, região...

EstatísticaTeste de hipóteses

Teste de Hipóteses

1

-objectivo

-nível de significância, região crítica, erros

-construção de testes de hipóteses

-teste para a média de uma distr. normal conhecida) valor de prova

-teste para a média de uma distr. normal desconhecida)

-teste de igualdade de duas médias de distr. normal conhecida)

-teste de igualdade de duas médias de distr. normal desconhecida)

-teste do “t” para dados emparelhados

-teste para a variância de populações normais, comparação de duas variâncias, distribuição F

Pontos mais importantes:

EstatísticaTeste de hipóteses

2

Objectivo:

Verificar a consistência de uma hipótese estatística (sobre um parâmetro da distribuição em estudo) com os dados disponíveis (amostra).

e.g.: -os filtros que a minha empresa comprou conseguem resistir uma pressão de 5 Bar?

-o número de células numa água contaminada diminuiu,

por um factor de 10-5/ml, após o nosso tratamento?-A pasteurização de leite com um permutador de calor mais barato não resultou numa qualidade inferior em relação ao processo com um permutador de calor mais caro?...

EstatísticaTeste de hipóteses

3

Hipóteses

rejeitar

muito improvável

Aceitar verdadeira

Aceitar um hipótese não significa que esta é verdadeira, só significa que os dados aparecem consistentes com a nossa hipótese (provável)

EstatísticaTeste de hipóteses

4

Nível de significância

Suponha que temos uma população com distribuição F. Queremos testar um hipótese sobre da F. Este hipótese chama-se “hipótese nula”.

a) H0: =5 Bar (N~(

b) H0: <5 Bar (N~(

Caso a) é um hipótese simples: determina completamente F

Caso b) é um hipótese complexo: não determina F

Baseado numa mostra de tamanho n, podemos aceitar ou rejeitar H0

EstatísticaTeste de hipóteses

5

aceitar H0 se

rejeitar H0 se

CX,...X,X n21

CX,...X,X n21

H0 é rejeitada se a amostra (estatística) fizer parte da região crítica ,C, do espaço amostral:

Erro de tipo I: rejeitar erradamente H0 quando é verdadeira

Erro de tipo II: aceitar erradamente H0 quando é falsa

Quando H0 é verdadeira, a nossa hipótese só deve ser rejeitada se os valores observados forem muito improváveis. A probabilidade de cometer erro de tipo I não deve ultrapassar um valor especificado, (geralmente baixo).

EstatísticaTeste de hipóteses

6

chama-se nível de significância. Existem alguns níveis convencionais, mas a escolha depende do objectivo:

=0.2 -é suficiente ser suspeitoso que H0 seja falsa

=0.1 -moderadamente convencido que H0 é falsa

=0.05 -bastante convencido que H0 é falsa

=0.005 -muito convencido que H0 é falsa

EstatísticaTeste de hipóteses

7

Construção de um teste de hipótese

1) Escolha da estatística para o teste: geralmente um estimador e.g. média amostral

2) Escolha de um nível de significância

3) Determinação da distribuição de probabilidade da estatística e a correspondente região crítica

EstatísticaTeste de hipóteses

8

Testar a média de uma distribuição normal de variância conhecida

H0 : Hipótese nula:

Hipótese alternativa: H1 :

(média é igual com um dado valor)

Estatística (óbvia):n

XX

n

1i i

Região crítica: )cX(C 0

Nos queremos determinar c em concordância de uma tal que

cXP 00

(e.g. =5%, só 5 vezes em 100 amostras, a diferença entre a média amostral e a média ultrapassa c se H0 for verdadeira)

EstatísticaTeste de hipóteses

9

Se for verdade que , nos podemos dizer:

)1,0(N~X

nZ 0

Assim,

cn

ZP0

Aplicando simetria temos, 2cn

ZP0

Também sabemos que, 2zZP 20

O resultado,n

zc 2

EstatísticaTeste de hipóteses

10

aceitar H0 se n

zX 2

0

rejeitar H0 se n

zX 2

0

EstatísticaTeste de hipóteses

11

H0 :

H1 :

96.1z68.15.12

5X

n025.00

Exemplo: Pretende-se re-calibrar uma balança. O erro das medições da balança tem uma g2) e, desejavelmente, média 0. Fazendo 5 medições com peso calibrados a média amostral do erro é 1.5 g. Pode ser que o erro da balança continue, em média, a ser 0 (=0.05)

H0 é aceite com 5% de nível de significância.

EstatísticaTeste de hipóteses

12

Uma alternativa ao procedimento anterior é primeiro calcular:

0X

nzP2

p

p chama-se valor de prova e dá o nível de significância crítica. H0 rejeita-se para todos valores de que verifica p

Exemplo: Determine p para o exemplo anterior

%65.468.1zPXn

zP2p

0

Assim para qualquer nível de significância superior de 2*0.0465=0.093 H0: erro do balanço=0 seria rejeitado (e.g. =0.1)

EstatísticaTeste de hipóteses

13

EstatísticaTeste de hipóteses

14

Erro de tipo II: qual é a probabilidade de aceitar erradamente H0 quando a verdadeira média ?

H0 verdadeira H0 falsa

H0 rejeitada Erro tipo I

(probabilidade Correcta

(probabilidade 1-

H0 aceite Correcta

(probabilidade 1-Erro tipo II

(probabilidade

Resultados possíveis

EstatísticaTeste de hipóteses

022

0

022

0

20

2

nzZznP

nzX

nznP

nznX

nnzP)(

para calcular

15

20

2 zX

nzP)(

Esta probabilidade (aceitar H0) é uma função da média verdadeira (,

EstatísticaTeste de hipóteses

16

= 0+= 0+2

= 0+3

EstatísticaTeste de hipóteses

17

522

5n 0

392.096.15196.4

96.15196.151

96.15596.1)2(

Exemplo: Pretende-se re-calibrar uma balança. O erro das medições da balança tem uma g2) e, desejavelmente, média 0. Fazendo 5 medições com pesos calibrados qual é a probabilidade de aceitarmos erradamente H0, se o factor de calibração verdadeiro era 2g

; z0.025=1.96

EstatísticaTeste de hipóteses

18

No exemplo anterior é óbvio que a probabilidade de cometer o erro tipo II só depende do tamanho da mostra (para um dado ). Assim a função podia ser usada para determinar o tamanho da mostra maximizando a probabilidade de aceitar H0: 0 à , quando a verdadeira média é .

Infelizmente não existe solução analítica mas pode ser usada a seguinte aproximação (sem prova):

2

10

222 zz

n

EstatísticaTeste de hipóteses

19

O teste de hipótese discutido agora resultou uma rejeição de H0 quando o valor média da amostra ficou longe da média “hipotética” da população em qualquer sentido. O que acontece e.g. se a única alternativa é que 0 ou:

H0 : (ou )

H1 :

Região crítica: )cX(C 0

Nos queremos determinar c em concordância de uma tal que

cXP 00

Neste caso o teste chama-se teste unilateral.

EstatísticaTeste de hipóteses

20

zc

nZP

0

n

zc

Assim podemos escrever:

ou

aceitar H0 se n

zX 0

rejeitar H0 se n

zX 0

A probabilidade do erro tipo II é dado

00 nznzZP)(

H0 : (ou )H1 :

EstatísticaTeste de hipóteses

21

H0 :

H1 :

645.1z68.15.12

5X

n05.00

H0 é rejeitado com 5% de nível de significância.

A mesma forma podemos construir testes de hipótese unilateral para:

H0 : (ou )

H1 :

aceitar H0 se n

zX 0

rejeitar H0 se n

zX 0

Exemplo: Considere o exemplo de calibração da balança(g2)). Agora sabemos que se existe um erro, não pode ser negativo. Poderá o erro da balança em média continuar a ser 0 em média (=0.05)?

EstatísticaTeste de hipóteses

22

Nota: Existe uma analogia directa entre os intervalos da confiança e os testes de hipóteses

aceitar H0 se n

zX 2

0

n

zX

n

z 20

2

n

zXX

n

z 20

2

o intervalo de confiança:

1n

ZXn

ZXP 2/2/

n

zX

n

zX 2

02

ou

Se fica no intervalo da confiança com nível de conf. 1-, H0 é aceitado

EstatísticaTeste de hipóteses

23

Testar a média de uma distribuição normal de variância desconhecida-Teste do “t” de Student

H0 : Hipótese nula:

Hipótese alternativa: H1 :

Estatística:

t~S

XnT 0

Assim:aceitar H0 se

n

StX 1n,2

0

rejeitar H0 se n

StX 1n,2

0

(média é igual a um dado valor)

EstatísticaTeste de hipóteses

24

340 344 362 375 356 386 354 364 332 402 340 355 362 322 372 324 318 360 338 370

H0 : H1 :

7778.0s

XnT 0

2231.07778.0tPTtP2p

191n

ou p=0.4462

e.g. com H0 é aceitado (p>).

Exemplo: Suspeita-se que nos EUA o consumo diário de água num domicilio seja de 350 (10-1) gal/dia. Realizou-se uma experiência, que envolveu 20 famílias, e observaram-se os seguintes resultados:

EstatísticaTeste de hipóteses

25

0.22

EstatísticaTeste de hipóteses

26

H0 : (ou )

H1 :

aceitar H0 se n

StX 1n,

0

rejeitar H0 se n

StX 1n,

0

A)

B) H0 : (ou )

H1 :

aceitar H0 se n

StX 1n,

0

rejeitar H0 se n

StX 1n,

0

Podemos efectuar os testes unilaterais:

EstatísticaTeste de hipóteses

27

Teste da igualdade das médias de duas populações normais com as variâncias conhecidas

H0 : XYHipótese nula:

Hipótese alternativa:

Estatística:

mn,N~

m

Y

n

XYX

2Y

2X

YX

m

1i i

n

1i i

H1 : X Y

Assim se Ho for verdade:

1,0N~

mn

YX2Y

2X

EstatísticaTeste de hipóteses

Assim podemos facilmente construir um teste de hipóteses porque,

aceitar H0 se 22Y

2X

z

mn

YX

rejeitar H0 se 22Y

2X

z

mn

YX

28

EstatísticaTeste de hipóteses

A B 61.1 62.2 58.2 56.6 62.3 66.4 64 56.2

59.7 57.5 66.2 58.4 57.8 57.6 61.4 65.4 62.2 63.6 61.7 60

H0 : AB H1 : A

B

H0 está aceitado com 5% nível de significância

96.1z688.047.2

7.1

836

1016

607.61Z 025.0

29

Exemplo: Temos dois métodos, um barato (B) e um caro (A), para imobilizar enzimas. Medimos o tempo (em horas) que as enzimas imobilizadas mantém a sua capacidade catalítica. Determine se o método mais barato pode ser considerado como uma boa alternativa ao método A com 5% nível de significância com B=4 e B=6.

EstatísticaTeste de hipóteses

30

EstatísticaTeste de hipóteses

Teste da igualdade das médias de duas populações normais com as variâncias desconhecidas

H0 : XYHipótese nula:

Hipótese alternativa:

Estatística:

H1 : X Y

Assim se Ho for verdade: T~tn+m-2

Suponha que: X= Y

2mnS)1m(S)1n(

m1

n1

)(YXT

2Y

2X

YX

aceitar H0 se |T|<tn+m-2

rejeitar H0 se |T|>tn+m-2 31

EstatísticaTeste de hipóteses

Exemplo: Considere o exemplo anterior, mas agora suponha que as variâncias são também desconhecidos

A B 61.1 62.2 58.2 56.6 62.3 66.4 64 56.2

59.7 57.5 66.2 58.4 57.8 57.6 61.4 65.4 62.2 63.6 61.7 60

H0 : AB H1 : A

B

H0 está aceitado com 5% nível de significância

12.2t02.147.0*33.3

7.1T 16,025.0

32

EstatísticaTeste de hipóteses

33

EstatísticaTeste de hipóteses

Teste do “t” para dados emparelhados

Muitas vezes estamos interessados em avaliar, se uma alteração qualquer no nosso sistema, melhorou ou não o sistema (menos custo, mais produção, melhor qualidade etc.) Para saber isso, compara-se o sistema antes (X) e após (Y) a alteração feita.

Com n pares da amostra (Xi, Yi) podem ser usados para obter uma nova v.a. Wi= Xi-Yi

Assim: H0 : WHipótese nula:

Hipótese alternativa: H1 : W

Estatística: t~S

WnT

W

34

EstatísticaTeste de hipóteses

Assim:aceitar H0 se

n

StW W1n,2

rejeitar H0 se n

StW W1n,2

Vantagem: O teste do “t” emparelhado pode ser utilizada, apresar as amostras não serem independentes ou não tiveram variâncias iguais, garantido que n1=n2.

Desvantagem: o grau de liberdade em vez que 2n-2 fica apenas n-1.

35

EstatísticaTeste de hipóteses

Antes Depois W 30.5 23 7.5 18.5 21 -2.5 24.5 22 2.5 32 28.5 3.5 16 14.5 1.5 15 15.5 -0.5

23.5 24.5 -1 25.5 21 4.5 28 23.5 4.5 18 16.5 1.5

H0 : W

H1 : W

aceitar H0 se ,1nW

tS

Wn

rejeitar H0 se ,1nW

tS

Wn

833.1t67.23

15.210

3S

15.2W05.0,9

W

36

Exemplo: Recentemente um novo programa de segurança do trabalho foi introduzido na industria de produção de latas. O tempo (em horas) médio perdido na produção de cada semana por causa de acidentes foi medido em 10 empresas. Determine se o programa teve um efeito positivo com 5% de nível de significância.

Assim H0 é rejeitado, o programa teve um efeito positivo com 5% de nível de significância

EstatísticaTeste de hipóteses

37

EstatísticaTeste de hipóteses

Teste de hipóteses para a variância de populações normais

H0 : Hipótese nula:

Hipótese alternativa: H1 :

(variância é igual com um dado valor)

Estatística: 21n2

0

2

~S)1n(

Sabemos:

aceitar H0 se

38

1

s)1n(P 1n,2/

22

0

2

1n,2/12

1n,2/2

20

2

1n,2/12 s

)1n(

rejeitar H0 para outros

EstatísticaTeste de hipóteses

H0 :

H1 :

%) 33.07(p 2.27111.210225.0

025.0*19S)1n(1.0,192

0

2

39

Exemplo: Uma nova máquina de encher garrafas da água foi instalada numa empresa de água. A máquina pode ser considerada eficiente se o desvio padrão do volume da água engarrafada não ultrapassar 0.15l (garrafas de 15l). 20 amostras indicaram uma variância amostral 0.025l2. O que podemos dizer sobre a máquina?

H0 é aceite com 10% nível de significância (e qualquer nível de significância <p=33.07%).

EstatísticaTeste de hipóteses

40

21.1

EstatísticaTeste de hipóteses

Teste da igualdade de variâncias de duas populações normais

H0 : X

YHipótese nula:

Hipótese alternativa:

Estatística: F~S

S1m,1n2

Y

2X

H1 : X

Y

1m

)YY(S ;

1n

)XX(S

m

1i

2i2

Y

n

1i

2i2

X

Então:

aceitar H0 se

rejeitar H0 para outros

1F

S

SFP 1m,1n,22

Y

2X

1m,1n,21

1m,1n,22Y

2X

1m,1n,21 FS

SF

41

EstatísticaTeste de hipóteses

Distribuição F: Sejam e

duas v.a. com distribuição chi-quadrado a v.a. F definida:

2

1F 22

21

2,1

tem uma distribuição F com e graus de liberdade

42

- f(x) muito complicado

-tabelas para calcular probabilidades

EstatísticaTeste de hipóteses

43

EstatísticaTeste de hipóteses

H0 : X

YHipótese nula:

Hipótese alternativa: H1 : X

Y

5.0S

S2

Y

2X 26.0

F

1F

9,11,025.011,9,025.01

59.3F 11,9,025.0

59.35.026.0

Exemplo: Existem dois catalisadores utilizados num processo químico. A quantidade de produto formado usando qualquer um dos catalisadores não tem uma diferença significativa em termos do valor da média. Mas também queremos testar, se as variâncias podem ser considerados iguais com 5% nível de significância. As mostras indicaram que S2

1=0.14 (n=10) e S22=0.28 (n=12).

assim o hipótese de variâncias iguais é aceite.

44

EstatísticaTeste de hipóteses

45

4