Escola Politécnica de Pernambuco Departamento de Ensino Básico Capítulo 08 TESTES DE HIPÓTESES E...

Post on 16-Apr-2015

105 views 1 download

Transcript of Escola Politécnica de Pernambuco Departamento de Ensino Básico Capítulo 08 TESTES DE HIPÓTESES E...

Escola Politécnica de PernambucoDepartamento de Ensino Básico

Capítulo 08

TESTES DE HIPÓTESES E SIGNIFICÂNCIA

Prof. Sérgio Mário Lins Galdino

http://epoli.pbworks.com/

Agenda

Decisões Estatísticas;

Hipóteses Estatísticas;

Testes de Hipóteses e Significância;

Erros do Tipo I e do Tipo II;

Nível de Significância;

Testes que Envolvem a Distribuição Normal;

Agenda

Testes Unilaterais e Bilaterais;

Diferenças de Médias;

Desvio Padrão;

Erro Padrão;

Testes para Diferença de Médias;

Relação entre a Teoria da Estimação e o Teste de Hipóteses.

Decisões Estatísticas

São decisões tomadas sobre populações com base em amostras das mesmas.

Hipóteses Estatísticas

Para tomar decisões é útil formular hipóteses ou suposições sobre as populações em estudo. Tais hipóteses chamam-se hipóteses estatísticas e, em geral, consistem de afirmações sobre as distribuições de probabilidade das populações. Formulamos uma hipótese com o propósito de aceitá-la ou rejeitá-la.

Testes de Hipóteses e Significância

Quando admitimos que uma determinada hipótese é verdadeira e obtermos um resultado que difere substancialmente do resultado esperado, dizemos que as diferenças observadas são significativas.

Os processos que nos permitem decidir entre aceitar ou rejeitar uma hipótese ou determinar se as amostras observadas diferem significativamente dos resultados esperados, são chamados de testes de hipóteses, testes de significância ou regras de decisão.

Erros do Tipo I e do Tipo II

Se rejeitamos uma hipótese quando ela deveria ser aceita, dizemos que foi cometido um erro do tipo I. Se, por outro lado, aceitamos uma hipótese quando ela deveria ser rejeitada, cometemos um erro do tipo II. Em qualquer dos casos ocorre um erro de julgamento.

Nível de Significância

O nível de significância representa a probabilidade de erro na rejeição de uma hipótese, ou seja, a probabilidade de um erro do tipo I.

Região crítica: aceitação ou rejeição da hipótese

O conjunto de valores dos extremos da estatística S exteriores ao intervalo obtido constitui o que se chama região crítica, região de rejeição da hipótese ou ainda região de significância. E o conjunto de valores extremos da estatística S interiores ao intervalo obtido pode então ser chamado de região de aceitação da hipótese ou região de não-significância.

Testes que Envolvem a Distribuição Normal

Suponha que sob a hipótese dada, a distribuição de amostragem de uma estatística S é uma distribuição normal com médias µS e desvio padrão σS. A distribuição desse padrão variável Z = (S - µS) / σS é a distribuição normal padrão (média 0, variância 1), e os valores extremos de Z determinam à rejeição da hipótese.

Testes que Envolvem a Distribuição Normal

Como indicado na figura, podemos estar 95% confiantes de que, se a hipótese for verdadeira, o escore z de uma amostra estatística S real estará entre - 1,96 a 1,96 (pois a área sob a curva normal entre esses dois valores é 0,95).

Testes Unilaterais e Bilaterais

Os testes são chamados bilaterais quando há interesse nos dois valores extremos da estatística S, ou seja, em seus escores z em ambos os lados da média.

Já os testes unilaterais ocorrem quando há interesse em apenas um dos valores extremos de um ou de outro lado da média.

A tabela abaixo mostra os valores críticos de z tanto para os testes unilaterais como para testes bilaterais, a vários níveis de significância.

Valores críticos de z

Valores críticos de z para os testes unilaterais e para testes bilaterais, a vários níveis de significância.

Nível de Significância 0.10 0.05 0.01 0.005

Valores Críticos de z para testes unilaterais

-1.28ou 1.28

-1.645ou 1.645

-2.33ou 2.33

-2.58ou 2.58

Valores Críticos de z para testes bilaterais

-1.645ou 1.645

-1.96ou 1.96

-2.58ou 2.58

-2.81ou 2.81

Diferenças de Médias

Comparação das médias de populações através da estimação das diferenças de médias e intervalo de confiança para esta diferença.

Sejam:

a média, o desvio padrão e o tamanho amostral da 1ª e 2ª população respectivamente.

A estimativa da diferença entre médias ( ) é dada por ( ), sendo necessário determinar um erro padrão para esta estimativa.

222111 ,,,, nSxenSx

21

21 xx

Desvio Padrão e Erro Padrão

Define-se o desvio padrão combinado como sendo:

E, a partir desse valor, define-se o erro padrão das diferenças nas médias como:

221

222

211

nn

SnSnDP

21

11

nnDPEP

Teste para Diferença de Médias

Um teste de hipótese para a diferença entre médias é

Usa-se a variável:

distribuição t-Student com graus de liberdade (pequenas amostras).

00: 21210 comoassimH

EP

xxt

)( 21

221 nn

Exemplo

Sejam as amostras das alturas de um grupo de estudantes com valores de média, desvio padrão e tamanho da amostra. Os valores com índice 1 referem-se aos homens e os com índice 2, às mulheres. As alturas estão medidas em centímetros.

17,750.9,09.164

20,734.7,85.178

222

111

nSx

nSx

Exemplo (continuação)

Temos que:

956,217

1

20

1.964,8

11

964,821720

)75,9.(17)734,7.(20

2

21

22

21

222

211

EP

EP

nnDPEP

DP

DP

nn

SnSnDP

Exemplo (continuação)

Graus de Liberdade: 20+17-2 = 35

Probabilidade de exceder o valor crítico (unilateral)

0.10 0.05 0.025 0.01 0.005 0.001 1. 3.078 6.314 12.706 31.821 63.657 318.313

35. 1.306 1.690 2.030 2.438 2.724 3.340

Conclui-se que: temos que rejeitar a hipótese = Afirma-se que as médias são diferente no nível 0.05 (t > 2.724)

993,4

956,2

09,16485,178

21

t

t

SE

xxt

Tabela t-Student

Graus de Liberdade

80% 90% 95% 99%

13.078 6.314 12.706 63.657

21.886 2.920 4.303 9.925

31.638 2.353 3.182 5.841

41.533 2.132 2.776 4.604

51.476 2.015 2.571 4.032

61.440 1.943 2.447 3.707

71.415 1.895 2.365 3.500

81.397 1.860 2.306 3.355

91.383 1.833 2.262 3.250

101.372 1.812 2.228 3.169

111.363 1.796 2.201 3.106

121.356 1.782 2.179 3.055

131.350 1.771 2.160 3.012

141.345 1.761 2.145 2.977

151.341 1.753 2.131 2.947

Graus de Liiberdade

80% 90% 95% 99%

161.337 1.746 2.120 2.921

171.333 1.740 2.110 2.898

181.330 1.734 2.101 2.878

191.328 1.729 2.093 2.861

201.325 1.725 2.086 2.845

211.323 1.721 2.080 2.831

221.321 1.717 2.074 2.819

231.319 1.714 2.069 2.807

241.318 1.711 2.064 2.797

251.316 1.708 2.060 2.787

261.315 1.706 2.056 2.779

271.314 1.703 2.052 2.771

281.313 1.701 2.048 2.763

291.311 1.699 2.045 2.756

301.310 1.697 2.042 2.750

df 80% 90% 95% 99%

infinity 1.282 1.645 1.96 2.576

Tabela t-Student

Relação entre a Teoria da Estimação e o Teste de Hipóteses

Relação entre a Teoria da Estimação e o Teste de Hipóteses

Pode-se notar que existe uma relação entre a teoria da estimação envolvendo intervalos de confiança e a teoria dos testes de hipóteses. Por exemplo, para aceitação de ao nível de 0,05 é equivalente ao resultado que conduz ao intervalo de confiança de 95 %

nx

nx

96,196,1