Contabilometria
Aula 6
Prof.: Patricia Maria Bortolon, D. Sc.
Teste de Hipóteses
Fonte:
LEVINE, D. M.; STEPHAN, D. F.; KREHBIEL, T. C.;
BERENSON, M. L.; Estatística – Teoria e Aplicações, 5a.
Edição, Editora LTC, São Paulo, 2008
STEVENSON, W. J.; Estatística Aplicada à Administração;
Editora Arbra; São Paulo
Teste de Hipóteses - Definições
É uma regra de decisão para aceitar, ou rejeitar,
uma hipótese estatística com base nos elementos
de uma amostra.
Hipótese nula = H0 = é a hipótese a ser testada,
refere-se sempre a um valor de um parâmetro da
população
Hipótese alternativa = H1 = é o oposto da hipótese
nula, a conclusão a que se chegaria ao rejeitar a
hipótese nula
Teste de Hipóteses - Exemplos
a) H0: μ = 1,65m
H1: μ ≠ 1,65m
ou μ > 1,65m ou μ < 1,65m
b) H0: σ2 = 500
H1: σ2 ≠ 500
ou σ2 > 500 ou σ2 < 500
c) H0: π = 0,40
H1: π ≠ 0,40
ou π > 0,40 ou π < 0,40
Exemplo 1
Defina a hipótese nula e a hipótese alternativa para
a seguinte situação: inspeciona-se uma amostra de
142 peças de uma grande remessa, encontrando-se
8% defeituosas. O fornecedor garante que não
haverá mais de 6% de peças defeituosas em cada
remessa. O que tentamos descobrir é se a
afirmação do fornecedor é verdadeira.
H0: π = 6%
H1: π > 6%
Variação casual ou real?
No exemplo anterior a amostra de 142 peças
apontou 8% de peças defeituosas. Será que posso
afirmar que é diferente de 6% afirmado pelo
fabricante?
E se eu retirasse outra amostra e encontrasse 3%
de defeituosas? Afirmaria que não há problemas
com a remessa?
A resposta, depende da dispersão (variação) da
proporção de defeituosas de amostra para
amostra...
Variação casual ou real?
No nosso exemplo qual o desvio padrão?
A amostra deu 8% de defeituosas, ou seja, a
discrepância em relação ao afirmado pelo
fabricante é de 2%, o que é exatamente um desvio-
padrão.
02,0142
94,006,0)1(
n
ppp
0,102,0
06,008,0
pz
Variação casual ou real?
Na tabela normal:
A probabilidade de obter uma discrepância maior
que 2% é de aproximadamente 16%!!!!
Então, pode ser devido ao acaso...
0,1587
0,08 0,06
Z = +1,0
Variação casual ou real?
E se a amostra de 142 peças tivesse dado 12% de
defeituosas?
Neste caso, parece pouco provável que tal estatística
amostral provenha de uma população com o parâmetro
alegado de 6%.
0,302,0
06,012,0
pz
0,0013
5
0,12 0,06
Z = +3,0
Variação casual ou real?
Estatísticas amostrais
como essa são bastante
prováveis se H0 é verdadeira
Estatísticas amostrais
como essa são bastante
improváveis se H0 é verdadeira
Como separar a variação
real da casual? Ou o muito
próximo do muito
diferente?
Regiões de Rejeição e de Não-Rejeição e Estatística
do Teste
...ou ou Teste do aEstatístic
nS
xt
n
xz
Rejeitar H0 se a
estatística de teste
está nesse intervalo
Não Rejeitar H0 se
está nesse intervalo
α
O que define a hipótese alternativa
Os desvios não aleatórios (isto é, significativos) de determinado parâmetro pode envolver desvios em ambas as direções ou apenas uma direção.
Exemplo: no. de caras em jogadas sucessivas de uma moeda H0 : a moeda é equilibrada
Se eu definir H1: a moeda não é equilibrada => vou investigar desvios em ambas as direções.
Mas, se eu estiver apostando em “caras”...
... é melhor definir H1: aparecem muito poucas “caras” (p < 0,50) => investigarei uma cauda apenas, a cauda à esquerda
H1 indica qual aspecto da variação não-aleatória nos interessa
Rejeita
H0
Não Rejeita
H0
α
v.c.
Rejeita
H0
Não Rejeita
H0
α
v.c.
Rejeita
H0
Não Rejeita
H0
α/2
v.c.
α/2
Rejeita
H0 v.c.
H0: π = 0,5
H1: π ≠ 0,5
H0: π = 0,5
H1: π < 0,5
H0: π = 0,5
H1: π > 0,5
(muito poucas caras)
(muitas caras)
Testes Bilaterais ou Unilaterais?
H0 se escreve sempre da mesma forma
H1 irá depender do problema com o qual você está lidando.
Bilaterais: A divergência crítica é em ambas as direções.
Ex: fabricação de roupas fora da
especificação, o problema ocorre sejam elas
serem muito grandes ou muito pequenas
Cauda esquerda: Para verificar se determinado padrão mínimo
foi atingido. Ex: % mínimo de gordura no leite,
vida útil de determinado produto. O problema
ocorre se a vida útil for muito pequena, se ela
for muito grande não há problema
Cauda direita: Para verificar se determinado padrão máximo
não foi excedido. Ex: no. de unidades
defeituosas em uma remessa, poluição
emitida por uma fábrica.
Exemplo 2
Um fornecedor de mancais comprometeu-se a enviar
para uma firma lotes que não contenham mais de 2%
de defeituosos. O comprador extrai amostras ao
receber a remessa, para verificar a qualidade.
a. indique Ho e H1
b. O fornecedor não deseja remeter lotes com
elevado risco de devolução em razão de
número excessivo de unidades defeituosas,
mas também não deseja remeter lotes com
percentagem de defeituosos muito menor que
a estabelecida, de modo que ele também,
fornecedor, faz seu teste antes de proceder à
remessa. Indique Ho e H1.
Exemplo 2
Um fornecedor de mancais comprometeu-se a enviar
para uma firma lotes que não contenham mais de 2%
de defeituosos. O comprador extrai amostras ao
receber a remessa, para verificar a qualidade.
a. H0: π = 2% e H1: π > 2%
b. H0: π = 2% e H1: π ≠ 2%
Mas, como estabelecer o
valor crítico?
Nível de Significância α
Rejeitar H0 se a
estatística de teste
está nesse intervalo
Não Rejeitar H0 se
está nesse intervalo
α
Mas, o que significa “nível de significância”????
Para entender seu significado é preciso
entender os erros que se pode cometer
e suas consequências...
Erros Tipo I e Tipo II
a verdadeirH sendo Hrejeitar de erro I Tipo Erro 00
falsa H sendo Haceitar de erro II Tipo Erro 00
Erros Tipo I e Tipo II
Realidade
H0 verdadeira H0 falsa
Decisão
Aceitar H0 Decisão correta
(1 – α)
Erro Tipo II
( β )
Rejeitar H0 Erro Tipo I
( α )
Decisão correta
(1 – β)
Erros Tipo I e Tipo II
α é também denominado Nível de Significância e é
estabelecido antes do teste por quem o realiza, em
geral, é igual a 1%, 5% ou 10%.
A escolha depende do risco que se quer correr e
dos custos de uma conclusão errada.
Erros Tipo I e Tipo II - Exemplo
Via de regra, em um tribunal os integrantes do júri
não se deixam enganar por provas falsas, quer sejam
a favor ou contra o réu. Tais enganos ocorrem sim,
mas com baixa probabilidade. Tendo em mente a
“filosofia” do teste de hipóteses da inferência
estatística com qual alternativa se deve trabalhar?
(a) O réu é inocente até prova em contrário.
(b) O réu é culpado até prova em contrário
H0: o réu é inocente
H1: o réu não é inocente
P(Erro Tipo I) = α = P(rejeitar H0 sendo H0 verdadeira)
= α = P(julgar o réu culpado sendo ele inocente)
Ao definirmos α limitamos a probabilidade de cometer
esse erro!!!
Nível de Significância α
Os níveis de significância mais utilizados são 1%,
5% e 10%
falsa é H quando Haceitar II Tipo Erro95% )HP(aceitar 000
a verdadeiré H quando Hrejeitar I Tipo Erro5% )H P(rejeitar 000
A decisão de rejeitar H0 é muito mais segura do
que a decisão de aceitar H0!!!!
A probabilidade de cometer erro é menor!
A lógica do Teste de Hipóteses
Atribuem-se baixos valores para α, geralmente 1%
a 10%
Formula-se H0 com a pretensão de rejeitá-la
Se o teste indicar a rejeição de H0, há um indicador
mais seguro para a decisão
Teste de uma média com
variância conhecida
Teste de Hipóteses para a Média
σ conhecido
Para um teste bi-caudal da média, σ conhecido:
Converta a estatística da amostra ( X ) em uma estatística de teste
Determine o valor crítico de z para o nível de confiança especificado a partir de uma tabela ou usando o Excel
Decisão: se a estatística de teste cair na região de rejeição, rejeite H0; caso contrário não rejeite Ho
n
σ
μXZ
Teste de Hipótese para a Média
σ conhecido
Não rejeita H0 Rejeita
H0
Rejeita
H0
Há dois valores
críticos definindo
as regiões de
rejeição /2
-Z
0
H0: μ = 3
H1: μ ≠ 3
+Z
/2
Valor
crítico
inferior
Valor
crítico
superior
3
Z
X
Teste de Hipótese para a Média
σ conhecido
Exemplo: Teste a afirmação de que o verdadeiro peso médio das barras de chocolate produzidas em uma fábrica é igual a 3 onças.
Declare as hipóteses nula e alternativa
H0: μ = 3 H1: μ ≠ 3 (este é um teste bi-caudal)
Especifique o nível desejado de significância
Suponha que = .05 seja escolhido para este teste
Escolha um tamanho de amostra
Suponha que um tamanho de amostra n = 100 seja
escolhido
Teste de Hipótese para a Média
σ conhecido
2.0.08
.16
100
0.8
32.84
n
σ
μXZ
Determine a técnica adequada σ é conhecido então pode-se usar o teste Z
Estabeleça os valores críticos
Para = .05 os valores críticos de Z são ±1.96
Colete os dados e calcule a estatística de teste
Suponha que os resultados da amostra sejam:
n = 100, X = 2.84
(σ = 0.8 é presumido a partir de dados históricos da
empresa)
Então a estatística de teste é:
Teste de Hipótese para a Média
σ conhecido
Rejeita H0 Não rejeita H0
A estatística de teste está na região de rejeição?
= .05/2
-Z= -1.96 0
Rejeita H0 se
Z < -1.96 ou
Z > 1.96;
caso contrário
não rejeite H0
= .05/2
Rejeita H0
+Z= +1.96
Aqui, Z = -2.0 < -1.96, então a
estatística de teste está na região de
rejeição de Ho’
Teste de Hipótese para a Média
σ conhecido
Decida e interprete o resultado
Como z = -2.0 < -1.96, você rejeita a hipótese
nula e conclui que há evidências suficientes de
que a média do peso das barras de chocolate
não é igual a 3 onças.
Teste de Hipótese para a Média
σ conhecido
As 6 etapas do Teste de Hipóteses:
1. Defina a hipótese nula, H0 e a hipótese
alternativa H1
2. Escolha o nível de significância, α, e o
tamanho da amostra n.
3. Determine a técnica estatística adequada e o
teste a ser realizado.
4. Encontre os valores críticos e determine a
região de rejeição.
Teste de Hipótese para a Média
σ conhecido
5. Colete os dados e calcule a estatística de teste a
partir da amostra.
6. Compare a estatística de teste com o valor crítico
para determinar se a estatística de teste caiu na
região de rejeição. Faça a decisão estatística:
Rejeitar H0 se a estatística de teste cair na região de
rejeição. Escreva a decisão no contexto do
problema em questão.
Teste de Hipótese para a Média
σ conhecido A abordagem do p-valor
O valor-p é a probabilidade de ser obtida uma estatística de teste igual ou mais extrema do que o resultado da amostra, considerando que a hipótese nula H0 seja verdadeira
Também conhecido como nível observado de significância
Menor valor de a partir do qual H0 pode ser rejeitada
Teste de Hipótese para a Média
σ conhecido A abordagem do p-valor
Converta a estatística da amostra (ex. X)
para a estatística de teste (ex. Estatística Z)
Obtenha o p-valor em uma tabela ou usando
o Excel
Compare o p-valor com
Se p-valor < , rejeita H0
Se p-valor , não rejeita H0
Teste de Hipótese para a Média
σ conhecido A abordagem do p-valor
Exemplo: Quão provável é encontrar uma amostra com média igual a 2,84 (ou algo mais distante da média, em qualquer direção) se a verdadeira média é = 3.0?
.02282.0)P(Z
.02282.0)P(Z
X = 2.84 é traduzida para
uma estatística Z = -2.0
p-valor
=.0228 + .0228
= .0456
.0228
/2 = .025
-1.96 0
-2.0
Z 1.96
2.0
.0228
/2 = .025
Teste de Hipótese para a Média
σ conhecido A abordagem do p-valor
Compare o p-valor com
Se p-valor < , rejeita H0
Se p-valor , não rejeita H0
Aqui: p-valor = .0456 = .05
Como .0456 < .05, você
rejeita a hipótese nula
.0228
/2 = .025
-1.96 0
-2.0
Z 1.96
2.0
.0228
/2 = .025
Teste de Hipótese para a Média - σ conhecido
Relação com Intervalo de Confiança
100
0.8 (1.96) 2.84 a
100
0.8 (1.96) - 2.84
Para X = 2.84, σ = 0.8 e n = 100, o intervalo
para um nível de confiança de 95% é:
2.6832 ≤ μ ≤ 2.9968
Como o intervalo não contém o valor da média
especificado na hipótese (3.0), você rejeita a
hipótese nula a um nível de significância =
.05
Mesma conclusão que o teste de hipóteses!!!!
Teste de Hipótese para a Média: σ conhecido
Testes Unicaudais
Em muitos casos, a hipótese alternativa se
concentra em uma determinada direção
H0: μ ≥ 3
H1: μ < 3
H0: μ ≤ 3
H1: μ > 3
Este é um teste de cauda à esquerda (ou
inferior) já que a hipótese alternativa foca em
valores menores do que a média 3
Este é um teste de cauda à direita (ou
superior) já que a hipótese alternativa foca em
valores maiores do que a média 3.
Teste de Hipótese para a Média: σ conhecido Teste de cauda à esquerda
Há somente um valor crítico, já que a área de
rejeição concentra-se em uma cauda apenas.
Rejeita
H0
Não Rejeita
H0
α
-Z
μ
Z
X
Valor crítico
Teste de Hipótese para a Média: σ conhecido
Teste de cauda à direita
Há somente um valor crítico, já que a área de
rejeição concentra-se em uma cauda apenas.
Rejeit
a H0
Não Rejeita
H0
α
Z
μ
Valor crítico
Z
X
Teste de Hipótese para a Média: σ conhecido Exemplo de teste com cauda à direita
Um gerente de uma companhia telefônica acha que a
conta mensal de telefone celular dos clientes aumentou,
e agora tem um valor médio maior do que $52 por mês.
A companhia deseja testar essa afirmação. Dados
históricos mostram que o desvio padrão é igual a $10.
H0: μ ≤ 52 a média é menor ou igual a $52 por mês
H1: μ > 52 a média é maior do que $52 por mês
Forma do teste de hipótese:
Teste de Hipótese para a Média: σ conhecido Exemplo de teste com cauda à direita
Suponha que = .10 seja escolhido para o teste
Encontre a região de rejeição:
Rejeita
H0
Não rejeita H0
= .10
Z 0
Rejeita H0
1- = .90
Teste de Hipótese para a Média: σ conhecido Exemplo de teste com cauda à direita
Qual é o Z dado α = 0.10?
Z .07 .09
1.1 .8790 .8810 .8830
1.2 .8980 .9015
1.3 .9147 .9162 .9177 z 0 1.28
.08 a = .10
Valor Crítico
= 1.28
.90
.8997
.10
.90
Teste de Hipótese para a Média: σ conhecido Exemplo de teste com cauda à direita
Obtenha a amostra e calcule a estatística de teste.
Suponha que uma amostra com os seguintes
resultados: n = 64, X = 53.1 (=10 assume-se
conhecido a partir de dados históricos)
Então a estatística de teste é:
0,88
64
10
5253,1
n
σ
μXZ
Teste de Hipótese para a Média: σ conhecido Exemplo de teste com cauda à direita
Conclua e interprete o resultado:
= .10
1.28 0
Rejeita H0
1- = .90
Z = .88
Não é possível rejeitar H0 já que Z = 0.88 ≤ 1.28
i.e.: não há evidências suficientes de que a conta média de celular é maior do que $52
Teste de Hipótese para a Média: σ conhecido Exemplo de teste com cauda à direita
Calcule o p-valor e compare com
Rejeita
H0
= .10
Não Rejeitar
H0 1.28
0
Rejeita H0
Z = .88 .1894
.810610.88)P(Z
6410/
52.053.1ZP
53.1)XP(
p-valor = .1894
Não rejeitar H0 já que o p-valor = .1894 > = .10
Teste de Hipóteses para a Média:
σ desconhecido
Se o desvio padrão da população não é conhecido
usa-se o desvio padrão amostral S.
Devido a essa mudança, deve-se usar a
distribuição t ao invés da distribuição Z para testar
a hipótese nula sobre a média.
A distribuição t também é utilizada quando a
população não é normal e a amostra não é grande o
suficiente (> 30) para que, pelo Teorema do Limite
Central, se possa assumir distribuição amostral
normal.
Todas as demais etapas, conceitos e conclusões
são os mesmos.
Teste de Hipóteses para a Média
σ desconhecido
Lembre que a estatística t com n-1graus de
liberdade é:
n
S
μXt 1-n
Teste de Hipóteses para a Média
σ desconhecido - Exemplo
Afirma-se que o valor médio das diárias de hotel em Nova York
é $168 por noite. Uma amostra aleatória de 25 hotéis resultou
em X = $172.50 e S = 15.40. Teste a afirmação a um nível de
significância = 0.05.
(Análises através de gráfico da probabilidade normal indicam que a
distribuição da população pode ser aproximada pela distribuição
normal)
H0: μ = 168
H1: μ 168
Teste de Hipóteses para a Média
σ desconhecido - Exemplo
H0: μ = 168
H1: μ ≠ 168
α = 0.05
n = 25
é desconhecido, então usamos a estatística t
Valor Crítico:
t24 = ± 2.0639
Determine as regiões de rejeição
Rejeita
H0
Rejeita
H0
α/2=.025
-t n-1,α/2 Não rejeita H0
0
α/2=.025
-2.0639 2.0639
t n-1,α/2
Teste de Hipóteses para a Média
σ desconhecido - Exemplo
a/2=.025
-t n-1,α/2 0
a/2=.025
-2.0639 2.0639
t n-1,α/2
1.46
25
15.40
168172.50
n
S
μXt 1n
Não é possível rejeitar H0: não há evidências
suficientes de que o custo médio verdadeiro é
diferente de $168
1.46
Teste de Hipóteses para a Média
Relação com Intervalos de Confiança
Para X = 172.5, S = 15.40 e n = 25, o intervalo
para um nível de confiança de 95% é:
166.14 ≤ μ ≤ 178.86
Como o intervalo contém a média especificada na
hipótese (168), não se pode rejeitar a hipótese nula
a um nível de significância = .05
25
15.4 (2.0639) 172.5 a
25
15.4 (2.0639) - 172.5
Teste de Hipóteses para a Média:
σ desconhecido
Lembre que assume-se que a estatística da amostra vem de uma amostra aleatória extraída de uma população com distribuição normal
Se a amostra for pequena (< 30) deve-se testar a hipótese de normalidade da população.
Se a amostra é grande, o Teorema do Limite Central é aplicável e a distribuição da média amostral é normal.
Teste de Hipóteses
Proporções
Variáveis categóricas
Dois possíveis resultados
“Sucesso” (observa-se certa característica)
“Fracasso” (a característica não é observada)
π indica a fração ou proporção da população em
que “sucesso” é observado. É o parâmetro da
população.
Teste de Hipóteses
Proporções
A proporção de “sucesso” na amostra é indicada
por p
Quando nπ e n(1-π) são ambos maiores do que
5, a distribuição de p pode ser aproximada pela
distribuição normal com as seguintes média e
desvio padrão:
amostra da tamanho
amostra na sucessos de número
n
Xp
pμn
)(1σ
p
Teste de Hipóteses
Proporções
A distribuição amostral de p é aproximadamente
normal, então a estatística do teste é a Z com
valor:
n
pZ
)1(
Teste de Hipóteses
Proporções - Exemplo
Uma empresa de marketing afirma que o índice de resposta de sua mala direta é de 8%. Para testar essa afirmativa, uma amostra aleatória de 500 correspondências foi pesquisada e encontrou-se 30 respostas. Teste a afirmação com um nível de significância = .05.
Primeiro, verifique:
n π = (500)(.08) = 40
n(1-π) = (500)(.92) = 460
Teste de Hipóteses
Proporções - Exemplo
H0: π = .08 H1: π ≠ .08
α = .05
n = 500, p = .06
Valores Críticos: ± 1.96
z 0
Rejeita Rejeita
.025 .025
1.96 -1.96
Determine a região de rejeição
Teste de Hipóteses
Proporções - Exemplo
Não rejeitar H0 a
= .05
Estatística de Teste:
Decisão:
Conclusão:
Não há evidência
suficiente para rejeitar
a afirmação da
empresa sobre o
índice de resposta ser
de 8%.
1.648
500
.08).08(1
.08.06
n
)(1Z
p
z 0
.025 .025
1.96 -1.96
-1.648
Armadilhas potencias do teste de hipóteses e
questões éticas
Adote métodos aleatórios na amostragem para reduzir potenciais vieses.
Não use respondentes humanos sem consentimento informado
Escolha o nível de significância, α, antes da coleta de dados
Não “espione os dados” para escolher entre teste unicaudal ou bicaudal, ou para determinar o nível de significância
Não pratique “descarte de dados” para esconder observações que não suportem as hipóteses formuladas
Divulgue todos os resultados relevantes
Top Related