Prof.: Patricia Maria Bortolon, D. Sc.pmbortolon.wdfiles.com/local--files/home/Aula 7_Teste...e...
Transcript of Prof.: Patricia Maria Bortolon, D. Sc.pmbortolon.wdfiles.com/local--files/home/Aula 7_Teste...e...
Contabilometria
Prof.: Patricia Maria Bortolon, D. Sc.
Teste para Duas Amostras
Fonte:
LEVINE, D. M.; STEPHAN, D. F.; KREHBIEL, T. C.;
BERENSON, M. L.; Estatística – Teoria e Aplicações, 5a. Edição,
Editora LTC, São Paulo, 2008
Objetivos
Neste capítulo você aprenderá a usar o teste de
hipóteses para comparar as diferenças entre:
As médias de duas populações independentes
As médias de duas populações relacionadas
Duas proporções
Testes para duas amostras
Visão Geral
Testes de duas
amostras
Populações
Independentes
Médias
Populações
Relacionadas
Médias
Grupo 1 x
Grupo 2
Mesmo grupo antes e depois do tratamento
Exemplos
Populações
Independentes
Proporções
Proporção 1 x
Proporção 2
Testes para duas amostras
Populações
Independentes
Médias
σ1 e σ2 conhecidas
σ1 e σ2 desconhecidas
Meta: Teste de hipótese ou
construa um intervalo de
confiança para a diferença entre
as médias das duas populações,
μ1 – μ2
A estimativa pontual para a
diferença entre as amostras:
X1 – X2
Teste para duas amostras
Populações Independentes
Populações
Independentes
Médias
σ1 e σ2 conhecidas
σ1 e σ2 desconhecidas
Diferentes fontes de dados
Independentes: a amostra selecionada de uma população não tem nenhum efeito na amostra selecionada da outra população
Use a diferença entre as médias das duas amostras
Use o teste Z test, teste t com variância agrupada, ou teste t com variâncias separadas
Teste para duas amostras
Populações Independentes
σ1 e σ2 conhecidas
σ1 e σ2 desconhecidas
Use a estatística de
teste Z
Use S como estimativa de σ
desconhecido, use o teste
estatístico t
Populações
Independentes
Médias
Teste para duas amostras
Populações Independentes
Populações
Independentes
Médias
σ1 e σ2 conhecidas
σ1 e σ2 desconhecidas
Premissas:
Amostras extraídas de forma
independente e aleatória
populações com distribuição
normal
Teste para duas amostras
Populações Independentes
Quando σ1 e σ2 são conhecidas e
ambas as populações são normais, o
teste estatístico é um valor Z e o
erro padrão de X1 – X2 é:
2
2
2
1
2
1
XX n
σ
n
σσ
21
Populações
Independentes
Médias
σ1 e σ2 conhecidas
σ1 e σ2 desconhecidas
2
2
2
1
2
1
2121
n
σ
n
σ
μμXXZ
A estatística de teste é:
Teste para duas amostras
Populações Independentes
Populações
Independentes
Médias
σ1 e σ2 conhecidas
σ1 e σ2 desconhecidas
Teste para duas amostras
Populações Independentes
Teste cauda à
esquerda:
H0: μ1 μ2
H1: μ1 < μ2
i.e.,
H0: μ1 – μ2 0
H1: μ1 – μ2 < 0
Teste de cauda à
direita:
H0: μ1 ≤ μ2
H1: μ1 > μ2
i.e.,
H0: μ1 – μ2 ≤ 0
H1: μ1 – μ2 > 0
Teste bi-caudal:
H0: μ1 = μ2
H1: μ1 ≠ μ2
i.e.,
H0: μ1 – μ2 = 0
H1: μ1 – μ2 ≠ 0
Duas Populações Independentes, Comparações de
Médias
Teste para duas amostras
Populações Independentes
Duas Populações Independentes, Comparações de Médias
Teste cauda inferior:
H0: μ1 – μ2 0
H1: μ1 – μ2 < 0
Teste cauda superior:
H0: μ1 – μ2 ≤ 0
H1: μ1 – μ2 > 0
Teste bi-caudal:
H0: μ1 – μ2 = 0
H1: μ1 – μ2 ≠ 0
a a/2 a/2 a
-za -za/2 za za/2
Rejeits H0 if Z < -Za Rejeita H0 if Z > Za Rejeita H0 if Z < -Za/2
or Z > Za/2
Teste para duas amostras
Populações Independentes
Premissas: Amostras são independentes
e extraídas de forma aleatória
Populações com distribuição
normal
As variâncias populacionais
são desconhecidas mas
assume-se que são iguais
Populações
Independentes
Médias
σ1 e σ2 conhecidas
σ1 e σ2 desconhecidas
Teste para duas amostras
Populações Independentes
Estimativas:
Como as variâncias das
populações são consideradas
iguais, use o desvio padrão
para amostras agrupadas para
estimar σ
A estatística de teste é o valor
t com (n1 + n2 – 2) graus de
liberdade
Populações
Independentes
Médias
σ1 e σ2 conhecidas
σ1 e σ2 desconhecidas
Teste para duas amostras
Populações Independentes
O desvio padrão para
amostras agrupadas é:
1)n()1(n
S1nS1nS
21
2
22
2
11p
Populações
Independentes
Médias
σ1 e σ2 conhecidas
σ1 e σ2 desconhecidas
Teste para duas amostras
Populações Independentes
Onde t tem (n1 + n2 – 2) g.l., e
21
2
p
2121
n
1
n
1S
μμXXt
A estatística de teste é:
1)n()1(n
S1nS1nS
21
2
22
2
112
p
Populações
Independentes
Médias
σ1 e σ2 conhecidas
σ1 e σ2 desconhecidas
Teste para duas amostras
Populações Independentes
Você é um analista financeiro de uma corretora. Há diferença entre as taxas de dividendos das ações listadas na NYSE & NASDAQ? Você coleta os seguintes dados:
NYSE NASDAQ Quantidade 21 25
Média da amostra 3.27 2.53
Desvio padrão da amostra 1.30 1.16
Assumindo que ambas as populações tem distribuição
aproximadamente normal com variâncias iguais, há diferença
entre as taxas de dividendos (a = 0.05)?
Teste para duas amostras
Populações Independentes
1.5021
1)25(1)-(21
1.161251.30121
1)n()1(n
S1nS1nS
22
21
2
22
2
112
p
2.040
25
1
21
15021.1
02.533.27
n
1
n
1S
μμXXt
21
2
p
2121
A estatística de teste é:
Teste para duas amostras
Populações Independentes
H0: μ1 - μ2 = 0 i.e. (μ1 = μ2)
H1: μ1 - μ2 ≠ 0 i.e. (μ1 ≠ μ2)
a = 0.05
gl = 21 + 25 - 2 = 44
Valores críticos: t = ±
2.0154
Estatística de teste: 2.040
t 0 2.0154 -2.0154
.025
Rejeita H0 Rejeita H0
.025
Decisão: Rejeita H0 a α = 0.05
2.040
Conclusão: Há evidências de
que as médias são diferentes.
Populações Independentes
Variâncias Diferentes
Se você não pode assumir que as variâncias
populacionais são iguais, o teste t para variância
agrupada não é apropriado
Ao invés dele, use o teste t para variâncias
separadas, que considera as variâncias das duas
amostras no cálculo da estatística de teste
Os cálculos são complicados e melhor executados no
excel
Teste para duas amostras
Populações Independentes
2
2
2
1
2
121
n
σ
n
σXX Z
O intervalo de confiança para
μ1 – μ2 é: Populações
Independentes
Médias
σ1 e σ2 conhecidas
σ1 e σ2 desconhecidas
Teste para duas amostras
Populações Independentes
21
2
p2-nn21
n
1
n
1SXX
21t
O intervalo de confiança para
μ1 – μ2 é:
Onde
1)n()1(n
S1nS1nS
21
2
22
2
112
p
Populações
Independentes
Médias
σ1 e σ2 conhecidas
σ1 e σ2 desconhecidas
Teste para duas amostras
Populações relacionadas
D = X1 - X2
Comparando médias de duas populações relacionadas
itens ou indivíduos são combinados, emparelhados
medições repetidas (antes/depois)
a variável de interesse é a diferença entre os valores:
Reduz a variabilidade decorrente dos próprios itens
ou indivíduos
Premissa:
Ambas as populações são normalmente distribuídas
Teste para duas amostras
Populações relacionadas
A i-ésima diferença é Di , onde
n
D
D
n
1i
i
Di = X1i - X2i
A estimativa pontual para a média da
diferença é D :
Supondo que o desvio padrão populacional
das diferenças, σD, seja conhecido
Teste para duas amostras
Populações relacionadas
A estatística de teste para a diferença de
médias é o valor Z :
n
σ
μDZ
D
D
Onde:
μD = diferença de média hipotética
σD = desvio padrão populacional das diferenças
n = tamanho da amostra (numero de pares de observações)
Teste para duas amostras
Populações relacionadas
Se σD é desconhecida, você pode estimar o
desvio padrão populacional a partir do desvio
padrão amostral:
1n
)D(D
S
n
1i
2
i
D
Teste para duas amostras
Populações relacionadas
1n
)D(D
S
n
1i
2
i
D
n
S
μDt
D
D
A estatística de teste para D é agora uma estatística t:
Onde t tem n - 1 g.l.
e SD é:
Teste para duas amostras
Populações relacionadas
Teste cauda inferior:
H0: μD 0
H1: μD < 0
Teste cauda superior:
H0: μD ≤ 0
H1: μD > 0
Teste bi-caudal:
H0: μD = 0
H1: μD ≠ 0
a a/2 a/2 a
-ta -ta/2 ta ta/2
Rejeita H0 if t < -ta Rejeita H0 if t > ta Rejeita H0 if t < -ta/2
or t > ta/2
Teste para duas amostras
Populações relacionadas - Exemplo
Você manda seus vendedores para um treinamento de
“serviço ao cliente”. Será que o treinamento teve
algum efeito no número de reclamações dos clientes?
Você coleta os seguintes dados:
Vendedor No. de reclamações Diferença, Di
(2-1) Antes (1) Depois (2)
C.B. 6 4 -2
T.F. 20 6 -14
M.H. 3 2 -1
R.K. 0 0 0
M.O 4 0 -4
Teste para duas amostras
Populações relacionadas - Exemplo
2.4n
D
D
n
1i
i
5.67
1n
)D(DS
2
i
D
Vendedor No. de reclamações Diferença, Di
(2-1) Antes (1) Depois (2)
C.B. 6 4 -2
T.F. 20 6 -14
M.H. 3 2 -1
R.K. 0 0 0
M.O 4 0 -4
Teste para duas amostras
Populações relacionadas - Exemplo
O treinamento fez diferença no número de
reclamações (a um nível de significância α = 0.01)?
H0: μD = 0
H1: μD 0 Valor crítico = ± 4.604
g.l. = n - 1 = 4
Estatística de Teste:
1.6655.67/
04.2
n/S
μt
D
D
D
Teste para duas amostras
Populações relacionadas - Exemplo
Rejeita
- 4.604 4.604
Rejeita
a/2
- 1.66
Decisão: Não rejeitar H0
(a estatística t não está na região de rejeição)
Conclusão: Não há evidências de uma
mudança significativa no número de
reclamações.
a/2
Teste para duas amostras
Populações relacionadas
O intervalo de confiança para μD (σ conhecido) é:
n
σDZD
Onde
n = tamanho da amostra (número de pares na amostra)
Teste para duas amostras
Populações relacionadas
O intervalo de confiança para μD (σ desconhecido)
é:
1n
)D(D
S
n
1i
2
i
D
n
StD D
1n
onde
Proporções de duas populações
Objetivo: Testar hipóteses ou construir um intervalo
de confiança para a diferença entre porporções em
duas populações independentes, π1 – π2
Premissas:
n1π1 5 , n1(1-π1) 5
n2π2 5 , n2(1-π2) 5
A estimativa pontual para a diferença é p1 - p2
Com base na hipótese nula, você pressupõe que as
proporções das duas populações são iguais, π1 = π2 e
agrupa as proporções das duas amostras.
21
21
nn
XXp
A estimativa geral para a
proporção comum da
população é:
onde X1 e X2 são os números de
sucessos nas amostras 1 e 2
Proporções de duas populações
21
2121
11)1(
nnpp
ppZ
A estatística de teste para p1 – p2 é uma
estatística Z:
2
22
1
11
21
21
n
X ,
n
X ,
nn
XXp
PPonde
Proporções de duas populações
Hipóteses para as Proporções Populacionais
Teste cauda inferior:
H0: π1 π2
H1: π1 < π2
i.e.,
H0: π1 – π2 0
H1: π1 – π2 < 0
Teste cauda superior:
H0: π1 ≤ π2
H1: π1 > π2
i.e.,
H0: π1 – π2 ≤ 0
H1: π1 – π2 > 0
Teste bi-caudal:
H0: π1 = π2
H1: π1 ≠ π2
i.e.,
H0: π1 – π2 = 0
H1: π1 – π2 ≠ 0
Proporções de duas populações
Teste cauda inferior:
H0: π1 – π2 0
H1: π1 – π2 < 0
Teste cauda superior:
H0: π1 – π2 ≤ 0
H1: π1 – π2 > 0
Teste bi-caudal:
H0: π1 – π2 = 0
H1: π1 – π2 ≠ 0
a a/2 a/2 a
-za -za/2 za za/2
Rejeita H0 if Z < -Za Rejeita H0 if Z > Za Rejeita H0 if Z < -Za/2
or Z > Za/2
Proporções de duas populações
Hipóteses para as Proporções Populacionais
Duas Populações Independentes
Proporções: Exemplo
Há diferença significativa entre as proporções de
homens e mulheres que votarão Sim em relação a
Proposta A?
Em uma amostra aleatória de 72 homens, 36
indicaram que votariam Sim e, em uma amostra de 50
mulheres, 31 indicaram que votariam Sim
Teste a um nível de significância de .05
H0: π1 – π2 = 0 (as duas proporções são iguais)
H1: π1 – π2 ≠ 0 (há uma diferença significativa entre as proporções)
As proporções nas amostras são:
Homens: p1 = 36/72 = .50
Mulheres: p2 = 31/50 = .62
A estimativa para a proporção geral das duas amostras é:
.549122
67
5072
3136
nn
XXp
21
21
Duas Populações Independentes
Proporções: Exemplo
A estatística de teste para π1 – π2 é:
1.31
50
1
72
1.549)(1.549
0.62.50
n
1
n
1)p(1p
z
21
2121
pp
Valores críticos = ±1.96 para a = .05
.025
-1.96 1.96
.025
-1.31
Decisão: Não rejeitar H0
Conclusão: Não há evidências de
diferenças significativas entre as
proporções que votam sim entre homens e
mulheres.
Rejeita H0 Rejeita H0
Duas Populações Independentes
Proporções: Exemplo
2
22
1
1121
n
)(1
n
)(1 ppppZpp
O intervalo de confiança para π1 – π2 é:
Duas Populações Independentes
Proporções: Exemplo
APÊNDICE
Testando Variâncias Populacionais
Objetivo: Determinar se duas populações
independentes tem a mesma variabilidade.
H0: σ12 = σ2
2
H1: σ12 ≠ σ2
2
H0: σ12 σ2
2
H1: σ12 < σ2
2
H0: σ12 ≤ σ2
2
H1: σ12 > σ2
2
Teste bi-caudal Teste de cauda
inferior
Teste de cauda
superior
2
2
2
1
S
SF
A estatística de teste F é:
= Variância da amostra 1
n1 - 1 = graus de liberdade do numerador
n2 - 1 = graus de liberdade do denominador
= Variância da amostra 2
2
1S
2
2S
Testando Variâncias Populacionais
O valor crítico de F pode ser encontrado nas tabelas F
Há dois graus de liberdade: numerador e denominador.
Na tabela F, Graus de liberdade do numerador determinam a coluna
Graus de liberdade do denominador determinam a linha
Testando Variâncias Populacionais
0
a
FL Rejeita H0
Não
rejeita H0
H0: σ12 σ2
2
H1: σ12 < σ2
2
Rejeita H0 if F < FL
0
a
FU Rejeita H0 Não
rejeita H0
H0: σ12 ≤ σ2
2
H1: σ12 > σ2
2
Rejeita H0 if F > FU
Teste de cauda inferior: Teste de cauda superior
Testando Variâncias Populacionais
L2
2
2
1
U2
2
2
1
FS
SF
FS
SF
região de rejeição para um teste bi-caudal é:
F 0
a/2
Rejeita H0 Não
rejeita H0 FU
H0: σ12 = σ2
2
H1: σ12 ≠ σ2
2
FL
a/2
Teste bi-caudal:
Testando Variâncias Populacionais
Para encontrar os valores críticos de F:
1. Encontre FU na tabela F para n1 – 1
numerador e n2 – 1 denominador graus de
liberdade.
*U
LF
1F 2. Encontre FL usando a fórmula:
Onde FU* vem da tabela F com n2 – 1 numerador e
n1 – 1 denominador graus de liberdade (i.e., inverta
os g.l. de FU)
Testando Variâncias Populacionais
Você é um analista financeiro em uma corretora. Você quer comparar as taxas de dividendos das ações listadas na NYSE & NASDAQ. Você coleta os seguintes dados:
NYSE NASDAQ Numéro 21 25
Média 3.27 2.53
Desv. Padrão 1.30 1.16
Há diferença entre as variâncias de NYSE & NASDAQ a um nível de significância a = 0.05?
Testando Variâncias Populacionais
Estabeleça o teste de hipótese:
H0: σ21 – σ2
2 = 0 (não há diferença entre as variâncias)
H1: σ2
1 – σ22 ≠ 0 (há diferença entre as variâncias)
Numerador:
n1 – 1 = 21 – 1 = 20 g.l.
Denominador:
n2 – 1 = 25 – 1 = 24 g.l.
FU = F.025, 20, 24 = 2.33
Numerador:
n2 – 1 = 25 – 1 = 24 g.l.
Denominador:
n1 – 1 = 21 – 1 = 20 g.l.
FL = 1/F.025, 24, 20 = 0.41
FU: FL:
Testando Variâncias Populacionais
A estatística de teste
é:
256.116.1
30.12
2
2
2
2
1 S
SF
0
a/2 = .025
FU=2.33 Rejeita H0 Não
rejeita H0
FL=0.41
a/2 = .025
Rejeita H0
F
F = 1.256 não está na
região de rejeição, então
não rejeitamos H0
Conclusão: Não há evidências
suficientes de uma diferença entre
as variâncias a um nível de
significância a = .05
Testando Variâncias Populacionais
Resumo do Capítulo
Neste capítulo, vimos:
Comparações entre duas amostras independentes
Teste Z para diferenças entre duas médias
Teste t com variâncias agrupadas para testes de diferenças de médias
Intervalos de confiança para diferenças entre médias
Comparações entre amostras relacionadas (amostras emparelhadas)
Testes Z e t em amostras emparelhadas para testar diferenças de médias
Intervalos de confiança para diferenças de médias de amostras emparelhadas
Teste t para variâncias separadas
Statistics for Managers Using Microsoft Excel, 5e ©
2008 Prentice-Hall, Inc.
Chap 10-55
Resumo do Capítulo
Comparações de duas proporções
populacionais
Intervalos de confiança para a diferença entre duas
proporções populacionais
Teste Z para duas proporções populacionais
Teste F para a diferença entre duas
variâncias populacionais
Uso da tabela F para encontrar os valores
críticos de F
Neste capítulo, vimos: