Prof.: Patricia Maria Bortolon, D. Sc.pmbortolon.wdfiles.com/local--files/home/Aula 7_Teste...e...

Post on 10-Jul-2020

4 views 0 download

Transcript of Prof.: Patricia Maria Bortolon, D. Sc.pmbortolon.wdfiles.com/local--files/home/Aula 7_Teste...e...

Contabilometria

Prof.: Patricia Maria Bortolon, D. Sc.

Teste para Duas Amostras

Fonte:

LEVINE, D. M.; STEPHAN, D. F.; KREHBIEL, T. C.;

BERENSON, M. L.; Estatística – Teoria e Aplicações, 5a. Edição,

Editora LTC, São Paulo, 2008

Objetivos

Neste capítulo você aprenderá a usar o teste de

hipóteses para comparar as diferenças entre:

As médias de duas populações independentes

As médias de duas populações relacionadas

Duas proporções

Testes para duas amostras

Visão Geral

Testes de duas

amostras

Populações

Independentes

Médias

Populações

Relacionadas

Médias

Grupo 1 x

Grupo 2

Mesmo grupo antes e depois do tratamento

Exemplos

Populações

Independentes

Proporções

Proporção 1 x

Proporção 2

Testes para duas amostras

Populações

Independentes

Médias

σ1 e σ2 conhecidas

σ1 e σ2 desconhecidas

Meta: Teste de hipótese ou

construa um intervalo de

confiança para a diferença entre

as médias das duas populações,

μ1 – μ2

A estimativa pontual para a

diferença entre as amostras:

X1 – X2

Teste para duas amostras

Populações Independentes

Populações

Independentes

Médias

σ1 e σ2 conhecidas

σ1 e σ2 desconhecidas

Diferentes fontes de dados

Independentes: a amostra selecionada de uma população não tem nenhum efeito na amostra selecionada da outra população

Use a diferença entre as médias das duas amostras

Use o teste Z test, teste t com variância agrupada, ou teste t com variâncias separadas

Teste para duas amostras

Populações Independentes

σ1 e σ2 conhecidas

σ1 e σ2 desconhecidas

Use a estatística de

teste Z

Use S como estimativa de σ

desconhecido, use o teste

estatístico t

Populações

Independentes

Médias

Teste para duas amostras

Populações Independentes

Populações

Independentes

Médias

σ1 e σ2 conhecidas

σ1 e σ2 desconhecidas

Premissas:

Amostras extraídas de forma

independente e aleatória

populações com distribuição

normal

Teste para duas amostras

Populações Independentes

Quando σ1 e σ2 são conhecidas e

ambas as populações são normais, o

teste estatístico é um valor Z e o

erro padrão de X1 – X2 é:

2

2

2

1

2

1

XX n

σ

n

σσ

21

Populações

Independentes

Médias

σ1 e σ2 conhecidas

σ1 e σ2 desconhecidas

2

2

2

1

2

1

2121

n

σ

n

σ

μμXXZ

A estatística de teste é:

Teste para duas amostras

Populações Independentes

Populações

Independentes

Médias

σ1 e σ2 conhecidas

σ1 e σ2 desconhecidas

Teste para duas amostras

Populações Independentes

Teste cauda à

esquerda:

H0: μ1 μ2

H1: μ1 < μ2

i.e.,

H0: μ1 – μ2 0

H1: μ1 – μ2 < 0

Teste de cauda à

direita:

H0: μ1 ≤ μ2

H1: μ1 > μ2

i.e.,

H0: μ1 – μ2 ≤ 0

H1: μ1 – μ2 > 0

Teste bi-caudal:

H0: μ1 = μ2

H1: μ1 ≠ μ2

i.e.,

H0: μ1 – μ2 = 0

H1: μ1 – μ2 ≠ 0

Duas Populações Independentes, Comparações de

Médias

Teste para duas amostras

Populações Independentes

Duas Populações Independentes, Comparações de Médias

Teste cauda inferior:

H0: μ1 – μ2 0

H1: μ1 – μ2 < 0

Teste cauda superior:

H0: μ1 – μ2 ≤ 0

H1: μ1 – μ2 > 0

Teste bi-caudal:

H0: μ1 – μ2 = 0

H1: μ1 – μ2 ≠ 0

a a/2 a/2 a

-za -za/2 za za/2

Rejeits H0 if Z < -Za Rejeita H0 if Z > Za Rejeita H0 if Z < -Za/2

or Z > Za/2

Teste para duas amostras

Populações Independentes

Premissas: Amostras são independentes

e extraídas de forma aleatória

Populações com distribuição

normal

As variâncias populacionais

são desconhecidas mas

assume-se que são iguais

Populações

Independentes

Médias

σ1 e σ2 conhecidas

σ1 e σ2 desconhecidas

Teste para duas amostras

Populações Independentes

Estimativas:

Como as variâncias das

populações são consideradas

iguais, use o desvio padrão

para amostras agrupadas para

estimar σ

A estatística de teste é o valor

t com (n1 + n2 – 2) graus de

liberdade

Populações

Independentes

Médias

σ1 e σ2 conhecidas

σ1 e σ2 desconhecidas

Teste para duas amostras

Populações Independentes

O desvio padrão para

amostras agrupadas é:

1)n()1(n

S1nS1nS

21

2

22

2

11p

Populações

Independentes

Médias

σ1 e σ2 conhecidas

σ1 e σ2 desconhecidas

Teste para duas amostras

Populações Independentes

Onde t tem (n1 + n2 – 2) g.l., e

21

2

p

2121

n

1

n

1S

μμXXt

A estatística de teste é:

1)n()1(n

S1nS1nS

21

2

22

2

112

p

Populações

Independentes

Médias

σ1 e σ2 conhecidas

σ1 e σ2 desconhecidas

Teste para duas amostras

Populações Independentes

Você é um analista financeiro de uma corretora. Há diferença entre as taxas de dividendos das ações listadas na NYSE & NASDAQ? Você coleta os seguintes dados:

NYSE NASDAQ Quantidade 21 25

Média da amostra 3.27 2.53

Desvio padrão da amostra 1.30 1.16

Assumindo que ambas as populações tem distribuição

aproximadamente normal com variâncias iguais, há diferença

entre as taxas de dividendos (a = 0.05)?

Teste para duas amostras

Populações Independentes

1.5021

1)25(1)-(21

1.161251.30121

1)n()1(n

S1nS1nS

22

21

2

22

2

112

p

2.040

25

1

21

15021.1

02.533.27

n

1

n

1S

μμXXt

21

2

p

2121

A estatística de teste é:

Teste para duas amostras

Populações Independentes

H0: μ1 - μ2 = 0 i.e. (μ1 = μ2)

H1: μ1 - μ2 ≠ 0 i.e. (μ1 ≠ μ2)

a = 0.05

gl = 21 + 25 - 2 = 44

Valores críticos: t = ±

2.0154

Estatística de teste: 2.040

t 0 2.0154 -2.0154

.025

Rejeita H0 Rejeita H0

.025

Decisão: Rejeita H0 a α = 0.05

2.040

Conclusão: Há evidências de

que as médias são diferentes.

Populações Independentes

Variâncias Diferentes

Se você não pode assumir que as variâncias

populacionais são iguais, o teste t para variância

agrupada não é apropriado

Ao invés dele, use o teste t para variâncias

separadas, que considera as variâncias das duas

amostras no cálculo da estatística de teste

Os cálculos são complicados e melhor executados no

excel

Teste para duas amostras

Populações Independentes

2

2

2

1

2

121

n

σ

n

σXX Z

O intervalo de confiança para

μ1 – μ2 é: Populações

Independentes

Médias

σ1 e σ2 conhecidas

σ1 e σ2 desconhecidas

Teste para duas amostras

Populações Independentes

21

2

p2-nn21

n

1

n

1SXX

21t

O intervalo de confiança para

μ1 – μ2 é:

Onde

1)n()1(n

S1nS1nS

21

2

22

2

112

p

Populações

Independentes

Médias

σ1 e σ2 conhecidas

σ1 e σ2 desconhecidas

Teste para duas amostras

Populações relacionadas

D = X1 - X2

Comparando médias de duas populações relacionadas

itens ou indivíduos são combinados, emparelhados

medições repetidas (antes/depois)

a variável de interesse é a diferença entre os valores:

Reduz a variabilidade decorrente dos próprios itens

ou indivíduos

Premissa:

Ambas as populações são normalmente distribuídas

Teste para duas amostras

Populações relacionadas

A i-ésima diferença é Di , onde

n

D

D

n

1i

i

Di = X1i - X2i

A estimativa pontual para a média da

diferença é D :

Supondo que o desvio padrão populacional

das diferenças, σD, seja conhecido

Teste para duas amostras

Populações relacionadas

A estatística de teste para a diferença de

médias é o valor Z :

n

σ

μDZ

D

D

Onde:

μD = diferença de média hipotética

σD = desvio padrão populacional das diferenças

n = tamanho da amostra (numero de pares de observações)

Teste para duas amostras

Populações relacionadas

Se σD é desconhecida, você pode estimar o

desvio padrão populacional a partir do desvio

padrão amostral:

1n

)D(D

S

n

1i

2

i

D

Teste para duas amostras

Populações relacionadas

1n

)D(D

S

n

1i

2

i

D

n

S

μDt

D

D

A estatística de teste para D é agora uma estatística t:

Onde t tem n - 1 g.l.

e SD é:

Teste para duas amostras

Populações relacionadas

Teste cauda inferior:

H0: μD 0

H1: μD < 0

Teste cauda superior:

H0: μD ≤ 0

H1: μD > 0

Teste bi-caudal:

H0: μD = 0

H1: μD ≠ 0

a a/2 a/2 a

-ta -ta/2 ta ta/2

Rejeita H0 if t < -ta Rejeita H0 if t > ta Rejeita H0 if t < -ta/2

or t > ta/2

Teste para duas amostras

Populações relacionadas - Exemplo

Você manda seus vendedores para um treinamento de

“serviço ao cliente”. Será que o treinamento teve

algum efeito no número de reclamações dos clientes?

Você coleta os seguintes dados:

Vendedor No. de reclamações Diferença, Di

(2-1) Antes (1) Depois (2)

C.B. 6 4 -2

T.F. 20 6 -14

M.H. 3 2 -1

R.K. 0 0 0

M.O 4 0 -4

Teste para duas amostras

Populações relacionadas - Exemplo

2.4n

D

D

n

1i

i

5.67

1n

)D(DS

2

i

D

Vendedor No. de reclamações Diferença, Di

(2-1) Antes (1) Depois (2)

C.B. 6 4 -2

T.F. 20 6 -14

M.H. 3 2 -1

R.K. 0 0 0

M.O 4 0 -4

Teste para duas amostras

Populações relacionadas - Exemplo

O treinamento fez diferença no número de

reclamações (a um nível de significância α = 0.01)?

H0: μD = 0

H1: μD 0 Valor crítico = ± 4.604

g.l. = n - 1 = 4

Estatística de Teste:

1.6655.67/

04.2

n/S

μt

D

D

D

Teste para duas amostras

Populações relacionadas - Exemplo

Rejeita

- 4.604 4.604

Rejeita

a/2

- 1.66

Decisão: Não rejeitar H0

(a estatística t não está na região de rejeição)

Conclusão: Não há evidências de uma

mudança significativa no número de

reclamações.

a/2

Teste para duas amostras

Populações relacionadas

O intervalo de confiança para μD (σ conhecido) é:

n

σDZD

Onde

n = tamanho da amostra (número de pares na amostra)

Teste para duas amostras

Populações relacionadas

O intervalo de confiança para μD (σ desconhecido)

é:

1n

)D(D

S

n

1i

2

i

D

n

StD D

1n

onde

Proporções de duas populações

Objetivo: Testar hipóteses ou construir um intervalo

de confiança para a diferença entre porporções em

duas populações independentes, π1 – π2

Premissas:

n1π1 5 , n1(1-π1) 5

n2π2 5 , n2(1-π2) 5

A estimativa pontual para a diferença é p1 - p2

Com base na hipótese nula, você pressupõe que as

proporções das duas populações são iguais, π1 = π2 e

agrupa as proporções das duas amostras.

21

21

nn

XXp

A estimativa geral para a

proporção comum da

população é:

onde X1 e X2 são os números de

sucessos nas amostras 1 e 2

Proporções de duas populações

21

2121

11)1(

nnpp

ppZ

A estatística de teste para p1 – p2 é uma

estatística Z:

2

22

1

11

21

21

n

X ,

n

X ,

nn

XXp

PPonde

Proporções de duas populações

Hipóteses para as Proporções Populacionais

Teste cauda inferior:

H0: π1 π2

H1: π1 < π2

i.e.,

H0: π1 – π2 0

H1: π1 – π2 < 0

Teste cauda superior:

H0: π1 ≤ π2

H1: π1 > π2

i.e.,

H0: π1 – π2 ≤ 0

H1: π1 – π2 > 0

Teste bi-caudal:

H0: π1 = π2

H1: π1 ≠ π2

i.e.,

H0: π1 – π2 = 0

H1: π1 – π2 ≠ 0

Proporções de duas populações

Teste cauda inferior:

H0: π1 – π2 0

H1: π1 – π2 < 0

Teste cauda superior:

H0: π1 – π2 ≤ 0

H1: π1 – π2 > 0

Teste bi-caudal:

H0: π1 – π2 = 0

H1: π1 – π2 ≠ 0

a a/2 a/2 a

-za -za/2 za za/2

Rejeita H0 if Z < -Za Rejeita H0 if Z > Za Rejeita H0 if Z < -Za/2

or Z > Za/2

Proporções de duas populações

Hipóteses para as Proporções Populacionais

Duas Populações Independentes

Proporções: Exemplo

Há diferença significativa entre as proporções de

homens e mulheres que votarão Sim em relação a

Proposta A?

Em uma amostra aleatória de 72 homens, 36

indicaram que votariam Sim e, em uma amostra de 50

mulheres, 31 indicaram que votariam Sim

Teste a um nível de significância de .05

H0: π1 – π2 = 0 (as duas proporções são iguais)

H1: π1 – π2 ≠ 0 (há uma diferença significativa entre as proporções)

As proporções nas amostras são:

Homens: p1 = 36/72 = .50

Mulheres: p2 = 31/50 = .62

A estimativa para a proporção geral das duas amostras é:

.549122

67

5072

3136

nn

XXp

21

21

Duas Populações Independentes

Proporções: Exemplo

A estatística de teste para π1 – π2 é:

1.31

50

1

72

1.549)(1.549

0.62.50

n

1

n

1)p(1p

z

21

2121

pp

Valores críticos = ±1.96 para a = .05

.025

-1.96 1.96

.025

-1.31

Decisão: Não rejeitar H0

Conclusão: Não há evidências de

diferenças significativas entre as

proporções que votam sim entre homens e

mulheres.

Rejeita H0 Rejeita H0

Duas Populações Independentes

Proporções: Exemplo

2

22

1

1121

n

)(1

n

)(1 ppppZpp

O intervalo de confiança para π1 – π2 é:

Duas Populações Independentes

Proporções: Exemplo

APÊNDICE

Testando Variâncias Populacionais

Objetivo: Determinar se duas populações

independentes tem a mesma variabilidade.

H0: σ12 = σ2

2

H1: σ12 ≠ σ2

2

H0: σ12 σ2

2

H1: σ12 < σ2

2

H0: σ12 ≤ σ2

2

H1: σ12 > σ2

2

Teste bi-caudal Teste de cauda

inferior

Teste de cauda

superior

2

2

2

1

S

SF

A estatística de teste F é:

= Variância da amostra 1

n1 - 1 = graus de liberdade do numerador

n2 - 1 = graus de liberdade do denominador

= Variância da amostra 2

2

1S

2

2S

Testando Variâncias Populacionais

O valor crítico de F pode ser encontrado nas tabelas F

Há dois graus de liberdade: numerador e denominador.

Na tabela F, Graus de liberdade do numerador determinam a coluna

Graus de liberdade do denominador determinam a linha

Testando Variâncias Populacionais

0

a

FL Rejeita H0

Não

rejeita H0

H0: σ12 σ2

2

H1: σ12 < σ2

2

Rejeita H0 if F < FL

0

a

FU Rejeita H0 Não

rejeita H0

H0: σ12 ≤ σ2

2

H1: σ12 > σ2

2

Rejeita H0 if F > FU

Teste de cauda inferior: Teste de cauda superior

Testando Variâncias Populacionais

L2

2

2

1

U2

2

2

1

FS

SF

FS

SF

região de rejeição para um teste bi-caudal é:

F 0

a/2

Rejeita H0 Não

rejeita H0 FU

H0: σ12 = σ2

2

H1: σ12 ≠ σ2

2

FL

a/2

Teste bi-caudal:

Testando Variâncias Populacionais

Para encontrar os valores críticos de F:

1. Encontre FU na tabela F para n1 – 1

numerador e n2 – 1 denominador graus de

liberdade.

*U

LF

1F 2. Encontre FL usando a fórmula:

Onde FU* vem da tabela F com n2 – 1 numerador e

n1 – 1 denominador graus de liberdade (i.e., inverta

os g.l. de FU)

Testando Variâncias Populacionais

Você é um analista financeiro em uma corretora. Você quer comparar as taxas de dividendos das ações listadas na NYSE & NASDAQ. Você coleta os seguintes dados:

NYSE NASDAQ Numéro 21 25

Média 3.27 2.53

Desv. Padrão 1.30 1.16

Há diferença entre as variâncias de NYSE & NASDAQ a um nível de significância a = 0.05?

Testando Variâncias Populacionais

Estabeleça o teste de hipótese:

H0: σ21 – σ2

2 = 0 (não há diferença entre as variâncias)

H1: σ2

1 – σ22 ≠ 0 (há diferença entre as variâncias)

Numerador:

n1 – 1 = 21 – 1 = 20 g.l.

Denominador:

n2 – 1 = 25 – 1 = 24 g.l.

FU = F.025, 20, 24 = 2.33

Numerador:

n2 – 1 = 25 – 1 = 24 g.l.

Denominador:

n1 – 1 = 21 – 1 = 20 g.l.

FL = 1/F.025, 24, 20 = 0.41

FU: FL:

Testando Variâncias Populacionais

A estatística de teste

é:

256.116.1

30.12

2

2

2

2

1 S

SF

0

a/2 = .025

FU=2.33 Rejeita H0 Não

rejeita H0

FL=0.41

a/2 = .025

Rejeita H0

F

F = 1.256 não está na

região de rejeição, então

não rejeitamos H0

Conclusão: Não há evidências

suficientes de uma diferença entre

as variâncias a um nível de

significância a = .05

Testando Variâncias Populacionais

Resumo do Capítulo

Neste capítulo, vimos:

Comparações entre duas amostras independentes

Teste Z para diferenças entre duas médias

Teste t com variâncias agrupadas para testes de diferenças de médias

Intervalos de confiança para diferenças entre médias

Comparações entre amostras relacionadas (amostras emparelhadas)

Testes Z e t em amostras emparelhadas para testar diferenças de médias

Intervalos de confiança para diferenças de médias de amostras emparelhadas

Teste t para variâncias separadas

Statistics for Managers Using Microsoft Excel, 5e ©

2008 Prentice-Hall, Inc.

Chap 10-55

Resumo do Capítulo

Comparações de duas proporções

populacionais

Intervalos de confiança para a diferença entre duas

proporções populacionais

Teste Z para duas proporções populacionais

Teste F para a diferença entre duas

variâncias populacionais

Uso da tabela F para encontrar os valores

críticos de F

Neste capítulo, vimos: