Prof.: Patricia Maria Bortolon, D. Sc.pmbortolon.wdfiles.com/local--files/home/Aula 7_Teste...e...

Contabilometria

Prof.: Patricia Maria Bortolon, D. Sc.

Teste para Duas Amostras

Fonte:

LEVINE, D. M.; STEPHAN, D. F.; KREHBIEL, T. C.;

BERENSON, M. L.; Estatística – Teoria e Aplicações, 5a. Edição,

Editora LTC, São Paulo, 2008

Objetivos

Neste capítulo você aprenderá a usar o teste de

hipóteses para comparar as diferenças entre:

As médias de duas populações independentes

As médias de duas populações relacionadas

Duas proporções

Testes para duas amostras

Visão Geral

Testes de duas

amostras

Populações

Independentes

Médias

Populações

Relacionadas

Médias

Grupo 1 x

Grupo 2

Mesmo grupo antes e depois do tratamento

Exemplos

Populações

Independentes

Proporções

Proporção 1 x

Proporção 2

Testes para duas amostras

Populações

Independentes

Médias

σ1 e σ2 conhecidas

σ1 e σ2 desconhecidas

Meta: Teste de hipótese ou

construa um intervalo de

confiança para a diferença entre

as médias das duas populações,

μ1 – μ2

A estimativa pontual para a

diferença entre as amostras:

X1 – X2

Teste para duas amostras

Populações Independentes

Populações

Independentes

Médias



Diferentes fontes de dados

Independentes: a amostra selecionada de uma população não tem nenhum efeito na amostra selecionada da outra população

Use a diferença entre as médias das duas amostras

Use o teste Z test, teste t com variância agrupada, ou teste t com variâncias separadas





Use a estatística de

teste Z

Use S como estimativa de σ

desconhecido, use o teste

estatístico t

Populações

Independentes

Médias



Populações

Independentes

Médias



Premissas:

Amostras extraídas de forma

independente e aleatória

populações com distribuição

normal



Quando σ1 e σ2 são conhecidas e

ambas as populações são normais, o

teste estatístico é um valor Z e o

erro padrão de X1 – X2 é:

2

2

2

1

2

1

XX n

σ

n

σσ

21

Populações

Independentes

Médias



2

2

2

1

2

1

2121

n

σ

n

σ

μμXXZ

A estatística de teste é:



Populações

Independentes

Médias





Teste cauda à

esquerda:

H0: μ1 μ2

H1: μ1 < μ2

i.e.,

H0: μ1 – μ2 0

H1: μ1 – μ2 < 0

Teste de cauda à

direita:

H0: μ1 ≤ μ2

H1: μ1 > μ2

i.e.,

H0: μ1 – μ2 ≤ 0

H1: μ1 – μ2 > 0

Teste bi-caudal:

H0: μ1 = μ2

H1: μ1 ≠ μ2

i.e.,

H0: μ1 – μ2 = 0

H1: μ1 – μ2 ≠ 0

Duas Populações Independentes, Comparações de

Médias



Duas Populações Independentes, Comparações de Médias

Teste cauda inferior:

H0: μ1 – μ2 0

H1: μ1 – μ2 < 0

Teste cauda superior:

H0: μ1 – μ2 ≤ 0

H1: μ1 – μ2 > 0

Teste bi-caudal:

H0: μ1 – μ2 = 0

H1: μ1 – μ2 ≠ 0

a a/2 a/2 a

-za -za/2 za za/2

Rejeits H0 if Z < -Za Rejeita H0 if Z > Za Rejeita H0 if Z < -Za/2

or Z > Za/2



Premissas: Amostras são independentes

e extraídas de forma aleatória

Populações com distribuição

normal

As variâncias populacionais

são desconhecidas mas

assume-se que são iguais

Populações

Independentes

Médias





Estimativas:

Como as variâncias das

populações são consideradas

iguais, use o desvio padrão

para amostras agrupadas para

estimar σ

A estatística de teste é o valor

t com (n1 + n2 – 2) graus de

liberdade

Populações

Independentes

Médias





O desvio padrão para

amostras agrupadas é:

1)n()1(n

S1nS1nS

21

2

22

2

11p

Populações

Independentes

Médias





Onde t tem (n1 + n2 – 2) g.l., e

21

2

p

2121

n

1

n

1S

μμXXt


1)n()1(n

S1nS1nS

21

2

22

2

112

p

Populações

Independentes

Médias





Você é um analista financeiro de uma corretora. Há diferença entre as taxas de dividendos das ações listadas na NYSE & NASDAQ? Você coleta os seguintes dados:

NYSE NASDAQ Quantidade 21 25

Média da amostra 3.27 2.53

Desvio padrão da amostra 1.30 1.16

Assumindo que ambas as populações tem distribuição

aproximadamente normal com variâncias iguais, há diferença

entre as taxas de dividendos (a = 0.05)?



1.5021

1)25(1)-(21

1.161251.30121

1)n()1(n

S1nS1nS

22

21

2

22

2

112

p

2.040

25

1

21

15021.1

02.533.27

n

1

n

1S

μμXXt

21

2

p

2121




H0: μ1 - μ2 = 0 i.e. (μ1 = μ2)

H1: μ1 - μ2 ≠ 0 i.e. (μ1 ≠ μ2)

a = 0.05

gl = 21 + 25 - 2 = 44

Valores críticos: t = ±

2.0154

Estatística de teste: 2.040

t 0 2.0154 -2.0154

.025

Rejeita H0 Rejeita H0

.025

Decisão: Rejeita H0 a α = 0.05

2.040

Conclusão: Há evidências de

que as médias são diferentes.


Variâncias Diferentes

Se você não pode assumir que as variâncias

populacionais são iguais, o teste t para variância

agrupada não é apropriado

Ao invés dele, use o teste t para variâncias

separadas, que considera as variâncias das duas

amostras no cálculo da estatística de teste

Os cálculos são complicados e melhor executados no

excel



2

2

2

1

2

121

n

σ

n

σXX Z

O intervalo de confiança para

μ1 – μ2 é: Populações

Independentes

Médias





21

2

p2-nn21

n

1

n

1SXX

21t

O intervalo de confiança para

μ1 – μ2 é:

Onde

1)n()1(n

S1nS1nS

21

2

22

2

112

p

Populações

Independentes

Médias




Populações relacionadas

D = X1 - X2

Comparando médias de duas populações relacionadas

itens ou indivíduos são combinados, emparelhados

medições repetidas (antes/depois)

a variável de interesse é a diferença entre os valores:

Reduz a variabilidade decorrente dos próprios itens

ou indivíduos

Premissa:

Ambas as populações são normalmente distribuídas



A i-ésima diferença é Di , onde

n

D

D

n

1i

i

Di = X1i - X2i

A estimativa pontual para a média da

diferença é D :

Supondo que o desvio padrão populacional

das diferenças, σD, seja conhecido



A estatística de teste para a diferença de

médias é o valor Z :

n

σ

μDZ

D

D

Onde:

μD = diferença de média hipotética

σD = desvio padrão populacional das diferenças

n = tamanho da amostra (numero de pares de observações)



Se σD é desconhecida, você pode estimar o

desvio padrão populacional a partir do desvio

padrão amostral:

1n

)D(D

S

n

1i

2

i

D



1n

)D(D

S

n

1i

2

i

D

n

S

μDt

D

D

A estatística de teste para D é agora uma estatística t:

Onde t tem n - 1 g.l.

e SD é:




H0: μD 0

H1: μD < 0


H0: μD ≤ 0

H1: μD > 0

Teste bi-caudal:

H0: μD = 0

H1: μD ≠ 0

a a/2 a/2 a

-ta -ta/2 ta ta/2

Rejeita H0 if t < -ta Rejeita H0 if t > ta Rejeita H0 if t < -ta/2

or t > ta/2


Populações relacionadas - Exemplo

Você manda seus vendedores para um treinamento de

“serviço ao cliente”. Será que o treinamento teve

algum efeito no número de reclamações dos clientes?

Você coleta os seguintes dados:

Vendedor No. de reclamações Diferença, Di

(2-1) Antes (1) Depois (2)

C.B. 6 4 -2

T.F. 20 6 -14

M.H. 3 2 -1

R.K. 0 0 0

M.O 4 0 -4



2.4n

D

D

n

1i

i

5.67

1n

)D(DS

2

i

D

Vendedor No. de reclamações Diferença, Di

(2-1) Antes (1) Depois (2)

C.B. 6 4 -2

T.F. 20 6 -14

M.H. 3 2 -1

R.K. 0 0 0

M.O 4 0 -4



O treinamento fez diferença no número de

reclamações (a um nível de significância α = 0.01)?

H0: μD = 0

H1: μD 0 Valor crítico = ± 4.604

g.l. = n - 1 = 4

Estatística de Teste:

1.6655.67/

04.2

n/S

μt

D

D

D



Rejeita

- 4.604 4.604

Rejeita

a/2

- 1.66

Decisão: Não rejeitar H0

(a estatística t não está na região de rejeição)

Conclusão: Não há evidências de uma

mudança significativa no número de

reclamações.

a/2



O intervalo de confiança para μD (σ conhecido) é:

n

σDZD

Onde

n = tamanho da amostra (número de pares na amostra)



O intervalo de confiança para μD (σ desconhecido)

é:

1n

)D(D

S

n

1i

2

i

D

n

StD D

1n

onde

Proporções de duas populações

Objetivo: Testar hipóteses ou construir um intervalo

de confiança para a diferença entre porporções em

duas populações independentes, π1 – π2

Premissas:

n1π1 5 , n1(1-π1) 5

n2π2 5 , n2(1-π2) 5

A estimativa pontual para a diferença é p1 - p2

Com base na hipótese nula, você pressupõe que as

proporções das duas populações são iguais, π1 = π2 e

agrupa as proporções das duas amostras.

21

21

nn

XXp

A estimativa geral para a

proporção comum da

população é:

onde X1 e X2 são os números de

sucessos nas amostras 1 e 2


21

2121

11)1(

nnpp

ppZ

A estatística de teste para p1 – p2 é uma

estatística Z:

2

22

1

11

21

21

n

X ,

n

X ,

nn

XXp

PPonde


Hipóteses para as Proporções Populacionais


H0: π1 π2

H1: π1 < π2

i.e.,

H0: π1 – π2 0

H1: π1 – π2 < 0


H0: π1 ≤ π2

H1: π1 > π2

i.e.,

H0: π1 – π2 ≤ 0

H1: π1 – π2 > 0

Teste bi-caudal:

H0: π1 = π2

H1: π1 ≠ π2

i.e.,

H0: π1 – π2 = 0

H1: π1 – π2 ≠ 0



H0: π1 – π2 0

H1: π1 – π2 < 0


H0: π1 – π2 ≤ 0

H1: π1 – π2 > 0

Teste bi-caudal:

H0: π1 – π2 = 0

H1: π1 – π2 ≠ 0

a a/2 a/2 a

-za -za/2 za za/2

Rejeita H0 if Z < -Za Rejeita H0 if Z > Za Rejeita H0 if Z < -Za/2

or Z > Za/2


Hipóteses para as Proporções Populacionais

Duas Populações Independentes

Proporções: Exemplo

Há diferença significativa entre as proporções de

homens e mulheres que votarão Sim em relação a

Proposta A?

Em uma amostra aleatória de 72 homens, 36

indicaram que votariam Sim e, em uma amostra de 50

mulheres, 31 indicaram que votariam Sim

Teste a um nível de significância de .05

H0: π1 – π2 = 0 (as duas proporções são iguais)

H1: π1 – π2 ≠ 0 (há uma diferença significativa entre as proporções)

As proporções nas amostras são:

Homens: p1 = 36/72 = .50

Mulheres: p2 = 31/50 = .62

A estimativa para a proporção geral das duas amostras é:

.549122

67

5072

3136

nn

XXp

21

21



A estatística de teste para π1 – π2 é:

1.31

50

1

72

1.549)(1.549

0.62.50

n

1

n

1)p(1p

z

21

2121

pp

Valores críticos = ±1.96 para a = .05

.025

-1.96 1.96

.025

-1.31

Decisão: Não rejeitar H0

Conclusão: Não há evidências de

diferenças significativas entre as

proporções que votam sim entre homens e

mulheres.

Rejeita H0 Rejeita H0



2

22

1

1121

n

)(1

n

)(1 ppppZpp

O intervalo de confiança para π1 – π2 é:



APÊNDICE

Testando Variâncias Populacionais

Objetivo: Determinar se duas populações

independentes tem a mesma variabilidade.

H0: σ12 = σ2

2

H1: σ12 ≠ σ2

2

H0: σ12 σ2

2

H1: σ12 < σ2

2

H0: σ12 ≤ σ2

2

H1: σ12 > σ2

2

Teste bi-caudal Teste de cauda

inferior

Teste de cauda

superior

2

2

2

1

S

SF

A estatística de teste F é:

= Variância da amostra 1

n1 - 1 = graus de liberdade do numerador

n2 - 1 = graus de liberdade do denominador

= Variância da amostra 2

2

1S

2

2S


O valor crítico de F pode ser encontrado nas tabelas F

Há dois graus de liberdade: numerador e denominador.

Na tabela F, Graus de liberdade do numerador determinam a coluna

Graus de liberdade do denominador determinam a linha


0

a

FL Rejeita H0

Não

rejeita H0

H0: σ12 σ2

2

H1: σ12 < σ2

2

Rejeita H0 if F < FL

0

a

FU Rejeita H0 Não

rejeita H0

H0: σ12 ≤ σ2

2

H1: σ12 > σ2

2

Rejeita H0 if F > FU

Teste de cauda inferior: Teste de cauda superior


L2

2

2

1

U2

2

2

1

FS

SF

FS

SF

região de rejeição para um teste bi-caudal é:

F 0

a/2

Rejeita H0 Não

rejeita H0 FU

H0: σ12 = σ2

2

H1: σ12 ≠ σ2

2

FL

a/2

Teste bi-caudal:


Para encontrar os valores críticos de F:

1. Encontre FU na tabela F para n1 – 1

numerador e n2 – 1 denominador graus de

liberdade.

*U

LF

1F 2. Encontre FL usando a fórmula:

Onde FU* vem da tabela F com n2 – 1 numerador e

n1 – 1 denominador graus de liberdade (i.e., inverta

os g.l. de FU)


Você é um analista financeiro em uma corretora. Você quer comparar as taxas de dividendos das ações listadas na NYSE & NASDAQ. Você coleta os seguintes dados:

NYSE NASDAQ Numéro 21 25

Média 3.27 2.53

Desv. Padrão 1.30 1.16

Há diferença entre as variâncias de NYSE & NASDAQ a um nível de significância a = 0.05?


Estabeleça o teste de hipótese:

H0: σ21 – σ2

2 = 0 (não há diferença entre as variâncias)

H1: σ2

1 – σ22 ≠ 0 (há diferença entre as variâncias)

Numerador:

n1 – 1 = 21 – 1 = 20 g.l.

Denominador:

n2 – 1 = 25 – 1 = 24 g.l.

FU = F.025, 20, 24 = 2.33

Numerador:

n2 – 1 = 25 – 1 = 24 g.l.

Denominador:

n1 – 1 = 21 – 1 = 20 g.l.

FL = 1/F.025, 24, 20 = 0.41

FU: FL:


A estatística de teste

é:

256.116.1

30.12

2

2

2

2

1 S

SF

0

a/2 = .025

FU=2.33 Rejeita H0 Não

rejeita H0

FL=0.41

a/2 = .025

Rejeita H0

F

F = 1.256 não está na

região de rejeição, então

não rejeitamos H0

Conclusão: Não há evidências

suficientes de uma diferença entre

as variâncias a um nível de

significância a = .05


Resumo do Capítulo

Neste capítulo, vimos:

Comparações entre duas amostras independentes

Teste Z para diferenças entre duas médias

Teste t com variâncias agrupadas para testes de diferenças de médias

Intervalos de confiança para diferenças entre médias

Comparações entre amostras relacionadas (amostras emparelhadas)

Testes Z e t em amostras emparelhadas para testar diferenças de médias

Intervalos de confiança para diferenças de médias de amostras emparelhadas

Teste t para variâncias separadas

Statistics for Managers Using Microsoft Excel, 5e ©

2008 Prentice-Hall, Inc.

Chap 10-55

Resumo do Capítulo

Comparações de duas proporções

populacionais

Intervalos de confiança para a diferença entre duas

proporções populacionais

Teste Z para duas proporções populacionais

Teste F para a diferença entre duas

variâncias populacionais

Uso da tabela F para encontrar os valores

críticos de F

Neste capítulo, vimos:

Prof.: Patricia Maria Bortolon, D. Sc.pmbortolon.wdfiles.com/local--files/home/Aula 7_Teste...e...

Documents

Transcript of Prof.: Patricia Maria Bortolon, D. Sc.pmbortolon.wdfiles.com/local--files/home/Aula 7_Teste...e...