Teste de hipóteses para médias e proporções amostrais · Usar t ou z para teste de hipótese?...

29
Teste de hipóteses para médias e proporções amostrais Prof. Marcos Pó Métodos Quantitativos para Ciências Sociais

Transcript of Teste de hipóteses para médias e proporções amostrais · Usar t ou z para teste de hipótese?...

Page 1: Teste de hipóteses para médias e proporções amostrais · Usar t ou z para teste de hipótese? ... Teste de hipóteses da média de duas populações •Objetivo: testar hipóteses

Teste de hipóteses para médias e proporções amostrais

Prof. Marcos Pó Métodos Quantitativos para Ciências Sociais

Page 2: Teste de hipóteses para médias e proporções amostrais · Usar t ou z para teste de hipótese? ... Teste de hipóteses da média de duas populações •Objetivo: testar hipóteses

Questão prática

Abrir a planilha “Alunos MQCS_16-18” e calcular a média, o desvio padrão e o tamanho da amostra dos alunos no geral e para cada turma.

Considerando que segundo o IBGE* a mediana de alturas da população entre 20 e 29 anos é de 173cm e que é válido assumir esse valor como equivalente à média, podemos afirmar que:

(a). Os alunos de MQCS são mais baixos que a população brasileira?

(b). Os alunos de pelo menos uma das turmas são mais baixos que a população brasileira?

2 * http://www.ibge.gov.br/home/estatistica/populacao/condicaodevida/pof/2008_2009_encaa/tabelas_pdf/tab1_1.pdf, acesso em 07/03/2016

Média (cm) Desvio Padrão

(cm) n

Diurno

Noturno

Total Geral

Page 3: Teste de hipóteses para médias e proporções amostrais · Usar t ou z para teste de hipótese? ... Teste de hipóteses da média de duas populações •Objetivo: testar hipóteses

Questão prática

Abrir a planilha “Alunos MQCS_16-18” e calcular a média, o desvio padrão e o tamanho da amostra dos alunos no geral e para cada turma.

Considerando que segundo o IBGE* a mediana de alturas da população entre 20 e 29 anos é de 173cm e que é válido assumir esse valor como equivalente à média, podemos afirmar que:

(a). Os alunos de MQCS são mais baixos que a população brasileira?

(b). Os alunos de pelo menos uma das turmas são mais baixos que a população brasileira?

3 * http://www.ibge.gov.br/home/estatistica/populacao/condicaodevida/pof/2008_2009_encaa/tabelas_pdf/tab1_1.pdf, acesso em 07/03/2016

Média (cm) Desvio Padrão

(cm) n

Diurno 166,5 9,40 101

Noturno 169,1 12,00 93

Total Geral 167,8 10,87 194

Page 4: Teste de hipóteses para médias e proporções amostrais · Usar t ou z para teste de hipótese? ... Teste de hipóteses da média de duas populações •Objetivo: testar hipóteses

Hipótese estatística

• Hipótese é uma explicação provisória proposta para um fenômeno, passível de ser demonstrada ou testada.

• Hipótese estatística é uma afirmação sobre um parâmetro populacional, a ser testada com base em estatísticas amostrais:

► H0 - Hipótese nula: normalmente é uma afirmação de igualdade. É nula no sentido de significar que o fenômeno investigado não está ocorrendo e que os valores amostrais encontrados são explicados apenas por acasos amostrais.

► HA - Hipótese alternativa: é o complemento da hipótese nula e significa que os valores encontrados naquela amostra são tão raros que provavelmente devem-se ao fato de tratarmos de duas populações diferentes.

4

Page 5: Teste de hipóteses para médias e proporções amostrais · Usar t ou z para teste de hipótese? ... Teste de hipóteses da média de duas populações •Objetivo: testar hipóteses

• Processo que usa estatísticas amostrais para testar uma afirmação sobre um parâmetro de uma população.

• É uma metodologia para julgar se os dados amostrais trazem evidências que apoiem ou refutem uma hipótese quantitativa, assim como permite estimar a probabilidade de cometer determinados tipos de erro nesse julgamento.

► Ele nos fornece uma regra de decisão em relação a uma afirmação com base nas probabilidade de erro que podemos incorrer.

• Ou seja, nos permite responder com algum grau de confiança: “essa evidência pode nos convencer que a hipótese está errada?”

5

Teste estatístico de hipótese

Page 6: Teste de hipóteses para médias e proporções amostrais · Usar t ou z para teste de hipótese? ... Teste de hipóteses da média de duas populações •Objetivo: testar hipóteses

6

Page 7: Teste de hipóteses para médias e proporções amostrais · Usar t ou z para teste de hipótese? ... Teste de hipóteses da média de duas populações •Objetivo: testar hipóteses

Tipos de erro de decisão em um TH

Erro Tipo I: rejeitar uma hipótese verdadeira.

Erro Tipo II: aceitar uma hipótese falsa.

Realidade

Verdadeiro Falso

Julg

ame

nto

Verdadeiro Erro Tipo II

Falso Erro Tipo I

7

Page 8: Teste de hipóteses para médias e proporções amostrais · Usar t ou z para teste de hipótese? ... Teste de hipóteses da média de duas populações •Objetivo: testar hipóteses

Erro Tipo I: rejeitar uma hipótese verdadeira

• A probabilidade de incorrermos nesse erro é denominada α e é chamada de nível de significância do teste, ou seja, o resultado da amostra é tanto mais significante para rejeitar H0 quanto menor for o valor de α

• Normalmente α é fixado em:

• O alfa (α) é um valor definido arbitrariamente pelo pesquisador.

8

10%

5% * Evento raro

1% ** Evento raríssimo

0,1% *** Evento raríssimo

Page 9: Teste de hipóteses para médias e proporções amostrais · Usar t ou z para teste de hipótese? ... Teste de hipóteses da média de duas populações •Objetivo: testar hipóteses

Exemplo de raridade

9

Como sabemos que determinado card de

Pokémon é raro?

Page 10: Teste de hipóteses para médias e proporções amostrais · Usar t ou z para teste de hipótese? ... Teste de hipóteses da média de duas populações •Objetivo: testar hipóteses

Erro Tipo II: aceitar uma hipótese falsa

• A probabilidade de se incorrer no Erro Tipo II é denominada β (beta).

• Nem sempre conseguimos determinar ou definir β em um teste de hipótese, pois normalmente a Hipótese Alternativa de um problema não contém muitos elementos.

10

Page 11: Teste de hipóteses para médias e proporções amostrais · Usar t ou z para teste de hipótese? ... Teste de hipóteses da média de duas populações •Objetivo: testar hipóteses

Uma cooperativa pretende usar um novo tipo de vergalhões em suas obras. Haverá um leilão de um lote, porém não se sabe se são do tipo antigo ou do novo. Antes do leilão será disponibilizado o resultado do teste de resistência à tração de uma amostra aleatória de 16 peças. Os parâmetros de cada tipo são mostrados na tabela.

(a). Se a regra de decisão fosse: “caso o resultado do teste seja inferior à 1500kg, considero que os vergalhões são do tipo antigo e não compro; se for maior que 1500kg considero serem novos e compro”, verifique a probabilidade dos seguintes erros:

► Tipo I: dizer que os vergalhões são antigos quando na realidade são novos.

► Tipo II: dizer que os vergalhões novos, quando na verdade são antigos.

(b). Qual deveria ser a regra de decisão se desejarmos que o risco de comprar peças antigas seja menor que 5%?

11

Exemplo de erros de decisão

Tipo Resistência à tração Desvio-padrão

Antigo 1.400 kg 300 kg

Novo 1.600 kg 250 kg

Page 12: Teste de hipóteses para médias e proporções amostrais · Usar t ou z para teste de hipótese? ... Teste de hipóteses da média de duas populações •Objetivo: testar hipóteses

Como escolher o erro que aceitamos cometer?

• Ao se diminuir a probabilidade de Erro I, aumenta-se a chance de Erro II.

• Para escolher que risco queremos correr é necessário analisar qual seria mais prejudicial para a pesquisa e para os seus possíveis impactos.

• Ex.: Por causa de um erro amostral excessivo seria mais grave considerar que...

... há ou não diferenças no desempenho acadêmico de estudantes de acordo com o gênero?

... há ou não diferenças no desempenho de motoristas que tomam bebidas alcoólicas?

12

Page 13: Teste de hipóteses para médias e proporções amostrais · Usar t ou z para teste de hipótese? ... Teste de hipóteses da média de duas populações •Objetivo: testar hipóteses

A partir de qual nível de evidência poderíamos julgar com segurança que determinado suspeito cometeu o crime?

1. Ele estava na cidade no dia do crime.

2. Ele tinha motivos para querer matar a vítima.

3. Não apresentou um álibi convincente.

4. Ele possuía uma arma do mesmo calibre da utilizada no crime.

5. Foi filmado entrando e saindo do local do crime.

13 Prof. Marcos Vinicius Pó

Teste de hipótese = decisão com base em evidências

Ícone: Aldric Rodríguez, The Noun Project

Page 14: Teste de hipóteses para médias e proporções amostrais · Usar t ou z para teste de hipótese? ... Teste de hipóteses da média de duas populações •Objetivo: testar hipóteses

Regra de decisão: Região Crítica

• Testar uma hipótese significa verificar se a nossa evidência amostral é tão forte (= tão improvável) a ponto de podermos rejeitar a Hipótese Nula. Para isso estabelecemos um intervalo de valores em que consideraremos haver elementos suficientes para fazer essa rejeição. Esse intervalo de rejeição de H0 é chamado região crítica.

► Se a estatística do teste cair na região crítica, rejeita-se H0, ou seja, consideramos que há forte evidência de H0 ser falsa e que podemos aceitar a HA. Esse risco é o nosso alfa ().

► Quando a evidência estatística não cair na região crítica dizemos que não houve evidência amostral significativa para rejeitar H0.

14

Page 15: Teste de hipóteses para médias e proporções amostrais · Usar t ou z para teste de hipótese? ... Teste de hipóteses da média de duas populações •Objetivo: testar hipóteses

Probabilidade de significância (p-valor)

• Invés de se definir arbitrariamente um valor para α, um procedimento alternativo consiste em determinar a probabilidade de significância, ou p-valor do teste.

• Nesse caso, em vez de se calcular a região crítica para aceitar ou rejeitar a hipótese, calcula-se qual a probabilidade de ocorrerem valores para x ou p mais desfavoráveis à H0. A seguir julga-se se tal valor consiste em um evento raro.

• Em muitos casos, em vez de se determinar simplesmente se H0 é rejeitada, diz-se que H0 é rejeitada a um determinado nível de p-valor.

15

^

Page 16: Teste de hipóteses para médias e proporções amostrais · Usar t ou z para teste de hipótese? ... Teste de hipóteses da média de duas populações •Objetivo: testar hipóteses

Roteiro para o teste de hipótese

1. Definir as hipóteses.

► Nula (H0)

► Alternativa (HA)

2. Especificar as evidências estatísticas que serão usadas.

► Estimadores

► Propriedades da estatística (distribuição, média, desvio-padrão...)

3. Fixar a probabilidade de cometer o Erro Tipo I (α) e especificar a regra de decisão.

► Referência para aceitar ou rejeitar a hipótese (região crítica)

4. Apreciar a evidência.

5. Decidir e interpretar o resultado.

16

Page 17: Teste de hipóteses para médias e proporções amostrais · Usar t ou z para teste de hipótese? ... Teste de hipóteses da média de duas populações •Objetivo: testar hipóteses

Usar t ou z para teste de hipótese?

• Se conhecermos o desvio-padrão da população (σ), pode-se usar

a distribuição z.

• Caso não se conheça σ, temos que usar o s da amostra para

determinar o intervalo de confiança.

• Assim, segue-se a mesma regra que para intervalos de confiança:

► Amostras grandes: nesse caso pode-se considerar que a amostra aproxima-se da normal

► Amostras pequenas: usar a distribuição t de Student

17

Page 18: Teste de hipóteses para médias e proporções amostrais · Usar t ou z para teste de hipótese? ... Teste de hipóteses da média de duas populações •Objetivo: testar hipóteses

TESTE DE HIPÓTESE DE MÉDIAS PARA DUAS POPULAÇÕES

18

Page 19: Teste de hipóteses para médias e proporções amostrais · Usar t ou z para teste de hipótese? ... Teste de hipóteses da média de duas populações •Objetivo: testar hipóteses

Teste de hipóteses da média de duas populações

• Objetivo: testar hipóteses que comparam médias de duas amostras, possivelmente de populações distintas.

• Tipos de amostras: ► Independentes: não há relação entre as amostras selecionadas em cada

população

► Dependentes: cada membro de uma amostra corresponde a um membro da outra amostra. Também chamadas de emparelhadas ou relacionadas.

População 1 (μ1; σ1)

População 2 (μ2; σ2)

Amostra (n, X, s)

Amostra (m, Y, s)

19

? ?

Page 20: Teste de hipóteses para médias e proporções amostrais · Usar t ou z para teste de hipótese? ... Teste de hipóteses da média de duas populações •Objetivo: testar hipóteses

Testes possíveis

• Diferença entre médias

• Diferença entre desvios-padrão (será tratado juntamente com ANOVA)

20

Page 21: Teste de hipóteses para médias e proporções amostrais · Usar t ou z para teste de hipótese? ... Teste de hipóteses da média de duas populações •Objetivo: testar hipóteses

Considerações: teste de médias

• Populações:

► Normais (= distribuição amostral da média)

► Homocedásticas (σX = σY = σ)

• Lembrar que:

)()()( YEXEYXE

)()()( YEXEYXE

)()()( YVarXVarYXVar

)()( 2 XVarkXkVar

21

Page 22: Teste de hipóteses para médias e proporções amostrais · Usar t ou z para teste de hipótese? ... Teste de hipóteses da média de duas populações •Objetivo: testar hipóteses

Amostras independentes

• Podemos definir um intervalo de confiança da diferença da média das amostras X e Y, com n e m elementos respectivamente.

• Como as populações são homocedásticas podemos simplificar:

• Caso seja usada a distribuição t, os graus de liberdade serão ν = n+m-2

22

mnNYXE YX

22

;0~)(

mn

YXZ

YX 22

mn

YXz

s11

.

Page 23: Teste de hipóteses para médias e proporções amostrais · Usar t ou z para teste de hipótese? ... Teste de hipóteses da média de duas populações •Objetivo: testar hipóteses

IC do teste da diferença de duas médias

0

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0 5 10 15 20- +

0

(0,1)N

z -z

2

2

1

0)( YXE

)()()( YVarXVarYXVar mn

YXz

s11

.

Page 24: Teste de hipóteses para médias e proporções amostrais · Usar t ou z para teste de hipótese? ... Teste de hipóteses da média de duas populações •Objetivo: testar hipóteses

Amostras dependentes

• Nesse caso, a quantidade de elementos de X e Y são iguais (n).

• As amostras podem ser entendidas como pares (X1-Y1,..., Xn- Yn) e, assim, podemos definir a variável D = X–Y, resultando na amostra D1,...,Dn.

• Dessa forma, reduzimos o problema a uma única população e amostra, com as seguintes características:

24

YXYXn

Dn

i ii 1

1

n

iD DDi

nS

1

22

1

1

Page 25: Teste de hipóteses para médias e proporções amostrais · Usar t ou z para teste de hipótese? ... Teste de hipóteses da média de duas populações •Objetivo: testar hipóteses

Teste de hipótese para proporção

Idêntico ao teste de médias, considerando que a estatística p tem distribuição aproximadamente normal.

n

pppNp

)1(,~ˆ

25

m

pp

n

ppNppE

)1()1(;0~)ˆˆ( 2211

21

m

pp

n

pp

ppZ

)1()1(

ˆˆ

2211

21

^

Page 26: Teste de hipóteses para médias e proporções amostrais · Usar t ou z para teste de hipótese? ... Teste de hipóteses da média de duas populações •Objetivo: testar hipóteses

Exemplo: amostra x população

1. Mediu-se as alturas de 30 recém-nascidos no departamento de pediatria de um hospital, obtendo-se uma média de 49cm e um desvio-padrão de 2,8cm. Teste a hipótese de que a média dos recém-nascidos seja de 51cm conforme o esperado pelos padrões da OMS, admitindo o risco de 5% de cometer o erro tipo I.

26

Page 27: Teste de hipóteses para médias e proporções amostrais · Usar t ou z para teste de hipótese? ... Teste de hipóteses da média de duas populações •Objetivo: testar hipóteses

Exemplo: diferença entre amostras

2. Uma rede de supermercados testou duas estratégias diferentes de venda em lojas de mesmo porte e perfil do público. Para compará-las utilizaram-se amostras de 50 clientes, obtendo-se as médias de gasto respectivamente em R$62 e R$71. Sabendo-se que o desvio-padrão em ambos os casos é de R$20, é possível afirmar que o gasto médio das duas filiais é o mesmo? Caso contrário, dê um intervalo de confiança para a diferença.

27

Cena de mercado. Século 15 www.wga.hu

Page 28: Teste de hipóteses para médias e proporções amostrais · Usar t ou z para teste de hipótese? ... Teste de hipóteses da média de duas populações •Objetivo: testar hipóteses

Exemplo: proporção x população (baseado em fatos reais)

3. Desconfiada dos resultados do sorteio de grupos realizado por seu professor de Métodos Quantitativos, a aluna R. resolveu testar o dado utilizado fazendo 600 lançamentos, onde o lado três foi sorteado 123 vezes.

(a) Qual o p-valor do teste?

(b) Podemos afirmar, ao nível de 5%, que o dado é viciado em relação ao lado 3?

(c) Podemos afirmar que o dado é viciado ao nível de 1%?

28

Page 29: Teste de hipóteses para médias e proporções amostrais · Usar t ou z para teste de hipótese? ... Teste de hipóteses da média de duas populações •Objetivo: testar hipóteses

Exemplo: amostras pareadas

4. Uma lanchonete quer saber se a introdução de uma pausa afeta a produtividade dos seus funcionários. Para isso verificou o total de lanches produzidos por cada um de seus 6 chapeiros ao longo de dias aletaórios sem e com o intervalo. Os resultados indicam que há melhora na produtividade?

29

Chapeiro Sem

intervalo Com

intervalo Diferença

(Sem-Com)

1 23 28 -5

2 35 38 -3

3 29 29 0

4 33 37 -4

5 43 42 1

6 32 30 2

média 32,5 34 -1,5

dpad 6,63 5,76 2,88