Estatística: Revelando o Poder dos Dados Lock5
Teste Estatístico
Um teste estatístico usa dados de uma amostra para avaliar uma afirmativa sobre
uma população
Estatística: Revelando o Poder dos Dados Lock5
Hipóteses Estatísticas
Hipótese Nula (H0): Afirmativa de que não há efeito ou diferença.
Hipótese Alternativa (Ha): Afirmativa para a qual procuramos evidências.
Testes estatísticos são estabelecidos formalmente em termos de duas hipóteses concorrentes:
Estatística: Revelando o Poder dos Dados Lock5
Hipóteses Estatísticas
A hipótese alternativa é estabelecida pela observação de evidências (dados) que contradizem a hipótese nula e apóiam a hipótese alternativa
Hipóteses são sempre sobre parâmetros populacionais
Ho: Hipótese nula
Ha: Hipótese alternativa
Afirmações concorrentes sobre
uma população
Estatística: Revelando o Poder dos Dados
Hipóteses
Tire um minuto para escrever as hipóteses para cada uma das seguintes situações:
A proporção de pessoas que apóia o controle de armas é diferente entre homens e mulheres?
A média de horas de sono por noite para estudantes universitários é inferior a 7?
Estatística: Revelando o Poder dos Dados
Hypotheses
Tire um minuto para escrever as hipóteses para cada uma das seguintes situações:
A proporção de pessoas que apóia o controle de armas é diferente entre homens e mulheres?
A média de horas de sono por noite para estudantes universitários é inferior a 7?
pm: proporção de mulheres que apoiam o controle de armasph: proporção de homens que apóiam o controle de armas
H0: pm = phHa: pm ≠ ph
: horas médias de sono por noite para estudantes universitários H0: =7Ha: < 7
Estatística: Revelando o Poder dos Dados
• Quão incomum seria obter resultados tão extremos (ou mais extremos) do que aqueles observados, se a hipótese nula for verdadeira?
• Se isso for muito incomum, a hipótese nula provavelmente não é verdadeira!
•Se não for muito incomum, então não há evidência contra a hipótese nula
Teste de Hipóteses
Estatística: Revelando o Poder dos Dados
Resumo da Seção 4.1
Testes estatísticos usam dados de uma amostra para avaliar uma afirmação sobre uma população
Testes estatísticos são geralmente formalizados com hipóteses concorrentes:
Hipótese nula(H0): sem efeito ou sem diferençaHipótese alternativa (Ha): que buscamos evidências
Se os dados são estatisticamente significativos, temos evidências convincentes contra a hipótese nula, e em favor da alternativa
Estatística: Revelando o Poder dos Dados
Paul o Polvo
http://www.youtube.com/watch?v=3ESGpRUMj9E
Estatística: Revelando o Poder dos Dados
Paul o Polvo
• Em 2008, Paul the Octopus previu 8 jogos da Copa do Mundo, e previu todos eles corretamente
• Isso é evidência de que a chance de Paul adivinhar corretamente, p, é realmente maior que 50%?
• Quais são as hipóteses nula e alternativa?
H0: p = 0.5Ha: p > 0.5
Estatística: Revelando o Poder dos Dados
Pergunta chave
Se é muito incomum, temos evidências estatisticamente significativas contra a hipótese nula
Pergunta de hoje: Como medimos quão incomum é uma estatística de amostra, se H0 for verdadeira?
Quão incomum seria ver uma estatística amostral tão extrema quanto a observada, se H0 fosse verdadeira?
Estatística: Revelando o Poder dos Dados
Paul o Polvo
Precisamos saber que tipos de estatísticas poderíamos observar apenas por acaso, se a hipótese nula fosse verdadeira
Como poderíamos descobrir isso???
Simule muitas amostras de tamanho n = 8 com p = 0,5
Estatística: Revelando o Poder dos Dados
Distribuição de Aleatorização
Uma distribuição de aleatorizaçãoé uma coleção de estatísticas de
amostras simuladas supondo que a hipótese nula é verdadeira
A distribuição de aleatorização mostra que tipos de estatísticas seriam observados, apenas pelo acaso, se a hipótese nula fosse verdadeira
Estatística: Revelando o Poder dos Dados
Pergunta Chave
Uma distribuição de aleatorização nos diz quais tipos de estatísticas veríamos apenas pelo acaso, se a hipótese nula é verdadeira
Isto torna simples avaliar quão extrema é a estatística observada!
Quão incomum seria ver uma estatística amostral tão extrema quanto a observada, se H0 fosse verdadeira?
Estatística: Revelando o Poder dos Dados
Valor p
O valor p é a chance de obter uma estatística da amostra tão extrema (ou mais extrema) quanto a
estatística amostral observada, se a hipótese nula for verdadeira
O valor p pode ser calculado como a proporção de estatísticas em uma distribuição de aleatorização que são tão extremas (ou mais extremas) do que a estatística amostral observada
Estatística: Revelando o Poder dos Dados
Valor p
Paul o polvo: o valor p é a chance de obter todos os 8 dos 8 palpites corretos, se p = 0,5
What proportion of statistics in the randomization distribution are as extreme as ො𝑝 = 1?
Estatística: Revelando o Poder dos Dados
1000 Simulações
valor p = 0,004
Se Paul está apenas adivinhando, a chance dele ter todos os 8 corretos é 0,004.
valor pProporção tão extrema quanto
a estatística observada
estatística observada
Estatística: Revelando o Poder dos Dados
1. Quais tipos de estatísticas obteríamos, apenas pelo acaso, se a hipótese nula fosse verdadeira?(distribuição de aleatorização)
2. Que proporção dessas estatísticas é tão extrema quanto nossa estatística amostral original?(valor p)
Calculando um Valor p
Estatística: Revelando o Poder dos Dados
Pena de Morte Numa amostra aleatória de pessoas
perguntou-se: "Você é a favor da pena de morte para uma pessoa condenada por assassinato?"
A proporção de americanos que é a favor da pena de morte diminuiu de 1980 para 2010?
Sim Não
1980 663 342
2010 640 360
“Death Penalty,” Gallup, www.gallup.com
Estatística: Revelando o Poder dos Dados
Pena de Morte
Quão extremo é 0,02, se p1980 = p2010?
p1980 , p2010: proporção de americanos que são a favor da pena de morte 1980, 2010
H0: p1980 = p2010
Ha: p1980 > p2010
StatKey
Sim Não
1980 663 342
2010 640 360
Ƹ𝑝1980 = 0,66 Ƹ𝑝2010 = 0,64
Então a estatística amostral é:Ƹ𝑝1980 − Ƹ𝑝2010 = 0,66 − 0,64 = 0,02
Estatística: Revelando o Poder dos Dados
Pena de Morte
Valor p = 0,164
Se a proporção que apoia a pena de morte não tiver mudado de 1980 para 2010, veremos diferenças extremas em cerca de 16% do tempo.
Estatística: Revelando o Poder dos Dados
• Uma alternativa unilateral contains > ou < • Uma alternativa bilateral contains ≠
• O valor p é a proporção na cauda na direção especificada por Ha
• Para uma alternativa de dois lados, o valor p é o dobro da proporção na menor cauda
Hipótese Alternativa
Estatística: Revelando o Poder dos Dados
Valores p e Ha
Cauda superior
(Right Tail)
Cauda inferior
(Left Tail)
Bicaudal
Estatística: Revelando o Poder dos Dados
Valores p e H0
Se o valor p for pequeno, então uma estatística tão extrema quanto a observada seria improvável se a hipótese nula fosse verdadeira, fornecendo evidência significativa contra H0
Quanto menor o valor p, mais forte a evidência contra a hipótese nula e em favor da alternativa
Estatística: Revelando o Poder dos Dados
The smaller the p-value, the
stronger the evidence against Ho.
The smaller the p-value,
the stronger the evidence
against Ho.
Quanto menor o valor
p, mais forte a
evidência contra Ho.
Valor p e H0
Estatística: Revelando o Poder dos Dados
Resumo da Seção 4.2 • A distribuição de aleatorização mostra que tipos
de estatísticas seriam observados, apenas pelo acaso, se a hipótese nula fosse verdadeira
• Um valor p é a chance de obter uma estatística tão extrema quanto a observada, se H0 for verdadeiro
• Um valor p pode ser calculado como a proporção de estatísticas na distribuição de aleatorização tão extremas quanto a estatística amostral observada
• Quanto menor o valor p, maior a evidência contra H0
Estatística: Revelando o Poder dos Dados
Decisões Formais
Se o valor p é pequeno: REJEITE H0
a amostra seria extrema se H0 fosse verdadeira os resultados são estatisticamente significativos temos evidências a favor de Ha
Se o valor p não for pequeno: NÃO REJEITE H0
a amostra não seria muito extrema se H0 fosse verdadeira os resultados não são estatisticamente significativos o teste é inconclusivo; tanto H0 quanto Ha podem ser
verdadeiros
Estatística: Revelando o Poder dos Dados
Um teste de hipótese formal tem apenas duas conclusões possíveis:
1. O valor p é pequeno: rejeitar a hipótese nula em favor da alternativa
2. O valor p não é pequeno: não rejeite a hipótese nula
Decisões Formais
Quão pequeno?
Estatística: Revelando o Poder dos Dados
Nível de Significância
O nível de significância, , é o limiar abaixo do qual o valor p é considerado pequeno o suficiente para rejeitar a hipótese nula
valor p < Rejeite H0
valor p > Não Rejeite H0
Estatística: Revelando o Poder dos Dados
Nível de Significância
Se o valor p for menor que , os resultadosserão estatisticamente significativos, e rejeitaremos a hipótese nula em favor da alternativa
Se o valor p for menor que , os resultadosserão estatisticamente não significativos, e nosso teste será inconclusivo
Freqüentemente = 0,05 por padrão, a menos que especificado de outra forma
Estatística: Revelando o Poder dos Dados
Conclusões Estatísticas
Força da evidência contra H0:
Decisão formal do teste de hipóteses, baseado em = 0.05 :
estatisticamente significativa estatisticamente não significativa
Estatística: Revelando o Poder dos Dados
Esclerose Múltipla e Luz Solar• Acredita-se que a luz solar oferece alguma proteção contra a
esclerose múltipla (EM), mas a razão é desconhecida
• Pesquisadores atribuíram aleatoriamente ratos a um dos grupos:• Controle (sem intervenção)• Recebendo Suplementos de Vitamina D• Recebendo Luz UV
• Todos os ratos foram injetados com proteínas conhecidas por induzir uma forma de EM, e eles observaram quais ratos desenvolveram EM
Seppa, Nathan. “Sunlight may cut MS risk by itself”, Science News, April 24, 2010 pg 9, reporting on a study appearing March 22, 2010 in the Proceedings of the National Academy of Science.
Estatística: Revelando o Poder dos Dados
Esclerose Múltipla e Luz Solar
Para cada situação abaixo, anote Hipóteses nula e alternativa Descrição informal da força da evidência contra H0
Decisão formal sobre H0, usando α = 0,05 Conclusão no contexto da questão
Ao testar se a luz UV fornece proteção contra EM (luz UV versus grupo controle), o valor p é 0,002.
Ao testar se a vitamina D fornece proteção contra EM (vitamina D versus grupo controle), o valor p é 0,47.
Estatística: Revelando o Poder dos Dados
Esclerose Múltipla e Luz Solar
Ao testar se a luz UV fornece proteção contra EM (luz UV versus grupo controle), com o valor p de 0,002:
• H0: pUV – pC = 0Ha: pUV – pC < 0
• Temos fortes evidências contra H0
• Rejeitamos H0
• Temos fortes evidências de que a luz UV fornece proteção contra a esclerose múltipla, pelo menos em camundongos.
Estatística: Revelando o Poder dos Dados
Esclerose Múltipla e Luz Solar
Ao testar se a vitamina D fornece proteção contra EM (vitamina D versus grupo controle), com o valor p de 0,47.
• H0: pD – pC = 0Ha: pD – pC < 0
• Nós temos poucas evidências contra H0
• Não rejeitamos H0
• Não podemos concluir nada sobre a vitamina D e EM através do experimento.
Estatística: Revelando o Poder dos Dados
Existem quatro possibilidades:
Erros
Rejeitar H0 Não rejeitar H0
H0 verdadeira
H0 falsa ☺
☺ERRO TIPO I
ERRO TIPO IIVer
dad
e
Decisão
• Um Erro Tipo I é rejeitar uma H0 verdadeira
• Um Erro Tipo II é não rejeitar uma H0 falsa
Estatística: Revelando o Poder dos Dados
Uma pessoa é inocente até que se prove culpada.
Evidência deve ser com pouca sombra de dúvida
.
Tipos de erros em um veredicto?
Condenar um inocente
Absolver um culpado
Ho Ha
Erro Tipo I
Erro Tipo II
Analogia com o Direito
valor p através dos
dados
Estatística: Revelando o Poder dos Dados
Escolhendo α
Por padrão, geralmente α = 0.05
Se um erro do Tipo I (rejeitar um verdadeiro nulo) for muito pior do que um erro do Tipo II, podemos escolher um α, tal como α = 0,01
Se um erro do tipo II (não rejeitar um falso nulo) for muito pior que um erro do tipo I, podemos escolher um erro maior α, tal como α= 0,10
Estatística: Revelando o Poder dos Dados
• Os resultados são estatisticamente significativos se o valor p for menor que o nível de significância, α
• Ao tomar decisões formais, rejeite H0 if the se o valor p for menor que α, caso contrário, não rejeite H0
• Não rejeitar H0 NÃO é o mesmo que aceitar H0
• Existem dois tipos de erros: rejeitar um verdadeiro nulo (Tipo I) e não rejeitar um falso nulo (Tipo II)
Resumo da Seção 4.3
Estatística: Revelando o Poder dos Dados
Resumo da Seção 4.4
Amostras de aleatorização devem ser geradas
Consistentes com a hipótese nulaUsando os dados observadosRefletindo a maneira como os dados foram
coletados
O método específico varia de acordo com a situação, mas a ideia geral é sempre a mesma
Estatística: Revelando o Poder dos Dados
Distribuições Bootstrap e de Aleatorização
Distribuição Bootstrap Distribuição de Aleatorização
Nosso melhor palpite na distribuição de estatísticas amostrais
Nosso melhor palpite na distribuição das estatísticas amostrais, se H0 fosse verdadeiro
Centrado em torno da estatística amostral observada
Centrado em torno do valor hipotético sob a hipótese nula
Simula amostragem da população por meio de reamostragem da amostra original
Simula amostras assumindo que H0 fosse verdadeiro
Grande diferença: uma distribuição de aleatorização assume que H0 é verdadeiro, enquanto uma distribuição bootstrap não
Estatística: Revelando o Poder dos Dados
Intervalos e Testes
Se um IC de 95% não contém o parâmetroem H0, então um teste bicaudal deve
rejeitar H0 ao nível de significância de 5%.
Se um IC de 95% contém o parâmetro emH0, então um teste bicaudal deve não
rejeitar H0 ao nível de significância de 5%.
Estatística: Revelando o Poder dos Dados
Intervalos e Testes
Os intervalos de confiança são mais úteis quando você deseja estimar parâmetrospopulacionais
Testes de hipótese e valores de p são mais úteis quando você deseja testar hipóteses sobreparâmetros populacionais
Intervalos de confiança fornecem uma faixa de valores plausíveis; Valores p quantificam a força da evidência contra a hipótese nula
Estatística: Revelando o Poder dos Dados
• Com amostras pequenas, mesmo grandes diferenças ou efeitos podem não ser significativos
• Com amostras grandes, até mesmo uma diferença ou efeito muito pequeno pode ser significativo
• Um resultado estatisticamente significativo nem sempre é praticamente significativo, especialmente com amostras grandes
Significância Estatística vs Prática
Estatística: Revelando o Poder dos Dados
Resumo da Seção 4.5 Se um valor hipotético nulo estiver dentro de um IC de
95%, um teste bicaudal usando α = 0,05 não rejeitariaH0
Se um valor hipotético nulo estiver fora de um
IC de 95%, um teste bicaudal usando α = 0.05 rejeitariaH0
Significância estatística nem sempre é o mesmo que significância prática
Usando α = 0,05, 5% de todos os testes de hipóteses levará a rejeição da hipótese nula, mesmo que todas as hipóteses nulas sejam verdadeiras
Top Related