Seção 3.2 Compreensão e Interpretação dos Intervalos de...
-
Upload
hoangquynh -
Category
Documents
-
view
218 -
download
0
Transcript of Seção 3.2 Compreensão e Interpretação dos Intervalos de...
Estatística: Revelando o Poder dos Dados Lock5
Seção 3.2
Compreensão e Interpretação dos
Intervalos de Confiança
Estatística: Revelando o Poder dos Dados
Sumário
Estimativas de intervalo
Estimativa intervalar com base na margem de erro
Intervalo de confiança
Intervalo de confiança de 95% usando o erro-padrão
Compreendendo intervalos de confiança
Interpretações erradas comuns
Estatística: Revelando o Poder dos Dados
Plano de Saúde-Empresa
Um relatório de uma pesquisa Gallup em 2011 com base em uma amostra aleatória de n = 147.291 adultos diz
“Quarenta e cinco por cento dos adultos americanos relataram obter o plano de saúde de um empregador…”
Qual a precisão de 45%???
http://www.gallup.com/poll/148079/Employer-Based-Health-Insurance-Declines-Further.aspx
Estatística: Revelando o Poder dos Dados
Estimativa Intervalar
Uma estimativa intervalar fornece um intervalo de valores plausíveis para um parâmetro populacional.
Estatística: Revelando o Poder dos Dados
Margem de Erro
Uma forma comum para uma estimativa intervalar é
estatística ± margem de erro
onde a margem de erro reflete a precisão
da estatística amostral como uma estimativa de ponto para o parâmetro.
Estatística: Revelando o Poder dos Dados
Plano de Saúde-Empresa
“Quarenta e cinco por cento dos adultos americanos relataram obter o plano de saúde de um empregador…”
Mais tarde no relatório, diz
“a margem máxima de erro de amostragem é de 1 ponto percentual”
Estimativa intervalar: 45% 1% = [44%, 46%]
A porcentagem de adultos americanos recebendo seu plano de saúde de um empregador estará provavelmente entre 44% e 46%
Estatística: Revelando o Poder dos Dados
Mensagens de Texto
• Uma amostra aleatória de 2011 de n = 755 usuários de telefone celular dos EUA com idade acima de 18 anos descobriu que o número médio de mensagens de texto enviadas ou recebidas por dia é de 41,5 mensagens, com uma margem de erro de 12,2.
• Forneça uma estimativa intervalar para o número médio de mensagens de texto enviadas ou recebidas por dia para usuários adultos de telefone celular nos EUA. 41.5 12.2
= (29.3, 53.7)Smith, A. “Americans and Text Messaging,” Pew Research Center, http://www.pewinternet.org/Reports/2011/Cell-Phone-Texting-2011/Main-Report/How-Americans-Use-Text-Messaging.aspx , accessed 9/19/11.
Estatística: Revelando o Poder dos Dados
Sondagem Eleitoral
http://www.realclearpolitics.com/epolls/2012/president/us/general_election_romney_vs_obama-1171.html
Por que a margem de erro é menor para a pesquisa Gallup do que para a pesquisa de notícias da ABC??
Estatística: Revelando o Poder dos Dados
Sondagem Eleitoral
Usando a pesquisa Gallup, calcule uma estimativa de intervalo para a proporção de eleitores registrados que planejam votar em Obama.
Estatística: Revelando o Poder dos Dados
Sondagem Eleitoral
A eleição presidencial de 2012 já aconteceu, então essa é uma das raras situações em que realmente conhecemos o verdadeiro parâmetro populacional, p!
Na eleição real, 50,4% votaram em Obama.
Sua estimativa intervalar contém o parâmetro populacional verdadeiro?
Estatística: Revelando o Poder dos Dados
Margem de Erro
• Como determinamos a margem de erro???
• Podemos usar a dispersão da distribuição amostral (o erro padrão) para determinar a margem de erro de uma estatística
Estatística: Revelando o Poder dos Dados
Intervalo de Confiança
Um intervalo de confiança para um parâmetro é um intervalo calculado a partir de dados da amostra por um método que irá
incluir o parâmetro para uma proporção especificada de todas as amostras possíveis
A taxa de sucesso (proporção de todas as amostras cujos intervalos contêm o parâmetro) é conhecida como nível de confiança
Um intervalo de confiança de 95% deverá conter o parâmetro verdadeiro em 95% de todas as amostras
Estatística: Revelando o Poder dos Dados
Intervalos de Confiança StatKey
O parâmetro é fixo
A estatística é aleatória (depende da amostra)
O intervalo é aleatório (depende da estatística)
95% dos intervalos de confiança de 95% incluirão o verdadeiro parâmetro
Estatística: Revelando o Poder dos Dados
Se você tivesse acesso à distribuição amostral, como você encontraria a margem de erro para garantir que os intervalos do formulário
estatística ± margem de erro
capturaria o parâmetro para 95% de todas as amostras?
(Dica: lembre-se da regra de 95% do capítulo 2)
Distributição Amostral
Estatística: Revelando o Poder dos Dados
Intervalo de Confiança de 95%
Se a distribuição amostral é relativamente simétrica e em forma de sino, um intervalo
de confiança de 95% pode ser estimado usando
estatística ± 2 × EP
Estatística: Revelando o Poder dos Dados
EconomiaUma pesquisa com 1.502 americanos em janeiro de 2012 descobriu que 86% consideram a economia uma "prioridade máxima" para o presidente e o congresso.
O erro-padrão para esta estatística é de 0,01.
Qual é o intervalo de confiança de 95% para a proporção verdadeira de todos os americanos que consideravam a economia uma “prioridade máxima” naquela época?
http://www.people-press.org/2012/01/23/public-priorities-deficit-rising-terrorism-slipping/
estatística ± 2×EP0,86 ± 2×0,010,86 ± 0,02[0,84; 0,88]
Estatística: Revelando o Poder dos Dados
Compreendendo Intervalos de Confiança
95% de todas as amostras produzem intervalos que contêm o parâmetro verdadeiro, por isso dizemos que temos “95% de certeza” ou “95% de confiança” de que um intervalo contém a verdade.
“Temos 95% de confiança de que a proporção real de todos os americanos que consideraram a economia como "prioridade máxima" em janeiro de 2012 está entre 0,84 e 0,88”
Estatística: Revelando o Poder dos Dados
Carbono na Biomassa Florestal Os cientistas que esperam reduzir o desmatamento
estimam que o carbono armazenado em florestas tropicais na América Latina, África subsaariana e sudeste da Ásia tem uma biomassa total de 247 gigatoneladas.
Para chegar a esta estimativa, eles primeiro estimam a quantidade média de carbono por quilômetro quadrado.
Com base em uma amostra de tamanho n = 4079 lotesde inventário, a média da amostra é ҧ𝑥 = 11.600toneladas com um erro-padrão de 1000 toneladas.
Forneça e interprete um intervalo de confiança de 95%.Saatchi, S.S. et. al. “Benchmark Map of Forest Carbon Stocks in Tropical Regions Across Three Continents,” Proceedings of the National Academy of Sciences, 5/31/11.
Estatística: Revelando o Poder dos Dados
Carbono na Biomassa Florestal
95% IC: 11.600 21.000 = [9.600; 13.600]
Temos 95% de confiança de que a quantidade média de carbono armazenada em cada quilômetro quadrado de floresta tropical está entre 9.600 e 13.600 toneladas.
Estatística: Revelando o Poder dos Dados
Proporção de Caras p = Proporção de vezes que uma moeda da cara
Sabemos p = 0,5, mas vamos fingir que não sabemos disso e queremos estimar
Jogue uma moeda 25 vezes e calcule sua proporção de amostra, Ƹ𝑝
Estatística: Revelando o Poder dos Dados
Proporção de Caras Crie uma distribuição amostral para calcular o
erro-padrão para ො𝑝
Estatística: Revelando o Poder dos Dados
Interpretações Erradas Comuns
• Interpretação incorreta 1: “Um intervalo de confiança de 95% contém 95% dos dados na população”
• Interpretação incorreta 2: "Tenho 95% de certeza de que a média de uma amostra cairá dentro de um intervalo de confiança de 95% para a média"
• Interpretação incorreta 3: “A probabilidade de o parâmetro populacional estar nesse intervalo de confiança de 95% específico é de 0,95”
Estatística: Revelando o Poder dos Dados
Intervalos de Confiança
População Amostra
Amostra
Amostra
AmostraAmostraAmostra
. . .
Calcule estatística para cada amostra
Distribuição Amostral
Erro-Padrão (EP): desvio-padrão da distribuição amostral
Margem de Erro (ME)(95% IC: ME = 2×EP)
estatística ± ME
Estatística: Revelando o Poder dos Dados
Resumo• Para criar um intervalo de confiança de 95%
para um parâmetro:o Pegue muitas amostras aleatórias da população e
calcule a estatística amostral para cada amostrao Calcule o erro-padrão como o desvio-padrão de
todas essas estatísticaso Use a estatística 2EP
• Um pequeno problema…