Estatística: Revelando o poder dos dados Lock5
Seção 2.3
Uma Variável Quantitativa: Medidas
de Dispersão
Estatística: Revelando o poder dos dados Lock5
Sumário
Uma variável quantitativa:
Desvio padrão
Escore z
Resumo dos cinco números
Amplitude e AIQ
Percentis
Estatística: Revelando o poder dos dados Lock5
FilmesHollywood2011.xls
Estatística: Revelando o poder dos dados Lock5
Desvio Padrão
O desvio padrão para uma variável quantitativa mede a dispersão dos
dados
Desvio padrão da amostra: s Desvio padrão da população: (“sigma”)
𝑠 =σ 𝑥 − ҧ𝑥 2
𝑛 − 1
Estatística: Revelando o poder dos dados Lock5
Desvio Padrão
O desvio padrão fornece uma estimativa aproximada da distância típica dos valores dos dados para a média (média dos quadrados dos desvios)
Quanto maior o desvio padrão, mais variabilidade existe nos dados e mais dispersos estarão os dados
Estatística: Revelando o poder dos dados Lock5
Fre
quency
-15 -10 -5 0 5 10 15
050
150
Fre
quency
-15 -10 -5 0 5 10 15
050
150
Desvio Padrão
1s
4s
Estatística: Revelando o poder dos dados Lock5
A Regra dos 95%
Se uma distribuição de dados for aproximadamente em forma de sino, cerca de 95% dos dados devem estar
dentro de dois desvios padrão da média.
Para uma população, 95% dos dados estaráentre (µ – 2) e (µ + 2)
Estatística: Revelando o poder dos dados Lock5
A Regra dos 95%
Estatística: Revelando o poder dos dados Lock5
A Regra dos 95%F
requency
-3 -2 -1 0 1 2 3
050
150
Fre
quency
-15 -10 -5 0 5 10 15
050
150
1s
4s
StatKey
Estatística: Revelando o poder dos dados Lock5
A Regra dos 95%
Estimar o desvio padrão para horas de sono por noite.
2.03s
Aprox. 2
Estatística: Revelando o poder dos dados Lock5
A Regra dos 95%
Com base nos dados do PesquisaEstudantes.xls, as taxas de pulso para essa amostra de estudantes universitários são aproximadamente em forma de sino com média de 69,6 e desvio padrão de 12,2. Que intervalo é provável que contenha 95% das taxas de pulso nesta amostra?
69.6 2(12.2)45.2 to 94 bpm
Estatística: Revelando o poder dos dados Lock5
Escore z
O Escore z para um valor de dados, x, é
𝑧 =𝑥 − ҧ𝑥
𝑠
Para uma população, ҧ𝑥 é substituído por µ e s é substituído por
Estatística: Revelando o poder dos dados Lock5
Escore z
Um escore Z coloca valores em uma escala comum (média = 0 e desvio padrão = 1)
Valores mais distantes de 0 são mais extremos
Um escore z é o número de desvios padrão que um valor cai da média
Para distribuições em forma de sino, 95% de todos os escores z caem entre -2 e 2.
Estatística: Revelando o poder dos dados Lock5
Escore z
Qual é melhor, uma pontuação ACT de 28 ou uma pontuação combinada SAT de 2100?
ACT: = 21, = 5 SAT: = 1500, = 325
Suponha que as pontuações ACT e SAT tenham aproximadamente distribuições em forma de sino
Responda a pergunta usando escores z.
Estatística: Revelando o poder dos dados Lock5
Escore z
ACT de 28:
SAT de 2100:
28 21 71.4
5 5z
2100 1500 6001.85
325 325z
Melhor (maior)
Estatística: Revelando o poder dos dados Lock5
Outras Medidas de Posição
Máximo (Max) = maior valor dentre os dados
Mínimo (Min) = menor valor dentre os dados
Quartis:Q1 = mediana dos valores abaixo de m.Q3 = mediana dos valores acima de m.
Estatística: Revelando o poder dos dados Lock5
Resumo dos Cinco Números
Resumo dos cinco números:
Min MaxQ1 Q3m
25% 25% 25% 25%
Estatística: Revelando o poder dos dados Lock5
Medidas de Dispersão
Amplitude = Max – Min
Amplitude InterQuartil (AIQ) = Q3 – Q1
A AIQ é resistente a outliers, já a amplitude não é.
Estatística: Revelando o poder dos dados Lock5
Comparando Estatísticas
Medidas do Centro: Média (não resistente) Mediana (resistente)
Medidas de Dispersão: Desvio padrão (não resistente) AIQ (resistente) Amplitude (não resistente)
Na maioria das vezes, usamos a média e o desvio padrão, porque eles são calculados com base em todos os valores de dados, portanto, usa todas as informações disponíveis.
Estatística: Revelando o poder dos dados Lock5
Percentis
O Pésimo percentil é o valor que é maior que P% dos dados
Nós já usamos z-scores para determinar se uma pontuação SAT de 2100 ou uma pontuação ACT de 28 é melhor
Nós também poderíamos ter usado percentis: Escore ACT de 28: 91º percentil Escora SAT de 2100: 97º percentil
Estatística: Revelando o poder dos dados Lock5
Resumo dos Cinco Números
Resumo dos cinco números:
Min MaxQ1 Q3m
25% 25% 25% 25%
0º percentil
100º percentil
50º percentil
75º percentil
25º percentil
Estatística: Revelando o poder dos dados Lock5
Estimando Valores
Baseado neste histograma de alturas, estimar: A média O desvio padrão O resumo dos cinco números O 10º percentil
n = 356
Estatística: Revelando o poder dos dados Lock5
Resumo: Uma Variável Quantitativa Estatísticas Resumo
Centro: média, mediana Dispersão: desvio padrão, amplitude, AIQ Percentis Resumo dos cinco números
Visualização Gráfico de pontos Histograma
Outros Conceitos Forma: simétrica, assimétrica, em forma de sino Outliers, robustez Escores z
Top Related