Estatística e Probabilidade 6 - Medidas de Tendências Central/Posição
Medidas de Posição e de Variabilidade
-
Upload
leonilda-oliveira-sales -
Category
Documents
-
view
227 -
download
0
description
Transcript of Medidas de Posição e de Variabilidade
![Page 1: Medidas de Posição e de Variabilidade](https://reader034.fdocumentos.tips/reader034/viewer/2022051000/563db790550346aa9a8c35ef/html5/thumbnails/1.jpg)
André Jalles
Departamento de Estatística e Matemática Aplicada
![Page 2: Medidas de Posição e de Variabilidade](https://reader034.fdocumentos.tips/reader034/viewer/2022051000/563db790550346aa9a8c35ef/html5/thumbnails/2.jpg)
Sumarização de dadosMedidas Proporção: medida que proporciona a comparação entre
distribuições de frequência com tamanhos amostraisdiferentes.
Pessoas de 18 a 24 anos de idade, por nível de instrução,segundo a situação do domicílio e gênero, Estado do ceará 2010
Nível de instrução Urbana Rural
Homens Percentual Mulheres Percentual Homens Percentual Mulheres Percentual
Sem instrução e fundamental incompleto 118.425 28,0% 89.497 20,2% 63.520 45,1% 41.168 32,4%
Fundamental completo e médio incompleto 119.796 28,3% 118.500 26,7% 45.235 32,1% 41.829 32,9%
Médio completo e superior incompleto 176.907 41,8% 221.604 50,0% 31.550 22,4% 43.070 33,9%
Superior completo 7.744 1,8% 13.780 3,1% 421 0,3% 1.035 0,8%
Total 422.872 100% 443.381 100% 140.726 100% 127.102 100%
Fonte: SIDRA/IBGE, Censo 2010
![Page 3: Medidas de Posição e de Variabilidade](https://reader034.fdocumentos.tips/reader034/viewer/2022051000/563db790550346aa9a8c35ef/html5/thumbnails/3.jpg)
Sumarização de dadosMedidas Razão: medida que proporciona a comparação de algum fenômeno
entre categorias distintas.
Pessoas de 18 anos ou mais de idade que costumam consumir bebidaalcoólica uma vez ou mais por mês, por gênero e UF-NE, ano 2013.
UF Masculino Feminino total Razão
Alagoas 354 122 476 2,90
Bahia 2.247 1.004 3251 2,24
Ceará 1.062 306 1368 3,47
Maranhão 750 258 1008 2,91
Paraíba 357 127 484 2,81
Pernambuco 1.145 444 1589 2,58
Piauí 431 154 585 2,80
Rio Grande do Norte 435 129 564 3,37
Sergipe 309 98 407 3,15
Fonte: SIDRA/IBGE
![Page 4: Medidas de Posição e de Variabilidade](https://reader034.fdocumentos.tips/reader034/viewer/2022051000/563db790550346aa9a8c35ef/html5/thumbnails/4.jpg)
Sumarização de dadosMedidasVariável quantitativa
{x1,x2,x3,...,xn}, Amostra com nobservações de uma variávelquantitativa.
![Page 5: Medidas de Posição e de Variabilidade](https://reader034.fdocumentos.tips/reader034/viewer/2022051000/563db790550346aa9a8c35ef/html5/thumbnails/5.jpg)
Medidas de posição (localização)
Média aritmética: localiza o “centro degravidade” dos dados
Fórmula: (x1+x2+x3+...+xn)/n
Exemplo: (1+2+3+5+9)/5 = 4
Deficiência: sensível a valoresextremos.
![Page 6: Medidas de Posição e de Variabilidade](https://reader034.fdocumentos.tips/reader034/viewer/2022051000/563db790550346aa9a8c35ef/html5/thumbnails/6.jpg)
Medidas de posição (localização)
Média Geométrica: localiza o “centro”
de dados geométricos.
Fórmula: (x1×x2×x3×... ×xn)1/n
Exemplo: (2×4x8x32x512)1/5
= 16
Deve ser utilizada para dados
geométricos (Exemplo: inflação)
![Page 7: Medidas de Posição e de Variabilidade](https://reader034.fdocumentos.tips/reader034/viewer/2022051000/563db790550346aa9a8c35ef/html5/thumbnails/7.jpg)
Medidas de posição (localização)Mediana: localiza o valor que divide osdados em dois grupos de tamanhos“iguais”.
Exemplo: {1,2,3,5,9}, Mediana = 3
Fórmula:
n ímpar: x(n+1)/2
n par: (xn/2+xn/2+1)/2Geral: x(n+1)/2
![Page 8: Medidas de Posição e de Variabilidade](https://reader034.fdocumentos.tips/reader034/viewer/2022051000/563db790550346aa9a8c35ef/html5/thumbnails/8.jpg)
Medidas de posição: Quartis
Q1- primeiro quartil: divide os dadosem duas partes, uma com 25% e outracom 75% das observações.
Q2- segundo quartil: Mediana
Q3- terceiro quartil: divide os dados emduas partes, uma com 75% e outra com25% das observações.
![Page 9: Medidas de Posição e de Variabilidade](https://reader034.fdocumentos.tips/reader034/viewer/2022051000/563db790550346aa9a8c35ef/html5/thumbnails/9.jpg)
Medidas de posição: QuartisExemplo: {1,2,3,5,9}
Q1=2
Q3=5
![Page 10: Medidas de Posição e de Variabilidade](https://reader034.fdocumentos.tips/reader034/viewer/2022051000/563db790550346aa9a8c35ef/html5/thumbnails/10.jpg)
Medidas de posição (localização)Moda: valor mais frequente. Valor quemais se repete. Valor que representa olocal de maior densidade dos dados,cuja vizinhança é mais “povoada” comdados.
Exemplo: {1,2,3,5,9}, Moda = 2
![Page 11: Medidas de Posição e de Variabilidade](https://reader034.fdocumentos.tips/reader034/viewer/2022051000/563db790550346aa9a8c35ef/html5/thumbnails/11.jpg)
Medidas de posição (localização)Exemplo: {1,2,3,5,9}
0 1 2 3 4 5 6 7 8 9
Moda Média
Mediana
![Page 12: Medidas de Posição e de Variabilidade](https://reader034.fdocumentos.tips/reader034/viewer/2022051000/563db790550346aa9a8c35ef/html5/thumbnails/12.jpg)
Variável quantitativa {x1,x2,x3,...,xn}, Amostra com n observações de uma variávelquantitativa.
Uma medida do centro isolada não é adequada para descreverdados numericamente para uma variável quantitativa. Eladescreve um valor típico, mas não a dispersão dos dados em tornodo valor típico. (Agreste,A e Finlay,B. Métodos Est. Para as C. Sociais)
A dispersão de conjunto de dados é a variabilidade que os dadosapresentam entre si. Se todos os valores forem iguais, não hádispersão; se os dados não são iguais, existe dispersão entre osdados. A dispersão é pequena quando os valores são próximos unsdos outros. Se os valores são muito diferentes entre si, a dispersãoé grande, assim, as medidas de dispersão apresentam o grau deagregação dos dados. (Waldir Medri, ANÁLISE EXPLORATÓRIA DE DADOS )
![Page 13: Medidas de Posição e de Variabilidade](https://reader034.fdocumentos.tips/reader034/viewer/2022051000/563db790550346aa9a8c35ef/html5/thumbnails/13.jpg)
Medidas de dispersão (variabilidade)
Medida possível de variabilidade dos
dados
Amplitude dos dados: Máximo - Mínimo
Exemplo: {1,2,3,5,9}
9 – 1 = 8
![Page 14: Medidas de Posição e de Variabilidade](https://reader034.fdocumentos.tips/reader034/viewer/2022051000/563db790550346aa9a8c35ef/html5/thumbnails/14.jpg)
Medidas de dispersão (variabilidade)
Medida possível de variabilidade dos
dados
Distância interquartílica: Q3 – Q1
Exemplo: {1,2,3,5,9}
5 – 2 = 3
![Page 15: Medidas de Posição e de Variabilidade](https://reader034.fdocumentos.tips/reader034/viewer/2022051000/563db790550346aa9a8c35ef/html5/thumbnails/15.jpg)
Medidas de dispersão (variabilidade)
Média aritmética: localiza o “centro de
gravidade” dos dados. Qual é a sua
representatividade?
Medida possível do “custo”: Distância
quadrática média dos dados à média
Variância: Fórmula (m=média aritmética)
((x1-m)2+(x2-m)
2+...+(xn-m)
2)/(n-1)
Exemplo
((1-4)2+(2-4)
2+(3-4)
2+(5-4)
2+(9-4)
2)/4 = 10
![Page 16: Medidas de Posição e de Variabilidade](https://reader034.fdocumentos.tips/reader034/viewer/2022051000/563db790550346aa9a8c35ef/html5/thumbnails/16.jpg)
Menor soma quadrática
n
xn
x
n
x
mm
n
xnxxm
mfa
acbbx
xfcbxaxxf
nmxmxmxmf
i
ii
iii
iii
2
2
2
2
2
2
''
2
442'
:se ,0)'( modo, desse ,2
4'
:se 0,)'( .)(
2)(
21
22
2
2
222
![Page 17: Medidas de Posição e de Variabilidade](https://reader034.fdocumentos.tips/reader034/viewer/2022051000/563db790550346aa9a8c35ef/html5/thumbnails/17.jpg)
Medidas de dispersão (variabilidade)
Problemas da variância: unidade de
medida quadrática
Desvio-Padrão: raiz da Variância
Exemplo
raiz((1-4)2+(2-4)
2+(3-4)
2+(5-4)
2+(9-4)
2)/4
= raiz(10) 3,16
![Page 18: Medidas de Posição e de Variabilidade](https://reader034.fdocumentos.tips/reader034/viewer/2022051000/563db790550346aa9a8c35ef/html5/thumbnails/18.jpg)
O que o Desvio Padrão representa
![Page 19: Medidas de Posição e de Variabilidade](https://reader034.fdocumentos.tips/reader034/viewer/2022051000/563db790550346aa9a8c35ef/html5/thumbnails/19.jpg)
Medidas de dispersão (variabilidade)
Mediana: localiza o valor que divide os
dados em dois grupos de tamanhos
“iguais”.
Desvio Médio: Distância linear média
entre as observações e a mediana
Exemplo
(|1-3|+|2-3|+|3-3|+|5-3|+|9-3|)/5=11/5=2,2
![Page 20: Medidas de Posição e de Variabilidade](https://reader034.fdocumentos.tips/reader034/viewer/2022051000/563db790550346aa9a8c35ef/html5/thumbnails/20.jpg)
Mínima soma linear
![Page 21: Medidas de Posição e de Variabilidade](https://reader034.fdocumentos.tips/reader034/viewer/2022051000/563db790550346aa9a8c35ef/html5/thumbnails/21.jpg)
Medidas de dispersão (variabilidade)
Problemas do desvio-padrão: a
unidade de medida influencia o valor
Coeficiente de variação: S/média
Adimensional
Exemplo: 3,16/ 4 0,7906
![Page 22: Medidas de Posição e de Variabilidade](https://reader034.fdocumentos.tips/reader034/viewer/2022051000/563db790550346aa9a8c35ef/html5/thumbnails/22.jpg)
Medidas de assimetria
Medida de afastamento da simetria dos
dados, ou grau de deformação da
distribuição dos dados
Comparação entre medidas de tendência
central
Coeficiente de Pearson:
Sk = 3(média-mediana)/S
= 3(4-3)/3,16 0,9487
![Page 23: Medidas de Posição e de Variabilidade](https://reader034.fdocumentos.tips/reader034/viewer/2022051000/563db790550346aa9a8c35ef/html5/thumbnails/23.jpg)
Medidas de assimetria
Medida de afastamento da simetria dos
dados, ou grau de deformação da
distribuição dos dados
Comparação entre medidas de tendência
central
Coeficiente quartil de assimetria
eQ = ((Q3-Q2)-(Q2-Q1))/(Q3-Q1)
=((5-3)-(3-2))/(5-2) 0,3333