Estatística Descritiva Profa Denise Duarte. Medidas de Posição 2 Máximo (max):Máximo (max): a...

Post on 07-Apr-2016

217 views 1 download

Transcript of Estatística Descritiva Profa Denise Duarte. Medidas de Posição 2 Máximo (max):Máximo (max): a...

Estatística Descritiva

Profa Denise Duarte

Medidas de PosiçãoMedidas de Posição

2

•Máximo (max):Máximo (max): a maior observação•Mínimo (min):Mínimo (min): a menor observação•Moda (mo):Moda (mo): é o valor (ou atributo) que ocorre com maior freqüência.

DadosDados: : 4, 5, 4, 6, 5, 8, 4

mo = 4max = 8 min = 4

3

n

x

nxxxxx

n

ii

n

1321 ...

•MédiaMédia::

DadosDados:: 2, 5, 3, 7, 8

55

87352 x

4

• MMediana:ediana:A mediana é o valor da variável que ocupa a posição central de um conjunto de n dados ordenados.

2

Posição da mediana: n+1

5

Exemplos:Exemplos:Dados: Dados: 2, 6, 3, 7, 8

Dados ordenados: 2 3 6 7 8 n n == 55 (ímpar)(ímpar)

Posição da Mediana 5+1 = 3

2

Md = (4 + 6) / 2 = 5

Dados: Dados: 4, 8, 2, 1, 9, 6 nn == 66 (par) (par)Dados ordenados: 1 2 4 6 8 9

Md

6+1 = 3,52

Md=6

O percentil de ordem p 100 (0 < p < 1), em um conjunto de dados de tamanho n, é o valor da variável que ocupa a posição

p (n + 1) do conjunto de dados ordenados.

6

PercentisPercentis::

percentil 50 = mediana ou segundo quartil (Md)percentil 25 = primeiro quartil (Q1)percentil 75 = terceiro quartil (Q3)percentil 10 = primeiro decil

Casos Casos pparticularesarticulares::

7

Md = 3,05

Q1 = 2,05

Q3 = 4,9

Md = 5,3 Q1 = 1,7 Q3 = 12,9

Dados:Dados: 1,9 2,0 2,1 2,5 3,0 3,1 3,3 3,7 6,1 7,7

nn=10=10

Posição de Md: 0,5(n+1)= 0,511= 5,5

Dados:Dados: 0,9 1,0 1,7 2,9 3,1 5,3 5,5 12,2 12,9 14,0 33,6

nn=11=11

Posição de Q1: 0,25 (11) = 2,75Posição de Q3: 0,75 (11) = 8,25

Md = (3 + 3,1)/2 = 3,05 Q1=( 2+2,1)/2=2,05 Q3=(3,7+6,1)/2=4,9

Medidas de Dispersão

Medidas de dispersão, ou medidas devariabilidade, são uma indicação de como os dados estão espalhados em torno do centro.As principais medidas de dispersão são:1. A amplitude2. Interquartis3. Desvio médio4. Variância5. Desvio-padrão6. Coeficiente de variação

9

Grupo 1: Grupo 1: 3,4,5,6,73,4,5,6,7

Grupo 2: 1, 3, 5, Grupo 2: 1, 3, 5, 7, 97, 9

Grupo 3: Grupo 3: 5,5,5,5,55,5,5,5,5

Exemplo Exemplo 22:: Considere as notas de um teste de 3 grupos de alunos

GG 11

* * * * *

GG 22

* * * * *

GG 33

*****

0 105

e md1= md2= md3 = 5Temos: x1 = x2 = x3 = 5

_ _ _ _ _ _

10

Medidas de DispersãoMedidas de DispersãoFinalidade:Finalidade: encontrar um valor que resuma a variabilidade de um conjunto de dados

•Amplitude (Amplitude (AA):):

Para os grupos anteriores, temos:Grupo 1, A = 4Grupo 2, A = 8Grupo 3, A = 0

A = máx - min

1. Amplitude É a diferença entre a maior e a menor medidadentro de um conjunto de dados. É uma medida rude da dispersão, pois leva em conta apenas o menor e o maior dos dados: geralmente a estatística amplitude subestima o parâmetro amplitude. Portanto, a estatística amplitude é uma estimativa pobre do parâmetro amplitude.

3. Desvio médio:Pega-se a diferença entre todos os dados emrelação a média e soma-os em módulo, dividindo em seguida pelo número de dados.

X i X

M édio Desvion

2. Interquartis A distância “interquartil” é a diferença entre oprimeiro e o terceiro quartil. Também é muito utilizado a “amplitude oudesvio semi-quartil”, que seria o interquartil

dividido por 2. Lembre-se que num intervalo igual aointerquartil em torno da mediana estão 50% dos dados.

14

DadosDados: 1,9 2,0 2,1 2,5 3,0 3,1 3,3 3,7 6,1 7,7

Q1 = 2,05 e Q3= 4,9

Q3 - Q1 = 4,9 - 2,05 = 2,85

•Intervalo-InterquartilIntervalo-Interquartil:: É a diferença entre o terceiro quartil e o primeiro quartil, ou seja, QQ3 - 3 - QQ11..

5. Desvio-padrão:– É a raiz quadrada da variância.

– Para dados considerados normais, podemos dizer que70%– 95%– 99%

dosdosdos

dadosdadosdados

então dentro do intervalo .X sX 2

sestão no intervaloestão no intervalo X 3

s

16

n

i

inn

xxn

xxxxxxsVariância1

2222

212

11)()(...)()(

VariânciaPadrãoDesvio s

•Variância:Variância:

•Desvio padrão:Desvio padrão:

17

G3: s2 = 0 s = 0

Cálculo para os grupos:

4GG11: s2 =(3-5)2+(4-5)2+ (5-5)2+ (6-5)2+ (7-5)2

GG22: s2 = 10 s = 3,16

s = 1,58 s2 = 10/4= 2,5

18

Fórmula alternativa:Fórmula alternativa:

Em G1: Xi2 = 9 + 16 + 25 + 36 +49

= 135

1)(

n

1i

n

XnXS

i22

2

4 S2 = 135 - 5(5)2 = 2,5

19

- é uma medida de dispersão relativa- elimina o efeito da magnitude dos dados- exprime a variabilidade em relação à média %100

xsCV

• Coeficiente de Variação Coeficiente de Variação ((CVCV))

20

Altura 1,143m 0,063m 5,5%Peso 50 kg 6kg 12%

Média DesvioPadrão

Coef. de Variação

ConclusãoConclusão: Os alunos são, aproximadamente, duas vezes mais dispersos quanto ao peso do que quanto à altura.

Altura e peso de alunosExemplo Exemplo 3:3:

21

ConclusãoConclusão: Em relação às médias, as alturas dos adolescentes e dos recém-nascidos apresentam variabilidade quase iguais.

Desviopadrão

Coef. devariaçãoMédia

Recém-nascidos 50 6 12%Adolescentes 160 16 10%

Altura (em cm) de uma amostra de recém-nascidos e de uma amostra de adolescentes

Exemplo Exemplo 4:4:

Estatística Descritiva –Diferentes tipos de gráficos

Para a estatística descritiva, podemos citaros seguintes gráficos para a apresentaçãodos dados de maneira resumida e elegante:– Dados contínuos: Histograma, Boxplot, Gráficos de dispersão, Gráficos delinha

– Dados discretos: Gráfico de barras, gráfico de pizzas

Estatística Descritiva –Diferentes tipos de gráficos

Histograma– Para dados contínuos.– Sugestão do no. de caixas: n

Freq

uênc

ia

Histograma (100 dados)40

30

20

10

0-4 -2 0 2 4

Dados

Estatística Descritiva –Diferentes tipos de gráficos

Boxplot:– Para dados contínuos.– Apresenta os pontos “outliers”

Dad

os

Boxplot5,0

2,5

0,560,0 0,00

-0,70

-2,5

-5,0

Box plotBox plot

Limite inferior:  .Limite superior:  .

Variações: menor valor, maior valor

Estatística Descritiva –Diferentes tipos de gráficos

Gráfico deDispersão– Estudar o comportamento de uma variável em função de outra (portanto, temos que ter 2 variáveis).

500,0

400,0

300,0

200,0

100,0

0,0 20,0 40,0

Idade

60,0 80,0

Tem

po d

e ca

min

hada

Estatística Descritiva –Diferentes tipos de gráficos

Gráfico deLinha

7,50

7,00

6,50

6,00

EVA T1 EVA T2 EVA T3

Méd

ia

Gráficode linha com barra de erro8,0

7,5

7,0

6,5

6,0

5,5

5,0

EVA T1 EVA T2 EVA T3

95%

CI

Estatística Descritiva –Diferentes tipos de gráficos

Gráfico de barras– Para apresentar a freqüência de dados qualitativos

Prop

orçã

o (%

)

Distribuição por Sexo70

60

50

40

30

20

10

0Masculino Feminino

SexoMasculino = 92 indiv.; Feminino = 43 indiv.

Gráfico de Pizza:– Também para apresentação de freqüências de dados qualitativos.

Distribuição por Sexo (%)

C ategoriaMasculino

31,8 F eminino

68, 2