Medidas de tendência central e de dispersão

Post on 19-Oct-2021

0 views 0 download

Transcript of Medidas de tendência central e de dispersão

MEDIDAS DE TENDÊNCIA

CENTRAL E VARIABILIDADE

Bioestatística e Delineamento Experimental - 2013

Carolina Coll

Tópicos da aula

Frequência absoluta e relativa

Medidas de tendência central e variabilidade

Variáveis contínuas: distribuição normal

Amostra

Relembrando... tipos de variáveis

Dicotômicas

Politômicas

Nominais

(ordem não importa)

Ordinais

(tem uma ordem lógica)

Discretas

(números inteiros)

Contínuas

(aceitam decimais) Cor da pele,

estado civil...

NSE, estágio

desenvolvimento de

um tumor...

“CONTAGENS”

Nº filhos, nº de

células... “MEDIDAS”

Peso, pressão

arterial,

glicose...

Por que sumarizar dados?

Por que sumarizar dados?

Por que sumarizar dados?

Distribuição de frequência

Descrição de uma variável categórica

Cálculo de proporções

Divisão de um número por outro, onde o numerador está

contido (é subconjunto) no denominador

Exemplo: Desnutrição: sim /não

Em 100 crianças, 20 estão desnutridas (20%)

Frequência absoluta e relativa

Tabela. Distribuição de idosos segundo concentração sanguínea

de vitamina D. São Paulo, 2012.

Concentração de vitamina D no sangue n %

Aceitável 20 40 Insuficiente 30 60 Deficiente 0 0

Total 50 100

Distribuição de frequência

Descrição de uma variável numérica

Tabela que mostra um número de observações ou

valores dentro de certos intervalos

Distribuição de frequência: variável “discreta”

Número de gravidezes das mães da coorte de 2004. Pelotas, RS (n=6000)

Número de gravidez Frequência (n) %

1 2092 34,9

2 1644 27,4

3 970 16,1

4 544 9,1

5 282 4,7

6 168 2,8

7 105 1,8

8 69 1,2

9 48 0,8

10 39 0,7

11 20 0,3

12 11 0,1

13 8 0,1

Distribuição de frequência: variável “discreta”

Número de gravidez das mães da coorte de 2004. Pelotas, RS (n=6000)

Número de gravidezes Frequência (n) %

1 2092 34,9

2 1644 27,4

3 970 16,1

≥4 1294 21,6

Distribuição de frequência: variável “contínua”

Peso ao nascer das crianças da coorte de 2004. Pelotas, RS (n=4555)

Peso ao nascer (gramas) Frequência %

<1000 52 1,1

1000-1499 43 0,9

1500-1999 98 2,2

2000-2499 305 6,7

2500-2999 1112 24,4

3000-3499 1747 38,3

3500-3999 976 21,5

4000 222 4,9

...

... mas para variáveis contínuas queremos descrever

os dados de forma ainda mais sucinta!

Medidas de tendência central

Medidas de posição

Medidas de variabilidade (dispersão)

Descrição de variáveis numéricas

MÉDIA

MEDIANA

MODA

AMPLITUDE

INTERVALO INTERQUARTIL

VARIÂNCIA

DESVIO PADRÃO

TERCIL

QUARTIL

QUINTIL

PERCENTIL

Medidas de tendência central

Média

Moda

Mediana

Medidas de tendência central

Média

É a soma dos valores de uma variável dividido pelo número

de valores

xi: valor de cada indivíduo

∑: somatória

n: total de indivíduos

x

x

n

i

i

n

1 Vantagem:

Utiliza TODOS os

valores da distribuição

Desvantagem:

É influenciada por

valores extremos

1,80

1,70

1,60

1,50

1,90

Média

Altura média = (1,50+1,60+1,70+1,80+1,90)/5 = 1,70 m

Média

É válida quando a distribuição dos dados é simétrica

em torno dos valores da média

153,9

110 134 149 161 165 178 180

141,3

100 110 115 125 134 200 205

Medidas de tendência central

Moda

Valor que mais se repete na amostra (na distribuição)

1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 4, 8, 9, 9

Moda: 2

Não tem muita utilidade!!!

Medidas de tendência central

Mediana

Valor que divide a distribuição ao meio

1º passo: ordenar os dados de menor a maior

2º passo: ver qual valor ocupa o “meio” da distribuição

Se...

Número ímpar de dados: valor do meio

1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 4, 8, 9, 9

Número par de dados: média dos dois do meio

1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 4, 8, 9, 9

Fórmula:

(n + 1)/2

Mediana

1,80

1,70

1,60

1,50

1,90

Quando número de observações (n) for ímpar...

Quando número de observações (n) for par...

Mediana =

= (1,70+1,80)/2 =

= 1,75 metros

Mediana

1,80

1,70

1,60

1,50

1,90

2,00

Média x Mediana

Semelhantes para distribuições simétricas: Peso ao nascer

Média: 3131 g

Mediana: 3180 g

Distantes para distribuições assimétricas: Renda familiar

Média: R$ 791

Mediana: R$ 500

Então...

Qual medida de tendência central usar?

MÉDIA ou MEDIANA?

Mediana x Média: peso ao nascer

Distribuição simétrica

0

50

01

00

01

50

02

00

0

n

1000 2000 3000 4000 5000 6000Peso ao nascer

Média: 3131 gramas; Mediana: 3180 gramas

Média

Mediana x Média: renda familiar

Distribuição assimétrica 0

10

00

20

00

30

00

n

0 5000 10000 15000 20000Renda famil iar (reais)

Média: R$ 791; Mediana: R$ 500

Mediana

Mediana x Média: motilidade espermática

Medidas de dispersão (variabilidade)

153,9

110 134 149 161 165 178 180

153,5

98 105 198 213

A média é semelhante, mas a dispersão....

Medidas de dispersão (variabilidade)

Várias maneiras de medir a dispersão

Amplitude (maior - menor)

Amplitude interquartil (p75 - p25)

Variância

Desvio padrão

Medidas de dispersão (variabilidade)

Amplitude

Valor maior – valor menor

Apenas considera os valores extremos

Ex: 5 medidas de glicemia em mmol/l

80; 85; 88; 90; 500

Amplitude: 500-80=480

Medidas que se distanciam muito das demais influenciam

muito a amplitude

Medidas de dispersão (variabilidade)

Amplitude interquartil

Percentil 75 – percentil 25

Considera apenas a parte central dos valores de um

conjunto de dados

Joga fora os valores mais altos e os mais baixos

Não influenciada pelos valores discrepantes

Medidas de dispersão (variabilidade)

Variância (S2)

Boas propriedades estatísticas

Usa todas as observações

É uma medida dos “desvios” (ao quadrado) de cada

observação em relação à média

Pq ao quadrado?

Unidade de medida ao quadrado difícil interpretação

Medidas de dispersão (variabilidade)

Desvio padrão (S)

É a raiz quadrada da variância

Quanto mais próximos os valores individuais estiverem de

sua média, < a dispersão e < o desvio-padrão

Muito útil para distribuições dos dados aproximadamente

normais

Medidas de posição

Percentis (dividem os dados em 100 partes iguais)

Percentil 10, percentil 50, percentil 99...

Quartis

Primeiro, segundo, terceiro, quarto quartil

Quintil

Primeiro, segundo, terceiro, quarto, quinto quintil

Percentis de peso ao nascer

. su peson,d

peso ao nascer em gramas

-------------------------------------------------------------

Percentiles Smallest

1% 1950 1100

5% 2340 1490

10% 2570 1550 Obs 962

25% 2870 1570 Sum of Wgt. 962

50% 3180 Mean 3200.639

Largest Std. Dev. 511.0475

75% 3510 4690

90% 3830 4700 Variance 261169.5

95% 4050 4700 Skewness -.1061833

99% 4450 4880 Kurtosis 3.579037

Estatística descritiva

Medidas de ocorrência

• Frequência ou porcentagem

Medidas de tendência central

• Moda

• Média

• Mediana

Medidas de posição

• Quartis, quintis, percentis...

Medidas de dispersão ou variabilidade

• Amplitude

• Variância

• Desvio padrão

Distribuição normal

Ou Gaussiana

Simétrica

Forma de “sino”

É uma distribuição contínua

Descreve bem fenômenos biológicos

5 4 0 0

5 0 0 0

4 6 0 0

4 2 0 0

3 8 0 0

3 4 0 0

3 0 0 0

2 6 0 0

2 2 0 0

1 8 0 0

1 4 0 0

1 0 0 0

6 0 0

1 8

1 6

1 4

1 2

1 0

8

6

4

2

0

S t d . D e v = 5 5 7 . 3 8

M e a n = 3 1 5 2

N = 5 2 5 8 . 0 0

Percentagem

Peso ao nascer

Distribuição normal padrão (propriedades)

1. Qualquer variável com distribuição simétrica

(normal) pode ser relacionada com uma distribuição

normal padrão

Média: zero; DP: 1

... Uso de amostras

O que seria uma amostra? Não é melhor avaliar

toda a população ?

Amostra

Quero conhecer um atributo de uma população (alvo)

Estado nutricional das crianças brasileiras menores de 5 anos

Escolho um grupo para estudar

Crianças menores de 5 anos da cidade de Pelotas

Deste grupo tiro uma amostra

Definição da população

UNIVERSO ou POPULAÇÃO TOTAL

POPULAÇÃO ALVO

AMOSTRA

Amostra: características

1. Representar a população

Equiprobabilidade = representatividade

Todos os indivíduos da população alvo têm a mesma chance de

participar do estudo (de serem sorteados)

POPULAÇÃO ALVO POPULAÇÃO ALVO

Amostra: características

2. Precisão

Amostra de tamanho adequado

Garantir o mínimo de precisão

Garantir a chance de demonstrar uma diferença entre dois

grupos

PODER: probabilidade de encontrar uma diferença quando ela

realmente existe

Quanto maior a amostra, maior o poder

Então, a amostra...

Tem importância pelo que nos conta sobre a

população que representa

A média e o desvio padrão da amostra são usados

para estimar a média e o desvio padrão da

população

s

xamostra

população

Obrigada!

carolinavncoll@gmail.com