Bioestatística .3 · 8 29 ABELAST abTela de frequência para variável raça São ideais para...

31

Transcript of Bioestatística .3 · 8 29 ABELAST abTela de frequência para variável raça São ideais para...

Page 1: Bioestatística .3 · 8 29 ABELAST abTela de frequência para variável raça São ideais para resumir variáveis qualitativas e quantitativas discreta desde que esta última tenha

Universidade Estadual de Maringá

Mestrado Acadêmico em Bioestatística

Bioestatística

Isolde Previdelli

[email protected]

[email protected]

07 de Março 2017

Page 2: Bioestatística .3 · 8 29 ABELAST abTela de frequência para variável raça São ideais para resumir variáveis qualitativas e quantitativas discreta desde que esta última tenha

129

Sumário

APRESENTAÇÃO DOS DADOSAnálise descritivaTipos de variáveisTabelas de frequênciasTabelas de frequênciasGrá�cosTabelas de frequênciasGrá�cosMedidas de resumo numérico

Isolde Previdelli | Bioestatística

Page 3: Bioestatística .3 · 8 29 ABELAST abTela de frequência para variável raça São ideais para resumir variáveis qualitativas e quantitativas discreta desde que esta última tenha

2

29

APRESENTAÇÃO DOS DADOS

Análise descritiva

Análise descritiva é primeiro contato do pesquisador com os dados

Principal objetivo é explorar, resumir e sumarizar o comportamento dos

dados.

Tabelas de frequências, grá�cos e medidas de resumo numérico.

Isolde Previdelli | Bioestatística

Page 4: Bioestatística .3 · 8 29 ABELAST abTela de frequência para variável raça São ideais para resumir variáveis qualitativas e quantitativas discreta desde que esta última tenha

3

29

TIPOS DE VARIÁVEIS

Variável qualitativa

Nominal - São categorias que não podem ser ordenadas.

Exemplo: Sexo, condição de saúde de um paciente, bairro, etc

Ordinal - São categorias que seguem uma ordem natural.

Exemplo: Grau de instrução, intensidade de maratonista, gravidade de umadoença, etc.

Isolde Previdelli | Bioestatística

Page 5: Bioestatística .3 · 8 29 ABELAST abTela de frequência para variável raça São ideais para resumir variáveis qualitativas e quantitativas discreta desde que esta última tenha

4

29

TIPOS DE VARIÁVEIS

Variável quantitativa

Discreta - Seu campo de variação é um conjunto �nito ou in�nito enumerável,

em geral são contagens.Exemplo: Quantidade de pacientes com determinada doença, número de ovosdo mosquito aedes aegypti em uma determinada região, etc

Contínua - Seu campo de variação é um conjunto in�nito não-enumerável

Exemplo: peso, altura e pressão sistólica de pacientes, etc.

Isolde Previdelli | Bioestatística

Page 6: Bioestatística .3 · 8 29 ABELAST abTela de frequência para variável raça São ideais para resumir variáveis qualitativas e quantitativas discreta desde que esta última tenha

5

29

TIPOS DE VARIÁVEIS

Rank/Posto - Rank pode ser de�nido como o número que corresponde a

posição de cada observação de uma amostra de valores.Exemplo: Uma amostra com os valores 0, 1, 2, 2, 2, 4, 6.Os ranks para esta amostra: 1,2,4,4,4,5,6

Porcentagem - É a proporção de indivíduos pertencentes a uma categoria e o

número total de indivíduos considerados na amostra simples.Exemplo: número de óbitos por acidentes de trânsito por faixa etária em umregião divido pelo total de óbitos por acidentes de trânsito.

Isolde Previdelli | Bioestatística

Page 7: Bioestatística .3 · 8 29 ABELAST abTela de frequência para variável raça São ideais para resumir variáveis qualitativas e quantitativas discreta desde que esta última tenha

6

29

TIPOS DE VARIÁVEIS

Taxas - número de casos de um resultado de interesse que ocorre em um

determinado período de tempo dividido pelo tamanho da população nesseperíodo.Exemplo: Razão entre o número total de óbitos de uma determinada regiãoem um determinado período de tempo dividido pela população total destaregião no mesmo período de tempo.

Escores - é uma pontuação dadas aos indivíduos de uma amostra para mensuar

determinado risco ou chance que ocorrer um determinado evento de interesse.Exemplo: atendimento em um pronto socorro que após algumas informaçõesserem coletadas, cada índivíduo recebe um escore e desta forma seuatendimento é classi�cado como urgente, pouco urgente ou sem urgência.

Isolde Previdelli | Bioestatística

Page 8: Bioestatística .3 · 8 29 ABELAST abTela de frequência para variável raça São ideais para resumir variáveis qualitativas e quantitativas discreta desde que esta última tenha

7

29

TIPOS DE VARIÁVEIS

Variáveis latentes - São variáveis não observáveis ou que não podem ser

medidas diretamente. Desta forma são criadas escalas para poder mensurá-las.

Exemplo: Variáveis que representam sentimentos como felicidade ou depressãoque podem ser medidas através de instrumentos analíticos psicológicos.

Isolde Previdelli | Bioestatística

Page 9: Bioestatística .3 · 8 29 ABELAST abTela de frequência para variável raça São ideais para resumir variáveis qualitativas e quantitativas discreta desde que esta última tenha

8

29

TABELAS

Tabela de frequência para variável raça

São ideais para resumir variáveis qualitativas e quantitativas discreta desdeque esta última tenha um conjunto pequeno de valores diferentes.

Raça Freq. Abs.(ni ) Freq. Rel.(fi )Branca 96 0,508Afro-americana 26 0,138Outras 67 0,354Total(n) 189 1

Tabela: SHAHBABA B., pág.23

ni : frequência absoluta da classen: total da amostrafi = ni

n, frequência relativa da classe

Isolde Previdelli | Bioestatística

Page 10: Bioestatística .3 · 8 29 ABELAST abTela de frequência para variável raça São ideais para resumir variáveis qualitativas e quantitativas discreta desde que esta última tenha

9

29

TABELASExemplo

Tabela de frequência para uma variável quantitativa

Considere um experimento em que foi envestigado em uma amostra de vintee um pacientes de uma clínica médica, se o aumento da a ingestão de cálcioaumenta a pressão arterial:

Nível Freq. Abs.(ni ) Freq. Rel.(fi )95`100 3 0,14100`105 4 0,19105`110 1 0,05110`115 6 0,29115`120 3 0,14120`125 3 0,14125`130 0 0,00130`135 1 0,05

Tabela: http://www.ics.uci.edu/~babaks/BWR/Home_files/calcium.txt

Isolde Previdelli | Bioestatística

Page 11: Bioestatística .3 · 8 29 ABELAST abTela de frequência para variável raça São ideais para resumir variáveis qualitativas e quantitativas discreta desde que esta última tenha

10

29

HISTOGRAMAExemplo

Histograma do exemplo anterior

pressão arterial

Fre

quên

cia

01

23

45

6

95 100 105 110 115 120 125 130 135

Figura: Normal

Isolde Previdelli | Bioestatística

Page 12: Bioestatística .3 · 8 29 ABELAST abTela de frequência para variável raça São ideais para resumir variáveis qualitativas e quantitativas discreta desde que esta última tenha

11

29

TABELASExemplo

Tabela de frequência para uma variável quantitativa

E se juntarmos as três últimas classes? Como �caria a tabela de frequência?

Nível Freq. Abs.(ni ) Freq. Rel.(fi )95`100 3 0,14100`105 4 0,19105`110 1 0,05110`115 6 0,29115`120 3 0,14120`135 4 0,19

Tabela: http://www.ics.uci.edu/~babaks/BWR/Home_files/calcium.txt

Isolde Previdelli | Bioestatística

Page 13: Bioestatística .3 · 8 29 ABELAST abTela de frequência para variável raça São ideais para resumir variáveis qualitativas e quantitativas discreta desde que esta última tenha

12

29

HISTOGRAMAExemplo

E o novo Histograma?

Histograma do exemplo anterior

pressão arterial

Fre

quên

cia

01

23

45

6

95 100 105 110 115 120 125 130 135

Figura: Normal

Isolde Previdelli | Bioestatística

Page 14: Bioestatística .3 · 8 29 ABELAST abTela de frequência para variável raça São ideais para resumir variáveis qualitativas e quantitativas discreta desde que esta última tenha

13

29

Medidas de resumo numérico

Medidas de resumo numérico

Tendência central

Dispersão

Separatrizes

Assimetria e curtose

Isolde Previdelli | Bioestatística

Page 15: Bioestatística .3 · 8 29 ABELAST abTela de frequência para variável raça São ideais para resumir variáveis qualitativas e quantitativas discreta desde que esta última tenha

1429

Medidas de Tendência Central

Média aritmética

Indica o valor em torno do qual há um equilíbrio na distribuição dos

dados:

x =n∑

i=1

xi

n

obs: x + K = x + K

obs: x ∗ K = x ∗ K

Isolde Previdelli | Bioestatística

Page 16: Bioestatística .3 · 8 29 ABELAST abTela de frequência para variável raça São ideais para resumir variáveis qualitativas e quantitativas discreta desde que esta última tenha

15 29

Medidas de Tendência Central

Mediana e Moda

Mediana: É valor central em um conjunto de dados ordenado:

Moda: É o valor mais frequente em um conjunto de dados

Isolde Previdelli | Bioestatística

Page 17: Bioestatística .3 · 8 29 ABELAST abTela de frequência para variável raça São ideais para resumir variáveis qualitativas e quantitativas discreta desde que esta última tenha

16

29

Medidas de Dispersão

Amplitude total

É a diferença entre o valor máximo e mínimo

∆ = x(max.) − x(min.)

Isolde Previdelli | Bioestatística

Page 18: Bioestatística .3 · 8 29 ABELAST abTela de frequência para variável raça São ideais para resumir variáveis qualitativas e quantitativas discreta desde que esta última tenha

17

29

Medidas de Dispersão

Desvio médio absoluto

É o cálculo da média dos desvios absolutos.

dma =n∑

i=1

| xi − xobs |n

Isolde Previdelli | Bioestatística

Page 19: Bioestatística .3 · 8 29 ABELAST abTela de frequência para variável raça São ideais para resumir variáveis qualitativas e quantitativas discreta desde que esta última tenha

18

29

Medidas de Dispersão

Variância

Quanti�ca a variabilidade dos dados em torno da média.

s2 =

n∑i=1

(xi − x)2

n − 1

obs: s2 + K = s2

obs: s2 ∗ K = s2 ∗ K 2

Isolde Previdelli | Bioestatística

Page 20: Bioestatística .3 · 8 29 ABELAST abTela de frequência para variável raça São ideais para resumir variáveis qualitativas e quantitativas discreta desde que esta última tenha

19

29

Medidas de Dispersão

Desvio Padrão

Quanti�ca a variabilidade dos dados na mesma escala em que eles foram

medidos.

s =√

Var(x) =

√√√√ n∑i=1

(xi − x)2

n − 1

Isolde Previdelli | Bioestatística

Page 21: Bioestatística .3 · 8 29 ABELAST abTela de frequência para variável raça São ideais para resumir variáveis qualitativas e quantitativas discreta desde que esta última tenha

20

29

Medidas de Dispersão

Coe�ciente de variação

É uma medida relativa que avalia o percentual de variabilidade em

relação a média observada.

cv = 100s

x

Isolde Previdelli | Bioestatística

Page 22: Bioestatística .3 · 8 29 ABELAST abTela de frequência para variável raça São ideais para resumir variáveis qualitativas e quantitativas discreta desde que esta última tenha

21

29

Exemplo

SHAHBABA B., pág.33

Considere a seguinte amostra:x1 = (74, 80, 79, 85, 81), a média é:

x1 = 79, 8

Se trocarmos o valor 74 por 47, x2 = (47, 80, 79, 85, 81)? O que

acontece?

A média muda para x2 = 74, 4.

Esse novo valor resume bem os dados?

A mediana de de x1 e x2 é igual a 80, ou seja, é uma medida mais

robusta a outliers.

Isolde Previdelli | Bioestatística

Page 23: Bioestatística .3 · 8 29 ABELAST abTela de frequência para variável raça São ideais para resumir variáveis qualitativas e quantitativas discreta desde que esta última tenha

22

29

Exemplo

SHAHBABA B., pág.35

Considere agora duas amostras sobre medidas da pessão do sangue

(mmHg) para dois tipos de pacientes:

Paciente A, x = (95, 98, 96, 95, 96)

Paciente B, y = (85, 106, 88, 105, 96)

As médias são iguais: x = y = 96

As medianas também são iguais: x = y = 96

Isolde Previdelli | Bioestatística

Page 24: Bioestatística .3 · 8 29 ABELAST abTela de frequência para variável raça São ideais para resumir variáveis qualitativas e quantitativas discreta desde que esta última tenha

23

29

Exemplo

SHAHBABA B., pág.35

Paciente A Paciente Bxi xi − x (xi − x)2 yi yi − y (yi − y)2

95 -1 1 85 -11 12198 2 4 106 10 10096 0 0 88 -8 6495 -1 1 105 9 8196 0 0 96 0 0∑

0 6∑

0 367

s2x 2 = 6

4= 1, 5 s2y = 367

4= 91, 5

sx =√

(1, 5) = 1, 22 sy =√91, 5 = 9, 56

Isolde Previdelli | Bioestatística

Page 25: Bioestatística .3 · 8 29 ABELAST abTela de frequência para variável raça São ideais para resumir variáveis qualitativas e quantitativas discreta desde que esta última tenha

24

29

Separatrizes

Percentis, Decis e Quartis

São medidas que dividem os dados em um número de partes iguais.

Isolde Previdelli | Bioestatística

Page 26: Bioestatística .3 · 8 29 ABELAST abTela de frequência para variável raça São ideais para resumir variáveis qualitativas e quantitativas discreta desde que esta última tenha

25

29

SeparatrizesBoxplot

Isolde Previdelli | Bioestatística

Page 27: Bioestatística .3 · 8 29 ABELAST abTela de frequência para variável raça São ideais para resumir variáveis qualitativas e quantitativas discreta desde que esta última tenha

26

29

Assimetria

Assimetria

Analisa a proximidade ou o afastamento de um conjunto de dados em relaçãoà distribuição Gaussiana.

As =µ3σ3

Se As = 0, distribuição é simétrica

Se As > 0, distribuição assimétrica a direita (positiva)

Se As < 0, distribuição assimétrica a esquerda (negativa)

Isolde Previdelli | Bioestatística

Page 28: Bioestatística .3 · 8 29 ABELAST abTela de frequência para variável raça São ideais para resumir variáveis qualitativas e quantitativas discreta desde que esta última tenha

27

29

Assimetria

Isolde Previdelli | Bioestatística

Page 29: Bioestatística .3 · 8 29 ABELAST abTela de frequência para variável raça São ideais para resumir variáveis qualitativas e quantitativas discreta desde que esta última tenha

2829

Curtose

Assimetria

caracterizar a forma da distribuição quanto ao seu achatamento.

k =µ4σ4

k < 0, distribuição Platicúrtica

k = 0, distribuição Mesocúrtica

k > 0, distribuição Leptocúrtica

Isolde Previdelli | Bioestatística

Page 30: Bioestatística .3 · 8 29 ABELAST abTela de frequência para variável raça São ideais para resumir variáveis qualitativas e quantitativas discreta desde que esta última tenha

2929

Curtose

−4 −2 0 2 4

0.0

0.1

0.2

0.3

0.4

0.5

Exemplos curtose

x

f(x)

κ1κ2κ3

= −0.594= 0= 2

Isolde Previdelli | Bioestatística

Page 31: Bioestatística .3 · 8 29 ABELAST abTela de frequência para variável raça São ideais para resumir variáveis qualitativas e quantitativas discreta desde que esta última tenha

Obrigada!