1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de...

59
1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados

Transcript of 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de...

Page 1: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

1

BIOESTATÍSTICA

Profª. Lúcia Helena Sagrillo Pimassoni

Unidade 3 Descrição e apresentação de dados

Page 2: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

2

O objetivo é organizar, resumir e apresentar dados, de tal forma que possamos interpretá-los de acordo com os objetivos da pesquisa.

Estatística Descritiva

Dados estatísticos são observações da realidade que nos cerca. Podem ser fatos ou números.

Page 3: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

3

a) Indivíduo ou unidade elementar: é a entidade de base sobre a qual o observador realiza um certo número de medições.

Exemplo: um paciente, um usuário, um empregado, um dente, uma cidade, um país, um eleitor, uma minhoca, etc...

Dados EstatísticosEm um conjuntos de dados, temos os indivíduos e as informações relativas a esses indivíduos, as variáveis. Segue que:

Page 4: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

4

b) Variáveis: conjunto de informações levantadas para cada indivíduo.

Exemplo: no caso de um estudo clínico, os indivíduos seriam os pacientes atendidos e as variáveis seriam o sexo, a idade, pressão d/s, altura, tipo de sangue, número de cáries, etc.

Quanto ao tipo as variáveis podem ser quantitativas e qualitativas.

Dados Estatísticos

A técnica estatística depende do tipo de variável.

Page 5: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

5

Tipos de VariáveisQualitativa: quando seus possíveis valores assumem modalidades não numéricas (categóricas), como sexo, profissão, escolaridade, região, nível hierárquico, etc... Pode ser:

Nominal: são dados que podem ser separados em categorias chamadas de não mensuráveis (cor dos olhos, sexo, região);

Ordinal: envolvem dados que podem ser dispostos em alguma ordem (nível hierárquico, nível de satisfação, grau de escolaridade).

Page 6: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

6

Quantitativa: a característica do elemento observado é uma quantidade (salário, idade, altura, peso, etc... ). Pode ser:

Discreta: assumem valores inteiros. Os dados discretos são resultantes da contagem de um número de itens (número de pacientes internados, etc.);

Contínua: assumem qualquer valor num intervalo de valores. São dados resultantes de medições (taxa de colesterol, peso, altura, etc.).

Tipos de Variáveis

Page 7: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

7

Exemplo de Planilha de DadosIndivíduo VAR 1 VAR2 … VARp

1

2

3

4

n

Page 8: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

8

Exemplo de Planilha de Dados

Page 9: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

9

Os dados qualitativos ou quantitativos discretos podem ser apresentados ou organizados das seguintes maneiras: Tabelas de Freqüências. Gráfico de Barras. Gráfico de Setores.

Apresentação e Organização dos dados: Métodos Tabulares e Métodos gráficos

Ao estudarmos grandes conjuntos de dados, é conveniente organizá-los e resumi-los.

Page 10: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

10

Apresentação e Organização dos dados: Métodos Tabulares e Métodos gráficos

Os dados quantitativos contínuos podem ser apresentados ou organizados das seguintes maneiras: Tabela de freqüências em classes Histogramas Polígono de freqüências Gráfico de linhas

Page 11: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

11

Tabelas de Freqüências

Tabela de Freqüência é uma tabela na qual numa das colunas aparecem os valores observados da variável aleatória e nas demais colunas aparecem as freqüências de ocorrência dos respectivos valores. Essas colunas contém as seguintes freqüências: Freqüência absoluta. Freqüência relativa. Freqüência acumulada absoluta. Freqüência acumulada relativa.

Page 12: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

12

Tabelas de Freqüências

Freqüência absoluta (f) é o número de vezes que cada valor se repete.

Freqüência Relativa (fr) fornece a relação entre a freqüência observada de um determinado valor e o número total de observações realizadas no experimento.

Page 13: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

13

Tabelas de Freqüências

Freqüência acumulada absoluta (Fa): A soma das freqüências absolutas anteriores é chamada freqüência acumulada absoluta.

Freqüência acumulada relativa (Fr): A soma das freqüências absolutas anteriores é chamada freqüência acumulada absoluta.

Page 14: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

14

Tabelas de Freqüências

Exemplo

234 43,4

305 56,6

539 100,0

Tipo de partoNormal

Cesárea

Total

Freqüência %

Tabela 1. Tipo de parto*.

*Amostra de 539 pacientes do Hospital AAAA

Page 15: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

15

Tabelas de Freqüências

Apgar de 5 minutos f fr (%) FA FR (%)1 2 0.4 2 0.43 1 0.2 3 0.65 3 0.6 6 1.26 4 0.7 10 1.97 16 3.0 26 4.98 65 12.1 91 17.09 346 64.7 437 81.7

10 98 18.3 575 100.0Total 535 100.0

Tabela 2. Apgar de 5 minutos*.

*Amostra de 539 pacientes do Hospital AAAA

Page 16: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

16

A Tabela de Freqüências para dados agrupados em classe é constituída da mesma forma que para dados não agrupados, com a diferença de que agora os valores da variável a ser descrita passam a ser organizados por classes.

O nº de classes deve ficar entre 5 e 20. Utilizando intervalos podemos apresentar

os dados como no exemplo seguinte:

Tabelas de Freqüências em classe

Page 17: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

17

Tabelas de Freqüências em classeExemplo

Peso ao nascer (kg) f fr FA FR

1,5 |-- 2,0 6 5.8 6 5.8

2,0 |-- 2,5 16 15.5 22 21.3

2,5 |-- 3,0 31 30.1 53 51.4

3,0 |--3,5 34 33.0 87 84.4

3,5 |-- 4,0 11 10.7 98 95.1

4,0 |-- 4,5 4 3.9 102 99.0

4,5 |-- 5,0 1 1.0 103 100.0

Total 103 100.0

Tabela 3. Peso de RN*.

*Amostra de 103 RN da Maternidade BBBB.

Page 18: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

18

Tabelas de Freqüências em classe

Dada a seqüência: 1, 2, 3, 4, 5, 6, 7, 8. Podemos representar intervalos das seguintes formas:

Intervalo aberto: 1 8 = 2, 3, 4, 5, 6, 7

Intervalo fechado: 1 8 = 1,2,3,4,5,6,7,8

Intervalo fechado à esquerda: 1 8 = 1,2,3,4,5,6,7

Intervalo fechado à direita: 1 8 = 2, 3, 4, 5, 6, 7, 8

Intervalo aberto: 1 8 = 2, 3, 4, 5, 6, 7

Intervalo fechado: 1 8 = 1,2,3,4,5,6,7,8

Intervalo fechado à esquerda: 1 8 = 1,2,3,4,5,6,7

Intervalo fechado à direita: 1 8 = 2, 3, 4, 5, 6, 7, 8

Tabelas de Freqüências em classe

Intervalo aberto: 1 8 = 2, 3, 4, 5, 6, 7

Intervalo fechado: 1 8 = 1,2,3,4,5,6,7,8

Intervalo fechado à esquerda: 1 8 = 1,2,3,4,5,6,7

Intervalo fechado à direita: 1 8 = 2, 3, 4, 5, 6, 7, 8

Intervalo aberto: 1 8 = 2, 3, 4, 5, 6, 7

Intervalo fechado: 1 8 = 1,2,3,4,5,6,7,8

Intervalo fechado à esquerda: 1 8 = 1,2,3,4,5,6,7

Intervalo fechado à direita: 1 8 = 2, 3, 4, 5, 6, 7, 8

Page 19: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

19

Gráficos

Variável qualitativa ou quantitativa discreta

Gráfico de Barras

Gráfico de Setores circulares

Page 20: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

20

Gráficos

0

10

20

30

40

50

60

%

Normal Cesárea

Tipo de parto

Gráfico de Barras

Page 21: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

21 Gráfico de Setores

Gráficos

92.8%

7.1% 0.2%

Cefálica

Pélvica

Córmica

Page 22: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

22

Histograma

Polígono de freqüência

Gráfico de linhas

Gráficos

Variável quantitativa contínua

Page 23: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

23

Gráficos

Hemoglobina em hemocue

14,5413,0911,6410,198,74

300

200

100

0

Histograma

Page 24: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

24

Gráficos

0

2

4

6

8

10

12

14

16

0 5 15 25 35 45 55 65 75

Polígono de freqüência

Page 25: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

25

Gráficos

Dados Prevalência e Incidência

1980 a 1998

ANO

98

97

96

95

94

93

92

91

90

89

88

87

86

85

84

83

82

81

80

40

30

20

10

0

prevalência

incidência

Page 26: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

26

TERCEIRA LISTA DE EXERCÍCIOS

1. Em cada uma das situações, a seguir, identifique a variável a ser

medida; classifique a variável sob estudo; indique uma representação

gráfica adequada:

a) Um pesquisador está estudando o número de crianças desnutridas em

cada município do ES.

b) A Secretaria de Saúde do estado do ES está estudando o grau de

satisfação (muito satisfeito, satisfeito, pouco satisfeito e insatisfeito)

em relação aos programas sociais do governo federal.

Page 27: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

27

TERCEIRA LISTA DE EXERCÍCIOS

c) Dentre os trabalhadores aposentados por acidente de trabalho será

realizado um estudo para identificar o tipo de acidente que foram

acometidos.

d) O corpo de enfermagem de certo hospital está analisando a perda

de peso de pacientes internados na UTI. Os pacientes são pesados

antes e depois da internação.

Page 28: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

28

2. Elabore uma tabela de freqüência para os seguintes dados:

Uma pesquisa foi realizada Hospital Infantil com crianças da região de

São Pedro que apresentavam indícios de verminose. Foram realizados

exames para confirmação da suspeita. Os exames foram realizados

com 40 crianças e os resultados são apresentados abaixo, sendo que

“Sim” indica que foi confirmada a suspeita de verminose e “Não” indica

que a suspeita não foi confirmada.

Sim Sim Não Sim Não Não Não Sim Sim Sim Sim Não Sim Sim Sim Não Não Sim Não Sim Sim Sim Não Sim Não Sim Não Sim Sim Sim Sim Sim Sim Sim Sim Não Não Sim Sim Sim

TERCEIRA LISTA DE EXERCÍCIOS

Page 29: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

29

3. Elabore uma tabela de freqüência para os dados referentes a

quantidade de anos trabalhados, quando 24 trabalhadores de certa

empresa desenvolveram doença ocupacional.

14 12 11 13 14 13 12 14 13 14 11 12 12 14 10 13 15 11 15 13 16 17 14 14

TERCEIRA LISTA DE EXERCÍCIOS

Page 30: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

30

4. Complete a tabela abaixo de dados referentes ao nível de colesterol de 78 pacientes:

Nível de colesterol

fi fri(%) Fa Fr (%)

100 |-- 150 2

150 |-- 200 24

200 |-- 250 35

250 |-- 300 14

300 |-- 350 1

350 |-- 400 1

400 |-- 450 0

450 |-- 500 1

Total 78

TERCEIRA LISTA DE EXERCÍCIOS

Page 31: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

31

5. Abaixo é dado um conjunto de dados referentes a tempos

(em dias) até a recidiva de 40 pacientes que realizaram

radioterapia. Monte uma distribuição de freqüências em classe.

175 187 195 203 212 225 241 249 175 190 195 209 213 235 245 249 178 190 198 209 218 236 245 251 183 194 199 210 220 237 245 255 185 194 201 210 220 238 248 258

TERCEIRA LISTA DE EXERCÍCIOS

Page 32: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

32

Objetivam resumir um conjunto de valores em um único valor.

Medidas estatísticas

Ten d ênc ia C en tralM ed idas de O rdem

P os ição

D esvio M éd ioD esvio P ad rão

V ariânc ia C oef. de V ariação

D isp ersã o

M ed ida d eA ss im etria

P os itivaN egativa

A ss im etria

M ed ida deA ch atam ento

C urtose

M ed id as

Page 33: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

33

Média Aritmética

A média aritmética, ou simplesmente média, é a soma de todos os valores do conjunto divididos pelo número observações.

Exemplo: Considere uma variável aleatória da qual foram observados os seguintes valores de rendimento em salários mínimos: 8; 10; 13; 17; 29.Calcule a média aritmética:

É sempre assim!... A média dos meus

rendimentos é sempre menor que o necessário!

Page 34: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

34

Média Aritmética Algumas propriedades da média aritmética

A média de um conjunto de números pode ser sempre calculada.

Para um dado conjunto de números a média é única.

A média é sensível a (ou afetada por) todos os valores do conjunto. Assim se um valor se modifica, a média também se modifica.

Page 35: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

35

Page 36: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

36

Moda (Mo) é o valor da variável que mais se repete, o que possui maior freqüência. Uma variável pode ter mais de uma moda (bimodal, trimodal,multimodal e amodal).

Moda

Fácil de calcular;

Não é afetada por valores extremos;

Pode estar afastada do centro dos valores;

Não utiliza todos os valores da variável;

Nem sempre ela existe e pode existir mais de uma moda.

Odeio usar chapéu!...Mas não posso ficar fora da moda

Querida, seu chapéu é

maravilhoso!

Ah! Nada como andar

na moda!

Page 37: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

37

Classifique o conjunto de dados de acordo com a moda, determine-a quando possível:

a) 8; 10; 13; 13; 17; 29b) 1; 3; 7; 9; 15; 20; 5 c) 2; 4; 6; 2; 4; 8; 10; 12; 14; 16d) 1; 1; 1; 2; 2; 2; 3; 3; 3; 4; 5; 6; 7; 8; 9; 10e) 10, 15, 16, 16, 18, 18, 18, 19, 30

Moda

Exemplo

Page 38: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

38

Mediana

A mediana é uma medida de posição, não sendo influenciada pelos valores observados.

Após a ordenação dos valores, do menor para o maior, a mediana dividirá a série de observações em 2 partes iguais, ou seja, 50% menores valores se encontram abaixo da mediana e 50% maiores valores se encontram acima da mediana.

MEDIANA

Page 39: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

39

Mediana

Se n (o número de observações) é ímpar o valor da mediana ocupa a posição (n +1)/2.

Se n (o número de observações) é par o valor da mediana é a média dos valores que ocupam as posições (n/2) e (n/2 +1).

Ordenando-se as notas da turma em bioestatística temos: 0, 5, 6, 7, 8, 9, 9.5.

A mediana será igual a 7.

Exemplo

Page 40: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

40

Mediana Fácil de calcular;

Não é afetada por valores extremos;

É um valor único;

Não utiliza todos os valores da variável.

Calcule a média, mediana e modas para os seguintes conjuntos de dados:

a) 32 42 46 46 54

b) 1000 1500 2000 2450 2500 2500 2500 100000

Page 41: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

41

Qual das três medidas usar? Quando procuramos conhecer valores médios: a média. Ex.: em controle de qualidade, a média é utilizada para determinar se o processo está operando ao redor de um valor esperado, o alvo.

Se a variável tiver valores extremos, a mediana é mais adequada. Ex.: salário.

A moda é um valor típico. Variáveis qualitativas. Doenças que mais ocorrem.

Page 42: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

42

Quartis

O interesse está em conhecer a posição de um determinado valor em relação ao grupo de valores.

Os quartis são os valores que dividem os dados ordenados em quatro partes, com igual número de dados. O primeiro quartil (Q1) delimita os 25% menores valores. O terceiro quartil (Q3) é o valor que separa os 25% maiores valores. O segundo quartil é a própria mediana.

Page 43: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

43

O diagrama é um gráfico útil para descrição dos dados, visualização de sua variabilidade e comparação entre diferentes grupos.

Box-plot

GRUPO

Grupo 2Grupo1

Idad

e (a

nos)

50

40

30

20

10

Page 44: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

44

Percentis

Ordenados os dados, os percentis são medidas que dividem os dados em partes iguais.

Percentil 10: separa 10% dos menores dados;

Percentil 20: separa 20% dos menores dados;

Percentil 80: separa 80% dos menores dados e 20% dos maiores;

E assim sucessivamente….

Page 45: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

45

Medidas de Variabilidade ou dispersãoMedidas de dispersão dizem respeito à descrição de um grupo de valores em termos da variabilidade existente entre os itens incluídos dentro do grupo, ou seja, essas medidas indicam se os valores estão relativamente próximos uns dos outros, ou separados.

Pequena dispersão

Grande dispersão

Page 46: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

46

Medidas de VariabilidadeAMPLITUDE: expressa a diferença entre o maior e o menor número num conjunto de dados.

DESVIO MÉDIO: soma dos módulos dos desvios dividido pelo total de dados.

VARIÂNCIA: soma dos quadrados dos desvios dividido pelo total de dados menos 1 (amostra).

DESVIO PADRÃO: raiz quadrada positiva da variância.

COEFICIENTE DE VARIAÇÃO: Mede o grau de variação relativa.

Page 47: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

47

Amplitude

Amplitude = Maior valor - menor valor

Exemplos

a) 1, 2, 2, 3, 5, 7, 8, 9, 10 Amplitude =

b) 14, 3, 17, 4, 8, 73, 36, 48 Amplitude =

970

Page 48: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

48

Variância e Desvio padrão

Faculdade Notas dos alunos Média da Faculdade6 6 6 6 6 6 6 6

1 2 4 6 6 9 10 10

0 6 7 7 7 6 8 7

A

B

C

6,0

6,0

6,0

Exemplo: Considere as notas de bioestatística de alunos de três faculdades de Vitória:

Page 49: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

49

Variância e Desvio padrão

As notas das três faculdades apontam para a mesma nota média, mas as notas estão distribuídas diferentemente em cada Faculdade. Comparando as notas de A com B e C, notamos que as notas de B são bem mais dispersas, indicando que B é mais heterogênea em termos de notas obtidas. Em C observamos um ponto discrepante dos demais, uma nota extremamente baixa, acarretando um valor para a média abaixo da maioria das notas da turma.

Page 50: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

50

Variância e Desvio padrão

Para melhorar o resumo dos dados, podemos apresentar uma medida de dispersão destes dados, como a variância ou desvio padrão.

É simples! Sempre sem dinheiro, a variância é zero!...

Como você consegue manter seu saldo bancário sempre

estável?

Page 51: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

51

Variância e Desvio padrão

é sempre um número positivo;

se todos os valores de uma amostra forem iguais, a variância e o desvio padrão serão zero;

a variância e o desvio padrão são medidas afetadas pelos valores extremos da variável.

Page 52: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

52

Variância e Desvio padrão

Para calcularmos essas medidas, devemos considerar os desvios de cada valor em relação à média. Depois, constrói-se uma média desses desvios.

Desvio da Média

Exemplo: 4, 5, 5, 6, 6, 7, 7, 8

Page 53: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

53

Variância e Desvio padrãoNotas Desvio = Nota - Média

4 4 - 6 = -25 5 - 6 = -15 5 - 6 = -16 6 - 6 = 06 6 - 6 = 07 7 - 6 =17 7 - 6 =18 8 - 6 = 2

soma 0

Notas Desvio = Nota - Média (Desvio)2

4 4 - 6 = -2 (-2)2 = 45 5 - 6 = -1 (-1)2 = 15 5 - 6 = -1 (-1)2 = 16 6 - 6 = 0 (0)2 = 06 6 - 6 = 0 (0)2 = 07 7 - 6 =1 (1)2 = 17 7 - 6 =1 (1)2 = 18 8 - 6 = 2 (2)2 = 4

soma 0 12

71,118

12

Variância 3,171,1 padrãoDesvio

Page 54: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

54

22 1

1

niix x

s n

Variância Amostral

Variância e Desvio padrão

Desvio padrão Amostral

11

2

nxx

sn

i i

Page 55: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

55

Coeficiente de variação

O coeficiente de variação é uma medida relativa da variabilidade.

Ele é útil quando queremos comparar a variabilidade de dois conjuntos de dados que tenham diferentes desvios padrões e diferentes médias.

100MédiapadrãoDesvioCV

Page 56: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

56

ExemploCalcule a variância e o desvio padrão do conjunto de dados abaixo:

i

1 3,2

2 3,2

3 2,8

4 2,1

5 2,9

6 3,1

7 3,2

8 3,0

9 3,5

10 4,0

Total 31

ix2ix xxi

2)( xxi

Page 57: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

57

i

1 3,2 10,24 0,1 0,012 3,2 10,24 0,1 0,013 2,8 7,84 -0,3 0,094 2,1 4,41 -1,0 1,005 2,9 8,41 -0,2 0,046 3,1 9,61 0,0 0,007 3,2 10,24 0,1 0,018 3,0 9,00 -0,1 0,019 3,5 12,25 0,4 0,1610 4,0 16,00 0,9 0,81Total 31 98,24 0,0 2,41

ix2ix xxi 2)( xxi

24,0914,22 s 49,024,0 s

Exemplo

Page 58: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

58

QUARTA LISTA DE EXERCÍCIOS

1. Considere pesos de 10 recém-nascidos e obtenha o peso médio,

o peso mediano e o peso modal.

2,1 2,8 2,9 3,0 3,1 3,2 3,2 3,2 3,5 4,0

2. Considere escores de pacientes na evolução do tratamento com tianeptina e calcule Calcule a amplitude total, o desvio padrão e o coeficiente de variação:

26 27 25 26 27 49

Page 59: 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de dados.

59

QUARTA LISTA DE EXERCÍCIOS3. Muitos estudos mostram que o stress afeta a capacidade de

memorização. Observe as medidas e o gráfico abaixo sobre um

escore para memorização e faça um comentário sobre os

resultados. Escreva um breve texto comentando sobre as medidas

estatísticas encontradas.

Com stress Sem stress Número de observações 10,0 10,0

Mínimo 30,0 48,0 Máximo 65,0 90,0 Média 46,3 65,1 Moda 45,0 55,0 Mediana 45,0 59,0 Percentil 25 37,3 53,8 Percentil 75 56,3 81,3 Desvio padrão 11,2 15,1

Sem stressCom stress

100

90

80

70

60

50

40

30

20