1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de...
-
Upload
maria-antonieta-castelo-beretta -
Category
Documents
-
view
230 -
download
5
Transcript of 1 BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3 Descrição e apresentação de...
1
BIOESTATÍSTICA
Profª. Lúcia Helena Sagrillo Pimassoni
Unidade 3 Descrição e apresentação de dados
2
O objetivo é organizar, resumir e apresentar dados, de tal forma que possamos interpretá-los de acordo com os objetivos da pesquisa.
Estatística Descritiva
Dados estatísticos são observações da realidade que nos cerca. Podem ser fatos ou números.
3
a) Indivíduo ou unidade elementar: é a entidade de base sobre a qual o observador realiza um certo número de medições.
Exemplo: um paciente, um usuário, um empregado, um dente, uma cidade, um país, um eleitor, uma minhoca, etc...
Dados EstatísticosEm um conjuntos de dados, temos os indivíduos e as informações relativas a esses indivíduos, as variáveis. Segue que:
4
b) Variáveis: conjunto de informações levantadas para cada indivíduo.
Exemplo: no caso de um estudo clínico, os indivíduos seriam os pacientes atendidos e as variáveis seriam o sexo, a idade, pressão d/s, altura, tipo de sangue, número de cáries, etc.
Quanto ao tipo as variáveis podem ser quantitativas e qualitativas.
Dados Estatísticos
A técnica estatística depende do tipo de variável.
5
Tipos de VariáveisQualitativa: quando seus possíveis valores assumem modalidades não numéricas (categóricas), como sexo, profissão, escolaridade, região, nível hierárquico, etc... Pode ser:
Nominal: são dados que podem ser separados em categorias chamadas de não mensuráveis (cor dos olhos, sexo, região);
Ordinal: envolvem dados que podem ser dispostos em alguma ordem (nível hierárquico, nível de satisfação, grau de escolaridade).
6
Quantitativa: a característica do elemento observado é uma quantidade (salário, idade, altura, peso, etc... ). Pode ser:
Discreta: assumem valores inteiros. Os dados discretos são resultantes da contagem de um número de itens (número de pacientes internados, etc.);
Contínua: assumem qualquer valor num intervalo de valores. São dados resultantes de medições (taxa de colesterol, peso, altura, etc.).
Tipos de Variáveis
7
Exemplo de Planilha de DadosIndivíduo VAR 1 VAR2 … VARp
1
2
3
4
…
…
…
…
n
8
Exemplo de Planilha de Dados
9
Os dados qualitativos ou quantitativos discretos podem ser apresentados ou organizados das seguintes maneiras: Tabelas de Freqüências. Gráfico de Barras. Gráfico de Setores.
Apresentação e Organização dos dados: Métodos Tabulares e Métodos gráficos
Ao estudarmos grandes conjuntos de dados, é conveniente organizá-los e resumi-los.
10
Apresentação e Organização dos dados: Métodos Tabulares e Métodos gráficos
Os dados quantitativos contínuos podem ser apresentados ou organizados das seguintes maneiras: Tabela de freqüências em classes Histogramas Polígono de freqüências Gráfico de linhas
11
Tabelas de Freqüências
Tabela de Freqüência é uma tabela na qual numa das colunas aparecem os valores observados da variável aleatória e nas demais colunas aparecem as freqüências de ocorrência dos respectivos valores. Essas colunas contém as seguintes freqüências: Freqüência absoluta. Freqüência relativa. Freqüência acumulada absoluta. Freqüência acumulada relativa.
12
Tabelas de Freqüências
Freqüência absoluta (f) é o número de vezes que cada valor se repete.
Freqüência Relativa (fr) fornece a relação entre a freqüência observada de um determinado valor e o número total de observações realizadas no experimento.
13
Tabelas de Freqüências
Freqüência acumulada absoluta (Fa): A soma das freqüências absolutas anteriores é chamada freqüência acumulada absoluta.
Freqüência acumulada relativa (Fr): A soma das freqüências absolutas anteriores é chamada freqüência acumulada absoluta.
14
Tabelas de Freqüências
Exemplo
234 43,4
305 56,6
539 100,0
Tipo de partoNormal
Cesárea
Total
Freqüência %
Tabela 1. Tipo de parto*.
*Amostra de 539 pacientes do Hospital AAAA
15
Tabelas de Freqüências
Apgar de 5 minutos f fr (%) FA FR (%)1 2 0.4 2 0.43 1 0.2 3 0.65 3 0.6 6 1.26 4 0.7 10 1.97 16 3.0 26 4.98 65 12.1 91 17.09 346 64.7 437 81.7
10 98 18.3 575 100.0Total 535 100.0
Tabela 2. Apgar de 5 minutos*.
*Amostra de 539 pacientes do Hospital AAAA
16
A Tabela de Freqüências para dados agrupados em classe é constituída da mesma forma que para dados não agrupados, com a diferença de que agora os valores da variável a ser descrita passam a ser organizados por classes.
O nº de classes deve ficar entre 5 e 20. Utilizando intervalos podemos apresentar
os dados como no exemplo seguinte:
Tabelas de Freqüências em classe
17
Tabelas de Freqüências em classeExemplo
Peso ao nascer (kg) f fr FA FR
1,5 |-- 2,0 6 5.8 6 5.8
2,0 |-- 2,5 16 15.5 22 21.3
2,5 |-- 3,0 31 30.1 53 51.4
3,0 |--3,5 34 33.0 87 84.4
3,5 |-- 4,0 11 10.7 98 95.1
4,0 |-- 4,5 4 3.9 102 99.0
4,5 |-- 5,0 1 1.0 103 100.0
Total 103 100.0
Tabela 3. Peso de RN*.
*Amostra de 103 RN da Maternidade BBBB.
18
Tabelas de Freqüências em classe
Dada a seqüência: 1, 2, 3, 4, 5, 6, 7, 8. Podemos representar intervalos das seguintes formas:
Intervalo aberto: 1 8 = 2, 3, 4, 5, 6, 7
Intervalo fechado: 1 8 = 1,2,3,4,5,6,7,8
Intervalo fechado à esquerda: 1 8 = 1,2,3,4,5,6,7
Intervalo fechado à direita: 1 8 = 2, 3, 4, 5, 6, 7, 8
Intervalo aberto: 1 8 = 2, 3, 4, 5, 6, 7
Intervalo fechado: 1 8 = 1,2,3,4,5,6,7,8
Intervalo fechado à esquerda: 1 8 = 1,2,3,4,5,6,7
Intervalo fechado à direita: 1 8 = 2, 3, 4, 5, 6, 7, 8
Tabelas de Freqüências em classe
Intervalo aberto: 1 8 = 2, 3, 4, 5, 6, 7
Intervalo fechado: 1 8 = 1,2,3,4,5,6,7,8
Intervalo fechado à esquerda: 1 8 = 1,2,3,4,5,6,7
Intervalo fechado à direita: 1 8 = 2, 3, 4, 5, 6, 7, 8
Intervalo aberto: 1 8 = 2, 3, 4, 5, 6, 7
Intervalo fechado: 1 8 = 1,2,3,4,5,6,7,8
Intervalo fechado à esquerda: 1 8 = 1,2,3,4,5,6,7
Intervalo fechado à direita: 1 8 = 2, 3, 4, 5, 6, 7, 8
19
Gráficos
Variável qualitativa ou quantitativa discreta
Gráfico de Barras
Gráfico de Setores circulares
20
Gráficos
0
10
20
30
40
50
60
%
Normal Cesárea
Tipo de parto
Gráfico de Barras
21 Gráfico de Setores
Gráficos
92.8%
7.1% 0.2%
Cefálica
Pélvica
Córmica
22
Histograma
Polígono de freqüência
Gráfico de linhas
Gráficos
Variável quantitativa contínua
23
Gráficos
Hemoglobina em hemocue
14,5413,0911,6410,198,74
300
200
100
0
Histograma
24
Gráficos
0
2
4
6
8
10
12
14
16
0 5 15 25 35 45 55 65 75
Polígono de freqüência
25
Gráficos
Dados Prevalência e Incidência
1980 a 1998
ANO
98
97
96
95
94
93
92
91
90
89
88
87
86
85
84
83
82
81
80
40
30
20
10
0
prevalência
incidência
26
TERCEIRA LISTA DE EXERCÍCIOS
1. Em cada uma das situações, a seguir, identifique a variável a ser
medida; classifique a variável sob estudo; indique uma representação
gráfica adequada:
a) Um pesquisador está estudando o número de crianças desnutridas em
cada município do ES.
b) A Secretaria de Saúde do estado do ES está estudando o grau de
satisfação (muito satisfeito, satisfeito, pouco satisfeito e insatisfeito)
em relação aos programas sociais do governo federal.
27
TERCEIRA LISTA DE EXERCÍCIOS
c) Dentre os trabalhadores aposentados por acidente de trabalho será
realizado um estudo para identificar o tipo de acidente que foram
acometidos.
d) O corpo de enfermagem de certo hospital está analisando a perda
de peso de pacientes internados na UTI. Os pacientes são pesados
antes e depois da internação.
28
2. Elabore uma tabela de freqüência para os seguintes dados:
Uma pesquisa foi realizada Hospital Infantil com crianças da região de
São Pedro que apresentavam indícios de verminose. Foram realizados
exames para confirmação da suspeita. Os exames foram realizados
com 40 crianças e os resultados são apresentados abaixo, sendo que
“Sim” indica que foi confirmada a suspeita de verminose e “Não” indica
que a suspeita não foi confirmada.
Sim Sim Não Sim Não Não Não Sim Sim Sim Sim Não Sim Sim Sim Não Não Sim Não Sim Sim Sim Não Sim Não Sim Não Sim Sim Sim Sim Sim Sim Sim Sim Não Não Sim Sim Sim
TERCEIRA LISTA DE EXERCÍCIOS
29
3. Elabore uma tabela de freqüência para os dados referentes a
quantidade de anos trabalhados, quando 24 trabalhadores de certa
empresa desenvolveram doença ocupacional.
14 12 11 13 14 13 12 14 13 14 11 12 12 14 10 13 15 11 15 13 16 17 14 14
TERCEIRA LISTA DE EXERCÍCIOS
30
4. Complete a tabela abaixo de dados referentes ao nível de colesterol de 78 pacientes:
Nível de colesterol
fi fri(%) Fa Fr (%)
100 |-- 150 2
150 |-- 200 24
200 |-- 250 35
250 |-- 300 14
300 |-- 350 1
350 |-- 400 1
400 |-- 450 0
450 |-- 500 1
Total 78
TERCEIRA LISTA DE EXERCÍCIOS
31
5. Abaixo é dado um conjunto de dados referentes a tempos
(em dias) até a recidiva de 40 pacientes que realizaram
radioterapia. Monte uma distribuição de freqüências em classe.
175 187 195 203 212 225 241 249 175 190 195 209 213 235 245 249 178 190 198 209 218 236 245 251 183 194 199 210 220 237 245 255 185 194 201 210 220 238 248 258
TERCEIRA LISTA DE EXERCÍCIOS
32
Objetivam resumir um conjunto de valores em um único valor.
Medidas estatísticas
Ten d ênc ia C en tralM ed idas de O rdem
P os ição
D esvio M éd ioD esvio P ad rão
V ariânc ia C oef. de V ariação
D isp ersã o
M ed ida d eA ss im etria
P os itivaN egativa
A ss im etria
M ed ida deA ch atam ento
C urtose
M ed id as
33
Média Aritmética
A média aritmética, ou simplesmente média, é a soma de todos os valores do conjunto divididos pelo número observações.
Exemplo: Considere uma variável aleatória da qual foram observados os seguintes valores de rendimento em salários mínimos: 8; 10; 13; 17; 29.Calcule a média aritmética:
É sempre assim!... A média dos meus
rendimentos é sempre menor que o necessário!
34
Média Aritmética Algumas propriedades da média aritmética
A média de um conjunto de números pode ser sempre calculada.
Para um dado conjunto de números a média é única.
A média é sensível a (ou afetada por) todos os valores do conjunto. Assim se um valor se modifica, a média também se modifica.
35
36
Moda (Mo) é o valor da variável que mais se repete, o que possui maior freqüência. Uma variável pode ter mais de uma moda (bimodal, trimodal,multimodal e amodal).
Moda
Fácil de calcular;
Não é afetada por valores extremos;
Pode estar afastada do centro dos valores;
Não utiliza todos os valores da variável;
Nem sempre ela existe e pode existir mais de uma moda.
Odeio usar chapéu!...Mas não posso ficar fora da moda
Querida, seu chapéu é
maravilhoso!
Ah! Nada como andar
na moda!
37
Classifique o conjunto de dados de acordo com a moda, determine-a quando possível:
a) 8; 10; 13; 13; 17; 29b) 1; 3; 7; 9; 15; 20; 5 c) 2; 4; 6; 2; 4; 8; 10; 12; 14; 16d) 1; 1; 1; 2; 2; 2; 3; 3; 3; 4; 5; 6; 7; 8; 9; 10e) 10, 15, 16, 16, 18, 18, 18, 19, 30
Moda
Exemplo
38
Mediana
A mediana é uma medida de posição, não sendo influenciada pelos valores observados.
Após a ordenação dos valores, do menor para o maior, a mediana dividirá a série de observações em 2 partes iguais, ou seja, 50% menores valores se encontram abaixo da mediana e 50% maiores valores se encontram acima da mediana.
MEDIANA
39
Mediana
Se n (o número de observações) é ímpar o valor da mediana ocupa a posição (n +1)/2.
Se n (o número de observações) é par o valor da mediana é a média dos valores que ocupam as posições (n/2) e (n/2 +1).
Ordenando-se as notas da turma em bioestatística temos: 0, 5, 6, 7, 8, 9, 9.5.
A mediana será igual a 7.
Exemplo
40
Mediana Fácil de calcular;
Não é afetada por valores extremos;
É um valor único;
Não utiliza todos os valores da variável.
Calcule a média, mediana e modas para os seguintes conjuntos de dados:
a) 32 42 46 46 54
b) 1000 1500 2000 2450 2500 2500 2500 100000
41
Qual das três medidas usar? Quando procuramos conhecer valores médios: a média. Ex.: em controle de qualidade, a média é utilizada para determinar se o processo está operando ao redor de um valor esperado, o alvo.
Se a variável tiver valores extremos, a mediana é mais adequada. Ex.: salário.
A moda é um valor típico. Variáveis qualitativas. Doenças que mais ocorrem.
42
Quartis
O interesse está em conhecer a posição de um determinado valor em relação ao grupo de valores.
Os quartis são os valores que dividem os dados ordenados em quatro partes, com igual número de dados. O primeiro quartil (Q1) delimita os 25% menores valores. O terceiro quartil (Q3) é o valor que separa os 25% maiores valores. O segundo quartil é a própria mediana.
43
O diagrama é um gráfico útil para descrição dos dados, visualização de sua variabilidade e comparação entre diferentes grupos.
Box-plot
GRUPO
Grupo 2Grupo1
Idad
e (a
nos)
50
40
30
20
10
44
Percentis
Ordenados os dados, os percentis são medidas que dividem os dados em partes iguais.
Percentil 10: separa 10% dos menores dados;
Percentil 20: separa 20% dos menores dados;
Percentil 80: separa 80% dos menores dados e 20% dos maiores;
E assim sucessivamente….
45
Medidas de Variabilidade ou dispersãoMedidas de dispersão dizem respeito à descrição de um grupo de valores em termos da variabilidade existente entre os itens incluídos dentro do grupo, ou seja, essas medidas indicam se os valores estão relativamente próximos uns dos outros, ou separados.
Pequena dispersão
Grande dispersão
46
Medidas de VariabilidadeAMPLITUDE: expressa a diferença entre o maior e o menor número num conjunto de dados.
DESVIO MÉDIO: soma dos módulos dos desvios dividido pelo total de dados.
VARIÂNCIA: soma dos quadrados dos desvios dividido pelo total de dados menos 1 (amostra).
DESVIO PADRÃO: raiz quadrada positiva da variância.
COEFICIENTE DE VARIAÇÃO: Mede o grau de variação relativa.
47
Amplitude
Amplitude = Maior valor - menor valor
Exemplos
a) 1, 2, 2, 3, 5, 7, 8, 9, 10 Amplitude =
b) 14, 3, 17, 4, 8, 73, 36, 48 Amplitude =
970
48
Variância e Desvio padrão
Faculdade Notas dos alunos Média da Faculdade6 6 6 6 6 6 6 6
1 2 4 6 6 9 10 10
0 6 7 7 7 6 8 7
A
B
C
6,0
6,0
6,0
Exemplo: Considere as notas de bioestatística de alunos de três faculdades de Vitória:
49
Variância e Desvio padrão
As notas das três faculdades apontam para a mesma nota média, mas as notas estão distribuídas diferentemente em cada Faculdade. Comparando as notas de A com B e C, notamos que as notas de B são bem mais dispersas, indicando que B é mais heterogênea em termos de notas obtidas. Em C observamos um ponto discrepante dos demais, uma nota extremamente baixa, acarretando um valor para a média abaixo da maioria das notas da turma.
50
Variância e Desvio padrão
Para melhorar o resumo dos dados, podemos apresentar uma medida de dispersão destes dados, como a variância ou desvio padrão.
É simples! Sempre sem dinheiro, a variância é zero!...
Como você consegue manter seu saldo bancário sempre
estável?
51
Variância e Desvio padrão
é sempre um número positivo;
se todos os valores de uma amostra forem iguais, a variância e o desvio padrão serão zero;
a variância e o desvio padrão são medidas afetadas pelos valores extremos da variável.
52
Variância e Desvio padrão
Para calcularmos essas medidas, devemos considerar os desvios de cada valor em relação à média. Depois, constrói-se uma média desses desvios.
Desvio da Média
Exemplo: 4, 5, 5, 6, 6, 7, 7, 8
53
Variância e Desvio padrãoNotas Desvio = Nota - Média
4 4 - 6 = -25 5 - 6 = -15 5 - 6 = -16 6 - 6 = 06 6 - 6 = 07 7 - 6 =17 7 - 6 =18 8 - 6 = 2
soma 0
Notas Desvio = Nota - Média (Desvio)2
4 4 - 6 = -2 (-2)2 = 45 5 - 6 = -1 (-1)2 = 15 5 - 6 = -1 (-1)2 = 16 6 - 6 = 0 (0)2 = 06 6 - 6 = 0 (0)2 = 07 7 - 6 =1 (1)2 = 17 7 - 6 =1 (1)2 = 18 8 - 6 = 2 (2)2 = 4
soma 0 12
71,118
12
Variância 3,171,1 padrãoDesvio
54
22 1
1
niix x
s n
Variância Amostral
Variância e Desvio padrão
Desvio padrão Amostral
11
2
nxx
sn
i i
55
Coeficiente de variação
O coeficiente de variação é uma medida relativa da variabilidade.
Ele é útil quando queremos comparar a variabilidade de dois conjuntos de dados que tenham diferentes desvios padrões e diferentes médias.
100MédiapadrãoDesvioCV
56
ExemploCalcule a variância e o desvio padrão do conjunto de dados abaixo:
i
1 3,2
2 3,2
3 2,8
4 2,1
5 2,9
6 3,1
7 3,2
8 3,0
9 3,5
10 4,0
Total 31
ix2ix xxi
2)( xxi
57
i
1 3,2 10,24 0,1 0,012 3,2 10,24 0,1 0,013 2,8 7,84 -0,3 0,094 2,1 4,41 -1,0 1,005 2,9 8,41 -0,2 0,046 3,1 9,61 0,0 0,007 3,2 10,24 0,1 0,018 3,0 9,00 -0,1 0,019 3,5 12,25 0,4 0,1610 4,0 16,00 0,9 0,81Total 31 98,24 0,0 2,41
ix2ix xxi 2)( xxi
24,0914,22 s 49,024,0 s
Exemplo
58
QUARTA LISTA DE EXERCÍCIOS
1. Considere pesos de 10 recém-nascidos e obtenha o peso médio,
o peso mediano e o peso modal.
2,1 2,8 2,9 3,0 3,1 3,2 3,2 3,2 3,5 4,0
2. Considere escores de pacientes na evolução do tratamento com tianeptina e calcule Calcule a amplitude total, o desvio padrão e o coeficiente de variação:
26 27 25 26 27 49
59
QUARTA LISTA DE EXERCÍCIOS3. Muitos estudos mostram que o stress afeta a capacidade de
memorização. Observe as medidas e o gráfico abaixo sobre um
escore para memorização e faça um comentário sobre os
resultados. Escreva um breve texto comentando sobre as medidas
estatísticas encontradas.
Com stress Sem stress Número de observações 10,0 10,0
Mínimo 30,0 48,0 Máximo 65,0 90,0 Média 46,3 65,1 Moda 45,0 55,0 Mediana 45,0 59,0 Percentil 25 37,3 53,8 Percentil 75 56,3 81,3 Desvio padrão 11,2 15,1
Sem stressCom stress
100
90
80
70
60
50
40
30
20