BIOESTATÍSTICA
HEP- 146
Professores:
Profa. Dra. Maria do Rosario D. O. Latorre
2015
Monitores:
Franciane Figueiredo da Silva ,
Max Moura de Oliveira e Bianca Melo Guedes
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
1
HEP 146 BIOESTATÍSTICA I – 2015 PROGRAMAÇÃO DAS AULAS
AULA DIA MÊS CONTEÚDO
1 4 agosto Apresentação do curso.
População, amostra, variáveis, coleta e apuração de dados. Noções de como fazer um questionário.
2 e 3 11 e 18
Apresentação tabular e gráfica de dados.
4 25 Medidas de tendência central (média, mediana e moda)
5 1º. setembro Medidas de dispersão (variância, desvio padrão e percentis)
6 15 Inferência estatística. Noções de amostragem. Distribuição de probabilidades: distribuição Binomial
7 18 Distribuição Normal, distribuição amostral da média
8 22 Prova I
9 29 Estimação de parâmetros populacionais (média e proporção)
10 2 outubro Testes de Hipóteses: teste de uma proporção.
11 13 Teste de uma média (com variância conhecida e com variância desconhecida)
teste de duas médias
12 20 Teste de associação pelo qui-quadrado.
13 27 Delineamento de estudos em epidemiologia
Medidas de risco
14 3 novembro Noções de correlação
15 10 Modelo de regressão linear simples.
16 17 Plantão de dúvidas, preparação dos trabalhos
17 24 Prova II
18 1º. dezembro Seminários - apresentação dos trabalhos
27 janeiro Prova de recuperação
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
2
Informações adicionais:
Local: sala José Maria Gomes
Horário: das 14h00 às 18h00.
Avaliação:
P: serão 2 provas, com consulta.
E: exercícios em sala sobre o conteúdo que está sendo ministrado, trabalho sobre a análise do perfil dos alunos e apresentação do mesmo.
PS: Prova surpresa
6
3221
ExPxPfinalmédia
ou
7
3221
PSExPxPfinalmédia
Monitoria:
das 13 às 14 hs, 4ª. feira, na sala José Maria Gomes.
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
3
Bibliografia
1. BERQUÓ ES, SOUZA JMP, GOTLIEB SLD. Bioestatística. São Paulo: EPU; 1981. 2. BEIGUELMAN B. Curso prático de Bioestatística. 5ª Edição. Ribeirão Preto: FUNPEC, 2002. 3. BUSSAB, WO; MORETTIN, PA. Estatística básica. 5ª Ed. São Paulo: Saraiva, 2004. 4. CALLEGARI-JAQUES, SM. Bioestatística: princípios e aplicações. Porto Alegre: Artmed, 2003. 5. ELIAN, SN; FARHAT CAV. Estatística básica. São Paulo: LCTE Editora, 2006. 6. MAGALHÃES MN; LIMA ACP. Noções de Probabilidade e Estatística. EDUSP. São Paulo, 2002 7. PEREIRA, JCR. Bioestatística em outras palavras. 1ª Ed. São Paulo: EDUSP; 2010. 8. PEREIRA MG. Epidemiologia Teoria e Prática. Editora Guanabara Koogan. Rio de Janeiro, 1999. 9. SOARES, JF; SIQUEIRA, AL. Introdução à estatística médica. 2ª Ed. Belo Horizonte: COOPMED, 2002.
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
4
ESTATÍSTICA
É a ciência que abrange métodos e procedimentos de coleta,
classificação, descrição e análise de dados e a Bioestatística é a estatística
aplicada às ciências da vida.
A participação da Bioestatística se dá em todo o desenvolvimento da
pesquisa: da elaboração do projeto à interpretação dos resultados, passando
pela coleta e armazenamento dos dados e, neste contexto, os métodos
estatísticos são as técnicas utilizadas para apresentar os dados, estimar
parâmetros e testar hipóteses.
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
5
ANÁLISE ESTATÍSTICA
Descritiva Inferência Estatística
Estatística Descritiva: análise exploratória dos dados
tabelas e gráficos
medidas resumo numéricas:
o média e desvio padrão
o mediana, quartis, percentis
o moda, extremos
o freqüências
Inferência Estatística: como fazer afirmações sobre características de uma
população, baseando-se em resultados de uma amostra.
amostragem
estimação por ponto
intervalo de confiança
testes de hipóteses
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
6
TIPOS DE VARIÁVEIS
VARIÁVEL:
qualitativa nominal
ordinal
quantitativa discreta
contínua
Variáveis conceituais operacionais
ex: diabetes mellitus
glicemia de jejum 140 mg/dl
ou
glicemia 2 hs pós 75 g de glicose 200 mg/dl
tipo de variável: ?
ex: hipertensão arterial
quantitativa contínua : pressão arterial diastólica (mm Hg)
qualitativa ordinal
nao hipertenso
hipertenso leve
hipertenso moderado
hipertenso grave
qualitativa nominal nao hipertenso
hipertenso
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
7
O tipo da variável irá indicar a melhor forma para o dado ser apresentado em
tabelas e gráficos, em medidas de resumo e a análise estatística mais adequada.
Exercício: Classificar quanto a natureza, as seguintes variáveis
Variável Tipo (natureza)
Condição de saúde (doente, não doente)
Tipo de parto (normal, cesáreo)
Nível de colesterol sérico (mg/100cc)
Tempo de um procedimento cirúrgico (minutos)
Número de praias consideradas poluídas
Peso (g)
Estado nutricional (desnutrição, eutrofia, sobrepeso, obesidade)
Consumo de energia (Kcal)
Realização da refeição café da manhã (sim/não)
Número de escolares por série
Realização de atividade física diária (sim/não)
Tempo assistindo TV/dia (< 2h, 2 a 4h, >4h)
Percentual de gordura corporal (%)
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
8
Como fazer um levantamento de dados através de questionário?
1. Levantamento bibliográfico.
2. Definição das variáveis de estudo.
3. Elaboração das questões.
Exemplo:
IDENTIFICAÇÃO
1. nome do paciente: ________________________________________________________
2. número do caso (caso): _________________
3. instituição (instituto):
4. data de nascimento (dt_nasc): ______/______/______
5. data da 1ª consulta (dt_1cons): ______/______/______
6. data do diagnóstico (dt_diag): ______/______/______
7. sexo : masculino (1) feminino (2)
8. cor da pele : branco (1) negro/preto (2) pardo/mulato (3)
amarelo (4) outros (5 ) ignorado (9)
9. renda (em reais): ________________
10. tempo de residência (em meses):__________
11. você é estrangeiro? não (0) sim (1)
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
9
CRIAÇÃO E GERENCIAMENTO DE BANCO DE DADOS
1) Elaboração da base de dados Estabelecimento das regras para a entrada de dados (codificação das variáveis), ANTES de iniciar a coleta dos dados.
Nome da variável (não muito grande);
Codificação prévia dos formulários;
Livro de Códigos (manual);
Código para as categorias “não sabe”, “dado ausente” e “não se aplica”
2) Escolha do programa de entrada de dados Epi-Info Excel outros Atenção!!!
Não utilizar acentos e espaços!
O microcomputador sabe fazer cálculos!
Fazer cópias de segurança! 3) Estratégias para reduzir ao mínimo os erros na base de dados
Verificações lógicas automáticas
Entrada de dados duplicados 4) Sistema de gerenciamento de dados
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
10
ESTATÍSTICA DESCRITIVA
Variáveis qualitativas
Tabelas de frequências
Gráficos em barras
Gráfico em setores ou diagrama circular
Variáveis quantitativas
Medidas de posição (média, mediana, moda)
Medidas de dispersão (variância, desvio-padrão, amplitude)
Box-plot
Tabela de freqüências
Histograma
Polígono de frequências
Pode ser interessante descrever variáveis quantitativas discretas
utilizando técnicas semelhantes às das variáveis qualitativas!
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
11
Apresentação tabular
Após a coleta, há necessidade dos dados serem dispostos de uma
forma ordenada e resumida, em tabelas, a fim de auxiliar o pesquisador na
sua análise e facilitar a compreensão das conclusões apresentadas ao leitor.
Os dados podem ser apresentados na forma de tabelas estatísticas.
Essas devem ser auto-explicativas (sem necessidade de texto explicativo)
Uma tabela estatística deve conter:
título,
corpo e
rodapé (fonte, notas e notas específicas)
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
12
Titulo:o que (natureza do fato estudado)? como (variáveis)? onde? quando?
FONTE
notas, chamadas
OBS: nenhuma casela deve ficar em branco
- valor numérico é nulo
... quando não se dispõe do dado
0 / 0,0/ 0,00 valor numérico é muito pequeno
? dúvidas quanto à exatidão da freqüência
§ quando o dado retifica informação já publicada
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
13
TABELAS DE FREQUÊNCIA
Exemplos
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
14
Apresentação gráfica
variável qualitativa
0
5
1 0
1 5
2 0
A B C D E F G H
N Ã O
S I M
variável quantitativa discreta
0
2
4
6
8
1 0
1 2
1 4
1 2 3 4 5
S I M
N Ã O
variável quantitativa contínua
0
2
4
6
8
1 0
1 2
1 4
0 5 1 5 2 5 3 5 4 5 5 5 6 5 7 5
S IM N Ã O
0
5
1 0
1 5
0 5 1 5 2 5 3 5 4 5 5 5 6 5 7 5 8 5
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
15
GRÁFICO EM BARRAS
Distribuição do número de habitantes segundo
faixa etária na cidade de Botucatu em 2012.
Distribuição do número de habitantes segundo
faixa etária e sexo na cidade de Botucatu em
2012.
FONTE: DATASUS, Ministério da Saúde, 2012. FONTE: DATASUS, Ministério da Saúde, 2012.
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
16
HISTOGRAMA
HISTOGRAMA E POLÍGONO DE FREQUENCIAS
POLÍGONO DE FREQUENCIAS
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
17
GRÁFICO DE FREQUÊNCIA ACUMULADA
DIAGRAMA DE DISPERSÃO
2.2
2.4
2.6
2.8
3.0
3.2
3.4
3.6
50 60 70 80 90 100
Peso (Kg)
Vo
lum
e (
l)
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
18
DIAGRAMA DE LINHA
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
19
DIAGRAMA CIRCULAR
Distribuição do número de pacientes segundo a presença de doença coronariana.
OUTROS EXEMPLOS
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
20
MEDIDAS DE TENDÊNCIA CENTRAL
MÉDIA ARITMÉTICA
i classe da freqüência :
classes de no. :k
i classe da médio ponto:
agrupados, dados
.
...
amostra da tamanho
o ã populaç da tamanhoN
(v.a.) aleatoria variavelX
1_
121_
i
m
k
i
mi
n
i
i
n
f
x
n
xf
X
n
x
n
xxxX
n
ii
OBS:
só existe para variáveis quantitativas e seu valor é único;
é da mesma natureza da variável considerada; e
sofre influência dos valores aberrantes.
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
21
MEDIANA
É o valor que ocupa a posição central de uma série de observações,
quando estas estão ordenadas de forma crescente ou decrescente.
OBS:
só existe para variável quantitativa;
é da mesma natureza da variável considerada;
torna-se inadequada quando há muitos valores repetidos;
não recebe influência dos valores aberrantes;
pode ser calculada mesmo quando os dados estão agrupados em
intervalos de classe e os extremos de algum intervalo não esteja definido
(a não ser que a mediana caia neste intervalo).
QUARTIL
DECIL
PERCENTIL
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
22
MODA
É o valor da variável que apresenta freqüência máxima.
OBS:
pode ser calculada para variável qualitativa;
nem sempre existe ou é única;
é da mesma natureza da variável considerada;
no caso da variável quantitativa estar apresentada em intervalos de
classes é muito afetada pela maneira como as classes foram construídas.
Tem-se:
Mo
L + t +f
f f
1
1 2
, onde
L=extremo inferior da classe em que está a moda
t = amplitude desta classe
f1 e f2 = freqüências das classes adjacentes à classe da moda
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
23
MEDIDAS DE DISPERSÃO
AMPLITUDE DE VARIAÇÃO
É a diferença entre os 2 valores extremos da distribuição.
VALORES MÍNIMOS E MÁXIMOS
VARIÂNCIA
É a média dos quadrados dos desvios em relação à média.
amostra
1
.
população
...
1
2_
2
1
2
1
2
2
n
fXx
S
N
Nfx
N
fx
i
k
i
i
X
k
i
iii
k
i
Xi
DESVIO PADRÃO
2
2S S
COEFICIENTE DE VARIAÇÃO DE PEARSON (V)
V = S
X
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
24
BOX PLOT
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
25
EXERCÍCIOS
Os dados da tabela abaixo se referem a informações sobre os estados
brasileiros. Fazer uma tabela com a estatística descritiva (média, desvio
padrão, mediana, percentis 25 e 75 e valores mínimos e máximos) destas
informações. Fazer os gráficos do tipo box-plot para cada variável.
Tabela : Indicadores Municipais, segundo UF. Brasil.2001
UF 1.DT 2.nasc.vivos 3. Pop. 4.Porc.DP % Não alfab.
Rondônia 92,39 28,24 12,19 53,65 25,57
Acre 45,72 14,90 4,76 38,96 38,85
Amazonas 75,41 68,42 24,56 55,69 32,87
Roraima 80,51 9,61 3,13 36,54 28,84
Pará 86,44 134,74 54,46 30,56 32,77
Amapá 49,83 14,64 4,85 28,48 29,70
Tocantins 95,44 26,64 8,97 39,52 31,43
Maranhão 93,27 108,61 44,81 23,35 40,33
Piauí 95,16 58,65 25,53 25,54 40,19
Ceará 90,00 149,09 75,04 35,73 36,97
Rio Grande do Norte 104,76 53,53 25,88 28,13 35,09
Paraíba 84,83 64,95 33,43 30,81 37,73
Pernambuco 71,77 162,09 76,48 39,67 34,41
Alagoas 98,46 66,79 28,32 22,18 44,08
Sergipe 67,07 39,84 18,05 42,23 35,90
Bahia 62,85 234,75 120,66 28,23 33,33
Minas Gerais 124,59 297,76 176,17 36,41 21,83
Espírito Santo 81,89 57,12 29,57 47,36 21,99
Rio de Janeiro 134,51 242,36 144,22 33,81 16,97
São Paulo 126,72 632,54 374,68 51,26 17,35
Paraná 116,38 167,29 94,90 34,49 19,77
Santa Catarina 99,44 87,88 54,08 39,48 17,04
Rio Grande do Sul 118,40 160,60 103,10 32,96 16,99
Mato Grosso do Sul 127,67 40,07 21,11 35,85 22,10
Mato Grosso 122,57 47,58 24,94 41,86 23,59
Goiás 103,31 92,70 49,72 31,39 22,10
Total 107,74 3106,53 1633,61 38,98 24,76
Fonte: http://tabnet.datasus.gov.br/cgi/sinasc/nvmap.htm ; 05/03/2004
1. Despesas totais com saúde/habitante
2. Número de nascidos vivos (por 1000)
3. Total da população (por 100.000 habitantes)
4. % de despesas com pessoal/Despesas Totais
5. Porcentagem de não alfabetizados
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
26
despesas totais com saúde/habitante
1 3,8 3,8 3,8
1 3,8 3,8 7,7
1 3,8 3,8 11,5
1 3,8 3,8 15,4
1 3,8 3,8 19,2
1 3,8 3,8 23,1
1 3,8 3,8 26,9
1 3,8 3,8 30,8
1 3,8 3,8 34,6
1 3,8 3,8 38,5
1 3,8 3,8 42,3
1 3,8 3,8 46,2
1 3,8 3,8 50,0
1 3,8 3,8 53,8
1 3,8 3,8 57,7
1 3,8 3,8 61,5
1 3,8 3,8 65,4
1 3,8 3,8 69,2
1 3,8 3,8 73,1
1 3,8 3,8 76,9
1 3,8 3,8 80,8
1 3,8 3,8 84,6
1 3,8 3,8 88,5
1 3,8 3,8 92,3
1 3,8 3,8 96,2
1 3,8 3,8 100,0
26 100,0 100,0
45,72
49,83
62,85
67,07
71,77
75,41
80,51
81,89
84,83
86,44
90,00
92,39
93,27
95,16
95,44
98,46
99,44
103,31
104,76
116,38
118,40
122,57
124,59
126,72
127,67
134,51
Total
Valid
Frequency Percent Valid Percent
Cumulative
Percent
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
27
no. de nascidos vivos/habitante
1 3,8 3,8 3,8
1 3,8 3,8 7,7
1 3,8 3,8 11,5
1 3,8 3,8 15,4
1 3,8 3,8 19,2
1 3,8 3,8 23,1
1 3,8 3,8 26,9
1 3,8 3,8 30,8
1 3,8 3,8 34,6
1 3,8 3,8 38,5
1 3,8 3,8 42,3
1 3,8 3,8 46,2
1 3,8 3,8 50,0
1 3,8 3,8 53,8
1 3,8 3,8 57,7
1 3,8 3,8 61,5
1 3,8 3,8 65,4
1 3,8 3,8 69,2
1 3,8 3,8 73,1
1 3,8 3,8 76,9
1 3,8 3,8 80,8
1 3,8 3,8 84,6
1 3,8 3,8 88,5
1 3,8 3,8 92,3
1 3,8 3,8 96,2
1 3,8 3,8 100,0
26 100,0 100,0
9,61
14,64
14,90
26,64
28,24
39,84
40,07
47,58
53,53
57,12
58,65
64,95
66,79
68,42
87,88
92,70
108,61
134,74
149,09
160,60
162,09
167,29
234,75
242,36
297,76
632,54
Total
Valid
Frequency Percent Valid Percent
Cumulative
Percent
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
28
total da população/100.000
1 3,8 3,8 3,8
1 3,8 3,8 7,7
1 3,8 3,8 11,5
1 3,8 3,8 15,4
1 3,8 3,8 19,2
1 3,8 3,8 23,1
1 3,8 3,8 26,9
1 3,8 3,8 30,8
1 3,8 3,8 34,6
1 3,8 3,8 38,5
1 3,8 3,8 42,3
1 3,8 3,8 46,2
1 3,8 3,8 50,0
1 3,8 3,8 53,8
1 3,8 3,8 57,7
1 3,8 3,8 61,5
1 3,8 3,8 65,4
1 3,8 3,8 69,2
1 3,8 3,8 73,1
1 3,8 3,8 76,9
1 3,8 3,8 80,8
1 3,8 3,8 84,6
1 3,8 3,8 88,5
1 3,8 3,8 92,3
1 3,8 3,8 96,2
1 3,8 3,8 100,0
26 100,0 100,0
3,13
4,76
4,85
8,97
12,19
18,05
21,11
24,56
24,94
25,53
25,88
28,32
29,57
33,43
44,81
49,72
54,08
54,46
75,04
76,48
94,90
103,10
120,66
144,22
176,17
374,68
Total
Valid
Frequency Percent Valid Percent
Cumulative
Percent
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
29
porcentagem de despesas com pessoal/despesa total
1 3,8 3,8 3,8
1 3,8 3,8 7,7
1 3,8 3,8 11,5
1 3,8 3,8 15,4
1 3,8 3,8 19,2
1 3,8 3,8 23,1
1 3,8 3,8 26,9
1 3,8 3,8 30,8
1 3,8 3,8 34,6
1 3,8 3,8 38,5
1 3,8 3,8 42,3
1 3,8 3,8 46,2
1 3,8 3,8 50,0
1 3,8 3,8 53,8
1 3,8 3,8 57,7
1 3,8 3,8 61,5
1 3,8 3,8 65,4
1 3,8 3,8 69,2
1 3,8 3,8 73,1
1 3,8 3,8 76,9
1 3,8 3,8 80,8
1 3,8 3,8 84,6
1 3,8 3,8 88,5
1 3,8 3,8 92,3
1 3,8 3,8 96,2
1 3,8 3,8 100,0
26 100,0 100,0
22,18
23,35
25,54
28,13
28,23
28,48
30,56
30,81
31,39
32,96
33,81
34,49
35,73
35,85
36,41
36,54
38,96
39,48
39,52
39,67
41,86
42,23
47,36
51,26
53,65
55,69
Total
Valid
Frequency Percent Valid Percent
Cumulative
Percent
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
30
porcentagem de não alfabetizados
1 3,8 3,8 3,8
1 3,8 3,8 7,7
1 3,8 3,8 11,5
1 3,8 3,8 15,4
1 3,8 3,8 19,2
1 3,8 3,8 23,1
1 3,8 3,8 26,9
2 7,7 7,7 34,6
1 3,8 3,8 38,5
1 3,8 3,8 42,3
1 3,8 3,8 46,2
1 3,8 3,8 50,0
1 3,8 3,8 53,8
1 3,8 3,8 57,7
1 3,8 3,8 61,5
1 3,8 3,8 65,4
1 3,8 3,8 69,2
1 3,8 3,8 73,1
1 3,8 3,8 76,9
1 3,8 3,8 80,8
1 3,8 3,8 84,6
1 3,8 3,8 88,5
1 3,8 3,8 92,3
1 3,8 3,8 96,2
1 3,8 3,8 100,0
26 100,0 100,0
16,97
16,99
17,04
17,35
19,77
21,83
21,99
22,10
23,59
25,57
28,84
29,70
31,43
32,77
32,87
33,33
34,41
35,09
35,90
36,97
37,73
38,85
40,19
40,33
44,08
Total
Valid
Frequency Percent Valid Percent
Cumulative
Percent
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
31
gabarito
Tabela Estatística descritiva dos indicadores municipais das UF brasileiras.
2001
VARIÁVEL média (dp) mediana percentis 25 - 75
valores mínimo e máximo
despesas totais com saúde/hab.
94, 21 (23,88) 94,22 79,23 - 116,89 45,72 - 134,51
no. de nascidos vivos/hab.
117,75 (129, 79) 61,61 40,01 - 160,97 9,61 - 632,54
total da população/ 100.00 hab.
62,83 (77,98) 31,50 20,34 - 81,09 3,13 - 374,68
% de despesas com pessoal/despesa total
36,31 (8,74) 35,79 30,04 - 40,22 22,18 - 55,69
% de pessoas não alfabetizadas
29,15 (8,43) 30,57 21,95 - 36,17 16,97 - 44,08
GABARITO BOX PLOT
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
1
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
2
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
3
A tabela abaixo contem Informações sobre a presença de doença coronariana, idade (anos), sexo, prática regular de exercícios (em horas/semana), IMC (kg/m2), obesidade e pressão arterial sistólica (em mmHg) após teste ergométrico em 40 pacientes da Clínica TAL. Faça uma descritiva completa.
Paciente Doença Idade Sexo Exercícios Filhos IMC Obesidade PAS
1 N 42,0 F 2 3 19,1 ausente 90,2
2 N 34,6 F 0 1 22,3 ausente 104,9
3 N 45,8 F 0 1 18,7 ausente 120,2
4 N 44,8 F 0 0 19,8 ausente 124,5
5 N 40,4 M 0 1 22,9 ausente 131,3
6 N 40,3 M 1 0 24,2 ausente 133,1
7 N 37,0 M 3 2 24,9 ausente 135,1
8 S 50,4 M 0 0 18,8 ausente 139,0
9 N 38,1 M 1 1 21,9 ausente 145,9
10 N 35,1 F 1 1 23,6 ausente 169,1
11 N 44,0 F 1 1 24,2 sobrepeso 105,3
12 N 31,9 F 0 2 29,8 sobrepeso 134,7
13 N 23,3 F 2 3 29,9 sobrepeso 139,3
14 N 52,9 M 0 2 25,7 sobrepeso 141,4
15 N 37,7 M 0 0 29,2 sobrepeso 145,8
16 S 25,7 M 0 1 29,6 sobrepeso 150,6
17 N 46,4 M 1 2 25,1 sobrepeso 152,2
18 N 68,5 M 1 0 27,9 sobrepeso 159,9
19 S 25,0 M 1 0 29,5 sobrepeso 192,2
20 S 28,3 M 0 0 26,1 sobrepeso 193,0
21 N 40,9 F 0 0 34,2 grau I 130,7
22 N 41,2 F 0 2 35,0 grau I 152,1
23 N 56,1 F 0 2 32,0 grau I 161,8
24 S 57,0 F 1 0 34,9 grau I 173,5
25 S 64,7 M 0 2 32,6 grau I 178,3
26 N 52,7 M 2 1 30,2 grau I 178,7
27 N 58,5 M 0 1 34,9 grau I 178,9
28 S 58,5 M 0 3 33,9 grau I 181,2
29 N 42,9 M 1 0 33,7 grau I 190,5
30 S 56,5 M 0 1 35,1 grau I 228,3
31 S 65,3 M 0 2 37,3 grau II 161,3
32 N 44,9 M 0 2 37,7 grau II 185,2
33 S 29,4 M 0 1 39,9 grau II 190,6
34 N 61,6 M 0 1 36,4 grau II 194,5
35 S 72,5 M 0 1 39,8 grau II 200,0
36 S 64,6 F 0 0 38,5 grau II 202,6
37 N 29,7 M 0 2 36,1 grau II 207,5
38 N 82,2 M 0 4 36,9 grau II 209,1
39 S 85,6 F 0 4 35,7 grau II 224,8
40 N 61,7 F 0 2 38,1 grau II 239,0
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
4
AMOSTRAGEM
População alvo população acessívelpopulação em estudo
especificação amostragem
População alvo: características clínicas e demográficas
População acessível: características geográficas e temporais
População em estudo: representativa da população acessível e fácil de
trabalhar
VALIDADES:
externa: a população acessível é representativa da população alvo, em
relação ao fenômeno de interesse?
interna: a população de estudo é representativa da população acessível?
Em resumo, o quanto os resultados da população de estudo podem
ser inferidos para outras populações?
CRITÉRIOS
de inclusão
caracterização da população alvo
definição (no tempo e no espaço) da população acessível
de exclusão
eliminação de indivíduos cuja inclusão diminuiria a qualidade dos
dados e/ou da interpretação dos resultados.
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
5
ESTRATÉGIAS DE AMOSTRAGEM
Amostragem probabilística
Cada unidade amostral (indivíduo) na população tem uma
probabilidade conhecida e diferente de zero de pertencer à amostra.
aleatória simples
sistemática
por conglomerados
com probabilidade proporcional ao tamanho
estratificada
Geralmente utilizada em estudos descritivos
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
6
Amostragem casual simples, sem reposição
Prob individuo pertencer a amostra n
N
n: tamanho da amostra
N: tamanho da população
Amostragem casual simples estratificada, com partilha
proporcional ao tamanho
Seja uma população de tamanho N, composta por i estratos,
com tamanhos Nei .
N N N Ne e ei 1 2 ...
A amostra de tamanho n será composta pelas amostras nei
de cada estrato i
n n n ne e ei 1 2 ...
Para se realizar uma partilha proporcional ao tamanho do
estrato, tem-se que:
n
N
n
Nn n
N
N
ei
ei
ei
ei .
fator de proporcionalidade
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
7
Amostragem sistemática
N
nk intervalo de amostragem
Sorteia-se um início casual (i) no intervalo entre 1
e k 1 i k
A amostra selecionada será:
i i+k i+2k ... i+(n-1) k
Amostragem por conglomerados (cluster)
Conglomerado conjunto de unidades elementares
da população.
ex: bairro, escola, etc.
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
8
Amostragem não probabilística
Geralmente utilizada em estudos analíticos
amostragem consecutiva (cumulativa)
São selecionados os indivíduos que preenchem o(s)
critério(s) de inclusão, em um específico intervalo de tempo ou
tamanho de amostra.
problema: se o tempo de coleta é muito curto, posso não ter
tempo de coletar todos os indivíduos que seriam representativos
da população acessível.
amostragem por conveniência
São selecionados os indivíduos que estão facilmente
disponíveis.
problema: os voluntários poderão não ser representativos da
população acessível (p. ex.: só são coletados dados de indivíduos
mais sadios ou dos mais doentes, ou dos mais expostos, etc).
amostragem intencional
Da população acessível são escolhidos aqueles indivíduos
que se julga serem mais apropriados para o estudo.
problema: é arriscado inferir as conclusões para outras
populações.
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
9
DISTRIBUIÇÕES DE PROBABILIDADES
DISCRETA : distribuição binomial
Esta é uma distribuição típica de um experimento com n repetições
independentes, com 2 resultados possíveis: sucesso e fracasso. As
probabilidades de sucesso (p) e fracasso (q=1-p) são sempre constantes.
Diz-se, então, que X é uma variável aleatória (v.a.) Binomial, com
parâmetros n e p e k. A probabilidade de ocorrerem k sucessos após n
repetições é definida por:
n.p.q e p .n X
q..p k
npn,k,k=XP
2
X
_
k-nk
S
B
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
10
EXERCÍCIOS 1. Assumindo que a probabilidade de nascer um menino é igual à de nascer uma menina, pede-se: a) calcular a probabilidade de um casal ter 3 filhos homens e 2 mulheres. b) calcular a probabilidade de um casal com 3 filhos ter, ao menos, uma menina. c) o número esperado de meninos em um casal de 2 filhos. 2. Certa doença tem letalidade de 70%. Supondo-se que existam 20 pacientes com esta doença, calcular: a) a probabilidade de que todos morram pela doença. b) a probabilidade de que nenhum paciente morra pela doença. c) a probabilidade de que 7 pacientes morram pela doença. d) a probabilidade de que, no máximo, 10 pacientes morram pela doença. e) a probabilidade de que, no mínimo, 5 pacientes sobrevivam. f) o número esperado de óbitos e respectivo desvio padrão. 3. Analisando prontuários de uma maternidade, estimou-se que a probabilidade de um parto ser operatório é de 30%. Sabendo-se que em um mês houve 26 partos, calcular: a) a probabilidade de que a metade dos partos tenha sido operatório. b) a probabilidade de, pelo menos, 20 partos não terem sido operatórios. c) a probabilidade de, pelo menos, 14 partos terem sido operatórios. d) a probabilidade de todos os partos terem sido não operatórios. e) o número médio de partos operatórios e o respectivo desvio padrão. 4. Em uma localidade foram vacinadas 80% das crianças em idade escolar. Ao se escolher uma amostra de 24 crianças em idade escolar, calcular: a) a probabilidade de todas as crianças sorteadas terem sido vacinadas. b) a probabilidade de, pelo menos, metade das crianças sorteadas terem sido vacinadas. c) a probabilidade de, no máximo, 5 crianças sorteadas terem sido vacinadas. d) a probabilidade de que entre 15 a 20 crianças tenham sido vacinadas. e) o número esperado de crianças vacinadas e o respectivo desvio padrão.
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
11
GABARITO
Ex. 1
a)0,3125
b)0,875
c)0,707
Ex. 2
a)0,001
b)0,000
c)0,001
d)0,048
e)0,762
f)Média=14 e dp=2,049
Ex. 3
a)0,016
b)0,296
c)0,009
d)0,000
e)Média=7,8 dp=2,337
Ex. 4
a)0,005
b)1,000
c)0,000
d)0,724
e)Média=19,2 dp=1,9596
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
12
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
13
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
14
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
15
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
16
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
17
DISTRIBUIÇÕES DE PROBABILIDADES CONTÍNUAS
DISTRIBUIÇÃO NORMAL
Definição: a v.a. X tem distribuição normal se sua função distribuição de
probabilidades for:
_
X
_
2
1
p
2
1
) X;(~X :o Notaçã
3,1416= e 718,2
0> e X
XXP e .2
1
2_
2_
2
1
SN
e
S
X
eeS
Xf
x
XS
XX
S
XX
X
dx
p
xx
xS
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
18
Propriedades:
as probabilidades da v.a. podem ser definidas a partir da curva;
a área total é 100%, portanto pode-se trabalhar também com percentis.
%9958,2X
%9596,1X
%2,68X
_
_
_
x
x
x
S
S
S
é simétrica em relação à média
Normal reduzida:
xS
ZNZ
_
X-X onde 1;0~
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
19
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
20
Exercícios
1. Seja X uma variável aleatória normalmente distribuída, com média 8 e desvio padrão 4 ( X~ N (8;4) ). Calcular: a) P( 5 < X < 10) b) P( 9 < X ) c) P( X < 2) d) P( 10 < X < 15) 2. Admitindo-se que a estatura dos habitantes de uma localidade seja uma variável aleatória com distribuição normal, com média 170 cm e desvio padrão de 25 cm, calcular: a) a probabilidade de se encontrar na população indivíduos com mais de 190 cm de estatura. b) a probabilidade de se encontrar na população indivíduos com menos de 158 cm de estatura. c) a probabilidade de se encontrar na população indivíduos entre 140 e 180 cm de estatura. d) o número de indivíduos com menos de 187 cm de estatura, assumindo que o total da população é de 5000 habitantes. 3. As notas de Bioestatística em um determinado curso ocorrem segundo uma distribuição N(7,0 ; 1,6). Calcular a probabilidade: a) de um aluno tirar menos do que 5. b) de um aluno tirar acima de 8. c) de um aluno tirar nota entre 4,5 e 6. d) de um aluno ser aprovado (ié,tirar no mínimo 7) e) de um aluno tirar acima de 4. 4. Supondo-se que a distribuição etária, para uma determinada população com 100000 habitantes, é uma variável aleatória normalmente distribuída com média de 40 anos e desvio padrão de 10 anos, calcular: a) quantas pessoas têm idade acima de 50 anos? b) quantas pessoas têm idade abaixo de 30 anos? c) quantas pessoas têm idade acima de 35 anos? d) quantas pessoas têm entre 20 e 40 anos? e) quantas pessoas têm entre 25 e 60 anos?
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
21
GABARITO
Ex.1
a)46,5%
b)40,1%
c)6,7%
d)26,85%
Ex. 2
a)21,19%
b)31,56%
c)54,03%
d)3759 indivíduos
Ex. 3
a)10,56%
b)25,99%
c)20,66%
d)50%
e)96,93%
Ex. 4
a)15866 indivíduos
b)15866 indivíduos
c)69146 indivíduos
d)47725 indivíduos
e)91044 indivíduos
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
22
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
23
INFERÊNCIA ESTATÍSTICA
É qualquer procedimento que se utiliza para se generalizar afirmações
sobre determinada população, baseadas em dados retirados de uma
amostra.
PARÂMETRO
É a medida usada para se descrever uma característica de uma
população.
ESTATÍSTICA
É uma função dos valores amostrais.
ESTIMAÇÃO
É o processo através do qual uma estatística computa dados de uma
ou mais amostras, para aproximar o valor de um parâmetro ao de uma
característica da população. Ou seja, estima-se o valor de um parâmetro de
uma população baseado no valor obtido em uma amostra.
HIPÓTESE
É uma forma de especulação relativa a um fenômeno estudado
(qualquer que seja).
HIPÓTESE ESTATÍSTICA
É uma especulação feita em relação a uma proposição, porém relativa
à uma população definida.
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
24
ESTIMAÇÃO DE PARÂMETROS POPULACIONAIS
por ponto
X =
X
n
_ ii
média aritmética
p = no. de sucessos
n proporção
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
25
por intervalo (intervalo de confiança-IC)
IC =estimativa por ponto
do parametro
percentil critico da
distribuicao de probabilidades
erro padrão
da estimativa
.
IC X Xn
_ _
t
Sn
x1 1, .
IC p pp q
n
^ ^^ ^
z1 .
X -n
X X X +n
pp.q
np p p
p.q
n
_ _ _
^^
^
^ ^^
^
| | | |
| | | |
. .
__^
erro
erro
tS
tS
z z
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
26
A DISTRIBUIÇÃO t DE STUDENT
A distribuição t de Student , a qual é simétrica em relação a 0, foi
originalmente desenvolvida para descrever a variável aleatória:
T =X - X -
n
, onde T ~ ,
obs : quando n T ~
_
X
_
X_ n -1:graus de liberdade
S St
N
n
1
0 1;
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
27
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
28
EXERCÍCIOS
1. Em uma amostra aleatória de 50 alunos encontrou-se que a altura
média foi de 165 cm (desvio padrão de 15 cm). Construir o intervalo de
confiança para essa média com 90% de confiança.
2. Desejando-se conhecer a média de consumo de carne em uma
determinada população, selecionou-se uma amostra aleatória de 100
pessoas. Os resultados mostraram que, em média, os indivíduos
consumiam 1000 g/mês (desvio padrão de 625 g). Determine o
intervalo de confiança para essa média, com 95% de confiança.
3. Em um estudo sobre o número de atendimentos em um hospital,
encontrou-se que, durante um ano (12 meses), o número médio de
atendimentos por mês foi de 500 pacientes (desvio padrão de 100
pacientes). Determine o intervalo de confiança para essa média, com
98% de confiança.
4. Calcule o intervalo de 95% de confiança para a média das despesas
totais com saúde/habitante, do número de nascidos vivos/habitante, do
total da população/100.000, da porcentagem de despesas com
pessoal/despesa total e da porcentagem de não alfabetizados. (páginas
10 a 12 desta apostila.
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
29
5. Desejando-se conhecer a prevalência de determinada doença na
cidade A, selecionou-se uma amostra aleatória de 500 pessoas. Nesta
amostra encontrou-se 20 doentes. Estimar a prevalência e calcular o
respectivo intervalo de confiança (95%).
6. Para se determinar a letalidade da doença B , acompanhou-se uma
amostra de 30 doentes durante um ano. Após esse período, 5 deles
haviam morrido. Estimar a letalidade da doença B e calcular o
respectivo intervalo de confiança (90%).
7. Desejando-se estimar a proporção de obesos em uma população,
coletou-se uma amostra de 700 pessoas, sendo 350 homens e 350
mulheres. Nesta amostra, havia 130 homens e 70 mulheres obesos.
Estime a proporção de obesos para cada um dos sexos e calcule os
respectivos intervalos de confiança (80%).
8. Os neonatologistas da Maternidade A estão interessados em
conhecer a prevalência de recém-nascidos com baixo peso ao nascer.
Para tanto estudaram todos os nascimentos ocorridos durante o mês
de janeiro. Analisando os dados encontraram que dos 1200
nascimentos, 200 eram de crianças com menos de 2500 gr. Estimar a
prevalência de baixo peso ao nascer e calcular o respectivo intervalo de
95% de confiança.
9. Em uma amostra de 16 gestantes com diagnóstico clínico de pré-
eclâmpsia, a taxa média de ácido úrico no plasma foi de 5,3 mg. Em
gestantes normais a variabilidade a que está sujeita a taxa de ácido
úrico no plasma é de 0,60 mg.
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
30
a) Estime, com 95% de confiança, a taxa média de ácido úrico no plasma da
população de gestantes com diagnóstico de pré-eclâmpsia.
b) Que pressuposições foram necessárias para a estimação do item a)?
10. Em certa área, baseando-se na amostra de 100 recém-nascidos, a
letalidade da diarréia do recém-nascido no verão e outono foi de 40%. Nestas
condições, estime com 99% de confiança, a verdadeira letalidade da diarréia.
11) Desejando-se estimar a eficiência de uma droga, uma amostra de 100
pacientes foi sorteada. Supondo-se que tivessem sido observados:
a) 10 curados
b) 30 curados
c) 90 curados
Quais seriam, respectivamente, os intervalos com 95% de confiança para a
verdadeira eficiência da droga utilizada.
12) Com o intuito de estudar o conteúdo de ácido lático no sangue de
indivíduos com demência precoce amostra de 16 pacientes foi sorteada e os
resultados foram: média ( ) = 13mg/100 cc e desvio padrão (s) = 4,6 mg/100
cc. Estime, através de um intervalo de 98% de confiança, a taxa média de
ácido lático no universo dos pacientes com demência precoce.
13) Com a finalidade de estudar o efeito da aplicação de hormônios
gonadotróficos, no tratamento de gestantes diabéticas, 60 receberam tal
tratamento e, destas, 15 gestantes tiveram, como produto de concepção,
natimortos. Estabeleça, a partir deste resultado, o intervalo com 95% de
confiança para a verdadeira proporção de nascidos vivos, para medir a
eficiência do tratamento.
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
31
GABARITO
1) XIC %95(161,44 – 168,56)
2) XIC %95(876,25 – 1123,75)
3) XIC %95(421,54 – 578,46)
4) XIC %95(84,56 - 103,85)
XIC %95 (65,31 - 170,19)
XIC %95 (31,33 - 94,33)
XIC %95 (32,78 - 39,84)
XIC %95 (25,74 - 32,56)
5) pIC ˆ%95
(0,023 – 0,057)
6) pIC ˆ%95
(0,057 – 0,282)
7) pIC ˆ%95 (0,17 – 0,23)
pIC ˆ%95 (0,34 – 0,40)
8) pIC ˆ%95 (0,149 - 0,191)
9) a)(5,006mg - 5,594mg);
A variabilidade da população de gestantes normais e de
gestantes com diagnóstico de pré-eclâmpsia é a mesma.
10) (0,27 - 0,53)
11) a) (0,041 - 0,159) b) (0,21 - 0,39) c) (0,84 - 0,96)
12) (10,01mg - 15,99mg)
13) (0,64 - 0,86)
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
32
TESTE DE HIPÓTESES
Características de uma boa hipótese:
hipótese simples (hipóteses complexas não podem
ser testadas com um único teste estatístico e devem
ser separadas em 2 ou mais hipóteses simples).
hipótese específica (não leva à ambigüidade sobre
o objeto de estudo e as variáveis ou sobre que teste
estatístico deve ser aplicado).
a hipótese deve ser estabelecida a priori.
HIPÓTESE NULA (H0)
É a que estabelece a base formal para a construção
do teste estatístico.
HIPÓTESE ALTERNATIVA (Ha)
Não é testada diretamente. Ela é aceita quando a
hipótese nula é rejeitada.
obs: escolher, de preferência, a hipótese alternativa bicaudal. A
hipótese monocaudal só deverá ser adotada sempre que
apenas uma direção da associação for possível, ou importante.
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
33
ERROS
DECISÃO VERDADE
H0 Ha
H0 não há erro
Ha
não há erro
: erro tipo I = Prob (rejeitar H0 , quando H0 é verdade)
: erro tipo II = Prob. (aceitar H0 , quando H0 é falsa)
1-: poder do teste
obs:
e entram no calculo do tamanho da amostra n
para um n fixo , tem - se que
NÍVEL DESCRITIVO: valor de p
O nível descritivo do teste (p) é o menor nível de
significância o qual o valor observado da estatística do
teste é significativo.
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
34
Etapas para se fazer um teste de hipótese:
a) Determinar Ho;
b) determinar a estatística;
c) fixar alfa e achar a região crítica; e/ou trabalha-se
com o nível descritivo do teste (p);
d) achar o valor da estatística;
e) verificar o posicionamento da estatística obtida com
os valores observados em relação ao valor crítico.
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
35
TESTE DE UMA MÉDIA POPULACIONAL, com
variância conhecida
1,0~,
:
:
,:
0
0
2
NZ onde
n
XXZ :aestatístic
H
H
nNX estimador
:parametro
c
X
o
a
0
TESTE DE UMA MÉDIA POPULACIONAL, com
variância desconhecida
1
0
0
2
~,
:
:
,:
nc
XX
o
a
0
tt onde
n
S
X
S
Xt :aestatístic
H
H
nNX estimador
:parametro
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
36
EXERCÍCIOS
1. Em uma amostra aleatória de 50 alunos encontrou-se que a altura
média foi de 165 cm (desvio padrão de 15 cm). Testar a hipótese de
que essa média é igual ao esperado, sabendo-se que a média padrão é
170 cm (desvio padrão conhecido=20 cm) (=5%)
2. Idem ao exercício anterior, porém supondo que a variância seja
desconhecida. (=5%)
3. Desejando-se conhecer a média de consumo de carne em uma
determinada população, selecionou-se uma amostra aleatória de 100
pessoas. Os resultados mostraram que, em média, os indivíduos
consumiam 1000 g/mês (desvio padrão de 625 g). Teste a hipótese de
que o consumo médio dessa população está de acordo com o
esperado, que é 1200 g/mês. (=10%)
4. Deseja-se saber se o número médio de atendimentos diário no Posto
de Saúde ZZ é igual à média diária dos postos da rede municipal que é
de 40 atendimentos. Para isso coletou-se a informação dos últimos 20
dias de atendimento e verificou-se que a média é de 30 pacientes por
dia (desvio padrão de 10 pacientes). Faça o teste estatístico para
verificar se o número médio diário de atendimentos no Posto de Saúde
ZZ é igual à média diária dos postos da rede municipais (=2%).
5) Admite-se que a quantidade de carne ingerida por pessoa por
semana (com renda familiar menor do que 3 salários mínimos e
tamanho da família de 5 membros), na região Sudeste, possui
distribuição normal com média 600g e desvio padrão 100g. Deseja-se
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
37
saber se no subdistrito de Pirituba o consumo médio é menor do que
esta quantidade. Para isto foi conduzida uma pesquisa, com nível de
significância de 5%, cujos valores amostrais de consumo são
apresentados a seguir. Elabore de forma completa o teste de hipótese.
Consumo médio semanal (em gramas):300; 400; 350; 450; 100;
220; 150; 500; 900; 800; 600; 150; 50; 170; 370; 220.
6) Em indivíduos sadios, o consumo renal médio de oxigênio tem
distribuição normal com média igual a 12 cc/minuto e desvio padrão de
1,5 cc/minuto. Um pesquisador interessado em saber se indivíduos com
insuficiência cardíaca tinham consumo maior, fixou = 5%. Supondo
que para o tamanho da amostra de 35 pessoas o consumo médio de
oxigênio tivesse sido 19 cc/minuto, qual seria a conclusão?
7) Com dados da tabela abaixo, diga se o nível de proteína desses
pacientes é significativamente menor (=5%) que o nível de proteína no
plasma em indivíduos sadios, cuja média é 7,0g/100cc.
Tabela 9.6 - Distribuição dos pacientes com endocardite sub-aguda
bacteriana segundo nível de proteína no plasma sanguíneo (g/100cc).
Local X, ano Y.
Proteína do plasma Nº de pacientes
4,1 1 4,6 2 5,3 3 5,7 4 6,0 3 6,8 2 7,6 1
Total 16
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
38
GABARITO
1)Aceita Ho
2)Rejeita Ho
3)Rejeita Ho
4)Rejeita Ho
5)
X: quantidade de carne ingerida (gramas)
X~N(m=600, =100)
H m m
H m m
Pirituba Sudeste
a Pirituba Sudeste
0:
:
= 5%
xobs=358,13g
zcrítico = -1,64
zobservado = -9,68 Decisão : Rejeita-se H0
Conclusão : O consumo médio de carne ingerida por pessoa por semana, no sub-distrito de Pirituba, é
menor do que o consumo médio da região Sudeste, em um nível de significância de 5% ( = 0,05).
Caso o desvio padrão fosse desconhecido, usar-se-ia a distribuição t-Student
Para = 5% tcrítico = -1,753
tobservado = -3,94 Decisão : Rejeita-se H0
Conclusão : O consumo médio de carne ingerida por pessoa por semana no sub-distrito de Pirituba é
menor do que o consumo médio da região Sudeste, em um nível de significância de 5% ( = 0,05).
13)
X: concentração de CO2 plasmático (volume/100cc)
X~N(m=55; =?)
S=9vol/100cc
H m vol cc
H m vol cc
FB
a FB
0 55 100
55 100
: /
: /
Para 1%, n=12 e xobs =58vol/100cc
tobservado = 1,155; tcrítico = 3,106 Decisão : Aceita-se H0
Conclusão : Não há evidência estatística para detectar diferença entre a média dos recém-
nascidos normais e a dos nascidos com fibroma pulmonar, em um nível de significância de 1%.
14)
X: consumo renal de oxigênio (cc/minuto)
X~N(m=12; =1,5)
Para 5%, =10% e d = 1,5
1) H m cc minuto
H m cc minuto
E
a E
0 12
12
: /
: /
2) para os valores de , d e especificados, obtém-se um tamanho de amostra n=4
xobs =19cc/minuto
zobservado = 9,33; zcrítico = 1,64 Decisão : Rejeita-se H0
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
39
Conclusão : O consumo médio renal de O2 em pacientes com insuficiência cardíaca é
estatisticamente maior do que o consumo médio em indivíduos sadios, em um nível de significância de
5% ( =5%).
15)
X: nível de proteína (g/100cc)
X~N(m=7; =?)
H m g cc
H m g cc
E
a E
0 7 100
7 100
: /
: /
n=16; xobs= 5,7g/100cc e S=0,885g/100cc
Para 5%, tobservado = -5,876; tcrítico = -1,753 Decisão : Rejeita-se H0
Conclusão : O nível de proteína no plasma sangüíneo de pacientes com endocardite sub-aguda
bacteriana é estatisticamente menor do que o de indivíduos sadios, em um nível de significância de 5%
( =5%).
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
40
TESTE DE UMA PROPORÇÃO
)(Exata! Binomial ãoDistribuiç :computador No
NZ onde ,
n
pp
ppppZ :aestatístic
pnpnpNB3p)-np(1 quando
simétricaé binomial ãodistribuiç 2
1p quando
ppH
ppH
n
p)-p(1 p,Np
ou p),Binomial(n~X onde ,n
Xp :estimador
p :parâmetro
p
o
a
1,0~)ˆ1(ˆ
ˆˆ
)1(;
ˆ:
ˆ:
ˆ
ˆ
0
00
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
41
EXERCÍCIOS
1) Certa enfermidade, quando tratada pela terapia usual, apresenta
50% de curas, isto é, Ep=50%. Uma nova terapia foi proposta com o
intuito de elevar esta percentagem de curas. Com o objetivo de testar a
nova terapia contra a usual, 15 pacientes (com características
semelhantes) foram tratados pela nova terapia. Nestas condições:
a) Formule as hipóteses correspondentes ao teste;
b) adotando a seguinte regra de decisão: "rejeitar H0 se na amostra de
15 pacientes houver 12, 13, 14, ou 15 curados", calcule:
b1) a probabilidade de rejeitar H0 se H0 fosse verdadeira;
b2) a probabilidade de aceitar H0 se H1: En = 60% fosse
verdadeira;
b3) a probabilidade de aceitar H0 se H1: En = 70% fosse
verdadeira;
b4) a probabilidade de aceitar H0 se H1: En = 80% fosse
verdadeira.
c) Calcule as probabilidades indicadas no item b), adotando a seguinte
regra de decisão: "rejeitar H0 se na amostra de 15 pacientes houver 13
ou mais curados".
3) Em certa área, os relatórios hospitalares informaram um total de
20.000 nascimentos dos quais 18.000 foram considerados partos
normais, isto é, uma proporção de 90%. Uma nova maternidade foi
instalada nesta área e durante um mês ocorreram 20 partos, dos quais
apenas 16 foram considerados normais, isto é, uma proporção de 80%.
Nestas condições, trabalhando a um nível de significância de 5% (ou
mais próximo de 5%) diga se concorda com as autoridades sanitárias
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
42
que concluíram que na nova maternidade a proporção de partos
normais é significantemente menor do que 90%.
4) Em certa comunidade durante um período de vários anos, a
meningite meningocócica tem apresentado uma fatalidade de 20% para
o grupo etário de 20 |-- 45 anos. Em 1999 nessa localidade, a
meningite meningocócica se manifestou em 15 indivíduos desse grupo
etário. Dos 15 casos (os quais eram semelhantes aos usualmente
encontrados na referida localidade), a investigação de rotina verificou
que 4 morreram. A fim de saber se a fatalidade por meningite
meningocócica aumentou em 1999, faça um teste de hipóteses
adotando um nível de significância de 1% (ou aproximadamente de
1%).
5) A resistência ao "resfriado comum" em uma dada indústria, durante o
inverno, é de 0,60. Foi proposto um tratamento preventivo com a
finalidade de aumentar para 0,70 a resistência ao "resfriado". Então:
a) formule as hipóteses.
b) fixando α= 0,05 (ou valor mais próximo) e admitindo ter sido sorteada
uma amostra de tamanho n=20. Como resultado observou-se que 4
operários ficaram resfriados. Nestas condições, qual é a conclusão
quanto à eficiência do medicamento?
6) Para se determinar a letalidade da doença B , acompanhou-se uma
amostra de 30 doentes durante um ano. Após esse período, 5 deles
haviam morrido. Testar a hipótese de que essa letalidade é igual a
20%.(α=10%)
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
43
7) Certa comunidade apresentou num período de vários anos
incidência da doença X de 12 por 10.000 hab.. Em 1999, a incidência
foi de 70 casos e a população estimada foi igual a 50.000 habitantes.
Nestas condições, em um nível de significância de 1% (ou mais
próximo) diga se concorda com as autoridades sanitárias que
consideraram a situação dentro do esperado.
8) Desejando-se conhecer a prevalência de determinada doença na
cidade A, selecionou-se uma amostra aleatória de 500 pessoas. Nesta
amostra encontrou-se 20 doentes. Teste a hipótese de que a
prevalência é semelhante ao que é descrito na literatura
(p=10%).(=5%)
10. Para se determinar a letalidade da doença B , acompanhou-se uma
amostra de 30 doentes durante um ano. Após esse período, 5 deles
haviam morrido. Testar a hipótese de que essa letalidade é igual a
20%.(=10%)
11. Em uma amostra de 88 pacientes atendidos no ambulatório do
Departamento de Oncologia Clínica, verificou-se que 38 eram
fumantes. Teste a hipótese de que a porcentagem de fumantes
atendidos neste ambulatório é igual ao referido na literatura
(50%).(=4%)
12. Estima-se que um medicamento A provoque efeitos colateral em
55% dos pacientes. Deseja-se testar se uma nova droga tem menos
efeitos colaterais que A. Para tanto, tratou-se 50 pacientes com a nova
droga e 30 deles apresentaram efeitos colaterais. Há diferença entre
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
44
as proporções de pacientes com efeitos colaterais nos dois
medicamentos? (=1%)
13. Sabe-se que na cidade Y, 40% dos homens são obesos. Estudou-
se uma amostra de 200 mulheres desta mesma cidade e verificou-se
que havia 50 obesas. A prevalência de obesos entre os homens é igual
à das mulheres? (=2%)
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
45
GABARITO
1)
H E
H E
N
a N
0 0 50
0 50
: ,
: ,
n=15
b1) 1,76% c1) = 0,37%
b2) 90,95% c2) 97,29%
b3) 70,31% c2) 87,32%
b4) 35,18% c2) 60,2%
2)
,p 16
200 8
H
H a
0 0 90
0 90
: ,
: ,
5% Decisão : Aceita-se H0
Conclusão : Não há evidência estatística para concordar que a nova maternidade tenha uma menor
proporção de partos normais, a um nível de significância de 5%.
3)
anteriora
anterior
FatalidadeFatalidadeH
FatalidadeFatalidadeH
1999
19990
:
2,0:
Decisão : Aceita-se H0
1%
Conclusão : Não há evidência estatística para confirmar que a fatalidade de 1999 é maior do que a
fatalidade dos anos anteriores, com nível de significância próximo a 1%.
4)
1) H resistencia
H resistenciaa
0 0 6
0 6
: ,
: ,
2) 5%; n=20
4 operários ficaram resfriados portanto 16 operários não ficaram doentes
Decisão : Rejeita-se H0
Conclusão: A mediação permitiu que a resistência ao resfriado aumentasse, a um nível de significância
5%.
5)
H letalidade
H letalidadea
0 0 2
0 2
: ,
: ,
=10%; n=30
5 doentes foram a óbito
Decisão : Aceita-se H0
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
46
Conclusão: A letalidade da doença é igual a 0,20 a um nível de significância 10%.
6)
H
H
anterior
a anterior
0 85
85
:
:
1%; zcrítico = 2,58 ; zobservado = 1,29 Decisão : Aceita-se H0
Conclusão : Não há evidência estatística para discordar das autoridades sanitárias, com nível de
significância próximo a 1%.
7)Rejeita Ho
8)Aceita Ho
9)Aceita Ho
10) Aceita Ho
11)Rejeita Ho
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
47
TESTE PARA DUAS MÉDIAS POPULACIONAIS
Observações dependentes Teste t-pareado
222
211
:
:
)Var(X e )E(X com 2, instante no ,populaçãona interesse de Variável X
)Var(X e )E(X com 1, instante no ,populaçãona interesse de Variável X
222
111
Definimos a variável:
2
:
DD21 Var(D) e E(D) com ,X-XD
2, e 1 instantes nos interesse de variávelda valores os entre Diferença D
E o problema se reduz a um teste para uma média!
Hipóteses: H
H
Da
D
0:
0:0
Parâmetro: D
Estimador:
n ,ND
2D
D
~
Estatística do teste: t
n
S
DT n
D
D1~
onde
n
D
D
n
i
i 1 e
1
1
2
n
DD
S
n
i
i
D
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
48
TESTE PARA DUAS MÉDIAS POPULACIONAIS
Observações independentes Teste t-Student
222
211
:
:
)Var(X e )E(X com 2, populaçãona interesse de Variável X
)Var(X e )E(X com 1, populaçãona interesse de Variável X
222
111
Hipóteses:
210
21
210
21
210
0:
0:
0:
0:
:
:
D
Da
D
aa
onde H
H
H
H
H
H
Parâmetro: 21 D
Estimador:
2
22
1
21
DDnn
,NXXX
~21
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
49
Estatística do teste:
Se as variâncias forem conhecidas (pouco provável‼)
1,0~)(
2
22
1
21
2
22
1
21
2121 N
nn
X
nn
XXZ DD
Se as variâncias forem desconhecidas e diferentes
t
n
S
n
S
X
n
S
n
S
XXT DD ~
)(
2
22
1
21
2
22
1
21
2121
onde
1
)/(
1
)/(
)//(
2
22
22
1
21
21
22
221
21
n
nS
n
nS
nSnS
Se as variâncias forem desconhecidas e iguais
2
212
2
1
2
2121
21~
11
)(
nn
comb
DD
combcomb
t
nnS
X
n
S
n
S
XXT
onde
2
)1()1(
21
222
2112
nn
SnSnScomb
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
50
Com
para
ndo
as m
édia
s de
dua
s po
pula
ções
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
51
EXERCÍCIOS
1. Para avaliar a eficácia de uma droga no combate à hipertensão, 10
pacientes hipertensos foram selecionados aleatoriamente e tratados com a
droga durante 6 semanas. A Tabela abaixo contém as medidas da pressão
sanguínea diastólica (mmHg) de cada paciente antes do tratamento e após
seis semanas. Faça o teste de hipóteses correspondente. Use = 5%.
Paciente 1 2 3 4 5 6 7 8 9 10
Antes 90 115 95 87 99 105 90 97 99 110
Após 6 semanas 86 97 100 78 89 100 87 99 84 93
2. A tabela seguinte mostra os efeitos de um placebo e da hidroclorotiazida
sobre a pressão sanguínea sistólica de 11 pacientes. Teste a hipótese
correspondente ao nível de significância de 5%. Podemos afirmar que existe
diferença na pressão sistólica média durante a utilização desses dois
fármacos?
Paciente 1 2 3 4 5 6 7 8 9 10 11
Placebo 211 210 210 203 196 190 191 177 173 170 163
H-cloro 181 172 196 191 167 161 178 160 149 119 156
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
52
3. Para avaliar a eficácia de um tratamento para desintoxicação de chumbo,
foi selecionada uma amostra aleatória de 10 crianças expostas a esse metal.
Os níveis séricos de chumbo (µg/dl) foram medidos antes do tratamento e
após 4 semanas. Os dados estão na tabela a seguir. Faça o teste de
hipóteses correspondente. Existe uma diferença significante entre os níveis
séricos de chumbo antes e depois a um nível de 0.05? E a um nível de 0.01?
Criança 1 2 3 4 5 6 7 8 9 10
Antes 10.5 10.5 9.4 11.8 9.5 10 10.2 9.5 11 9.2
Depois 8.2 7.9 9.9 9.6 9.5 8.1 7.8 7.1 11.2 7.2
4. Para avaliar a eficácia da droga Lipitor na redução dos níveis de colesterol,
62 pacientes com altos níveis de colesterol foram divididos em dois grupos.
Um deles recebeu a droga enquanto o outro recebeu placebo. Todos os
pacientes foram submetidos a uma dieta alimentar apropriada. Ao final do
tratamento, foi obtida a redução nos níveis de colesterol atingida por cada
paciente. Os resultados estão sumarizados na tabela a seguir. Teste as
hipóteses pertinentes.
Lipitor Placebo
média 89.7 61.2
desvio padrão 13.87 8.75
No. pacientes 41 21
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
53
5. Um laboratório que fabrica comprimidos analgésicos anuncia que seu
remédio contra dor de cabeça leva em média 15 min para aliviar a dor. Um
médico sustenta que o tempo é maior e seleciona aleatoriamente 31
pacientes. Pede a eles que tomem tais pílulas quando tiverem dor de cabeça,
anotando o tempo (em minutos) até o alivio da dor. Após coletar todas as
respostas, ele verifica que o tempo médio de alivio para esses pacientes foi
de 17.3 min, com desvio padrão de 8 min. Faça o teste de hipóteses
correspondente. Os resultados confirmam a afirmação feita pelo médico? Use
= 5%.
6. Para avaliar as características da ingestão calórica na presença de bulimia,
foi selecionado um grupo de mulheres que sofriam de bulimia e um grupo de
mulheres saudáveis. Todas as pacientes tinham composição corporal e níveis
de atividade física similares. As medidas de ingestão calórica diária (kcal/kg)
estão sumarizadas na tabela abaixo. Faça o teste de hipóteses
correspondente. Use = 1%.
Bulímicas Saudáveis
No.de pacientes 41 31
Média 19.3 26.2
Desvio padrão 9.2 16.5
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
54
Teste de associação pelo 2
variável 1 variável 2 TOTAL
1 ... j
1 n1
... ...
i ni
TOTAL m1 .... mj N
E =n m
Nij
i j.
caselas de no. k
1-colunas de no.1-linhas de no.
=liberdade de graus de no.=m
onde ,E
EO :aestatistic
associaçãohá : H
ciaindependênhá H
m
2
c
k k
kk2
o
a
0
:
.
~
:
2
2
limitações: . N<20: Teste exato de Fisher
. 20N<40 teste 2 somente se freqüências da tabela do esperado forem 5
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
55
Com correção de Yates:
O E
Ec
2 k k
k
0 5
2,
k
Coeficiente de associação de Yule (Y)
Variável 1 Variável 2 TOTAL
sim não
sim a b a+b
não c d c+d
TOTAL a+c b+d N=a+b+c+d
Ya d b c
a d b cY
. .
. ., onde: 1 1
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
56
DISTRIBUIÇÃO m m2 (qui - quadrado com graus de liberdade)
É a melhor medida para se avaliar as diferenças
entre uma distribuição de freqüências teórica (E) e a
obtida através de uma amostra (O).
A suposição básica é a de que os prováveis erros
aleatórios existentes na amostra são constantes e
pequenos em toda a distribuição.
mi
k
m
m
Z
N n
22
1
212
2 22 1
O E
E : graus de liberdade
aproximaç ã o da Normal para
aproximaç ã o para Normal
quando n
; 1
i i
i
2
2
~
~
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
57
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
58
EXERCÍCIOS
1. Um estudo investigou alguns possíveis fatores de risco para câncer
em criança e os resultados estão apresentados nas tabelas 2 e 3
(dados hipotéticos). Analise a possível associação entre a presença de
câncer em criança menor de 12 anos e o fato de o pai ser trabalhador
rural (tabela 2). Faça o mesmo em relação a antecedentes familiares
de câncer (tabela 3).
Tabela 2- Número de crianças menores de 12 anos, segundo a presença de câncer e o pai ser trabalhador rural. Local X, 1990.
presença de pai trabalhador rural
câncer Sim Não Total
Sim 4 6 10
Não 50 50 100
Total 54 56 110
Fonte: dados hipotéticos
Tabela 3- Número de crianças menores de 12 anos, segundo a presença de câncer e antecedentes familiares de câncer. Local X, 1990.
presença de antecedente
s
de câncer
câncer Sim Não Total
Sim 8 2 10
Não 20 80 100
Total 28 82 110
Fonte: dados hipotéticos
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
59
2. Os dados a seguir referem-se ao trabalho “Análise de sobrevida em pacientes com lúpus eritematoso sistêmico”. (LATORRE, L.C. - Tese apresentada à Faculdade de Saúde Pública da USP para a obtenção do título de Doutor - 1997). Faça o teste de associação para as tabelas a seguir:
a) Tabela 17. Número de pacientes com LES, segundo ocorrência de óbito e sexo. Clínica de Reumatologia do Hospital Heliópolis. São Paulo - 1978 a 1995.
sexo óbito Total
sim não
feminino 32 203 235
masculino 5 13 18
Total 37 216 253
p=0,1551 Y= -0,42
b) Tabela 18. Número de pacientes com LES, segundo ocorrência de óbito e presença de envolvimento cárdio-pulmonar. Clínica de Reumatologia do Hospital Heliópolis. São Paulo - 1978 a 1995.
envolvimento óbito Total
cárdio-pulmonar sim não
não 16 147 163
pulmão 10 38 48
coração 3 15 18
pulmão+coração 8 16 24
Total 37 216 253
p=0,0103
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
60
c) Tabela 19. Número de pacientes com LES, segundo ocorrência de óbito e presença de insuficiência renal terminal (IRT). Clínica de Reumatologia do Hospital Heliópolis. São Paulo - 1978 a 1995.
IRT óbito Total
sim não
sim 8 13 21
não 29 203 232
Total 37 216 253
p=0,0049 Y= 0,62
d) Tabela 20. Número de pacientes com LES, segundo ocorrência de óbito e presença de hipertensão arterial (HA). Clínica de Reumatologia do Hospital Heliópolis. São Paulo - 1978 a 1995.
HA óbito Total
sim não
sim 10 62 72
não 27 154 181
Total 37 216 253
p=0,9907 Y= -0,04
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
61
3) Analise, a possível associação (nível de significância de 5%), entre as variáveis das tabelas abaixo:
Número de óbitos por suicídio segundo sexo e meio utilizado. Local X, 1999. (dados hipotéticos)
Meio Sexo
utilizado Masculino
Feminino Total
Envenenamento
31 44 75
Enforcamento
89 16 105
Total 120 60 180
Número de pacientes segundo presença de câncer de esôfago e hábito de fumar. Local X, ano Y. (dados hipotéticos).
Hábito de Presença de câncer
fumar Sim Não Total
Sim 65 115 180 Não 35 85 120
Total 100 200 300
Respostas: Há associação estatisticamente significante entre sexo e meio utilizado no suicídio. A associação é negativa (Y=-0,77) concluindo-se que os homens utilizam mais enforcamento do que as mulheres, para um nível de significância =5%.
Não existe associação estatisticamente significativa entre fumar e ter câncer de esôfago, em um nível de significância de 5%.
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
62
MEDIDAS DE RISCO
DOENTE NÃ0 DOENTE TOTAL
EXPOSTO a b a+b
NÃO EXPOSTO c d c+d
TOTAL a+c b+d N=a+b+c+d
Delineamento:
estudo transversal: N é fixo
estudo caso-controle: (a+c) e (b+d) fixos
estudo de coorte: (a+b) e (c+d) fixos
estudo ecológico: a, b, c e d desconhecidos Medidas de risco:
RR: risco relativo RR =
a
a + bc
c + d
OR: odds ratio OR =a
bc
d
a.d
b.c
RP: razão de prevalências RP =
a
a + bc
c + d
densidade de incidência, incidência acumulada.
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
63
NOÇÕES DE CORRELAÇÃO
COVARIÂNCIA
É o valor médio do produto dos desvios de X e Y, em relação às suas
respectivas médias.
__
ii
iiii
_
i
_
i
XY YXnYX1-n
YXYXn
1-n
YYXX
S
COEFICIENTE DE CORRELAÇÃO ( )
Mede o grau de dependência entre 2 variáveis X e Y.
Y e X de unidades das depende não ié, dimensão, possui não b)
+11- a)
: ESPROPRIEDAD
n
YY
n
XX
n
YXYX
YYXX
YYXX
YX,Cov= : DEFINIÇÃO
2
i2
i
2
i2
i
ii
ii
2_
i
2_
i
_
i
_
i
YXYX
XY
r
r
r
SSSS
Sr
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
64
Exercício:
Vamos supor que a variável dependente (Y) seja DT e as demais as
variáveis independentes. Calcular o coeficiente de correlação entre as
despesas totais com saúde/habitante e o número de nascidos
vivos/habitante, o total da população/100.000, a porcentagem de despesas
com pessoal/despesa total e a porcentagem de não alfabetizados.
Indicadores Municipais, segundo UF. Brasil.2001
UF 1.DT 2.nasc.vivos 3. Pop. 4.Porc.DP % Não alfab.
Rondônia 92,39 28,24 12,19 53,65 25,57
Acre 45,72 14,90 4,76 38,96 38,85
Amazonas 75,41 68,42 24,56 55,69 32,87
Roraima 80,51 9,61 3,13 36,54 28,84
Pará 86,44 134,74 54,46 30,56 32,77
Amapá 49,83 14,64 4,85 28,48 29,70
Tocantins 95,44 26,64 8,97 39,52 31,43
Maranhão 93,27 108,61 44,81 23,35 40,33
Piauí 95,16 58,65 25,53 25,54 40,19
Ceará 90,00 149,09 75,04 35,73 36,97
Rio Grande do Norte 104,76 53,53 25,88 28,13 35,09
Paraíba 84,83 64,95 33,43 30,81 37,73
Pernambuco 71,77 162,09 76,48 39,67 34,41
Alagoas 98,46 66,79 28,32 22,18 44,08
Sergipe 67,07 39,84 18,05 42,23 35,90
Bahia 62,85 234,75 120,66 28,23 33,33
Minas Gerais 124,59 297,76 176,17 36,41 21,83
Espírito Santo 81,89 57,12 29,57 47,36 21,99
Rio de Janeiro 134,51 242,36 144,22 33,81 16,97
São Paulo 126,72 632,54 374,68 51,26 17,35
Paraná 116,38 167,29 94,90 34,49 19,77
Santa Catarina 99,44 87,88 54,08 39,48 17,04
Rio Grande do Sul 118,40 160,60 103,10 32,96 16,99
Mato Grosso do Sul 127,67 40,07 21,11 35,85 22,10
Mato Grosso 122,57 47,58 24,94 41,86 23,59
Goiás 103,31 92,70 49,72 31,39 22,10
Total 107,74 3106,53 1633,61 38,98 24,76
Fonte: http://tabnet.datasus.gov.br/cgi/sinasc/nvmap.htm ; 05/03/2004
1. Despesas totais com saúde/habitante
2. Número de nascidos vivos (por 1000)
3. Total da população (por 100.000 habitantes)
4. % de despesas com pessoal/Despesas Totais
5. Porcentagem de não alfabetizados
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
65
Gabarito
Tabela. Coeficientes de correlação de Pearson (r) entre as despesas totais
com saúde/habitante e as demais variáveis de estudo.
variável r (p)
número de nascidos vivos/habitante 0,44 (p=0,025)
total da população/100.000 0,048 (0,014)
porcentagem de despesas com pessoal/despesa total 0,01 (p=0,970)
porcentagem de não alfabetizados -0,60 (p=0,001)
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
66
no. de nascidos vivos/habitante
7006005004003002001000
de
sp
esa
s t
ota
is c
om
sa
úd
e/h
ab
ita
nte
140
120
100
80
60
40
20
0
total da população/100.000
4003002001000
de
sp
esa
s t
ota
is c
om
sa
úd
e/h
ab
ita
nte
140
120
100
80
60
40
20
0
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
67
porcentagem de despesas com pessoal/despesa total
6050403020100
de
sp
esa
s t
ota
is c
om
sa
úd
e/h
ab
ita
nte
140
120
100
80
60
40
20
0
porcentagem de não alfabetizados
50403020100
de
sp
esa
s t
ota
is c
om
sa
úd
e/h
ab
ita
nte
140
120
100
80
60
40
20
0
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
68
O MODELO DE REGRESSÃO LINEAR
SIMPLES
A função que determina uma reta é: Y = 0 + 1 X.
Porém, como se deseja fazer uma estimativa, a
reta de regressão estimada pode ser escrita da
seguinte maneira:
Y^
= ^
0 + ^
1 X , e Y = 0 + 1 X+ε , onde = erro =Y - Y^
^
0 e ^
1 são estimados pelo Método dos Mínimos
Quadrados da seguinte maneira:
Em uma amostra de tamanho n tem-se n pares de
observações das v.a. X e Y: (X1, Y1), ... (Xn,Yn) e n
equações do tipo .
Somando-se todas as n equações, tem-se:
n
iii
n
iX
110
1i
Y
A soma (S) dos quadrados dos desvios () é:
i
i
n
i i
i
n
Y X2
1
0 1
2
1
^ ^
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
69
Para se encontrar os valores de 0 1 e que
minimizam a equação acima deve-se derivá-la em
relação a 0 1 e , igualando as equações a zero. (Não
se preocupem que não irei demonstrar isso nesse
curso!!).
Dessa maneira os valores estimados para 0 1 e
são:
^
1
1 1
1
2
1
n X Y X Y
n X X
i
=1
i i
i i
2
i
n
i
i
n
i
n
i
n
i
n
1
1
2
1
^
_
X X Y Y
X X
i i
_
i
_
i
n
i
n
^ ^
0 1 Y X_ _
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
70
PRECISÃO DA RETA ESTIMADA
Considera-se a seguinte identidade:
Y Y Y Y Y Yi i
^
i
_^
i
_
.
Elevando-se ao quadrado os 2 lados da igualdade
acima e fazendo-se a soma de todas as n equações
(i=1,2, ...,n), obtem-se:
Y Y Y Y + Y Yi
_
i
^
i
2
i
^
i
n
i
n
i
n
1
2 2
11
_
+ 0
SQT SQR SQM
SQT: soma de quadrados total, ié, soma dos
quadrados dos desvios do valor de Y da i-ésima observação em relação à média dos Y.
SQR: soma dos quadrados devido aos resíduos,
ié,a soma dos quadrados dos desvios entre o valor de Y da i-ésima observação e seu valor estimado.
SQM: soma dos quadrados devido à regressão, ié,
a soma dos quadrados dos desvios do valor estimado de Y para a i-ésima observação e a média dos Y.
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
71
Y Y Y Y + Y Yi
_
i
^
i
2
i
^
i
n
i
n
i
n
1
2 2
11
_
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
72
Isso significa que a variação total dos Y's sobre
sua média pode ser explicada uma parte pela linha de
regressão e outra pelos resíduos. Se todos os Y's
caíssem sempre na linha de regressão a SQR seria
zero!!
Portanto, quanto mais a SQM for próxima da SQT
melhor.
Daí deriva-se uma medida quantitativa de
precisão da reta estimada denominada r2.
melhor ,1r mais quanto
1r0 SQT
SQMr
2
22
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
73
2
1
^
1
1
1,2^
1
~
2
0:
0:
2
nc
X
o
a
o
X
n
tt onde ,
n
SQR
1-nS t
H
H
: hipotese de testeO
1-nS
n
SQR
t = IC
: (IC) Confianca de IntervaloO
EXERCÍCIO Estimar a reta de regressão para modelos em que a variável dependente é a variável despesas totais com saúde/habitante e as demais são as variáveis independentes (número de nascidos vivos/habitante, o total da população/100.000, a porcentagem de despesas com pessoal/despesa total e a porcentagem de não alfabetizados).
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
74
GABARITO
Coefficients a
84,729 5,855 14,471 ,000 72,645 96,813
,080 ,034 ,438 2,384 ,025 ,011 ,150
(Constant )
no. de nascidos
v ivos/habitante
Model
1
B Std. Error
Unstandardized
Coef f ic ients
Beta
Standardized
Coef f ic ients
t Sig. Lower Bound Upper Bound
95% Conf idence Interval f or B
Dependent Variable: despesas totais com saúde/habitantea.
Coefficients a
85,072 5,444 15,626 ,000 73,836 96,308
,145 ,055 ,475 2,643 ,014 ,032 ,259
(Constant )
total da população/100.000
Model
1
B Std. Error
Unstandardized
Coef f ic ients
Beta
Standardized
Coef f ic ients
t Sig. Lower Bound Upper Bound
95% Conf idence Interv al f or B
Dependent Variable: despesas totais com saúde/habitantea.
Coefficients a
93,445 20,793 4,494 ,000 50,531 136,359
,021 ,557 ,008 ,038 ,970 -1,129 1,171
(Constant )
porcentagem de despesas
com pessoal/despesa total
Model
1
B Std. Error
Unstandardized
Coef f ic ients
Beta
Standardized
Coef f ic ients
t Sig. Lower Bound Upper Bound
95% Conf idence Interval f or B
Dependent Variable: despesas totais com saúde/habitantea.
Coefficients a
143,965 13,985 10,294 ,000 115,101 172,829
-1,707 ,462 -,602 -3,698 ,001 -2,660 -,754
(Constant )
porcentagem de
não alf abetizados
Model
1
B Std. Error
Unstandardized
Coef f ic ients
Beta
Standardized
Coef f ic ients
t Sig. Lower Bound Upper Bound
95% Conf idence Interv al f or B
Dependent Variable: despesas totais com saúde/habitantea.
MARIA DO ROSARIO DIAS DE OLIVEIRA LATORRE HEP-146 - 2015
75
PROJETO DE PESQUISA
Introdução: justificativa fundamentada
quadro teórico Objetivos
Hipótese
Metodologia:
o delineamento o organização
o amostratamanho (poder e custo)
selecao
o medidas e instrumento
o análises previstas
o Questões éticas o Cronograma o Orçamento
Top Related