FAR503_1aLista_exercicios

13
UNIVERSIDADE FEDERAL DE OURO PRETO PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIAS FARMACÊUTICAS Disciplina: FAR503 – Bioestatística Professor: Ricardo Tavares 1ª Lista de Exercícios Questões - revisão 1) Classifique cada uma das variáveis abaixo em qualitativa (nominal / ordinal) ou quantitativa (discreta / contínua): a) Ocorrência de hipertensão pré-natal em grávidas com mais de 35 anos ( sim ou não são as possíveis respostas para esta variável). b) Intenção de voto para presidente (possíveis respostas são os nomes dos candidatos, além de não sei). c) Perda de peso de maratonistas na Corrida de São Silvestre, em quilos. d) Intensidade da perda de peso de maratonistas na Corrida de São Silvestre (leve, moderada, forte). e) Grau de satisfação da população brasileira com relação ao trabalho de seu presidente ( valores de 0 a 5, com 0 indicando totalmente insatisfeito e 5 totalmente satisfeito). 2) Fale sobre a diferença entre população e amostra, e explique quais são as vantagens do uso da amostragem. 3) Para as situações abaixo, identifique a população e a amostra correspondente. Discuta a validade do processo de inferência estatística para cada um dos casos. a) Para avaliar a eficácia de uma campanha de vacinação em MG, 200 mães de recém-nascidos, durante o primeiro semestre de um dado ano e em uma dada maternidade em MG, foram perguntadas a respeito da última vez em que vacinaram seus filhos; b) Uma amostra de sangue foi retirada de um paciente com suspeita de anemia; c) Para verificar a audiência de um programa de TV, 563 indivíduos foram entrevistados por telefone com relação ao canal em que estavam sintonizados; 1

Transcript of FAR503_1aLista_exercicios

Page 1: FAR503_1aLista_exercicios

UNIVERSIDADE FEDERAL DE OURO PRETOPROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIAS FARMACÊUTICAS

Disciplina: FAR503 – BioestatísticaProfessor: Ricardo Tavares

1ª Lista de Exercícios

Questões - revisão

1) Classifique cada uma das variáveis abaixo em qualitativa (nominal / ordinal) ou quantitativa (discreta / contínua):a) Ocorrência de hipertensão pré-natal em grávidas com mais de 35 anos ( sim ou não são as possíveis respostas para esta variável).b) Intenção de voto para presidente (possíveis respostas são os nomes dos candidatos, além de não sei).c) Perda de peso de maratonistas na Corrida de São Silvestre, em quilos.d) Intensidade da perda de peso de maratonistas na Corrida de São Silvestre (leve, moderada, forte).e) Grau de satisfação da população brasileira com relação ao trabalho de seu presidente ( valores de 0 a 5, com 0 indicando totalmente insatisfeito e 5 totalmente satisfeito).

2) Fale sobre a diferença entre população e amostra, e explique quais são as vantagens do uso da amostragem.

3) Para as situações abaixo, identifique a população e a amostra correspondente. Discuta a validade do processo de inferência estatística para cada um dos casos.

a) Para avaliar a eficácia de uma campanha de vacinação em MG, 200 mães de recém-nascidos, durante o primeiro semestre de um dado ano e em uma dada maternidade em MG, foram perguntadas a respeito da última vez em que vacinaram seus filhos;

b) Uma amostra de sangue foi retirada de um paciente com suspeita de anemia;c) Para verificar a audiência de um programa de TV, 563 indivíduos foram

entrevistados por telefone com relação ao canal em que estavam sintonizados;d) A fim de avaliar a intenção de voto para presidente dos brasileiros, 122 pessoas

foram entrevistas em Brasília;

4) Por que a amostragem estratificada (escolhendo-se variáveis adequadas para estratificação) reduz o erro amostral

5) Classifique o método de amostragem utilizado em cada uma das pesquisas descritas a seguir em: Amostragem Aleatória Simples (AAS), Amostragem Sistemática (AS), Amostragem Estratificada (AE), identificando a variável de estratificação; e Amostragem por Conglomerados (AG), identificando os conglomerados. Em todos os casos, identifique a população amostrada e a unidade de observação.

a) Um jornalista escreve, em cartões separados, o nome dos 520 deputados brasileiros, mistura-se e extrai 30 deles para uma declaração sobre as denúncias de corrupção dos governos FHC e Lula.

b) Um repórter da revista EXAME obtém uma relação numerada das 1000 empresas brasileiras que tiveram maiores cotações na BOVESPA no ano de 2005. Utiliza um

1

Page 2: FAR503_1aLista_exercicios

computador para gerar 20 números aleatórios e então entrevista os gerentes gerais das empresas correspondentes aos números gerados.

c) A empresa Sony seleciona cada 200º CD de sua linha de produção às 14 e 16 horas de um dia para fazer um teste de qualidade.

d) Um entrevistador entrevista cada 10º eleitor que deixa uma seção eleitoral de uma cidade entre as 8 e 17 horas de um dia de eleições.

e) O gerente geral de uma agência de um banco seleciona, por sorteio por igual chance, 50 correntistas com aplicações de até R$5.000,00, outros 50 correntistas com aplicações entre R$5.000,01 e R$20.000,00 e outros 50 correntistas com aplicações entre R$20.000,01 e R$50.000,00 em 31 de dezembro de 2005 para receberem uma pesquisa via correio.

f)Um médico entrevista todos os pacientes de leucemia internados em 20 hospitais selecionados por sorteio com igual chance dentre todos os hospitais de um estado.

6) Diferencie a amostragem probabilística da não–probabilística citando um exemplo de cada uma delas.

7) [Fazer manualmente usando a calculadora simples, pois estarás treinando para a prova, quero ver todos os cálculos] Os dados abaixo se referem ao número de profissionais da área de Farmácia com pós-graduação concluída em dez estabelecimentos públicos de saúde na região metropolitana de Belo Horizonte, dados a seguir:

2 4 3 4 6 4 2 1 5 5

e) Calcule e interprete os quartis 1, 2 (mediana) e 3;f) Calcule e interprete a média e a moda;g) Se a menor observação for corrigida e substituída pelo valor 11, então quanto valeria

a média e a mediana? O que aconteceu com estas medidas estatísticas?h) Calcule e interprete o desvio padrão e o coeficiente de variação;

8) Associe cada situação com o seu respectivo significado Estatístico:SITUAÇÃO A SITUAÇÃO B

SITUAÇÃO C SITUAÇÃO D

2

Page 3: FAR503_1aLista_exercicios

SITUAÇÃO SIGNIFICADO ESTATÍSTICO( ) Preciso e inexato( ) Exato e preciso( ) Impreciso e inexato( ) Exato e impreciso

9) Com base nos dados de taxa de colesterol (ml/dl) em 80 indivíduos, apresentados abaixo, responda o que se pede:

278 182 247 227 277 194 196 276 244 192 118 219 255201 -9 209 219 228 209 209 171 213 233 226 209 200200 363 209 200 179 167 192 277 317 146 217 292 217255 212 233 250 243 150 209 184 199 250 479 175 194221 233 -9 184 217 150 167 265 242 180 255 170 209161 196 165 234 179 248 184 291 185 242 276 243 229242 250

a) Construa uma tabela de freqüência em classes contendo a freqüência absoluta simples, freqüência absoluta acumulada, freqüência relativa simples, freqüência relativa acumulada e ponto médio;

b) Calcule a média, mediana e moda;c) Calcule os quartis 1 e 3;d) Calcule os centis 37 e 73;e) Calcule o desvio padrão e o coeficiente de variação;

Questões - 1ª etapa da disciplina

10) Numa grande população humana, a distribuição de daltonismo da cor vermelha-verde segundo sexo foi:

Daltonismo Masculino Feminino Total

Presente 4,23% 0,65% 4,88%

Ausente 48,48% 46,64% 95,12%

Total 52,71% 47,29% 100,00%

Uma pessoa é escolhida ao acaso dessa população, calcule a probabilidade dela ser:a) Daltônica b) Do sexo femininoc) Daltônica sabendo-se que é do sexo femininod) Daltônica sabendo-se que é do sexo masculino

Resp.: (a) 0,0488 (b) 0,4729 (c) 0,0137 (d) 0,0803

11) Num determinado laboratório farmacêutico, três setores A, B e C estão produzindo medicamentos para tranqüilizar pacientes estressados. Tais setores representam, respectivamente, 30%, 25% e 45% da produção diária de todo o laboratório. As respectivas taxas de rejeição desses remédios são de 1%, 1,5% e 2%. Da produção de certo dia, retirou-

3

Page 4: FAR503_1aLista_exercicios

se ao acaso um tranqüilizante, constatando-se que era rejeitado. Qual a probabilidade desse medicamento rejeitado ter sido fabricado nos setores A, B e C?

Resp.: 0,19 ; 0,2381 ; 05714

12) O Dr. Américo trata de doenças hepáticas em uma clínica especializada e sugere um novo teste para detectar câncer no fígado. Os resultados do experimento, para uma amostra de 2225 pacientes atendidos nessa clínica, foram:

Câncer hepáticoTeste

TotalPositivo Negativo

Presente 90 17 107

Ausente 39 2079 2118Total 129 2096 2225

a) Calcule a prevalência de câncer hepático na amostra acima.b) Calcule a sensibilidade e a especificidade do teste.c) Calcule a probabilidade de um paciente, atendido nessa clínica e que não tem câncer

no fígado, tenha um resultado positivo no teste.d) Calcule VPP e VPN.e) Calcule PFP e PFN.

Resp.: (a) 0,0481 (b) 0,8411 e 0,9816 (c) 0,0184 (d) 0,0415 e 0,9919 (e) 0,9585 e 0,0081

13) Suponha que a sensibilidade e a especificidade de dois testes (X e Y) para o diagnóstico de uma determinada doença sejam:

Teste Sensibilidade Especificidade

X 0,85 0,65

Y 0,92 0,92

Considere que a prevalência dessa doença seja de 2,5%. Denote os eventos:

A = {X ou Y positivo} e B = {X e Y positivo}

a) Calcule o VPP e o VPN para X e Y.b) Calcule a Sensibilidade, Especificidade, VPP e VPN para A e B

Resp.: (a) VPPx=0,0586 VPNx=0,9941 VPPy=0,2277 VPNy=0,9978 (b) sA=0,988 eA=0,598 VPPA=0,0593 VPNA=0,9995 sB=0,782 eB=0,9825 VPPB=0,534 VPNB=0,9943

14) A detecção precoce do câncer cervical uterino é crucial para o tratamento e cura da paciente. O papanicolau é um dos testes utilizados no diagnóstico. Na tabela abaixo temos os resultados deste teste para 600 mulheres. As mulheres foram classificadas como portadoras ou não da doença através de biópsia cervical.

PacienteTeste

TotalPositivo Negativo

Com câncer 94 6 100

Sem câncer 250 250 500Total 344 256 600

4

Page 5: FAR503_1aLista_exercicios

a) Calcule a prevalência de câncer na amostra.b) Calcule a sensibilidade e a especificidade do papanicolau. Interprete os valores

obtidos.c) Calcule o VPP e o VPN usando a prevalência obtida no item (a).d) Considere a seguinte afirmação: “O papanicolau é útil para excluir a presença da

enfermidade, embora um resultado positivo não possa ser confiável para diagnosticar a presença da doença”. Você concorda com a afirmação? Justifique sua resposta.

Resp.: (a) p=0,1667 (b) s=0,94 e=0,500 (c) VPP=0,2733 VPN=0,9766 (d) sim, pois o VPN é alto, embora o VPP seja baixo.

15) Foi feita avaliação pra câncer de próstata em 300 homens hospitalizados devido a sintomas de obstrução urinária. Um dos testes realizado foi o exame digital do reto. O resultado foi classificado como “positivo” segundo o critério padrão. Os resultados do exame digital e da biópsia são apresentados a seguir:

Resultado da biópsia

Resultado do exame digital Total

Positivo Negativo

Presente 48 21 69

Ausente 25 206 231Total 73 227 300

a) Admita que o resultado da biópsia é completamente preciso na determinação de presença do câncer de próstata. Qual é a sensibilidade e a especificidade do exame digital na detecção de câncer de próstata?

b) Nesta população de homens, qual é o valor de predição positiva e o valor de predição negativa do exame digital?

c) Um clínico geral está considerando a possibilidade de realizar o exame digital do reto em todos os homens com mais de 50 anos que procuram seu consultório, mesmo não apresentando sintomas de obstrução urinária. Da literatura, ele sabe que a prevalência de câncer de próstata nesta faixa etária é de 0,005. Usando os valores para a sensibilidade e especificidade obtidos anteriormente, calcule a proporção de homens com resultado positivo no exame digital que realmente tem a doença.

Resp.: (a) s=0,6956 e=0,8918 (b) VPP=0,6575 VPN=0,9075 (c) VPP(H50)=0,0313

16) Um grupo de 100 pessoas apresenta, de acordo com o vínculo e a instituição a que pertence dentro da UFOP, a seguinte composição:

ICEB Escola de FarmáciaAlunos 21 39Professores 14 26

Calcule:a) A probabilidade de um escolhido ser Aluno;b) A probabilidade de um escolhido ser Professor da Escola de Farmácia;c) A porcentagem dos integrantes da Escola de Farmácia;d) A porcentagem dos Alunos pertencentes ao ICEB;e) Se o sorteado for do ICEB, qual a probabilidade de ser Professor?f) Se o sorteado for Aluno, qual a probabilidade de ser da Escola de Farmácia?

Resp: (a) 0,600 (b) 0,260 (c) 0,650 (d) 0,210 (e) 0,400 (f) 0,650

17) Uma variável aleatória tem a distribuição de probabilidade dada pela seguinte fórmula: P(x)=c/x para x=1, 3, 5, 7.a) Determine c.b) Calcular P(2 ≤ x ≤ 6)

5

Page 6: FAR503_1aLista_exercicios

c) Quanto vale F(5)?Resp: (a) c=105/176 (b) 7/22 (c) 161/176

18) Admitindo que os nascimentos de meninos e meninas sejam iguais, calcular a probabilidade de um casal com seis filhos ter quatro filhos homens e duas mulheres.

Resp.: 0,2344

19) Um medicamento X tem 2/3 de probabilidade de ser vendido a um paciente sempre que o farmacêutico o sugere. Se o remédio X é sugerido 5 vezes, calcule a probabilidade de:

a) X ser vendido exatamente três vezes.b) X ser vendido ao menos uma vez.c) X ser vendido mais da metade das partidas.

Resp: (a) 80/243 (b) 242/243 (c) 64/81

20) Cianose é a condição de ter a pele azulada por conta de uma insuficiência na oxigenação do sangue. Cerca de 80% dos bebês que nascem com a doença conseguem se recuperar totalmente. Um hospital está cuidando de três bebês que possuem a doença. Seja a variável aleatória quantidade de bebês que vão se recuperar totalmente. Obtenha:

a. A distribuição de probabilidade.b. Os gráficos da função de probabilidade e da função de distribuição acumulada.c. E(X) e DP(X). Interprete-os.d. Qual a probabilidade de pelo menos dois bebês se recuperarem totalmente?

Resp.: (a) (b) (c) (d)

21) Suponha que a média de comprimidos com algum tipo de falha de fabricação em uma hora é três. Qual a probabilidade de:

a. Ter três comprimidos com falha em 20 minutos?b. Ter no mínimo dois comprimidos com falha em 30 minutos?c. Ter nenhum comprimido com falha durante 45 minutos?d. Ter no máximo cinco comprimidos com falha em 80 minutos?

Resp: (a) 0,0613 (b) 0,4423 (c) 0,1054 (d) 0,0916

22) Considere uma variável aleatória W com distribuição N(0,1). Determine as seguintes probabilidades:a) P(W>1,84)b) P(W<0,30)c) P(W<-2,69)d) P(W>-2,35)e) P(-1,05 < W < 2,76)

Resp: (a) 0,0329 (b) 0,6179 (c) 0,0036 (d) 0,9906 (e) 0,8502

23) Considere uma variável aleatória T com distribuição N(0,1). Determine o valor de x nas seguintes condições:a) P(T>x)=0,945b) P(T<x)=0,755c) P(T>x)=0,264d) P(T>-x)=0,145e) P(x < T < 1,95)=0,78

Resp: (a) -1,5982 (b) 0,6903 (c) 0,6311 (d) -1,0581 (e) -0,8618

24) Para a população masculina de uma determinada cidade, com idade entre 18 e 74 anos, a pressão sistólica tem distribuição aproximadamente gaussiana com média 129 mmHg e

6

Page 7: FAR503_1aLista_exercicios

desvio padrão 19,8 mmHg. Tem-se ainda que, níveis pressóricos menores que 130 (sistólica) / 85 (diastólica) mmHg são considerados normais.a) Qual a probabilidade de um homem dessa população possuir pressão sistólica normal?b) Selecionando-se ao acaso 1000 homens dessa população, quantos seriam diagnosticados com hipertensão moderada (pressão sistólica entre 160 e 179 mmHg)?

Resp: (a) 0,5201 (b) 53

25) Sabe-se que para adultos do sexo masculino, com boa saúde, numa certa população, a temperatura corporal segue uma distribuição Normal com média 36,8 graus e desvio-padrão 0,15 graus.

a. Qual a variável de interesse? Classifique-a.b. Se considerarmos 1000 dessas pessoas, quantas se esperariam com temperatura

entre 36,8 e 37,2 graus?c. Qual a temperatura corporal que é excedida com probabilidade 20%?

Resp: (a) variável quantitativa contínua (b) 496 (c) 36,93

26) Sabendo-se que a taxa de hemoglobina (g%) em um grupo de ovinos sadios tem distribuição N(14, 3), construa faixas de referência que englobem: (a) 95% das taxas de hemoglobina (b) 99% das taxas de hemoglobina

Resp.: (a) FR(95%)=[8,12 - 19,88] (b) FR(99%)=[6,27 - 21,73]

Questões computacionais

[a escolha do software...] Exemplo Milsa (baixar os dados do site www.iceb.ufop.br/deest), importá-los ao pacote estatístico, codificá-lo, calcular algumas medidas estatísticas, fazer gráficos estatísticos e interpretações.

27) Vinte e uma pacientes de uma clínica médica tiveram o seu nível de potássio no plasma medido. Os resultados foram os seguintes: 2.30, 2.57, 2.62, 2.70, 2.80, 2.93, 2.95, 2.98, 3.05, 3.10, 3.15, 3.15, 3.20, 3.27, 3.30, 3.35, 3.40, 3.40, 3.50, 3.55, 3.60. Calcule e interprete as seguintes medidas estatísticas: média, desvio padrão, moda, mediana, mínino, máximo, quartis, centis 30 e 70. Qual a porcentagem de pacientes com nível acima de 3?

28) O baixo peso ao nascer é usado frequentemente para rastrear a hemorragia Peri-intraventricular (HPIV), sendo 1500 g o limite sugerido para tal fim. Considerando essa informação e os dados mostrados no quadro a seguir do peso ao nascer (g) de 39 crianças com HPIV, qual seria a sensibilidade resultante do rastreamento? Abaixo de que peso encontram-se 95% das crianças com HPIV? Quais as conseqüências de se alterar o valor de referência para o novo valor encontrado?

1530 1520 1350 1260 1160 1120 1500 1020 1000 1020 1690 1140 11601290 1410 1850 1280 1410 1750 800 1020 830 1620 1430 1150 12301660 1430 1590 1280 1040 1810 1420 1760 1670 1520 1680 1650 1180

7

Page 8: FAR503_1aLista_exercicios

29) Em uma pesquisa sobre a concentração de minerais no leite materno, foram coletados no período de 1984 a 1985 dados de 55 mães do Hospital Maternidade Odete Valadares em Belo Horizonte. As mães foram divididas em dois grupos, segundo o período de lactação: colostro e leite maduro. Os minerais considerados foram cálcio, cobre, magnésio e zinco. Os dados referem-se ao cálcio e zinco:

Cálcio (grupo

colostro)

113 181 254 311 334 145 221 256 312 344 163 225 275 313  

372 163 231 296 323 375 167 241 303 325 375 437      Cálcio (grupo

maduro)

159 175 181 188 200 206 213 214 217 231 238 238 242 244 256

259 260 263 264 275 277 279 281 293 302 303 314 344 394  Zinco (grupo

colostro)

1,07 1,2 1,3 3,13 3,2 3,7 4,4 4,57 5,2 5,82 6,07 6,13 6,5 6,82  

6,82 6,9 7,23 7,42 7,43 7,43 7,45 8,25 8,4 8,77 9,54        Zinco (grupo

maduro)

0,52 0,6 0,78 0,86 1,08 1,23 1,28 1,31 1,4 1,55 1,55 1,6 1,92 2,15  

2,27 2,4 2,41 2,52 2,57 2,6 2,63 2,92 3 3,05 3,57 3,88 5,5 7,38  

30) Um pesquisador deseja criar um padrão para identificar presença de infecção bacteriana (Pseudomonas SP) no trato respiratório através de cultura da liberação de muco. Para isto, coletaram-se dados de pessoas sabidamente sadias e determinou-se o número de colônias encontradas em cada cultura. Foram encontrados os seguintes resultados:

17 24 25 35 5122 24 26 35 5423 24 28 35 5623 25 28 36 5623 25 29 40 5623 25 30 41 5824 25 30 41 6024 25 31 41 6824 25 31 42 79

a) Determine um valor de referência para o número de colônias de bactérias no trato respiratório de pessoas sadias, usando o método dos percentis e o método da curva de Gauss.

b) Qual dos dois métodos é o mais indicado neste caso. Justifique.

Bom Trabalho!

8