figura 3.42 resultados das medidas de tendência...

7
100 Figura 3.42 Resultados das medidas de tendência central. Atividade 2 Ao longo dos próximos exercícios nós trabalharemos com uma planilha de dados a ser fornecida durante a aula. A planilha contém dados de um estudo sobre fatores de risco para o desenvolvimento de doença arterial coronariana (uma condição em que o fornecimento de sangue para o músculo cardíaco é prejudicado pelo estreitamento dos vasos sanguíneos). Nesse estudo, pacientes do sexo masculino foram diagnosticados quanto à presença de doença coronariana, sendo registrados também alguns parâmetros clínicos. A planilha com a qual trabalharemos contém os seguintes parâmetros: • id: identificador numérico do paciente; • idade em anos; • pressão sistólica; • tabaco: medida acumulada do uso; • histórico familiar de doença coronariana; • álcool: consumo do paciente à época do estudo; • doença coronariana: diagnóstico (0: não apresenta doença, 1: apresenta doença). Abra o arquivo da planilha usando o aplicativo LibreOffice Calc. O aspecto dos dados carregados deve ser semelhante ao visto na Figura 3.43. Agora nós vamos calcular medidas de tendência central e de espalhamento para alguns dos parâmetros con- tínuos presentes na planilha. Essas medidas serão inseridas na própria planilha, abaixo da coluna do parâmetro respectivo. Antes de calcular, vamos rotular algumas linhas da planilha para identificar cada medida. Na primeira coluna da planilha, a partir de alguma linha abaixo dos dados amostrais, insira os seguintes rótulos, um em cada linha (ver Figura 3.44 para ilustração): média, variância, desvio padrão e mediana.

Transcript of figura 3.42 resultados das medidas de tendência...

Page 1: figura 3.42 resultados das medidas de tendência central.compscinet.org/hausen/courses/2016/q3/bcc/aulas/03estatistica/aula... · figura 3.42 resultados das medidas de tendência

100

figura 3.42 resultados das medidas de tendência central.

Atividade 2

Ao longo dos próximos exercícios nós trabalharemos com uma planilha de dados a ser fornecida durante a aula. A planilha contém dados de um estudo sobre fatores de risco para o desenvolvimento de doença arterial coronariana (uma condição em que o fornecimento de sangue para o músculo cardíaco é prejudicado pelo estreitamento dos vasos sanguíneos). Nesse estudo, pacientes do sexo masculino foram diagnosticados quanto à presença de doença coronariana, sendo registrados também alguns parâmetros clínicos. A planilha com a qual trabalharemos contém os seguintes parâmetros:

•id:identificadornuméricodopaciente;

•idadeemanos;

•pressãosistólica;

•tabaco:medidaacumuladadouso;

•históricofamiliardedoençacoronariana;

•álcool:consumodopacienteàépocadoestudo;

•doençacoronariana:diagnóstico(0:nãoapresentadoença,1:apresentadoença).

Abra o arquivo da planilha usando o aplicativo LibreOffice Calc. O aspecto dos dados carregados deve ser semelhante ao visto na Figura 3.43. Agora nós vamos calcular medidas de tendência central e de espalhamento para alguns dos parâmetros con-tínuos presentes na planilha. Essas medidas serão inseridas na própria planilha, abaixo da coluna do parâmetro respectivo. Antes de calcular, vamos rotular algumas linhas da planilha para identificar cada medida. Na primeira coluna da planilha, a partir de alguma linha abaixo dos dados amostrais, insira os seguintes rótulos, um em cada linha (ver Figura 3.44 para ilustração): média, variância, desvio padrão e mediana.

Page 2: figura 3.42 resultados das medidas de tendência central.compscinet.org/hausen/courses/2016/q3/bcc/aulas/03estatistica/aula... · figura 3.42 resultados das medidas de tendência

101

figura 3.43 aparência da planilha de dados logo após ser carregada.

figura 3.44 atribuindo rótulos a linhas onde as medidas serão inseridas.

Agora nós calcularemos as medidas estatísticas para o parâmetro pressão sistólica, começando com a média, seguindo os mesmos procedimentos da Atividade 1. Se-lecione a célula da tabela no cruzamento da linha rotulada “média” e da coluna “pressão sistólica”. Agora clique sobre o botão do assistente de funções, localizado na barra acima dos dados da planilha (representado por f(x)). Um outro meio de acionar o assistente de funções é pelo menu Inserir >> Função. A tela do assistente será exibida; selecione a categoria de funções estatísticas e, em seguida, selecione a função MÉDIA dentro da lista de funções; pressione então o botão “Próximo”.

Na próxima tela, nós vamos selecionar a faixa de valores usados para o cálculo da média. Clique sobre a planilha e selecione todos os dados numéricos da coluna “pressão sistólica”, a faixa de valores selecionada aparece no campo denominado “número 1” na tela do assistente. Note que em vez de selecionar a faixa de valores com o mouse, poderíamos digitar diretamente a faixa pretendida, dando o nome da primeira e da última célula, separado por dois pontos. Por exemplo, D2:D41. Para finalizar, pressione o botão “Ok” na tela do assistente e observe que o valor da média é inserido na célula desejada. Você pode agora seguir o mesmo procedimento para calcular as outras medidas do parâmetro “pressão sistólica”, alterando o nome da função usada. A seguir, associamos cada medida com a função correspondente do LibreOffice Calc:

•média:funçãoMÉDIA;

•variância:funçãoVAR;

•desviopadrão:funçãoDESVPAD;

•mediana:funçãoMED.

Page 3: figura 3.42 resultados das medidas de tendência central.compscinet.org/hausen/courses/2016/q3/bcc/aulas/03estatistica/aula... · figura 3.42 resultados das medidas de tendência

102

Compare o valor da média obtida com o valor da mediana, eles são semelhantes?

Repita o cálculo das medidas média, desvio padrão e mediana para o parâmetro “álcool”. Compare os resultados da média e da mediana. É possível deduzir algo sobre a distribuição deste parâmetro a partir da comparação destes valores?

Atividade 3

Para entender melhor a distribuição do parâmetro “álcool”, nós vamos construir um histograma. Para isso, é preciso dividir a faixa de valores exibida pelo parâmetro em um número razoável de intervalos. Como o menor valor exibido é 0 e o maior é 97,2, vamos adotar, como primeira tentativa, a divisão em 10 intervalos de largura 10. Ou seja, nossos intervalos serão: <10, 10 |– 20, 20 |– 30, 30 |– 40, 40 |– 50, 50 |– 60, 60 |– 70, 70 |– 80, 80 |– 90 e ≥90. No LibreOffice Calc, antes de se construir o histograma é preciso determinar quantos pontos pertencem a cada intervalo usando a função FREQUÊNCIA. Essa função precisa de dois argumentos: uma coluna de dados a ser analisados e uma coluna contendo os valores que delimitam os intervalos. Antes de prosseguir, vamos inserir uma nova folha em nossa planilha de trabalho, evitando que os dados do histograma interfiram com os dados do estudo. Para isso, use a opção de menu Inserir >> Planilha. Na nova folha de planilha, vamos criar uma coluna composta pelos valores superiores de cada intervalo, em ordem: 10,20,30,40,50,60, 70, 80, 90. Agora, devemos selecionar a coluna (ainda vazia) à direita da coluna dos intervalos (Figura 3.45).

figura 3.45 selecionando a coluna onde os valores de frequência serão inseridos.

Devemos agora abrir o assistente de funções, selecionar o grupo de funções Matriciais e escolher a função FREQUÊNCIA (Figura 3.46), pressionado o botão “Próximo” a seguir. Na tela seguinte, vamos selecionar os dados. Clique sobre o campo “dados” e em seguida retorne para a planilha 1, onde estão os dados do estudo. Selecione a coluna do parâmetro “álcool” (Figura 3.47). Ainda na mesma tela, clique agora sobre o campo “classes”, selecionando-o. Volte para a folha da planilha que contém os limites dos intervalos e selecione os valores de 10 até 90 (Figura 3.48). O LibreOffice Calc automaticamente cria uma contagem para a faixa de valores >N, em que N é o último valor de “classe” selecionado neste passo. Agora finalizamos o cálculo das

Page 4: figura 3.42 resultados das medidas de tendência central.compscinet.org/hausen/courses/2016/q3/bcc/aulas/03estatistica/aula... · figura 3.42 resultados das medidas de tendência

103

frequências, clicando o botão “Ok”. O programa deve então preencher a coluna de frequências selecionada no início.

figura 3.46 selecionando a função frequência.

figura 3.47 selecionando dados para a construção do histograma.

Finalmente, vamos construir um gráfico de barras das frequências, representando o histograma. Para tanto, o Calc precisa de uma série de rótulos para atribuir a cada barra. Nós poderíamos usar os próprios limitantes dos intervalos, mas isso não ex-pressaria com clareza que estamos tratando de grandezas intervalares. Em vez disso, vamos usar uma coluna extra de rótulos, usando a notação de intervalos introduzida anteriormente (Figura 3.49).

Page 5: figura 3.42 resultados das medidas de tendência central.compscinet.org/hausen/courses/2016/q3/bcc/aulas/03estatistica/aula... · figura 3.42 resultados das medidas de tendência

104

figura 3.48 selecionando limites dos intervalos (classes) do histograma.

figura 3.49 inserindo coluna de rótulos.

Agora selecione a coluna das frequências e clique em Inserir >> Gráfico; selecione o gráfico do tipo coluna (Figura 3.50). Clique em “Próximo”, na tela do segundo passo (“Intervalo de dados”) não há nada a ser alterado. Clique em “Próximo” novamente. Na tela de “Série de dados”, clique sobre o campo “Categorias” e selecione a coluna de rótulos (Figura 3.51). Finalmente, clique em “Próximo”, insira um título adequado para o histograma e clique em “Concluir” (Figura 3.52). Deve ser inserido na planilha um gráfico como o da Figura 3.53. Note que o programa Calc desenha as barras com um espaço vazio entre elas, mas, conceitualmente, tal espaço não existe, os intervalos que formam o histograma são contíguos.

Page 6: figura 3.42 resultados das medidas de tendência central.compscinet.org/hausen/courses/2016/q3/bcc/aulas/03estatistica/aula... · figura 3.42 resultados das medidas de tendência

105

figura 3.50 selecionando tipo de gráfico.

figura 3.51 selecionando coluna de rótulos.

Page 7: figura 3.42 resultados das medidas de tendência central.compscinet.org/hausen/courses/2016/q3/bcc/aulas/03estatistica/aula... · figura 3.42 resultados das medidas de tendência

106

figura 3.52 inserindo título.

figura 3.53 histograma final.