Curso de Anlise EstatsticaUNIFESP 2007Prof. Dr. Clvis de Arajo [email protected]
FILOSOFIA DO CURSO um curso de estatstica que no exige conhecimento prvio e os conceitos so introduzidos atravs de exemplificao prtica, dando nfase na intuio e no na argumentao matemtica.
O curso dividido em duas partes:Na primeira parte sero discutidos conceitos fundamentais de estatstica descritiva e inferencial, que permitem ao aluno entender a essncia do pensamento estatstico.
Na segunda parte iremos realizar a anlise estatstica completa de projetos de pesquisa desde o planejamento at a concluso. Os projetos so escolhidos de forma a contemplar o ensino de diferentes tcnicas de anlise estatstica.
importante que o aluno participe de todas as etapas de discusses com perguntas relacionadas com a sua rea de atuao.
O material didtico distribudo apenas um guia do roteiro do curso.
Programa do CursoParte 1: Definies e conceitos bsicos.
I - Definio de Estatstica;II - Interao entre a Estatstica e o Mtodo Cientfico;III - Tipos de variveis geradoras de dados;IV - Planejamento de pesquisa Observacional e Experimental : diferentes formas de obteno de dados;V - Descrio de um conjunto de dados obtidos por Levantamentos Populacionais, Amostrais ou Experimentos Controlados atravs de: medidas-resumo, tabelas e grficos apropriados para cada situao;VI - Conceitos essenciais para se entender a Anlise Estatstica Inferencial: erro amostral, intervalo de confiana para uma amostra e determinao de tamanho de amostra. VII - Noes sobre Teste de Hipteses para comparao de dois grupos, variveis Numricas e Categricas.VIII - Noes sobre Intervalo de Confiana para comparao de dois grupos, variveis Numricas e Categricas.
Programa do CursoParte 2: Anlise Estatstica de Projetos de Pesquisa com o uso do computador.
I - Estudo da relao entre variveis categricas: Chi- Quadrado, Teste exato de Fisher.II - Estudo da relao entre uma varivel resposta numrica e variveis explicativas categricas: Anlise de Varincia.III - Estudo da relao entre variveis numricas: Anlise de Regresso.
Referncias: - Practial Statistics For Medical Research, Douglas G. Alltman. Chapman& Hall/CRC - Introduo Estatstica Mdica, Jos Francisco Soares e Arminda Lucia Siqueira. Departamento de Estatstica UFMG
I Definio de Estatstica um campo de estudos que produz metodologia para:Decidir qual o melhor Plano para a realizao de uma Pesquisa cientfica ou observacional (analtica ou descritiva);
Organizar e Sumarizar dados obtidos por classificao, contagem ou mensurao, ou transformaes destes, e
Fazer inferncias sobre populaes de unidades (indivduos, objetos, animais) quando apenas uma parte (amostra) estudada (classificada, contada ou medida).
Sub-reas da Estatstica:(1) Planejamento de experimentos e tcnicas de amostragem;(2) Estatstica Descritiva;(3) Estatstica Inferencial. CAP
II- Interao entre estatstica e pesquisa cientfica
III Tipos de variveis geradoras de dados
III - Tipos de variveis geradoras de dados
IV - Planejamento da PesquisaTipos de PesquisaIV.A. Observacional: coletamos informaes sobre variveis categricas e numricas de interesse, em indivduos de um ou mais grupos, mas no realizamos intervenes. Quanto forma de obteno dos dados, pode ser prospectivo, retrospectivo ou transversal.Exemplos: Levantamento Populacional, Levantamento Amostral e Estudo Epidemiolgico.
IV.B. Experimental: coletamos as informaes como no caso anterior, mas os resultados so influenciados pelo pesquisador com intervenes. Em geral necessrio grupo controle. A forma de obteno dos dados , em geral, prospectiva, longitudinal. Exemplos: Ensaios Clnicos, experimentos nas reas de agronomia, industria e laboratrios.
IV.A Pesquisas ObservacionaisIV.A.1 Levantamentos populacionais
Contnuos quando os eventos vo sendo registrados medida que ocorrem . Ex : registros de bitos, nascimentos, casamentos
Peridicos so aqueles que acontecem ciclicamente. Ex: censos populacionais que ocorrem a cada 10 anos.
Ocasionais so aqueles realizados sem preocupao de continuidade ou periodicidade pr estabelecidas.
Obs: A anlise estatstica recomendada: Descritiva ou Exploratria de dados.
IV.A Pesquisas ObservacionaisIV.A.2 Levantamentos Amostrais
- Etapas:
Definio do objetivo;Descrio da populao (populao objetivo e amostrada);Unidade amostral e unidade de informao;Forma de obteno da informao (instrumentos de coleta);Escolha do Plano Amostral apropriado:Amostra casual simplesAmostra estratificadaAmostra em mltiplos estgios
- Condies de vida das famlias da RMSP;- Pesquisa de Emprego e Desemprego da RMSP;- Grau de satisfao dos usurios da SABESP;- Estimao da prevalncia de cefalia no municpio de Marlia- Grau de satisfao de usurios da rede hospitalar do municpio de Guarulhos;- Perfil scio-econmico dos favelados e encortiados do municpio de So Paulo;- Estudo do rendimento escolar na rede Estadual de Ensino na RMSP.IV.A Pesquisas Observacionais
IV.A.2 Levantamentos Amostrais Exemplos
IV.A Pesquisas Observacionais
IV.A.3 Estudos Epidemiolgicos So, em geral, necessrios quando informaes preliminarmente coletadas indicam que um estudo epidemiolgico mais detalhado deve ser conduzido para estudar a associao entre uma varivel resposta dicotmica (doena, bito) e variveis explicativas categricas e numricas
COORTESEm estudos de coorte prospectivo todos os indivduos includos so no doentes e divididos em 2 grupos, expostos e no expostos. O coorte seguido por um perodo de tempo e taxas de incidncia da doena so comparadas entre expostos e no expostos. Este estudo tambm pode ser conduzido retrospectivamente selecionando dois grupos de indivduos expostos e no expostos comparando-se taxas de incidncia da doena em um perodo de tempo passado.
CASO-CONTROLEEm estudos de caso-controle um grupo de doentes (casos) e um grupo de no doentes (controles) so selecionados. A proporo de indivduos que foram expostos por um perodo de tempo calculada nos grupos e comparadas.
TRANSVERSALEm estudos transversais ou de prevalncia, exposio a fatores de risco e de ocorrncia da doena so avaliados simultaneamente num ponto no tempo em um grupo de indivduos. Taxas de prevalncia da doena so comparadas entre expostos e no expostos.IV.A Pesquisas Observacionais
IV.A.3 Estudos Epidemiolgicos
IV.B Pesquisa Experimental - Etapas:
Objetivo;Descrio das situaes experimentais que serocomparadas (Tratamentos);Descrio da populao experimental;Escolha da unidade experimental;Escolha do Plano Experimental:Completamente casualizado (amostras no pareadas)Blocos casualizados (amostras pareadas)Experimentos Cross-over
IV.B Pesquisa Experimental
Exemplo # 1 - Teste do efeito do Metoprolol em pacientes de 65 a 74 anos que tiveram Infarto Agudo do Miocrdio. Comentrios:Os pacientes foram aleatorizados a cada um dos grupos e aps o seguimento de 3 meses foi registrado o estado vital;O estudo um Ensaio Clnico completamente aleatorizado, prospectivo, com amostras independentes isto , no pareada o estudo da relao entre duas variveis categricas dicotmicas, uma resposta e a outra explicativa.
IV.B Pesquisa Experimental
Exemplo # 2 Comparao de 3 grupos de gestantes - normais (N), tolerncia diminuda (TD) e diabticas (D) em relao a hemoglobina glicosilada (HbA). Comentrios: um plano experimental completamente casualizado com um critrio de classificao. Trs amostras independentes de 10 gestantes, uma para cada classe, amostras no pareadas.Estudo da relao entre uma varivel numrica resposta, (HbA) e uma explicativa categrica, classe de gestantes.
IV.B Pesquisa ExperimentalExemplo # 3: Estudo sobre perda de peso(kg) em obesos para 2 diferentes terapias e 4 diferentes dietas. Comentrios: um plano experimental completamente casualizado com dois critrios de classificao. So 8 amostras independentes de 5 indivduos, no pareadas, uma para cada combinao (dieta, terapia).Estudo da relao entre duas variveis categricas explicativas, dieta e terapia, e uma numrica, resposta.
IV.B Pesquisa Experimental Comentrios:1) O Plano Experimental utilizado foi Cross-Over. Cada indivduo submetido s 2 drogas em perodos diferentes. 30 indivduos recebem a droga A e os outros 30 recebem a droga B no primeiro perodo. Em um segundo perodo, aps a eliminao do efeito residual, os dois grupos recebem as drogas em ordem contrria. 2) So amostras pareadas onde cada indivduo controle dele mesmo.Exemplo # 4 : Comparao de duas drogas para normalizar a presso sangunea em hipertensos
V Anlise exploratria de dados A Anlise Descritiva ou Exploratria de dados consiste em obter: - Medidas que resumem informaes de um conjunto de dados quanto a posio central e variabilidade. - Grficos e tabelas que mostram a distribuio dos dados.
Estes conceitos sero apresentados de acordo com o seguinte esquema:
Varivel numrica 1) Medidas de Variabilidade e de Posio: Amplitude, Desvio padro, Mdia, Mediana e Quartil;2) Representao grfica: Histograma e Box-plot;3) Propriedades da distribuio normal.
b) Varivel categrica
medidas de variabilidade e de posio obtidas das frequencias. representao grfica: grfico de barras e pizza.
Varivel numrica: Exemplo 1: Duas amostras de 20 indivduos1) Medida de variabilidade Amplitude Amostra 1: Estatura mnima: 140 cmEstatura mxima: 180 cm Amostra 2: Estatura mnima: 150 cm Estatura mxima: 170 cm Questo 2: Quanto a variabilidade individual de uma amostra maior do que a outra?Resposta:Questo 1: Em qual das duas amostras os indivduos variam mais em relao estatura?Resposta: CONCEITOS:V Anlise exploratria de dados
Varivel numrica: Exemplo 2: Duas amostras de 6 indivduos(os valores abaixo representam a estatura, em cm) 1) medidas de variabilidade e de posio Media e Desvio padroAmostra 1: 150, 151, 153, 155, 158, 160Amostra 2: 150, 155, 155, 155, 155, 160 Questo 1: Em qual das duas amostras os indivduos variam mais em relao estatura? Resposta:Questo 2: Quanto a variabilidade de uma amostra maior que a da outra? Resposta:CONCEITOS:V Anlise exploratria de dados
Varivel numrica : 2) Representao grfica para amostras grandes - Histogramaa) Histograma (distribuio de freqncia emprica)V Anlise exploratria de dados
Varivel numrica : b)Representao grfica para amostras pequenas - BoxPlot : (forma de agrupar dados atravs dos percentis) Exemplo : Estudo sobre Diabetes Gestacional - Comparao de 3 grupos de gestantes, normais, tolerncia diminudas e diabticas em relao a hemoglobina glicosilada (HbA). Box-Plot do nvel de Hemoglobina glicosilada, segundo grupo de gestantes.V Anlise exploratria de dados
Varivel numrica: 3) Noes sobre a Distribuio NormalPropriedades da Distribuio Normal68% dos valores individuais esto entre - e + 90% dos valores individuais esto entre - 1,64 e + 1,6495% dos valores individuais esto entre - 1,96 e + 1,9699,7% dos valores individuais esto entre - 3 e + 3Mdia = Mediana = ModaCoeficiente de Assimetria = 0 [-1; 1] ou [-2;2]Coeficiente de Curtose = 0 [-1; 1] ou [-2;2]V Anlise exploratria de dados
Varivel numrica : 4) Curva normal ajustada distribuio de freqncia empricaV Anlise exploratria de dados
Varivel categrica : 1) medidas de variabilidade e de posioExemplo: Duas amostras de 20 indivduos classificados em relao ao sexo. .
Questo 1: Em qual das duas amostras os indivduos variam mais em relao ao sexo? Resposta: Questo 2: Quanto a variabilidade de uma amostra maior que a da outra? Resposta:CONCEITOS:V Anlise exploratria de dados
Varivel categrica: 2) Representao grfica: grfico de barras e pizza V Anlise exploratria de dados
Grf1
76.6490765172
23.3509234828
Fonte : PED-Dez/1999
Percentual
Distribuio de Chefes de Famlias segundo gnero
Plan1
Quadro 3- Distribuio de Chefes de Famlias segundo gnero
sexofreqnciaporcentagem (%)
masculino174376.6
feminino53123.4
total2274100.00
Fonte PED -Dez/1999
masculino76.6
feminino23.4
Plan2
Plan2
76.6490765172
23.3509234828
Fonte : PED-Dez/1999
Percentual
Distribuio de Chefes de Famlias segundo gnero
Plan3
VI - Conceitos essenciais para se entender a anlise estatstica inferencial: erro amostral e intervalo de confiana.Essncia da Estatstica InferencialConsidere uma populao de indivduos representada por uma varivel numrica (Albumina Srica).
VI - Conceitos essenciais para se entender a anlise estatstica inferencial: erro amostral e intervalo de confiana.Questo de interesse
Queremos estimar por meio de uma amostra de tamanho n a mdia populacional .
Consideraes sobre a soluoa) Tipo de Amostra: Amostra probabilstica;
b) Para qualquer tamanho de amostra n a mdia da amostra sempre diferente da mdia da populao;
c) A distncia entre a mdia da amostra e a mdia da populao chamada de Erro Amostral (EA).VI - Conceitos essenciais para se entender a anlise estatstica inferencial: erro amostral e intervalo de confiana.
Consideraes sobre a soluo d) Para uma determinada populao com uma determinada varincia, quanto maior for o tamanho da amostra menor ser o EA e) Para um determinado tamanho de amostra quanto mais espalhada for a populao em torno da mdia (varincia), maior ser o EA Concluso: Portanto podemos escrever que o erro amostral (EA) proporcional ao quociente
Ou
Formulas para se calcular Erro amostral, tamanho da amostra e construir intervalo de confiana para mdias e propores
VII Comparao de dois grupos: (Testes de Hipteses) > - Roteiro para testes de hipteses
a) Formulao das hipteses estatsticas: Hiptese Nula (Ho) Hiptese Alternativa (Ha)
b) Determinao de uma medida de afastamento da hiptese
c) Obteno de um Sistema de Referncia
d) Calculo do valor p [ Nvel de Significncia observado, p-value ], que representa a probabilidade de errar quando o pesquisador rejeita Ho)
CAP
VII Comparao de dois grupos: (Testes de Hipteses) EXEMPLO 1: Varivel Numrica, Amostras no pareadasComparao de motoristas que se declaram hiper-tensos e normais em relao ao ndice de Massa Corprea (IMC)
Presso altaSimNoTotalN278522800Mdia28,0226,4626,72Varincia17,6437,3388,73Desvio-padro4,206,119,42Erro-padro0,250,270,23
VII Comparao de dois grupos: (Testes de Hipteses)Representamos o IMC mdio por: 1 , IMC mdio dos hipertensos 2, IMC mdio dos normais b) Medida de afastamento da hiptese nulaversusFormulao das Hipteses:Soluo:onde
Sistema de Referncia: Distribuio t-Student com (nsim+nno2) graus de liberdade;c) Nvel de Significncia Descritivo: p=0,0001;Concluso: O IMC mdio dos indivduos com presso alta estatisticamente maior do que o IMC mdio dos indivduos com presso normal (p=0,0001).
VII Comparao de dois grupos: (Testes de Hipteses)EXEMPLO 2: Varivel Categrica, Amostras no pareadasEstudo sobre presena de sintomas da doena entre vacinados e no vacinados
Sintomas da doenaVacinadoNo vacinadoTotalSim5 (3,3%)45 (12,9%)50 (10,0%)No145 (96,7%)305 (81,7%)450 (90,0%)Total150 (100,0%)350 (100,0%)500 (100,0%)
VII Comparao de dois grupos: (Testes de Hipteses)Soluo:Formulao das Hipteses: b) Medida de afastamento da hiptese nula
c) Sistema de Referncia: Distribuio de Qui-quadrado com 1 grau de liberdade;d) Nvel de Significncia Descritivo: p=0,0011;Concluso: A proporo de indivduos com sintoma da doena, entre os vacinados, estatisticamente menor que entre os no vacinados (p=0,0011).VII Comparao de dois grupos: (Testes de Hipteses)
VIII Comparao de dois grupos (Intervalo de Confiana-varivel numrica) Clculo do erro padro (EP) da diferena entre as mdias; Roteiro para Intervalo de ConfianaVarivel Numrica:Clculo da diferena observada (d) entre as duas mdias;Clculo do erro amostral da diferena das mdias EA(x1 x2) = c(EP), onde c corresponde ao coeficiente de confiana;
VIII Comparao de dois grupos (Intervalo de Confiana-varivel numrica) Roteiro para Intervalo de Confiana (cont.)Varivel Numrica:Clculo do intervalo de confiana (IC)Interpretao do intervalo de confiana.
EXEMPLO 1: Varivel Numrica, Amostras no pareadasComparao de motoristas que se declaram hiper-tensos e normais em relao ao ndice de Massa Corprea (IMC)VIII Comparao de dois grupos (Intervalo de Confiana-varivel numrica)
Interpretao: Com 95% de Confiana, a diferena mdia de IMC entre hiper-tensos e normais foi de 1,56 kg/(cm)2, podendo atingir um valor mnimo de 0,76 kg/(m)2 e um valor mximo de 2,36 kg/(m)2
VIII Comparao de dois grupos (Intervalo de Confiana-varivel categrica) Clculo do erro padro (EP) da diferena entre as propores: Roteiro para Intervalo de ConfianaVarivel Categrica:Clculo da diferena observada (p1-p2) entre as duas propores;Clculo do erro amostral da diferena das propores EA(p1 p2) = c(EP), onde c o coeficiente de confiana;
VIII Comparao de dois grupos (Intervalo de Confiana-varivel categrica) Roteiro para Intervalo de Confiana (cont.)Varivel Categrica:Clculo do intervalo de confiana (IC)Interpretao do intervalo de confiana.
EXEMPLO 2: Varivel Categrica, Amostras no pareadasEstudo sobre presena de sintomas da doena entre vacinados e no vacinadosVIII Comparao de dois grupos (Intervalo de Confiana-varivel categrica)
VIII Comparao de dois grupos (Intervalo de Confiana-varivel categrica) Interpretao:
Com 95% de Confiana, a diferena da proporo de Indivduos com sintoma, entre os no vacinados e os vacinados, foi de 0,096 (9,6%), podendo atingir um valor mnimo de 0,051(5,1%) e um valor mximo de 0,141(14,1%).
************************************************
Top Related