Post on 25-Jun-2022
ANÁLISEESTATÍSTICAcom o SPSS Statistics
João MarôcoJOÃO MARÔCO (Ph. D., Washington State University) é professor asso-ciado do ISPA - Instituto Universitário onde leciona disciplinas de Esta-tística, Metodologias de Investigação e Análise de Dados nos diferentes ciclos de estudo e coordena a área científico-pedagógica de Estatística. É também professor associado convidado do programa doutoral da Faculdade de Psicologia da Universidade de Lisboa e do Mestrado e Programa Doutoral em Neurociências da Faculdade de Medicina da Universidade de Lisboa. É beta tester do SPSS Statistics e do AMOS e pertence ao Authors programme da IBM SPSS. Os seus interesses de investigação incluem aplicações de regressão, modelos de equações estruturais, estatística multivariada e análise classificatória nas Ciências Biológicas, Medicina e Ciências Sociais e Humanas. É autor / coautor de quatro livros de Estatística e de Avaliação Psicométrica e de uma centena de artigos, com revisão por pares, publicados em revistas nacionais e internacionais nos domínios da Psicometria, Estatística, Ciências Biológicas e Ciências Sociais e Humanas.
ANÁLISE ESTATÍSTICA com o SPSS Statistics é a súmula da ex-periência de docência, formação profissional e de investigação aplicada do autor nas Ciências Biológicas, Medicina e Ciências Sociais e Huma-nas. O livro apresenta, numa linguagem acessível mas sem descurar o formalismo matemático, os fundamentos teóricos das diferentes técni-cas de análise estatística e exemplifica, passo-a-passo, a utilização do software IBM® SPSS® Statistics com ênfase nos desenvolvimentos das novas versões 18 a 20.
www.reportnumber.pt/ae
5a.Edição
João Marôco
Análise Estatísticacom
o SPSS Statistics5a.
Edição
9 7 8 9 8 9 9 6 7 6 3 2 9
ISBN 978-989-96763-2-9
ANÁLISE ESTATÍSTICA
com o SPSS Statistics
5ª Edição
JOÃO MARÔCO
ii
É proibida toda e qualquer reprodução desta obra por qualquer meio físico ou digital, nomeadamente por fotocópia, digitalização e distribuição em formato eletrónico, sem a expressa autorização do autor. Excetua-se, naturalmente, a transcrição de pequenos tex-tos ou passagens para apresentação ou crítica do livro. As transgressões serão passíveis das penalizações previstas na lei. O autor é o produtor desta obra, sem uma editora comercial intermediária, o que possi-bilita a redução do preço final de venda. O preço deste livro pretende ser adequado à sua dimensão e foi decidido após consulta a potenciais interessados, como, por exemplo, alunos universitários, sobre o que seria um “preço justo e adequado”. Se o leitor fizer a contabilidade, verá que a fotocópia integral não será mais barata que a compra do livro editado numa livraria física ou online. Para além do mais, a fotocópia e a sua encaderna-ção não têm a mesma qualidade do livro editado. A fotocópia não valoriza, nem incen-tiva, a dedicação e o trabalho que um livro técnico exige ao autor e ao circuito comercial que o disponibiliza ao público. Pense nisto, por favor, antes de adicionar um volume de inestéticas fotocópias à sua estante.
Sitio online de apoio ao livro: www.reportnumber.pt/ae
FICHA TÉCNICA: Título: Análise Estatística com o SPSS Statistics
Autor: João Marôco Capa: João Marôco © João Marôco 5ª. edição Pero Pinheiro, 2011 Impressão e acabamentos: Rolo & Filhos II, SA. Depósito Legal: 331687/11 ISBN: 978-989-96763-2-9
Rua 5 de Outubro, 12 – 3 FT 2715-085 Pero Pinheiro Telef: 965044458 e-mail: reportnumber@gmail.com www.reportnumber.pt
iii
Índice
Prefácio ix Como usar este livro? 1
Capítulo 1
Variáveis, Populações e Amostras 5 1.1. Variáveis estatísticas e escalas de medida 7 1.2. População vs. Amostra 8 1.3. Teoria da Amostragem 9 1.4. Amostras independentes vs. amostras emparelhadas 13 1.5. Tipos de estudos de investigação 14
Capítulo 2
Estatística Descritiva 15 2.1. Medidas de tendência central 17 2.2. Medidas de dispersão 19 2.3. Medidas de forma 20 2.4. Medidas de associação 22 2.5. Representações gráficas 27
Capítulo 3
Inferência Estatística 33 3.1. Funções de distribuição com utilização frequente em inferência 35
3.1.1. Distribuição Normal 35 3.1.2. Distribuição Qui-quadrado (2) 38 3.1.3. Distribuição t-Student 39 3.1.4. Distribuição F-Snedecor 40 3.1.5. Distribuição Binomial 41
3.2. Distribuições Amostrais e Teorema do Limite Central 42 3.3. Teoria da Estimação 46 3.4. Teoria da Decisão 50
3.4.1. P-values e Erros estatísticos 54 3.4.2. Intervalos de confiança vs. testes de hipóteses 59 3.4.3. Como ‘escolher’ um teste de hipóteses? 60
Capítulo 4
Introdução ao SPSS Statistics 63
iv
Capítulo 5
Comparação de Contagens e Proporções 87 5.1. O Teste Binomial 89
5.1.1. A aproximação da binomial à normal 90 5.2. O teste do Qui-Quadrado 99
5.2.1. O Teste do Qui-quadrado por Simulação de Monte Carlo 105 5.3. O teste de Fisher 108 5.4. Modelos Log-lineares 113
5.4.1. Estimação dos parâmetros do modelo Log-linear 117 5.4.2. Chances e Rácio de Chances 120 5.4.3. Avaliação da qualidade do ajustamento do modelo Log-linear 122 5.4.4. Independência parcial de variáveis 133 5.4.5. Análise dos parâmetros do modelo saturado 137 5.4.6. Modelação Log-linear Hierárquica 141 5.4.7. Modelos Log-lineares com variáveis ordinais 154 5.4.7.1. Modelo Log-linear de Associação Linear-linear 156 5.4.7.2. Modelo Log-linear de Efeitos em Linha (ou em Coluna) 161
5.5. Testes para contagens em amostras emparelhadas 164 5.5.1. Teste de McNemar para duas populações 165 5.5.2. Teste Q de Cochran para mais de duas populações 170 5.5.2.1. Comparação múltipla de proporções no teste Q de Cochran 176
Capítulo 6
Testes Paramétricos para Amostras Independentes 183 6.1. Condições de aplicação dos testes paramétricos 185
6.1.1. Teste de Kolmogorov-Smirnov 185 6.1.2. Teste de Shapiro-Wilk 187 6.1.3. Teste de Levene 188 6.1.4. Violação dos pressupostos da normalidade e da homogeneidade de variâncias 189
6.2. Teste t-Student para uma amostra 196 6.3. Teste t-Student para duas amostras 199 6.4. Análise de Variância (ANOVA) 205
6.4.1. ANOVA a um fator (one-way ) 207 6.4.2. Comparação múltipla de médias one-way 212 6.4.3. ANOVA fatorial 223 6.4.3.1. ANOVA a dois fatores 223 6.4.3.2. ANOVA com mais de 2 fatores 230 6.4.4. Comparações múltiplas nos designs fatoriais 231 6.4.4.1. Testes Post-hoc 231 6.4.4.2. Contrastes 238 6.4.5. Dimensão do efeito 248 6.4.6. Análise da Potência do teste 251
v
6.5. A Análise de Covariância (ANCOVA) 258 6.5.1. Pressupostos da ANCOVA 261 6.5.2. E se os declives não forem homogéneos? 269
6.6. Análise de variância multivariada (MANOVA) 276 6.6.1. MANOVA one-way ou a um fator 277 6.6.2. MANOVA two-way ou a dois fatores 282 6.6.3. Validação dos pressupostos da MANOVA 285 6.6.3.1. Distribuição Normal multivariada 285 6.6.3.2. Homogeneidade das matrizes de variâncias-covariâncias 286 6.6.4. Considerações adicionais sobre a MANOVA 287
Capítulo 7
Testes Não Paramétricos para Amostras Independentes 299 7.1. Teste de Wilcoxon para uma mediana 303 7.2. Teste de Wilcoxon-Mann-Whitney 307 7.3. Teste de Kruskal-Wallis 317
7.3.1. Comparação múltipla de médias das ordens para amostras independentes 322 7.4. Transformações matemáticas para homogeneizar variâncias e normalizar variáveis 331 7.5. ANOVA two-way não paramétrica 339 7.6. MANOVA não paramétrica 345 7.7. ANCOVA não paramétrica 356
Capítulo 8
Testes para Amostras Emparelhadas 363 8.1. Teste t-Student 367 8.2. ANOVA de medições repetidas 372
8.2.1. Pressupostos da ANOVA de Medições Repetidas 372 8.2.2. ANOVA de medições repetidas a um fator 375 8.2.3. ANOVA de medições repetidas a dois fatores 376 8.2.4. ANOVA de medições repetidas mista 379 8.2.5. Comparação múltipla de médias 391 8.2.5.1. Testes Post-hoc 391 8.2.5.2. Contrastes 405
8.3. Teste de Wilcoxon para amostras emparelhadas 412 8.4. ANOVA de Friedman 419
8.4.1. Comparação múltipla de médias de ordens para amostras emparelhadas 424
Capítulo 9
Análise de Componentes Principais 439 9.1. O modelo das Componentes Principais 441 9.2. Estimação das componentes principais 443
vi
9.3. ACP com o SPSS Statistics: Categorical Principal Components Analysis (CATPCA) 450
9.4. Quantas componentes principais se devem extrair? 459 9.5. Utilização das componentes principais 466
Capítulo 10
Análise Fatorial 469 10.1. O modelo da Análise Fatorial Exploratória 472 10.2. Extração de fatores 476
10.2.1. Método das Componentes principais 479 10.2.2. Método da Fatorização do Eixo Principal 480 10.2.3. Método da Máxima Verosimilhança 480 10.2.4. Quantos fatores se deve reter? 482
10.3. Rotação de Fatores 484 10.4. Estimação dos valores dos fatores (Factor Scores ) 489
10.4.1. Método de Bartlett 489 10.4.2. Método de Thompson 489 10.4.3. Método de Anderson-Rubin 490
10.5. Avaliação da qualidade do modelo fatorial 490 10.6. Análise Fatorial com variáveis qualitativas 516 10.7. Considerações finais: AF vs. ACP 527
Capítulo 11
Análise de Clusters 529 11.1. Medidas de Semelhança e Dissemelhança 531 11.2. Agrupamento Hierárquico de Clusters 538
11.2.1. Que tipo de método hierárquico se deve utilizar? 540 11.2.2. Quantos Clusters se devem reter? 550 11.2.3. Análise de Clusters hierárquica com variáveis 554
11.3. Agrupamento não hierárquico de Clusters 557
Capítulo 12
Escalonamento Multidimensional 565 12.1. Modelos de MDS 568 12.2. MDS Clássico 569 12.3. Algoritmos de MDS: ALSCAL e PROXSCAL 574 12.4. Medidas da qualidade da solução de MDS 578 12.5. MDS Replicado 600 12.6. MDS a partir de dados em bruto 609
vii
Capítulo 13
Análise Discriminante 623 13.1. Seleção das variáveis discriminantes 626 13.2. Estimação das funções discriminantes 628
13.2.1. Avaliação da contribuição relativa das variáveis originais na função discriminante 635 13.2.2. Significância das funções discriminantes 638
13.3. Classificação por recurso às funções discriminantes 640 13.4. Análise Discriminante Stepwise 654
13.4.1. Critérios de seleção de variáveis na Análise Discriminante Stepwise 655
Capítulo 14
Regressão Linear 671 14.1. O modelo de regressão linear univariado tipo I 674 14.2. Estimação dos coeficientes de regressão: O método dos mínimos quadrados 676 14.3. Inferência sobre o modelo de regressão linear 679
14.3.1. A análise de variância do modelo de regressão linear 680 14.3.2. Testes aos coeficientes do modelo de regressão 682 14.3.3. O coeficiente de determinação 683
14.4. Validação dos pressupostos do modelo de regressão linear 690 14.4.1. A análise de resíduos 691 14.4.2. Multicolinearidade 712
14.5. Métodos de seleção de preditores 718 14.6. Comentários adicionais sobre diagnósticos de colinearidade 742 14.7. Estimação do valor médio de yj e previsão de novas observações 743 14.8. Outras utilizações para o modelo de regressão linear 747
14.8.1. O modelo de regressão linear com variáveis qualitativas 747 14.8.2. Testes a efeitos de moderação (interação) com o modelo de regressão linear 755 14.8.3. Testes a efeitos de mediação com o modelo de regressão linear 761 14.8.4. Análise de Trajetórias (Path Analysis) 769
14.9. O modelo de regressão linear univariado de tipo II 788 14.9.1. Eixo principal reduzido ou regressão da média geométrica 791 14.9.2. Método de ajustamento robusto de Kendall 794 14.9.3. Método dos três grupos de Bartlett 796
Capítulo 15
Regressão Categorial 801 15.1. Regressão Logística 804
15.1.1. Regressão Logística ou Regressão Linear? 804 15.1.2. O Modelo de Regressão Logística 807
viii
15.1.3. Ajustamento do modelo de Regressão Logística: O Método da Máxima Verosimilhança 812
15.1.4. Significância e qualidade do modelo de regressão logística 815 15.1.5. Seleção de variáveis com poder preditor na regressão logística múltipla 821 15.1.6. Diagnóstico de outliers e de observações influentes 823 15.1.7. Classificação por recurso à Regressão Logística 826
15.2. Regressão Multinomial 859 15.2.1. O modelo de regressão multinomial 859 15.2.2. Classificação por recurso à regressão multinomial 862
15.3. Regressão Ordinal 878 15.3.1. O Modelo de Regressão Ordinal 879 15.3.2. Avaliação da qualidade do modelo 885 15.3.3. Teste à homogeneidade dos declives 885 15.3.4. Classificação com o modelo de regressão ordinal 886
15.4. Notas finais sobre os modelos de regressão categorial: Problemas numéricos 910
Capítulo 16
Modelos Lineares Hierárquicos 913 16.1. O Modelo Linear Hierárquico (HLM) 917 16.2. Estimação dos parâmetros do modelo 923
16.2.1. Centragem das covariáveis 926 16.3. Estratégia de Análise e Qualidade do modelo HLM 928
16.3.1. Teste do Rácio de Verosimilhanças 930 16.3.2. Critérios de Informação do Modelo 931 16.3.3. Teste à significância dos parâmetros 932
16.4. Modelos Lineares Hierárquicos Generalizados (GHLM) 959 ANEXOS
1. Distribuição Normal reduzida 967 2. Distribuição t-Student 968 3. Distribuição do Qui-quadrado 969 4. Distribuição de Fisher-Snedecor 971
Índice Remissivo 975 Referências Bibliográficas 983