Statistics II for Dummies Abertura

35
7/13/2019 Statistics II for Dummies Abertura http://slidepdf.com/reader/full/statistics-ii-for-dummies-abertura 1/35 Estatística II Para Leigos Para Leigos: A série de livros para iniciantes que mais vende no mundo.  F  o  l  h  a   d  e   C  o  l  a  Saiba Qual Análise de Dados Usar Esta tabela vai ajudá-lo a comparar, contrastar e decidir qual análise de dados usar e quando. Use-a para uma consulta rápida ou para uma revisão antes das provas. Análise Propósito Quando Usar Capítulo Regressão Linear Simples Usa  para estimar  através de uma reta A variável de resposta  é quantitativa; variação constante através de , que  também é quantitativa 4 Regressão Múltipla Usa várias variáveis  (i ,  = 1... , k) para estimar  através de um plano  é quantitativa; distribuição normal para cada i  com variação constante 5 Regressão Não-Linear Usa  para estimar  através de uma curva  é quantitativa; distribuição normal; variação constante através de  7 Regressão Logística Usa  para estimar  = probabilidade da ocorrência de   é uma variável de sim/não 8 ANOVA com um fator Compara mais do que duas médias populacionais usando um fator  é quantitativa; o fator é  10 Teste de Tukey Comparações Múltiplas Intervalos de confiança para todos os pares de médias; mantém as taxas de erro baixas 10 LSD de Fisher Comparações Múltiplas Intervalos de confiança para todos os pares de médias; taxas de erro globais mais altas do que as de Tukey 10 Método Scheffe Comparações Múltiplas Examina as combinações lineares das médias, não apenas dos pares 10 Ajuste de Bonferroni Comparações Múltiplas Todos os pares de testes t ajustados para número de teste 10 Teste de Dunnett Comparações Múltiplas Experimentos; compara tratamento versus controle 10 Teste de Student Newman-Keuls (SNK) Comparações Múltiplas Abordagem gradual, compara pares ordenados do menor para o maior 10 Teste de Duncan (MRT) Comparações Múltiplas Ajusta SNK para mais força 10 ANOVA com dois fatores Compara mais do que duas médias populacionais usando dois fatores mais interação  é quantitativa; os fatores são ( 1 , 2 ) 11 Testes do Qui- quadrado Testa a independência de duas variáveis ou a qualidade de ajuste para uma variável qualitativa Todas as variáveis são qualitativas 14, 15 Teste do sinal/ Teste dos postos sinalizados Testa uma mediana populacional  é quantitativa ou ordinal (baseada nos postos) 17 Teste da soma de postos Compara duas medianas populacionais  é quantitativa ou ordinal (baseada nos postos) 18 Teste de Kruskal-Wallis Compara mais de duas medianas populacionais usando um fator  é quantitativa ou ordinal (baseada nos postos); o fator é x 19 BOOK - Statistics II for Dummies.indb 1 21/08/2013 13:33:38

description

.

Transcript of Statistics II for Dummies Abertura

  • Estatstica II Para Leigos

    Para Leigos: A srie de livros para iniciantes que mais vende no mundo.

    Folha

    de Cola

    Saiba Qual Anlise de Dados UsarEsta tabela vai ajud-lo a comparar, contrastar e decidir qual anlise de dados usar e quando. Use-a para uma consulta rpida ou para uma reviso antes das provas.

    Anlise Propsito Quando Usar Captulo

    Regresso Linear Simples

    Usa x para estimar y atravs de uma reta A varivel de resposta y quantitativa; variao constante atravs de x, que tambm quantitativa

    4

    Regresso Mltipla Usa vrias variveis x (xi, i = 1... , k) para estimar y atravs de um plano

    y quantitativa; distribuio normal para cada xi com variao constante

    5

    Regresso No-Linear Usa x para estimar y atravs de uma curva y quantitativa; distribuio normal; variao constante atravs de x

    7

    Regresso Logstica Usa x para estimar p = probabilidade da ocorrncia de y

    y uma varivel de sim/no 8

    ANOVA com um fator Compara mais do que duas mdias populacionais usando um fator

    y quantitativa; o fator x 10

    Teste de Tukey Comparaes Mltiplas Intervalos de confiana para todos os pares de mdias; mantm as taxas de erro baixas

    10

    LSD de Fisher Comparaes Mltiplas Intervalos de confiana para todos os pares de mdias; taxas de erro globais mais altas do que as de Tukey

    10

    Mtodo Scheffe Comparaes Mltiplas Examina as combinaes lineares das mdias, no apenas dos pares

    10

    Ajuste de Bonferroni Comparaes Mltiplas Todos os pares de testes t ajustados para nmero de teste

    10

    Teste de Dunnett Comparaes Mltiplas Experimentos; compara tratamento versus controle

    10

    Teste de Student Newman-Keuls (SNK)

    Comparaes Mltiplas Abordagem gradual, compara pares ordenados do menor para o maior

    10

    Teste de Duncan (MRT) Comparaes Mltiplas Ajusta SNK para mais fora 10

    ANOVA com dois fatores

    Compara mais do que duas mdias populacionais usando dois fatores mais interao

    y quantitativa; os fatores so (x1, x2) 11

    Testes do Qui-quadrado

    Testa a independncia de duas variveis ou a qualidade de ajuste para uma varivel qualitativa

    Todas as variveis so qualitativas 14, 15

    Teste do sinal/ Teste dos postos sinalizados

    Testa uma mediana populacional y quantitativa ou ordinal (baseada nos postos)

    17

    Teste da soma de postos

    Compara duas medianas populacionais y quantitativa ou ordinal (baseada nos postos)

    18

    Teste de Kruskal-Wallis Compara mais de duas medianas populacionais usando um fator

    y quantitativa ou ordinal (baseada nos postos); o fator x

    19

    BOOK - Statistics II for Dummies.indb 1 21/08/2013 13:33:38

  • Estatstica II Para Leigos

    Para Leigos: A srie de livros para iniciantes que mais vende no mundo.

    Folha

    de Cola

    Entendendo os resultados fornecidos pelo computadorEsta pgina mostra o dissecamento dos resultados fornecidos pelo programa estatstico para a regresso mltipla e para a ANOVA. Os professores adoram dar esses dados nas provas e pedir que voc os interprete. s vezes, eles deixam espaos em branco e pedem que voc os preencha usando a informao dada esteja preparado! (Observao: Para mais informao sobre como incorporei os resultados fornecidos pelo programa aos tpicos deste livro, veja a Introduo e o Captulo 1).

    Anlise de regresso Y versus X1, X2The regression equation isY = 2.34 + 0.00741X1 + 0.0261X2 [row 1]

    S = 2.44958 [4] R-Sq = 39.4% [5] R-Sq(adj) = 34.9% [6]

    PredictorConstantX1X2

    Coef SE Coef2.3405 0.68210.007406 0.0034350.02610 0.01176

    P0.0020.040 [row 2]0.035 [row 3]

    T3.432.162.22

    [linha 1] = Este o modelo para estimar y usando x1 e x2 (equao do plano).

    [linha 2] = o coeficiente de x1 0,007; a estatstica-t para testar sua significncia (dado que x2 est no modelo) 2,16, valor que significativo (valor-p = 0,04, o que menor do que 0,05).

    [linha 3] = o coeficiente de x2 0,026; a estatstica-t para testar sua significncia (dado que x1 est no modelo) 2,22, valor que significativo (valor-p = 0,035, o que menor do que 0,05).

    [4] = Variabilidade de y sobre os valores previstos (um valor pequeno desejvel).

    [5] = R 2 = Porcentagem de variabilidade em y explicada por x1 e x2 (uma alta porcentagem um bom sinal).

    [6] = R 2 (de [5]) ajustado para o nmero de variveis no modelo. Este o chamado "R 2 Ajustado". (Um valor alto bom.)

    ANOVA com um fator: Y versus GroupSource DF SS MS F PGroup 2 20.58 10.29 1.13 0.329 [row 1]Error 63 572.45 9.09 [row 2]Total 65 593.03 [row 3]S = 3.014 R-Sq = 3.47% R-Sq(adj) = 0.41% [row 4]

    [linha 1] = tratamento (trt) = grupo; k = 3 grupos, pois gl = k 1 = 2; SQT = 20,58; MQT = SQT / gl = 20,58/2 = 10,29. F = MQT / MQE = 1,13 no significativo (valor-p = 0,329 > 0,05). (Veja a linha 2 para MQR.) Assim, no h diferena entre os os grupos com relao varivel y.

    [linha 2] = gl = n k = 63, assim, n = 66 (pois k = 3, segundo a linha 1). MQE = SQD / gl = 572,45 / 63 = 9,09. MQE o denominador do teste-F na linha 1.

    [linha 3] = gl Total = n 1, assim, n = 66. Lembre-se SQTO = SQT + SQE.

    [linha 4] = Veja [4], [5], e [6] da sada para Regresso. Voc pode ver que distinguir os grupos no influencia y, pois R 2 muito pequeno e R 2 ajustado (para o nmero de grupos) ainda menor.

    BOOK - Statistics II for Dummies.indb 2 21/08/2013 13:33:38

  • por Deborah Rumsey, PhD

    Estatstica II para leigo

    Rio de Janeiro, 2013

    BOOK - Statistics II for Dummies.indb 1 21/08/2013 13:33:38

  • DedicatriaPara meu marido, Eric: meu sol nasce e se pe por voc. Para meu filho, Clint: amo voc daqui at a lua, ida e volta.

    Sobre a AutoraDeborah Rumsey PhD em Estatstica pela Ohio State University (1993), onde especialista no ensino de Estatstica e auxiliar docente do Departamento de Estatstica. Dra. Rumsey recebeu o privilgio de ser nomeada membro da Associao Americana de Estatstica. Tambm ganhou o Prmio Presidencial de Ensino da Kansas State University. Ela ainda a autora de Estatstica Para Leigos, Statistics Workbook For Dummies e Probability For Dummies, alm de ter publicado inmeros artigos e apresentado vrias palestras sobre o ensino da Estatstica. Suas paixes incluem estar com a famlia, observar pssaros, ficando mais tempo em seu trator Kubota, e torcer para o Ohio State Buckeyes em mais um campeonato nacional.

    Agradecimentos da AutoraObrigada, novamente, Lindsay Lefevere e Kathy Cox, por me darem a oportunidade de escrever este livro; Natalie Harris e Guthrie Chrissy, pelo apoio inabalvel e pela perfeita moldagem de minhas palavras e ideias; Kim Gilbert, da Universidade da Gergia, por sua minuciosa reviso tcnica; Elizabeth Rea e Sarah Westfall, pelo maravilhoso copidesque. Um agradecimento especial a Elizabeth Stasny, por sua orientao e apoio desde o primeiro dia, e a Joan Garfield, pela constante inspirao e encorajamento.

    BOOK - Statistics II for Dummies.indb 3 21/08/2013 13:33:38

  • BOOK - Statistics II for Dummies.indb 4 21/08/2013 13:33:38

  • Sumrio Resumido

    Introduo ...................................................................1

    Parte I: Encarando os Fundamentos da Anlise de Dados e da Construo de Modelos ....................................... 7

    Captulo 1: Alm das Operaes Numricas: A Arte e a Cincia da Anlise de Dados ............................................................................................................ 9

    Captulo 2: Encontre a Anlise Certa para o Problema ................................................. 21Captulo 3: Revendo Intervalos de Confiana e Testes de Hiptese ............................ 37

    Parte II: Usando Diferentes Tipos de Regresso para Fazer Previses ..............................................53Captulo 4: Em Linha com a Regresso Linear Simples................................................. 55Captulo 5: Regresso Mltipla com Duas Variveis X ................................................... 83Captulo 6: Como Vou Sentir Sua Falta se Voc No Sair?

    Escolha do Modelo de Regresso ............................................................................... 115Captulo 7: Subindo na Curva de Aprendizagem com a Regresso No Linear ....... 115Captulo 8: Sim, No, Talvez: Fazendo Previses Usando a Regresso Logstica ....... 137

    Parte III: Analisando a Varincia com ANOVA ........151Captulo 9: Precisando Testar Vrias Mdias? Venha para a ANOVA! .......................... 153Captulo 10: Organizando as Mdias Atravs das Comparaes Mltiplas ............... 173Captulo 11: Percorrendo os Caminhos da ANOVA com Dois Fatores ....................... 191Captulo 12: Regresso e ANOVA: Uma Relao Inesperada! ..................................... 207

    Parte IV: Construindo Fortes Ligaes com os Testes Qui-quadrado .......................................................219Captulo 13: Fazendo Associaes com Tabelas de Dupla Entrada ........................... 221Captulo 14: Independente o Suficiente para o Teste do Qui-quadrado .................... 241Captulo 15: Usando os Testes do Qui-quadrado para

    Qualidade de Ajuste (dos Dados, e No de Seu Jeans) ............................................ 263

    Parte V: Estatstica No Paramtrica: Rebeldes sem Distribuio ...................................................273Captulo 16: Ficando No Paramtrico .......................................................................... 275Captulo 17: Todos os Sinais Apontam para o Teste dos Sinais e o

    BOOK - Statistics II for Dummies.indb 5 21/08/2013 13:33:38

  • Teste de Postos Sinalizados .......................................................................................... 287Captulo 18: Subindo de Posto com o Teste das Somas dos Postos ............................ 303Captulo 19: Faa o Kruskal-Wallis e Ordene as Somas com Wilcoxon ..................... 313Captulo 20: Apontando Correlaes com o Posto de Spearman .............................. 325

    Parte VI: A Parte dos Dez ......................................333Captulo 21: Os Dez Erros Mais Comuns nas Concluses Estatsticas ........................ 335Captulo 22: Dez Formas de Chegar na Frente por Saber Estatstica .......................... 347Captulo 23: Dez Empregos Legais que Usam Estatstica ............................................. 357Apndice: Tabelas de Referncia ................................................................................... 367

    ndice ..................................................................379

    BOOK - Statistics II for Dummies.indb 6 21/08/2013 13:33:38

  • Sumrio

    Introduo ...................................................................1Sobre Este Livro ......................................................................................................... 1Convenes Usadas Neste Livro .............................................................................. 2S de Passagem ......................................................................................................... 3Penso eu... .................................................................................................................. 3Como Este Livro Est Organizado ............................................................................ 3

    Parte I: Encarando os Fundamentos da Anlise de Dados e da Construo de Modelos ............................................................................ 4

    Parte II: Usando Diferentes Tipos de Regresso para Fazer Previses .... 4Parte III: Analisando a Varincia com ANOVA .......................................... 4Parte IV: Construindo Fortes Ligaes com os Testes Qui-quadrado ...... 5Parte V: Estatstica No Paramtrica: Rebeldes sem Distribuio ........... 5Parte VI: A Parte dos Dez .............................................................................. 5

    cones Usados Neste Livro ........................................................................................ 5De L para C, Daqui para L .................................................................................. 6

    Parte I: Encarando os Fundamentos da Anlise de Dados e da Construo de Modelos ............................7

    Captulo 1: Alm das Operaes Numricas: A Arte e a Cincia da Anlise de Dados .................................................................................... 9Anlise de Dados: Olhe Antes de Mastigar ............................................................ 9

    Nada(nem mesmo uma reta) dura para sempre. .................................... 11Bisbilhotar os dados no coisa que se faa! .......................................... 11Proibido pescar(dados)............................................................................... 12

    Veja o Quadro como um Todo: Um Panorama sobre Estatstica II .................... 13Parmetro da populao ............................................................................. 13Estatstica amostral ....................................................................................... 14Intervalo de confiana ................................................................................. 14Teste de hiptese .......................................................................................... 15Anlise de varincia (ANOVA) ................................................................... 15Comparaes mltiplas ............................................................................... 16Efeitos de interao ...................................................................................... 16Correlao ..................................................................................................... 17Regresso linear ............................................................................................ 18Testes Qui-quadrados ................................................................................... 19Estatstica no paramtrica ......................................................................... 20

    Captulo 2: Encontre a Anlise Certa para o Problema .................. 21Variveis Categricas versus Variveis Quantitativas ........................................... 22Estatsticas para Variveis Categricas................................................................... 23

    BOOK - Statistics II for Dummies.indb 7 21/08/2013 13:33:38

  • viii Estatstica II Para Leigos ______________________________________

    Estimando uma proporo ......................................................................... 23Comparando propores ............................................................................ 24Procurando relaes entre variveis categricas ..................................... 25Construindo modelos para fazer previses ............................................... 26

    Estatsticas para Variveis Quantitativas ................................................................ 27Fazendo estimativas ..................................................................................... 27Fazendo comparaes................................................................................. 28Explorando relaes .................................................................................... 28Prevendo y atravs de x ............................................................................... 30

    Evitando o Vis ......................................................................................................... 31Medindo a Preciso Atravs da Margem de Erro .................................................. 33Conhecendo Seus Limites ....................................................................................... 34

    Captulo 3: Revendo Intervalos de Confiana e Testes de Hiptese ................................................................................37Estimando Parmetros Usando os Intervalos de Confiana ................................ 38

    Entendendo o bsico: A forma geral de um intervalo de confiana ..... 38Encontrando o intervalo de confiana para uma mdia populacional 39O que altera a margem de erro? ................................................................. 40Interpretando um intervalo de confiana ................................................. 43

    O que que os Testes de Hiptese Tm? .............................................................. 44O que Ho e Ha realmente representam? ................................................... 44Reunindo evidncias em uma estatstica de teste .................................... 45Determinando a fora da evidncia atravs do valor-p. .......................... 45Alarmes falsos e oportunidades perdidas: Erros Tipo I e Tipo II ............ 46O poder de um teste de hiptese ............................................................... 48

    Parte II: Usando Diferentes Tipos de Regresso para Fazer Previses ................................................. 53

    Captulo 4: Em Linha com a Regresso Linear Simples .................55Investigando Relaes com Diagramas de Disperso e Correlaes ................. 56

    Usando diagramas de disperso para investigar relaes ....................... 57Comparando informaes atravs do coeficiente de correlao .......... 58

    Construindo um Modelo de Regresso Linear Simples ....................................... 60Encontrando a reta certa para modelar seus dados ................................ 60O intercepto y da reta de regresso ............................................................ 61O coeficiente angular da reta de regresso ............................................... 62Estimando pontos atravs da regresso linear ..........................................63

    Sem Deixar Nenhuma Concluso para Trs: Testes e Intervalos de Confiana para a Regresso .........................................................63

    Analisando o coeficiente angular ..............................................................64Inspecionando o intercepto y .....................................................................66Construindo intervalos de confiana para a resposta mdia. .................68Prevendo o futuro com os intervalos de previso ....................................69

    Checando a Adequao do Modelo (dos Dados, No das Roupas!) ................. 71Definindo as condies ...............................................................................71Encontrando e investigando os resduos ...................................................73Usando r2 para medir o ajuste do modelo .................................................76

    BOOK - Statistics II for Dummies.indb 8 21/08/2013 13:33:39

  • ix__________________________________________ Sumrio

    Analisando outliers ......................................................................................77Conhecendo as Limitaes de sua Anlise de Regresso ................................... 79

    Evitando cair no modo causa e efeito .......................................................79Extrapolao: N-A-O-Til, NUNCA! ...............................................................80s vezes preciso ter mais do que uma varivel .....................................81

    Captulo 5: Regresso Mltipla com Duas Variveis X ..................83Conhecendo o Modelo de Regresso Mltipla ..................................................... 83

    Descobrindo os usos da regresso mltipla .............................................84A frmula geral do modelo de regresso mltipla ...................................84Seguindo os passos rumo a uma anlise ...................................................85

    Observando xs e ys ................................................................................................. 85Coletando Dados ...................................................................................................... 86Identificando Possveis Relaes ............................................................................ 88

    Construindo diagramas de disperso .........................................................88Correlaes: Examinando os vnculos .......................................................89

    Checando a Multicolinearidade ............................................................................. 91Encontrando o Modelo sob Medida para Duas Variveis X ................................ 92

    Obtendo os coeficientes de regresso mltipla ........................................93Interpretando os coeficientes .....................................................................94Testando os coeficientes .............................................................................95

    Prevendo y Atravs das Variveis x ........................................................................ 97Verificando o Ajuste do Modelo de Regresso Mltipla ...................................... 98

    Observando as condies ...........................................................................98Traando um plano para checar as condies ........................................98Verificando as trs condies ................................................................... 100

    Captulo 6: Como Vou Sentir Sua Falta se Voc No Sair? Escolha do Modelo de Regresso .....................................................115Dando o Pontap Inicial na Estimativa para a Distncia de um Punt ..............104

    Fazendo o brainstorm das variveis e coletando os dados ...................104Examinando diagramas de disperso e correlaes .............................106

    Igual a Comprar Sapatos: O Modelo Lindo, Mas Serve? ................................. 109Avaliando o ajuste do modelo de regresso mltipla ........................................110

    Processo de seleo de modelo ............................................................... 111

    Captulo 7: Subindo na Curva de Aprendizagem com a Regresso No Linear .............................................................115Antecipando a Regresso No Linear ..................................................................116Comeando com Diagramas de Disperso .........................................................117Nas Curvas da Estrada com os Polinmios..........................................................119

    Relembrando o que um polinmio ......................................................119Em busca do melhor modelo polinomial ...............................................122Usando um polinmio de segundo grau para passar na prova ............123Avaliando o ajuste de um modelo polinomial .......................................126Fazendo previses ......................................................................................129

    Subiu? Desceu? Ento Exponencial! .................................................................130Recordando os modelos exponenciais ...................................................130Em busca do melhor modelo exponencial .............................................131Espalhando segredos de forma exponencial ..........................................133

    BOOK - Statistics II for Dummies.indb 9 21/08/2013 13:33:39

  • x Estatstica II Para Leigos ______________________________________

    Captulo 8: Sim, No, Talvez: Fazendo Previses Usando a Regresso Logstica ............................................................................137Entendendo o Modelo de Regresso Logstica ...................................................138

    Qual a diferena entre a regresso logstica e as outras regresses? ............................................................138

    Utilizando uma curva em S para estimar as probabilidades .................139Interpretando os coeficientes do modelo de regresso logstica .........140O modelo de regresso linear em ao ...................................................141

    Fazendo uma Anlise de Regresso Logstica ....................................................142Fazendo a anlise no Minitab ...................................................................142Encontrando os coeficientes e construindo o modelo ..........................144Estimando p ................................................................................................145Verificando o ajuste do modelo ...............................................................146Ajustando o modelo ...................................................................................147

    Parte III: Analisando a Varincia com ANOVA ...........151

    Captulo 9: Precisando Testar Vrias Mdias? Venha para a ANOVA! .........................................................................153Comparando Duas Mdias com um Teste-t .........................................................154Avaliando Mais Mdias com ANOVA ...................................................................155

    Cuspe de sementes: uma situao perfeita para a ANOVA ...................155Seguindo os passos da ANOVA ................................................................156

    Verificando as Condies ......................................................................................157Verificando a independncia ...................................................................158Procurando o que normal ......................................................................158Notando a disperso ..................................................................................159

    Estabelecendo as Hipteses ..................................................................................162Realizando o Teste-F ..............................................................................................162

    ANOVA no Minitab .....................................................................................163Desmembrando a varincia em somas de quadrados. ..........................164Localizando as mdias das somas de quadrados. ..................................165Chegando estatstica-F ............................................................................ 166Tirando concluses a partir da ANOVA .................................................. 168O que fazer agora? ...................................................................................... 169

    Verificando o Ajuste do Modelo ANOVA ............................................................170

    Captulo 10: Organizando as Mdias Atravs das Comparaes Mltiplas ...............................................173

    Acompanhando a ANOVA ........................................................................ 174Preparando o terreno para os procedimentos

    de comparao mltipla .......................................................................176Identificando as Mdias Diferentes com Fisher e Tukey ...................................177

    Pescando diferenas com o LSD de Fisher .............................................178Usando o novo e aperfeioado LSD de Fisher ........................................179O teste de Tukey .........................................................................................182

    Examinando a Sada para Determinar a Anlise ................................................183

    BOOK - Statistics II for Dummies.indb 10 21/08/2013 13:33:39

  • xi__________________________________________ Sumrio

    Tantos Outros Procedimentos, To Pouco Tempo! ............................................184Cortando a conversa fiada com o ajuste de Bonferroni ........................185Comparando combinaes usando o mtodo de Scheffe ....................186O Teste de Dunnett .....................................................................................186Teste de Student Newman-Keuls ..............................................................187O Teste de Mltiplo de Alcance ...............................................................187Ficando no paramtrico com o teste de Kruskal-Wallis .....................188

    Captulo 11: Percorrendo os Caminhos da ANOVA com Dois Fatores ...................................................................191Configurando o Modelo ANOVA com Dois Fatores ...........................................192

    Determinando os tratamentos ..................................................................192Em busca das somas de quadrados .........................................................193

    Entendendo os Efeitos da Interao ....................................................................194Mas, afinal, o que interao? .................................................................195Interagindo com os grficos de interao ...............................................195

    Testando os Termos na ANOVA com Dois Fatores ...........................................198Executando uma Tabela ANOVA .........................................................................199

    Interpretando os resultados: nmeros e grficos ....................................200O Branco Fica Mais Branco na gua Quente?

    Mais um Caso para a ANOVA com Dois Fatores .............................................202

    Captulo 12: Regresso e ANOVA: Uma Relao Inesperada! .....207Vendo a Regresso Atravs da Variao .............................................................208

    Localizando a variabilidade e encontrando uma x-plicao ............208Chegando aos resultados com a regresso .............................................209Avaliando o ajuste do modelo de regresso ...........................................211

    Regresso e ANOVA: O Encontro dos Modelos ..................................................212Comparando as somas de quadrados ......................................................212Dividindo os graus de liberdade...............................................................214Levando a regresso at a tabela ANOVA ...............................................215Relacionando as estatsticas F e t: a ltima fronteira .............................216

    Parte IV: Construindo Fortes Ligaes com os Testes Qui-quadrado .................................................219

    Captulo 13: Fazendo Associaes com Tabelas de Dupla Entrada ...................................................................221Decompondo uma Tabela de Dupla Entrada .....................................................222

    Organizando dados em uma tabela de dupla entrada ..........................222Preenchendo as clulas .............................................................................223Totais marginais .........................................................................................224

    Desmembrando as Probabilidades ......................................................................225Probabilidades marginais ..........................................................................226Probabilidades conjuntas ..........................................................................227Probabilidades condicionais ....................................................................228

    Tentando Ser Independente ..................................................................................233

    BOOK - Statistics II for Dummies.indb 11 21/08/2013 13:33:39

  • xii Estatstica II Para Leigos ______________________________________

    Verificando a independncia entre duas categorias .............................233Verificando a independncia entre duas variveis ................................235

    Desmistificando o Paradoxo de Simpson ............................................................236Experimentando o Paradoxo de Simpson ...............................................236Descobrindo o porqu do Paradoxo de Simpson ..................................239De olho no Paradoxo de Simpson ............................................................240

    Captulo 14: Independente o Suficiente para o Teste do Qui-quadrado ........................................................................................241O Teste do Qui-quadrado para a Independncia ...............................................242

    Coletando e organizando os dados ..........................................................243Determinando as hipteses .......................................................................245Calculando as frequncias esperadas ......................................................245Verificando as condies para o teste .....................................................246Calculando a estatstica Qui-quadrado. ...................................................247Encontrando seus resultados na tabela do Qui-quadrado ....................249Tirando concluses ....................................................................................253Colocando o Qui-quadrado prova ........................................................255

    Comparando Dois Testes para Comparar Duas Propores .............................257Refamiliarizando-se com o teste-Z

    para duas propores populacionais ..................................................257Igualando os testes do Qui-quadrado e

    testes-Z para uma tabela dois por dois .................................................258

    Captulo 15: Usando os Testes do Qui-quadrado para Qualidade de Ajuste (dos Dados, e No de Seu Jeans) ................263Encontrando a Estatstica de Qualidade de Ajuste ............................................264

    O observado versus o esperado ................................................................264Calculando a estatstica de Qualidade de ajuste ....................................266

    Interpretando a Estatstica da Qualidade de Ajuste Atravs do Qui-quadrado ...................................................................................268

    Verificando as condies antes de comear ..........................................270Os passos para o teste Qui-quadrado de qualidade de ajuste. .............270

    Parte V: Estatstica No Paramtrica: Rebeldes sem Distribuio .............................................................273

    Captulo 16: Ficando no Paramtrico .............................................275Em Favor da Estatstica No Paramtrica ............................................................275

    No precisa se preocupar se as condies no forem atendidas ........276Uma chance para a mediana mostrar seu potencial .............................277Ento, qual a pegadinha? .......................................................................279

    Dominando o Bsico das Estatsticas no Paramtricas ...................................280Sinal .............................................................................................................280Postos ...........................................................................................................282Postos com sinais .......................................................................................283Soma de postos ...........................................................................................284

    BOOK - Statistics II for Dummies.indb 12 21/08/2013 13:33:39

  • xiii__________________________________________ Sumrio

    Captulo 17: Todos os Sinais Apontam para o Teste dos Sinais e o Teste de Postos Sinalizados .........................287Interpretando os Sinais: O Teste dos Sinais .........................................................288

    Testando a mediana ...................................................................................290Estimando a mediana ................................................................................292Testando os pares combinados ................................................................294

    Um Passo Adiante com o Teste de Postos Sinalizados ......................................296Uma limitao do teste dos sinais ............................................................296Seguindo os passos para realizar um teste de postos sinalizados ........297Emagrecendo com os postos sinalizados ................................................298

    Captulo 18: Subindo de Posto com o Teste das Somas dos Postos ..............................................................303Realizando o Teste da Soma dos Postos ..............................................................303

    Verificando as condies ..........................................................................303Seguindo os passos para a realizao de um teste .................................304Aumentando o tamanho da amostra 306

    Realizando um Teste da Soma dos Postos: Qual Corretor de Imveis Vende Casas Mais Rpido? ............................................................................................307

    Verificando as condies para este teste ................................................307Testando a hiptese ...................................................................................309

    Captulo 19: Faa o Kruskal-Wallis e Ordene as Somas com Wilcoxon ................................................................................................313Fazendo o Teste de Kruskal-Wallis para Comparar Mais de

    Duas Populaes ................................................................................................313Verificando as condies ..........................................................................315Estabelecendo o teste ................................................................................317Realizando o teste passo a passo..............................................................317

    Localizando as Diferenas: O Teste da Soma dos Postos de Wilcoxon ...........320Comparaes pareadas .............................................................................320Realizando testes de comparao para ver quem diferente ..............321Examinando as medianas para ver como elas se diferem ....................323

    Captulo 20: Apontando Correlaes com o Posto de Spearman ..............................................................................325Pearson e Suas Preciosas Condies ...................................................................326Correlao de Posto de Spearman .......................................................................327

    Calculando a correlao de posto de Spearman ...................................328Spearman em ao: Relacionando aptido ao desempenho ...............329

    Parte VI: A Parte dos Dez .........................................333

    Captulo 21: Os Dez Erros Mais Comuns nas Concluses Estatsticas ............................................................................................335

    BOOK - Statistics II for Dummies.indb 13 21/08/2013 13:33:39

  • xiv Estatstica II Para Leigos ______________________________________

    Dizer o que as Estatsticas Provam... ....................................................................335Tecnicamente No Estatisticamente Significativo, Mas... ..............................336Concluir que x Causa y ..........................................................................................337Supor que os Dados So Normais ........................................................................338Relatar Apenas os Resultados Importantes ......................................................338Supor que Uma Amostra Grande ..........................................................................339 Sempre Melhor ....................................................................................................339No Tecnicamente Aleatria, Mas... .................................................................340Supor que 1.000 Respostas So 1.000 Respostas .................................................341Naturalmente, Os Resultados se Aplicam Populao em Geral ....................343Omitir .......................................................................................................................344

    Captulo 22: Dez Formas de Chegar na Frente por Saber Estatstica ..................................................................................347Faa as Perguntas Certas .......................................................................................347Seja Ctico ...............................................................................................................348Colete e Analise os Dados Corretamente ............................................................349Pedindo Ajuda ........................................................................................................350Refazendo os Passos de Outras Pessoas ..............................................................350Juntando as Peas ..................................................................................................351Verificando Suas Respostas ...................................................................................352Explicando a Sada .................................................................................................352Fazendo Recomendaes Convincentes ............................................................353Estabelecendo-se Como o Cara da Estatstica .....................................................355

    Captulo 23: Dez Empregos Legais que Usam Estatstica .............357Pesquisadores de Opinio Pblica .......................................................................357Ornitlogo (Observador de Pssaros)..................................................................358Comentarista ou Jornalista Esportivo ...................................................................359Jornalista ..................................................................................................................360Combatentes do Crime ..........................................................................................361Profissional da rea Mdica ..................................................................................362Executivo de Marketing .........................................................................................363Advogado ................................................................................................................364Corretor de Aes ...................................................................................................364

    Apndice: Tabelas de Referncia .....................................................367Tabela-t ....................................................................................................................367Tabela Binomial......................................................................................................369Tabela do Qui-quadrado........................................................................................374Tabela da Soma dos Postos ...................................................................................376Tabela-F ...................................................................................................................377

    ndice .....................................................................379

    BOOK - Statistics II for Dummies.indb 14 21/08/2013 13:33:39

  • Introduo

    Ento, voc j sabe alguma coisa sobre Estatstica. Mdias, medianas e desvios padro so todos termos que lhe soam familiares. Tambm conhece um pouco de pesquisa e experimentos e entende as ideias bsicas de correlao e regresso simples. Estudou probabilidade, margem de erro e alguma coisa sobre testes de hiptese e intervalos de confiana. Est pronto para acrescentar ferramentas mais sofisticadas sua caixa de ferramenta estatsticas? Estatstica II Para Leigos inicia justamente onde o Estatstica Para Leigos parou e faz com que voc continue passo a passo sua caminhada pela trilha de ideias e tcnicas estatsticas.

    O foco do Estatstica II Para Leigos est em encontrar mais formas de analisar dados. Aqui, voc encontrar instrues passo a passo para usar tcnicas como a de regresso mltipla, regresso no linear, anlise de varincia com um ou dois fatores (ANOVA), testes qui-quadrado e estatsticas no paramtricas. Com essas novas tcnicas, possvel estimar, investigar, correlacionar e congregar ainda mais variveis baseadas nas informaes que voc tem mo.

    Sobre Este LivroEste livro foi concebido para aqueles que concluiram os conceitos bsicos de estatstica, indo desde os intervalos de confiana at os testes de hiptese (encontrados no Estatstica Para Leigos), e que esto prontos para desbravar o caminho e seguir em direo parte final da Estatstica I ou encarar a Estatstica II. Contudo, sempre que necessrio, voltarei brevemente a alguns pontos de Estatstica I, apenas para lembr-lo da matria e garantir que voc est tinindo. A cada nova tcnica, voc ter um panorama geral de quando e por que ela usada, como saber quando ela necessria, alm de instrues passo a passo sobre como faz-la, e as dicas e truques de uma analista de dados veterana (eu mesma, ao seu dispor!). Uma vez que muito importante ser capaz de saber qual mtodo usar e quando, enfatizo o que distingue cada tcnica e o que dizem os resultados. Voc tambm ver muitas aplicaes das tcnicas em situaes reais.

    Tambm incluo a interpretao do resultado para fim de anlise de dados. Mostro como usar os programas para chegar aos resultados, mas foco mais em como interpretar os resultados encontrados no resultado (sada), uma vez que mais provvel que voc tenha que interpretar esse tipo de informao em vez de fazer a programao. E j que as equaes e clculos podem ficar muito complexos se feitos mo, voc usar muito o computador para chegar aos resultados. Incluo instrues para o uso do Minitab na realizao de muitos dos clculos apresentados neste livro. A maioria dos professores que ministram aulas sobre esses tpicos tambm mantm a mesma opinio. (Que alvio!)

    BOOK - Statistics II for Dummies.indb 1 21/08/2013 13:33:39

  • 2 Estatstica II Para Leigos _____________________________________

    Este livro se diferencia dos outros livros de Estatstica II por muitos motivos, pois traz:

    5 Explicaes completas dos conceitos de Estatstica II. Muitos livros enfiam todos os tpicos de Estatsticas II no finalzinho da matria de Estatstica I; o resultado disso que esses pontos tendem a ficar condensados e aparecerem como se fossem opcionais. Mas no se preocupe, dediquei tempo para explicar clara e completamente todas as informaes de que voc precisa para sobreviver e prosperar.

    5 Dissecao do resultado. Ao longo de todo o livro, apresento muitos exemplos que utilizam programa de estatstica para analisar dados. Em cada caso, apresento o resultado e explico como eu o obtive e o que ele significa.

    5 Um grande nmero de exemplos. Incluo muitos exemplos para abordar os diferentes tipos de problemas que voc ir encarar.

    5 Muitas dicas, estratgias e alertas. Compartilho com voc alguns segredos fundamentados em minha experincia como professora, orientadora e na correo de provas.

    5 Linguagem simples. Tento manter a linguagem informal a fim de ajud-lo a entender, memorizar e praticar as definies, as tcnicas e os processos estatsticos.

    5 Passo a passo conciso e objetivo. Na maioria dos captulos, possvel encontrar instrues passo a passo que, de forma intuitiva, explicam como trabalhar os problemas de Estatstica II e o ajudam a lembrar como resolv-los quando tiver que faz-lo sozinho.

    Convenes Usadas Neste LivroAo longo de todo este livro, usei vrias convenes, as quais gostaria que voc conhecesse:

    5 Indico a multiplicao, usando um sinal de vezes indicado por um asterisco (*).

    5 Indico as hipteses nula e alternativa como Ho (para a hiptese nula) e Ha (para a hiptese alternativa).

    5 O pacote de software estatstico que utilizo e mostro ao longo do livro o Minitab 14, mas me refiro a ele simplesmente por Minitab.

    5 Sempre que introduzo um novo termo, o escrevo em itlico.

    5 Palavras-chave e passo a passos numerados aparecem em negrito.

    5 Sites e endereos de e-mail aparecem em monofonte.

    BOOK - Statistics II for Dummies.indb 2 21/08/2013 13:33:39

  • 3_________________________________________________ Introduo

    S de Passagems vezes, apresento alguns detalhes mais tcnicos de frmulas e procedimentos para os leitores que possam precisar deles ou que apenas queiram conhecer os mnimos detalhes. Essas mincias esto marcadas com um cone. Tambm incluo barras laterais como informaes parte do texto essencial, em geral na forma de um exemplo real ou de informao extra que voc possa achar interessante. Fique vontade para pular esses cones e essas barras laterais, pois no perder nenhuma das informaes principais de que precisa (mas, se voc for l-las, poder deixar seu professor de estatstica impressionado com seu conhecimento alm da mdia!).

    Penso que...J que este livro aborda a Estatstica II, presumo que voc j tenha feito um curso de introduo Estatstica (ou, pelo menos, tenha lido Estatstica Para Leigos), que tenha apresentado a voc o Teorema do Limite Central e, talvez, algo sobre intervalos de confiana e testes de hiptese (embora eu faa uma breve reviso desses conceitos no Captulo 3). No preciso ter experincia com regresso linear simples. Apenas a lgebra aprendida no ensino superior necessria para os detalhes matemticos. Experincia com softwares estatsticos algo a mais, mas no necessria.

    Como estudante, voc pode abordar estes tpicos destas formas: como prosseguimento do curso de Estatstica I (talvez de forma apressada, mas, de qualquer modo, est vendo); ou como um curso de duas etapas, sendo os tpicos deste livro o foco da segunda fase. Se for o caso, este livro lhe oferece a informao necessria para que voc se d bem, seja qual for o mtodo que esteja seguindo.

    Voc pode estar apenas interessado em Estatstica II para compreender situaes do dia a dia ou, talvez, queira aprimorar sua compreenso de estudos e resultados estatsticos mostrados na mdia. Caso seja este o seu caso, voc encontrar vrios exemplos e aplicaes dessas tcnicas estatsticas na vida real, assim como cuidados para interpret-los.

    Como Este Livro Est OrganizadoEste livro est organizado em cinco partes principais que exploram os tpicos mais importantes em Estatstica II, alm de uma parte bnus que oferece uma srie de dez referncias rpidas para voc usar. Cada parte

    BOOK - Statistics II for Dummies.indb 3 21/08/2013 13:33:39

  • 4 Estatstica II Para Leigos _____________________________________

    contm captulos que dividem o principal objetivo da parte em fragmentos compreensveis. A configurao no linear deste livro lhe permite pular captulos e, ainda assim, acessar e compreender facilmente qualquer tpico dado.

    Parte I: Encarando os Fundamentos da Anlise de Dados e da Construo de ModelosEsta parte aborda as grandes ideias das estatsticas descritiva e inferencial, alm da regresso linear simples no contexto da construo de modelos e do processo decisrio. Alguns tpicos da Estatstica I recebem uma rpida reviso. Tambm apresento o jargo tpico da Estatstica II.

    Parte II: Usando Diferentes Tipos de Regresso para Fazer PrevisesNesta parte, voc pode revisar e expandir as ideias da regresso linear simples para o processo de utilizao de mais de uma varivel preditora. Essa parte apresenta tcnicas para manipular dados que seguem uma curva (modelos no lineares) e modelos para dados do tipo sim ou no usados para fazer previses sobre o acontecimento ou no de um evento (regresso logstica). Nesta parte, voc encontra tudo aquilo de que precisa para saber sobre condies, diagnsticos, construo de modelos, tcnicas de anlise de dados e interpretao de resultados.

    Parte III: Analisando a Varincia com ANOVAVoc pode querer comparar as mdias de mais de duas populaes, e isso requer a utilizao da anlise da varincia (ANOVA). Essa parte discute as condies bsicas necessrias, o teste-F, a ANOVA de um e dois fatores e as comparaes mltiplas. O objetivo final dessas anlises mostrar se as mdias das populaes em questo so diferentes e, caso sejam, quais so mais altas ou mais baixas do que o restante.

    Parte IV: Construindo Fortes Ligaes com os Testes Qui-quadradoEsta parte abrange a distribuio Qui-quadrado e como voc pode us-la para modelar e testar dados categricos (qualitativos). Voc vai descobrir

    BOOK - Statistics II for Dummies.indb 4 21/08/2013 13:33:39

  • 5_________________________________________________ Introduo

    como testar a independncia de duas variveis usando o teste Qui-quadrado. (Voc no vai mais precisar fazer especulaes apenas por meio da observao dos dados em tabelas 2X2!) Voc tambm ver como usar um Qui-quadrado para testar a capacidade de adequao do modelo aos dados.

    Parte V: Estatstica No Paramtrica: Rebeldes sem DistribuioEsta parte o ajuda com as tcnicas usadas em situaes em que voc no pode (ou no quer) partir do princpio de que seus dados vm de uma populao com determinada distribuio, como, por exemplo, quando sua populao no normal (condio exigida pela maioria dos outros mtodos em Estatstica II).

    Parte VI: A Parte dos DezA leitura desta parte pode lhe dar uma vantagem dentro de uma importante rea que vai alm de frmulas e tcnicas da Estatstica II: terminar o problema da forma correta (sabendo que tipos de concluses voc pode ou no tirar). Voc tambm vai conhecer a Estatstica II no mundo real, ou seja, de que forma ela pode ajud-lo a se sobressair na multido.

    No final do livro, voc tambm encontrar um apndice que contm todas as tabelas necessrias para o entendimento e para a realizao dos clculos presentes nesta obra.

    cones Usados Neste LivroNeste livro, utilizo cones a fim de chamar sua ateno para determinados textos que aparecem frequentemente. Pense nos cones como placas com as quais voc se depara durante uma viagem. Algumas placas mostram atalhos, outras oferecem mais informaes que voc pode precisar; algumas o alertam sobre possveis perigos, enquanto outras do algum lembrete.

    SAD

    A D

    O C

    OMPUTADOR Este cone significa que vou explicar como realizar uma determinada

    anlise de dados usando o Minitab. Tambm explico as informaes obtidas no resultado para que voc consiga interpret-lo.

    LEMB

    RE-SE Uso esse cone para reforar certas ideias que so cruciais para o sucesso em Estatstica II, tais como coisas que acredito ser importante revisar durante a preparao para uma prova.

    BOOK - Statistics II for Dummies.indb 5 21/08/2013 13:33:39

  • 6 Estatstica II Para Leigos _____________________________________

    PAPO

    DE E

    SPECIALISTA

    Quando voc vir esse cone, poder pular a informao caso no queira saber os pormenores. Tais informaes esto presentes para as pessoas que tenham um interesse especial ou a obrigao de saber mais sobre os aspectos mais tcnicos de certas questes estatsticas.

    DICA Este cone aponta dicas teis, ideias ou atalhos que podem ser usados para

    economizar tempo; tambm inclui formas alternativas de compreender determinado conceito.

    CUIDA

    DO! Utilizo os cones de cuidado para ajud-lo a ficar longe de erros e armadilhas comuns com os quais voc pode se deparar ao lidar com ideias e tcnicas relacionadas Estatstica II.

    De L para C, Daqui para LEste livro foi escrito de forma no linear. Portanto, possvel comear por qualquer captulo e, ainda assim, entender o que est acontecendo. Entretanto, quero fazer algumas recomendaes caso voc queira instrues de por onde comear.

    Se voc estiver bem familiarizado com as ideias de testes de hiptese e de regresso linear simples, comece pelo Captulo 5 (regresso mltipla). Utilize o Captulo 1 se precisar de uma referncia para o jargo que os profissionais usam em Estatstica II.

    Se j tiver abordado todos os tpicos relacionados aos vrios tipos de regresso (simples, mltipla, no linear e logstica) ou um subconjunto dos tpicos que seu professor considerou importantes, v ao Captulo 9, o fundamento da anlise de varincia (ANOVA).

    O Captulo 14 a parte por onde comear caso voc queira enfrentar as variveis categricas (qualitativas) antes de acertar as quantitativas. L voc pode trabalhar com o teste Qui-quadrado.

    A estatstica no paramtrica apresentada no Captulo 16. Essa rea, hoje em dia, um tpico significativo nos cursos de Estatstica, no entanto, parece no receber o espao devido nos livros didticos. Comece aqui caso queira detalhes completos sobre os procedimentos no paramtricos mais comuns.

    BOOK - Statistics II for Dummies.indb 6 21/08/2013 13:33:40

  • A 5a Onda Por Rich Tennant

    Fiz uma avaliao do nosso ltimo grfico de pizza. Aparentemente, de quatro queijos.

    Parte I:

    Encarando os Fundamentos da

    Anlise de Dados e da Construo de Modelos

    BOOK - Statistics II for Dummies.indb 7 21/08/2013 13:33:41

  • Nesta parte...

    Para que voc comece a deixar os conceitos bsicos de estatstica (abordados em seu livro de Estatstica I, assim como no Estatstica Para Leigos) para conhecer os novos e instigantes mtodos apresentados neste livro, primeiro introduzo o bsico da anlise de dados, as terminologias mais importantes, os principais objetivos e conceitos da construo de modelos e as dicas para a escolha da estatstica adequada ao trabalho. Alm disso, vou refrescar sua memria com relao a itens de grande referncia em Estatstica I, e voc tambm comear a fazer e observar alguns resultados bsicos produzidos no Minitab.

    BOOK - Statistics II for Dummies.indb 8 21/08/2013 13:33:41

  • Captulo 1

    Alm das Operaes Numricas: A Arte e a

    Cincia da Anlise de DadosNeste Captulo

    X Entendendo seu papel como analista de dados X Evitando gafes estatsticas X Bisbilhotando o jargo da Estatstica II

    J que est lendo este livro, voc provavelmente j est familiarizado com o bsico de Estatstica e est pronto para fazer mais um avano. O prximo passo envolve o uso do que voc j conhece, mais a aprendizagem de algumas ferramentas e tcnicas e, finalmente, a mistura de tudo ir ajud-lo a resolver questes mais realistas atravs do uso de dados reais. Em termos estatsticos, voc est pronto para entrar no mundo dos analistas de dados.

    Neste captulo, voc vai rever os termos envolvidos em Estatstica que fazem parte da anlise de dados no nvel da Estatstica II. Voc ter uma ideia do impacto que seus resultados podem causar ao ver o que essas tcnicas de anlise so capazes de fazer. Voc tambm ter uma boa viso sobre o mal uso da anlise de dados e seus efeitos.

    Anlise de Dados: Olhe Antes de Mastigar

    Apenas os estatsticos costumavam analisar dados, j que os nicos programas de computador disponveis eram complicados demais e requeriam um grande conhecimento sobre Estatstica para organizar e

    BOOK - Statistics II for Dummies.indb 9 21/08/2013 13:33:41

  • 10 Parte I: Encarando os Fundamentos da Anlise... ___________________

    conduzir as anlises. Os clculos eram entediantes e, s vezes, imprevisveis, alm de requererem um bom conhecimento sobre teorias e mtodos para a obteno de respostas corretas e confiveis.

    Hoje em dia, qualquer um que queira analisar dados pode faz-lo sem grandes esforos. Muitos pacotes de programas estatsticos so feitos justamente com esse propsito Microsoft Excel, Minitab, SAS e SPSS so apenas alguns exemplos. Tambm existem programas online gratuitos, como o Stat Crunch, para ajud-lo a fazer exatamente o que seu nome sugere esmiuar os nmeros e chegar a uma soluo.

    Cada programa tem seus prs e contras (e seus prprios usurios e discordantes). O meu preferido, ao qual vou me referir ao longo do livro, o Minitab, pois muito fcil de usar. Os resultados so precisos e o software vem carregado com todas as tcnicas de anlise de dados usadas em Estatstica II. Embora a licena do Minitab no seja barata, a verso para estudantes pode ser alugada por um preo bem baixo.

    LEMB

    RE-SE A ideia mais importante durante a aplicao das tcnicas estatsticas para a anlise de dados saber o que se passa por trs do clculo, para que, assim, voc (e no o computador) fique no controle da anlise. por isso que o conhecimento em Estatstica II crucial.

    CUIDA

    DO! Muitas pessoas no se do conta de que o software no lhes diz quando usar ou no usar uma determinada tcnica estatstica. Voc que tem de determinar isso. Como resultado, as pessoas acham que esto fazendo suas anlises da forma correta, mas podem acabar cometendo todos os tipos de erros. Nas sees a seguir, dou exemplos de algumas situaes em que inocentes anlises de dados podem dar errado, e por que importante identificar e evitar esses erros antes de comear os clculos.

    Concluso: os pacotes de software atuais parecem mgica se voc no entende os princpios de Estatstica II envolvidos.

    Voltando aos velhos temposAntigamente, a fim de determinar se mto-dos diferentes geravam diferentes resulta-dos, era preciso escrever um programa com um cdigo que voc s aprendia depois de ter uma aula. Era preciso digitar seus dados da forma requerida pelo programa, envi--los para o computador e esperar os resul-tados. Esse mtodo consumia muito tempo e dava muita dor de cabea.

    A boa nova que os programas de estats-tica passaram por uma evoluo inacredi-

    tvel nos ltimos 15 anos, a ponto de, hoje, voc conseguir inserir seus dados de forma rpida e fcil em quase todos os formatos. Alm disso, as opes para a anlise de dados so bem organizadas e listadas em barras de menu. Pull-down menus refere--se caracterstica das barras de menu de serem estendidas para baixo. Os resul-tados so instantneos e eficazes, e voc pode recort-los e col-los em um editor de texto em um piscar de olhos.

    BOOK - Statistics II for Dummies.indb 10 21/08/2013 13:33:41

  • 11__ Captulo 1: Alm das Operaes Numricas: A Arte e a Cincia...

    Nada(nem mesmo uma reta) dura para sempreBill Prediction um estudante de estatstica que estuda o efeito do tempo de estudo sobre o resultados obtidos em provas. Bill coleta dados sobre estudantes de estatstica e utiliza seu confiabilssimo software para prever as notas obtidas nas provas utilizando o tempo de estudo. O computador dele apresenta a equao y = 10x + 30, onde y representa a nota que voc obtm se estudar um certo nmero de horas (x). Observe que esse modelo a equao de uma reta com intercepto y (coordenada y quando x = 0) de 30 e coeficiente angular de 10.

    Sendo assim, Bill prev, usando este modelo, que se voc no estudar nada, sua nota na prova ser 30 (usando x = 0 na equao para chegar ao valor de y, ponto que representa a intercepo y da reta). E ele prev, usando este modelo, que se voc estudar durante 5 horas, sua nota na prova ser y = (10 * 5) + 30 = 80. Assim, o ponto (5,80) tambm est nesta reta.

    Mas, ento, Bill se empolga um pouco e quer saber o que aconteceria se voc estudasse durante 40 horas (uma vez que, sempre que est estudando, ele tem a impresso de ter estudado todo esse tempo). O computador, ento, lhe diz que se ele estudasse durante 40 horas, a previso de sua nota seria (10 * 40) + 30 = 430. Essa, sim, seria uma nota alta! O problema que a nota mxima em uma prova 100. Dessa forma, Bill se questiona onde seu computador errou.

    Mas acaba colocando a culpa no lugar errado. Na verdade, ele precisa se lembrar de que os valores de x precisam ter um limite para que esta equao faa sentido. Por exemplo, uma vez que x representa o tempo de estudo, x nunca pode ser menor do que zero. Se voc substituir x por um nmero negativo, digamos x = 10, ter y = (10 * 10) + 30 = 70, resultado que no faz sentido. No entanto, nem a equao nem o computador que a descobriu sabem disso. O computador apenas faz o grfico da reta que voc d, pressumido que ela infinita tanto na direo positiva quanto na negativa.

    CUIDA

    DO! Depois de conseguir uma equao ou um modelo estatstico, preciso especificar os valores que se aplicam equao. As equaes no sabem quando esses valores funcionam ou no; tarefa do analista de dados determinar isso. A ideia a mesma para a aplicao dos resultados de qualquer anlise de dados que voc realizar.

    Bisbilhotar os dados no coisa que se faa!

    CUIDA

    DO! Os estatsticos inventaram um ditado que voc j deve ter ouvido: Os nmeros no mentem. Mas os mentirosos fabricam nmeros. Conhea todas as anlises realizadas em um conjunto de dados, e no apenas as que foram relatadas como sendo estatisticamente significativas.

    BOOK - Statistics II for Dummies.indb 11 21/08/2013 13:33:41

  • 12 Parte I: Encarando os Fundamentos da Anlise... ___________________

    Suponha que Bill Prediction (da seo anterior) decida tentar prever as notas obtidas em uma prova de biologia, baseando-se no tempo de estudo, mas, desta vez, seu modelo no se adqua. No querendo dar o brao a torcer, Bill insiste na ideia de que deva haver outros fatores que prevejam as notas da prova de biologia alm do tempo de estudo e, ento, sai em busca deles.

    Bill vasculha todas as possibilidades. Seu conjunto de 20 possveis variveis inclui o tempo de estudo, a mdia de notas, a experincia anterior em estatstica, as notas de matemtica no Ensino Mdio e se voc masca chiclete durante a prova. Depois de muitas anlises de correlao, as variveis que Bill descobre estar relacionadas nota da prova foram o tempo de estudo, as notas de matemtica no Ensino Mdio, a mdia de notas e se voc masca chiclete durante a prova. No final, este modelo em particular serve muito bem (por critrios que discuto no Captulo 5 sobre os modelos de regresso linear mltipla).

    Mas aqui est o problema: ao observar todas as possveis correlaes entre suas 20 variveis e a nota da prova, Bill est, na verdade, fazendo 20 anlises estatsticas separadas. Sob as condies normais descritas no Captulo 3, cada anlise estatstica tem 5% de chances de estar errada apenas por acaso. Aposto que voc consegue acertar qual das correlaes de Bill provavelmente est errada nesse caso. E ainda bem que ele no vai contar com um chiclete para melhorar sua nota em Biologia.

    CUIDA

    DO! A observao exaustiva de dados em busca de algo conhecida como data snooping. O data snooping concede ao pesquisador seus cinco minutos de fama, mas, depois, faz com que ele perca toda a sua credibilidade, pois ningum mais quer repetir seus resultados.

    Proibido pescar(dados)Algumas pessoas simplesmente no aceitam um no como resposta, e, quando se trata da anlise de dados, isso pode trazer problemas.

    Sue Gonnafindit uma pesquisadora determinada. Ela acredita que seu cavalo consegue contar batendo a pata no cho. (Por exemplo, ela diz dois, e o cavalo bate com a pata no cho duas vezes.) Sue coleta dados sobre seu cavalo durante quatro semanas, registrando a porcentagem de vezes que o cavalo conseguiu contar corretamente. Em seguida, conduz a anlise estatstica adequada a seus dados e se surpreende por no ter descoberto nenhuma diferena significativa entre os resultados de seu cavalo e os resultados que voc teria obtido apenas por palpite.

    Determinada a provar que seus resultados so reais, Sue procura outros tipos de anlises existentes e coloca seus dados em toda e qualquer coisa que encontra (no importando o fato de que essas anlises no sejam adequadas sua situao). Usando o famoso mtodo da gua mole em pedra dura tanto bate at que fura, em um determinado ponto, ela finalmente tropea em um resultado significativo. Entretanto, o resultado artificial, pois ela usou muitas

    BOOK - Statistics II for Dummies.indb 12 21/08/2013 13:33:41

  • 13__ Captulo 1: Alm das Operaes Numricas: A Arte e a Cincia...

    anlises inadequadas e ignorou os resultados da anlise adequada, apenas porque estes no diziam o que ela queria ouvir.

    Outro fato interessante: quando Sue foi a um programa de TV para mostrar ao mundo seu magnfico cavalo, algum na plateia percebeu que sempre que o cavalo chegava ao nmero correto de batidas, Sue o interrompia dizendo: Bom trabalho!, e ele parava. Na verdade, ele no sabia contar; tudo o que ele sabia era parar de bater a pata quando ela dizia: Bom trabalho!

    CUIDA

    DO! O ato de refazer anlises de forma diferente a fim de tentar chegar aos resultados que voc deseja chamado de data fishing e, no mundo da estatstica, isso considerado uma infrao gravssima. (Entretanto, infelizmente, as pessoas cometem esse erro com frequncia, a fim de verificar suas crenas mais fortes.) Ao usar a anlise errada para conseguir os resultados desejados, voc leva o pblico a pensar que sua hiptese realmente correta quando, na verdade, ela pode no ser.

    Veja o Quadro como um Todo: Um Panorama sobre Estatstica II

    A Estatstica II uma extenso da Estatstica I (estatstica introdutria). Sendo assim, o jargo continua o mesmo, e as tcnicas se baseiam no que voc j conhece. Nesta seo, voc encontra uma introduo terminologia usada em Estatstica II, alm de uma ampla viso geral das tcnicas utilizadas por estatsticos para analisar os dados e descobrir o que est por trs de toda histria. (Caso voc ainda tenha dvidas sobre alguns termos da Estatstica I, consulte seu livro de Estatstica I ou veja meu outro livro, Estatstica Para Leigos, da Alta Books, para uma reviso completa.)

    Parmetro da populao

    CUIDA

    DO! O parmetro um nmero que resume a populao, grupo de interesse de sua pesquisa. Alguns exemplos de parmetros incluem a mdia de uma populao, sua mediana ou uma proporo que se enquadra em determinada categoria.

    Suponha que voc queira determinar a durao mdia de uma chamada de telefone celular entre adolescentes (com idades entre 13 e 18 anos). Voc no est interessado em fazer comparaes; o que voc quer uma boa estimativa do tempo mdio de durao. Para isso, voc deve, ento, estimar um parmetro populacional (como a mdia aritmtica). A populao composta por todos os usurios de telefone celular com idades entre 13 e 18 anos. O parmetro a durao mdia de uma chamada feita por essa populao.

    BOOK - Statistics II for Dummies.indb 13 21/08/2013 13:33:41

  • 14 Parte I: Encarando os Fundamentos da Anlise... ___________________

    Estatstica amostralNormalmente, no possvel determinar com exatido os parmetros populacionais, podemos apenas estim-los. Mas nem tudo est perdido; atravs da coleta de uma amostra (um subconjunto de indivduos) da populao e de seu estudo, possvel obter uma boa estimativa do parmetro populacional. A estatstica amostral um nico nmero que resume esse subconjunto.

    Por exemplo, no caso do telefone celular descrito na seo anterior, voc selecionaria uma amostra de adolescentes e mediria a durao de suas chamadas durante um perodo de tempo (ou obteria esses dados atravs dos registros em seus telefones, se pudesse ter acesso legal a eles). Em seguida, calcularia a mdia da durao das chamadas. Por exemplo, a durao mdia de 100 chamadas poderia ser igual a 12,2 minutos essa mdia uma estatstica. Essa estatstica em particular chamada de mdia amostral, pois trata-se de um valor mdio retirado de seus dados amostrais.

    Existem muitas estatsticas para o estudo de diferentes caractersticas de uma amostra, tais como a proporo, a mediana e o desvio padro.

    Intervalo de confianaO intervalo de confiana um conjunto de possveis valores para um parmetro populacional com base em uma amostra e nas estatsticas que resultam dessa amostra. A principal razo para que voc tenha um conjunto de possveis valores, em vez de apenas um nico nmero, que os resultados das amostras variam.

    Por exemplo, suponha que voc queira estimar a porcentagem de pessoas que comem chocolate. De acordo com o Simmons Research Bureau, 78% dos adultos entrevistados comem chocolate, e desses, 18% admitem comer doces com regularidade. O que est faltando nesses resultados? Esses nmeros resultaram de uma nica amostra de pessoas, e esses valores amostrais, com certeza, variam de amostra para amostra. Por isso, preciso ter uma medida para o quanto esses resultados mudariam caso voc repetisse o estudo.

    Essa variao de amostra para amostra, esperada para sua estatstica, medida pela margem de erro, que reflete um certo nmero de desvios padres somados e subtrados estatstica, para que voc obtenha uma determinada confiana em seus resultados (veja o Captulo 3 para mais informaes sobre margem de erro). Se os resultados dos que comem chocolate se baseassem em uma amostra formada por mil pessoas, a margem de erro seria de aproximadamente 3%. Isso significa que a porcentagem real de pessoas que comem chocolate esperada para a populao total seria de 78% 3% (ou seja, entre 75 e 81%).

    BOOK - Statistics II for Dummies.indb 14 21/08/2013 13:33:42

  • 15__ Captulo 1: Alm das Operaes Numricas: A Arte e a Cincia...

    Teste de hipteseO teste de hiptese um procedimento estatstico usado para avaliar uma afirmao existente sobre uma populao usando seus dados. A afirmao representada por Ho (hiptese nula). Caso seus dados comprovem a hiptese, voc no pode rejeitar a Ho. Entretanto, caso seus dados no comprovem a hiptese, voc deve rejeitar a Ho e elaborar uma hiptese alternativa, Ha. A razo pela qual muitos conduzem um teste de afirmao no a de meramente mostrar que seus dados comprovam uma hiptese existente, mas a de mostrar que a hiptese existente falsa, em favor da hiptese alternativa.

    O Pew Research Center estudou a porcentagem de pessoas que assistem ESPN para saber as notcias do mundo esportivo. Suas estatsticas, baseadas em uma pesquisa com cerca de mil pessoas, apontaram que, no ano 2000, 23% das pessoas diziam preferir a ESPN, e, em 2004, esse nmero caiu para apenas 20%. A pergunta : essa reduo de 3% de telespectadores de 2000 para 2004 representa uma tendncia significativa com a qual a ESPN deveria se preocupar?

    Para testar formalmente essas diferenas, voc pode elaborar um teste de hiptese. Voc toma sua hiptese nula como o resultado que voc tem de acreditar, sem estudo, Ho = no existe diferena entre os dados de 2000 e 2004 para a audincia da ESPN. Sua hiptese alternativa (Ha) a de que existe uma diferena. Para conduzir um teste de hiptese, observe a diferena entre a estatstica obtida a partir de seus dados e a afirmao que j foi feita sobre a populao (em Ho); Ento, mea o quanto elas se distanciam em unidades de desvios padro.

    Com relao ao exemplo, usando as tcnicas do Captulo 3, o teste de hiptese mostra que 23% e 20% no se distanciam o suficiente, em termos de desvios padro, para disputar a hiptese (Ho). Sendo assim, voc no pode afirmar que a porcentagem de telespectadores da ESPN na populao total tenha sofrido uma alterao de 2000 para 2004.

    LEMB

    RE-SE Assim como em qualquer anlise estatstica, suas concluses podem estar erradas apenas por acaso, uma vez que seus resultados se baseiam em dados amostrais e os resultados amostrais variam. No Captulo 3, discuto os tipos de erros que podem ser cometidos em concluses tiradas a partir de um teste de hiptese.

    Anlise de varincia (ANOVA)ANOVA o acrnimo para anlise de varincia (do ingls analysis of variance). A ANOVA utilizada quando voc quer comparar as mdias de mais de duas populaes. Por exemplo, digamos que voc queira comparar o tempo de vida de quatro marcas de pneus em nmero de milhas. Voc coleta uma amostra aleatria de 50 pneus de cada grupo, somando um total de 200 pneus, elabora um experimento para comparar o tempo de vida de cada um e faz registros. Ao final, voc obtm quatro mdias e quatro desvios padro, um para cada conjunto de dados.

    BOOK - Statistics II for Dummies.indb 15 21/08/2013 13:33:42

  • 16 Parte I: Encarando os Fundamentos da Anlise... ___________________

    Em seguida, para testar as diferenas no tempo de vida mdio das quatro marcas, voc, basicamente, compara a variabilidade entre os quatro conjuntos de dados variabilidade dentro de um conjunto inteiro, usando uma razo. Essa razo denominada estatstica-F. Caso essa razo seja grande, a variabilidade entre as marcas maior do que a variabilidade dentro de cada marca, deixando claro que nem todas as mdias so iguais para as diferentes marcas de pneus. No entanto, se a estatstica-F for pequena, isso indica que no existe uma diferena suficiente entre as mdias do tratamento comparadas variabilidade geral dentro de cada tratamento. Neste caso, no se pode dizer que as mdias para cada grupo so diferentes. (Nos Captulos 9 e 10, voc vai encontrar mais detalhes sobre ANOVA, alm de todos os jarges, todas as frmulas e o resultado obtido por computador.)

    Comparaes mltiplasSuponha que voc realize uma ANOVA e descubra uma diferena na mdia de vida til das quatro marcas de pneus (veja a seo anterior). Suas prximas perguntas, provavelmente, sero: Quais marcas se diferem? e Quo diferentes elas so? Para responder a essas perguntas, utilize os procedimentos de comparao mltipla.

    O procedimento de comparao mltipla uma tcnica estatstica que compara as mdias entre si e descobre as que se diferem. Com essa informao, voc consegue classific-las da maior para a menor, levando em conta que, em alguns casos, dois ou mais grupos podero ter mdias to prximas, a ponto de terem de ser classificados na mesma posio.

    Existem muitos tipos diferentes de procedimentos de comparao mltipla que comparam as mdias individuais e estabelecem uma ordem caso sua estatstica-F realmente tenha encontrado a existncia de uma diferena. Alguns dos procedimentos de comparao mltipla incluem o teste de Tukey, LSD e os testes-t pareados. Alguns procedimentos sero melhores do que outros, dependendo das condies e de seu objetivo como analista de dados. No Captulo 11, discuto os procedimentos de comparao mltipla com mais detalhes.

    CUIDA

    DO! No d o segundo passo a fim de comparar as mdias dos grupos caso a ANOVA no encontre qualquer resultado significativo durante a primeira fase. O programa nunca vai impedi-lo de fazer uma anlise dessas, mesmo quando a realizao de tal procedimento for errada.

    Efeitos de interaoO efeito de interao na estatstica opera da mesma forma que no mundo da medicina. s vezes, quando voc toma dois medicamentos distintos no mesmo dia, o efeito combinado dos dois muito diferente do obtido quando voc os toma separadamente.

    BOOK - Statistics II for Dummies.indb 16 21/08/2013 13:33:42

  • 17__ Captulo 1: Alm das Operaes Numricas: A Arte e a Cincia... LE

    MBRE-SE Os efeitos de interao podem aparecer em modelos estatsticos que

    utilizam duas ou mais variveis para explicar ou comparar resultados. Nesse caso, voc no pode, automaticamente, estudar o efeito de cada varivel de forma separada; primeiro, preciso verificar a presena do efeito de interao.

    Por exemplo, suponha que pesquisadores da rea mdica estejam estudando um novo medicamento para depresso e desejem saber como essa droga afeta a mudana da presso arterial tanto com grandes quanto com pequenas doses. Tambm ser comparado o contraste entre os efeitos em crianas e adultos. Tambm pode ser que o nvel da dosagem afete de modo diferente a presso arterial dos adultos e das crianas. Esse tipo de modelo se chama ANOVA com dois fatores, com um provvel efeito de interao entre os dois fatores (idade e nvel da dosagem). O Captulo 11 abrange esse assunto com mais profundidade.

    CorrelaoO termo correlao frequentemente utilizado de forma equivocada. Em estatstica, a correlao mede a fora e a direo de uma relao linear entre duas variveis quantitativas (variveis que apenas representam contagens e medidas).

    LEMB

    RE-SE No utilize a correlao para descrever relaes, a no ser quando as variveis so quantitativas. Por exemplo, errado dizer que existe uma correlao entre a cor dos olhos e a dos cabelos. (No Captulo 14, voc vai explorar as associaes entre as variveis categoriais.)

    A correlao um nmero entre 1,0 e +1,0. Uma correlao de +1,0 indica uma relao positiva perfeita; medida que uma varivel aumenta, a outra aumenta em perfeita sincronia. Uma correlao de 1,0 indica uma relao negativa perfeita; medida que uma varivel aumenta, a outra diminui em perfeita sincronia. Uma correlao igual a zero indica a ausncia de uma relao linear entre todas as variveis. A maioria das correlaes no mundo real fica entre 1,0 e +1,0; quanto mais prximas estiverem de 1,0 ou de +1,0, mais forte ser a relao; quanto mais prximas estiverem de 0, mais fraca ser a relao.

    A Figura 1-1 mostra o grfico do nmero de cafs vendidos em partidas de futebol americano realizadas em Buffalo, Nova York, bem como a temperatura do ar (em graus Fahrenheit) em cada partida. Este conjunto de dados parece seguir uma reta descendente, indicando a existncia de uma correlao negativa. A correlao se revela igual a 0,741; o nmero de cafs vendidos possui uma relao negativa relativamente forte com a temperatura no dia da partida. Isso faz sentido, uma vez que, nos dias em que a temperatura est baixa, as pessoas sentem frio e querem mais caf. Discuto a correlao mais adiante, no Captulo 4, j que ela se aplica construo de modelos.

    BOOK - Statistics II for Dummies.indb 17 21/08/2013 13:33:42

  • 18 Parte I: Encarando os Fundamentos da Anlise... ___________________

    Figura 1-1: Cafs vendi-dos em dias de partidas

    de futebol de acordo com

    diferentes temperatu-

    ras. Temperatura (F)

    Nmero de cafs vendidos versus temperatura70000

    60000

    50000

    40000

    30000

    20000

    10000

    -10 1000

    20 30 40 50 60 70

    Caf

    s

    Regresso linearDepois de encontrar uma correlao e determinar a existncia de uma relao linear relativamente forte entre duas variveis, voc pode tentar fazer previses para uma varivel com base no valor da outra. Por exemplo, caso voc saiba da existncia de uma relao linear negativa relativamente forte entre o nmero de cafs vendidos e a temperatura no dia da partida (veja a seo anterior), poder usar essa informao para prever a quantidade de caf necessria para o jogo com base na temperatura. O mtodo para encontrar a reta que melhor represente a relao entre duas variveis chamado de regresso linear.

    H muitos tipos diferentes de anlise de regresso, dependendo de sua situao. Quando apenas uma varivel utilizada para prever um resultado, o mtodo de regresso chamado de regresso linear simples (veja o Captulo 4). A regresso linear simples a mais conhecida entre todas as anlises de regresso e essencial continuao de um curso sequencial de estatstica.

    Entretanto, h outros tipos de regresso para outras situaes.

    5 Quando mais do que uma varivel utilizada para prever um resultado, o mtodo de regresso chamado de regresso linear mltipla (veja o Captulo 5).

    5 Quando a varivel utilizada para a previso de um resultado tiver apenas dois resultados, sim ou no, o mtodo usado a regresso logstica (veja o Captulo 8).

    5 Para relaes que no seguem uma reta, existe uma tcnica chamada (no se surpreenda) regresso no linear (veja o Captulo 7).

    BOOK - Statistics II for Dummies.indb 18 21/08/2013 13:33:42

  • 19__ Captulo 1: Alm das Operaes Numricas: A Arte e a Cincia...

    Testes Qui-quadradosTodas as tcnicas de regresso e correlao partem do princpio de que a varivel que est sendo estudada mais detalhadamente (a varivel de resposta) quantitativa ou seja, a varivel mede ou conta alguma coisa. Voc tambm pode se deparar com situaes em que os dados que esto sendo estudados no sejam quantitativos, mas categricos ou seja, os dados representam categorias, e no medidas ou contagens. Para estudar as relaes entre dados categricos, voc vai utilizar um teste do Qui-quadrado para independncia. Caso se descubra que as variveis no se relacionam entre si, estas so declaradas independentes. Mas, se existir uma relao entre elas, estas so declaradas dependentes.

    Suponha que voc queira explorar a relao entre o gnero e o hbito de tomar caf da manh. Uma vez que cada uma dessas variveis categrica ou qualitativa, voc vai utilizar um teste do Qui-quadrado para independncia. Em uma entrevista com 70 homens e 70 mulheres, voc descobre que 25 homens tomam caf da manh e 45 no; no caso das mulheres, 35 fazem essa primeira refeio do dia e 35 no. A Tabela 1-1 organiza esses dados e os prepara para um cenrio da utilizao do teste Qui-quadrado.

    Tabela 1-1 Configurao para questionrio Caf da Manh e gnero

    Tomam caf da manh

    No Tomam caf da manh

    Total

    Homens 25 45 70

    Mulheres 35 35 70

    LEMB

    RE-SE O teste Qui-quadrado primeiro calcula o valor possvel em cada clula da tabela caso as variveis sejam independentes (esses valores recebem o brilhante nome de frequncias esperadas). O teste Qui-quadrado, ento, compara esses valores possveis aos valores observados nos dados (chamados de frequncias observadas), usando a estatstica Qui-quadrado.

    Na comparao caf da manh e gnero, o nmero de homens que toma caf da manh menor do que o nmero de mulheres (25 70 = 35.7% comparado a 35 70 = 50%). Embora voc saiba que os resultados variam de amostra para amostra, essa diferena suficiente para declarar a existncia de uma relao entre o gnero e o hbito de tomar caf da manh, segundo o teste Qui-quadrado de independncia. O Captulo 14 revela todos os detalhes da realizao de um teste Qui-quadrado.

    Voc tambm pode usar o teste Qui-quadrado para verificar se sua teoria sobre a porcentagem de cada grupo que se enquadra em determinada

    BOOK - Statistics II for Dummies.indb 19 21/08/2013 13:33:42

  • 20 Parte I: Encarando os Fundamentos da Anlise... ___________________

    categoria verdadeira ou falsa. Por exemplo, voc consegue adivinhar a porcentagem de M&Ms que se enquadra em cada categoria de cor? Encontre mais sobre essas variaes do Qui-quadrado, bem como a resposta para a questo dos M&Ms, no Captulo 15.

    Estatstica no paramtricaA estatstica no paramtrica uma rea da Estatstica que fornece tcnicas de anlise usadas quando as condies para o uso de mtodos mais tradicionais e mais comuns no so atendidas. No entanto, s vezes, as pessoas se esquecem ou no se preocupam em checar tais condies. Logo, se as condies realmente no forem atendidas, toda a anlise jogada fora com as concluses.

    Suponha que voc esteja tentando testar uma hiptese sobre a mdia de uma populao. A abordagem mais comum nessa situao o uso do teste-t. No entanto, para usar um teste-t, os dados precisam ser coletados de uma populao que tenha distribuio normal (ou seja, ela deve ter uma curva simtrica em forma de sino). Ento, depois de coletar os dados e fazer o grfico, voc descobre que, em vez de uma distribuio normal, tem uma assimtrica. Voc se v em um beco sem sada no pode usar os procedimentos comuns de teste de hiptese que conhece e adora (pelo menos, no deveria).

    a que os procedimentos no paramtricos entram em cena. Esses procedimentos no requerem tantas condies quanto os procedimentos paramtricos. No caso de dados assimtricos, sensato realizar um teste de hiptese para a mediana, em vez de usar a mdia, e muitos so os procedimentos no paramtricos que existem para isso.

    LEMB

    RE-SE Caso as condies para o procedimento de anlise dos dados que voc deseja realizar no sejam atendidas, no entre em pnico, muito provvel que um procedimento no paramtrico esteja esperando por voc. Grande parte dos programas pode realiz-los com a mesma facilidade que realizariam os procedimentos mais comuns (paramtricos).

    CUIDA

    DO! Os programas de estatstica no verificam as condies antes de conduzir uma anlise de dados. Voc quem deve checar todas e quaisquer condies necessrias, e, caso elas estejam seriamente violadas, altere o curso de sua jornada. Muitas vezes, um procedimento no paramtrico apenas a passagem. Para mais informaes sobre os diferentes procedimentos no paramtricos, veja os Captulos 16 a 19.

    BOOK - Statistics II for Dummies.indb 20 21/08/2013 13:33:42