Teste Qui-quadrado Comparando proporções Verificando a hipótese de associação entre variáveis...

36
Teste Qui-quadrado Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas

Transcript of Teste Qui-quadrado Comparando proporções Verificando a hipótese de associação entre variáveis...

Page 1: Teste Qui-quadrado Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas.

Teste Qui-quadrado

Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas

Page 2: Teste Qui-quadrado Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas.

Exemplo Inicial: Igualdade de ProporçõesA administração de um hospital deseja verificar se luvas de três marcas (A, B e C) são homogêneas quanto à permeabilidade a vírus. Para isto, realizou um experimento, no qual 240 luvas da marca A, 240 luvas da marca B e 300 luvas da marca C foram submetidas à tensão. Durante os testes, 151 luvas da marca A (62.9%), 134 luvas da marca B (55.8%) e 177 luvas da marca C (40.0%) deixaram passar vírus quando submetidas à tensão. Os dados do experimento apresentam evidências estatísticas suficientes contra a hipótese de que as três marcas possuem a mesma permeabilidade?

H0: PA = PB = PC = PHa: ao menos uma das permeabilidades é diferente das outras

Page 3: Teste Qui-quadrado Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas.

Teste de Igualdade de Proporções (mais de uma população)

Tabela de valores observadosMarca da

luvaDeixou passar vírus quando

submetida à tensão?Total

Sim Não

A 151 89 240B 134 106 240C 177 123 300Total 462 318 780

Tabela de Classificação Cruzada

Page 4: Teste Qui-quadrado Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas.

Construção do Teste

Marca daluva

Deixou passar vírus quando submetida à tensão?

Total

Sim Não

A 151 89 240B 134 106 240C 177 123 300Total 462 318 780

H0: PA = PB = PC = PHa: ao menos uma das permeabilidades é diferente das outras

462ˆ780

P Estimativa de P, a permeabilidade comum

Page 5: Teste Qui-quadrado Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas.

Construção do Teste

Marca daluva

Deixou passar vírus quando submetida à tensão? Total Sim Não

A 151 ....................................

89............................. 240

B 134..................................... 106............................... 240C 177..................................... 123............................... 300Total 462 318 780

Se H0 (PA = PB = PC = P) é verdadeira:

quantas luvas que deixam passar o vírus deveríamos esperar dentre as luvas da marca A ? E dentre as luvas da marca B ? E da marca C ?

462ˆ780

P

(240x462/780=142.15)(240x462/780=142.15)

(300x462/780=177.70)

(240-142.15=97.85)(240-142.15=97.85)

(300-177.70=122.30)

Valores esperados sob H0

Page 6: Teste Qui-quadrado Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas.

Construção do TesteNote que os valores esperados sob H0 são calculados como uma função simples dos totais de linha, coluna e do total geral

(240x462/780=142.15)(240x462/780=142.15)

(300x462/780=177.70)

(240x318/780=97.85)(240x318/780=97.85)

(300x318/780=122.30)

(total de linha) (total de coluna)Valor Esperado da casela(total geral)

Marca daluva

Deixou passar vírus quando submetida à tensão? Total Sim Não

A 151 ....................................

89............................. 240

B 134..................................... 106............................... 240C 177..................................... 123............................... 300Total 462 318 780

Page 7: Teste Qui-quadrado Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas.

Construção do Teste

Marca daluva

Deixou passar vírus quando submetida à tensão?

Total

Sim Não

A 151 (142.15) 89 (97.85) 240B 134 (142.15) 106 (97.85) 240C 177 (177.70) 123 (122.30) 300Total 462 318 780

Tabela de Valores Observados (esperados sob H0 entre parênteses)

Estatística de Teste = “Observado – Esperado sob H0”

Page 8: Teste Qui-quadrado Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas.

Construção do TesteTabela de Valores Observados (esperados sob H0 entre

parênteses)

Estatística de Teste = (151-142.15) (89-97.85) (134-142.15) (106-97.85) (177-177.70) (123-122.30)

2 2

22

2 2

Marca daluva

Deixou passar vírus quando submetida à tensão?

Total

Sim Não

A 151 (142.15) 89 (97.85) 240B 134 (142.15) 106 (97.85) 240C 177 (177.70) 123 (122.30) 300Total 462 318 780

Page 9: Teste Qui-quadrado Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas.

Construção do TesteTabela de Valores Observados (esperados sob H0 entre

parênteses)

2 2 2

2 2 2

(151-142.15) (89-97.85) (134-142.15)Estatística de Teste = 142.15 97.85 142.15

(106-97.85) (177-177.70) (123-122.30) 97.85 177.70 122.30

+ +

+

+

+2X 2.50

Marca daluva

Deixou passar vírus quando submetida à tensão?

Total

Sim Não

A 151 (142.15) 89 (97.85) 240B 134 (142.15) 106 (97.85) 240C 177 (177.70) 123 (122.30) 300Total 462 318 780

Page 10: Teste Qui-quadrado Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas.

Valores críticos para X2

O valor de X2 é “grande” ou “pequeno” ?

5 g.l.

10 g.l.

0

Valores de Referência para X2 Distribuição de Probabilidade de X2

Distribuição Qui-quadrado

2gl

Page 11: Teste Qui-quadrado Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas.
Page 12: Teste Qui-quadrado Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas.

Graus de Liberdade para o Teste Qui-QuadradoNo caso do teste Qui-quadrado, os graus de liberdade da distribuição de referência equivalem ao

número de caselas livres na tabela

Exemplo: Tabela 2 x 2 Marca da

luvaDeixou passar vírus quando

submetida à tensão?Total

Sim Não

A 151 89 240B 134 106 240Total 285 195 480

G.L. = (número de linhas -1) x (número de colunas -1)

Page 13: Teste Qui-quadrado Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas.

Voltando ao exemplo inicial ….

Tabela 3 x 2 G.l. = (3-1) x (2-1) = 2 x 1 = 2

O valor da estatística X2 deve ser comparado aos valores de distribuição Qui-quadrado com 2 graus de liberdade.

Se α = 0.05,

RR : X2 > χ20.05 ; 2

Percentil que deixa uma área de α=0.05 acima dele na distribuição Qui-quadrado com 2 graus de liberdade (linha 2 , coluna do 0.05)

2;gl

Page 14: Teste Qui-quadrado Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas.
Page 15: Teste Qui-quadrado Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas.

Voltando ao exemplo inicial ….

O valor da estatística observado de X2 foi 2.50. Como esse valor não pertence à região de valores críticos do teste qui-quadrado, a distância entre os valores observados e os valores esperados sob H0 foi considerada pequena. Assim, o experimento não mostrou evidências estatísticas suficientes para a rejeição da hipótese de que as permeabilidades das luvas das três marcas sejam iguais, a 5% de significância.

RR : X2 > 5.991

Page 16: Teste Qui-quadrado Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas.

Se rejeitarmos a hipótese da homogeneidade das permeabilidades usando os dados deste experimento ….

Valor P = P[ obter um valor de X2 ainda “mais extremo” do que o valor observado ]

X2obs

Valor PValor P = P[χ2gl> X2

obs]

Qual será o risco de estarmos cometendo o erro tipo I ?

Page 17: Teste Qui-quadrado Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas.

Voltando ao exemplo inicial ….

Na linha 2 da Tabela Qui-quadrado, não existe o valor 2.50.

Valor P = P[χ2gl>

2.50]

2.50

Valor P = P[χ2gl> 2.50] > 0.10

Conclusão: Os dados do experimento não mostraram evidências estatísticas suficientes para a rejeição da hipótese de que as permeabilidades das luvas das três marcas sejam iguais (valor P > 0.10).

Page 18: Teste Qui-quadrado Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas.

Teste Qui-quadrado para homogeneidade de proporções

H0: As proporções de sucesso são homogêneas para todas as populaçõesHa: Ao menos uma população tem proporção de sucesso diferente das demais

22

1

( )cNi i

obsi i

O EXE

Onde :Nc é o número total de caselas da tabela

Oi é o valor observado na casela i, i=1,2,…, Nc

Ei é o valor esperado na casela i.(total de linha) (total de coluna)(total geral)iE

Valor P = P[χ2gl> X2

obs], onde g.l. = (l-1) x (c-1)

Page 19: Teste Qui-quadrado Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas.

Estatística X2 simplificada para o caso da Tabela 2x2

Marca daluva

Deixou passar vírus quando submetida à tensão?

Total

Sim Não

A 151 a 89 b 240 (a+b)B 134 c 106 d 240 (c+d)Total 285 (a+c) 195 (b+d) 480 N

XN ad bc

a b a c b d c d2

2

( )

( )( )( )( )

Page 20: Teste Qui-quadrado Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas.

Resolvendo o exemplo apenas com luvas A e B ….

Marca daluva

Deixou passar vírus quando submetida à tensão?

Total

Sim Não

A 151 a 89 b 240 (a+b)B 134 c 106 d 240 (c+d)Total 285 (a+c) 195 (b+d) 480 N

22 480(151 106 89 134) 2.49

(240)(285)(195)(240)X

Page 21: Teste Qui-quadrado Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas.

Teste Qui-quadrado de independência

Variável A Variável B TotalB1 B2 .... Bm

A1

A2

A3

An

Total N

Um número arbitrário N de indivíduos são classificados segundo duas variáveis qualitativas (variável A e variável B)

Page 22: Teste Qui-quadrado Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas.

Exemplo: associação entre grupo sanguíneo e presença de uma característica de interesse

Tabela de Classificação CruzadaGrupo

SangüíneoCaracterística

TotalPresente AusenteA 32 47 79B 8 19 27

AB 7 14 21O 9 64 73

Total 56 144 200

[Reis e Reis, 2000]

Page 23: Teste Qui-quadrado Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas.

H0: Variável A não está associada à Variável B (A e B são independentes)

HA: Variável A está associada à Variável B (A e B não são independentes)

22

1

( )cNi i

obsi i

O EXE

Onde :Nc é o número total de caselas da tabela

Oi é o valor observado na casela i, i=1,2,…, Nc

Ei é o valor esperado na casela i.(total de linha) (total de coluna)(total geral)iE

Valor P = P[χ2gl> X2

obs], onde g.l. = (l-1) x (c-1)

Page 24: Teste Qui-quadrado Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas.

“Associação entre toxoplasmose e acidente de trânsito em pessoas com sangue Rh negativo”

[Flerg et al, 2009]

Page 25: Teste Qui-quadrado Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas.

H0: acidente automobilístico NÃO está associado à presença de toxoplasmose em pessoas com Rh

negativoHA: acidente automobilístico está associado à

presença de toxoplasmose em pessoas com Rh negativo Toxoplasma Acidente ? Total

Não SimNão 526 14 540Sim 170 11 181Total 696 25 721

22 721(526 11 14 170) 4.92

(181)(696)(25)(540)X

Valor P = P[χ21> 4.92]

Page 26: Teste Qui-quadrado Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas.

(0.025 < Valor P < 0.05)

4.92

Ao nível de 5% de significância, há evidências estatísticas suficientes a favor da hipótese de associação entre acidente automobilístico e presença de toxoplasmose em pessoas com sangue Rh negativo (0.025 < Valor P < 0.05).

Page 27: Teste Qui-quadrado Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas.

“Associação entre toxoplasmose e acidente de trânsito em pessoas com sangue Rh positivo”

“Increased incidence of traffic accidents in Toxoplasma-infected military drivers and protective effect RhD molecule revealed by a large-scale prospective cohort study”

Page 28: Teste Qui-quadrado Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas.

H0: acidente automobilístico NÃO está associado à presença de toxoplasmose em pessoas com Rh

positivoHA: acidente automobilístico está associado à

presença de toxoplasmose em pessoas com Rh positivo Toxoplasma Acidente ? Total

Não SimNão 2391 69 2460Sim 692 17 709Total 3083 86 3169

22 3169(2391 17 69 692) 0.21

(2460)(709)(3083)(86)X

Valor P = P[χ21> 0.21]

Page 29: Teste Qui-quadrado Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas.

(0.10 < Valor P < 0.90)

0.21

Para pessoas com sangue Rh positivo, os dados amostrais não fornecem evidências estatísticas suficientes contra a hipótese de independência entre acidente automobilístico e presença de toxoplasmose (Valor P > 0.10).

Page 30: Teste Qui-quadrado Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas.

Associação entre variáveis qualitativas

Amostras DependentesExemplo inicialEm um estudo sobre tipos sanguíneos de casais, gostaria-se de verificar se existe associação entre o fator Rh do sangue das esposas e dos esposos.Para isto, 100 casais foram classificados quanto ao fator Rh dos esposos e das esposas.

Esposa Esposo TotalRh+ Rh -

Rh+ a r a+rRh- s b s+bTotal a+s r+b 100

Page 31: Teste Qui-quadrado Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas.

Teste Qui-quadrado de McNemar

22 | | 1

( )McNemar

r sX

r s

Esposa Esposo TotalRh+ Rh -

Rh+ a r a+rRh- s b s+bTotal a+s r+b 100

Número de pares discordantes: r e s

Número de pares concordantes: a e b

H0: não há associação entre o fator Rh dos membros do casalHa: não há associação entre o fator Rh dos membros do casal

tem distribuição 21

Page 32: Teste Qui-quadrado Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas.

Esposa Esposo TotalRh+ Rh -

Rh+ 60 0 60Rh- 0 40 40Total 60 40 100

Associação Positiva Perfeita

22 | 0 0 | 1 1

(0 0) 0McNemarX

Valor P = P[ > ∞] = 021

Conclusão: rejeitar a hipótese de independência entre o fator Rh dos casais

Page 33: Teste Qui-quadrado Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas.

Valor P = P[ > 0.0208] > 0.9521

Esposa Esposo TotalRh+ Rh -

Rh+ 36 24 60Rh- 24 16 40Total 60 40 100

Não Associação Perfeita

22 | 24 24 | 1 1 0.0208

(24 24) 48McNemarX

Conclusão: não rejeitar a hipótese de independência entre o fator Rh dos casais

Page 34: Teste Qui-quadrado Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas.

Amostras Dependentes

Sem infarto

Com Infarto TotalDiabético Nao-Diabético

Diabético 9 37 46Não-Diabético 16 82 98Total 25 119 144

Um estudo investiga a associação entre infarto do miocárdio e a presença de diabetes entre os índios navajos americanos (Coulehan et al, 1986)Índios com episódios de infarto do miocárdio foram emparelhados com índios sem a doença (144 pares). Cada elemento do par foi investigado quanto à presença de diabetes.

[Coulehan et al,1986]

2 7.55 (valor-p < 0.01)McNemarX

Page 35: Teste Qui-quadrado Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas.

Exercícios da Seção 12

Para aprender

Page 36: Teste Qui-quadrado Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas.

Referências Bibliográficas Coulehan et al (1986) “Acute Myocardial Infarction Among

Navajo Indians”, 1976-1983, American Journal of Public Health, pp 412-214

Flegr et al. (2009) “Increased incidence of traffic accidents in Toxoplasma-infected military drivers and protective effect RhD molecule revealed by a large-scale prospective cohort study”, BMC Infectious Diseases, vol. 9, n. 72.

Reis, E. A.; Reis, I.A. (2000) “Exercícios Resolvidos em Introdução à Bioestatística”, Relatório Técnico do Departamento de Estatística da UFMG. Disponível em: http://www.est.ufmg.br