Teste Qui-quadrado Comparando proporções Verificando a hipótese de associação entre variáveis...
-
Upload
raquel-bernardes-bergler -
Category
Documents
-
view
292 -
download
1
Transcript of Teste Qui-quadrado Comparando proporções Verificando a hipótese de associação entre variáveis...
Teste Qui-quadrado
Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas
Exemplo Inicial: Igualdade de ProporçõesA administração de um hospital deseja verificar se luvas de três marcas (A, B e C) são homogêneas quanto à permeabilidade a vírus. Para isto, realizou um experimento, no qual 240 luvas da marca A, 240 luvas da marca B e 300 luvas da marca C foram submetidas à tensão. Durante os testes, 151 luvas da marca A (62.9%), 134 luvas da marca B (55.8%) e 177 luvas da marca C (40.0%) deixaram passar vírus quando submetidas à tensão. Os dados do experimento apresentam evidências estatísticas suficientes contra a hipótese de que as três marcas possuem a mesma permeabilidade?
H0: PA = PB = PC = PHa: ao menos uma das permeabilidades é diferente das outras
Teste de Igualdade de Proporções (mais de uma população)
Tabela de valores observadosMarca da
luvaDeixou passar vírus quando
submetida à tensão?Total
Sim Não
A 151 89 240B 134 106 240C 177 123 300Total 462 318 780
Tabela de Classificação Cruzada
Construção do Teste
Marca daluva
Deixou passar vírus quando submetida à tensão?
Total
Sim Não
A 151 89 240B 134 106 240C 177 123 300Total 462 318 780
H0: PA = PB = PC = PHa: ao menos uma das permeabilidades é diferente das outras
462ˆ780
P Estimativa de P, a permeabilidade comum
Construção do Teste
Marca daluva
Deixou passar vírus quando submetida à tensão? Total Sim Não
A 151 ....................................
89............................. 240
B 134..................................... 106............................... 240C 177..................................... 123............................... 300Total 462 318 780
Se H0 (PA = PB = PC = P) é verdadeira:
quantas luvas que deixam passar o vírus deveríamos esperar dentre as luvas da marca A ? E dentre as luvas da marca B ? E da marca C ?
462ˆ780
P
(240x462/780=142.15)(240x462/780=142.15)
(300x462/780=177.70)
(240-142.15=97.85)(240-142.15=97.85)
(300-177.70=122.30)
Valores esperados sob H0
Construção do TesteNote que os valores esperados sob H0 são calculados como uma função simples dos totais de linha, coluna e do total geral
(240x462/780=142.15)(240x462/780=142.15)
(300x462/780=177.70)
(240x318/780=97.85)(240x318/780=97.85)
(300x318/780=122.30)
(total de linha) (total de coluna)Valor Esperado da casela(total geral)
Marca daluva
Deixou passar vírus quando submetida à tensão? Total Sim Não
A 151 ....................................
89............................. 240
B 134..................................... 106............................... 240C 177..................................... 123............................... 300Total 462 318 780
Construção do Teste
Marca daluva
Deixou passar vírus quando submetida à tensão?
Total
Sim Não
A 151 (142.15) 89 (97.85) 240B 134 (142.15) 106 (97.85) 240C 177 (177.70) 123 (122.30) 300Total 462 318 780
Tabela de Valores Observados (esperados sob H0 entre parênteses)
Estatística de Teste = “Observado – Esperado sob H0”
Construção do TesteTabela de Valores Observados (esperados sob H0 entre
parênteses)
Estatística de Teste = (151-142.15) (89-97.85) (134-142.15) (106-97.85) (177-177.70) (123-122.30)
2 2
22
2 2
Marca daluva
Deixou passar vírus quando submetida à tensão?
Total
Sim Não
A 151 (142.15) 89 (97.85) 240B 134 (142.15) 106 (97.85) 240C 177 (177.70) 123 (122.30) 300Total 462 318 780
Construção do TesteTabela de Valores Observados (esperados sob H0 entre
parênteses)
2 2 2
2 2 2
(151-142.15) (89-97.85) (134-142.15)Estatística de Teste = 142.15 97.85 142.15
(106-97.85) (177-177.70) (123-122.30) 97.85 177.70 122.30
+ +
+
+
+2X 2.50
Marca daluva
Deixou passar vírus quando submetida à tensão?
Total
Sim Não
A 151 (142.15) 89 (97.85) 240B 134 (142.15) 106 (97.85) 240C 177 (177.70) 123 (122.30) 300Total 462 318 780
Valores críticos para X2
O valor de X2 é “grande” ou “pequeno” ?
5 g.l.
10 g.l.
0
Valores de Referência para X2 Distribuição de Probabilidade de X2
Distribuição Qui-quadrado
2gl
Graus de Liberdade para o Teste Qui-QuadradoNo caso do teste Qui-quadrado, os graus de liberdade da distribuição de referência equivalem ao
número de caselas livres na tabela
Exemplo: Tabela 2 x 2 Marca da
luvaDeixou passar vírus quando
submetida à tensão?Total
Sim Não
A 151 89 240B 134 106 240Total 285 195 480
G.L. = (número de linhas -1) x (número de colunas -1)
Voltando ao exemplo inicial ….
Tabela 3 x 2 G.l. = (3-1) x (2-1) = 2 x 1 = 2
O valor da estatística X2 deve ser comparado aos valores de distribuição Qui-quadrado com 2 graus de liberdade.
Se α = 0.05,
RR : X2 > χ20.05 ; 2
Percentil que deixa uma área de α=0.05 acima dele na distribuição Qui-quadrado com 2 graus de liberdade (linha 2 , coluna do 0.05)
2;gl
Voltando ao exemplo inicial ….
O valor da estatística observado de X2 foi 2.50. Como esse valor não pertence à região de valores críticos do teste qui-quadrado, a distância entre os valores observados e os valores esperados sob H0 foi considerada pequena. Assim, o experimento não mostrou evidências estatísticas suficientes para a rejeição da hipótese de que as permeabilidades das luvas das três marcas sejam iguais, a 5% de significância.
RR : X2 > 5.991
Se rejeitarmos a hipótese da homogeneidade das permeabilidades usando os dados deste experimento ….
Valor P = P[ obter um valor de X2 ainda “mais extremo” do que o valor observado ]
X2obs
Valor PValor P = P[χ2gl> X2
obs]
Qual será o risco de estarmos cometendo o erro tipo I ?
Voltando ao exemplo inicial ….
Na linha 2 da Tabela Qui-quadrado, não existe o valor 2.50.
Valor P = P[χ2gl>
2.50]
2.50
Valor P = P[χ2gl> 2.50] > 0.10
Conclusão: Os dados do experimento não mostraram evidências estatísticas suficientes para a rejeição da hipótese de que as permeabilidades das luvas das três marcas sejam iguais (valor P > 0.10).
Teste Qui-quadrado para homogeneidade de proporções
H0: As proporções de sucesso são homogêneas para todas as populaçõesHa: Ao menos uma população tem proporção de sucesso diferente das demais
22
1
( )cNi i
obsi i
O EXE
Onde :Nc é o número total de caselas da tabela
Oi é o valor observado na casela i, i=1,2,…, Nc
Ei é o valor esperado na casela i.(total de linha) (total de coluna)(total geral)iE
Valor P = P[χ2gl> X2
obs], onde g.l. = (l-1) x (c-1)
Estatística X2 simplificada para o caso da Tabela 2x2
Marca daluva
Deixou passar vírus quando submetida à tensão?
Total
Sim Não
A 151 a 89 b 240 (a+b)B 134 c 106 d 240 (c+d)Total 285 (a+c) 195 (b+d) 480 N
XN ad bc
a b a c b d c d2
2
( )
( )( )( )( )
Resolvendo o exemplo apenas com luvas A e B ….
Marca daluva
Deixou passar vírus quando submetida à tensão?
Total
Sim Não
A 151 a 89 b 240 (a+b)B 134 c 106 d 240 (c+d)Total 285 (a+c) 195 (b+d) 480 N
22 480(151 106 89 134) 2.49
(240)(285)(195)(240)X
Teste Qui-quadrado de independência
Variável A Variável B TotalB1 B2 .... Bm
A1
A2
A3
An
Total N
Um número arbitrário N de indivíduos são classificados segundo duas variáveis qualitativas (variável A e variável B)
Exemplo: associação entre grupo sanguíneo e presença de uma característica de interesse
Tabela de Classificação CruzadaGrupo
SangüíneoCaracterística
TotalPresente AusenteA 32 47 79B 8 19 27
AB 7 14 21O 9 64 73
Total 56 144 200
[Reis e Reis, 2000]
H0: Variável A não está associada à Variável B (A e B são independentes)
HA: Variável A está associada à Variável B (A e B não são independentes)
22
1
( )cNi i
obsi i
O EXE
Onde :Nc é o número total de caselas da tabela
Oi é o valor observado na casela i, i=1,2,…, Nc
Ei é o valor esperado na casela i.(total de linha) (total de coluna)(total geral)iE
Valor P = P[χ2gl> X2
obs], onde g.l. = (l-1) x (c-1)
“Associação entre toxoplasmose e acidente de trânsito em pessoas com sangue Rh negativo”
[Flerg et al, 2009]
H0: acidente automobilístico NÃO está associado à presença de toxoplasmose em pessoas com Rh
negativoHA: acidente automobilístico está associado à
presença de toxoplasmose em pessoas com Rh negativo Toxoplasma Acidente ? Total
Não SimNão 526 14 540Sim 170 11 181Total 696 25 721
22 721(526 11 14 170) 4.92
(181)(696)(25)(540)X
Valor P = P[χ21> 4.92]
(0.025 < Valor P < 0.05)
4.92
Ao nível de 5% de significância, há evidências estatísticas suficientes a favor da hipótese de associação entre acidente automobilístico e presença de toxoplasmose em pessoas com sangue Rh negativo (0.025 < Valor P < 0.05).
“Associação entre toxoplasmose e acidente de trânsito em pessoas com sangue Rh positivo”
“Increased incidence of traffic accidents in Toxoplasma-infected military drivers and protective effect RhD molecule revealed by a large-scale prospective cohort study”
H0: acidente automobilístico NÃO está associado à presença de toxoplasmose em pessoas com Rh
positivoHA: acidente automobilístico está associado à
presença de toxoplasmose em pessoas com Rh positivo Toxoplasma Acidente ? Total
Não SimNão 2391 69 2460Sim 692 17 709Total 3083 86 3169
22 3169(2391 17 69 692) 0.21
(2460)(709)(3083)(86)X
Valor P = P[χ21> 0.21]
(0.10 < Valor P < 0.90)
0.21
Para pessoas com sangue Rh positivo, os dados amostrais não fornecem evidências estatísticas suficientes contra a hipótese de independência entre acidente automobilístico e presença de toxoplasmose (Valor P > 0.10).
Associação entre variáveis qualitativas
Amostras DependentesExemplo inicialEm um estudo sobre tipos sanguíneos de casais, gostaria-se de verificar se existe associação entre o fator Rh do sangue das esposas e dos esposos.Para isto, 100 casais foram classificados quanto ao fator Rh dos esposos e das esposas.
Esposa Esposo TotalRh+ Rh -
Rh+ a r a+rRh- s b s+bTotal a+s r+b 100
Teste Qui-quadrado de McNemar
22 | | 1
( )McNemar
r sX
r s
Esposa Esposo TotalRh+ Rh -
Rh+ a r a+rRh- s b s+bTotal a+s r+b 100
Número de pares discordantes: r e s
Número de pares concordantes: a e b
H0: não há associação entre o fator Rh dos membros do casalHa: não há associação entre o fator Rh dos membros do casal
tem distribuição 21
Esposa Esposo TotalRh+ Rh -
Rh+ 60 0 60Rh- 0 40 40Total 60 40 100
Associação Positiva Perfeita
22 | 0 0 | 1 1
(0 0) 0McNemarX
Valor P = P[ > ∞] = 021
Conclusão: rejeitar a hipótese de independência entre o fator Rh dos casais
Valor P = P[ > 0.0208] > 0.9521
Esposa Esposo TotalRh+ Rh -
Rh+ 36 24 60Rh- 24 16 40Total 60 40 100
Não Associação Perfeita
22 | 24 24 | 1 1 0.0208
(24 24) 48McNemarX
Conclusão: não rejeitar a hipótese de independência entre o fator Rh dos casais
Amostras Dependentes
Sem infarto
Com Infarto TotalDiabético Nao-Diabético
Diabético 9 37 46Não-Diabético 16 82 98Total 25 119 144
Um estudo investiga a associação entre infarto do miocárdio e a presença de diabetes entre os índios navajos americanos (Coulehan et al, 1986)Índios com episódios de infarto do miocárdio foram emparelhados com índios sem a doença (144 pares). Cada elemento do par foi investigado quanto à presença de diabetes.
[Coulehan et al,1986]
2 7.55 (valor-p < 0.01)McNemarX
Exercícios da Seção 12
Para aprender
Referências Bibliográficas Coulehan et al (1986) “Acute Myocardial Infarction Among
Navajo Indians”, 1976-1983, American Journal of Public Health, pp 412-214
Flegr et al. (2009) “Increased incidence of traffic accidents in Toxoplasma-infected military drivers and protective effect RhD molecule revealed by a large-scale prospective cohort study”, BMC Infectious Diseases, vol. 9, n. 72.
Reis, E. A.; Reis, I.A. (2000) “Exercícios Resolvidos em Introdução à Bioestatística”, Relatório Técnico do Departamento de Estatística da UFMG. Disponível em: http://www.est.ufmg.br