INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

46
INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011

Transcript of INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Page 1: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS

CATEGÓRICAS

Biotecnologia – UFPel

2011

Page 2: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Amostra

Quero conhecer um atributo de uma

população (alvo)

Escolho um grupo para estudar (população

em estudo)

Deste grupo, tiro uma amostraamostra

Porque todo este trabalho???

Page 3: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Amostra

Representar a população

equiprobabilidade

Precisão

influi no cálculo do tamanho da amostra

VARIABILIDADE

cada amostra dá um resultado!

Page 4: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Distribuição das médias amostrais

Se cada amostra dá 1 resultado diferente…

Repetir o processo de amostragem e estudar a distribuição dos

resultados!

Como será que esta distribuição se compara com a

distribuição dos dados originais????

Teorema do Limite Central

distribuição das médias amostrais tende à distribuição normal

quando o N tende ao infinito, independente da distribuição original

dos dados

Page 5: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Distribuição das médias amostrais

A média é a mesma

A variância é menor

depende do tamanho da amostra!

nep

Page 6: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Intervalo de confiança

Intervalo que contém o parâmetro de interesse

() com alto grau de certeza

Intervalo de confiança de 95%:

IC95%: média – 1,96 x e.p., média + 1,96 x e.p.

baseado na distribuição normal

%95)( ICP

Page 7: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Intervalo de confiança de 95%

3100 3200 3300

95% das amostras

Page 8: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Exemplos

PNASC

Total Sum Mean Variance Std Dev Std Err 449 1420145 3162.906 245887.125 495.870 23.402

Minimum 25%ile Median 75%ile Maximum Mode 900.000 2900.000 3210.000 3475.000 4640.000 3280.000

Student's "t", testing whether mean differs from zero.T statistic = 135.158, df = 448 p-value = 0.00000

Calcular:IC 95% = 3162,9 – 1.96 x 23,4 -- 3162,9 + 1.96 x 23,4IC 95% = 3117.036 -- 3208.764

Page 9: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Exemplos (Stata)

. ci pnasc compr aigdubo banho gesta nprenat

Variable | Obs Mean Std. Err. [95% Conf. Interval]-------------+--------------------------------------------------------------- pnasc | 449 3162.906 23.40156 3116.916 3208.897

compr | 445 48.46944 .1187009 48.23615 48.70272

aigdubo | 447 38.2081 .0722459 38.06611 38.35008

banho | 450 1.155556 .0301043 1.096393 1.214718

gesta | 450 2.324444 .0732 2.180587 2.468301

nprenat | 414 8.623188 .16236 8.304033 8.942343-------------+---------------------------------------------------------------

Page 10: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Tabela 2 x 2

Associação entre 2 variáveis categóricas

Comparar a ocorrência de uma variável binária

(desfecho) entre as categorias de outra variável

binária (exposição)

Na tabela vai haver apenas 2 linhas e 2 colunas com

dados

As linhas e colunas correspondem às categorias de cada

variável

Page 11: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Tabela 2 x 2

Por convenção as linhas correspondem a

exposição e as colunas ao desfecho (Kirkwood)

Mas nem todos os autores fazem desta forma...

O importante é que os % demonstrados sejam

da variável de exposição

Page 12: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Tabela 2×2 padrão

exposição + – + a b n1 – c d n2 do

ença

m1 m2 N

exposição + – + a b n1 – c d n2 do

ença

m1 m2 N

Page 13: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Exemplo de Tabela 2×2

Desfecho = chiado no peito (s/n) linha

Exposição = mama no peito aos 12 meses (s/n) coluna

Page 14: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Teste do qui-quadrado

Permite examinar se existe associação entre a

variável da linha e a da coluna

Em outras palavras....verifica se a distribuição dos

indivíduos entre as categorias de uma variável é

independente da sua distribuição entre as categorias

da outra variável

Page 15: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Exemplo: qui-quadrado em tabela 2x2

INFLUENZA TOTAL

SIM NÃO

VACINA 20 (8,3%) 220 (91,7%) 240

PLACEBO 80 (36,4%) 140 (63,6%) 220

TOTAL 100 (21,7%) 360 (78,3%) 460

Estudo realizado durante uma epidemia de influenza

Page 16: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Perguntas:

Quantos indivíduos contraíram influenza?

Quantos indivíduos foram vacinados?

INFLUENZA TOTAL

SIM NÃO

VACINA 20 (8,3%) 220 (91,7%) 240

PLACEBO 80 (36,4%) 140 (63,6%) 220

TOTAL 100 (21,7%) 360 (78,3%) 460

R: 100

R: 240

Page 17: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Perguntas:

Que percentagem de indivíduos contraíram influenza dentre os

vacinados?

Que percentagem de indivíduos contraíram influenza dentre os

que receberam placebo?

INFLUENZA TOTAL

SIM NÃO

VACINA 20 (8,3%) 220 (91,7%) 240

PLACEBO 80 (36,4%) 140 (63,6%) 220

TOTAL 100 (21,7%) 360 (78,3%) 460

R: 20/240 * 100 = 8,3%

R: 280/220 * 100= 36,4%

Page 18: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Perguntas:

O fato de vacinar, afeta a probabilidade

dos indivíduos de contrair influenza?

Aparentemente sim, mas é preciso testar

estatisticamente para ver a probabilidade de

as diferenças encontradas terem ocorrido ao

acaso

Page 19: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Testar uma associação

Teste de qui-quadrado (2)

compara os valores observados em cada

uma das 4 categorias da tabela 2 x 2 com

os valores esperados se não existisse

nenhuma diferença entre receber vacina ou

placebo

Page 20: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Teste do qui-quadrado

O valor esperado para a é:

Nnm

aNm

na 111

1

influenza + – + a b n1 – c d n2 va

cina

m1 m2 N

Page 21: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Teste de qui-quadrado

Globalmente 100/460 (0,22) contraíram

influenza

Se a vacina e placebo são igualmente efetivos,

esperaríamos essa mesma proporção entre

vacinados = 0,21739... * 240=52,2

placebo = 0,21739...... * 220=47,8

Page 22: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Teste qui-quadrado

INFLUENZA TOTAL

SIM NÃO

VACINA 52,2 187,8 240

PLACEBO 47,8 172,2 220

TOTAL 100 360 460

Valores esperados

Page 23: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Obtenção do valor do qui-quadrado

(observados – esperados )² / esperados

...Isso para cada uma das 4 caselas da tabela de contingência

Quanto maior a diferença entre valores observados e esperados, maior o valor de 2

gl

E

EO1

22

2 ~

Page 24: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Aplicando o teste do ²

Para o teste ser válido: Valor esperado (E) 5 em todas as caselas

Fórmula para cálculo na mão:

2121

22 )(

mmnn

Nbcad

influenza + – + a b n1 – c d n2 va

cina

m1 m2 N

Page 25: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Aplicando o teste do ²

Fórmula para cálculo na mão:

0,001 p devalor

1 d.f. ; 53,01220 * 240* 360 * 100

460)220* 80140* 20( 22

exposição + – + 20 220 240 – 80 140 220

doen

ça

100 360 460

Page 26: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Aplicando o teste do ²

Valor encontrado do ² = 53,09

Procurar a correspondência com valor-p na

tabela de distribuição ²

Para isso é necessário conhecer o nº de graus

de liberdade (Linhas – 1)x (Colunas – 1)

Tabela 2x2: (2-1)x(2-1) = 1 grau de liberdade

Page 27: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Observando a tabela do ²

O valor calculado (53,09) é maior que o maior

valor da primeira linha da tabela correspondente

a 1G.L. (10,83)

10,83 é o ponto de probabilidade = 0,1% na

distribuição ² com 1 G.L., logo, o valor-p para o

teste é < 0,001

Page 28: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Conclusão do teste do ²

Em nosso exemplo valor-p < 0,001

Existe uma probabilidade muito pequena de que a diferença

entre os % de influenza encontrados no grupo de vacinados e

no grupo de placebo possa ter sido obtida ao acaso (< 0,1%)

Page 29: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Correção de continuidade

Teste ² pode ser melhorado usando a correção

de continuidade de Yates:

Esta quantidade tem distribuição ² com 1 grau

de liberdade

Neste caso o valor de 53,09 ficaria em 51,46

gl

E

EO1

2

2

2 ~5,0

Page 30: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Correção de continuidade

Correção de continuidade de Yates é útil se o tamanho

amostral é <40 ou os números esperados são

pequenos

Se os números esperados são muito pequenos ou se o

total geral da tabela <20 Teste exato

O ² é válido quando

N total > 40, independente dos valores esperados

N total entre 20 e 40, sendo todos os valores esperados > 4

Page 31: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Teste exato de Fisher

Se a aproximação pela ² não é boa

Teste exato

Usado quando os valores esperados são muito

pequenos

N total da tabela < 20, ou

N total entre 20 e 40 e o menor dos 4 valores

esperados é <5

Page 32: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Testes na prática

Hoje o cálculo do teste exato é muito rápido,

exceto para tabelas r x c onde r ou c >2

Conclusão:

Aplicar sempre o teste exato na análise de tabelas

2 x 2

Page 33: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Teste do ² ou exato de Fisher?

Mortos Vivem Total

ATB novo 0 10 10

ATB habitual 4 8 12

Total 4 18 22

Pearson chi2(1) = 4,02 P = 0,0435

Fisher's exact P = 0,0964

Page 34: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Teste do ² ou exato de Fisher?

Mortos Vivem Total

ATB novo 650 350 1000

ATB habitual 600 400 1000

Total 1250 750 2000

Pearson chi2(1) = 5,3 P = 0,021

Fisher's exact P = 0,024

Page 35: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

SSeexxoo BBPPNN nnoorrmmaaiiss TToottaall

MMeenniinnooss 5500 445500 550000

MMeenniinnaass 4400 446600 550000

TToottaall 9900 991100 11000000

p1 = 50/500=0,10=10% p2 = 40/500 = 0,08=8%

Será que a proporção de BPN é a mesma nos dois sexos?

Outro exemplo: BPN

Page 36: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Hipóteses

Ho: a proporção de BPN é a mesma nos dois sexos (hipótese de independência ou não associação)

H1: a proporção de BPN não é a mesma nos dois sexos (hipótese de dependência ou associação)

Outro exemplo: BPN

Page 37: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Sexo BPN normais Total

Meninos 50 (45) 450 (455) 500

Meninas 40 (45) 460 (455) 500

Total 90 910 1000

Outro exemplo: BPN

Comparar as freqüências observadas com as freqüências esperadas (E) sob a hipótese de nulidade Ho

Page 38: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Outro exemplo: BPN

Será que as diferenças são suficientemente grandes para que se possa rejeitar a hipótese Ho? Calcular ² a partir da amostra:

² = 0,989 valor-p = 32% (> 5%)

Não rejeitar H0 não existe

associação entre sexo e BPN

Page 39: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Exemplo: tabela de resultados

Tabela – Prevalência de baixo peso ao nascer (BPN) conforme sexo, Pelotas 2004.

Característica N BPN (%)

Total N

Valor-p1

Sexo 0,3

masculino 50 10 500

feminino 40 8 500

1 teste exato de Fisher

Page 40: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Tabelas 2×k

Consideramos um desfecho dicotômico

Se as k categorias não são ordenadas testa-se associação usando ² geral

i j ij

ijijglk E

EO 2

2)1(

Page 41: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Exemplo

Tabela – Uso de preservativo entre escolares, de acordo com religião

Exposição Não usa O (E)

Usa O (E)

Total

Religião

Nenhuma 44 (52) 345 (337) 389 Católica 145 (149) 969 (965) 1114 Espírita 21 (25) 164 (160) 185

Protestante 44 (30) 182 (196) 226

Afro-brasileira 4 (6) 44 (42) 48

Evangélica 7 (3) 13 (17) 20

Outras 2 (2) 10 (10) 12 Total 267 1727 1994

Pearson ²(6) = 18,7; p = 0,005

Page 42: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Exemplo

Tabela – Uso de preservativo entre escolares, de acordo com religião

Exposição Não usa N (%)

Total Valor-p1

Religião 0,005

Nenhuma 44 (11) 389

Católica 145 (13) 1114

Espírita 21 (11) 185

Protestante 44 (19) 226

Afro-brasileira 4 (8) 48

Evangélica 7 (35) 20

Outras 2 (17) 12

Total 267 1994 1 teste de Pearson

Page 43: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Tabelas 2×k: categorias ordenadas

Além de avaliar associação

Avaliar se há uma tendência prevalências aumentam ou diminuem

² com k-1 gl é dividido parte devido à tendência (1 gl)

resto

Método de análise “muito mais poderoso”

Page 44: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Exemplo

Tabela – Distribuição do no. de filhos nas famílias, de acordo com classe social

Exposição N filhos<5

N (%) N filhos5

N (%) Total

Classe social

Alta 88 (92) 8 (8) 96 Média alta 113 (91) 11 (9) 124 Média baixa 87 (84) 16 (16) 103

Baixa 85 (83) 18 (17) 103 Total 373 53 426

Pearson Pearson ²(3) = 6,24; p = 0,10²(3) = 6,24; p = 0,10Tendência linear z = 2,36; p = 0,02Tendência linear z = 2,36; p = 0,02

Page 45: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Idade x uso de medicamentos

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

20 a 29

30 a 39

40 a 49

50 a 59

60 a 69

70 ou +

Homens

Mulheres

P < 0,001 para ambos os sexos (teste para tendência linear)

Page 46: INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011.

Dúvidas?