Comparando duas populações: amostras independentes Inferência Estatística Básica.
-
Upload
ines-alves-marinho -
Category
Documents
-
view
232 -
download
0
Transcript of Comparando duas populações: amostras independentes Inferência Estatística Básica.
Comparando duas populações: amostras independentes
Inferência Estatística Básica
Consumo de chocolate amargo e redução na pressão arterial*
*Taubert, D. et al. (2007) Effects of Low Habitual Cocoa Intake on Blood Pressure and Bioactive Nitric Oxide: A Randomized Controlled Trial, JAMA, July 4, 2007—Vol 298, No. 1
44 adultos com hipertensão arterial leve
Antes
Depois
18 semanas
Antes
Depois
18 semanas
Amostras Pareadas
Amostras Pareadas
Amostras independentes
Chocolate amargo
Chocolate branco
Amostras independentes devem ser comparáveis….
No exemplo, isso significa que os grupos “chocolate amargo” e “chocolate branco” devem ser parecidos quanto a:
idadepesosexonível de colesterolpressão sanguínea inicialcircunferência de quadriletc…
variáveis que afetam a resposta:
pressão sanguínea depois do experimento
Tabela 2 do artigo (Taubert et al, 2007)
μV ≠ μA
σV=σA=σ
Médias Populacionais (desconhecidas): μ1 e μ2 , μd = μ1 - μ2Hipótese nula: H0: μ1 = μ2 H0: μd
= 0
Suposição:
as amostras dos Grupos 1 e 2 vêm de populações com distribuição Normal com desvios-padrão iguais.
n1: tamanho da amostra no Grupo 1n2: tamanho da amostra no Grupo 2
Comparação de duas médias Amostras Independentes
Amostras Grupo 1 Grupo 2Tamanho n1 n2
MédiaDesvio-Padrão
s1 s2
s1 e s2 são estimativas do desvio-padrão comum σ
x y
Hipótese nula: H0: μd = 0Hipótese alternativa: HA: μd ≠ 0
Comparação de duas médias Amostras Independentes
0
α/2α/2
( ; / 2)glt ( ; / 2)glt
Estatística de Teste:
Valor P = 2P(Tgl >|Tobs |)
2 2
1 2
0obs
comb comb
x yT
s sn n
( ; / 2)obs glT t ouRR: ( ; / 2)obs glT t gl = n1 + n2 - 2
Supondo que as amostras dos Grupos 1 e 2 tenham vindo de populações com distribuição Normal e desvios-padrão iguais:
sn s n s
n ncomb2 1 1
22 2
2
1 2
1 12
( ) ( )
Comparação de duas médias Amostras Independentes
Tabela 2 do artigo (Taubert et al, 2007)
Valor P = P[T42 <-0.23] + P[T42 > 0.23] = 2 x P[T42 < -0.23]
2 22
2 2
(22 1)14 (22 1)1522 22 2
14 15 = 4212
combs
189 190 -0.231 142122 22
obsT
H0: μCA – μCB = 0HA: μCA – μCB ≠ 0
Valor P = 2 x P[Z <-0.23]= c 0.4090 = 0.8180“Não foram encontradas evidências estatisticamente significantes contra a hipótese de que as taxas médias de colesterol total são iguais nos dois grupos de estudo (valor p = 0.8180)”
Exemplo 2: efeito da presença de pragas na área foliar das plantas de ciclame
Uma equipe de pesquisa gostaria de verificar o efeito da presença de pragas no tamanho da área foliar de plantas de ciclame. A suspeita é que a presença de pragas diminuiria a área foliar das plantasUma amostra de 14 plantas com pragas e outra amostra de 12 plantas sem pragas foi avaliada quanto à área foliar.A área foliar média das plantas com pragas foi de 7.5 cm2, com desvio-padrão de 1.76 cm2. Nas plantas sem pragas, a área foliar média foi de 8.9 cm2, com desvio-padrão de 1.68 cm2.Ao nível de 5% de significância, os dados desse estudo mostram evidências estatísticas a favor da hipótese dos pesquisadores?
1/4
Exemplo 2: efeito da presença de pragas na área foliar das plantas de ciclame
2/4
H0: μSP – μCP = 0HA: μSP – μCP > 0
μSP é a área foliar média das plantas sem pragas, em cm2
μCP é a área foliar média das plantas com pragas, em cm2
8.90 7.50 2.071 12.97
12 14
obsT
8.9; 1.68; 127.5; 1.76; 14
SP SP SP
CP CP CP
x s nx s n
Dados amostrais:
2 22 (12 1)(1.76) (14 1)(1.68)
12 14 231.05 40.27 = 2.97
24
combs
Estatística de teste
Exemplo 2: efeito da presença de pragas na área foliar das plantas de ciclame
3/4
Valor P = P[T24 > 2.07] = ?
Valor P = P[T24 > 2.07] ≈ 0.025
2.07
Exemplo 2: efeito da presença de pragas na área foliar das plantas de ciclame
4/4
Conclusão em termos do problema:
Ao nível de 5% de significância, os dados desse estudo mostram evidências estatísticas a favor da hipótese que da área foliar média de plantas sem pragas é maior do que a área foliar média de plantas com pragas (valor p ≈ 0.025 ).
IC x y t s n nn n comb
1 2 1 2
100 12 2
2
1 2
1 1
( )%( ; / )( )
Intervalos de Confiança para diferença entre duas médias
Amostras Independentes
sn s n s
n ncomb2 1 1
22 2
2
1 2
1 12
( ) ( )
Exemplo 2: efeito da presença de pragas na área foliar das plantas de ciclame
2/4
100(1 )% 2( 2; / 2)
1 1( )SP CP SP CPSP CP n n comb
SP CP
IC x x t sn n
100(1 )%(24; / 2)
1 1(8.90 7.50) 2.9712 14SP CP
IC t
(24;0.05) 1.71t Se 100(1-α)%=90%, então α=0.05 e
90% 1.40 (1.71 0.68)SP CP
IC
90% 1.40 1.16 [0.24 ; 2.56]SP CP
IC
Usando Intervalos de Confiança para fazer Testes de Hipóteses
Em estudo sobre os efeitos da suplementação de vitamina A, um grupo de crianças de 4 a 24 meses de idade, com sarampo e complicações (pneumonia e diarréia grave) foi dividido em dois grupos: um grupo recebeu vitamina A nas doses recomendadas pela OMS e outro grupo recebeu um placebo.
Durante o acompanhamento, foram medidas as seguintes variáveis: PC – duração da pneumonia clínica (dias), DI – duração da diarréia (dias) e GP – ganho de peso após 6 semanas (g).
H0: μA - μP = 0
HA: μA - μP ≠ 0
Média e desvio-padrão (entre parênteses) para três características
dos grupos de Placebo e Vitamina A
Placebo Vitamina AIntervalo de 99% de
Confiança para (μA – μP) PC (dias) 4.50 (0.79) 4,10 (0.40) -0.82 a 0.02
DI (dias) 3.60 (0.35) 3.30 (0.71) -0.67 a 0.07
GP (g) 900 (140) 1150 (310) 70 a 430
(não rejeitar H0 a 1% de sig.)
(não rejeitar H0 a 1% de sig.)
(rejeitar H0 a 1% de sig.)
Usando Intervalos de Confiança para fazer Testes de Hipóteses
Comparação de duas proporções Amostras Independentes
Deseja-se comparar as proporções de dois grupos:
p1: valor populacional da proporção no Grupo 1
p2: valor populacional da proporção no Grupo 2
Amostras Grandes (n1 ≥ 30 e n2 ≥ 30)
Amostras Grupo 1 Grupo 2Tamanho n1 n2
N° de sucessos
m1 m2
Proporção de sucessos p
mn1
1
1 p
mn2
2
2
1 2
1 1 2 2
1 2
ˆ ˆˆ ˆ ˆ ˆ(1 ) (1 )
p pZp p p p
n n
Comparação de duas proporções Amostras Independentes
Hipótese nula: H0: p1 = p2
Estatística de teste:
Se H0 for verdadeira, Z ~ Normal(0 ; 1)
Exemplo 3: comparação de duas marcas de luvas quanto à permeabilidade a vírusA administração de um hospital deseja verificar se luvas de duas marcas (A e B) são homogêneas quanto à permeabilidade a vírus. Para isto, realizou um experimento, no qual 240 luvas da marca A e 240 luvas da marca B foram submetidas à tensão. Durante os testes, 151 luvas da marca A (62.9%), 134 luvas da marca B (55.8%) deixaram passar vírus quando submetidas à tensão. Ao nível de 5% de significância, os dados do experimento apresentam evidências estatísticas suficientes contra a hipótese de que as duas marcas possuem a mesma permeabilidade?
1/4
Exemplo 3: comparação de duas marcas de luvas quanto à permeabilidade a vírus
2/4
H0: pB – pA = 0HA: pB – pA ≠ 0
pA é a proporção luvas da marca A que deixa passar vírus quando tensionada.
Dados amostrais:
Estatística de teste
pB é a proporção luvas da marca B que deixa passar vírus quando tensionada.151ˆ 0.629
240Ap 134ˆ 0.558240Bp
0.558 0.6290.558(1 0.558) 0.629(1 0.629)
240 240
obsZ
-0.071 -1.580.045obsZ
Exemplo 3: comparação de duas marcas de luvas quanto à permeabilidade a vírus
3/4
-1.58obsZ
Valor P = P[Z < -1.58] + P[Z > 1.58] = 2 x P[Z < -1.58] = 2 x 0.0571 = 0.1141
0.0571 0.0571
-1.58 1.58
Exemplo 3: comparação de duas marcas de luvas quanto à permeabilidade a vírus
4/4
Conclusão em termos do problema:
Ao nível de 5% de significância, os dados desse estudo não mostram evidências estatísticas suficientes contra a hipótese de que as duas marcas possuem a mesma permeabilidade (valor p = 0.1141).
Intervalos de Confiança para diferença entre duas proporções
Amostras independentes e grandes (n1 30 e n2 30)
1 1 2 21 21 2
1 2/ 2
100(1 )% ˆ ˆ ˆ ˆ(1 ) (1 )ˆ ˆ( )p pp p p pIC p p z
n n
Exemplo 4: efeito do uso do cinto de segurança sobre a proporção de feridos graves em acidentes automobilísticos
Um estudo com crianças hospitalizadas em conseqüência de acidentes com veículos teve o objetivo de estimar o efeito do uso do cinto de
segurança na proporção de ferimentos graves. Entre 290 crianças que não estavam usando o
cinto de segurança, 50 sofreram ferimentos graves. Entre 123 crianças que estavam usando cintos, 16
sofreram ferimentos graves. Com 95% de confiança, qual é a estimativa do efeito
do uso do cinto de segurança na proporção de ferimentos graves?
1/3
Exemplo 4: efeito do uso do cinto de segurança sobre a proporção de feridos graves em acidentes automobilísticos
2/3
pSIM é a proporção de crianças que sofreram ferimentos graves dentre as que estavam usando cinto de segurança.pNAO é a proporção de crianças que sofreram ferimentos graves dentre as que não estavam usando cinto de segurança.Efeito do uso do cinto = (pSIM – pNAO)
0.02595% ˆ ˆ ˆ ˆ(1 ) (1 )ˆ ˆ( )
123 290SIM SIM NAO NAO
SIM NAOSIM NAOp pp p p p
IC p p z
Exemplo 4: efeito do uso do cinto de segurança sobre a proporção de feridos graves em acidentes automobilísticos
3/3
95% 0.130(1 0.130) 0.172(1 0.172)(0.130 0.172) 1.96123 290SIM NAOp pIC
95% -0.042 (1.96 0.038) -0.042 0.073SIM NAOp pIC
95% -0.116 ; 0.031SIM NAOp pIC
Com 95% de confiança, o efeito do uso no cinto de segurança está entre reduzir em 11.6 pontos percentuais até aumentar 3.1 pontos percentuais na proporção de ferimentos graves. O que isto quer
dizer ???
Para aprender mais …
Exercícios da Seção 11 Somente amostras independentes