Post on 30-Aug-2018
1
Profa. Dra. Livia M. A. Tenuta
litenuta@fop.unicamp.br
Universidade Estadual de CampinasFaculdade de Odontologia de Piracicaba
A escolha do método
estatístico
Universidade Estadual de CampinasFaculdade de Odontologia de Piracicaba
A escolha do método
estatístico
- Probabilidades, hipóteses e
delineamentos -
2
“A notícia boa é que a estatística
está se tornando mais fácil e
acessível.
A notícia ruim é que a estatística
está se tornando mais fácil e
acessível.”
Hofacker, 1983
Para muitos, estatística é...
3
Figueira CV, 2006
“Estatística é a arte de torturar
os dados até que eles digam o
que se quer ouvir”
Mills, 1993,
Susin & Rösing, 1999
Para outros...
4
Jim Borgman, New York Times, 27 April 1997
5
Testes estatísticos mais comuns
Número e tipo de grupos Paramétrico Não paramétrico
2 grupos
Independentes (não pareados)
Teste t para amostras
independentes
Teste de Mann-Whitney
Dependentes (pareados)
Teste t para amostras
dependentes
Teste de Wilcoxon
3 ou mais grupos
Independentes (não pareados)
ANOVA Teste de Kruskal-Wallis
Dependentes (pareados)
ANOVA medidas repetidas
Teste de Friedman
Susin C. Basic statistical analysis for dental rese arch.
In: Rode SM, Dias KRHC, França CM. Handbook of scie ntific methodology. IADR latinoamericana, 2009
Métodos de regressão mais comuns
Tipo de observações Dados contínuos Dados categóricos
Independentes Regressão linearRegressão logística
dicotômica, multinomial e ordenada
Dependentes
Regressão linear com erro padrão ajustado para o
agrupamento das observações
Regressão logística condicional e extensões
Susin C. Basic statistical analysis for dental rese arch.
In: Rode SM, Dias KRHC, França CM. Handbook of scie ntific methodology. IADR latinoamericana, 2009
6
Estudo cruzado duplo-cego
• Controle negativo : H2O
• Controle positivo : 1.5% Sacarose
• Controle ativo : 1.5% Lactose
• Experimental : Zero Cal R
• Controle negativo: sem dentifrício
• Controle ativo : MFP/SiO2
• Experimental : MFP/CaCO3
Pergunta (???) – curiosidade científica!
Delineamento experimental adequado
para testar a pergunta
Variáveis resposta que ajudem a
explicar o fenômeno
Pesquisa científica
7
Tratamento A:
21,5%
23,6%
39,7%
29,5%
32,7%
Média 29,4%
Estatística experimentalDesmineralização dental (% perda de dureza)
Tratamento B:
18,9%
24,4%
26,7%
19,4%
17,8%
Média 21,4%
Diferença estimada entre A e B: 8%
Estatística experimental
Existe uma real diferença entre os
tratamentos A e B?
Para descobrir, o experimento deveria
ser repetido infinitas vezes!
8
Inferência estatística: determina a
probabilidade de estimar se uma real
diferença entre tratamentos existe
Estatística experimental
Nível de significância (p): probabilidade
de erro ao afirmar que há diferença entre
os tratamentos
Tratamento A:
21,5%
23,6%
39,7%
29,5%
32,7%
Média 29,4%
DP 7,3%
Estatística experimentalDesmineralização dental (% perda de dureza)
Tratamento B:
18,9%
24,4%
26,7%
19,4%
17,8%
Média 21,4%
DP 3,9%
9
Variação do acaso: toda variação devido a fatores
não controláveis. Pode ser medida através do
desvio em relação a média
ANOVA
Análise da variância
Quanto da variabilidade observada
é devido ao acaso ou a um real
efeito do tratamento
10
Efeito de 2 dentifrícios na concentração de
F no fluido do biofilme
(µM F, média, n=56)
Dentifrício A Dentifrício B
5,5 11,4
Efeito de 2 dentifrícios na concentração de
F no fluido do biofilme
(µM F, média ± DP, n=56)
Dentifrício A Dentifrício B
5,5 ± 4,5 11,4 ± 21,0
11
Concentração de F no fluido do
biofilme dental exposto a 2 dentifrícios
12
Eliminando o outlier…
13
Transformação sugerida pelo pacote
estatístico: inversa
14
Esquema da análise de variância:
Delineamento inteiramente aleatorizado
Fonte de variação
Graus de liberdade
Soma de Quadrados Quadrado médio F
Tratamento I – 1Variabilidade devido
ao tratamentoSQ tratamento
GL trat.QM tratamento
QM resíduo
Resíduo I (J – 1) Por diferençaSQ resíduoGL resíduo
-
Total IJ – 1 Variabilidade total - -
I = número de níveis do tratamento
J = número de repetições
Modelo matemático:
Yij = µ + t i + eij
Delineamento inteiramente aleatorizado
Onde:
Yij = valor da variável testada sob o i-ésimo nível de tratamento
µ = média geral do experimento para a variável
t i = efeito do i-ésimo nível de tratamento
eij = erro aleatório
15
280 ppm F140 ppm F
70 ppm FControle
Teste de hipóteses: regra de decisão para
rejeitar ou não uma hipótese estatística
com base nos elementos amostrais
Estatística experimental
H0 (hipótese nula): hipótese que será testada
estatisticamente
Ha (hipótese alternativa): suposição que o
pesquisador quer estudar
16
Hipóteses:
H0 = t1 = t2 = ... = t I = 0
Ha = t i ≠ 0
Delineamento inteiramente aleatorizado
Ao rejeitar H 0, com nível de significância
de 5%, por exemplo, o pesquisador
automaticamente aceita sua hipótese
alternativa
Estatística experimental
17
“In relation to any experiment we may speak of…
the “null hypothesis,” and it should be noted that
the null hypothesis is never proved or established,
but is possibly disproved, in the course of
experimentation. Every experiment may be said to
exist only in order to give the facts a chance of
disproving the null hypothesis. ”
Fisher RA
Tratamento A:
21,5%
23,6%
39,7%
29,5%
32,7%
Média 29,4%
Estatística experimentalDesmineralização dental (% perda de dureza)
Tratamento B:
18,9%
24,4%
26,7%
19,4%
17,8%
Média 21,4%
Erro tipo I ( α): probabilidade de erro ao se rejeitar a
hipótese de nulidade quando ela é verdadeira, ou
seja, probabilidade de apontar um falso positivo
Diferem ao
nível de
significância
de 5%
18
Nível de significância de 5% significa que
aceitamos errar em 1 a cada 20 casos
Trabalhando com probabilidades...
Correlação entre variáveis: se eu tiver 10 variávei s
e for estudar a correlação entre elas, tenho 45
comparações (10*(10-1)/2 = 45)
Em 5% delas, posso ver uma correlação
significativa por mero acaso! 0,05* 45 = 2,25!Hofacker CS, 1983
Erro tipo II ( β): probabilidade de erro ao não
rejeitar a hipótese de nulidade quando ela é de
fato falsa, ou seja, probabilidade de apontar um
falso negativo
É função do:
a) número de repetições
b) variabilidade dos dados
c) real diferença entre os grupos
19
Proporciona uma estimativa do erro
experimental (variabilidade), permitindo a
estimativa do efeito dos tratamentos.
Repetição
Repetiçãon=3
Tratamento A:
20
24
25
Média 23
Tratamento B:
17
22
24
Média 21
Teste t comparando A e B: p=0,48
20
Repetiçãon=30
Tratamento A:
20, 24, 25, 21, 23, 20, 24, 25, 21, 23, 25, 20, 23, 26, 20, 25, 20, 23, 26, 20, 24, 25, 20, 24, 25, 24, 25, 20, 24, 25, 22, 24, 23, 21, 23, 22, 24, 23, 21, 23, 26, 19, 24, 25, 20, 26, 19, 24, 25, 20, 24, 25, 19, 25, 2524, 25, 19, 25, 25
Média 23
Tratamento B:
15, 22, 26, 16, 23, 15, 22, 26, 16, 23, 24, 15, 24, 24, 17, 24, 15, 24, 24, 17, 22, 24, 17, 22, 24, 22, 24, 17, 22, 24, 17, 16, 22, 24, 23, 17, 16, 22, 24, 23, 24, 17, 22, 24, 17, 24, 17, 22, 24, 17, 22, 24, 14, 24, 2522, 24, 14, 24, 25
Média 21
Teste t comparando A e B: p=0,0137
Repetiçãon=3
Tratamento A:
20
24
25
Média 23
Tratamento B:
10
13
16
Média 13
Teste t comparando A e B: p=0,0123
Diferença entre A e B = 10
21
Repetiçãon=3
Tratamento A:
20
24
25
Média 23
DP 2,6
Tratamento B:
10
13
16
Média 13
DP 3,0
Repetiçãon=3
Tratamento A:
13
21
35
Média 23
DP 11,1
Tratamento B:
5
10
24
Média 13
DP 9,9
Teste t comparando A e B: p=0,31
22
Poder estatístico
Erro tipo II ( β): probabilidade de erro ao não
rejeitar a hipótese de nulidade quando ela é de
fato falsa, ou seja, probabilidade de apontar um
falso negativo
Poder do teste estatístico : Capacidade do teste em
apontar diferenças quando elas realmente existem
Erro tipo II ( β) = 10%
Poder = 1 – β = 90%
23
Esquema da análise de variância:
Delineamento inteiramente aleatorizado
Fonte de variação
Graus de liberdade
Soma de Quadrados Quadrado médio F
Tratamento I – 1Variabilidade devido
ao tratamentoSQ tratamento
GL trat.QM tratamento
QM resíduo
Resíduo I (J – 1) Por diferençaSQ resíduoGL resíduo
-
Total IJ – 1 Variabilidade total - -
I = número de níveis do tratamento
J = número de repetições
Poder estatístico
The sample size selection was based on a pilot study , made with 3 volunteers,
who ingested the 550 µg F/g dentifrice, on fasting, after breakfast or after
lunch, and we used the AUC of salivary F concentration as the r esponse
variable. In fact, we intended to determine the number of vol unteers necessary
to detect differences between the gastric content situatio ns using the low F
dentifrice, with 80% power . From this pilot study, a low standard deviation was
observed between volunteers for each gastric content condi tion. Using the
SAS System 8.01, considering the differences obtained from the mean of these
treatments, we could reach 80% power if we used nine voluntee rs . For 11
volunteers, the power would increase to 90% . Considering that volunteers
could be lost during the 9-phase study, we opted to select 11 v olunteers.
Actually, we could significantly reject H 0 in the experiment , and therefore we
haven’t worried in mention this in the text, but we added the p ower
information in the text.
Reviewer: What were criteria for sample size selection? Was it to reach estimated power (80%)?
24
1. Repetição
2. Aleatorização
3. Cegamento
4. Controle local (blocos estatísticos)
Princípios básicos da experimentação
�
Proporciona a todos os tratamentos a
mesma probabilidade de serem
designados a qualquer das unidades
experimentais
Aleatorização
25
Aleatorização = sorteio!
Exemplo:
Dividir 16 espécimes em 4 tratamentos
(cada um com 4 espécimes)
Aleatorização no Excel
26
Classificar pela coluna Classificar pela coluna “Aleatório”“Aleatório”
ATENÇÃO: Para que o sorteio seja ATENÇÃO: Para que o sorteio seja feito corretamente, apenas as feito corretamente, apenas as colunas “Tratamento” e colunas “Tratamento” e “Aleatório” devem ser “Aleatório” devem ser selecionadas!selecionadas!
27
Ao classificar por um Ao classificar por um número aleatório,número aleatório,automaticamente o automaticamente o tratamento ficará tratamento ficará aleatorizado!aleatorizado!
Portanto, os espécimes Portanto, os espécimes 1, 6, 7 e 8 devem receber 1, 6, 7 e 8 devem receber o tratamento 1, e assim o tratamento 1, e assim sucessivamente...sucessivamente...
28
A distribuição dos espécimes entre os
tratamentos é feita de modo restrito, para
evitar que algum tratamento seja
favorecido pela aleatorização.
Exemplo: quando se conhece a dureza inicial de bloco s
dentais, é possível sorteá-los aos tratamentos de a cordo
com sua dureza
Aleatorização com restrição
E a média de dureza entre E a média de dureza entre os grupos apresentaos grupos apresenta--se se homogênea.homogênea.
29
RealizandoRealizando--se a se a aleatorizaçãoaleatorização sem restrição, sem restrição, as diferenças entre durezas as diferenças entre durezas dos espécimes distribuídos dos espécimes distribuídos aos 4 níveis de tratamento aos 4 níveis de tratamento são mais evidentes.são mais evidentes.
Estudo cego : o pesquisador não tem acesso
à identificação de qual nível de tratamento se
trata.
Cegamento
30
Vieira, S. Estatística experimental. 2.ed. 1999
Estudo cego: o pesquisador não tem acesso
à identificação de qual nível de tratamento se
trata.
Quando voluntários estão envolvidos, estes
também não devem saber de qual tratamento
estão participando – estudo duplo cego
Cegamento
31
Utiliza os princípios da repetição,
aleatorização e controle local
Exemplo: avaliar o efeito do dentifrício fluoretado ,
em 2 níveis, na concentração de F na saliva,
utilizando 14 voluntários como blocos estatísticos
Delineamento aleatorizado em blocos
Modelo matemático:
Yij = µ + t i + b j + eijk
Delineamento aleatorizado em blocos
Onde:
Yij = valor da variável testada sob o i-ésimo nível de tratamento e
no j-ésimo bloco
µ = média geral do experimento para a variável
t i = efeito do i-ésimo nível de tratamento
b j = efeito do j-ésimo nível de voluntário
eij = erro aleatório
32
Hipóteses:
H0 = t1 = t2 = ... = t I = 0
Ha = t i ≠ 0
Delineamento aleatorizado em blocos
Esquema da análise de variância:
Fonte de variação
Graus de liberdade
Soma de Quadrados Quadrado médio F
Tratamento I – 1Variabilidade devido
ao tratamentoSQ tratamento
GL trat.QM tratamento
QM resíduo
Blocos J – 1 Variabilidade devido
aos blocosSQ blocosGL blocos
QM blocosQM resíduo
Resíduo (I – 1)(J – 1) Por diferençaSQ resíduoGL resíduo
-
Total IJ – 1 Variabilidade total - -
I = número de níveis do tratamento
J = número de blocos
Delineamento aleatorizado em blocos
33
A variabilidade devido aos blocos
(voluntários, p.ex.) pode ser estimada,
diminuindo a variabilidade devido ao
acaso (erro experimental)
Delineamento aleatorizado em blocos
34
Fase 1
Delineamento cruzado
Fase 2 Fase 3
Voluntários grupo 1
Voluntários grupo 2
Voluntários grupo 3
Tratamento ATratamento A Tratamento BTratamento B Tratamento CTratamento C
1. Fatorial
2. Parcelas subdivididas
Delineamentos de tratamentos
35
Derivam do interesse em testar o efeito de
dois ou mais tipos de tratamentos no
mesmo experimento. Cada tipo de
tratamento é referido como um fator.
Experimentos fatoriais
Exemplo: avaliar o efeito do dentifrício
fluoretado, em 2 níveis, e da freqüência de
exposição do biofilme dental a sacarose,
em 4 níveis, na desmineralização dental.
Experimentos fatoriais
Fatorial 2 x 4
36
A combinação de tratamentos resultantes é o resulta do
da interação dos fatores a serem testados. No exemp lo,
há 8 combinações possíveis de tratamentos:
500 500 ppmppm FF, exposição ao açúcar 2x/dia
500 500 ppmppm FF, exposição ao açúcar 4x/dia
500 500 ppmppm FF, exposição ao açúcar 6x/dia
500 500 ppmppm FF, exposição ao açúcar 8x/dia
1100 1100 ppmppm FF, exposição ao açúcar 2x/dia
1100 1100 ppmppm FF, exposição ao açúcar 4x/dia
1100 1100 ppmppm FF, exposição ao açúcar 6x/dia
1100 1100 ppmppm FF, exposição ao açúcar 8x/dia
Experimentos fatoriais
Modelo matemático:
Yij = µ + A i + B j + Ai*B j + eijk
Delineamento fatorial
Onde:
Yij = valor da variável testada sob o i-ésimo nível do fator A e j-
ésimo nível do fator B
µ = média geral do experimento para a variável
Ai = efeito do i-ésimo nível do fator A
B j = efeito do j-ésimo nível do fator B
Ai*B j = efeito da interação A e B
eij = erro aleatório
37
Hipóteses:
Delineamento fatorial
(1) H0 = A1 = A2 = ... = AI = 0Ha = Ai ≠ 0
(2) H0 = B1 = B2 = ... = BJ = 0Ha = B j ≠ 0
(3) H0 = (A*B) ij = 0Ha = (A*B) ij ≠ 0
Esquema da análise de variância:
Fonte de variação
Graus de liberdade
Soma de Quadrados Quadrado médio F
A I – 1Variabilidade devido
ao fator ASQ trat. AGL trat. A
QM trat. AQM resíduo
B J – 1 Variabilidade devido
ao fator BSQ trat. BGL trat. B
QM trat. BQM resíduo
A*B (I – 1)(J – 1)Variabilidade devido
a interação A*BSQ (A*B)GL (A*B)
QM trat. A*BQM resíduo
Resíduo IJ (K– 1) Por diferençaSQ resíduoGL resíduo
-
Total IJ – 1 Variabilidade total - -
I = número de níveis do fator AJ = número de níveis do fator BK = número de repetições
Delineamento fatorial
38
A1 A2
Var
iáve
l res
post
a
B2
B1Não há efeito significativo
de A (A1 = A2)
Não há efeito significativo
de B (B1 = B2)
Não há efeito da interação
A1 A2
Var
iáve
l res
post
a
B2
B1
Há efeito significativo de A (A2 > A1)
Não há efeito significativo
de B (B1 = B2)
Não há efeito da interação
A1 A2
Var
iáve
l res
post
a
B2
B1 Há efeito significativo de A (A2 > A1)
Há efeito significativo de B(B1 > B2)
Não há efeito da interação
A1 A2
Var
iáve
l res
post
a
B2
B1Não há efeito significativo
de A (A1 = A2)
Há efeito significativo de B
(B1 > B2)
Não há efeito da interação
39
A1 A2
Var
iáve
l res
post
a
B2B1 Interação devido a
diferença na direção da
resposta
A1 A2
Var
iáve
l res
post
a
B2
B1 Interação devido a
diferença na grandeza da
resposta
40
Efeito de 2 dentifrícios na concentração de F no
fluido do biofilme em função da freqüência de
exposição a sacarose
(µM F, média ± DP, n=14)
Frequênciaexposição do
biofilme à sacaroseDentifrício A Dentifrício B
2 x 5,6 ± 4,7 7,2 ± 4,8
4 x 4,4 ± 1,3 10,1 ± 12,8
6 x 5,1 ± 2,3 8,2 ± 6,2
8 x 6,8 ± 7,2 8,0 ± 6,4
Houve efeito significativo do fator dentifrício na concent ração de F nofluido do biofilme dental (p<0,05)
Experimentos em parcelas subdivididas
Vieira, S. Estatística experimental. 2.ed. 1999
41
Ocorrem quando os tratamentos não são distribuídos
nas unidades experimentais da mesma forma,
caracterizando tratamentos primários (parcelas) e
secundários (subparcelas).
Após o sorteio do tratamento principal às unidades
experimentais de forma usual, o tratamento secundár io
é sorteado dentro de cada tratamento primário.
Experimentos em parcelas subdivididas
Baseline surface microhardness
42
Modelo matemático:
Yij = µ + A i + b j + Bk + Ai*Bk + eijkl
Delineamento em parcelas subdivididas
Onde:
Yij = valor da variável testada sob o i-ésimo nível do fator A, j-
ésimo bloco e k-ésimo nível do fator B
µ = média geral do experimento para a variável
Ai = efeito do i-ésimo nível do fator A
b j = efeito do j-ésimo bloco estatístico
B j = efeito do k-ésimo nível do fator B
Ai*Bk = efeito da interação A e B
eij = erro aleatório
Hipóteses:
Delineamento fatorial
(1) H0 = A1 = A2 = ... = AI = 0Ha = Ai ≠ 0
(2) H0 = B1 = B2 = ... = BJ = 0Ha = B j ≠ 0
(3) H0 = (A*B) ij = 0Ha = (A*B) ij ≠ 0
43
Esquema da análise de variância:
Fonte de variação
Graus de liberdade
Soma de Quadrados Quadrado médio F
A I – 1Variabilidade devido
ao fator ASQ trat. AGL trat. A
QM trat. AQM resíduo a
Blocos J – 1 Variabilidade devido
aos blocosSQ blocosGL blocos
QM blocosQM resíduo a
Resíduo a(A*bloco)
(I – 1)(J – 1)Variabilidade da
parcelaSQ resíduo aGL resíduo a
Delineamento fatorial
Esquema da análise de variância:
Fonte de variação
Graus de liberdade
Soma de Quadrados Quadrado médio F
A I – 1Variabilidade devido
ao fator ASQ trat. AGL trat. A
QM trat. AQM resíduo a
Blocos J – 1 Variabilidade devido
aos blocosSQ blocosGL blocos
QM blocosQM resíduo a
Resíduo a(A*bloco)
(I – 1)(J – 1)Variabilidade da
parcelaSQ resíduo aGL resíduo a
B K – 1 Variabilidade devido
ao fator BSQ trat. BGL trat. B
QM trat. BQM resíduo b
A*B (I – 1)(K – 1)Variabilidade devido
a interação A*BSQ (A*B)GL (A*B)
QM trat. A*BQM resíduo b
Resíduo b I(J – 1)(K– 1) Por diferençaSQ resíduo b GL resíduo b
-
Total IJK – 1 Variabilidade total - -
Delineamento fatorial
44
45
46
“We have discussed the practice of using different data
transformations within a 2-way ANOVA with our statistical adviser and
he stated that this is not valid , since the comparisons are not then
between data of the same type. Transformation is performed t o deal
with 1 or more of 3 problems: non-normality, non-homogeneit y of
variance and non-additivity . To my understanding, in a 2-way analysis,
'individualized' transformations, while solving the firs t two problems,
would work against the third requirement of ANOVA, that trea tment
effects are additive. For instance, data in which treatment effect was
multiplicative rather than additive are appropriately tra nsformed to
logs, since the treatment effects then become additive. But these
could not then be compared with data that had not been transfo rmed
because they already fulfilled the ANOVA requirements. You would be
comparing oranges and bananas .”
“Sorry about the confusion induced by my last set of comments on
the statistics. I think there might be still some sort of prob lem there, in
that your comparison of the 30-min plaque solid data is on a
somewhat different basis from the other comparisons. But I w ill
discuss it when I next see our statistical advisor. I suspect that I put
the question to him in a misleading way, combined with a mis-
interpretation of your analysis.”
47
Obrigadapela atenção!!!
litenuta@fop.unicamp.br