A escolha do método estatístico - sbpqo.org.brsbpqo.org.br/snpqo/arquivos/A ESCOLHA DO MÉTODO...

Profa. Dra. Livia M. A. Tenuta

litenuta@fop.unicamp.br

Universidade Estadual de CampinasFaculdade de Odontologia de Piracicaba

A escolha do método

estatístico

Universidade Estadual de CampinasFaculdade de Odontologia de Piracicaba

A escolha do método

estatístico

- Probabilidades, hipóteses e

delineamentos -

“A notícia boa é que a estatística

está se tornando mais fácil e

acessível.

A notícia ruim é que a estatística

está se tornando mais fácil e

acessível.”

Hofacker, 1983

Para muitos, estatística é...

Figueira CV, 2006

“Estatística é a arte de torturar

os dados até que eles digam o

que se quer ouvir”

Mills, 1993,

Susin & Rösing, 1999

Para outros...

Jim Borgman, New York Times, 27 April 1997

Testes estatísticos mais comuns

Número e tipo de grupos Paramétrico Não paramétrico

2 grupos

Independentes (não pareados)

Teste t para amostras

independentes

Teste de Mann-Whitney

Dependentes (pareados)

Teste t para amostras

dependentes

Teste de Wilcoxon

3 ou mais grupos

Independentes (não pareados)

ANOVA Teste de Kruskal-Wallis

Dependentes (pareados)

ANOVA medidas repetidas

Teste de Friedman

Susin C. Basic statistical analysis for dental rese arch.

In: Rode SM, Dias KRHC, França CM. Handbook of scie ntific methodology. IADR latinoamericana, 2009

Métodos de regressão mais comuns

Tipo de observações Dados contínuos Dados categóricos

Independentes Regressão linearRegressão logística

dicotômica, multinomial e ordenada

Dependentes

Regressão linear com erro padrão ajustado para o

agrupamento das observações

Regressão logística condicional e extensões

Susin C. Basic statistical analysis for dental rese arch.

In: Rode SM, Dias KRHC, França CM. Handbook of scie ntific methodology. IADR latinoamericana, 2009

Estudo cruzado duplo-cego

• Controle negativo : H2O

• Controle positivo : 1.5% Sacarose

• Controle ativo : 1.5% Lactose

• Experimental : Zero Cal R

• Controle negativo: sem dentifrício

• Controle ativo : MFP/SiO2

• Experimental : MFP/CaCO3

Pergunta (???) – curiosidade científica!

Delineamento experimental adequado

para testar a pergunta

Variáveis resposta que ajudem a

explicar o fenômeno

Pesquisa científica

Tratamento A:

Média 29,4%

Estatística experimentalDesmineralização dental (% perda de dureza)

Tratamento B:

Média 21,4%

Diferença estimada entre A e B: 8%

Estatística experimental

Existe uma real diferença entre os

tratamentos A e B?

Para descobrir, o experimento deveria

ser repetido infinitas vezes!

Inferência estatística: determina a

probabilidade de estimar se uma real

diferença entre tratamentos existe

Nível de significância (p): probabilidade

de erro ao afirmar que há diferença entre

os tratamentos

Tratamento A:

Média 29,4%

DP 7,3%

Tratamento B:

Média 21,4%

DP 3,9%

Variação do acaso: toda variação devido a fatores

não controláveis. Pode ser medida através do

desvio em relação a média

Análise da variância

Quanto da variabilidade observada

é devido ao acaso ou a um real

efeito do tratamento

Efeito de 2 dentifrícios na concentração de

F no fluido do biofilme

(µM F, média, n=56)

Dentifrício A Dentifrício B

5,5 11,4

Efeito de 2 dentifrícios na concentração de

F no fluido do biofilme

(µM F, média ± DP, n=56)

Dentifrício A Dentifrício B

5,5 ± 4,5 11,4 ± 21,0

Concentração de F no fluido do

biofilme dental exposto a 2 dentifrícios

Eliminando o outlier…

Transformação sugerida pelo pacote

estatístico: inversa

Esquema da análise de variância:

Delineamento inteiramente aleatorizado

Fonte de variação

Graus de liberdade

Soma de Quadrados Quadrado médio F

Tratamento I – 1Variabilidade devido

ao tratamentoSQ tratamento

GL trat.QM tratamento

QM resíduo

Resíduo I (J – 1) Por diferençaSQ resíduoGL resíduo

Total IJ – 1 Variabilidade total - -

I = número de níveis do tratamento

J = número de repetições

Modelo matemático:

Yij = µ + t i + eij

Yij = valor da variável testada sob o i-ésimo nível de tratamento

µ = média geral do experimento para a variável

t i = efeito do i-ésimo nível de tratamento

eij = erro aleatório

280 ppm F140 ppm F

70 ppm FControle

Teste de hipóteses: regra de decisão para

rejeitar ou não uma hipótese estatística

com base nos elementos amostrais

H0 (hipótese nula): hipótese que será testada

estatisticamente

Ha (hipótese alternativa): suposição que o

pesquisador quer estudar

Hipóteses:

H0 = t1 = t2 = ... = t I = 0

Ha = t i ≠ 0

Ao rejeitar H 0, com nível de significância

de 5%, por exemplo, o pesquisador

automaticamente aceita sua hipótese

alternativa

“In relation to any experiment we may speak of…

the “null hypothesis,” and it should be noted that

the null hypothesis is never proved or established,

but is possibly disproved, in the course of

experimentation. Every experiment may be said to

exist only in order to give the facts a chance of

disproving the null hypothesis. ”

Fisher RA

Tratamento A:

Média 29,4%

Tratamento B:

Média 21,4%

Erro tipo I ( α): probabilidade de erro ao se rejeitar a

hipótese de nulidade quando ela é verdadeira, ou

seja, probabilidade de apontar um falso positivo

Diferem ao

nível de

significância

Nível de significância de 5% significa que

aceitamos errar em 1 a cada 20 casos

Trabalhando com probabilidades...

Correlação entre variáveis: se eu tiver 10 variávei s

e for estudar a correlação entre elas, tenho 45

comparações (10*(10-1)/2 = 45)

Em 5% delas, posso ver uma correlação

significativa por mero acaso! 0,05* 45 = 2,25!Hofacker CS, 1983

Erro tipo II ( β): probabilidade de erro ao não

rejeitar a hipótese de nulidade quando ela é de

fato falsa, ou seja, probabilidade de apontar um

falso negativo

É função do:

a) número de repetições

b) variabilidade dos dados

c) real diferença entre os grupos

Proporciona uma estimativa do erro

experimental (variabilidade), permitindo a

estimativa do efeito dos tratamentos.

Repetição

Repetiçãon=3

Tratamento A:

Média 23

Tratamento B:

Média 21

Teste t comparando A e B: p=0,48

Repetiçãon=30

Tratamento A:

20, 24, 25, 21, 23, 20, 24, 25, 21, 23, 25, 20, 23, 26, 20, 25, 20, 23, 26, 20, 24, 25, 20, 24, 25, 24, 25, 20, 24, 25, 22, 24, 23, 21, 23, 22, 24, 23, 21, 23, 26, 19, 24, 25, 20, 26, 19, 24, 25, 20, 24, 25, 19, 25, 2524, 25, 19, 25, 25

Média 23

Tratamento B:

15, 22, 26, 16, 23, 15, 22, 26, 16, 23, 24, 15, 24, 24, 17, 24, 15, 24, 24, 17, 22, 24, 17, 22, 24, 22, 24, 17, 22, 24, 17, 16, 22, 24, 23, 17, 16, 22, 24, 23, 24, 17, 22, 24, 17, 24, 17, 22, 24, 17, 22, 24, 14, 24, 2522, 24, 14, 24, 25

Média 21

Repetiçãon=3

Tratamento A:

Média 23

Tratamento B:

Média 13

Diferença entre A e B = 10

Repetiçãon=3

Tratamento A:

Média 23

DP 2,6

Tratamento B:

Média 13

DP 3,0

Repetiçãon=3

Tratamento A:

Média 23

DP 11,1

Tratamento B:

Média 13

DP 9,9

Poder estatístico

Erro tipo II ( β): probabilidade de erro ao não

rejeitar a hipótese de nulidade quando ela é de

fato falsa, ou seja, probabilidade de apontar um

falso negativo

Poder do teste estatístico : Capacidade do teste em

apontar diferenças quando elas realmente existem

Erro tipo II ( β) = 10%

Poder = 1 – β = 90%

Fonte de variação

Graus de liberdade

QM resíduo

Resíduo I (J – 1) Por diferençaSQ resíduoGL resíduo

J = número de repetições

Poder estatístico

The sample size selection was based on a pilot study , made with 3 volunteers,

who ingested the 550 µg F/g dentifrice, on fasting, after breakfast or after

lunch, and we used the AUC of salivary F concentration as the r esponse

variable. In fact, we intended to determine the number of vol unteers necessary

to detect differences between the gastric content situatio ns using the low F

dentifrice, with 80% power . From this pilot study, a low standard deviation was

observed between volunteers for each gastric content condi tion. Using the

SAS System 8.01, considering the differences obtained from the mean of these

treatments, we could reach 80% power if we used nine voluntee rs . For 11

volunteers, the power would increase to 90% . Considering that volunteers

could be lost during the 9-phase study, we opted to select 11 v olunteers.

Actually, we could significantly reject H 0 in the experiment , and therefore we

haven’t worried in mention this in the text, but we added the p ower

information in the text.

Reviewer: What were criteria for sample size selection? Was it to reach estimated power (80%)?

1. Repetição

2. Aleatorização

3. Cegamento

4. Controle local (blocos estatísticos)

Princípios básicos da experimentação

Proporciona a todos os tratamentos a

mesma probabilidade de serem

designados a qualquer das unidades

experimentais

Aleatorização

Aleatorização = sorteio!

Exemplo:

Dividir 16 espécimes em 4 tratamentos

(cada um com 4 espécimes)

Aleatorização no Excel

Classificar pela coluna Classificar pela coluna “Aleatório”“Aleatório”

ATENÇÃO: Para que o sorteio seja ATENÇÃO: Para que o sorteio seja feito corretamente, apenas as feito corretamente, apenas as colunas “Tratamento” e colunas “Tratamento” e “Aleatório” devem ser “Aleatório” devem ser selecionadas!selecionadas!

Ao classificar por um Ao classificar por um número aleatório,número aleatório,automaticamente o automaticamente o tratamento ficará tratamento ficará aleatorizado!aleatorizado!

Portanto, os espécimes Portanto, os espécimes 1, 6, 7 e 8 devem receber 1, 6, 7 e 8 devem receber o tratamento 1, e assim o tratamento 1, e assim sucessivamente...sucessivamente...

A distribuição dos espécimes entre os

tratamentos é feita de modo restrito, para

evitar que algum tratamento seja

favorecido pela aleatorização.

Exemplo: quando se conhece a dureza inicial de bloco s

dentais, é possível sorteá-los aos tratamentos de a cordo

com sua dureza

Aleatorização com restrição

E a média de dureza entre E a média de dureza entre os grupos apresentaos grupos apresenta--se se homogênea.homogênea.

RealizandoRealizando--se a se a aleatorizaçãoaleatorização sem restrição, sem restrição, as diferenças entre durezas as diferenças entre durezas dos espécimes distribuídos dos espécimes distribuídos aos 4 níveis de tratamento aos 4 níveis de tratamento são mais evidentes.são mais evidentes.

Estudo cego : o pesquisador não tem acesso

à identificação de qual nível de tratamento se

trata.

Cegamento

Vieira, S. Estatística experimental. 2.ed. 1999

Estudo cego: o pesquisador não tem acesso

à identificação de qual nível de tratamento se

trata.

Quando voluntários estão envolvidos, estes

também não devem saber de qual tratamento

estão participando – estudo duplo cego

Cegamento

Utiliza os princípios da repetição,

aleatorização e controle local

Exemplo: avaliar o efeito do dentifrício fluoretado ,

em 2 níveis, na concentração de F na saliva,

utilizando 14 voluntários como blocos estatísticos

Delineamento aleatorizado em blocos

Modelo matemático:

Yij = µ + t i + b j + eijk

Yij = valor da variável testada sob o i-ésimo nível de tratamento e

no j-ésimo bloco

t i = efeito do i-ésimo nível de tratamento

b j = efeito do j-ésimo nível de voluntário

Hipóteses:

H0 = t1 = t2 = ... = t I = 0

Ha = t i ≠ 0

Fonte de variação

Graus de liberdade

QM resíduo

Blocos J – 1 Variabilidade devido

aos blocosSQ blocosGL blocos

QM blocosQM resíduo

Resíduo (I – 1)(J – 1) Por diferençaSQ resíduoGL resíduo

J = número de blocos

A variabilidade devido aos blocos

(voluntários, p.ex.) pode ser estimada,

diminuindo a variabilidade devido ao

acaso (erro experimental)

Fase 1

Delineamento cruzado

Fase 2 Fase 3

Voluntários grupo 1

Tratamento ATratamento A Tratamento BTratamento B Tratamento CTratamento C

1. Fatorial

2. Parcelas subdivididas

Delineamentos de tratamentos

Derivam do interesse em testar o efeito de

dois ou mais tipos de tratamentos no

mesmo experimento. Cada tipo de

tratamento é referido como um fator.

Experimentos fatoriais

Exemplo: avaliar o efeito do dentifrício

fluoretado, em 2 níveis, e da freqüência de

exposição do biofilme dental a sacarose,

em 4 níveis, na desmineralização dental.

Fatorial 2 x 4

A combinação de tratamentos resultantes é o resulta do

da interação dos fatores a serem testados. No exemp lo,

há 8 combinações possíveis de tratamentos:

500 500 ppmppm FF, exposição ao açúcar 2x/dia

Modelo matemático:

Yij = µ + A i + B j + Ai*B j + eijk

Delineamento fatorial

Yij = valor da variável testada sob o i-ésimo nível do fator A e j-

ésimo nível do fator B

Ai = efeito do i-ésimo nível do fator A

B j = efeito do j-ésimo nível do fator B

Ai*B j = efeito da interação A e B

Hipóteses:

(1) H0 = A1 = A2 = ... = AI = 0Ha = Ai ≠ 0

(2) H0 = B1 = B2 = ... = BJ = 0Ha = B j ≠ 0

(3) H0 = (A*B) ij = 0Ha = (A*B) ij ≠ 0

Fonte de variação

Graus de liberdade

A I – 1Variabilidade devido

ao fator ASQ trat. AGL trat. A

QM trat. AQM resíduo

B J – 1 Variabilidade devido

ao fator BSQ trat. BGL trat. B

QM trat. BQM resíduo

A*B (I – 1)(J – 1)Variabilidade devido

a interação A*BSQ (A*B)GL (A*B)

QM trat. A*BQM resíduo

Resíduo IJ (K– 1) Por diferençaSQ resíduoGL resíduo

I = número de níveis do fator AJ = número de níveis do fator BK = número de repetições

B1Não há efeito significativo

de A (A1 = A2)

Não há efeito significativo

de B (B1 = B2)

Não há efeito da interação

Há efeito significativo de A (A2 > A1)

Não há efeito significativo

de B (B1 = B2)

B1 Há efeito significativo de A (A2 > A1)

Há efeito significativo de B(B1 > B2)

B1Não há efeito significativo

de A (A1 = A2)

Há efeito significativo de B

(B1 > B2)

B2B1 Interação devido a

diferença na direção da

resposta

B1 Interação devido a

diferença na grandeza da

resposta

Efeito de 2 dentifrícios na concentração de F no

fluido do biofilme em função da freqüência de

exposição a sacarose

(µM F, média ± DP, n=14)

Frequênciaexposição do

biofilme à sacaroseDentifrício A Dentifrício B

2 x 5,6 ± 4,7 7,2 ± 4,8

4 x 4,4 ± 1,3 10,1 ± 12,8

6 x 5,1 ± 2,3 8,2 ± 6,2

8 x 6,8 ± 7,2 8,0 ± 6,4

Houve efeito significativo do fator dentifrício na concent ração de F nofluido do biofilme dental (p<0,05)

Experimentos em parcelas subdivididas

Vieira, S. Estatística experimental. 2.ed. 1999

Ocorrem quando os tratamentos não são distribuídos

nas unidades experimentais da mesma forma,

caracterizando tratamentos primários (parcelas) e

secundários (subparcelas).

Após o sorteio do tratamento principal às unidades

experimentais de forma usual, o tratamento secundár io

é sorteado dentro de cada tratamento primário.

Experimentos em parcelas subdivididas

Baseline surface microhardness

Modelo matemático:

Yij = µ + A i + b j + Bk + Ai*Bk + eijkl

Delineamento em parcelas subdivididas

Yij = valor da variável testada sob o i-ésimo nível do fator A, j-

ésimo bloco e k-ésimo nível do fator B

Ai = efeito do i-ésimo nível do fator A

b j = efeito do j-ésimo bloco estatístico

B j = efeito do k-ésimo nível do fator B

Ai*Bk = efeito da interação A e B

Hipóteses:

(1) H0 = A1 = A2 = ... = AI = 0Ha = Ai ≠ 0

(2) H0 = B1 = B2 = ... = BJ = 0Ha = B j ≠ 0

(3) H0 = (A*B) ij = 0Ha = (A*B) ij ≠ 0

Fonte de variação

Graus de liberdade

QM trat. AQM resíduo a

QM blocosQM resíduo a

Resíduo a(A*bloco)

(I – 1)(J – 1)Variabilidade da

parcelaSQ resíduo aGL resíduo a

Fonte de variação

Graus de liberdade

QM trat. AQM resíduo a

QM blocosQM resíduo a

Resíduo a(A*bloco)

(I – 1)(J – 1)Variabilidade da

parcelaSQ resíduo aGL resíduo a

B K – 1 Variabilidade devido

ao fator BSQ trat. BGL trat. B

QM trat. BQM resíduo b

A*B (I – 1)(K – 1)Variabilidade devido

a interação A*BSQ (A*B)GL (A*B)

QM trat. A*BQM resíduo b

Resíduo b I(J – 1)(K– 1) Por diferençaSQ resíduo b GL resíduo b

Total IJK – 1 Variabilidade total - -

“We have discussed the practice of using different data

transformations within a 2-way ANOVA with our statistical adviser and

he stated that this is not valid , since the comparisons are not then

between data of the same type. Transformation is performed t o deal

with 1 or more of 3 problems: non-normality, non-homogeneit y of

variance and non-additivity . To my understanding, in a 2-way analysis,

'individualized' transformations, while solving the firs t two problems,

would work against the third requirement of ANOVA, that trea tment

effects are additive. For instance, data in which treatment effect was

multiplicative rather than additive are appropriately tra nsformed to

logs, since the treatment effects then become additive. But these

could not then be compared with data that had not been transfo rmed

because they already fulfilled the ANOVA requirements. You would be

comparing oranges and bananas .”

“Sorry about the confusion induced by my last set of comments on

the statistics. I think there might be still some sort of prob lem there, in

that your comparison of the 30-min plaque solid data is on a

somewhat different basis from the other comparisons. But I w ill

discuss it when I next see our statistical advisor. I suspect that I put

the question to him in a misleading way, combined with a mis-

interpretation of your analysis.”

Obrigadapela atenção!!!

litenuta@fop.unicamp.br

A escolha do método estatístico - sbpqo.org.brsbpqo.org.br/snpqo/arquivos/A ESCOLHA DO MÉTODO...

Documents

Transcript of A escolha do método estatístico - sbpqo.org.brsbpqo.org.br/snpqo/arquivos/A ESCOLHA DO MÉTODO...

NORMAS PARA APRESENTAÇÃO DE TRABALHOS ......1.2 ESCOLHA DO TEMA A elaboração de um trabalho científico depende de planeamento e método. Embora pareça fácil, a escolha de um

A escolha do R como software estatístico - leg.ufpr.brleg.ufpr.br/lib/exe/fetch.php/pessoais:bruno:dissertacao:palestra.pdf · Início da Graduação em Estatística ... O point

MÉTODO PARA CONTROLE ESTATÍSTICO MULTIVARIADO DE ...

A escolha do método estatístico profa. dra. lívia maria andaló tenuta (unicamp)

Estudo EstatíStico

Método , Metodologia e Técnicapesquisaemeducacaoufrgs.pbworks.com/w/file/fetch/52632108/aula... · Método , Metodologia e Técnica Instrumentos para a ... • Comparativo • Estatístico

Avaliação in vitro do comportamento de osteoblastos sobre ... · eletrónico: pmesquita@fmd.up.pt ... (OMRON ESCS, Kyoto, ... tes foi avaliada pelo método estatístico MANOVA.

ROTEIRO PARA ABORDAGEM DE CONTEÚDOS DE FÍSICA … · roteiro para abordagem de conteÚdos de fÍsica na experimentaÇÃo - a utilizaÇÃo do mÉtodo estatÍstico de regressÃo,

Anuario Estatístico

INTRODUÇÃO CARACTERIZAÇÃO DA EMPRESA SITUAÇÃO PROBLEMÁTICA JUSTIFICATIVA DA ESCOLHA DO TEMA OBJETIVOS FUNDAMENTAÇÃO TEÓRICA MÉTODO RESULTADOS CONCLUSÃO.

Matriz de decisão qualitativa para escolha do método ... · 1 Matriz de decisão qualitativa para escolha do método construtivo de contenções – Estudo de caso na implantação

Método Estatístico Tabelas e Gráficosjoinville.ifsc.edu.br/~joni.fusinato/Eng Mec/Aulas/Aula 3 - Tabelas... · 3 Coleta de Dados Primário Feito pelo pesquisador (dados inexistentes).

ESTATÍSTICA APLICADA À ADMINISTRAÇÃOww1.ead.upe.br/nead/theme/2015/administracao/adm4/estatistica... · Coordenador do Projeto ... Unidade 1 – Fases do Método Estatístico,

Evidências.com 1/36 Projeto de Pesquisa Método estatístico (Análise estatística) .

Métodos Estocásticos da Engenharia IIIprofessor.ufop.br/sites/default/files/magno/files/...O método de engenharia e o pensamento estatístico Consequentemente, engenheiros têm

Rosemberg Trindade. Ementa da disciplina Natureza da estatística. Método estatístico e suas fases. População e amostra:Variáveis, tipos de amostragem.

Aula 01 – introdução Panorama histórico Método estatístico Fases do método estatístico Prof. Diovani Milhorim Estatística.

MINISTÉRIO DA EDUCAÇÃO UNIVERSIDADE FEDERAL DO … · estatístico foi o Inteiramente Casualizado; parcelas de 10g de sementes com dez insetos e teste sem chance de escolha. No

ECONOMETRIA - pmbortolon.wikispaces.com 1...O método Econométrico 3. Especificação do modelo estatístico ou econométrico – Se obtivéssemos dados de 500 famílias (consumo

PROGRAMA DE ENSAIOS DE PROFICIÊNCIA EM … · Escolha do método de Ensaio ... ANÁLISE ESTATÍSTICA DOS RESULTADOS E AVALIAÇÃO DE DESEMPENHO O método estatístico utilizado neste