Post on 10-Dec-2018
11
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
Prof. LorProf. LorProf. LorProf. Loríííí Viali, Dr.Viali, Dr.Viali, Dr.Viali, Dr.
http://www.pucrs.br/famat/viali/http://www.pucrs.br/famat/viali/http://www.pucrs.br/famat/viali/http://www.pucrs.br/famat/viali/
viali@pucrs.brviali@pucrs.brviali@pucrs.brviali@pucrs.brProf. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
O teste de McNemar O teste de McNemar O teste de McNemar O teste de McNemar
O teste de McNemar para a
significância de mudanças é
particularmente aplicável aos
experimentos do tipo "antes e depois" em
que cada sujeito é utilizado como seu
próprio controle e a medida é efetuada em
escala nominal ou ordinal.
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
Para testar a significância de
qualquer mudança observável, através
deste método, é necessário construir uma
tabela de freqüências “2x2”. Veja exemplo
a seguir:
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
A tabela 2x2A tabela 2x2A tabela 2x2A tabela 2x2
DC----
BA++++Antes
++++----
Depois
22
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
Note-se que aqueles casos que
mostram mudanças entre a primeira e a
segunda resposta aparecem nas células AAAA e
DDDD. Um sujeito é contado na célula AAAA se ele
muda de ++++ para ---- e é contado na DDDD se ele
muda de ---- para ++++.
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
Se nenhuma mudança é ocorre ele
é contado nas células AAAA (resposta ++++
antes antes antes antes e depoisdepoisdepoisdepois) e CCCC (resposta ---- antesantesantesantes e
depoisdepoisdepoisdepois).
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
HipHipHipHipóóóótesestesestesesteses
A Como A + D representa o
número total de elementos que acusaram alguma modificação, a
expectativa, sob a hipótese de
nulidade, é de que 1/2 (A + D) acuse modificações em um sentido e 1/2 (A +
D) no outro sentido. Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
VariVariVariVariáááável Testevel Testevel Testevel Teste
( )
2
D+A
)2
D+AD(
=
2
D+A
)2
D+AA(
=E
EO
=χ
22
i
k
1=iii2
21
--∑ -
Simplificando vem:
D+A
)DA(==χ
221
-
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
A correção torna-se necessária porque
uma distribuição contínua, no caso, o qui-
quadrado está sendo usada para
aproximar uma distribuição discreta.
Quando todas as freqüências esperadas
são pequenas, esta aproximação pode não
ser boa.
Correção de Continuidade
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
A correção de continuidade (de
Yates) é uma tentativa de remover esta
fonte de erro. A expressão acima
incluindo a correção de Yates fica:
Correção de Continuidade
D+A
)1|DA(|==χ
221
--
33
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
Uma pesquisa realizada entre donos
de automóveis sobre a necessidade do uso
do cinto de segurança foi realizada antes e
depois de um filme sobre acidentes, onde
era enfocado os benefícios do uso do cinto.
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
Dos 80 motoristas entrevistados 20 eram
a favor do uso do cinto antes e continuaram
após, 30 eram contra antes e ficaram a favor
após, 15 eram contra antes e continuaram
contra após e 5 eram a favor e ficaram contra
após. Teste, ao nível de 1%, a significância das
mudanças.
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
H0: A proporção de mudanças de A
para B é igual a de B para A, isto
é, PA = PB = 1/2
H1: PA > PB
HipHipHipHipóóóótesestesestesesteses
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
Os dadosOs dadosOs dadosOs dados
3015----
205++++Antes
++++----
Depois
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
A estatA estatA estatA estatíííística testestica testestica testestica teste
457,16=30+5
)1|5(|==χ
221
-30-
44
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
Significância do ResultadoSignificância do ResultadoSignificância do ResultadoSignificância do Resultado
Como pode ser visto o resultado
encontrado é significativo a 1% ou
menos, portanto as mudanças são
significativas.
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
ObjetivosObjetivosObjetivosObjetivos
A prova de Wilcoxon de duas
amostras emparelhadas é a equivalente não
paramétrica ao teste t para duas amostras
dependentes. As hipóteses são as mesmas,
embora às vezes elas possam ser colocadas
em termos da mediana e não da média.
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
HipHipHipHipóóóótesestesestesesteses
H0: A diferença entre as médias (ou
medianas) populacionais é zero.
H1: A diferença entre as médias (ou
mediadas) não é zero.
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
ObjetivosObjetivosObjetivosObjetivos
A suposição básica por trás deste teste
é que as distribuições populacionais são
simétricas (médias e medianas idênticas).
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
Inicialmente calcular di = diferença
dentro do par “i”. A seguir atribuir postos a
cada di, independentemente de sinal. Ao menor
di, atribuir o posto 1; ao próximo 2, etc. A cada
posto atribuir o sinal da diferença, isto é,
identificar quais postos decorrem de diferenças
negativas e quais de diferenças positivas.
Metodologia
55
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
Se as duas classificações são
equivalentes, isto é se Ho é verdadeira, é de se
esperar que algumas das maiores diferenças
sejam positivas e outras negativas. Desta
forma, se forem somados os postos com sinal
mais e os postos com sinal menos, deve-se
esperar somas aproximadamente iguais.
MetodologiaMetodologiaMetodologiaMetodologia
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
Se houver diferença entre estas duas
somas é sinal de que as duas classificações
(ou tratamentos) não se equivalem e deve-
se então rejeitar a hipótese nula.
MetodologiaMetodologiaMetodologiaMetodologia
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
Se as duas amostras foram extraídas da
mesma população, então se espera que as
distribuições acumuladas das amostras estejam
próximas. Se as distribuições estão “distantes”
isto sugere que as amostras provenham de
populações distintas e um desvio grande pode
levar a rejeição da hipótese de nulidade.
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
Eventualmente os escores de dois
pares serão iguais. Neste caso eles devem devem devem devem
serserserser excluídos da análise e o valor de n
deve ser reduzido na mesma quantidade
de valores em que a diferença for nula.
Empates
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
Pode ocorrer, ainda, um outro tipo de
empate. Duas ou mais diferenças podem ter o
mesmo valor absoluto. Neste caso, atribuí-se o
mesmo posto aos empates. Este posto é a
média dos postos que teriam sido atribuídos se
as diferenças fossem diferentes.
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
Por exemplo, se três pares acusam as
diferenças: -1, -1 e +1, a cada par será
atribuído o posto 2, que é a média entre 1, 2 e
3. O próximo valor, pela ordem, receberia o
valor 4, porque já teriam sido utilizados os
postos 1, 2 e 3.
66
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
Se T = a menor soma dos postos de
mesmo sinal (negativos ou positivos)
então T será significativo se não superar
o valor dado na tabela, sob determinado
nível de significância.
Pequenas Amostras (n < 25)
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
Neste caso T (menor soma) é
aproximadamente normal com os
seguintes parâmetros:
Grandes Amostras (n ≥ 25)
24
)1+n2)(1+n(n=σ T
4
)1+n(n=µ T
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
Um grupo de 25 motoristas foi
submetido a um teste para verificar o
efeito do álcool na percepção de
obstáculos. O número de cones derrubados
antes e depois da ingestão de uma dose de
destilado foi anotado.
2425433212D
1434321210A
3131534210A
20191817161514131211M
4563423232D
98
67
10
54321M
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
Teste a hipótese de que o álcool
não tem influência sobre a
percepção dos motoristas.
77
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
Resultados Resultados Resultados Resultados ---- SPSSSPSSSPSSSPSS
116,00116,00116,00116,00116,00116,00116,00116,009,6712Positive
Ranks
5,00
MeanMeanMeanMean
RankRankRankRank
2020202020202020
4
4
NNNN
TotalTotalTotalTotal
Ties
NegativeRanks
20,0020,0020,0020,0020,0020,0020,0020,00Antes –Depois
SumSumSumSum of of of of
RanksRanksRanksRanks
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
0,005Exact Sig. (1-tailed)
0,011Asymp. Sign (2 tailed)
0,002
0,010
-2,542 (a)
Antes –Depois
Point Probability
Exact Sig. (2-tailed)
Z
a Based on negative ranks.
b Wilcoxon Signed Ranks Test
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
O teste é uma extensão direta do qui-quadrado para duas amostras independentes.
Em geral, o teste é o mesmo, tanto para duas, como para k amostras independentes.
O teste quiO teste quiO teste quiO teste qui----quadradoquadradoquadradoquadrado
O teste χ² de “k” amostras independentes pode ser utilizado para
verificar a dependência ou independência entre as variáveis sendo consideradas.
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
H0 : As variáveis são independentes
H1 : As variáveis são dependentes
HipHipHipHipóóóóteses e Cteses e Cteses e Cteses e Cáááálculolculolculolculo
( )
E
EO
=χij
k
1=i
∑l
1=jijij
2
2υ
∑ -
A variA variA variA variáááável teste vel teste vel teste vel teste éééé::::
88
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
Expressão alternativaExpressão alternativaExpressão alternativaExpressão alternativa
( )
nE
O
=
=E
EO
=χ
ij
k
1=i
l
1=j
2ij
ij
k
1=i
l
1=jijij
2
2υ
-
∑ ∑
∑ -∑A variA variA variA variáááável vel vel vel
teste teste teste teste éééé::::
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
r = número de linhas da tabela;
L = número de colunas da tabela;
Oij = freqüência observada na interseção da linha i com a coluna j.
Eij = número de casos esperados na
interseção da linha i com a coluna j.
Onde:
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
Onde:
= tamanho da amostra;∑k
1=i
l
1=jij∑O=n
χ 2υ é a estatística teste;
pn=E ijij são as freqüências esperadas
de cada célula ij da tabela.
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
pij é a probabilidade de ocorrer uma
observação na célula ij. Se as variáveis são
supostamente independentes (H0 é
Verdadeira), então pij = pi.p.j, onde pi. é a
probabilidade marginal correspondente à
linha “i” e p.j é a probabilidade marginal
correspondente a coluna j.
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
Como não se conhecem as probabilidades
marginais, elas devem ser estimadas através
das correspondentes freqüências relativas.
Então:
n
ff=
n
f.
n
f.n
=p.pn=pn=E
j..ij..i
j..iijij
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
∑k
1=iijj.
l
1=jij.i f=f e ∑ f=f
99
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
O teste de Kruskal-Wallis é utilizado
para decidir se k amostras independentes
podem ter sido extraídas de populações
diferentes.
ObjetivosObjetivosObjetivosObjetivos
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
Os valores amostrais diferem entre si
e deve-se decidir se essas diferenças
amostrais significam diferenças efetivas
entre as populações, ou se representam
apenas variações casuais.
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
O teste supõe que a variável em
estudo tenha distribuição contínua e exige
mensuração no mínimo ao nível ordinal.
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
Cada um dos nnnnnnnn valores é substituído por
um posto. Isto é, os escores de todas as k
amostras combinadas são dispostos em uma
única série de postos. Ao menor escore é
atribuído o posto 1, ao seguinte o posto 2 e
assim por diante até o maior posto que é n =
número total de observações.
MetodologiaMetodologiaMetodologiaMetodologia
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
Feito isso, determina-se a soma dos
postos em cada amostra (coluna). A prova
então testa se estas somas são tão diferentes
entre si, de modo que não seja provável que
tenham sido todas retiradas de uma mesma
população.
1010
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
Se as k amostras forem de uma mesma
população (H0 é V) então a estatística de
Kruskal-Wallis tem distribuição conhecida
(Tabela O) se as amostras forem pequenas
(n < 5) ou Qui-Quadrado com glglglglglglglgl = k = k = k = k = k = k = k = k -------- 11111111, desde
que os tamanhos das k amostras não sejam
muito pequenos (5 ou mais elementos).
A estatística teste
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
O grau de liberdade O grau de liberdade O grau de liberdade O grau de liberdade O grau de liberdade O grau de liberdade O grau de liberdade O grau de liberdade éééééééé::::::::
A estatA estatA estatA estatA estatA estatA estatA estatíííííííística amostral stica amostral stica amostral stica amostral stica amostral stica amostral stica amostral stica amostral
amostras de número=k onde ,1k=ν -
nn
T- 1
)1+n(3n
R
)1+n(n
12
=H
3
k
1=j j
2j
-
∑
∑ -eeeeeeee
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
Onde:Onde:Onde:Onde:Onde:Onde:Onde:Onde:
k = número de amostras;
nj = número de elementos na amostra “j”;
Rj = soma dos postos na amostra (coluna) “j”;
n = ∑nj = número total de elementos em todas as amostras combinadas;
T = t3 – t, onde t é o número de empates.
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
Verificar a influência do Fator
“Idade” sobre a variável “tempo, em
dias, para conseguir um emprego”,
considerando as seguintes amostras:
1245
336471
18
14
6
31
25
Abaixo de 25
30
51
28
27
42
33
Entre 25 e 40
57
58
43
20
63
Acima de 40 anos
1111
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
Tem-se n = 21 (total de
informações). Então o maior posto
será 21.
10
215
32021
ΣΣΣΣΣΣΣΣRRRRRRRR33333333 = 31= 31= 31= 31= 31= 31= 31= 31
5
4
1
11
7
Postos (3)Postos (3)Postos (3)Postos (3)Postos (3)Postos (3)Postos (3)Postos (3)
ΣΣΣΣΣΣΣΣRRRRRRRR22222222 = 90= 90= 90= 90= 90= 90= 90= 90
16
9
8
13
12
Postos (2) Postos (2) Postos (2) Postos (2) Postos (2) Postos (2) Postos (2) Postos (2)
ΣΣΣΣΣΣΣΣR R R R R R R R 11111111 = 110= 110= 110= 110= 110= 110= 110= 110
17
18
14
6
19
Postos (1) Postos (1) Postos (1) Postos (1) Postos (1) Postos (1) Postos (1) Postos (1)
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
A variA variA variA variA variA variA variA variáááááááável teste servel teste servel teste servel teste servel teste servel teste servel teste servel teste seráááááááá: : : : : : : :
04,21=6604,87=
=+)6
31+
8
90+
7
110()1+21(21
12=
=)1+n(3n
R
)1+n(n
12=H
222
k
1=j j
2j
-
1)3(21-
∑ -
O grau de liberdade é:2=1 - 3 = 1k=ν -
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
O χ22 tabelado é:
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
A 1% de significância é possível
afirmar que o fator “idade” tem
influência sobre o “tempo para
encontrar trabalho”.
Conclusão
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
1212
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
Resultados SPSSResultados SPSSResultados SPSSResultados SPSS
Kruskal-Wallis Test
5,92
10,81
15,57
MeanMeanMeanMean RankRankRankRank
21
6
8
7
nnnn
Total
2
1
0
ControleControleControleControle
0,020
2
7,839
TempoTempoTempoTempo
Assyp. Sig.
df
Chi-Square
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
ObjetivosObjetivosObjetivosObjetivos
Quando os dados de kkkk amostras estão em
correspondência, isto é, o número de casos é o
mesmo para cada uma delas, pode-se utilizar a
análise de variância por postos de Friedman
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
A dupla análise de variância ou χ2 de
Friedman é uma alternativa não paramétrica
para testar diferenças entre duas ou mais
amostras dependentes.
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
A estatística teste é dada por:
CCCCáááálculolculolculolculo
∑ -k
1=i
2i
2υ )1+k(n3R
)1+k(nk
12=χ
Onde:
k = número de tratamentos;
n = tamanho da amostra;
ΣRi = soma dos postos de cada tratamento;
v = k –1 = grau de liberdade.
1313
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
Onde:
k = número de tratamentos;
n = tamanho da amostra;
ΣRi = soma dos postos de cada tratamento;
v = k –1 = grau de liberdade.
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
Oito gerentes foram convidados de uma
empresa de Internet para avaliar o novo sítio
da instituição onde trabalham. Eles foram
convidados a dar uma nota de 0 a 5 para cada
uma de quatro características de interesse do
local. Teste se as características diferem
significativamente a 5%. 3
4
3
5
2
2
4
2
C2C2C2C2
5
4
1
2
0
2
3
3
C1C1C1C1
537
016
4
3
0
2
5
1
C4C4C4C4
5
4
3
5
4
2
C3C3C3C3
8
5
4
3
2
1
GerentesGerentesGerentesGerentes
Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS/UFRGS – Departamento de Estatística
Friedman Friedman Friedman Friedman TestTestTestTest
2,19
2,88
2,69
2,25
Mean Rank
CCCC4444
CCCC3333
CCCC2222
CCCC1111
0,606
3
1,846
8
AsympAsympAsympAsymp. . . . SigSigSigSig....
dfdfdfdf
Chi-Square
n