Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
1
Testes Não Paramétricos
Nos testes abordados até agora, ditos testes paramétricos, as hipóteses
envolvem apenas parâmetros populacionais, como a média, a variância, uma
proporção, etc. Além disso, em geral, estes testes comportam uma diversidade
de suposições fortes a que o seu emprego deve subordinar-se de que são
exemplo:
as observações devem ser extraídas de populações com distribuição
especificada;
as variáveis em estudo devem ser medidas em escala intervalar ou de
rácios, de modo a que seja possível utilizar operações aritméticas sobre os
valores obtidos das amostras (adição, multiplicação, ...),
etc.
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
2
Vamos agora abordar um conjunto de testes que nos permitem testar outro tipo
de hipóteses que não apenas sobre parâmetros populacionais (e.g., se a
distribuição populacional em estudo pode ser considerada Normal). Estes são
chamados testes não paramétricos.
Estes testes são, em geral, fáceis de aplicar, pois podem ser usados quando
as hipóteses exigidas por outras técnicas não são satisfeitas. Apesar de haver
certas suposições básicas associadas à maioria das provas não paramétricas,
essas suposições são em menor número e mais fracas do que as associadas às
provas paramétricas. A maior parte das provas não paramétricas servem para
pequenas amostras e, além disso, aplicam-se a dados medidos em escala
ordinal, e alguns mesmo a dados em escala nominal.
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
3
Testes de Ajustamento (testes da bondade do ajustamento)
Os testes de ajustamento servem para testar a hipótese de que uma
determinada amostra aleatória tenha sido extraída de uma população com
distribuição especificada.
Hipóteses a testar:
H0: a amostra provém de uma população com distribuição especificada H1: a população de onde provém a amostra não segue a distrib. especificada
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
4
Exemplo: Pretende-se construir um modelo de simulação das operações de um determinado terminal de um porto situado na Europa.
Uma das variáveis a considerar no modelo é a diferença entre a data de chegada dos navios provenientes dos EUA e a respectiva data planeada. Há razões para supor que tal diferença é uma variável aleatória com distribuição Normal de média 0.1 e desvio padrão 7.2.
Uma amostra de 30 navios revelou os resultados que se apresentam na tabela seguinte.
-6.6 -2 5 2.4 -1.8 -0.3 15 -7.6 -0.6 2.6 -7.4 12.4 -6 -5.8 15.2 -2.4 -8.9 -5.6 -3.7 2.2 8.2 -9 13.2 7.6 -2.8 -1.8 1.8 4.4 2.2 4
Diferença entre a data de chegada e a data planeada para 30 navios.
Será mesmo de admitir que tais dados foram extraídos de uma pop. N(0.1, 7.2)?
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
5
Neste exemplo, estamos perante um problema de ajustamento de dados a uma
determinada distribuição.
Existem vários testes de ajustamento que nos permitem fazer uma análise de
problemas deste tipo, entre os quais: o Teste de Ajustamento do Qui-quadrado
sugerido por Karl Pearson, o teste de Kolmogorov ou Kolmogorov-Smirnov e o
teste de normalidade de Lilliefors, que apresentamos a seguir.
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
6
Teste do Qui-quadrado
Considere-se uma amostra aleatória de n elementos, extraída de uma
população com distribuição desconhecida, sobre os quais se observa uma
característica (qualitativa ou quantitativa).
Os valores possíveis da característica em estudo são, num primeiro passo,
repartidas por m classes mutuamente exclusivas, A1, A2, ... , Am (serão intervalos
da recta real se a característica é quantitativa e contínua).
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
7
Denote-se por:
- Oi o nº de observações ou frequência absoluta observada da classe Ai;
- pi a probabilidade desconhecida de obter uma observação na classe Ai;
- p0i a probabilidade de obter uma observação na classe Ai , assumindo que
a observação foi extraída de uma população com a distribuição especificada
em H0.
Hipóteses a testar:
H0: pi=p0i , i=1,...,m
H1: pi≠p0i para algum i
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
8
Assim, a frequência esperada da classe Ai, quando H0 é verdadeira, é dada por
ei = n×p0i.
A estatística de teste, do teste de ajustamento do Qui-quadrado, é dada por
( )∑=
−=
m
i i
iie
eOQ1
2
que, sendo verdadeira a hipótese nula, tem distribuição assimptótica do Qui-
quadrado com m-k-1 graus de liberdade (χ2m-k-1), onde k é o número de
parâmetros desconhecidos da distribuição proposta em H0, estimados a partir da
amostra.
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
9
Se a hipótese nula for verdadeira, a diferença entre cada valor observado e o
respectivo valor esperado, Oi–ei, não deve ser muito grande e,
consequentemente, a estatística de teste terá um valor observado, Qobs, também
não muito grande.
De modo intuitivo, quanto maior for o valor observado de Q, menos plausível é
a hipótese nula, isto é, mais nos encaminhamos de concluir que as frequências
observadas não foram provenientes da população em que se baseou a hipótese
nula, levando à rejeição desta.
Trata-se portanto de um teste unilateral à direita.
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
10
Na aplicação deste teste deve-se ter particular atenção às frequências
esperadas, ei’s, pois se estas forem muito pequenas a aproximação ao
Qui-quadrado não é a mais apropriada. São referidas na literatura várias regras
práticas de aplicação do teste, das quais avançamos a seguinte. Se tivermos:
- mais de 20% das classes com ei inferior a 5 ou,
- alguma classe com ei inferior a 1
devemos proceder à agregação de algumas classes contíguas, e iniciar
novamente o teste, agora com menos classes.
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
11
Retomemos o exemplo exposto atrás.
Exemplo: Denotando por X a diferença entre a data de chegada dos navios e a
data planeada, as hipóteses a testar são
H0: X ~ N(0.1, 7.22)
H1: X ~/ N(0.1, 7.22)
Neste caso a distribuição proposta em H0 é contínua e, deste modo, as classes
Ai, i=1,...m, são intervalos da forma
A1=]-∞, a1[, A2=[ a1, a2[ A3=[ a2, a3[ ... Am=[ am-1, +∞[.
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
12
Para a determinação das classes é sugerida a regra de Mann e Wald:
Número de classes = m, com m tal que n/m>5.
Os limites dos intervalos são tais que as probabilidades decorrentes da
hipótese nula sejam iguais a 1/m para todas as classes.
Assim, as frequências esperadas são todas iguais a n/m>5.
Para o exemplo escolheu-se m=4 classes (ei=30/4=7.5>5), donde
p0i = P(Ai\H0) = 1/4, para i=1,2,3,4.
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
13
Cálculo dos limites dos intervalos de classe:
a3: p03 = 0.25 ⇔ a3=4.96 (EXCEL: INV.NORM(0.75;0.1;7.2));
Da simetria da distribuição normal:
a2=0.1 e a1=0.1-(4.924-0.1)= -4.724 (EXCEL: INV.NORM(0.25;0.1;7.2))
a1 a2 =0.1 a3
1/4 1/4 1/4
1/4
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
14
-6.6 -2 5 2.4 -1.8 -0.3 15 -7.6 -0.6 2.6-7.4 12.4 -6 -5.8 15.2 -2.4 -8.9 -5.6 -3.7 2.28.2 -9 13.2 7.6 -2.8 -1.8 1.8 4.4 2.2 4
Classes Frequências
observadas p0i Frequências
esperadas A1=]-∞, -4.76[ 8 0.25 7.5 A2=[-4.76,0.1[ 8 0.25 7.5 A3=[0.1, 4.96[ 7 0.25 7.5 A4=[4.96, +∞ [ 7 0.25 7.5
O valor observado da estatística de teste é
Qobs= 5.7
)5.78( 2− + 5.7
)5.78( 2− +5.7
)5.77( 2− +5.7
)5.77( 2− = 0.13
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
15
A estatística teste, sob o pressuposto de H0 ser verdadeira, tem
aproximadamente distribuição Qui-quadrado com m-1=4-1=3 graus de liberdade.
Para α=0.05: R.C.=[7.81, +∞[ . (EXCEL: 7.81=INV.CHI(0,05;3))
Como Qobs ∉R.C., somos levados a não rejeitar a hipótese de que a diferença
entre os tempos de chegada e os tempos planeados tem distribuição N(0.1, 7.22).
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
16
Teste de Kolmogorov-Smirnov (K-S)
O teste de Kolmogorov-Smirnov (K-S) ao contrário do teste do Qui-quadrado,
não se aplica a dados qualitativos nem a variáveis discretas, pois a tabela
disponível para este teste só é exacta caso a distribuição em teste seja contínua.
No entanto, tem a vantagem de não estar dependente de classificações dos dados, que além de serem sempre algo arbitrárias envolvem perdas de
informação. De facto, no ajustamento de uma distribuição contínua a uma
amostra usando o teste do Qui-quadrado, temos de proceder à agregação dos
dados em classes, sendo por isso mais adequado utilizar o teste K-S.
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
17
Por outro lado, o teste K-S só pode ser aplicado quando a distribuição indicada
na hipótese nula está completamente especificada (o que não sucede com o
teste do Qui-quadrado). No caso de pretendermos, por exemplo, efectuar um
ajustamento de uma distribuição normal, sem especificar µ e σ, podemos recorrer
a outro teste, neste caso o teste desenvolvido por Lilliefors (teste de normalidade
de Lilliefors) que será abordado mais tarde.
Além disso, o teste do Qui-Quadrado está orientado essencialmente para
grandes amostras, enquanto que o teste K-S é aplicável a pequenas amostras.
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
18
Seja F a função de distribuição da população em estudo e F0 a função de
distribuição proposta, contínua e completamente especificada.
Hipóteses a testar:
H0: F(x)=F0(x), para qualquer x H1: F(x)≠F0(x), para algum x
No teste de Kolmogorov-Smirnov comparam-se as frequências relativas
acumuladas registadas na amostra com as que se esperariam se a distribuição
populacional fosse a especificada na hipótese nula.
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
19
A Estatística do teste de K-S considera a maior das diferenças, em valor absoluto, entre a
proporção de observações inferiores ou iguais a x, S(x), e a probabilidade de se observar
um valor inferior ou igual a x se a distribuição populacional for a especificada em H0, F0(x):
)()(sup 0 xFxSDx
n −=+∞<<∞−
F0(x)
)(xS
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
20
Uma vez que F0 é uma função (contínua) não decrescente e S é uma função
em escada, o supremo ocorre num ponto onde se verifica um salto de S :
{ } )()( , )()( max 100,...,1, −
=−−= iiiiniobsn xSxFxSxFD .
Assim, se H0 for verdadeira, a distância vertical máxima entre as imagens das
duas distribuições não deve de ser muito grande, e logo espera-se que Dn,obs
tome um valor pequeno.
Então, para um nível de significância α, rejeita-se H0, se o valor observado for
superior ou igual ao ponto crítico Dn,α (os valores críticos Dn,α podem ser consultados
numa tabela).
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
21
Exemplo: Acredita-se que o tempo despendido na execução de uma
determinada tarefa é uma variável aleatória com distribuição normal de média
290 minutos e desvio padrão 56 minutos. Foram registados os tempos
despendidos em 10 tarefas seleccionadas ao acaso, tendo-se registado o
seguinte:
198 254 262 272 275 278 285 287 287 292
Ao nível de significância de 5%, há evidência para rejeitar a hipótese de
normalidade da referida variável?
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
22
Denote-se por X o tempo despendido na execução de uma tarefa.
As hipóteses a testar são, neste caso,
H0: X∼N(290, 562)
H1: X ~/ N(290, 562).
O ponto crítico da estatística de teste D10 é, para α=0.05, D10,0.05= 0.409
(consulte a tabela).
Para calcular o valor observado da estatística de teste, começa-se por ordenar
os valores da amostra por ordem crescente. Os cálculos estão efectuados na
tabela seguinte.
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
23
EXCEL: DIST.NORM(198;290;56;VERDADEIRO)
xi S(xi) S(xi-1) F0(xi) |F0(xi)- S(xi) | |F0(xi)- S(xi-1)|
198 0,1 0 0,0502 0,05 0,0502 254 0,2 0,1 0,2602 0,06 0,1602 262 0,3 0,2 0,3085 0,009 0,1085 272 0,4 0,3 0,3739 0,026 0,0739 275 0,5 0,4 0,3944 0,106 0,0056 278 0,6 0,5 0,4152 0,185 0,0848 285 0,7 0,6 0,4644 0,236 0,1356 287 0,9 0,7 0,4786 0,421 0,2214 292 1 0,9 0,5142 0,486 0,3858
Como D10,obs =0.486>0.409, ao nível de significância de 5%, rejeitamos a
hipótese de o tempo despendido na execução de uma tarefa seguir distribuição
N(290, 562).
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
24
Teste de Normalidade Lilliefors
Pretende-se testar se uma dada variável aleatória X tem distribuição N(µ, σ2)
sem especificar µ e σ, isto é, para algum µ e algum σ.
Hipóteses a testar
H0: X ~ N(µ, σ2)
H1: X ~/ N(µ, σ2)
Este teste processa-se como o teste de K-S, usando estimativas de µ e σ,
respectivamente, x e s.
Os pontos críticos são consultados na tabela elaborada por Lilliefors.
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
25
Exemplo: Um distribuidor pretende estimar o tempo médio de entrega dos
seus produtos a um cliente bastante importante. Foi recolhida uma amostra
aleatória de cinco tempos: 29, 33, 35, 36 e 36.
O senhor quer estimar o tempo médio pretendido através de um intervalo de
confiança, mas nada sabe acerca da distribuição do tempo de entrega X, e além
disso, a dimensão da amostra é muito pequena (n=5). Poderá fazê-lo?
Sabemos que caso a distribuição subjacente aos dados seja normal, o
intervalo pode ser calculado usando a fórmula:
nStX m , onde t: P(-t<T<t) =λ, T ~ tn-1
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
26
Assim, interessa testar, em primeiro lugar, as hipóteses
H0: X ~ N(µ, σ2) H1: X ~/ N(µ, σ2)
Uma vez que nada sabemos acerca de µ e σ, podemos utilizar o teste de
Lilliefors, recorrendo às estimativas x =33.8 s=2.95 .
O valor crítico da estatística teste, ao nível de significância de 0.05 é *
05.0,5D =0.337 (consulte a tabela).
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
27
EXCEL: DIST.NORM(29;33.8;2.95;VERDADEIRO) Cálculo do valor observado da estatística de Teste:
xi S(xi) S(xi-1) F0(xi)
|F0(xi)- S(xi) | |F0(xi)- S(xi-1)|
29 0,2 0 0,0519 0,1481 0,0519 33 0,4 0,2 0,3931 0,0069 0,1931 35 0,6 0,4 0,6579 0,0579 0,2579 36 1 0,6 0,772 0,2279 0,1721
Como *,5 obsD =0.2579<0.337, então, ao nível se significância de 5%, não
rejeitamos a hipótese de a população em estudo ter distribuição normal.
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
28
Tabelas de Contingência
Teste do Qui-quadrado de Independência
Suponha que numa amostra aleatória de tamanho n de uma dada população
são observados dois atributos ou características A e B (qualitativas ou
quantitativas), uma com r e outra com s modalidades ou categorias,
respectivamente A1, A2,..., Ar e B1, B2,..., Bs.
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
29
Cada indivíduo da amostra é classificado numa e numa só categoria (ou
classe) de A e numa e numa só categoria (ou classe) de B.
A classificação dos elementos da amostra dá origem a uma tabela de dupla
entrada, designada por tabela de contingência r×s, com o seguinte aspecto:
B1 B2 ... Bs
A1 O11 O12 ... O1s
A2 O21 O22 ... O2s
M M M O M
Ar Or1 Or2 ... Ors
Oij (i=1,...,r e j=1,...,s) número de elementos classificados simultaneamente
nas categorias Ai de A e Bj de B, numa amostra de tamanho n.
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
30
Sejam:
• Oi⋅ ∑=
=s
1jijO (i=1,...,r) nº de elementos na amostra com modalidade Ai;
• O⋅j ∑=
=r
1iijO (j=1,...,s) nº de elementos na amostra com modalidade Bj.
Tem-se,
∑∑∑∑=
•=
•= =
===s
1jj
r
1ii
r
1i
s
1jij OOOn
onde n é a dimensão da amostra.
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
31
O objectivo a que nos propomos é o de tentar inferir sobre a existência ou não
de qualquer relação ou associação entre os atributos (variáveis) A e B, mais
concretamente, inferir se A e B são ou não independentes.
Hipóteses a testar:
H0: A e B são independentes
H1: A e B não são independentes
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
32
Denote-se por: • pij=P(Ai∩Bj) (i=1,..,r e j=1,...,s) a probabilidade (desconhecida) de um
indivíduo da população ser classificado simultaneamente nas categorias Ai de
A e Bj de B;
• pi⋅=P(Ai) (i=1,...,r) a probabilidade (desconhecida) de um indivíduo da população ser classificado na categoria Ai de A;
• p⋅j=P(Bj) (j=1,...,s) a probabilidade (desconhecida) de um indivíduo da população ser classificado na categoria Bj de B.
∑∑∑∑=
•=
•= =
===s
1jj
r
1ii
r
1i
s
1jij ppp1 .
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
33
Ora, se os atributos são independentes, verifica-se a conhecida relação,
P(Ai∩Bj) = P(Ai) P(Bj),
isto é,
pij= pi⋅× p⋅j Assim, as hipóteses anteriores podem ser formuladas do seguinte modo:
H0: pij= pi⋅× p⋅j (para todo i e j)
H1: pij≠ pi⋅× p⋅j (para algum i≠j).
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
34
Os verdadeiros valores das probabilidades pi⋅ e p⋅j são estimadas, a partir dos dados amostrais, por
nOp i
i•
• = e n
Op j
j•
• = ,
Notação: eij=n pij número esperado de indivíduos na classe Ai de A e Bj de B.
Quando H0 é verdadeira, i.e, pij= pi⋅× p⋅j , temos
eij=n pij =n pi⋅× p⋅j ⎯⎯⎯⎯ →⎯ porestimado
nOO
ppne jijiij
••••
×==
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
35
A estatística do teste de independência é então:
∑∑= =
−=χ
r
1i
s
1j ij
2ijij2
e)eO(
,
que, sob o pressuposto de H0 ser verdadeira, tem distribuição assimptótica do
Qui-quadrado com (r-1)(s-1) graus de liberdade.
Vimos que quando H0 é verdadeira eij pode ser estimado por jiij ppne ••= .
Logo, a diferença entre Oij (frequência observada) e ije (estimativa da frequência
esperada supondo a independência) não deve ser grande.
Assim, a estatística teste, mede o afastamento dos dados em relação à
hipótese de independência. Trata-se então de um teste unilateral à direita.
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
36
Exemplo: Um supermercado quer testar ao nível de significância de 5% a
hipótese de que o modo de pagamento dos clientes nesse estabelecimento é
independente do período do dia em que fazem as compras. Existem três modos
de efectuar os pagamentos: por cheque, dinheiro e cartão de débito/crédito.
A seguinte tabela de contingência 3×3 apresenta os resultados obtidos numa
amostra de 4000 clientes:
PERÍODO DO DIA MODO DE PAGAMENTO Manhã Tarde Noite
Cheque 750 1500 750 Dinheiro 125 300 75
Cartão de débito/Crédito 125 200 175
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
37
Denotando por A o atributo Modo de pagamento e por B o atributo Período do
dia em que faz as compras, as hipóteses as testar são
H0: A e B são independentes
H1: A e B não são independentes
Uma vez que A e B assumem cada uma 3 modalidades, sob H0, a estatística
teste tem distribuição assimptótica do Qui-quadrado com (r-1)(s-1)=(3-1)(3-1)= 4
graus de liberdade.
Ao nível de significância de 0.05, a região crítica é então [9.49, +∞[ (consulte
tabela ou faça no EXCEL: INV.CHI(0,05;4)).
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
38
PERÍODO DO DIA MODO DE PAGAMENTO Manhã Tarde Noite Totais
Cheque 750 1500 750 3000 Dinheiro 125 300 75 500
Cartão de Crédito 125 200 175 500 Totais 1000 2000 1000 4000
Cálculo das frequências esperadas: jiij ppne ••= =nn
Oi•n
O j• =nOO ji ••
11e =(3000×1000)/4000=750
12e =(3000×2000)/4000=1500
13e =(3000×1000)/4000=750.
M
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
39
Frequências esperadas
PERÍODO DO DIA MODO DE PAGAMENTO Manhã Tarde Noite Totais
Cheque 750 1500 750 3000 Dinheiro 125 250 125 500
Cartão de Crédito 125 250 125 500 Totais 1000 2000 1000 4000
Valor observado da estatística teste:
χ2obs =
750)750750( 2− +
1500)15001500( 2− +...+
250)250200( 2− +
125)125175( 2− =60.
Uma vez que 60 excede o valor crítico 9.49, ao nível de significância de 0.05,
rejeitamos a hipótese de que o modo de pagamento é independente do período
do dia em que as compras são feitas.
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
40
Medidas de Associação
No teste do Qui-Quadrado apresentado, se for rejeitada a hipótese de
independência entre os atributos, pode interessar medir a intensidade da
associação entre os mesmos, através de uma medida adequada.
Uma vez que a estatística do teste mede o afastamento em relação à hipótese
de independência, o seu valor observado poderá ser usado para avaliar o grau de
associação entre os atributos.
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
41
Coeficiente de Contingência de Pearson: n
C 2
2
+χχ
=
Este coeficiente varia entre 0 e q)1q( − onde q=min{r,s} e portanto nunca
assume o valor 1.
Valores pequenos de C indicam fraca associação entre os atributos, enquanto
que valores grandes de C indicam forte associação.
O facto deste coeficiente não assumir o valor 1 no caso de associação
completa é uma sua limitação. Para obviar este problema, Tshuprow propôs o
seguinte coeficiente.
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
42
Coeficiente de Tshuprow: )1s()1r(n
2T
−×−χ
=
Este coeficiente varia entre 0 e 1, tomando o valor 0 no caso de existir
independência e o valor 1 quando r=s e houver associação completa.
Por último, referimos o coeficiente proposto por Cramer que atinge o valor 1
quando há associação completa.
Coeficiente V de Cramer: )1q(n
V2
−χ
= , com q=min{r,s} 0≤V≤1.
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
43
Para o exemplo anterior, rejeitámos a hipótese de independência entre o modo
de pagamento e o período do dia em que as compras eram efectuadas.
Para ter uma ideia da intensidade de associação entre estes dois atributos,
calculam-se os coeficientes que acabámos de descrever.
Coeficiente de Contingência de Pearson: 1220400060
602
2.
nC =
+=
+χ
χ=
0≤C≤ q)q( 1− , onde q=min{r,s}=3, i.e, 0 ≤C≤ 0.816.
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
44
Coeficiente de Tshuprow: 224000
6011
2
×−×−χ ==
)s()r(nT =0.087
Coeficiente V de Cramer: 24000
601
2
×=
−χ
=)q(n
V =0.087
Verificamos, então, que apesar de haver associação entre os atributos, esta
pode considerar-se fraca.
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
45
Teste de Homogeneidade Suponha que são recolhidas amostras aleatórias de s populações
(sub-populações ou estratos) B1, B2,..., Bs , nas quais se observa um atributo A
com r categorias A1, A2,..., Ar.
Neste contexto, surge também uma tabela de contingência r×s:
B1 B2 ... Bs
A1 O11 O12 ... O1s
A2 O21 O22 ... O2s
M M M O M
Ar Or1 Or2 ... Ors
Oij (i=1,...,r e j=1,...,s) número de elementos da amostra da população Bj
classificados na categoria Ai de A.
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
46
Sejam:
• Oi⋅ ∑=
=s
1jijO (i=1,...,r) nº de elementos na categoria Ai de A em todas as
amostras;
• O⋅j ∑=
=r
1iijO (j=1,...,s) tamanho da amostra recolhida na população Bj.
Neste caso, cada Bj rotula uma sub-população cujos elementos se distribuem
pelas r modalidades do atributo A, e o que se pretende saber é se existe homogeneidade, isto é, se não há diferença entre as populações no modo como os seus elementos se distribuem pelas modalidades do atributo A.
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
47
À semelhança do teste de independência, a estatística do teste é
∑∑= =
−=χ
r
1i
s
1j ij
2ijij2
e)eO(
,
que, sob o pressuposto de H0 ser verdadeira, tem distribuição assimptótica do
Qui-Quadrado com (r-1)(s-1) graus de liberdade.
Valores muito grandes da estatística de teste traduzem um grande afastamento
dos dados em relação à hipótese nula, conduzindo à rejeição desta. Assim, a estatística de teste mede o afastamento dos dados em relação à hipótese de homogeneidade.
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
48
Para aplicar os testes de independência e de homogeneidade devem ser
seguidas as mesmas regras que vimos para o teste de ajustamento do Qui-
quadrado, isto é, se tivermos:
- mais de 20% das frequências esperadas, ei’s, inferiores a 5 ou,
- alguma frequência esperada inferior a 1
devemos proceder à agregação de algumas classes contíguas.
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
49
Teste exacto de Fisher O teste do Qui-quadrado é, como já se disse, baseado numa distribuição
assimptótica, o que portanto limita a sua aplicação ao caso de grandes amostras
(recorde as limitações sobre as frequências esperadas).
Em tabelas de contingência 2x2, existe uma alternativa ao teste do
Qui-quadrado, o teste de Fisher, que é um teste exacto, i.e., a distribuição da
estatística é exacta (os pontos críticos e valores-p são calculados de forma
exacta).
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Ajuste entre duas Amostras Independentes
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
1
AJUSTE ENTRE DUAS AMOSTRAS INDEPENDENTES Objectivo: Dadas duas amostras aleatórias e independentes provenientes de duas
populações, pretende-se testar a hipótese H0 de que as duas distribuições
populacionais são idênticas, isto é, as duas amostras podem ser consideradas
como provenientes de populações com a mesma distribuição.
Hipóteses a testar:
H0: As duas amostras são retiradas de populações com a mesma distribuição
H1: As duas amostras são retiradas de populações com distribuições diferentes
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Ajuste entre duas Amostras Independentes
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
2
Teste do Qui-quadrado
Os valores possíveis da característica em estudo são repartidos por m classes
mutuamente exclusivas A1, A2,...,Am.
A hipótese H0 que se pretende testar é a de que as duas populações em
estudo têm a mesma distribuição, isto é, não há diferença entre as duas
populações no modo como os seus elementos se distribuem pelas diversas
classes. Por outras palavras, as duas populações são homogéneas.
Trata-se então do teste do Qui-quadrado de homogeneidade para duas
populações (s=2).
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Ajuste entre duas Amostras Independentes
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
3
Teste de Kolmogorov-Smirnov Este teste aplica-se a distribuições contínuas.
Comparam-se as frequências relativas acumuladas registadas nas duas amostras
(digamos A e B). Se não se registarem diferenças significativas, não é rejeitada a hipótese
nula de que as duas amostras provêm de populações com a mesma distribuição.
A estatística de teste considera a maior das diferenças, em valor absoluto, entre as
proporções de valores inferiores ou iguais a x observadas em cada amostra, SA(x)–SB(x).
Estatística de teste:
)()(sup' xSxSD BAx
−=+∞<<∞−
Para um nível de significância α, a hipótese H0 é rejeitada se o valor observado da
estatística de teste for superior ao ponto crítico α'D (a ser consultado numa tabela).
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Ajuste entre duas Amostras Independentes
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
4
Exemplo: Registaram-se os valores de uma análise feita a 80 indivíduos com a variante
A de uma dada doença, obtendo-se os seguintes resultados
VALORES 20 22 23 26 29 30 31 33 34 N.º indivíduos 2 3 9 12 27 16 7 2 2
Seleccionaram-se aleatoriamente 70 indivíduos com a variante B da mesma doença. Os
valores da análise para estes 70 indivíduos estão registados seguidamente.
VALORES 23 24 26 28 30 31 32 33 34 36 38
N.º indivíduos 1 2 3 6 15 20 13 4 3 2 1
Pode-se admitir que a distribuição dos valores da análise é a mesma para as duas
variantes da doença? Servirá esta análise como meio de diagnostico da variante A ou B
desta doença? (Use α=0.01)
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Ajuste entre duas Amostras Independentes
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
5
Variante A: VALORES 20 22 23 26 29 30 31 33 34
N.º indivíduos 2 3 9 12 27 16 7 2 2 Freq. acumuladas 2 5 14 26 53 69 76 78 80
SA(x) 2/80 5/80 14/80 26/80 53/80 69/80 76/80 78/80 1 Variante B:
VALORES 23 24 26 28 30 31 32 33 34 36 38
N.º indivíduos 1 2 3 6 15 20 13 4 3 2 1
Freq. acumuladas 1 3 6 12 27 47 60 64 67 69 70 SB(x) 1/70 3/70 6/70 12/70 27/70 47/70 60/70 64/70 67/70 69/70 1
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Ajuste entre duas Amostras Independentes
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
6
Cálculo do valor observado da estatística de teste:
Valores 20 22 23 24 26 28 29 30 31 32 33 34 36 38
SA(x) 2/80 5/80 14/80 14/80 26/80 26/80 53/80 69/80 76/80 76/80 78/80 1 1 1 SB(x) 0 0 1/70 3/70 6/70 12/70 12/70 27/70 47/70 60/70 64/70 67/70 69/70 1
|SA(x)- SB(x)| 0,025 0,063 0,161 0,132 0,239 0,154 0,491 0,477 0,279 0,093 0,061 0,043 0,014 0
O valor observado da estatística de teste é então D’obs=0.491.
Para α=0.01, o ponto crítico é (consulte tabela): 267.07080708063.1 =
×+ .
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Ajuste entre duas Amostras Independentes
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
7
Dado que o valor observado da estatística de teste é 0.491>0.267, então
rejeita-se a hipótese nula de as duas variantes da doença não se distinguirem
quanto à distribuição dos valores da análise. Há portanto evidência estatística, ao
nível de significância de 0.01, de que os valores da análise de distribuem de
forma diferente na variante A e B da doença.
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Teste de Kruskal_Wallis
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
1
TESTE DE KRUSKAL-WALLIS
Objectivo: Dadas k populações nas quais se estuda uma característica comum e de onde
foram extraídas k amostras aleatórias e independentes, pretende-se testar a
hipótese H0 de que as distribuições populacionais são idênticas, isto é, as k
amostras podem ser consideradas como provenientes de populações com a
mesma distribuição.
Nota: O teste de Krukal-Wallis constitui uma alternativa à análise de variância com um
factor, a ser abordada mais tarde, quando os pressupostos desta não podem ser
verificados.
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Teste de Kruskal_Wallis
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
2
Hipóteses a testar:
H0: As k amostras são retiradas de populações com a mesma distribuição
H1: As k amostras não são retiradas de populações com a mesma distribuição,
isto é, há pelo menos duas populações com distribuições diferentes
O teste de Kruskal-Wallis é particularmente sensível a diferenças nas medidas
de localização.
Por esta razão as hipóteses são geralmente formuladas em termos das médias
ou das medianas populacionais.
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Teste de Kruskal_Wallis
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
3
Notação: µi média da i-ésima população
Mi mediana da i-ésima população
H0: µ1=µ2=…=µk (as médias populacionais são iguais para as k populações)
H1: µi≠µj , i≠j (há pelo menos duas populações com médias diferentes)
H0: M1=M2=…=Mk (as k medianas populacionais são iguais)
H1: Mi=Mj , i≠j (há pelo menos duas populações com medianas diferentes)
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Teste de Kruskal_Wallis
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
4
Notação: ni - o tamanho da amostra retirada da população i (i=1,...k);
N =∑=
k
iin
1- nº total de observações;
Xij - a j-ésima observação da amostra da população i.
Procedimento: ordenam-se todas as observações por ordem crescente dos seus valores;
atribui-se um nº de ordem, ou posto, Rij, a cada observação Xij (a
observação mais pequena fica com o nº de ordem, ou posto, 1 e a observação
maior com o posto N);
para cada população i determina-se o valor Ri da soma dos postos das
observações correspondentes a esse grupo populacional: ∑=
=in
1jiji RR
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Teste de Kruskal_Wallis
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
5
Quando há empates nos valores observados, o número de ordem, ou posto,
que deve ser atribuído a cada valor empatado deve ser a média dos números de
ordem que seriam atribuídos a estes valores se não estivessem empatados. Por
exemplo, suponhamos que ordenando os valores observados obtínhamos
100, 102, 102, 102, 102.5, 103, 103, 104.
Neste caso, os números de ordem seriam respectivamente,
1, 3, 3, 3, 5, 6.5, 6.5, 8.
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Teste de Kruskal_Wallis
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
6
Quando não há empates nos valores observados das amostras, ou o nº de empates é muito pequeno, a estatística de teste é:
H= )1N(3nR
)1N(N12 k
1i i
2i +−
+∑=
A hipótese nula deve ser rejeitada se o valor observado da estatística H for
muito grande, i.e., superior ao ponto crítico (teste unilateral à direita).
Pontos críticos:
o Se k=3 e ni≤5 para todo i=1,...,k, consultar tabela da distribuição exacta da estatística H, sob H0.
o Se ni≥5 para todo i=1,...,k, sob H0, H tem aproximadamente distribuição 2
1−kχ ; consultar tabela desta distribuição.
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Teste de Kruskal_Wallis
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
7
Quando há muitos empates nos valores observados das amostras a
estatística de teste a usar deve ser:
H'= ⎥⎦
⎤⎢⎣
⎡ +−∑
= 4)1N(N
nR
S1 2k
1i i
2i
2
onde,
⎥⎦
⎤⎢⎣
⎡ +−−
= ∑∑= = 4
)1N(NR1N
1S2k
1i
n
1j
2ij
2 i
Pontos críticos:
o Se ni≥5 para todo i=1,...,k, sob H0, H’ tem aproximadamente distribuição 2
1−kχ ; consultar tabela desta distribuição.
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Teste de Kruskal_Wallis
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
8
Exemplo: Para avaliar o mérito de três métodos de ensino diferentes, cada um de 14
estudantes foi aleatoriamente matriculado em uma de três turmas. Em cada turma
utilizou-se um método de ensino diferente. Após algumas aulas, pediu-se a cada
estudante que resolvesse o mesmo problema. Os tempos respectivos (em minutos)
constam do quadro seguinte.
Método 1 Método 2 Método 3 15 21 11 12 16 19 18 13 17 20 9 22 10 24
Será possível afirmar que os métodos de ensino produzem resultados diferentes no que
diz respeito à rapidez de um aluno para resolver um problema? (Use α=0.05)
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Teste de Kruskal_Wallis
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
9
Ordenam-se as observações, registando o grupo (mét. ensino) a que
pertencem, e determina-se o posto de cada uma:
Observação 9 10 11 12 13 15 16 17 18 19 20 21 22 24
Posto - Rij 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Grupo (mét.) 2 1 3 1 2 1 2 3 1 3 1 2 3 3
R1=2+4+6+9+11=32
R2=1+5+7+12=25
R3=3+8+10+13+14=48
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Teste de Kruskal_Wallis
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
10
Não havendo empates, a estatística de teste é H= )1N(3nR
)1N(N12 k
1i i
2i +−
+∑=
cujo
valor observado é: Hobs= =+−⎟⎟⎠
⎞⎜⎜⎝
⎛++
+)114(3
548
425
532
)114(1412 222
1.963.
Consultando a tabela da distribuição exacta de H, sob H0, retira-se o ponto
crítico para α=0.05: 5.6429.
Dado que Hobs=1.963<5.6429, não se rejeita a hipótese nula dos três métodos
de ensino produzirem efeitos idênticos. Por outras palavras, não há evidência
estatística de que o tipo de método de ensino influencie o desempenho dos
estudantes na resolução de problemas.
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Teste de Kruskal_Wallis
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
11
Testes de Comparações múltiplas
Quando rejeitamos a hipótese H0, surge a questão de identificar onde se
encontram as diferenças, i.e., quais são as amostras onde se encontram
diferenças significativas.
Para isso temos de comparar cada par de amostras da seguinte maneira:
para cada amostra, calcula-se o posto médio iR , dividindo a soma dos
postos Ri pelo tamanho da amostra ni;
Determinam-se as diferenças absolutas entre cada par de postos médios
ji RR − , i,j=1,…,k
Dep. Matemática Escola Superior de Tecnologia de Viseu
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Teste de Kruskal_Wallis
Carla Henriques e Manuel Reis Tratamento Estatístico de Dados
12
Cada diferença absoluta ji RR − é comparada com o valor crítico
⎟⎟⎠
⎞⎜⎜⎝
⎛+⎟
⎠⎞
⎜⎝⎛ +
χ= −αji
21k,ij n
1n1
12)1N(Nc
onde, 21k, −αχ é o ponto crítico usado para o teste de Kruskal-Wallis.
Se ijji cRR >− , então, considera-se significativa a diferença entre as
amostras i e j, havendo, portanto, evidência de existirem diferenças entre
as populações de onde se extraíram estas amostras.
Top Related