Códigos de Agrupamentos e Escolas não Agrupadas 2011_2012_22-07-2011
3. TESTES DE QUALIDADE DE AJUSTAMENTOw3.ualg.pt/~eesteves/docs/TestesQualidadeAjustamento.pdf · As...
Transcript of 3. TESTES DE QUALIDADE DE AJUSTAMENTOw3.ualg.pt/~eesteves/docs/TestesQualidadeAjustamento.pdf · As...
Testes da qualidade de ajustamento
APONTAMENTOS DE ADPE © E. Esteves & C. Sousa, 2007. 67
3. TESTES DE QUALIDADE DE AJUSTAMENTO
3.1 Introdução
A informação sobre o modelo da população donde se extrai uma amostra constitui,
frequentemente, um problema estatístico. A forma da distribuição pode ser o objectivo da
investigação ou, então, (na inferência clássica) a informação acerca da forma deve ser postulada na
hipótese nula para que as conclusões sejam válidas.
A compatibilidade de um conjunto de valores observados com a distribuição normal ou
qualquer outra distribuição é analisada através dos testes de qualidade de ajustamento. Estes são
usados quando apenas a forma da população está em causa, na esperança de que a hipótese nula não
seja rejeitada. Esta constituirá uma afirmação acerca da forma da função distribuição da população
donde se extraiu a amostra. Preferencialmente, a distribuição em H0 deve ser completamente
especificada, incluindo todos os parâmetros. Se apenas for especificada alguma família de
distribuições, devem estimar-se os parâmetros desconhecidos (por um qualquer método de
estimação) partir dos dados amostrais, tendo em vista a realização do teste. Em ambos os casos, a
hipótese alternativa é bastante geral, incluindo diferenças apenas na localização e/ou dispersão e/ou
forma, pelo que a rejeição da hipótese nula não nos fornece (demasiada) informação específica.
Neste capítulo serão apresentados testes (não-paramétricos) que permitem verificar
hipóteses acerca da forma da distribuição da população de onde provém uma qualquer amostra, ou
avaliar se diferentes amostras são provenientes de uma população comum. Estes testes são
denominados por testes de qualidade de ajustamento.
3.2 Ajustamento de uma amostra a uma distribuição teórica
3.2.1 Teste de qui-quadrado
O teste qui-quadrado permite avaliar a aderência entre uma distribuição de frequências,
associada a uma amostra, constituída por observações expressas numa qualquer escala e uma
distribuição teórica. Os requisitos exigidos para a realização do teste são: amostra aleatória; e com
uma dimensão mínima adequada (esta questão será discutida mais adiante).
O teste qui-quadrado para a avaliação da qualidade de ajuste baseia-se na comparação da
distribuição dos dados amostrais com a distribuição teórica à qual se supõe pertencer a amostra. A
metodologia que se adopta no teste inclui os passos que se descrevem de seguida:
(i) As hipóteses nula e alternativa são formuladas nos seguintes termos:
Testes da qualidade de ajustamento
APONTAMENTOS DE ADPE © E. Esteves & C. Sousa, 2007. 68
:0H A população segue uma determinada distribuição teórica;
:1H A população não segue tal distribuição teórica.
(ii) As n observações que constituem a amostra são agrupadas em k classes (ou categorias)
não-sobreponíveis (com 2≥k ) e a amostra é constituída por dados quantitativos (não se
consideram, aqui, os dados qualitativos), isto é, “dados contínuos”, que serão agrupados
em classes que, a exemplo do que sucede na construção de histogramas, são de definição
relativamente arbitrária enquanto que para os “dados discretos”, as classes a considerar
corresponderão, naturalmente, às categorias nas quais os dados se encontram
classificados ou aos valores particulares que podem tomar.
(iii) Calculam-se as frequências absolutas das observações amostrais em cada classe i,
),,1( ki K= . Tais frequências, que se designam por frequências observadas, denotam-se
por in e satisfazem a condição, ∑=
=k
ii nn
1
(tamanho da amostra).
(iv) Determina-se a frequência das observações que se esperaria obter em cada classe i se a
hipótese nula fosse verdadeira, isto é, se os dados fossem provenientes de uma
determinada distribuição teórica conhecida. Tais frequências esperadas, que se denotam
por ein , são dadas por iei npn = , onde ip representa a probabilidade de, sendo 0H
verdadeira, a variável aleatória tomar valores pertencentes à classe i e n é o tamanho da
amostra. Note-se que, tal como as frequências observadas, também as frequências
esperadas satisfazem a condição, ∑=
=k
iei nn
1
.
(v) A estatística de teste é construída com base numa medida global de “ajustamento” entre
as frequências observadas na amostra, in , e as frequências esperadas, ein . Essa medida é
dada por
∑=
−=
k
i ei
eiiobs n
nn
1
22
.
)(χ .
Se 0H for verdadeira, devem registar-se pequenas diferenças entre as frequências
observadas e as frequências esperadas e, consequentemente, 2.obsχ deve tomar valores
baixos. Pelo contrário, um valor de 2 .obsχ elevado constitui um indício de que há um
desajuste entre a distribuição de frequências amostrais e teóricas. Pode demonstrar-se
que, quando 0H for verdadeira e a dimensão da amostra é grande, a estatística 2.obsχ
segue uma distribuição [ ]gl2χ , com [ ]pkgl −−= )1( graus de liberdade, onde k
Testes da qualidade de ajustamento
APONTAMENTOS DE ADPE © E. Esteves & C. Sousa, 2007. 69
representa o número de classes e p o número de parâmetros da distribuição populacional
estimados a partir da amostra.
(vi) Uma vez fixado o nível de significância α , a rejeição ou não rejeição de 0H será feita
com base na comparação entre o valor que a estatística de teste toma e [ ]12 −− pkαχ .
Dada a natureza da estatística 2.obsχ – tomando valores próximos de zero, se 0H for
verdadeira, e valores tanto mais positivos quanto mais 0H se afastar de 1H – o teste será
unilateral à direita e, consequentemente, o valor crítico, [ ]12 −− pkαχ , deverá ser
procurado na cauda direita da distribuição qui-quadrado16.
Sendo 0H verdadeira, a estatística 2 .obsχ terá uma distribuição tanto mais próxima da
distribuição [ ]12 −− pkαχ quanto maior for a dimensão da amostra e maiores forem os números de
observações esperadas nas diferentes classes )( ein . Como regra prática, para utilizar este teste:
• A dimensão da amostra deve ser não-inferior a 30 )30( ≥n ; e
• A frequência esperada em cada classe deve ser não-inferior a 5 )5( ≥ein .
Se esta última condição não prevalecer, o teste pode ainda ser utilizado, embora com
moderada confiança, se não mais de 20% dos valores de ein forem inferiores a 5 e nenhum for
inferior a 1. Quando tal não se verificar, procuram-se agregar classes adjacentes, de forma a obter
novas classes que satisfaçam esta condição.
Exemplo 3.1
Considerem-se os dados da Tabela 1.1, onde o modelo ajustado foi 74,3 14,9y x= + . Na regressão linear,
assume-se que os erros (resíduos) seguem, aproximadamente, uma distribuição normal com média zero e
variância constante ( 2σ ). Apesar do tamanho da amostra ser 20 30n = < , utilize-se o teste de qui-
quadrado para se verificar se ( )2~ 0,i Nε σ . Os erros do modelo de regressão apresentam-se na Tabela
3.1.
A hipótese a testar será ( )20 : ~ 0,iH Nε σ , cuja função densidade de probabilidade (f.d.p.) é
21
21( )
2
x
f x eµ
σ
πσ
− − = , com , e 0x IR IRµ σ∈ ∈ > , onde µ e σ são os parâmetros da distribuição
normal.
16 É possível, através da função distribuição 2χ , obter o valor da prova (p-value) com 1−− pk graus de liberdade da
estatística de teste 2 .obsχ . No Excel, usar a função =DIST.CHI(x, (k – 1) – p).
Testes da qualidade de ajustamento
APONTAMENTOS DE ADPE © E. Esteves & C. Sousa, 2007. 70
x y y ˆi i ie y y= −
1 0,99 90,01 89,08 0,93
2 1,02 89,05 89,53 -0,48
3 1,15 91,43 91,47 -0,04
4 1,29 93,74 93,57 0,17
5 1,46 96,73 96,11 0,62
6 1,36 94,45 94,61 -0,16
7 0,87 87,59 87,29 0,30
8 1,23 91,77 92,67 -0,90
9 1,55 99,42 97,45 1,97
10 1,40 93,65 95,21 -1,56
11 1,19 93,54 92,07 1,47
12 1,15 92,52 91,47 1,05
13 0,98 90,56 88,93 1,63
14 1,01 89,54 89,38 0,16
15 1,11 89,85 90,88 -1,03
16 1,20 90,39 92,22 -1,83
17 1,26 93,25 93,12 0,13
18 1,32 93,41 94,01 -0,60
19 1,43 94,98 95,66 -0,68
20 0,95 87,33 88,48 -1,15
Tabela 3.1 – Erros obtidos do ajustamento da regressão linear aos dados da Tabela 1.1
O primeiro passo será estimar estes dois parâmetros, recorrendo à média e desvio padrão amostrais (no
caso da distribuição normal, x e s constituem estimadores não-enviesados de µ e σ ). Da distribuição
amostral dos erros resulta a média 0,00x = ( ˆ 0,00µ = ) e o desvio-padrão 1,06s = ( ˆ 1,06σ = ) e,
consequentemente, a variância 2 1,12s = ( 2ˆ 1,12σ = ). Relembre-se que a variância poderia ser estimada
pela EMQ resultante da tabela ANOVA, neste caso 2ˆ 1,18EMQ σ= = (Tabela 1.4). Nestes termos, a
hipótese nula será ( )20 : ~ 0;1,06iH Nε , onde os dois parâmetros da distribuição foram estimados a partir
da amostra, daí que 2=p .
As 20n = observações (dados contínuos) deverão ser agrupadas em k classes. A construção das classes é
relativamente arbitrária. Pode-se, contudo, apontar o seguinte procedimento, como linha de orientação: a)
5k = , para 25n ≤ e k n≅ , para 25n > ou pela Fórmula de Sturges 1 3,322logk n≅ + ; ou b) a
amplitude das classes, h, pode ser dada por r
hk
= , onde r é a amplitude total dos dados, isto é, a diferença
entre o maior e o menor valor observados. Tal como no caso do número de classes, a amplitude das
Testes da qualidade de ajustamento
APONTAMENTOS DE ADPE © E. Esteves & C. Sousa, 2007. 71
classes deve ser aproximada para o maior inteiro. Neste exemplo, como 20n = , considere-se o número de
classes 5k = .
De seguida pretende-se conhecer os limites dessas classes sob 0H . Considere-se, então, a distribuição
( )20;1,06N (Figura 3.1).
Figura 3.1 – Gráfico da distribuição normal com média 0 e desvio-padrão 1,06.
Uma vez que
21
21( )
2
x
f x eµ
σ
πσ
− − = é uma f.d.p., sabe-se que a área sob curva é igual a 1 (soma de
todas as probabilidades, i.e. a probabilidade de X estar compreendido entre −∞ a +∞ ). Por conveniência,
vamos considerar a área total dividida em cinco partes iguais (ou seja, nº de classes = 5). Denotem-se as
abcissas que separam cada uma destas áreas, e que serão os limites das classes que se pretendem
conhecer, por 1x , 2x , 3x e 4x .
Para o cálculo de 1x , não é muito difícil entender que a área à esquerda de 1x será 20% da área total que é
1, ou seja, ( )1 0,20P X x< = . Supondo que 1z é o valor da (0,1)N que corresponde a 1x (de acordo
com a transformação de Gauss) tem-se (com 0,00µ = e desvio-padrão 1,06σ = ) que
1 11 1 1
01,06
1,06
x xz x z
µσ− −= = ⇔ =
Sendo 1z o valor da (0,1)N que corresponde a 1x ,
( ) ( )1 1 1( ) 0,20P Z z z P X x< = Φ = = <
onde ( )1 1( )z P Z zΦ = < é a função distribuição da norma reduzida (0,1)N 17. O nosso objectivo será,
portanto, calcular 1z (a abcissa correspondente à área 0,20), utilizando a função do Excel
17 No Excel será =DIST.NORMP( 1z ).
0
0.1
0.2
0.3
0.4
f(x)
-4 -2 2 4x
Testes da qualidade de ajustamento
APONTAMENTOS DE ADPE © E. Esteves & C. Sousa, 2007. 72
=INV.NORMP(0,20) 10,8416 z= − = , vindo, 1 11,06 1,06 ( 0,8416) 0,8901x z= = × − = − (ou então poderia
ter recorrer-se à tabela da distribuição normal reduzida)18. No caso do cálculo de 2x , 3x e 4x , por
raciocínio análogo ao anterior: uma vez que ( )2 0,40P X x< = <=> 2 00,4
1,06
x − Φ =
, então
=INV.NORM(0,40;0;1,06) = -0,2679; ( )3 0,6P X x< = obtém-se com =INV.NORM(0,60;0;1,06) = 0,2679; e
para obter ( )4 0,8P X x< = , vem que =INV.NORM(0,80;0;1,06) = 0,8901. Podemos, então, apresentar
numa tabela (Tabela 3.2) os dados agrupados em classes19.
Classes in ip ei in np=
[ [- ;-0,89∞ 5 0,2 4
[ [-0,89;-0,27 3 0,2 4
[ [-0,27;0,27 5 0,2 4
[ [0,27;0,89 2 0,2 4
[ [0,89;+ ∞ 5 0,2 4
Total 20 1 20
Tabela 3.2 – Valores observados e esperados por classes.
Como as frequência esperadas são todas inferiores a 5 (o que viola um dos pressupostos do teste), vamos
considerar apenas 4 classes, ou seja, 4k = . Obtém-se, por raciocínio análogo ao anterior, a seguinte
tabela
Classes
in ip ei in np=
[ [- ;-0,71∞ 5 0,25 5
[ [-0,71;0 5 0,25 5
[ [0;0,71 5 0,25 5
[ [0,71;+ ∞ 5 0,25 5
Total 20 1 20
Tabela 3.3 – Valores observados e esperados por classes
18 Usando a função =INV.NORM(prob., ˆ ˆ,µ σ ) do Excel obteríamos o valor directamente para 1x , isto é,
=INV.NORM(0,20;0;1,06)= -0,8901 (atenção ao arredondamento do desvio-padrão). 19 Obviamente as probabilidades para cada classe sob 0H , isto é, se os erros seguirem uma distribuição ( )20;1,06N
são todas iguais a 0,2, facto que tem a ver com a maneira como foram construídas as classes.
Testes da qualidade de ajustamento
APONTAMENTOS DE ADPE © E. Esteves & C. Sousa, 2007. 73
Sendo assim, 2
2.
1
( )0
ki ei
obsi ei
n n
nχ
=
−= =∑ (com p-value 1= , que se obtém no Excel com
=DIST.CHI( 2.obsχ , ( 1)k p− − ))20 ou seja, não se rejeita ( )2
0 : ~ 0;1,06iH Nε . Nestes termos, tomando por
base os dados da amostra, não temos razões para afirmar que a suposição ( )2~ 0,i Nε σ esteja
incorrecta, ou seja, os erros não violam esta hipótese subjacente ao modelo de regressão. Deve, contudo,
ter-se em conta que o tamanho da amostra é 20 30n = < , ou seja, o teste de qui-quadrado deve ser
utilizado com moderada confiança. Deve-se, portanto, utilizar um teste mais seguro como é o caso do teste
Kolmogorov-Smirnov o qual se apresenta da próxima secção.■
Exemplo 3.2
Numa experiência com ervilhas, observaram-se 315 lisas e amarelas (LA), 108 lisas e verdes (LV), 101
estriadas e amarelas (EA), 32 estriadas e verdes (EV). De acordo com a teoria da hereditariedade de
Mendel, os números deveriam apresentar-se na proporção 9:3:3:1. Pode-se usar o teste de qui-quadrado,
com um determinado nível de significância, para se verificar se os resultados obtidos na experiência (as
observações) estão de acordo com a teoria de Mendel. Sendo assim, as hipóteses a testar são:
0 :H As observações estão de acordo com a teoria da hereditariedade de Mendel;
1 :H As observações não estão de acordo com a teoria da hereditariedade de Mendel.
Para se utilizar o teste de qui-quadrado devem calcular-se as frequências esperadas para os diferentes
tipos de ervilhas sob a hipótese nula (as proporções referentes à teoria de Mendel seguem determinada
distribuição discreta). Seja in o número de ervilhas observadas (de cada tipo) e ein o respectivo número
esperado de ervilhas (que seguem a proporção da Teoria de Mendel), com 1,2,3,4i = (para LA, LV, EA e
EV, respectivamente). Então pode-se construir a seguinte tabela:
Tipo de ervilhas
Frequências LA LV EA EV
in 315 108 101 32
ein 312,75 104,25 104,25 34,75
Tabela 3.4 – Valores observados e esperados numa experiência com ervilhas.
Para calcular as frequências esperadas, sabe-se que o número total de observações (de ervilhas) é
4
1 2 3 41
315 108 101 32 556ii
n n n n n=
= + + + = + + + =∑ ,
20 Caso os dois parâmetros não tivessem sido estimados a partir da amostra, ou seja a hipótese nula estaria completamente especificada, o número de graus de liberdade seria 1−= kgl .
Testes da qualidade de ajustamento
APONTAMENTOS DE ADPE © E. Esteves & C. Sousa, 2007. 74
Como as frequências esperadas (sob 0H ) estão na proporção 9:3:3:1, ou seja, 9 3 3 1 16+ + + = , então:
1
9 556312,75
16en×= = serão ervilhas do tipo LA, que resulta da “regra de três simples” 165569 =ein ;
2 3
3 556104,25
16e en n×= = = serão ervilhas dos tipos LV e EA; e 4
1 55634,75
16en×= = ervilhas do serão
do tipo EV. Donde a estatística do teste será
2 2 2 2 22
.1
( ) (315 312,75) (108 104,25) (101 104,25) (32 34,75)=0,470
312,75 104,25 104,25 34,75
ki ei
obsi ei
n n
nχ
=
− − − − −= = + + +∑
Como há quatro categorias, i.e. 4k = , o número de graus de liberdade será 1 4 1 3gl k= − = − = .
Comparando o valor da estatística de teste com [ ]20,05 3 7,8147χ = , não se rejeita a hipótese nula de que
as observações estejam de acordo com a teoria da hereditariedade de Mendel. Repare-se que o p-
value 0,9254= (embora a concordância seja boa, os resultados obtidos poderão estar sujeitos a erros de
amostragem).■
3.2.2 Teste de Kolmogorov-Smirnov
O Teste de Kolmogorov-Smirnov (abreviadamente K-S) de qualidade de ajuste deve o seu
nome aos matemáticos russos Andrei N. Kolmogorov [1903-1987] e Nicolai V. Smirnov [n. 1900].
Podem ser apontadas duas vantagens deste teste em relação ao teste qui-quadrado, que acaba de ser
apresentado. Em primeiro lugar, quando a distribuição populacional é contínua e se conhecem a
forma e os parâmetros da sua função densidade de probabilidade, a distribuição da estatística do
teste é definida rigorosamente (ao contrário do que sucede com a estatística 2 .obsχ , cuja distribuição
é aproximada). Esta vantagem é tanto mais nítida quanto menor for a dimensão da amostra. Em
segundo lugar, o teste K-S é, na maioria das situações, mais potente do que o teste qui-quadrado.
Em contrapartida, o teste K-S exige distribuições populacionais contínuas e completamente
especificadas (o que não sucede com o teste do qui-quadrado), bem como um maior esforço
computacional.
Para uma v.a. X, o teste K-S tem por base a análise da proximidade ou, se se preferir, do
ajustamento entre a função de distribuição empírica ou da amostra, )(xS , e a função de distribuição
populacional (teórica), )(0 xF , que é admitida em 0H . Para uma amostra de tamanho n, a função
)(xS expressa a soma das frequências relativas dos dados com valores menores ou iguais a x, um
qualquer valor particular x da variável X. Sendo ( )nXXX ,,, 21 K uma amostra aleatória de uma
população contínua X e )()2()1( ,,, nXXX K a respectiva amostra ordenada, tem-se que, a função
Testes da qualidade de ajustamento
APONTAMENTOS DE ADPE © E. Esteves & C. Sousa, 2007. 75
distribuição empírica S(x) é dada por
(1)
( ) ( 1)
( )
0 ,
( ) , ( 1,2, , 1)
1 ,
k k
n
x X
kS x X x X k n
nx X
+
<= ≤ ≤ = −
≥
K
A função de distribuição empírica, )(xS , é, pois, uma função em degrau que cresce 1 n nos pontos
de salto (estatísticas ordinais da amostra)21.
A estatística de teste, que se denota por .obsD (que é uma variável aleatória), corresponde ao
supremo (ou máximo) da diferença, em valor absoluto, entre )(xS e )(0 xF , quando são
considerados todos os valores possíveis de X. Em notação simbólica,
. 0max ( ) ( )obsx
D S x F x= − .
É possível demonstrar que, se a amostra é aleatória e provém de uma distribuição contínua
conhecida, a estatística .obsD só depende da dimensão da amostra, n, sendo irrelevante a forma da
função distribuição da população, )(0 xF . Esta é a razão pela qual .obsD é considerada uma
estatística “distribution-free”.
No teste K-S de qualidade de ajuste adopta-se o procedimento que se descreve em seguida:
(i) As hipóteses nula e alternativa são formuladas nos seguintes termos: )()( : 00 xFxFH = ,
para todos os valores de X, ou seja, a função de distribuição da população da qual
provém a amostra é idêntica a uma função de distribuição que se assume conhecida,
)(0 xF ; versus )()( : 01 xFxFH ≠ para algum valor de X.
(ii) Uma vez determinada a função de distribuição empírica, )(xS , calcula-se .obsD . O
máximo de )()( 0 xFxS − não é necessariamente o maior valor que )()( 0 xFxS − toma
quando se consideram apenas os valores observados de X. De facto, dados que a função
)(0 xF é contínua e )(xS é uma função em escada, o valor máximo daquela diferença
absoluta deve ser procurado na vizinhança de cada valor observado de X. O valor
observado .obsd , da variável aleatória .obsD , será, pois, o maior dos valores seguintes:
. 1 0( ) ( )obs i iD S x F x−−= − e . 0( ) ( )obs i iD S x F x+ = − , ni ≤≤1 .
(iii) O valor de .obsD é comparado com o respectivo valor crítico de [ ]nDα , uma vez
21 Deve-se ter em conta a frequência absoluta de cada observação, pois estas estão directamente relacionadas com os saltos da função.
Testes da qualidade de ajustamento
APONTAMENTOS DE ADPE © E. Esteves & C. Sousa, 2007. 76
especificado o nível de significância do teste. Deverá rejeitar-se 0H , sempre que
αddobs >. . O valor crítico da estatística de K-S pode ser obtido a partir das respectivas
tabelas (Tabelas 3.11 a 3.17). Note-se que, como a estatística .obsD é calculada com base
no módulo da diferença entre )(xS e )(0 xF , não distinguindo entre valores positivos e
negativos, os valores críticos de .obsD devem ser procurados na cauda direita da sua
distribuição.
Tal como se afirmou atrás, o teste K-S é exacto (ou seja, o risco α está definido
rigorosamente) quando a função )(0 xF se encontra perfeitamente especificada e, em particular,
quando se conhecem os respectivos parâmetros. O teste pode, no entanto, ser utilizado quando os
parâmetros de )(0 xF são estimados a partir da amostra. Porém, nestas circunstâncias deverá ter-se
em conta que o nível de significância com que se realiza o teste é menor do que aquele que é
especificado e que a potência do teste também diminui de uma quantidade não-conhecida. ara
ultrapassa esta limitação do teste K-S, H. Lilliefors estudou o comportamento da estatística .obsD
nas situações em que a distribuição populacional é normal ou exponencial negativa, mas em que os
seus parâmetros são estimados a partir dos dados amostrais. Na Tabela 3.13 apresentam-se os
valores críticos da estatística .obsD para o caso da distribuição normal.
Exemplo 3.3
Retomando o exemplo 3.1, onde se estudou o ajustamento de uma distribuição normal ( )20;1,06N aos
resíduos resultantes do modelo 74,3 14,9y x= + (ajustado aos dados da Tabela 1.1). Não obstante o
tamanho da amostra ser 20 30n = < , utilizou-se um teste de qui-quadrado para se verificar a qualidade do
ajustamento, não se tendo rejeitado a hipótese nula.
Vamos agora utilizar um teste Kolmogorov-Smirnov (K-S) para testar, de forma mais apropriada, a hipótese
( )20 : ~ 0;1,06iH Nε . Para este teste não se procede ao agrupamento dos dados em classes. Depois de
se terem ordenados os resíduos, constrói-se a distribuição de frequências absolutas ( if ) e de frequências
absolutas acumuladas ( iF ) a partir das quais se obtém a função de distribuição empírica
( ) ( 1)( ) ,ii i
FS x X x X
n += ≤ < (neste caso o saltos da função serão dados por if
n).
Testes da qualidade de ajustamento
APONTAMENTOS DE ADPE © E. Esteves & C. Sousa, 2007. 77
A determinação de 0( )F x 22 sob 0H é feita através da função de distribuição da normal, que no Excel
corresponde a fazer =DIST.NORM( ie , ˆ ˆ,µ σ ,VERDADEIRO) com 1,2, ,i n= K , ou então, pode-se
estandardizar os resíduos, através de id dado por (2.44), para uma (0,1)N , cujos valores se encontram
tabelados, ou através do Excel fazendo =DIST.NORMP( id ). Após a determinação dos valores das colunas
( )S x e 0( )F x , determinam-se . 0( ) ( )obs i iD S x F x+ = − e . 1 0( ) ( )obs i iD S x F x−−= − , ni ≤≤1 (Tabela 3.5).
O valor mais elevado das duas últimas colunas nessa tabela será o valor da estatística de teste, ou seja,
0884,0. =obsd . Como os parâmetros da distribuição foram estimados a partir da amostra (ver exemplo
3.1), para a obtenção do valor crítico, vamos utilizar a Tabela 3.13 (de Lilliefors). Verifica-se que
[ ]0,05 20 0,190D = > 0884,0. =obsd , o que leva à não-rejeição de 0H e portanto não se pode rejeitar que
( )206,1;0~ Niε , conclusão idêntica à alcançada pelo teste de qui-quadrado.■
ie if iF ( )S x 0( )F x .obsD+ .obsD−
-1,83 1 1 0,05 0,0418 0,0082 0,0418
-1,56 1 2 0,1 0,0702 0,0298 0,0202
-1,15 1 3 0,15 0,1385 0,0115 0,0385
-1,03 1 4 0,2 0,1651 0,0349 0,0151
-0,9 1 5 0,25 0,1975 0,0525 0,0025
-0,68 1 6 0,3 0,2602 0,0398 0,0102
-0,6 1 7 0,35 0,2853 0,0647 0,0147
-0,48 1 8 0,4 0,3250 0,0750 0,0250
-0,16 1 9 0,45 0,4399 0,0101 0,0399
-0,04 1 10 0,5 0,4849 0,0151 0,0349
0,13 1 11 0,55 0,5489 0,0011 0,0489
0,16 1 12 0,6 0,5601 0,0399 0,0101
0,17 1 13 0,65 0,5638 0,0862 0,0362
0,3 1 14 0,7 0,6116 0,0884 0,0384
0,62 1 15 0,75 0,7211 0,0289 0,0211
0,93 1 16 0,8 0,8103 0,0103 0,0603
1,05 1 17 0,85 0,8395 0,0105 0,0395
1,47 1 18 0,9 0,9176 0,0176 0,0676
1,63 1 19 0,95 0,9383 0,0117 0,0383
1,97 1 20 1 0,9687 0,0313 0,0187
Tabela 3.5 – Cálculos necessários à obtenção do valor da estatística de K-S
22 Atente-se que 0( )1,06
ieF x
= Φ
.
Testes da qualidade de ajustamento
APONTAMENTOS DE ADPE © E. Esteves & C. Sousa, 2007. 78
3.2.3 Comparação entre os dois testes
O teste de 2χ é especificamente destinado a casos com dados classificados enquanto o teste
de K-S será usado apenas para amostras aleatórias extraídas de populações contínuas. Todavia,
quando os dados não estão classificados estes dois testes de ajustamento podem ser utilizados
indistintamente se os requisitos básicos exigidos à aplicação de cada um forem satisfatórios. A
breve comparação feita a seguir apenas se ajusta ao caso de dados não-classificados.
Sendo contínua a distribuição postulada (teórica), o teste de K-S permite examinar a
qualidade do ajustamento para cada uma das n estatísticas ordinais; o teste de 2χ apenas faz isso
para nk ≤ classes. Neste sentido o teste de K-S faz um uso mais completo dos dados disponíveis
não se perdendo tanta informação como no teste de 2χ .
Outra das vantagens do teste de K-S, reside no facto da distribuição de amostragem .obsD ser
exacta (conhecida e tabelada), enquanto a distribuição de 2.obsχ é aproximadamente 2χ quando
+∞→n .
Por outro lado, o teste de K-S pode ser aplicado a amostras de qualquer tamanho, enquanto a
estatística de 2χ só deve ser utilizada para n grande e para frequências esperadas em cada classe
não demasiadamente pequenas )5( ≥ein .
Por fim, no caso da função de distribuição teórica ser discreta, poderão existir problemas na
utilização do teste K-S.
3.3 Ajustamento entre duas amostras independentes
3.3.1 Teste de qui-quadrado
O teste de qui-quadrado utilizado na comparação de duas amostras independentes pode ser
considerado como uma extensão do teste de qui-quadrado de qualidade de ajustamento de uma
amostra a uma distribuição teórica. A situação que será abordada nesta secção difere da que foi
estudada anteriormente pelo facto do objectivo ser, agora, a comparação entre duas populações a
partir das quais se obtêm amostras independentes. Tal como anteriormente, apenas se requer que as
amostras sejam aleatórias e tenham dimensões adequadas.
A metodologia deste teste de qui-quadrado, que se descreve de seguida, é muito semelhante
à que foi apresentada anteriormente, nomeadamente:
(i) Denotando por A e B as populações a partir das quais se obtêm as amostras, as hipóteses
Testes da qualidade de ajustamento
APONTAMENTOS DE ADPE © E. Esteves & C. Sousa, 2007. 79
nulas e alternativas são formuladas nos seguintes termos: :0H As populações A e B são
idênticas vs :1H As populações A e B são não idênticas23.
(ii) As An e Bn observações que constituem as amostras retiradas das populações A e B, são
agrupadas em k classes (ou categorias) não-sobreponíveis (com 2≥k );
(iii) Para cada amostra, determinam-se as frequências observadas em cada classe i, iAn e iBn
),,1( ki K= ;
(iv) As frequências esperadas, eiAn e eiBn , são calculadas no pressuposto de que 0H é
verdadeira, do modo que se segue (o procedimento acima referido esta sumariado na
Tabela 3.6, página seguinte):
a. Denote-se por n o número total de observações ( BA nnn += ) e por •in a frequência
das observações na classe i ( iBiAi nnn +=• ).
b. Como se admite que 0H é verdadeira, a probabilidade de uma observação ser
classificada na classe i (uma observação se encontrar na classe i) pode ser estimada
por n
ni• .
c. Consequentemente, a frequência esperada de observações referentes à população A
na classe i será n
nnn i
AeiA•= .
d. As frequências esperadas eiBn , são obtidas de forma análoga ou, mais simplesmente,
pela subtracção24 i eiAn n• − , já que ( ) ieiB A i eiA
nn n n n n
n•
•= − = − .
(v) A estatística de teste é uma medida global do ajustamento entre as frequências
observadas nas amostras e as respectivas frequências esperadas. Tal medida é dada por
2 22
.1 1
( ) ( )k kiA eiA iB eiB
obsi ieiA eiB
n n n n
n nχ
= =
− −= +∑ ∑
23 Estas hipóteses podem tomar a seguinte forma equivalente: :0H )()( xFxF BA = , para todo o x versus
:1H )()( xFxF BA ≠ , para algum x (Com )(xFA e )(xFB representando as funções de distribuição das populações
A e B). 24 Pode-se verificar que das 2k frequências esperadas apenas 1k − são independentes, isto é, a partir de 1k − frequências esperadas quaisquer podem ser obtidas por subtracção as restantes frequências esperadas, já que
1
k
eiA Ai
n n=
=∑ e 1
k
eiB Bi
n n=
=∑
Testes da qualidade de ajustamento
APONTAMENTOS DE ADPE © E. Esteves & C. Sousa, 2007. 80
Frequências observadas Frequências esperadas
Classe A B Total eiAn eiBn
1 1An 1Bn 1n • 1A
nn
n• 1 1e An n• −
2 2An 2Bn 2n • 2A
nn
n• 2 2e An n• −
M M M M M M
k kAn kBn kn • kA
nn
n• k ekAn n• −
Total An Bn n An Bn
Tabela 3.6 – Cálculo das frequências esperadas para o teste de qui-quadrado para duas amostras independentes.
(vi) Se 0H for verdadeira, pode demonstrar-se que, para amostras de grande dimensão, 2 .obsχ
segue uma distribuição qui-quadrado com 1gl k= − graus de liberdade (uma vez que só
existem 1k − termos independentes nos somatórios da expressão da estatística de teste).
(vii) Fixado o nível de significância α , a rejeição ou não rejeição de 0H será feita com
base na comparação entre o valor que a estatística de teste toma e o valor crítico
[ ]2 1kαχ − . Tal como no teste de qui-quadrado apresentado anteriormente, este teste é
unilateral à direita, pelo que o valor crítico deverá ser procurado na cauda direita da
distribuição qui-quadrado.
Como a estatística de teste terá uma distribuição tanto mais próxima da distribuição
[ ]2 1kαχ − quanto maior forem as dimensões das amostras, o teste deve ser conduzido seguindo as
mesmas recomendações que foram apresentadas a propósito do teste de qui-quadrado discutido na
secção3.2.1. Note-se apenas que, quando houver necessidade de agregar classes adjacentes numa
das amostras, tal operação deve ser igualmente executada na outra.
Exemplo 3.4
Um fabricante de pêssegos em calda produz diferentes qualidades deste produto e pretende verificar se o
modo como se repartem as vendas da sua marca tendo em conta a qualidade do produto é idêntico nos
hipermercados A e B. Na Tabela 3.7 apresenta-se a composição das vendas nestes mercados ao longo do
último ano.
Testes da qualidade de ajustamento
APONTAMENTOS DE ADPE © E. Esteves & C. Sousa, 2007. 81
Qualidade Hipermercado A Hipermercado B Total
Baixa 1034 2225 3259
Média-baixa 892 2103 2995
Média 734 1754 2488
Média-alta 280 685 965
Alta 80 202 282
Luxo 26 32 58
Total 3046 7001 10047
Tabela 3.7 – Composição das vendas de pêssego em calda nos hipermercados A e B
Denotando por A e B as populações referentes à composição das vendas do produto nos hipermercados A
e B, respectivamente, obtém-se (os cálculos necessários apresentam-se na Tabela 3.8):
2 2 2
1
( ) (1034 988,0) (26 17,6)... 7,856
988,0 17,6
kiA eiA
i eiA
n n
n=
− − −= + + =∑
e
2 2 2
1
( ) (2225 2271,0) (32 40,4)... 3,425
2271,0 40,4
kiB eiB
i eiB
n n
n=
− − −= + + =∑
Sendo que a estatística de teste é
2 22
.1 1
( ) ( )7,856 3,425 11,281
k kiA eiA iB eiB
obsi ieiA eiB
n n n n
n nχ
= =
− −= + = + =∑ ∑
Considerando um nível significância 0,05α = , é possível verificar, a partir da função do Excel, que
[ ]20,05 5 11,07χ = . Como [ ]2 2
. 0,0511,281 5 11,07obsχ χ= > = rejeita-se 0H ao nível de significância de 5%,
ou seja, há indícios de que as vendas do produto em causa, tendo em conta as diferentes qualidades,
diferem nos dois hipermercados (a análise da Tabela 3.7 pode dar uma ideia deste facto, mas atenção às
proporções…). Neste caso o p-value é 4,6%. ■
k iAn iBn Total eiAn eiBn
1 1034 2225 3259 988,0 2271,0
2 892 2103 2995 908,0 2087,0
3 734 1754 2488 754,3 1733,7
4 280 685 965 292,6 672,4
5 80 202 282 85,5 196,5
6 26 32 58 17,6 40,4
Total 3046 7001 10047 3046,0 7001,0
Tabela 3.8 – Cálculo das frequências esperadas necessárias para a obtenção da estatística de qui-quadrado
Testes da qualidade de ajustamento
APONTAMENTOS DE ADPE © E. Esteves & C. Sousa, 2007. 82
3.3.3 Teste de Kolmogorov-Smirnov
Admita-se agora que se pretende avaliar se duas amostras aleatórias independentes provêm
de uma única população contínua ou, equivalentemente, se provêm de duas populações contínuas
idênticas.
Denotem-se por ( )AF x e ( )BF x as funções de distribuição associadas às populações A e B,
respectivamente. A estrutura deste teste K-S, que é semelhante à do teste K-S discutido
anteriormente, é a seguinte:
(i) As hipóteses nula e alternativa são 0 : ( ) ( )A BH F x F x= , para todo o x (ou seja, as duas
amostras provêm de populações com a mesma função distribuição) versus
1 : ( ) ( )A BH F x F x≠ , para algum x (teste bilateral)25.
(ii) Uma vez determinadas as funções de distribuição das amostras ( )AS x e ( )BS x , calcula-
se a estatística de teste .obsD , tal que
. max ( ) ( )obs A Bx
D S x S x= −
Note-se que se recorre à estatística .obsD tanto no caso do teste ser bilateral como no caso
do teste ser unilateral.
(iii) Uma vez especificado o nível de significância do teste, o valor de .obsD é comparado
com o respectivo valor crítico de αD , e, em função do resultado, 0H é ou não rejeitada.
A distribuição de .obsD é conhecida de forma exacta quando 0H é verdadeira e ambas as
distribuições populacionais são consideradas contínuas. Deverá rejeitar-se 0H , sempre
que αddobs >. . Na Tabela 3.14 apresentam-se os valores da distribuição da estatística
.A B obsn n D⋅ ⋅ (onde An e Bn representam as dimensões das duas amostras).
Exemplo 3.5
O departamento de engenharia alimentar da universidade do Algarve foi seleccionado para uma experiência
piloto na qual se pretende testar novos procedimentos. Na Tabela 3.9 apresentam-se valores do tempo
despendido no processamento de uma determinada operação, antes e depois de terem sido introduzidos
novos procedimentos.
25 No caso de fazer sentido um teste unilateral, a hipótese alternativa virá: )()(:1 xFxFH BA > ou
)()(:1 xFxFH BA < para algum x.
Testes da qualidade de ajustamento
APONTAMENTOS DE ADPE © E. Esteves & C. Sousa, 2007. 83
Antes 4,1 4,4 4,7 4,8 4,9 5,7 7,4 7,6 9,7 10,3 12,4 15,5
Depois 3,8 5,0 6,3 6,6 6,7 6,9 8,5 8,6 8,9 9,5 9,8 10,2
Tabela 3.9 – Tempos de processamento, em minutos.
Estes valores, seleccionados aleatoriamente, foram obtidos a partir de cronometragem. Será que os dados
sustentam a hipótese de que a distribuição do tempo de processamento se modificou com a introdução dos
novos procedimentos? Na resposta a esta questão utilizar-se-á o teste K-S de ajustamento entre duas
amostras independentes.
Para testar as hipóteses: 0 : ( ) ( )A BH F x F x= para todo o x (em que A e B denotam, respectivamente, as
situações anterior e posterior à adopção dos novos procedimentos) versus 1 : ( ) ( )A BH F x F x≠ para algum
x, obtém-se a estatística de teste
.
40,(3)
12obsD = = ,
que foi calculada como se indica na Tabela 3.10. Note-se que, contrariamente ao que sucedia no teste K-S
discutido na secção 3.2.2, agora basta calcular as diferenças absolutas para os valores observados de X
numa ou noutra amostra ( ) ( )A BS x S x− e escolher o valor máximo de tais diferenças absolutas.
X ( )AS x ( )BS x ( ) ( )A BS x S x− 3,8 0 1/12 1/12
4,1 1/12 1/12 0
4,4 2/12 1/12 1/12
4,7 3/12 1/12 2/12
4,8 4/12 1/12 3/12
4,9 5/12 1/12 4/12
5,0 5/12 2/12 3/12
5,7 6/12 2/12 4/12
6,3 6/12 3/12 3/12
(…) (…) (…) (…)
8,6 8/12 8/12 0
8,9 8/12 9/12 1/12
9,5 8/12 10/12 2/12
9,7 9/12 10/12 1/12
9,8 9/12 11/12 2/12
10,2 9/12 12/12 3/12
10,3 10/12 12/12 2/12
12,4 11/12 12/12 1/12
15,5 12/12 12/12 0
Tabela 3.10 – Excerto dos cálculos envolvidos num teste K-S para duas amostras independentes
Testes da qualidade de ajustamento
APONTAMENTOS DE ADPE © E. Esteves & C. Sousa, 2007. 84
De acordo com a Tabela 3.16, para um nível de significância 0,05α = e 12A Bn n= = vem
. 84A B obsn n D⋅ ⋅ = , donde resulta
0,05
840,583
144d = = .
Como
. 0,05
40,(3) 0,583
12obsd d= = < = ,
a hipótese nula não é rejeitada com um nível de significância de 5%. Podemos pois concluir, com 95% de
confiança, que os dados sustentam a hipótese de que a distribuição do tempo de processamento não se
modificou com a introdução dos novos procedimentos.■
Na Tabela 3.11 apresentam-se os valores críticos da distribuição da estatística
0max ( ) ( )x
D S x F x= − para amostras de dimensão n e níveis de significância α . Para amostras de
grandes dimensões ( 40n > ), os valores críticos de Dα podem ser aproximados pelas expressões
apresentadas na Tabela 3.12. Valores críticos da estatística 0max ( ) ( )x
D S x F x= − , segundo
Lilliefors, para populações normais e parâmetros estimados a partir de amostras de dimensão n,
podem obter-se da Tabela 3.13.
Nas Tabelas 3.14 e 3.15 apresentam-se os valores críticos Dα , sob a forma .A B obsn n D⋅ ⋅ ,
para situações em que a dimensão das amostras A e B é diferente. Os valores p nessas tabelas
referem-se à probabilidade na cauda direita da distribuição da estatística .A B obsn n D⋅ ⋅ (com
. max ( ) ( )obs A Bx
D S x S x= − ), para amostras com dimensões An e Bn (satisfazendo 2 12A Bn n≤ ≤ ≤ e
16A Bn n+ ≤ ) de duas populações A e B, isto é, .Pr( )A B A B obsn n D n n Dα⋅ ⋅ > ⋅ ⋅ . Em testes unilaterais
deverá considerar-se p/2 (os valores de .obsD assim calculados serão correctos se p for pequeno).
Valores críticos da distribuição da estatística .A B obsn n D⋅ ⋅ para amostras com dimensões tais
que 9 20A Bn n≤ = ≤ (os valores de α indicados para testes unilaterais são aproximados)
apresentam-se na Tabela 3.16.
Para amostras cujas dimensões não estão contempladas nos quadros anteriores, os valores
críticos da distribuição da estatística de teste podem ser aproximados através das expressões que
constam da Tabela 3.17 (com A Bn n n= + ).
Testes da qualidade de ajustamento
APONTAMENTOS DE ADPE © E. Esteves & C. Sousa, 2007. 85
Níveis de significância α Níveis de significância α
n 0,20 0,10 0,05 0,02 0,01 n 0,20 0,10 0,05 0,02 0,01
1 0,900 0,950 0,975 0,990 0,995 (…)
2 0,684 0,776 0,842 0,900 0,929 21 0,226 0,259 0,287 0,321 0,344
3 0,565 0,636 0,708 0,785 0,829 22 0,221 0,253 0,281 0,314 0,337
4 0,493 0,565 0,624 0,689 0,734 23 0,216 0,247 0,275 0,307 0,330
5 0,447 0,509 0,563 0,627 0,669 24 0,212 0,242 0,269 0,301 0,323
6 0,410 0,468 0,519 0,577 0,617 25 0,208 0,238 0,264 0,295 0,317
7 0,381 0,436 0,483 0,538 0,576 26 0,204 0,233 0,259 0,290 0,311
8 0,358 0,410 0,454 0,407 0,542 27 0,200 0,229 0,254 0,284 0,305
9 0,339 0,387 0,430 0,480 0,513 28 0,197 0,225 0,250 0,279 0,300
10 0,323 0,369 0,409 0,457 0,489 29 0,193 0,221 0,246 0,275 0,295
11 0,308 0,352 0,391 0,437 0,468 30 0,190 0,218 0,242 0,270 0,290
12 0,296 0,338 0,375 0,419 0,449 31 0,187 0,214 0,238 0,266 0,285
13 0,285 0,325 0,361 0,404 0,432 32 0,184 0,211 0,234 0,262 0,281
14 0,275 0,314 0,349 0,390 0,418 33 0,182 0,208 0,231 0,258 0,277
15 0,266 0,304 0,338 0,377 0,404 34 0,179 0,205 0,227 0,254 0,273
16 0,258 0,295 0,327 0,366 0,392 35 0,177 0,202 0,224 0,251 0,269
17 0,250 0,286 0,318 0,355 0,381 36 0,174 0,199 0,221 0,247 0,265
18 0,244 0,279 0,309 0,346 0,371 37 0,172 0,196 0,218 0,244 0,262
19 0,237 0,271 0,301 0,337 0,361 38 0,170 0,194 0,215 0,241 0,258
20 0,232 0,265 0,294 0,329 0,352 39 0,168 0,191 0,213 0,238 0,255
(…) 40 0,165 0,189 0,210 0,235 0,252
Tabela 3.11 – Valores críticos da distribuição da estatística Dα de K-S para uma amostra.
Níveis de significância ( α ) 0,20 0,10 0,05 0,02 0,01
1,07
n
1,22
n
1,36
n
1,52
n
1,63
n
Tabela 3.12 – Expressões de aproximação para os valores críticos da distribuição da estatística de K-S para mostras de grandes dimensões (i.e. n>40)26.
26 As expressões apresentadas na Tabela 3.12 obtêm-se a partir de [ ]n
nD
−=
αα
2
1ln
.
Testes da qualidade de ajustamento
APONTAMENTOS DE ADPE © E. Esteves & C. Sousa, 2007. 86
Dimen sões Níveis de significância ( α )
n 0,20 0,15 0,10 0,05 0,01
4 0,300 0,319 0,352 0,381 0,417
5 0,285 0,299 0,315 0,337 0,405
6 0,265 0,277 0,294 0,319 0,364
7 0,217 0,253 0,276 0,300 0,348
8 0,233 0,244 0,261 0,285 0,331
9 0,223 0,233 0,249 0,271 0,311
10 0,215 0,224 0,239 0,258 0,294
11 0,206 0,217 0,230 0,249 0,284
12 0,199 0,212 0,223 0,242 0,275
13 0,190 0,202 0,214 0,234 0,268
14 0,183 0,194 0,207 0,227 0,261
15 0,177 0,187 0,201 0,220 0,257
16 0,173 0,182 0,195 0,213 0,245
17 0,169 0,177 0,189 0,206 0,239
18 0,166 0,173 0,184 0,200 0,235
19 0,163 0,169 0,179 0,195 0,231
20 0,160 0,166 0,174 0,190 0,203
25 0,149 0,153 0,165 0,180 0,187
30 0,131 0,136 0,144 0,161 1,031
>30 0,730
n
0,768
n
0,805
n
0,886
n
1,031
n
Tabela 3.13 – Valores críticos da distribuição da estatística Dα de K-S, segundo Lilliefors, nos casos de
populações normais.
Testes da qualidade de ajustamento
APONTAMENTOS DE ADPE © E. Esteves & C. Sousa, 2007. 87
nA nB nA · nB · Dobs p nA nB nA · nB · Dobs p nA nB nA · nB · Dobs p
2 2 4 0,333 3 6 18 0,02 4 5 20 0,016
2 3 6 0,200 15 0,09 16 0,079
2 4 8 0,133 12 0,33 15 0,143
2 5 10 0,095 3 7 21 0,01 4 6 24 0,100
8 0,286 18 0,06 20 0,048
2 6 12 0,071 15 0,16 18 0,095
10 0,214 3 8 24 0,01 16 0,181
2 7 14 0,056 21 0,04 4 7 28 0,006
12 0,167 18 0,12 24 0,030
2 8 16 0,044 3 9 27 0,00 21 0,067
14 0,133 24 0,03 20 0,121
2 9 18 0,036 21 0,09 4 8 32 0,004
16 0,109 18 0,23 28 0,020
2 10 20 0,030 3 10 30 0,00 24 0,085
18 0,091 27 0,02 20 0,222
16 0,182 24 0,07 4 9 36 0,003
2 11 22 0,026 21 0,14 32 0,014
20 0,077 3 11 33 0,00 28 0,042
18 0,154 30 0,02 27 0,062
2 12 24 0,022 27 0,05 24 0,115
22 0,066 24 0,11 4 10 40 0,002
20 0,132 3 12 36 0,00 36 0,010
3 3 9 0,100 33 0,01 32 0,030
3 4 12 0,057 30 0,04 30 0,046
9 0,229 27 0,08 28 0,084
3 5 15 0,036 24 0,18 26 0,126
12 0,143 4 4 16 0,02
12 0,22
Tabela 3.14 – Distribuição da estatística .A B obsn n D⋅ ⋅ de K-S para duas amostras independentes.
Testes da qualidade de ajustamento
APONTAMENTOS DE ADPE © E. Esteves & C. Sousa, 2007. 88
nB nA · nB · Dobs p nA nB nA · nB · Dobs p nA nB nA · nB · Dobs p
4 11 44 0,001 5 10 50 0,001 6 10 60 0,000
40 0,007 45 0,004 54 0,002
36 0,022 40 0,019 50 0,004
33 0,035 35 0,061 48 0,009
32 0,063 30 0,166 44 0,019
29 0,098 5 11 55 0,000 42 0,031
28 0,144 50 0,003 40 0,042
4 12 48 0,001 45 0,010 38 0,066
44 0,005 44 0,014 36 0,092
40 0,016 40 0,029 34 0,125
36 0,048 39 0,044 7 7 49 0,001
32 0,112 35 0,074 42 0,008
5 5 25 0,008 34 0,106 35 0,053
20 0,079 6 6 36 0,002 28 0,212
15 0,357 30 0,026 7 8 56 0,000
5 6 30 0,004 24 0,143 49 0,002
25 0,026 6 7 42 0,001 48 0,005
24 0,048 36 0,008 42 0,013
20 0,108 35 0,015 41 0,024
5 7 35 0,003 30 0,038 40 0,033
30 0,015 29 0,068 35 0,056
28 0,030 28 0,091 34 0,087
25 0,066 24 0,147 33 0,118
23 0,116 6 8 48 0,001 7 9 63 0,000
5 8 40 0,002 42 0,005 56 0,001
35 0,009 40 0,009 54 0,003
32 0,020 36 0,023 49 0,008
30 0,042 34 0,043 47 0,015
27 0,079 32 0,061 45 0,021
25 0,126 30 0,093 42 0,034
5 9 45 0,001 28 0,139 40 0,055
40 0,006 6 9 54 0,000 38 0,079
36 0,014 48 0,003 36 0,098
35 0,028 45 0,006 35 0,127
31 0,056 42 0,014 8 8 64 0,000
30 0,086 39 0,028 56 0,002
27 0,119 36 0,061 48 0,019
33 0,095 40 0,087
30 0,176 32 0,283
Tabela 3.15 – Distribuição da estatística .A B obsn n D⋅ ⋅ de K-S para duas amostras independentes (continuação).
Testes da qualidade de ajustamento
APONTAMENTOS DE ADPE © E. Esteves & C. Sousa, 2007. 89
Dimensões
da amostra
Níveis de significância ( α )
(teste bilateral)
A Bn n= 0,20 0,10 0,05 0,02 0,01
9 45 54 54 63 63
10 50 60 70 70 80
11 66 66 77 88 88
12 72 72 84 96 96
13 78 91 91 104 117
14 84 98 112 112 126
15 90 105 120 135 135
16 112 112 128 144 160
17 119 136 136 153 170
18 126 144 162 180 180
19 133 152 171 190 190
20 140 160 180 200 220
0,10 0,05 0,025 0,01 0,005
Níveis de significância (α )
(teste unilateral)
Tabela 3.16 – Distribuição da estatística .A B obsn n D⋅ ⋅ de K-S para duas amostras independentes (se nA=nB).
Níveis de significância (α ) (teste bilateral)
0,20 0,10 0,05 0,02 0,01
1,07.A B
n
n n 1,22
.A B
n
n n 1,36
.A B
n
n n 1,52
.A B
n
n n 1,63
.A B
n
n n
0,10 0,05 0,025 0,01 0,005
Níveis de significância (α ) (teste unilateral)
Tabela 3.17 – Distribuição da estatística Dα de K-S para duas amostras independentes (para casos não
contemplados anteriormente).