cap_7_8_9_10_11_3

79
MINISTÉRIO DA EDUCAÇÃO UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ CAMPUS PATO BRANCO Coordenação do Curso Análise e Desenvolvimento de Sistemas 7 FUNDAMENTOS DE TESTE DE HIPÓTESES PARA UMA AMOSTRA 8 TESTES PARA DUAS AMOSTRAS COM DADOS NUMÉRICOS 9 ANALISE DA VARIANCIA 10 TESTES PARA DUAS AMOSTRAS COM DADOS CATEGORICOS 11 REGRESSÃO LINEAR SIMPLES Prof jorge roberto grobe AD34S 14:11:14 11/09/14

description

Teste de hipótese.

Transcript of cap_7_8_9_10_11_3

Page 1: cap_7_8_9_10_11_3

MINISTÉRIO DA EDUCAÇÃOUNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ

CAMPUS PATO BRANCOCoordenação do Curso Análise e Desenvolvimento de Sistemas 

7 FUNDAMENTOS DE TESTE DE HIPÓTESES PARA UMA AMOSTRA

8 TESTES PARA DUAS AMOSTRAS COM DADOS NUMÉRICOS

9 ANALISE DA VARIANCIA

10 TESTES PARA DUAS AMOSTRAS COM DADOS CATEGORICOS

11 REGRESSÃO LINEAR SIMPLES

Prof jorge roberto grobe AD34S 14:11:14 11/09/14

Page 2: cap_7_8_9_10_11_3

iiMINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

Sumário                                  8 TESTES PARA DUAS AMOSTRAS COM DADOS NUMÉRICOS..1CAPITULO 7..............................................................................................................................47 FUNDAMENTOS DE TESTE DE  HIPÓTESES  PARA UMA AMOSTRA.......................4

7.1 METODOLOGIAS DO TESTE DE HIPÓTESES..........................................................47.2 O TESTE Z DE HIPÓTESES PARA A  MÉDIA ARITMÉTICA  ( ∂ DESVIO PADRÃO CONHECIDO )­ AMOSTRAS GRANDES.........................................................77.3 EXERCICIOS..................................................................................................................87.4 TESTE UNICAUDAIS..................................................................................................11

       7.5.1 Exercicios........................................................................................................117.6 TESTE t DE HIPOTESES PARA A MÉDIA ARITMÉTICA  (  desvio padrão  δdesconhecido).......................................................................................................................137.7 EXERCICIOS................................................................................................................147.7 TESTE Z DE HIPOTESES PARA A PROPORÇÃO...................................................177.8 EXERCICIOS................................................................................................................18

      CAPITULO  8.....................................................................................................................19      8 TESTES PARA DUAS AMOSTRAS COM DADOS NUMÉRICOS............................19

8.1 COMPARANDO DUAS AMOSTRAS INDEPENDENTES: TESTANDO A DIFERENÇA ENTRE AS MÉDIAS ( amostras grandes e independentes)........................198.2 EXERCICIOS................................................................................................................218.3 TESTE t DE VARIÂNCIA AGRUPADA PARA A DIFERENÇA ENTRE DUAS MÉDIAS ARITMÉTICAS – amostras pequenas e independentes......................................228.4 ESTIMATIVA DO INTERVALO DE CONFIANÇA PARA DIFERENÇA ENTRE DUAS MÉDIAS ARITMÉTICAS DE DOIS GRUPOS INDEPENDENTES....................248.5 TESTE t VARIÂNCIAS SEPARADAS PARA DIFERENÇAS ENTRE DUAS MÉDIAS ARITMÉTICAS­ VARIANCIAS NÃO SÃO IGUAIS......................................248.6 EXERCICIOS................................................................................................................258.7 TESTE F PARA DIFERENÇAS ENTRE DUAS VARIANCIAS................................30

       8.7.1 Exercicios........................................................................................................348.8 COMPARANDO DUAS AMOSTRAS RELACIONADAS ( EMPARELHADAS): TESTE t PARA A DIFERENÇA ENTRE MÉDIAS ARITMÉTICAS­amostras dependentes..........................................................................................................................38

       8.8.1 Exercicios........................................................................................................408.9 TESTE DA SOMA DE CLASSIFICAÇÕES DE WILCOXON PARA DIFERENÇAS ENTRE DUAS MEDIANAS...............................................................................................42

8.9.1 Exercicios...............................................................................................................43       CAPITULO  9....................................................................................................................469 ANÁLISE DA VARIÂNCIA ...............................................................................................46

9.1 O MODELO COMPLETAMENTE ALEATORIO :ANALISE DA VARIANCIA DE FATOR ÚNICO  .................................................................................................................46

Page 3: cap_7_8_9_10_11_3

iiiMINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

9.2 EXERCICIOS................................................................................................................489.3 COMPARAÇÕES MULTIPLAS: O PROCEDIMENTO TUKEY­KRAMER............509.4 EXERCICIOS................................................................................................................519.5 O MODELO FATORIAL DE FATOR DUPLO: ANALISE DA VARIANCIA DE FATOR DUPLO...................................................................................................................529.6 EXERCICIOS................................................................................................................549.7 O TESTE DE CLASSIFICAÇÕES DE KRUSKAL­WALLIS PARA DIFERENÇAS ENTRE AS MEDIANAS.....................................................................................................569.8 EXERCICIOS................................................................................................................57

        ...........................................................................................................................................59        CAPITULO 10..................................................................................................................5910 TESTES PARA DUAS AMOSTRAS COM DADOS CATEGORICOS...........................59

10­1:Teste Z para diferença entre duas proporções..............................................................59       10. 1.1 Exercicios.....................................................................................................60

10.2 teste qui­quadrado   para a diferença entre duas proporções........................................6210.3 TESTE QUI­QUADRADO PARA DIFERENÇAS ENTRE MAIS DE DUAS PROPORÇÕES....................................................................................................................6510.4 TESTE QUI­QUADRADO PARA A INDEPENDÊNCIA.........................................66

CAPITULO 11..........................................................................................................................6911 REGRESSÃO LINEAR.......................................................................................................69

11.1 A EQUAÇÃO DE  UMA REGRESSÃO.....................................................................6911.3 CORRELAÇÃO (r)......................................................................................................7111.4 COEFICIENTE DE DETERMINAÇÃO ....................................................................71

                                                                                                                                              .....71        REFERENCIAS................................................................................................................74

Page 4: cap_7_8_9_10_11_3

4MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

CAPITULO 7

7 FUNDAMENTOS DE TESTE DE HIPÓTESES PARA UMA AMOSTRA

7.1 METODOLOGIAS DO TESTE DE HIPÓTESES

• Para LEVINE (2005), o teste de hipótese baseia-se em uma teoria, declaração ou afirmativa.

• E a hipótese nula, diz respeito ao status quo, no qual corresponde a nenhuma diferença.

• A metodologia de teste de hipóteses, baseia-se em evidencias a partir da amostra, tanto

para a rejeição da hipótese nula como a hipótese alternativa.

• E que a hipótese alternativa tenha uma probabilidade bem mais alta para ser verdadeira.

• A hipótese nula nem sempre esta correta por que a decisão é baseada em informações da

amostra.

• Quando se aceita Ho (hipótese nula), conclui-se que não existe evidencias para garantir sua

rejeição.

as hipóteses nula e alternativa

Ho= sempre testada

H1=se Ho for rejeitada

Ho sempre se refere o valor especificado do parâmetro da população µ e não a média da

amostra X .

Ho: µ= média da população

H1: µ≠ média da população

Para calcular a estatística do teste com base em uma amostra, ela segue uma distribuição de

estatística como uma distribuição normal ou distribuição t.

FARBER (2009, p.298), quando a hipotese H1 contem simbolos menos que < é um teste

unicaudal a esquerda ou > é unicaudal a direita.

Page 5: cap_7_8_9_10_11_3

5MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

fonte: www.dimap.ufrn.br/~marcilio/AM/ testehipotese .ppt

unilateral à esquerda ou cauda superiorHo: <= kH1:: > k

Unilateral à direita ou cauda inferiorHo: : >= kH1: : < k

Bilateral: Ho: : = kH1:: k

Page 6: cap_7_8_9_10_11_3

6MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

• FARBER (2009, p.294) A tabela seguir mostra a relação entre as possíveis afirmações

verbais sobre o parametro μ e as hipoteses nulas ou alternativa.

Formulação verbal Ho: hipotese nula

Formulação matematica Formulação verbal H1: hipotese alternativa

• a média é Maior ou igual a k

• a média é pelo menos k• a média é não menos

que k

• Ho: μ ≥ k• H1: μ <k• teste da cauda inferior

• a média é Menor que k• a média é abaixo de k• a média é menos que k

• a média é Menos ou igual a k

• a média é no maximo k• a média é não mais do

que k

• Ho: μ ≤ k• H1: μ >k• teste da cauda superior

• a média é Maior que k• a média é acima de k• a média é mais do que k

• a média é igual a k• a média é k• a média é exatamente k

• Ho: μ =k• H1: μ ≠ k• teste bicaudal

• a média é não igual a k• a média é diferente de k• a média é não k

* comparar a primeira coluna e a terceira coluna.

Riscos na tomada de decisão utilizando a metodologia do teste de hipóteses

• Pode correr o risco de uma conclusão incorreta

Erro do tipo I:• rejeita-se Ho quando ela é verdadeira, é representado por α.

Erro do tipo II:• aceita-se Ho, quando ela é falsa, é representado por β.

O nivel de significância

• O nível de significância é conhecido antes do teste.

• Niveis são selecionados α=0,01; 0,05;0,10

• Toda escolha do nível de significância tem-se um risco.

• Pode-se ocorrer erro do tipo I representado por α.

• Quando conhecido α, é conhecido a região de aceitação e não aceitação em relação a

hipótese nula.

Page 7: cap_7_8_9_10_11_3

7MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

O coeficiente de confiança

• É representado por (1- α ), corresponde a probabilidade de que Ho não seja rejeitada quando

que de fato ela é verdadeira e não seja rejeitada.

Eficacia de um teste

• A eficacia de um teste 1-ß, é a probabilidade de que seja rejeitada a hipotese nula quando

que de fato ela for falsa e deva ser rejeitada.

Exemplo : 1) FARBER (2009, p.294-295) Afirme as hipoteses nula e alternativa e identifique qual

representa a afirmação.

a) uma universidade publica que a proporção de seus estudantes que se graduaram em 4 anos é de

82%.

• solução : Ho: p=0,82 afirmação

• H1:p≠ 0,82

b) Um fabricante de torneiras anuncia que o indice médio de fluxo de agua de certo tipo de torneira

é menor que 2,5 galoes por minuto.

• Ho: μ ≥ 2,5

• H1: μ < 2,5 afirmação

Exemplo: 2) FARBER (2009, p.296-297) o limite USDA para contaminação por salmonela por

frango é de 20%. Um inspetor de carnes reporta que o frango produzido por uma empresa excede o

limite USDA. Realizando o teste de hipoteses para determinar se afirmação do inspetor de carne é

verdadeira. Quando ira ocorrer um erro do tipo I ou tipo II? Qual é mais sério?

• Solução

• Ho: p≤ 0,20

• H1: p> 0,20 ( afirmação )

• erro do tipo I: se a proporção real de frango contaminado for menor ou igual a 0,20, decisao

de rejeitar Ho.

• Erro do tipo II: ocorrerá se a real proporção de frango contaminado for maior que 0,20 mas

você não rejeita Ho.

Page 8: cap_7_8_9_10_11_3

8MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

7.2 O TESTE Z DE HIPÓTESES PARA A MÉDIA ARITMÉTICA ( ∂ DESVIO PADRÃO

CONHECIDO )- AMOSTRAS GRANDES

• Caso o desvio padrão (∂) conhecido a distribuição de amostragem segue uma distribuição

normal, resultando na estatística Z:

Z=X−μ

n

• Na equação em Z o numerador mede a distancia ( absoluto) a média aritmética da amostra

observada em relação a média aritmética da hipótese µ e o denominador representa o erro-

padrão.

• FARBER (2009, p.307), quando n≥ 30 podera ser usado o desvio padrão da amostra nolugar de sigma.

O método do valor- p para testes de hipóteses

• p≥α (nivel de significância) = aceita-se Ho (médias são iguais)• p<α= aceita-se H1(médias são diferentes)

7.3 EXERCICIOS

3) O diretor de produção de uma fabrica precisa determinar se uma nova maquina está produzindo

de acordo com as especificações do fabricante, que indicam que o tecido deveria ter uma média

aritmética de resistência ao rompimento equivalente a 70 libras e um desvio padrão de 3,5 libras.

Uma amostra de 49 peças de tecidos revela uma média aritmética de resistência ao rompimento da

amostra igual a 69,1 libras.

a) especifique a hipótese nula e alternativa.

Hipótese nula : Ho = 70 libras ( afirmação)

Hipótese alternativa : H1≠ 70 libras

b)existem evidencia de que a máquina não esteja atendendo às especificações do fabricante, com

relação a média da resistência ao rompimento? ( α=0,05). R: aceitar Ho

Dados:

Hipótese nula : Ho = 70 libras

Page 9: cap_7_8_9_10_11_3

9MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

Hipótese alternativa : H1≠ 70 libras

∂ desvio padrão conhecido: 3,5 libras

n=49 peças

média aritmética da amostra : 69,1 libras

Z Test of Hypothesis for the Mean

DataNull Hypothesis = 70Level of Significance 0,05Population Standard Deviation 3,5Sample Size 49Sample Mean 69,1

Intermediate CalculationsStandard Error of the Mean 0,5Z Test Statistic -1,800

Two-Tailed Test Lower Critical Value -1,959962787Upper Critical Value 1,959962787p-Value 0,071860531

Do not reject the null hypothesis

O valor de Z foi calculado pela seguinte formula : Z=

X−μ∂

n

c)calcule o valor p e interprete seu significado.

O valor de p equivale a 1- α.

d)qual seria a sua resposta em (b) caso o desvio padrão especificado fosse igual a 1,75 libras?

R: aceitar H1

Z Test of Hypothesis for the Mean

DataNull Hypothesis = 70Level of Significance 0,05Population Standard Deviation 1,75Sample Size 49Sample Mean 69,1

Page 10: cap_7_8_9_10_11_3

10MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

Intermediate CalculationsStandard Error of the Mean 0,25Z Test Statistic -3,600

Two-Tailed Test Lower Critical Value -1,959962787Upper Critical Value 1,959962787p-Value 0,000318291

Reject the null hypothesis

e) qual seria sua resposta em (b) caso a média aritmética da amostra fosse igual a 69 libras e o

desvio padrão fosse de 3,5 libras?

R:aceitar H1

Z Test of Hypothesis for the Mean

DataNull Hypothesis = 70Level of Significance 0,05Population Standard Deviation 3,5Sample Size 49Sample Mean 69

Intermediate CalculationsStandard Error of the Mean 0,5Z Test Statistic -2,000

Two-Tailed Test Lower Critical Value -1,959962787Upper Critical Value 1,959962787p-Value 0,045500124

Reject the null hypothesis

Page 11: cap_7_8_9_10_11_3

11MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

7.4 TESTE UNICAUDAIS

• Em LEVINE (2005), o teste unicaudal ou teste direcional esta contida em uma cauda da

distribuição de amostragem da estatistica do teste.

• A metodologia do teste de hipóteses é utilizada para examinar a questão relativa a média

aritmética da população correspondente a ser ou não ser igual a µ.

Ho: µ ≥ média da amostra

H1 : µ< media da amostra

• Para calcular o valor de Z com área de 5%, chamado zona de rejeição: invnormp(0,05)=

-1,645 abaixo e acima 1,645

fonte: www.dimap.ufrn.br/~marcilio/AM/testehipotese.ppt

unilateral à esquerda ou cauda superiorHo: ≤kH1:: > k

Unilateral à direita ou cauda inferiorHo: : ≥kH1: : < k

Bilateral: Ho: : = kH1:: k

Page 12: cap_7_8_9_10_11_3

12MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

7.5.1 Exercicios

4) FARBER (2009, p.308) Em um anuncio, uma pizzaria afirma que a média de seu tempo de

entrega é menor que 30 minutos. Uma seleção aleatória de 36 tempos de entrega tem média

amostral de 28,5 minutos e desvio padrão de 3,5 minutos. Há evidencia suficiente para apoiar a

afirmação em α=0,01 ? Use o valor de P.

Solução:

• afirmação : a media de entrega é menor que 30 minutos.

• Ho: μ≥ 30 minutos

• H1: u< 30 minutos ( afirmação )

• cauda inferior o valor de z é negativo.

5) FARBER (2009, p.309) proprietários de casas afirmam que a velocidade média de veículos que

passam por sua rua é maior que o limite de velocidade de 35 milhas por hora. Uma amostra

aleatória de 100 automóveis tem média de velocidade de 36 milhas por hora e desvio padrão de 4

milhas por hora. Há evidencia suficiente para apoiar a afirmação em α=0,05. Use o valor de P.

Solução:

• Ho: μ ≤35 milhas por hora

• H1: u > 35 milhas por hora ( afirmação)

• cauda superior o valor de z é positivo

Page 13: cap_7_8_9_10_11_3

13MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

6) A Glen Valley Steel Company produz barras de aço. Se o processo estiver operando

adequadamente são produzidas barras de aço com uma média aritmética de comprimento

equivalente pelo menos 2,8 pés, com um desvio padrão de 0,2 pés. Barras de aço mais longas

podem ser utilizadas ou alteradas, porem barras mais curtas devem ser descartadas. Uma amostra

de 25 barras é selecionada da linha de produção. A amostra indica que o comprimento médio de

2,73 pés. A empresa deseja determinar se o equipamento de produção necessita de algum ajuste.

a)especifique a hipótese nula e alternativa.

Resultado1:

• Ho: µ ≥2,8 pés ( afirmação)

• H1:µ < 2,8 pés

b)caso a empresa desejasse testar a hipótese no nível de significância de 0,05, que decisões ela iria

tomar utilizando o modelo do valor critico para testes de hipóteses?

Z=X−μ

n

Resultado 2:Z=-1,75 ( zona de rejeição) < Z=-1,645 ( zona de aceitação)

portanto :rejeitar Ho

comando: inv.normp(z)

c)caso a empresa desejasse testar a hipótese no nível de significância de 0,05, que decisões ela iria

tomar utilizando o modelo do valor-p para testes de hipóteses?

Resultado3:p=0,0401< α=0,05 rejeitar Ho

d) interprete o significado do valor-p neste problema.

e)compare suas conclusões em (b) e (c).

Page 14: cap_7_8_9_10_11_3

14MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

7.6 TESTE t DE HIPOTESES PARA A MÉDIA ARITMÉTICA (σ(sigma) desvio padrão

desconhecido)

Em diversas situações teste de hipoteses utilizam dados numericos, onde o desvio padrão da

população é desconhecido.

t=X−u

S

n

μ=media da população onde a estatistica do teste t segue uma distribuição t, tendo n-1 graus

de liberdade.

S= desvio padrão da amostraPremissas do teste t de uma amostra

• Para utilizar o teste t de uma amostra , os dados numéricos obtidos são vistos como se

representassem uma amostra aleatória, a partir de uma população que seja normalmente

distribuída.

• Na pratica, enquanto tamanho da amostra não for demasiadamente pequeno e a população

não for muito assimétrica, a distribuição t fornece uma boa aproximação da distribuição de

amostragem da média aritmética quando δ for desconhecido.

7.7 EXERCICIOS

7) Se, em uma amostra de tamanho n=16 selecionada a partir de uma população normal subjacente,

a média aritmética da amostra X =56, e o desvio padrão da amostra S=12, qual sera o valor da

estatística do teste t, se você estiver testando a hipótese nula, de que µ=50?

Solução:

n=16

X =56

S=12 ( desvio padrão da amostra)

µ=50

Page 15: cap_7_8_9_10_11_3

15MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

o calculo é realizado pela seguinte formula : t=

X−uS

n=

56−5012

16

=63=2

o valor de t é igual a 2.

8) O diretor de uma grande universidade informa aos pais de alunos recém-chegados sobre os

custos dos livros durante um semestre. Uma amostra de 100 alunos matriculados na universidade

indica uma média aritmética da amostra de custos correspondentes a $315,4, com um desvio padrão

da amostra igual a $43,20 e a média da população de $300?

a) construa uma estimativa de intervalo de confiança de 90%.

Resposta:[308,23;322,57]

Dados : n=100 media da amostra=315,4 desvio padrão da amostra =43,20 media da população

:µ=300

Confidence Interval Estimate for the Mean

DataSample Standard Deviation 43,2Sample Mean 315,4Sample Size 100Confidence Level 90%

Intermediate CalculationsStandard Error of the Mean 4,32Degrees of Freedom 99t Value 1,660391717Interval Half Width 7,172892219

Confidence IntervalInterval Lower Limit 308,23Interval Upper Limit 322,57

Page 16: cap_7_8_9_10_11_3

16MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

b) qual seria sua decisão estatistica caso voce testasse Ho e H1, ao nível de significância de 0,05 e 0,1? Resposta:

• a nível de 0,05 e 0,1 rejeita-se Ho, existem diferenças entre as medias da população e da amostra.

t Test for Hypothesis of the Mean

DataNull Hypothesis = 300Level of Significance 0,05Sample Size 100Sample Mean 315,4Sample Standard Deviation 43,2

Intermediate CalculationsStandard Error of the Mean 4,32Degrees of Freedom 99t Test Statistic 3,564814815

Two-Tailed Test Lower Critical Value -1,984217306Upper Critical Value 1,984217306p-Value 0,000562434

Reject the null hypothesis

t Test for Hypothesis of the Mean

DataNull Hypothesis = 300Level of Significance 0,1Sample Size 100Sample Mean 315,4Sample Standard Deviation 43,2

Intermediate CalculationsStandard Error of the Mean 4,32Degrees of Freedom 99t Test Statistic 3,564814815

Two-Tailed Test Lower Critical Value -1,660391717Upper Critical Value 1,660391717p-Value 0,000562434

Reject the null hypothesis

Page 17: cap_7_8_9_10_11_3

17MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

c)utilizando o nível de significância de 0,1, existem evidencias de que a média da população seja

superior a $300?

cauda superior

9)FARBER (2009, p.326-327) Para o seu estudo sobre hábitos alimentares entre adolescentes

homens, você seleciona aleatoriamente 20 adolescentes e pergunta a cada um deles quantas porções

de 12 onças de refrigerante ele bebe todos os dias. Os resultados são listados a seguir. Com o nivel

de significancia igual a 0,05 , há evidencia suficiente para dar suporte a afirmação de que

adolescentes homens bebem menos que tres porções de 12 onças de refrigerantes todos os dias?

2,1 2,3 2,4 1,2 0,8 2,1 2 2,2 2,5 2,1

1,6 2,1 1,8 2,2 2 2,8 3,2 0,5 1,4 1,2* 1 onça = 28 ml

a) escreva a afirmação matematicamente e identifique Ho e H1.

Resposta:

H1: μ< 3,0 afirmação

Ho: μ⩾3,0

b) calcule o valor P.

Teste t de Hipóteses para a Média Aritmética

DadosHipótese Nula 300,0000Nível de Significância 0,1000Tamanho da Amostra 100,0000Média da Amostra 315,4000Desvio Padrão da Amostra 43,2000

Cálculos IntermediáriosErro Padrão da Média 4,3200Graus de Liberdade 99,0000

3,5648

TESTE CAUDA SUPERIORValor Crítico Inferior 1,2902 0,10000

0,000281Rejeitar a hipótese nula

Estatística do Teste t

Valor-p

Area da cauda superior

Page 18: cap_7_8_9_10_11_3

18MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

Resposta:

c) decida se rejeita ou aceita Ho.

d) interprete a decisão no contexto da afirmação original.

10) Uma empresa que produz materiais escolares diz que os professores gastam uma média de mais

do que $550 de seu dinheiro em materiais escolares em um ano. Uma amostra aleatoria da

quantidade ( em dolares) que 24 professores gastaram em materiais escolares em um ano recente é

listada a seguir. Com α=0,05, há evidencia suficiente para dar suporte a afirmação da empresa?

715 623 582 721 602 621 462 320 532 566 686 532

603 420 684 713 531 888 482 361 560 910 546 860

a) escreva a afirmação matematicamente e identifique Ho e H1.

• Ho: 550

• H1: 550 afirmativa

b) calcule o valor P.

c) decida se rejeita ou aceita Ho.

d) interprete a decisão no contexto da afirmação original.

Page 19: cap_7_8_9_10_11_3

19MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

7.7 TESTE Z DE HIPOTESES PARA A PROPORÇÃO

• FARBER (2009, p.327), ocorrem quando um politico quer saber a proporção de seus

constituintes que estão a favor de certo projeto de lei ou quando um engenheiro de qualidade

testa a proporção de peças com problemas.

• LEVINE (2005, p.246) Uma distribuição normal pode ser utilizada para aproximar a

distribuição binomial quando np≥5 e nq ≥5.

• Para uma distribuição binomial , então uma distribuição amostral para

p é normal com:

• p= p e p= pqn

• Testar a hipotese pertinente a proporção, p, de valores que se encontram em uma

determinada categoria em vez de testar a media aritmética da população.

Teste Z para a proporção

n

pp

ppZ a

)1(

pa=X/n X= numero de sucessos na amostra

n=tamanho da amostra

p=proporção da hipotese de sucessos na população

7.8 EXERCICIOS

11)Caso, em uma amostra aleatória de 400 itens, sejam encontrados 88 itens com defeito, qual é a

proporção da amostra dos itens defeituosos?

R:pa =88/400=0,22=22%

12)No problema anterior,se a hipótese nula, determinar que 20% dos itens na população são

defeituosos, qual o valor da estatística do teste Z?

Dados: p=0,20 pa=88/400=0,22

Page 20: cap_7_8_9_10_11_3

20MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

n

pp

ppZ a

)1(

Z=[0,22−0,2]

0,21−0,2400

Z=1

13) Suponha que você esteja testando a hipótese nula. Ho: p =0,2, contra a hipótese alternativa

bicaudal , H1: p≠0,2, e que voce escolheu o nível de significância correspondente a α=0,05. Qual

seria a sua decisão estatistica?

Resultado1: aceita-se Ho em que a proporção igual a 20%.

Resultado 2: para rejeitar Ho, pode-se mudar aleatóriamente o numero de sucessos maior ou menor que 80.

14) FARBER (2009, p.328) Um centro de pesquisas declara que menos que 20% dos usuarios de

internet nos EUA tem rede sem fio em suas casas. Em uma amostra aleatoria de 100 adultos, 15%

dizem que tem rede sem fio em casa. Com α=0,01 há evidencias suficientes para apoiar a

declaração do pesquisador?

15) FABER (2009, p.329) A Zogby Internacional declara que 45% das pessoas nos EUA são a favor

de tornar a venda do cigarro ilegal dentro dos próximos 10 anos. Você decide testar essa afirmação e

entrevista uma amostra de 200 pessoas, dentre as quais, 49% são a favor da lei. Com α=0,05, há

evidencia o bastante para apoiar a afirmação?R : não rejeitar Ho.

16) FARBER (2009,p.331) O centro de pesquisas de Pew afirma que mais de 55% dos adultos

norte-americanos assistem seus noticiários locais regularmente. Você decide testar essa afirmação e

entrevista uma amostra de 425 adultos nos EUA sobre esse assunto. Dos 425 entrevistados, 255

responderam que assistem seus noticiários locais regularmente. Com α=0,05,ha evidencia o

suficiente para apoiar essa afirmação do centro de pesquisas Pew? R:rejeitar Ho.

Page 21: cap_7_8_9_10_11_3

21MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

CAPITULO 8

8 TESTES PARA DUAS AMOSTRAS COM DADOS NUMÉRICOS

8.1 COMPARANDO DUAS AMOSTRAS INDEPENDENTES: TESTANDO A DIFERENÇA

ENTRE AS MÉDIAS ( amostras grandes e independentes)

• FARBER (2009, p.352) duas amostras são independentes se a amostra selecionada de uma

das populações não é relacionada a amostra selecionada da segunda população.

• Duas amostras são dependentes se cada membro de uma amostra corresponde a um

membro da outra amostra .

• As amostras tambem são chamadas de amostras emparelhadas ou amostras

relacionadas.

• Exemplo 1: dependentes

• amostra 1- ritmo cardiaco em descanso de 35 indivíduos antes de tomar café.

• Amostra 2: ritmo cardiaco em descanso de 35 indivíduos depois de tomar café.

• Exemplo2:independentes

• amostra 1:nota de teste de 35 estudantes de estatistica,

• amostra 2: nota de teste de 42 estudantes de biologia que não estudam estatistica.

Teste z de duas amostras para a diferenças entre medias

FARBER (2009, p.354)

1) as amostras devem ser selecionadas aleatoriamente.

2) As amostras devem ser independentes.

3) Cada tamanho da amostra deve ser pelo menos 30 ou, se não , cada população deve ter

uma distribuição normal com um desvio padrão conhecido.

• LEVINE(2005, p.346), suponha que uma amostra n1 foi extraida da primeira população e

n2 da segunda população, existem uma variável numérica correspondente.

• Nas duas populações existem suas respectivas médias e seus respectivos desvio padrão.

• A estatística do teste, utilizada para determinar a diferença entre as médias das populações,

é baseado na diferença entre as medias das amostras X1 e X2 .

• Esta estatística de teste segue uma distribuição normal padronizada, para tamanhos de

amostras suficientemente grandes.

Page 22: cap_7_8_9_10_11_3

22MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

O teste Z para diferença entre duas médias aritméticas:

Z=(X 1−X 2)−(μ1−μ2)

√σ12

n1

+σ2

2

n2

• FARBER (2009, p.355) quando as amostras são grandes( ao menos 30), pode usar s1 e

s2 no lugar de σ1 e σ2 .

• Se as amostras não são grandes pode-se usar o teste z de duas amostras, contanto que

as populações sejam distribuidas normalmente e os desvios padroes populacionais seja

conhecidos.

• Para LEVINE (2005, 346),na maioria dos casos as variâncias e os desvios padrões não são

conhecidos, a única informação disponíveis são as médias aritméticas , variâncias e desvios

-padrão das amostras.

• Podem ser estabelecidas premissas de que as amostras têm que ser extraídas de uma de

forma aleatória e independente, a partir de uma população normalmente distribuídas e que as

variâncias das populações sejam iguais 12=2

2 .

• Um teste t de variancia agrupada pode ser utilizado para determinar se existe um diferença

significativa entre as médias aritméticas das duas populações.

Onde:

n1 = tamanho da população 1

n2 = tamanho da população 2

µ1 = média aritmética da população 1

µ2 = média aritmética da população 2

σ1 = desvio padrão da população 1

σ2 = desvio padrão da população 2

S2p =variância agrupada

X1 e X2= médias aritméticas das amostras da população 1 e 2.

Page 23: cap_7_8_9_10_11_3

23MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

Teste de Hipótese

Para testar a hipótese nula de que não existe uma diferença entre as medias das duas populações

independentes:

Ho: µ1 = µ2 ou µ1 - µ2=0

contra a hipótese alternativa de que as medias aritméticas não são iguais.

H1: µ1 1≠2 ou 1−2≠0

fonte: www.dimap.ufrn.br/~marcilio/AM/testehipotese.ppt8.2 EXERCICIOS

17) Sendo conhecida uma amostra de tamanho n1=40 , a partir de uma população com desvio

padrão conhecido 1=20 , e uma amostra independente de tamanho n2=50, a partir de uma outra

população , com desvio padrão conhecido 2=10 , qual é o valor da estatística do teste Z para

testar diferenças entre médias aritméticas de duas populações, se X 1 =72 e X 2 =66?

Z=X1−X2− 1−2

12

n1

1

2

n2

resposta: 1,7321

18)Qual seria sua decisão no problema numero 17, caso você estivesse testando Ho:, contra a

hipótese nula alternativa bi caudal, utilizando o nível de significância =0,01 .

resposta: aceitar a hipotese nula de que a médias das populações são iguais.

unilateral à esquerda ou cauda superiorHo: ≤ µ2H1:: >µ2

Unilateral à direita ou cauda inferiorHo: ≥ µ2H1: : < µ2

Bilateral: Ho: : = µ2H1:: µ2

Page 24: cap_7_8_9_10_11_3

24MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

19) Qual o valor - p no problema 1, caso vc tivesse testando Ho e H1 bicaudal.

20) FARBER (2009, p.359) Custos de reparo : fornos micro -ondas. Você quer comprar um forno de

micro-ondas e escolhera o modelo A se os custos de reparo forem mais baixos que os custos de

reparo do modelo B. Você pesquisa os custos de reparo de 47 fornos do modelo A e 55 fornos do

modelo B. Os resultados da sua pesquisa são , com nivel de significancia de 0,01, você compraria o

modelo A?

Dados:

Modelo A Modelo B

X1 =$ 75 X2 =$80

S1= $12,50 S2=$20

a) identifique a afirmação e expresse Ho e H1.

Ho: μB ≤ µA

H1: μB >µA ( afirmação)

b) encontre os valores criticos

c) encontre a estatistica do teste z.

d) decida se rejeita ou aceita Ho.

e) interprete a decisao no contexto da afirmação geral.

21) assistindo mais TV. Um sociologo afirma que crianças entre 6 e 17 anos passavam mais tempo

assistindo TV em 1981 do que crianças de 6 a 17 anos passam hoje. Um estudo foi conduzido em

1981 para descobrir o tempo que crianças de 6 a 17 anos assistiam TV nos dois dias da semana. Os

resultados ( em horas por dia da semana ) são mostrados a seguir:

amostra 1: ( em 1981)

2 2,5 2,1 2,3 2,1 1,6 2,6 2,1 2,1 2,4 2,1 2,1 1,5 1,7 2,1

2,3 2,5 3,3 2,2 2,9 1,5 1,9 2,4 2,2 1,2 3 1 2,1 1,9 2,2

0,0833

Page 25: cap_7_8_9_10_11_3

25MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

Em um estudo similar foi conduzido. Os resultados são mostrados a seguir:

amostra 2:( nos dias de hoje)

2,9 1,8 0,9 1,6 2 1,7 2,5 1,1 1,6 2 1,4 1,7 1,7 1,9 1,6

1,7 1,2 2 2,6 1,6 2,5 1,6 2,1 1,7 1,8 1,1 1,4 1,2 2,3 1,5

Em α=0,025 , você pode apoiar a afirmação do sociologo?

a) identifique a afirmação e expresse Ho e H1.

• solução

Ho: μ1 ≥ µ2

H1: μ1 > µ2 ( afirmação)

b) encontre os valores criticos

zo=1,96 região de rejeição : z>-1,96

c) encontre a estatistica do teste z.

• 3,01

d) decida se rejeita ou aceita Ho.

Rejeite Ho

e) interprete a decisao no contexto da afirmação geral.

• No nivel de significancia de 2,5%, há evidencia suficiente para apoiar a afirmação do

sociólogo de que as crianças entre 6 e 17 anos passavam mais tempo assistindo TV em 1981

do que as crianças entre 6 e 17 hoje em dia.

Page 26: cap_7_8_9_10_11_3

26MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

8.3 TESTE t DE

VARIÂNCIA AGRUPADA PARA A DIFERENÇA ENTRE DUAS MÉDIAS ARITMÉTICAS – amostras pequenas e independentes.

• FARBER (2009, p.363) variancias iguais: se as variancias da população são iguais, então a

informação das duas amostras é combinada para calcular uma estimativa coligada do desvio

padrão =S p

S p2=

n1−1 S12n2−1 S2

2

n1−1 n2−1

*A estatística do teste t segue uma distribuição t, com n1+n2-2 graus de liberdade

t= X1−X 2 − μ1−μ 2

S p2

1n1

1n2

Page 27: cap_7_8_9_10_11_3

27MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

FIGURA 1- Regiões de rejeicão e de não rejeição para os testes t para a diferença entre as médias

aritméticas ( teste bicaudal)

• A estatística do teste t para variância agrupada, requer que as duas variâncias das amostras

sejam iguais, no sentido de obter o calculo da variância agrupada para obter o melhor

estimador.

Page 28: cap_7_8_9_10_11_3

28MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

8.4 ESTIMATIVA DO INTERVALO DE CONFIANÇA PARA DIFERENÇA ENTRE DUAS MÉDIAS

ARITMÉTICAS DE DOIS GRUPOS INDEPENDENTES.

X1−X 2 ±t S p2

1n1

1n2 t=n1+n2-2 graus de liberdade

8.5 TESTE t VARIÂNCIAS SEPARADAS PARA DIFERENÇAS ENTRE DUAS MÉDIAS

ARITMÉTICAS- VARIANCIAS NÃO SÃO IGUAIS

FARBER (2009, p.363-364)

S p2= S1

2

n1

S2

2

n2

t= X1−X 2 − μ1−μ 2

S p2

1n1

1n2

Page 29: cap_7_8_9_10_11_3

29MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

• valores criticos são calculados em cima da menor amostra.

VERIFICANDO PREMISSAS

• Ao testar as diferenças entre as médias, é adotada a premissa de que as populações são

normalmente distribuídas, com variâncias iguais.

• Para situações nos quais as duas populações possuam iguais variâncias, o teste t de variância

agrupada é robusto (não sensível) quanto ao afastamentos moderados em relação a premissa

da normalidade, contanto que os tamanhos das amostras sejam grandes.

• Nestas situações, o teste t de variância agrupada pode ser utilizado sem efeitos sérios sobre

sua eficácia.

• Os dados não são normalmente distribuídos.

• Um procedimento não paramétrico, tal como o teste da soma de classificações de Wilcoxon,

que não depende da premissa da normalidade para as duas populações.

8.6 EXERCICIOS

22)FARBER (2009, p.364) As distancias de frenagem de 8 Volks GTIS e 10 Ford Focus foram

testadas enquanto viajavam a 60 milhas por hora em pista seca. Os resultados são mostrados na

tabela. Você pode concluir que existe diferença na média da distancia de frenagem dos dois tipos de

carro? Use α=0,05 . Assuma que as populações são distribuidas normalmente e as variancias da

população não são iguais. R: rejeitar Ho

Estatistica amostral para a distancia de frenagem em pista molhada

GTI FOCUS

Média da amostral:141 pés Média da amostral:151 pés

Desvio padrão amostral:7 pés Desvio padrão amostral:3,1 pés

n1=8 n2=10

Page 30: cap_7_8_9_10_11_3

30MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

23)Um fabricante esta desenvolvendo uma bateria de hidreto de níquel para telefones celulares em

substituição a baterias de níquel-cádmio diretor de controle de qualidade decide avaliar o

desempenho da bateria recentemente desenvolvida em relação à amplamente utilizada bateria de

níquel-cádmio. Uma amostra aleatória de 25 baterias de cada tipo, são colocadas em telefones

celulares da mesma marca e modelo. A medida de desempenho de interesse é o tempo de

conversação (em minutos), até que seja necessária a recarga.Os resultados são seguintes:

* colar antes no calc e depois no gnumeric

Bateria de niquel

cadmio

Bateria de hidreto

de niquel

54,5 71 56,7 78,3 103 91,1

67,8 41,7 86,8 95,4 81,3 82,8

64,5 69,7 74,9 69,4 46,4 71,8

70,4 40,8 76,9 87,3 82,3 77,5

72,5 75,4 104,4 62,5 83,2 74,3

64,9 81 82 85 85,3 86,1

83,3 90,4 58,7 85,3 85,5 74,1

72,8 71,8 72,1 112,3

68,8 67 41,1 79,8

a) Existem diferenças entre as medias, admitindo que as variância são iguais? α=0,05

APLICAÇÕES DAS FERRAMENTA

1. USANDO GNUMERIC:

● FERRAMENTAS/ANÁLISE ESTATISTICA/ DUAS MÉDIAS/

● AMOSTRAS NÃO EMPARELHADAS/

● VARIANCIAS IGUAIS ( PRESUMINDO) /

● VARIANCIAS POPULACÕES DESCONHECIDAS

● ( POR CAUSA DA AMOSTRA )/VARIANCIAS IGUAIS

rejeitar Ho

2.CALC-LibreOffice

TESTET

Retorna a probabilidade associada ao Teste t de Student.

Sintaxe

Page 31: cap_7_8_9_10_11_3

31MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

TESTET(Dados1; Dados2; Modo; Tipo)

Dados1 é a matriz ou intervalo de dados dependente para o primeiro registro.

Dados2 é a matriz ou intervalo de dados dependentes para o segundo registro.

Modo = 1 calculará o teste uni-caudal;

Modo = 2 calculará o teste bi-caudal.

Tipo é o tipo de teste t que será realizado.

O Tipo 1 significa pareado.

O Tipo 2 significa duas amostras de variância igual (homoscedástico).

O Tipo 3 significa duas amostras de variância diferente (heteroscedástico).

RESULTADO 1:CALC

valor-p:

RESULTADO 2: GNUMERIC

Variável 1 Variável 2

Média 70,748 79,728

Variância 195,788 226,030

Observações 25 25

Correlação de Pearson 0,00911

Hipótese de Diferença entre

Médias 0

Diferença entre Médias

Observada −8,98

Variância das Diferenças 417,985

df 24

t Stat −2,1962

0,033711727

Page 32: cap_7_8_9_10_11_3

32MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

P (T<=t) monocaudal 0,01899

t Crítico monocaudal 1,71088

P (T<=t) bicaudal 0,03798

t Crítico bicaudal 2,06390O valor-p 0,03798 é menor que o nível de significância de 0,05,portanto rejeita-se Ho ( então as

medias são diferentes presumindo variâncias iguais ).

b)Que outras premissas devem ser adotadas em (a)?

Resposta: são normalmente distribuídas

c)Determine o valor- p em (a) e interprete seu significado.

Resposta:

P (T<=t) bicaudal 0,03798

d) Repita para que as variâncias não são iguais

● USANDO GNUMERIC:

● FERRAMENTAS/ANÁLISE ESTATISTICA/

● DUAS MÉDIAS/AMOSTRAS NÃO EMPARELHADAS/

● VARIANCIAS DESIGUAIS ( PRESUMINDO) /

● VARIANCIAS POPULACÕES DESCONHECIDAS

Teste-t: duas amostras

presumindo variâncias

diferentes Variável 1 Variável 2Média 70,7480 79,7280Variância 195,7884 226,0296Observações 25,0000 25,0000Hipótese da diferença de

média 0,0000 gl 48,0000 Stat t -2,1862

Page 33: cap_7_8_9_10_11_3

33MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

P(T<=t) uni-caudal 0,0169 t crítico uni-caudal 1,6772 P(T<=t) bi-caudal 0,0337 t crítico bi-caudal 2,0106

Rejeita-se Ho , ou seja as medias são diferentes presumindo variâncias diferentes.

e) construa uma estimativa do intervalo de confiança de 95% da diferença entre as médias

aritméticas das populações entre as baterias de niquel-cadmio e as baterias d hidreto de niquel.

O intervalo de confiança de 95% para a diferença entre as medias é [0,72; 17,24]

24) Uma agencia imobiliária deseja comparar os valores de avaliação de residências uni familiares

em 2 comunidades no Condado de Nassau, Nova York. Uma amostra de 60 residências em

Farmingdale e 99 residências em Lewittown produz os seguintes resultados (milhares de dólares):

Farmingdale Lewittown

Medias X 191,33 172,34

S ( desvio padrão) 32,60 16,92

n 60 99

a) nivel de significancia de 0,05, existem evidencias de uma diferença na média de valores

avaliados para residencias unifamiliares nas duas comunidades do Conrado de Nassau?

• presumindo variancias diferentes

• presumindo variancias iguais

X1−X 2 ±t S p2

1n1

1n2

Page 34: cap_7_8_9_10_11_3

34MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

b) construa uma estimativa do intervalo de confiança de 95% da diferença entre as médias

aritméticas das populações de Farmingdale e Lewittown.

25) A diretora de treinamento de uma empresa que produz equipamentos eletronicos esta

interessada em determinar se diferentes metodos de treinamento possuem algum efeito sobre a

produtividade de empregados, da linha de produção. Ela designa 42 empregados recentemente

contratados, para dois grupos com 21 empregados. O primeiro grupo recebe um programa de

treinamento individual, assistido por computador de uso pessoal , e outro recebe um programa de

treinamento baseado em equipes. Ao término do treinamento, os empregados são avaliados em

relação ao tempo ( em segundos) necessário para que seja montada uma peça.

Programa com base

individual assistido

por computador

Programa baseado

em equipes

19,4 16,7 16,5 22,4 13,8 23,7

20,7 19,3 17,7 18,7 18 17,4

21,8 16,8 16,2 19,3 20,8 23,2

14,1 17,7 17,4 15,6 17,1 20,1

16,1 19,8 16,4 18 28,2 12,3

16,8 19,3 16,8 21,7 20,8 15,2

14,7 16 18,5 30,7 24,7 16

a) admitindo que as variancias são iguais das populações correspondentes a metodos de treinamento

sejam iguais , existem evidencias de uma diferença entre a média dos tempos de montagem ( em

segundos) de empregados treinados em um programa com base individual assistido por computador

e aqueles treinados em um programa baseado em equipes? α=0,05

b) repita para que as variancias das populações são diferentes.

c) compare os resultados a e b

Page 35: cap_7_8_9_10_11_3

35MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

d)construa uma estimativa do intervalo de confiança de 95% da diferença entre as medias

aritmeticas das populações relativas aos dois metodos de treinamento.

8.7 TESTE F PARA DIFERENÇAS ENTRE DUAS VARIANCIAS

DEFINIÇÃO :FARBER (2009,p.461-462)

• sejam s 21

e s 22

representam as variancias de amostras de duas populações.

• Se duas populações são normais e as variancia populacionais 21

e 22

são iguais ,

então a distribuição de amostragem de :

• F=s2

1

s21

é chamada de distribuição F.

• PROPRIEDADES

• LEVINE (2005, p. )

• O objetivo desta estatistica F é testar se duas populações possuem a mesma variabilidade.

• Outra importante razão para testar a diferença entre as variancias de duas populações é

determinar se o teste t para variancia agrupada é apropriado.

• A distribuição F é denominada em função do famoso R. A. Fisher.

• Os valores criticos da distribuição F dependem de dois conjuntos de graus de liberdade.

• Os graus de liberdade no numerador da fração pertencem a primeira amostra e o

denominador a segunda amostra.

• A estatistica do teste F segue uma distribuição F, com n1-1 e n2-1 graus de liberdade.

• Para um dado nivel de significância α para testar hipotese nula de igualdade de variancias:

• Ho: 21

= 22

contra a hipotese alternativa de que as variancias das duas populações não são iguais:

• H1: 21

≠ 22

• Na tabela 1 a seguir tem -se os valores de F com nivel de significancia de 5%

Page 36: cap_7_8_9_10_11_3

F

36MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

TABELA 1 Distribuição

F de Snedecor

α = 0,05

Tabela 2 : nivel de significancia de 0,05 unicaudal

gl graus de liberdade no numeradordenom. 1 2 3 4 5 6 7 8 9 101 161

,45

199,5

0

215,7

1

224,5

8

230,1

6

233,9

9

236,7

7

238,8

8

240,5

4

241,8

82 18,

51

19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40

3 10,

13

9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79

4 7,7

1

6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96

5 6,6

1

5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74

6 5,9

9

5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06

7 5,5

9

4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64

8 5,3

2

4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35

9 5,1

2

4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14

10 4,9

6

4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98

11 4,8

4

3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85

12 4,7

5

3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75

13 4,6

7

3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67

14 4,6

0

3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60

15 4,5

4

3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54

área == 0,05

(valor tabulado)

Page 37: cap_7_8_9_10_11_3

37MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

16 4,4

9

3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49

17 4,4

5

3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45

18 4,4

1

3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41

19 4,3

8

3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38

20 4,3

5

3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35

21 4,3

2

3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32

22 4,3

0

3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30

23 4,2

8

3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27

24 4,2

6

3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25

25 4,2

4

3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24

26 4,2

3

3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22

27 4,2

1

3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20

28 4,2

0

3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19

29 4,1

8

3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18

30 4,1

7

3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16

35 4,1

2

3,27 2,87 2,64 2,49 2,37 2,29 2,22 2,16 2,11

40 4,0

8

3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08

45 4,0

6

3,20 2,81 2,58 2,42 2,31 2,22 2,15 2,10 2,05

50 4,0 3,18 2,79 2,56 2,40 2,29 2,20 2,13 2,07 2,03

Page 38: cap_7_8_9_10_11_3

38MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

3100 3,9

4

3,09 2,70 2,46 2,31 2,19 2,10 2,03 1,97 1,9

Fonte: www.inf.ufsc.br/~ogliari/arquivos/Tabelas.do

• Para obter os valores criticos da cauda inferior a partir da distribuição F

• Fi= 1/Fs

• quando Fs vem de uma distribuição F, com n2-1 graus de liberdade no numerador e

• n1-1 graus de liberdade no denominador.

• Para calcular o valor critico :

INVF ( ,n1-1,n2-1) unicaudal

INVF (α2

,n1-1,n2-1) bicaudal

exemplos :

• INVF (0,05,9,9)=3,18 unicaudal (Fs)

• INVF (0,025,9,9)=4,03 (FS) bicaudal

• Fi=1/4,03 = 0,248

8.7.1 Exercicios

26) MONTGOMERY (2003), para uma distribuição F , calcule o seguinte :

a) F0,25,5,10= 1,59 unicaudal

(bicaudal divide o alfa por dois) F (0,125,5,10)= FSuperior = 2,2820 Finferior=1

2,2820=0,4382

b) F0,10,24,9= c) F0,05,8,15= d) F 0,75,5,10=

respostas:1,59; 2,29;1,64;0,529

Page 39: cap_7_8_9_10_11_3

39MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

27) Duas companhias quimicas podem fornecer uma materia prima , cuja concentração de um

determinado elemento é importante. A concentração media para ambos os fornecedores é a mesma,

porem suspeitamos de que a variabilidade na concentração pode diferir entre duas companhias. O

desvio padrão da concentração em uma amostra aleatoria de n1=10 bateladas produzidas pela

companhia 1 é s1=4,7g/l, enquanto para a companhia 2, uma amostra aleatoria de n2=16 bateladas

resulta em s2=5,8 g/l. Há evidencias suficiente para concluir que as variâncias das duas populações

difiram? Use :α =0,05

F Test for Differences in Two

Variances DataLevel of Significance 0,05Population 1 Sample Sample Size 10Sample Standard Deviation 4,7Population 2 Sample Sample Size 16Sample Standard Deviation 5,8 Intermediate CalculationsF-Test Statistic 0,656659Population 1 Sample Degrees of

Freedom 9Population 2 Sample Degrees of

Freedom 15 Two-Tailed Test Lower Critical Value 0,265297Upper Critical Value 3,122707p-Value 0,531163Do not reject the null hypothesis

Nao podemos rejeitar a que as variancias sao diferentes

Page 40: cap_7_8_9_10_11_3

40MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

28) LEVINE (2005), a diretora de treinamento de uma empresa que produz equipamentos

eletronicos esta interessada em determinar se diferentes metodos de treinamento possuem algum

efeito sobre a produtividade de empregados, da linha de produção. Ela designa 42 empregados

recentemente contratados, para dois grupos com 21 empregados. O primeiro grupo recebe um

programa de treinamento individual, assistido por computador de uso pessoal , e outro recebe um

programa de treinamento baseado em equipes. Ao término do treinamento, os empregados são

avaliados em relação ao tempo ( em segundos) necessário para que seja montada uma peça.

Programa com base

individual assistido

por computador

Programa baseado

em equipes

19,4 16,7 16,5 22,4 13,8 23,7

20,7 19,3 17,7 18,7 18 17,4

21,8 16,8 16,2 19,3 20,8 23,2

14,1 17,7 17,4 15,6 17,1 20,1

16,1 19,8 16,4 18 28,2 12,3

16,8 19,3 16,8 21,7 20,8 15,2

14,7 16 18,5 30,7 24,7 16

a) utilizando um nivel de significancia de 0,05 , existem evidencias de uma diferença entre

variancias do tempo de montagem ( em segundos) para empregados treinados atraves de um

programa de treinamento individual assistido por computador e aqueles empregados que foram

treinados em um programa de treinamento baseado em equipes?

• APLICAÇÕES NA FERRAMENTA -CALC

TESTEF

Retorna o resultado de um teste F.

Sintaxe

TESTEF(Dados1; Dados2)

Dados1 é a primeira matriz de registros.

Dados2 é a segunda matriz de registros.

Exemplo

Page 41: cap_7_8_9_10_11_3

41MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

=TESTEF(A1:A30;B1:B12) calcula se dois conjuntos de dados são diferentes em suas variâncias e

retorna a probabilidade que ambos conjuntos possam ter vindo da mesma população total.

• APLICAÇÕES NA FERRAMENTA -GNUMERIC

F Test for Differences in Two Variances

DataLevel of Significance 0,05Population 1 Sample Sample Size 21Sample Standard Deviation 1,9333Population 2 Sample Sample Size 21Sample Standard Deviation 4,5767

Intermediate CalculationsF-Test Statistic 0,178441Population 1 Sample Degrees of

Freedom 20Population 2 Sample Degrees of 20

Page 42: cap_7_8_9_10_11_3

42MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

Freedom Two-Tailed Test Lower Critical Value 0,405764Upper Critical Value 2,464489p-Value 0,000311Reject the null hypothesis

As duas variâncias são diferentes.

• CALC – valor -p 0,00031121

b) com base nos resultados obtidos em (a), é apropriado utilizar o teste t para variancia agrupada

para comparar médias aritméticas dos dois grupos?

8.8 COMPARANDO DUAS AMOSTRAS RELACIONADAS ( EMPARELHADAS): TESTE t

PARA A DIFERENÇA ENTRE MÉDIAS ARITMÉTICAS-amostras dependentes

• LEVINE (2005, p. )Existem uma dependência entre os grupos devido ao fato dos itens

serem colocados em pares, ou combinados , de acordo com alguma característica, ou em

virtude de as medições repetidas serem obtidas a partir de um mesmo conjunto de itens.

• A variável de interesse representa a diferença entre os valores das observações, e não os

valores das próprias observações.

• Os itens ou indivíduos irão se comportar de uma mesma maneira, caso sejam tratados da

mesma forma, o objetivo da analise é demonstrar que: quaisquer diferenças entre duas

medidas dos mesmos itens resultam de diferentes condições de tratamento.

• O objetivo é estudar as diferenças entre duas medições, reduzindo o efeito da variabilidade

decorrente dos próprios itens.

FARBER (2009, p.369-370) , as condições são requeridas para conduzir o teste:

• amostras devem ser selecionadas aleatoriamente

• amostras devem ser dependentes ( emparelhadas)

• ambas as populações devem ser normalmente distribuidas.

simbolo descrição

n Numero de dados emparelhados

Page 43: cap_7_8_9_10_11_3

43MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

d Diferença entre entradas para dados emparelhados, d=x1-x2

μd Media hipotetica das diferenças de dados emparelhados na população.

d Média das diferenças entre entradas de dados emparelhados nas amostras dependentes:

d=∑ d

n

sd Desvio padrão das diferenças entre dados emparelhados nas amostras dependentes:

sd=∑ d−d 2

n−1

Teste t para diferença entre as médias

Estatistica de teste padronizada:t=

d−ud

S d

ngraus de liberdade : n-1

Teste de hipótese • Ho: μd=0 ( onde μ1-μ2=0)

• H1: μd≠0 ( onde μ1-μ2=0)

Premissas do teste da diferença da media

• Embora a população seja assumida como normalmente distribuída, na pratica foi descoberto

que,

• enquanto o tamanho da amostra não for bastante pequeno e a população não for

significativamente assimétrica, a distribuição t fornece uma boa aproximação da distribuição

de amostragem da diferença da media, d .

• Para testar a hipótese nula de que não existe nenhuma diferença entre duas medias

aritméticas de 2 populações relacionadas ( a diferença na media aritmética das

populações,μd é zero):

• Ho: μd=0 ( onde μ1-μ2=0)

• Contra a hipótese alternativa de que as medias aritméticas não são iguais ( a diferença das

medias aritméticas das populações μd =0).

Page 44: cap_7_8_9_10_11_3

44MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

A estatistica do teste t segue uma distribuição t, com n-1 graus de liberdade.

coeficiente de correlação: número entre [-1;1] que descreve a relação entre pares de variáveis.

coeficiente de correlação de Pearson (r): número entre [-1;1] que descreve a relação linear entre

pares de variáveis quantitativas.

propriedades de r:

o sinal de r indica que o tipo de relação linear , se é positiva ou negativa.

o valor de r , sem considerar o sinal, indica força da relação linear.

LEVINE (2005, p.111)

COMANDO NO CALC: pearson ou correl

Estimativa do intervalo de confiança para a diferença da média aritmetica

D±tS D

n

TESTE Z PARA A DIFERENÇA ENTRE DUAS MÉDIAS ARITMÉTICAS

• Quando a população é suficientemente grande o tamanho da amostra segue uma

distribuição normal.

8.8.1 Exercicios

29)Um desenho experimental para um teste t de medições repetidas necessita de uma medição

anterior e uma medição posterior a apresentação de estímulos em cada um dos 15 sujeitos. Quantos

graus de liberdade existem neste teste t?

Z=D−mD

s D

n

Page 45: cap_7_8_9_10_11_3

45MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

30) Um professor de uma escola de negócios deseja investigar os preços de novos livros na livraria

do campus e em uma livraria concorrente fora do campus, filial de uma cadeia nacional de livrarias.

O prof. escolhe aleatoriamente os livros solicitados em 12 cursos de escolas de negócios e compara

os preços nas duas livrarias:

preçosLivros Livraria do

campus

Livraria fora do

campus1 55 50,952 47,5 45,753 50,5 50,954 38,95 38,505 58,7 56,256 49,9 45,957 39,95 40,258 41,5 39,959 42,25 4310 44,95 42,2511 45,95 4412 56,95 55,60

a) a nível de significância de 0,01 existem evidencias de uma diferença entre a média aritmética do

preço de livros de negócios nas duas livrarias.

Teste-t: duas amostras em

par para médias

Variável 1

Variável

2Média 47,6750 46,1167Variância 44,3598 36,2824Observações 12,0000 12,0000Correlação de Pearson 0,9730 Hipótese da diferença de

média 0,0000 gl 11,0000 Stat t 3,3653 P(T<=t) uni-caudal 0,0032 t crítico uni-caudal 2,7181 P(T<=t) bi-caudal 0,0063 t crítico bi-caudal 3,1058

Page 46: cap_7_8_9_10_11_3

46MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

Resposta: como o valor -p no teste bicaudal é 0,0063 é menor que o nivel de significancia de 0,01,

então rejeita-se Ho de que existe uma diferença entre as médias.

rejeitar Ho:uD =0 ( onde uD =u1−u2 )

B)encontre o valor de p em (a) e interprete seu significado.

Valor p=0,0063

c) construa um intervalo de confiança 99% da diferença na média de preços entre duas livrarias.

8.9 TESTE DA SOMA DE CLASSIFICAÇÕES DE WILCOXON PARA DIFERENÇAS ENTRE

DUAS MEDIANAS

• FARBER (2009, p.494) os testes de postos de sinais de Wilcoxon é um teste não

paramétrico que pode ser usado para determinar se duas amostras dependentes ou

independentes foram selecionadas de populações que possuem a mesma distribuição.

• LEVINE (2005, p.372-373) , o teste da soma de classificações de Wilcoxon para

encontrar diferenças entre duas medianas.

• Caso os tamanhos das amostras sejam pequenos e não deseje avaliar a premissa de que os

dados em cada grupo seja extraidos de populações normalmente distribuidas, tem duas

opções:

pode-se utilizar um procedimento não paramétrico, que não depende da premissa da

normalidade ou

pode-se utilizar o teste t de variancia agrupada, seguindo alguma transformação

normalizante.

O teste da soma de classificações de Wilcoxon é para encontrar diferenças entre duas

medianas, procedimento não paramétrico.

Para realizar o teste da soma de classificações de Wilcoxon:

substitua as observações nas duas amostras de tamanhos n1 e n2, por classificações

combinadas.

Page 47: cap_7_8_9_10_11_3

47MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

classifica-se em ordem crescente o tamanho da amostra n=n1+n2 observações combinadas,

até que a classificação n seja a maior delas.

Na repetição de valores faz-se a média aritmetica entre as classificações.

Quando houver duas amostras de tamanhos diferentes,

utiliza-se n1 (menor tamanho) e n2 (maior tamanho).

A estatistica T1 corresponde ao teste de soma de classificações de Wilcoxon,

como sendo a soma de classificações de n1 ( menor amostra)

Verificando classificações T 1 +T 2=

n n+1 2

Grandes amostras: estatistica do teste T1 Media aritmética T 1

=n1 n+1

2

desvio padrão T 1= n1n2 n+1

12

Estatistica do teste ZZ=

T 1−T 1

T 1

Testes de hipotese: M1 e M2 (medianas das populações 1 e 2)

Teste bicaudal Ho: M1=M2

H1: M1≠M2

Teste unicaudal- inferior Ho: M1≥M2

H1:M1<M2

Teste unicaudal-superior Ho: M1 ≤ M2

H1:M1 > M2

CALC – seleciona variáveis e dados /ferramentas/dados/classificar/ coluna dos dados ordem

crescente / em seguida das variáveis ordem crescente.

os dados da amostra que forem iguais depois de classificados faz a média aritmética da

ordem de classificação.

Page 48: cap_7_8_9_10_11_3

48MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

8.9.1 Exercicios

31) Realize o teste da soma de classificações de Wilcoxon.

Amostra A Amostra B22 5234 7152 7662 5430 6740 8364 6684 9056 7759 84

32) As informações disponiveis para duas amostras extraidas a partir de populações independentes:

amostra 1: n1=7

classificações : 4,1,8,2,5,10,11

amostra 2: n2=9

classificações : 7,16,12,9,3,14,13,6,15

qual é o valor da estatistica do teste T1, se voce estiver testando a hipotese nula, de igualdade entre

as medianas das populações.

Resposta: 41

33) Um fabricante esta desenvolvendo uma bateria de hidreto de níquel para telefones celulares em

substituição a baterias de níquel-cádmio diretor de controle de qualidade decide avaliar o

desempenho da bateria recentemente desenvolvida em relação à amplamente utilizada bateria de

níquel-cádmio. Uma amostra aleatória de 25 baterias de cada tipo, são colocadas em telefones

celulares da mesma marca e modelo. A medida de desempenho de interesse é o tempo de

conversação (em minutos), até que seja necessária a recarga.Os resultados são seguinte:

Page 49: cap_7_8_9_10_11_3

49MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

Bateria de niquel

cadmio

Bateria de hidreto de

niquel

54,5 71 56,7 78,3 103 91,1

67,8 41,7 86,8 95,4 81,3 82,8

64,5 69,7 74,9 69,4 46,4 71,8

70,4 40,8 76,9 87,3 82,3 77,5

72,5 75,4 104,4 62,5 83,2 74,3

64,9 81 82 85 85,3 86,1

83,3 90,4 58,7 85,3 85,5 74,1

72,8 71,8 72,1 112,3

68,8 67 41,1 79,8

a) Utilizando um nivel de significancia de 0,05 , existem de uma diferença entre os dois tipos de

baterias em termos de mediana do tempo de conversação ( em minutos) até que seja necessaria a

recarga ?

Wilcoxon Rank Sum

Test Data Level of Significance 0,05 Population 1 Sample Sample Size 25Sum of Ranks 502,5Population 2 Sample Sample Size 25Sum of Ranks 772,5 Intermediate CalculationsTotal Sample Size n 50T1 Test Statistic 502,5T1 Mean 637,5Standard Error of T1 51,53882Z Test Statistic -2,61938 Two-Tailed Test Lower Critical Value -1,95996Upper Critical Value 1,959963

Page 50: cap_7_8_9_10_11_3

50MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

p-value 0,008809Reject the null

hypothesis

Rejeitamos que as medianas das duas populações são iguais.

b)Que premissas devem ser adotadas em (a)?

c) compare os resultados obtidos no problema 4 para as variancias iguais.

RESUMO

TESTE t para diferença entre duas medias

TESTE F para diferença entre as variâncias

TESTE de Wilcoxon para a diferença entre as medianas.

CAPITULO 9

9 ANÁLISE DA VARIÂNCIA

9.1 O MODELO COMPLETAMENTE ALEATORIO :ANALISE DA VARIANCIA DE FATOR

ÚNICO

Para   LEVINE   (2005,   p.390),algumas   aplicações   que   envolvem     experimentos   podem   ser

considerados os grupos ou níveis pertencentes a somente um fator de interesse.

• Fator: temperatura de cozimento ( pode possuir vários níveis numéricos : 300, 350, 400 e

450 graus centigrados).

TESTE F PARA DIFERENÇAS ENTRE DUAS MÉDIAS ARITMÉTICAS 

medidas numéricas são continuas;

metodologia usada Analise da Variância (ANOVA);

o objetivo é analisar diferenças entre as médias aritméticas dos grupos;

Page 51: cap_7_8_9_10_11_3

51MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

através da analise da   variação dos dados, fornece entre os grupos e dentro dos próprios

grupos;

a variação dos grupos é considerada erro experimental;

a variação entre os grupos é o efeito dos tratamentos.

 c=numero de grupos.

Admite­se que os (c) grupos sejam extraídas de maneira aleatória e independente, segue uma

distribuição normal e variância iguais.

O teste de hipótese :

Ho : µ1=µ2=...=µc ( não existe diferença entre as médias das populações)

admitindo­se que os (c)  grupos representam as populações,

 cujas medidas são extraídas de maneira aleatória e independente, 

seguem uma distribuição normal, 

e possuem variâncias iguais, 

H1: nem todas as µj   são iguais ( onde j=1,2..c)

é testada em relação à hipótese alternativa de que nem todas as c médias das populações são

iguais. 

A  variação   total   é   soma   total   dos   quadrados   (STQ),   é   obtido   através   da   soma  das

diferenças ao quadrado entre cada observação e sua media geral ( soma todas as observações

em todos os grupos combinados).

STQ=∑j=1

c

∑i=1

n j

X ij−X 2

  onde  X =média geral

A soma dos quadrados entre os grupos (SQE), medida através da soma da diferença ao quadrado

entre a media de cada amostra e a media geral.

SQE=∑j=1

c

n j X j−X 2

   nj= numero de  observações  no grupo ou nivel j

A variação dentro do grupo,  como a soma dos quadrados dentro dos grupos (SQD), mede a

diferença entre cada observação e a media  de seu próprio grupo.

SQD=∑j=1

c

∑i=1

n j

X ij−X 2

Page 52: cap_7_8_9_10_11_3

52MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

Obtendo os quadrados da media aritmética:

MQE=SQEc−1

     MQD=SQDn−c

        MTQ=STQn−1

c= numero de   grupos        n= numero  total de amostras

MQE=MEDIA DOS QUADRADOS ENTRE OS GRUPOS

MQD=MEDIA DOS QUADRADOS DENTRO DOS GRUPOS

MTQ=MEDIA TOTAL DOS QUADRADOS

SQE=VARIAÇÃO ENTRE OS GRUPOS

SQD=VARIAÇÃO DENTRO DO GRUPO

STQ=VARIAÇÃO TOTAL

  A estatistica do teste F Anova de fator único

F=MQEMQD

Rejeitar HO  se F>Fs

tabela resumida da analise da variância

Fonte Graus de liberdade

Soma dos quadrados

Quadrados da média arimética (variancia)

F( valor critico de Fs )INVF ( ,c­1;n­c) unicaudalα

Entre os grupos c­1 SQE MQEF=

MQEMQD

Dentro dos grupos

n­c SQD MQD Rejeitar HO  se F>Fs

total n­1 STQ                        FS  

9.2 EXERCICIOS

34)Resistência   à   tração   de   para­quedas   fabricados   com   fibras   sintéticas,   obtidas   através   de   4

fornecedores. Verificar se tem diferença entre as médias.  =0,05α

*Fator único é testar a resistência a tração.

• PARA COLAR NO GNUMERIC

Page 53: cap_7_8_9_10_11_3

53MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

• COLE ANTES NO CALC 

• tools/analise estatística /anova/fator único

Anova: fator único             RESUMO  

GrupoConta­

gem Soma MédiaVariân­

cia  Coluna 1 5 97,6 19,52 7,237  Coluna 2 5 121,3 24,26 3,683  Coluna 3 5 114,2 22,84 4,553  Coluna 4 5 105,8 21,16 8,903        ANOVA  Fonte da varia­

ção SQ gl MQ F valor­P F críticoEntre grupos 63,2855 3 21,0952 3,4616 0,0414 3,2389Dentro dos gru­pos 97,504 16 6,094     Total 160,7895 19        *MQ ou MS = média dos quadrados dentro dos grupos

Conclusão : 

• O valor de   Fcalculado=3,4616 > Fcritico =3,2389 ou  valor ­p é 0,0414 é menor que o nivel de

significancia de 0,05.

F1 F2 F3 F4

18,5 26,3 20,6 25,4

24 25,3 25,2 19,9

17,2 24 20,8 22,6

19,9 21,2 24,7 17,5

18 24,5 22,9 20,4

Page 54: cap_7_8_9_10_11_3

54MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

• rejeita­se de que as medias são todas iguais, sendo que pelo menos uma media é diferente

das demais 

9.3 COMPARAÇÕES MULTIPLAS: O PROCEDIMENTO TUKEY-KRAMER

• LEVINE (2005, p.399), quando  há evidencias de que existem medias diferentes pelo menos

uma, utiliza­se o procedimento de TUKEY, desenvolvido por John Tukey.

•   Este procedimento  Tukey­Kramer examina simultaneamente comparações entre todos os

pares de grupos. 

• O primeiro passo é calcular as diferenças  entre todos os pares de média aritméticas.

Obtendo o intervalo critico para o procedimento de Tukey­Kramer                              

Intervalo critico= Qs MQD2 1

n j

1

n' j  

nj : número de observações do grupo j.

n'j : número de réplicas de cada  grupo.

onde QS  é  o  valor  critico  da cauda superior  a  partir  da  distribuição de  intervalos  de Student,

possuindo (c) graus de liberdade no  numerador e (n­c) graus de liberdade no denominador.

Intervalo crítico: 

erro padrão da  diferença

• SQD: variação dentro do grupo.    

Qs MQD

2 1n

j

1

n' j

MQD

2 1

nj

1

n j' MQD=

SQD

n−c

Page 55: cap_7_8_9_10_11_3

55MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

• MQD: quadrado da média aritmética dentro dos grupos.

• n: tamanho total das amostras.

• c: numero de grupos

Estatistica Q de student usar a tabela n1=4 e n2=16 graus de liberdade

• Neste método é comparada a diferença absoluta entre os pares de   médias   com o valor

critico.

• Caso uma diferença da média em valor absoluto seja maior que o valor crítico existem uma

diferença entre os tratamentos ou por exemplo fornecedor 1 e fornecedor 2.

 PREMISSAS DE ANOVA

aleatoriedade e independencia­ os dados sejam extraidos de forma aleatoria e independente.

Normalidade­ extraidos de populações distribuidas de forma normal.

Homogeneidade da variancia­ afirma que a variancia dentro de cada população deve ser igual

para todas as populações.

9.4 EXERCICIOS

35) Conforme exercício anterior verificar quais dos fornecedores  são diferentes, quanto as medias?

Resposta: fornecedor 1 e 2.

36)   Uma   empresa   fabricante   de   petiscos   e   que

abastece   lojas   em   uma   área   metropolitana   com

produtos saudáveis  estavam interessada em melhorar  o  tempo de permanência  de seus petiscos

tortilla chips nas prateleiras em boas condições de consumo. Seis lotes( cada um contendo 1 libra)

do produto foram fabricados com 4 diferentes receitas e todos mantidos sob as mesmas condições

de   armazenamento.  As   condições  do  produto   eram verificados  diariamente   em  relação   a   suas

Fornecedor 1 Fornecedor 2 Fornecedor 3 Fornecedor 4

18,5 26,3 20,6 25,4

24 25,3 25,2 19,9

17,2 24 20,8 22,6

19,9 21,2 24,7 17,5

18 24,5 22,9 20,4

Page 56: cap_7_8_9_10_11_3

56MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

condições  de consumo.  O tempo de permanência  na prateleira,  em dias  ,até  que o produto ser

considerado impróprio para o consumo foi o seguinte:

Tipo de receita

A B C D

94 88 76 82

100 89 69 80

90 88 76 82

97 83 79 78

101 79 80 89

90 82 72 80a) nível de 0,05 verifique se existe diferença entre as médias do tempo de permanência?

 resposta: rejeitar Ho

b) determine quais os grupos diferem em relação a média do tempo de permanência na prateleira. 

Resposta: grupos 1 e 2;1 e 3; 1 e 4; 2 e 3; 2 e 4; 3 e 4

Procedimento de Tukey-Kramer

Diferença intervalo ouMédia Tamanho Absoluta Erro Padrão Amplitude

Grupos da Amostra da Amostra Comparação médias da Diferença Crítica Resultados1 95,3333 6 Grupo 1 com Grupo 2 10,5000 1,728034 6,84301 Médias são diferentes2 84,8333 6 Grupo 1 com Grupo 3 20,0000 1,728034 6,84301 Médias são diferentes3 75,3333 6 Grupo 1 com Grupo 4 13,5000 1,728034 6,84301 Médias são diferentes4 81,8333 6 Grupo 2 com Grupo 3 9,5000 1,728034 6,84301 Médias são diferentes

Grupo 2 com Grupo 4 3,0000 1,728034 6,84301 Médias são diferentesOutros Dados Grupo 3 com grupo 4 6,5000 1,728034 6,84301 Médias são diferentes

Nível de Significância 0,05g.l. numerador ( c ) 4g.l. denominador 20

17,9166Estatística Q 3,96 Pagina 796 nj numero de observações do grupo j

nj' numero de réplicas do grupo j

MQD-quadrado da media dentro dos grupos MQD

2 1

nj

1

n j'

Page 57: cap_7_8_9_10_11_3

57MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

9.5 O MODELO FATORIAL DE FATOR DUPLO: ANALISE DA VARIANCIA DE FATOR

DUPLO

• O modelo fatorial de fator duplo, em que dois fatores são simultaneamente avaliados e um

numero igual de repetições (n')

• Para os fatores A e B possuem uma interação se o  efeito que o fator A possui sobre as

medidas numericas for dependente do nivel do fator B.

• O procedimento ANOVA, conhecido ANOVA FATOR DUPLO  os termos são definidos:

• l=numero de niveis do fator  A

• c= número de niveis do fator  B.

• n'=  numero de valores (réplicas) para  cada célula ( combinação de um determinado

nível do fator A    com um determinado nível do fator  B)

• n= numero total de observações na experiencia ( onde n=lcn')

• Xijk = valor  k­ésima observação para o nível  i fator A e nível j do fator  B.

• X = média geral ou grande média  ( soma todos os valores e divide pelo total)

• X i =média aritmética de cada nivel do fator A (média geral de nivel de repetição)

• X j =média de cada coluna (fator B)

REPARTINDO A VARIAÇÃO TOTAL

STQ=SQA + SQB +SQAB + SQR( residuo)

 ANOVA DE FATOR DUPLO TEM TRES TESTES DISTINTOS PARA SEREM REALIZADOS:

FATOR   A ( linhas) 

• HO: todas as medias são iguais

• H1: nem todas as medias são iguais

 FATOR  B( colunas)

   HO: todas as medias são iguais

Page 58: cap_7_8_9_10_11_3

58MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

   H1: nem todas as medias são iguais

INTERAÇÃO ENTRE OS FATORES A E B

Ho: a interação de A e B igual a zero

H1: a interação de A e B não é igual a zero

Para  interpretar os resultados , inicia­se testando o efeito de interação entre o fator A e B, caso esse

efeito não seja significativo o foco se concentrara nos efeitos principais Fator A e Fator B.

Interpretando efeitos de interação

• Para uma melhor compreensão do conceito de interação,  construir   um grafico em

linhas das medias dos niveis de cada grupo. 

• Caso as linhas sejam paralelas não existe uma interação entre os fatores A e B.

9.6 EXERCICIOS

37)Resistência à tração dos  pára­quedas tecidos por dois tipos de teares. A partir de fibras sintéticas

oriundas de 4 fornecedores. Faça uma análise da variância de fator duplo.

fornecedor

teares 1 2 3 4

jetta 20,6 22,6 27,7 21,5

jetta 18,9 24,6 18,6 20

jetta 19 19,6 20,8 21,1

jetta 21,3 23,8 25,1 23,9

jetta 13,2 27,1 17,7 16

turk 18,5 26,3 20,6 25,6

turk 24 25,3 25,2 19,9

turk 17,2 24 20,8 22,6

turk 19,9 21,2 24,7 17,5

turk 18 24,5 22,9 20,4

a) ao nivel de 5% , existe uma interação entre os dois tipos de teares?

INTERAÇÃO ENTRE OS FATORES A E B

Resposta: 

Page 59: cap_7_8_9_10_11_3

59MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

• aceitar Ho, indica que a diferença entre as medias de resistencias a tração aos dois teares são

virtualmente iguais para os 4 fornecedores.

• Caso as linhas sejam paralelas não existe uma interação entre os fatores A e B.

b)no nivel de 0,05, existe um efeito devido aos 4 fornecedores? 

 FATOR  B( colunas)

Resposta: rejeitar Ho, existem evidencias de  uma diferença entre os 4 fornecedores, em termos de

media da resistencia a tração dos para­quedas.  

c) no nivel de significancia de 0,05 , existe um efeito devido aos dois tipos de teares?

 FATOR   A ( linhas) 

resposta:aceitar Ho, não existe diferença entre os dois tipos de teares.

F1 F2 F3 F4

0

5

10

15

20

25

30

GRAFICO DAS MEDIAS DE Turk e Jetta

turkjetta

4 fornecedores

Page 60: cap_7_8_9_10_11_3

60MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

Anova: fator duplo com repetição

RESUMO 1 2 3 4 Total

jetta

Contagem 5,0000 5,0000 5,0000 5,0000 20,0000

Soma 93,0000 117,7000 109,9000 102,5000 423,1000

Média 18,6000 23,5400 21,9800 20,5000 21,1550

Variância 10,1750 7,5680 18,3970 8,3550 12,8742

turk

Contagem 5,0000 5,0000 5,0000 5,0000 20,0000Soma 97,6000 121,3000 114,2000 106,0000 439,1000Média 19,5200 24,2600 22,8400 21,2000 21,9550Variância 7,2370 3,6830 4,5530 9,3350 8,5373

Total

Contagem 10,0000 10,0000 10,0000 10,0000Soma 190,6000 239,0000 224,1000 208,5000Média 19,0600 23,9000 22,4100 20,8500Variância 7,9738 5,1444 10,4054 7,9983

ANOVAFonte da variação SQ gl MQ F valor-P F crítico

Amostra 6,4000 1,0000 6,4000 0,7388 0,3964 4,1491Colunas 129,5210 3,0000 43,1737 4,9838 0,0060 2,9011Interações 0,0860 3,0000 0,0287 0,0033 0,9997 2,9011Dentro 277,2120 32,0000 8,6629

Total 413,2190 39,0000

9.7 O TESTE DE CLASSIFICAÇÕES DE KRUSKAL-WALLIS PARA DIFERENÇAS ENTRE

AS MEDIANAS

• Em LEVINE (2005), o teste de classificações de Kruskal­Wallis para a diferenças entre c

medianas ( c>2), 

• é utilizado com muita frequencia para testar se c grupos de amostras independentes foram

extraidos de  populações que possuem medianas iguais. 

Page 61: cap_7_8_9_10_11_3

61MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

TESTE  DE HIPOTESES

hipotese nula Ho: M1=M2=...=MC   

Hipotese alternativa H1:   nem   todos   os   Mj  são   iguais   (   onde

j=1,2,..,c)

A estatística do teste de Kruskal­Wallis para diferenças  em c medianas

H=[12n n+1

∑j=1

c

T j2

n j]−3 n+1

onde :

n= número  total de observações ao longo das amostras combinadas.

nj =número de observações na j­ésima amostra ( j=1,2,..,c)

Tj =   soma das classificações designadas à j­ésima amostra.

T j2 =quadrado da soma das classificações designadas à j­ésima amostra.

PREMISSAS DO  TESTE DE KRUSKAL­WALLIS

I. As c amostras são aleatórias e independentemente extraídas de suas respectivas populações.

II. A variável continua (evita igualdade)

III. Os dados observados constituem no mínimo um conjunto de classificações,   tanto dentro

quanto entre as c amostras.

IV. As c populações possuem a mesma variabilidade

V. As c populações possuem o mesmo formato

Para obter o valor critico cauda superior :

INV.QUI (ALFA, GRAUS DE LIBERDADE) ­TESTE QUI QUADRADO

9.8 EXERCICIOS

39) Um psicólogo do trabalho deseja testar se os tempos de resposta de trabalhadores de linhas de

montagem são equivalentes sob três diferentes métodos de aprendizagem. A partir de um grupo de

25 empregados recentemente contratados, 9 foram aleatoriamente designados para o método A, 8

para o método B e 8 para o método C. Após o período de aprendizagem, foi atribuída uma tarefa a

Page 62: cap_7_8_9_10_11_3

62MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

cada funcionário e medidos seus tempos de resposta. A tabela a seguir apresenta as classificações

dos tempos de respostas, desde 1(mais rápido) até 25(mais lento):

A) existem evidencias de uma diferença significativa entre a mediana dos tempos de resposta em

relação a estes métodos de aprendizagem?  =0,01α

Metodo A Metodo B Metodo C

2 1 5

3 6 7

4 8 11

9 15 12

10 16 13

14 17 18

19 21 24

20 22 25

23

DECISÃO : aceita­se  a hipótese nula de que as medianas são iguais.

hipótese alternativa H1: nem todas as medianas são iguais.

DadosNível de Significância 0,01

Grupo 1Soma de Classificações 104Tamanho da Amostra 9

Grupo 2Soma de Classificações 106Tamanho da Amostra 8

Grupo 3Soma de Classificações 115Tamanho da Amostra 8

Grupo 4Soma de Classificações 0Tamanho da Amostra 0

Cálculos IntermediáriosSoma das Classificações ao Quadrado/Tamanho da Amostra 4259,4Soma de Tamanhos de Amostras 25Número de grupos 3

0,64

Resultado do TesteValor Crítico 9,21

0,7279Não rejeitar a hipótese nula

Teste de Classificações de Kruskal-Wallishipótese nula Ho: M1=M2=...=MC

Estatística do Teste H

Valor-p

Entre com o nivel de significancia

Digite o numero de grupos

Page 63: cap_7_8_9_10_11_3

63MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

CAPITULO 10

10 TESTES PARA DUAS AMOSTRAS COM DADOS CATEGORICOS

10-1:TESTE Z PARA DIFERENÇA ENTRE DUAS PROPORÇÕES

• Para LEVINE (2005, p.433), é  comparar e analisar diferenças entre duas populações em

termos de uma variável categórica. 

• Um teste para a diferença entre duas proporções, obtidas a partir de amostras são obtidas a

partir de amostras independentes 

• (Amostras independentes – quando o resultado de um evento não afeta a probabilidade de

ocorrência de outro evento) utilizando dois diferentes métodos.)

• A estatística do  teste Z é aproximada através de um distribuição normal padronizada. 

Page 64: cap_7_8_9_10_11_3

64MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

• Avaliar diferenças entre duas proporções, baseando­se em amostras independentes, utiliza­

se um Teste Z, 

• com   uma distribuição normal  padronizada  para  tamanhos  de amostras  suficientementes

grandes.

• Esta estatística do teste Z determina a diferença entre duas proporções de populações, e é

baseada na diferença entre duas proporções (pa1­pa2).

• A estatística do teste Z tem a seguinte equação:

Z=pa1−pa2 −p1−p2

p 1−p 1n1

1n2

                              

com  :  p=X1X2

n1n2

      pa1=X1

n1

       pa2=X2

n2

                                      

pa1=proporção de sucessos na amostra1 

X1=numero de sucessos na amostra 1

n1=tamanho da amostra 1

p1=proporção de sucessos na população 1

pa2=proporção de sucessos na amostra2 

X2 =numero de sucessos na amostra 2

n2 =tamanho da amostra 2

p2 =proporção de sucessos na população 2.

Teste de hipótese ( bicaudal)

p1= proporção de sucessos na população 1.

P2=proporção de sucessos na população 2.

Ho:p1=p2

H1:p1ǂ p2

ESTIMATIVA   DO   INTERVALO   DE   CONFIANÇA   PARA   A   DIFERENÇA   ENTRE

PROPORÇÕES DE DOIS GRUPOS INDEPENDENTES

Page 65: cap_7_8_9_10_11_3

65MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

pa1−pa2 ±Z p 1-p 1n1

1n2

p=X1X2

n1n2

     pa1=X1

n1

    pa2=X2

n2

10. 1.1 Exercicios

40) LEVINE ( 2005, p.438), admita que n1=100 , X1=50, n2=100 e X2=30. 

a) no nivel de significancia de 0,05 , existem evidencias de uma diferença significativa entre as

proporções de sucessos no grupo 1 e grupo 2?

b) construa uma estimativa do intervalo de confiança de 95% da diferença entre as duas proporções.

41)  Um estudo  realizado como parte  de um esforço para  aperfeiçoamento  da  produção de um

fabrica de semicondutores  forneceu dados correspondentes  a defeitos  para uma amostra de 450

placas. A tabela de contingência a seguir apresenta um resumo das respostas para as duas perguntas

(alguma partícula  foi  encontrada  na fôrma que produziu a  placa?e  a  placa  é  de boa ou de má

qualidade?

Condição da formaQualidade

da placa

Nenhuma

particulas

particulas total

Boa 320 14 334má 80 36 216total 400 50 450

Page 66: cap_7_8_9_10_11_3

66MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

a)  No nível  de significância  de 0,05,  existe  uma diferença entre  a proporção de placas  de boa

qualidade e de má qualidade que contém partículas.

Conclusão : o teste estatístico Z=­4,4  é menor que o teste critico Z=­1,96 , portanto rejeita­se Ho

de que as medias são iguais.

b) Construa uma estimativa do intervalo de confiança de 95%, correspondente à diferença entre as

proporções  das  populações  relativas  a  placas  de boa qualidade e  de má  qualidade que contêm

partículas.

Dados:

pa1−pa2 ±Z p 1-p 1n1

1n2

n1=50  X1=14   pa1=14/50  n2=50  X2=36 pa2=36/50  p=50/100

Resultado1:[­0,636;­0,244] não está incluido o zero no   intervalo, por isso  rejeita­se Ho

42) Assuma que n1=100 X1=45, n2=50 e X2=25.

a) no nivel de significancia de 0,01  , existem evidencias de um diferença significativa entre as

proporções de sucessos no grupo 1 e grupo 2?

b) construa uma estimativa de intervalo de confiança de 99% da diferença entre as duas proporções.

10.2 TESTE QUI-QUADRADO 2 PARA A DIFERENÇA ENTRE DUAS PROPORÇÕES

• Na secção anterior foi comparar diretamente proporções em termos de sucesso.

•   Nesta  secção os  dados são examinados  em termos de  frequência  de sucessos  nos  dois

grupos.

• Um procedimento cuja estatística do teste é aproximada através de uma distribuição   qui­

quadrado, com 1 grau de liberdade.

TABELA DE CONTINGÊNCIA

Variável da coluna ( grupo)

Variáveis da linha 1 2 totais

sucessos X1 X2 X

insucessos n1-X1 n2-X2 n-X

Page 67: cap_7_8_9_10_11_3

67MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

totais n1 n2 n

TESTE QUI­QUADRADO    PARA A DIFERENÇA ENTRE DUAS PROPORÇÕES

• A estatística do teste qui­quadrado é   igual  a diferença ao quadrado entre as frequências

observada e esperada dividida pela frequência esperada em cada celula da tabela somada ao

longo de todas as celulas da tabela:

fo =freqüência observada, em um determinada célula de uma tabela de contingência 2x2

fe =freqüência esperada ou teórica,e uma determinada célula,se a hipótese nula for verdadeira.

f e=totaldacolunatotal dalinha

totalgeral

TESTE DE HIPÓTESE

Ho:p1=p2   ( não  existe nenhuma diferença entre duas proporções de população)

H1:p1 ǂ p2     ( existe uma diferença entre as duas proporções de população)

A regra de decisao  é ilustrada pela figura :

 

 

INV.QUI(0,05;1) α=0,05 e n=1 grau de liberdade

Verificando as premissas com relação a uma tabela 2x2: 

celulas as

2o2 )(f

todas e

e

f

f

Page 68: cap_7_8_9_10_11_3

68MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

Para que o teste ofereça resultados precisos para uma tabela 2x2, é assumido que cada freqüência

esperada seja pelo menos igual a 5.

10.2.1 Exercicios

43) LEVINE (2005, p.446) O The New York divulgou um estudo realizado  pela Henry J. Kaiser

Family Foundation , com relação ao papel dos meios de comunicação na vida das crianças. Em uma

das questões do estudo, foi perguntado as crianças se elas utilizam um computador todos os dias. Os

resultados encontram­se resumidos na seguinte tabela de contingência:

Utiliza computador todos os dias

idade sim nao total

02 ate 7 anos 283 807

08 ate 18 anos 1053 1012

total

a) ao nivel de significancia de 0,05 , existe uma diferença significativa entre as duas faixas etárias,

no que diz respeito a proporção de crianças que fazem uso do computador todos os dias?

Solução:

• TESTE DE HIPÓTESE

• Ho:p1=p2   ( não  existe nenhuma diferença entre duas proporções de população)

• H1:p1 ǂ p2     ( existe uma diferença entre as duas proporções de população)

• GNUMERIC

Test of Homogeneity

Test Statistic: 183,066

Degrees of Freedom: 1

p-Value: 1,0E−41

Critical Value: 3,84146

DECISÃO: como o valor-p 1*10-41 é menor que 0,05 rejeita-se Ho, então existe uma diferença nas

proporções das duas faixas etárias.

Page 69: cap_7_8_9_10_11_3

69MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

10.3 TESTE QUI-QUADRADO PARA DIFERENÇAS ENTRE MAIS DE DUAS PROPORÇÕES

• O teste qui­quadrado pode ser estendido para o caso geral, no qual existem duas ou mais

populações independentes.

• Teste de hipóteses

• Ho:p1=p2=...=pc

• H1:nem todas pj  são iguais, onde j=1,2,...,c

• Verificando as premissas em relação a uma tabela 2xc

• Todas as frequencias tem que ser grandes

• Frequencias esperadas forem iguais ou maiores que 0,5.

• Ou

• Não mais que 20% das células contenham frequencias esperadas inferiores a 5 e nenhuma

célula possua frequencia esperada inferior a 1.

• Para ter um equilibrio razoável é que cada frequencia esperada seja pelo menos igual a 1.

Suposições de alguns estatísticos.

10.3.1 Exercicios

44)Uma cadeia de lanchonetes deseja determinar se existem quaisquer diferenças entre os meios de

comunicação (revista, tv, radio), em termos do consumidor vir a  se recordar de uma propaganda.

Os resultados de um estudo em relação a propaganda são os seguintes:

Meios de comunicação

Capacidade de recordação revista tv rádio total

Numero de pessoas que se recordam da propaganda 25 10 7

Numero de pessoas que não se recordam da propaganda 73 93 108

total

Page 70: cap_7_8_9_10_11_3

70MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

a)Ao nivel de significância de 0,05, determine se existem evidência de um efeito significativo de

um meio de comunicação com relação à proporção de indivíduos que podem se recordar de uma

propaganda.

• Teste de hipóteses

• Ho:p1=p2=...=pc

• H1:nem todas pj  são iguais, onde j=1,2,...,c

Test of Homogeneity

Test Statistic: 19,0222

Degrees of Freedom: 2

p-Value: 7,4E−05

Critical Value: 5,99146

decisão : como valor­p é menor que 0,05 então rejeita­se  Ho.

b) Qual seria a sua resposta para (a), se 17 entre os 115 indivíduos que ouviram a propaganda no

radio pudessem se recordar dela?

10.4 TESTE QUI-QUADRADO PARA A INDEPENDÊNCIA

• No teste qui­quadrado para diferenças entre mais de duas proporções foi avaliar diferenças

potenciais entre a proporção de sucessos em qualquer número de populações.

Os teste qui­quadrado pode ser generalizado como um teste de independência.

• TESTE PARA A INDEPENDÊNCIA

• Ho: as  duas  variáveis  categóricas  são  independentes   (  não existe  nenhuma relação

entre elas)

• H1: as duas variáveis categóricas são dependentes ( existe uma relação entre elas)

• Verificando as premissas em relação a uma tabela l x c:

• Garantidos resultados precisos

• Todas as frequências esperadas sejam grandes.

10.4.5 Exercicios

Page 71: cap_7_8_9_10_11_3

71MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

45) LEVINE (2005, p.458) Uma grande corporação esta interessada em determinar se existe alguma

associação entre o tempo de transporte de seus empregados e o nivel de problemas relacionados ao

estresse no trabalho. Um estudo relativo a 116 trabalhadores da linha de produção revela o seguinte:

ESTRESSE

Tempo detransporte

alto moderado baixo total

Abaixo de 15minutos

9 5 18

15 – 45 minutos 17 8 28

Acima de 45minutos

18 6 7

a) no nivel de significancia de 0,01, existem evidencias de uma relação significativa entre o tempo

de transporte e o estresse?

Test of Independence

Test Statistic: 9,83114

Degrees of Freedom: 4

p-Value: 0,04337

Critical Value: 13,2767

decisão: existe um relação significativa entre o tempo de transporte e o estresse , isto é aceita­se Ho.

b) qual seria sua resposta para (a) se o nivel de significancia de 0,05 tivesse sido utilizado?

Resposta: rejeita­se Ho.

46) Durante a guerra do Vietnã, um sistema de loteria foi instituído para escolher homens a serem

requisitados para o serviço militar. Os números, representando dias do ano, foram aleatoriamente

selecionados; homens nascidos nos dias do ano com números baixos eram convocados em primeiro

Page 72: cap_7_8_9_10_11_3

72MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

lugar;  aqueles  com números mais  elevados  não eram convocados.  Os dados  a   seguir  mostram

quantos números baixos (1­122), médios (122­244) e altos (245­366) foram extraídos para datas de

nascimento em cada trimestre do ano.

trimestres

Conjunto de numeros jan-mar

abr-jun jul-set out-dez total

baixo 21 28 35 38 122

médio 34 22 29 37 122

alto 36 41 28 17 122

total 91 91 92 92 366

a)Existem evidências de que os números extraídos eram significativamente relacionados á época do

ano ?  =0,05

b) Quais seria resposta em  (a) se as frequencias fossem:

trimestres

Conjunto de numeros jan-mar abr-jun jul-set out-dez total

baixo 23 30 32 37 122

médio 27 30 34 31 122

alto 41 31 26 24 122

total 91 91 92 92 366

47)  WITTE   (2005,   p.379)     Alunos   são   classificados   de   acordo   com   sua   preferencia   religiosa

(   budista,   judaica,   protestante,   catolica   romana   ou   outras)   e   afiliação   poltica   (   democrata,

republicana ,independente ou outras)

Preferencia religiosa e afiliação politica

Preferencia religiosa

Afiliação politica

budista judaica protestante Catolica romana

outras total

democrata 30 30 40 60 40

republicana 10 10 40 20 20

independente 10 10 20 20 40

Page 73: cap_7_8_9_10_11_3

73MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

outras 0 0 0 0 100

total

a) utilizando o nivel de significancia de 0,05 , teste a hipotese nula que essas duas variáveis sejam

independentes.

solução: Ho : preferencia religiosa e afiliação politica são independentes H1: Ho é falsa.

Test of Independence

Test Statistic: 220

Degrees of Freedom: 12

p-Value: 2,4E−40

Critical Value: 21,0261

Decisão: rejeitar Ho ao nivel de significancia de 0,05 em razão do valor de -p 2,4*10^-40 é menor

de 0,05 ou χ2 =220 ser maior do que 21,03.

CAPITULO 11

11 REGRESSÃO LINEAR

Definição: uma linha de regressão tambem chamada de linha de melhor ajuste , é a linha para a

qual a soma dos quadrados dos residuos é um minimo. FARBER (2009,p.409) .

Considere o diagrama de dispersão e a linha mostrados a seguir:

Page 74: cap_7_8_9_10_11_3

74MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

11.1 A EQUAÇÃO DE UMA REGRESSÃO

FARBER (2009, p.410) A equação de uma reta de regressão para uma variável independente x e

uma variável dependente y é: y=mx+ b

48) Exemplo:

Encontre a reta de regressão para os gastos com propaganda e dados sobre vendas da empresa:

Custo de propaganda Vendas da empresa

2,4 225

1,6 184

2 220

2,6 240

1,4 180

1,6 184

2 186

2,2 215

a) qual é a reta de regressão

resposta:

b) use a equação para prever as vendas esperadas da empresa para os seguintes gastos com

propaganda:

i) 1,5 mil dólares resposta: 180,1538

ii) 1,8 mil dólares resposta:195,3724

iii) 2,5 mil dólares resposta: 230,8825

* os valores de previsão são significativos somente para valores de x na ( ou próximos a) faixa de dados.

11.2 EXERCICIOS

49) FARBER (2009, p.414) O numero de horas que 12 alunos passaram on-line durante o fim de

semana e as pontuações que cada um conseguiu em um teste na segunda-feira seguinte:

Horas gastas on-line x Pontuação no teste y

0 96

1 85

2 82

3 74

f(x) = 50,7287449393x + 104,0607287449

Page 75: cap_7_8_9_10_11_3

75MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

3 95

5 68

5 76

5 84

6 58

7 65

7 75

10 50Construa um diagrama de dispersão dos dados e desenhe a linha de regressão. Use a equação de

regressão para prever o valor de y para um dos valores x dados. Caso o valor de x não seja

importante para prever o valor de y , explique o porque.

A equação de regressão é -4,0674*x +93,9700

a) x=4 horas resposta: 77,7004

b) x=8 horas resposta: 61,6308

c) x= 9 horas resposta: 57,5634

d) x=15 horas resposta : este valor esta fora da faixa de dados, por isso não é possível prever o resultado.

11.3 CORRELAÇÃO (r)

◦ FARBER (2009, p.398) é uma medida da força e direção de uma relação entre duas

variáveis.

◦ A amplitude do coeficiente de correlação é -1 para 1.

◦ Mais próximo de zero não há correlação linear.

◦ Comandos no calc : correl ou pearson

11.4 COEFICIENTE DE DETERMINAÇÃO

FARBER (2009, p.420) o coeficiente de r2 é a relação da variação explicada com variação total.

r 2=

variação explicadavariaçã total

=∑ ( y i− y )2

∑ ( y i− y )2

• variação explicada é a soma dos quadrados das diferenças entre cada valor de y previsto e a

média de y.

• variação total é a soma dos quadrados das diferenças entre cada valor de y e a média de y.

Page 76: cap_7_8_9_10_11_3

76MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

O quadrado do coeficiente de correlação (r) é chamado de coeficiente de determinação (r 2 )

• Por exemplo se o coeficiente de correlação r= 0,90 , então o coeficiente de

determinação é r2=0,902= 81% , significa que 81% da variação de y podem ser

explicados pela relação entre x e y ;

• 19% restante da variação é não explicada e é em razão de outros fatores

50)FARBER (2009, p.425) A tabela mostra o numero de cigarros consumidos( em bilhoes) nos

EUA e o numero de cigarros exportados ( em bilhoes) nos EUA por 7 anos. Determine a equação

de regressão e o coeficiente de determinação.

Cigarros consumidos nos EUA (x) – bilhões Cigarros consumidos nos EUA (y)exportados – bilhões

435 166

430 154

425 145

415 130

400 127

388 122

376 124

RESPOSTA:

f(x) = 0,6711050038x - 136,7714651251R² = 0,7869564637

Page 77: cap_7_8_9_10_11_3

77MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

51) FARBER (2009, p.416) Use dos dados apresentados na tabela:

Numero de horas x Numero de bactérias y

1 165

2 280

3 468

4 780

5 1310

6 1920

7 4900

a) encontre a equação de regressão.

b) construa um grafico de dispersão de (x,log y) e encontre a equação de regressão.

c) uma equação exponencial é uma equação de regressão não linear da forma y=abx, encontre essa

equação.

d) uma equação de potencia é uma equação de regressão não linear da forma y=axb, encontre essa

equação.

Solução: y=axb, *APLICAR LOGARITMO NEPERIANO OU LOGARITMO NA BASE 10 NOS DOISTERMOS.• Ln y = Ln axb

• Ln (y)= Ln (a) + b Ln (x)

f(x) = 654,5357142857x - 1214,8571428572R² = 0,7243296207

f(x) = 3,8581524066x - 2,8885449998R² = 0,9837535766

f(x) = 93,0282142524·1,7119074994^xR² = 0,9897099883

Page 78: cap_7_8_9_10_11_3

78MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

• Y = Bo +B1X• Construir a tabela com Ln (y) e Ln(x).

FAZENDO A COMPARAÇÃO ENTRE Y=B0=B1*X e Ln y = Ln a +b* Ln x

• b=1,6163 * Ln a= 4,7148 a = exp(4,7148)= 111,5864• A EQUAÇÃO DE POTENCIA AJUSTADA É :• Y=111,5864∗X 1,6163

REFERENCIAS

• Disponivel em www.inf.ufsc.br/~ogliari/arquivos/Tabelas.doc, acessado em 29/10/2010

• Disponivel em www.dimap.ufrn.br/~marcilio/AM/ testehipotese .ppt, acessado em

13/10/2010.

• REFERENCIAS

• MONTGOMERY,   D.C.   e   RUNGER,G.C.  Estatística   Aplicada   e   Probabilidade   Para

Engenheiros. 2a edição RJ. Editora LTC.2003.     

• LEVINE, David M. et. al. Estatística –Teoria e Aplicações Usando o Microsoft Excel em

Português. 3a ed.RJ Editora LTC. 2005.

• CRESPO, A. Estatística Fácil. 14a ed .SP. Editora Saraiva.1994        

• BROFFICE

• LARSON & FARBER. Estatística Aplicada. 4a edição.SP.Pearson Education.2009.

• DOMENICO, Luiz Carlos De. MATEMATICA 3 em 1. Artes Gráficas e Editora- Unificado.

Curitiba.PR.

f(x) = 1,6163518497x + 4,7148129033R² = 0,89906368

x y LN(x) LN(y)

1 165 0,0000 5,1059

2 280 0,6931 5,6348

3 468 1,0986 6,1485

4 780 1,3863 6,6593

5 1310 1,6094 7,1778

6 1920 1,7918 7,5601

7 4900 1,9459 8,4970

Page 79: cap_7_8_9_10_11_3

79MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS PATO BRANCO

Coordenação do Curso Análise e Desenvolvimento de Sistemas 

• FARBER, Betsy. LARSON, Ron. Estatística Aplicada. São Paulo. 4 edição.2009. Pearson.

• MILONE, Giuseppe. Estatistica Geral e Aplicada.São Paulo: Thomson Learning.2006.

• WITTE, John S.; WITTE, Robert S. Estatística. LTC. 7a edição 2005. 506p. ISBN 85-216-1441-

1