desvio_padrao

38
Estatística amintas paiva afonso

description

Noções sobre desvio padrão

Transcript of desvio_padrao

Page 1: desvio_padrao

Estatísticaamintas paiva

afonso

Page 2: desvio_padrao

Estimativa pontualIntervalo de ConfiançaTamanho da amostra

Page 3: desvio_padrao

Estimativa pontual para a média

ESTIMAR A MÉDIA DA POPULAÇÃO

Média amostral

(média das médias)

Como foi visto anteriormente a média da população é igual à média das médias

Como podemos estimar o verdadeiro valor da média da população se temos em mãos a média de uma amostra?

Page 4: desvio_padrao

Intervalo de Confiança

É uma faixa de possíveis valores em torno da média amostral, e a probabilidade de que esta faixa realmente contenha o valor real da média da população

O Intervalo de confiança terá uma certa probabilidade chamada de nível de confiança (simbolizada por 1 – ) de conter a média da população.

x

1 – α/2 /2

Intervalo de confiança

1 – α = nível de confiança

α = nível de significância (probabilidade de erro)

Há uma probabilidade de 1 – da média estar contida no intervalo definido

Há uma probabilidade de a média amostral estar fora do intervalo definido (área hachurada)

Se usarmos um desvio padrão em torno da média (Z = 1), a chance de erro ao estimar a média será de 31,74%. Mas, se usarmos dois (Z = 2), a chance de erro será de 4,56%.

Page 5: desvio_padrao

Intervalo de Confiança

z2z1

Erro = z . Desvio padrão amostral

nz.e intervalo

errox errox

(μ)

1)( exexP

α /2 α /2

= desvio padrão da população

1 - α = grau de confiança

Distribuição das médias amostrais

x

1 – α

Page 6: desvio_padrao

Intervalo de Confiança

Se o desvio padrão da população é conhecido:

A estimativa intervalar da média populacional se baseia na hipótese de que a distribuição amostral das médias amostrais é normal. Para grandes amostras isto não apresenta dificuldade especial, pois se aplica o teorema do limite central.

Todavia, para amostras de 30 ou menos observações, é importante saber se a população tem distribuição normal ou aproximada.

XzX .:

nX

Page 7: desvio_padrao

Intervalo de Confiança

Se o desvio padrão da população é desconhecido:

Quando o desvio padrão da população não é conhecido (o que é o caso, geralmente), usa-se o desvio padrão da amostra como estimativa, substituindo-se x por Sx nas equações. Isto não acarreta maiores dificuldades, pois o desvio padrão amostral dá uma aproximação bastante razoável do verdadeiro valor, na maioria dos casos.

Além disso, pelo teorema do limite central, sabemos que, quando a amostra é maior que 30, a distribuição das médias é aproximadamente normal.

Para amostras menores que 30, a aproximação normal não é adequada. Devemos então usar a distribuição t. A forma da distribuição t é bem parecida com a normal.

n

SzX X.

Page 8: desvio_padrao

Intervalo de Confiança

exouexex Quando tem n > 30 e

é conhecido

Quando tem n > 30 e

σ é desconhecido

Substitui o desvio padrão

da população pelo desvio padrão da amostra s

Região Crítica

Região Crítica

Z/2Z/2

ZcríticoZcrítico

1 - α

xnX

XzX .:

nze

.

n

Sze X.

n

SzX X.

Page 9: desvio_padrao

Intervalo de Confiança

X5050403020 807060Amostra1

2

3

...

45

46

47...

98

99100 =50

Se em um estudo, forem retiradas várias amostras aleatórias de tamanho n da população e que, para cada amostra, seja construído um intervalo de (1-) de confiança para a variável desejada.

Os intervalos obtidos serão diferentes, mas (1-)% destes intervalos conterão entre os seus intervalos o valor real do parâmetro.

Ao nível de 95% de confiança espera-se que em 100 intervalos para as amostras, 95 deles contenham a média μ

Interpretação:

Page 10: desvio_padrao

Intervalo de Confiança

E quando o tamanho da amostra é menor que 30 (n < 30) e o desvio padrão da população () é desconhecido?

Neste caso não podemos usar a distribuição normal (a distribuição das médias não é normal).

Devemos usar a distribuição t (t de student).

A distribuição t é similar à distribuição normal, mas tem maior variação nas caudas (nas pontas da curva).

Page 11: desvio_padrao

Distribuição t de Student

Distribuição t de student com n = 3

Distribuição t de student com n = 12

Distribuição normal padronizada

A curva t nos dá a probabilidade de ocorrer um evento a t desvios padrão da média (para mais ou para menos)

os valores de t (valores correspondentes à área sob a curva nas caudas) são tabelados e dependem de dois fatores:

n-1 = graus de liberdade

grau de confiança desejado (1- α)

Page 12: desvio_padrao

Intervalo de Confiança

exouexex

n

ste n 1,2/

n

ste ncrítico 1,

n

ste

Quando tem n < 30 e σ é desconhecido

Substitui o desvio padrão da população pelo desvio padrão da amostra s

ouou

Page 13: desvio_padrao

Intervalo de Confiança

Imagine que tivéssemos uma amostra de tamanho tão grande que tendesse ao infinito. O que ocorreria?

O erro seria próximo de zero (desconsiderável) e a média da amostra seria igual a média da população, sem a necessidade

de estimar um intervalo.

Page 14: desvio_padrao

Escolha a distribuição adequada

Início

n > 30?

população tem

distr. normal?

população

é conhecido

Usar distribuição t

usar métodos não-paramétricos ou de reamostragem

sim

sim

sim

não

não

não

Pelo teorema do limite central podemos usar a distrib. normal (use s se não for conhecido)

nze

2/

usar a distribuição normal

nze

2/

n

ste n 2/,1

Page 15: desvio_padrao

Exercícios

Determine o valor crítico que corresponde ao

grau de confiança indicado:

2/Z

a) 99%

b) 94%

c) 92%

d) 90%

Page 16: desvio_padrao

Exercícios

Resolução:

0,01 2,58

0,10 1,65

0,08 1,75

0,06 1,88

Grau de Confiança

(1 – α)

Valor Crítico

(Z α/2)

99%

94%

92%

90%

Page 17: desvio_padrao

ExercíciosUm dos principais produtos de uma indústria siderúrgica é a folha de flandres. Havia uma preocupação com a possibilidade de haver um número de folhas fora da faixa de especificação de dureza (LIE = 58,0 HR e LSE = 64,0 HR). A partir desta informação a empresa decidiu estimar a dureza média das folhas de flandres () coletando uma amostra aleatória de 49 folhas.

61,0 60,2 60,3 60,3 60,0 61,0 60,360,0 60,0 60,9 61,0 61,2 59,2 60,960,0 60,5 59,8 59,3 61,0 59,6 59,859,6 60,1 58,0 59,8 58,9 57,6 58,060,5 60,1 61,6 61,1 59,7 58,3 61,659,5 59,0 60,3 58,7 59,6 54,2 60,361,0 59,7 59,9 59,9 60,0 58,6 59,9

Medidas de dureza (HR) das folhas-de-flandres fabricadas pela siderúrgica

61,0

21,60

s

X

Para um grau de confiança de 95%, determine a margem de erro (E) e o intervalo de confiança para média populacional ().

Page 18: desvio_padrao

Exercícios

49

61,0

21,60

n

s

X

n

sZE

2

Margem de erro:

17,01708,049

61,0.96,1 E

Dados:

Grau de confiança de 95% implica em: 1 – = 95%,

logo α = 5% = 0,05 e α/2 = 0,025. Z α/2 = Z0,025 = 1,96

-Z/2Z/2

1 - α

0

/2 /2

Page 19: desvio_padrao

Exercícios

ExEx Intervalo de confiança:

17,021,6017,021,60

[60,04 ; 60,38]HR

Interpretação:

Se fôssemos selecionar muitas amostras de 49 elementos da produção de folhas e construíssemos um intervalo de 95% de confiança para cada amostra, 95% desses intervalos conteriam a média populacional .

38,6004,60

Page 20: desvio_padrao

Exercícios

Uma máquina automática de suco industrial é regulada de modo que a quantidade suprida de cada vez, tenha distribuição aproximadamente normal com desvio-padrão de 35ml. Determine um intervalo de 96% de confiança para a quantidade média de toda produção, sabendo que uma amostra de 30 embalagens teve um conteúdo médio de 290 ml.

mls

mlX

35

290

n = 30

n

sZE .

2

10,1330

35.05,2 E

Grau de confiança de 96% implica em:1 - = 96% = 4% = 0,04

05,202,0

2

ZZ

ExEx 10,1329010,13290

[276,90 ; 303,10] ml

Dados:

-Z/2Z/2

1 - α

0

/2 /2

10,30390,276

Page 21: desvio_padrao

Cálculo do Tamanho da Amostra• O conceito de nível de confiança pode ser utilizado para o cálculo do tamanho da amostra, necessário para fazermos inferências confiáveis.

• Se a amostra empregada for muito pequena, a margem de erro será grande, o que impossibilita ou inviabiliza a tomada de decisão.

• Por outro lado, se a amostra for muito grande, o intervalo obtido pode ser mais estreito do que o necessário (gastos desnecessários);

Como o tamanho da amostra afeta o erro de amostragem?

2

2/ .

E

sZn

n

sZE .

2

Page 22: desvio_padrao

Cálculo do Tamanho da Amostra

500 1000 1500 2000 2500 3000

Tamanho da amostra

Mar

gem

de

erro

(E

)

0,5

1,0

1,5

3,0

2,0

2,5

Tamanho de amostra e margens de erromantendo fixos (s=10 e 95% de confiança)

• Os ganhos em precisão conseguidos com aumentos fixos dos tamanhos das amostras não são constantes;• Tamanho de amostra 5.000 podem ser um perda de tempo e dinheiro porque elas fornecem pouca precisão adicional;

Page 23: desvio_padrao

Exercícios

Em um estudo para a determinação do perfil dos alunos da Faculdade Pitágoras, a característica de maior interesse tem s = 0,3. Qual deve ser o tamanho da amostra para que tenhamos 95% de confiança em que o erro da estimativa da correspondente a esta característica não supere 0,05?

2

2/ .

E

sZn

13905,0

)3,0).(96,1(.22

2/

E

sZn

Dados:E = 0,05s = 0,3 =0,05

Refaça o cálculo supondo que se deseja ter 98% de confiança.

Page 24: desvio_padrao

Conclusões

• Intervalos de confiança são muito mais informativos do que as estimativas pontuais;

• Toda estimativa intervalar está associada a um grau de confiança;

• Quando se tem n < 30 ou não se conhece o desvio-padrão da população usamos a distribuição t.

Referência Bibliográfica

Triola – Introdução a Estatística, p.144-158;Stevenson - Estatística aplicada à AdministraçãoSlack – Estatística para Administração; p. 262-277.Soares et al.; - Introdução a Estatística; p.132 –155

Page 25: desvio_padrao

Estimativa pontual para proporção

• A estimativa de proporções populacionais é muito semelhante à de médias populacionais;

Estimadores

Estimativa pontual de uma proporção

Estimativa intervalar de uma proporção

• 21% das peças são defeituosas;•45% dos eleitores votariam novamente no Presidente Lula

• Entre 18 e 23% das peças são defeituosas;• A proporção de votos para reeleição do Presidente está entre 15 a 25%.

• A média de uma distribuição amostral de proporções amostrais é sempre igual a verdadeira proporção da população.

Page 26: desvio_padrao

Intervalo de Confiança

O QUE É PROPORÇÃO?

Num lote de 1000 peças foram encontradas 150 peças defeituosas, logo

Proporção de peças defeituosas é P = (150/1000)*100 = 15%

Existem 15% de peças defeituosas no lote.

O que podemos falar sobre esta proporção na população?

Nos outros lotes a proporção é a mesma? Possivelmente serão diferentes.

Precisamos estimar

Intervalo de confiança

Page 27: desvio_padrao

Estimativa pontual para a média

Sendo:

π = p = proporção da população

= proporção média das proporções amostrais (x/n)

= 1-

n

qpze

ˆˆ2/

eppep

epp

ˆˆ

ˆ

Erro

Intervalo de confiança1- α = grau de confiança

α = nível de significância (probabilidade de erro)

Desvio padrão da distribuição das médias das proporções

n

qpp

ˆˆ

q̂ p̂

Page 28: desvio_padrao

Intervalo de Confiança

Estimativa pontual Estimativa intervalar

n

xp ˆ

O estimador da proporção amostral:

Sendo X o número de elementos da amostra (n)

que apresenta a característica de estudo;

O erro-padrão da estimativa:

n

qppEP

ˆ.ˆ)( pq ˆ1ˆ

Sendo:

n

qpZp

ˆ.ˆ.ˆ

2

• Intervalo de (1-)% de confiança;

• Supondo amostras grandes (n > 40);

• Se população for finita e n > 5% de N:

1

.ˆ.ˆ

.ˆ2 N

nN

n

qpZp

22

2

ˆ.ˆ

E

qpZn

Para o cálculo do tamanho da

amostra:

A proporção populacional é igual a proporção amostral!

Page 29: desvio_padrao

Intervalo de Confiança

Populações grandes ou infinitas

Não há necessidade de reposição

Probabilidades de cada prova é constante

Populações finitas ou quando amostra é superior a 5% da

população ( n/ N > 5%)

Não se faz a reposição;

A probabilidade de cada prova varia

Os desvios padrões das distribuições amostrais devem ser multiplicados pelo fator de correção finita

N – população

n - amostra1

N

nN

Page 30: desvio_padrao

Correções p/ Populações Finitas

Desvio padrão das médias amostrais

Desvio padrão das proporções amostrais

1

N

nN

nx

1

ˆˆ

N

nN

n

qpp

Page 31: desvio_padrao

Exercícios

Uma amostra de 200 observações acusou 20 baterias defeituosas numa remessa. Usando uma confiança de 99%, determine o erro de estimação máximo provável.

10,0200

20ˆ

n

xp 90,010,01ˆ1ˆ pq

0547,0200

)90,0).(10,0(58,2

ˆ.ˆ.)ˆ(

2

n

qpZpE

Grau de confiança de 95% implica em:1 - = 99% = 1% = 0,010

58,2005,0

2

ZZ

5,47%

Page 32: desvio_padrao

Exercícios

Um fabricante de cintos de segurança deseja estimar a probabilidade dos cintos resistirem a um esforço. Como o teste é destrutível, ele deseja manter o tamanho da amostra o menor possível. Determine o número de observações que devem ser feitas para estimar a probabilidade a menos de 0,04 com 95% de confiança, se ele crê (baseando-se em experimentos anteriores) que a percentagem de defeituosos não supere a 6%.

1364,13504,0

)94,0.(06,0.96,1

ˆ.ˆ2

22

2

E

qpZn

Page 33: desvio_padrao

ExercíciosQual o tamanho da amostra necessária para estimar o tempo médio que um vendedor de uma loja de móveis gasta com cada cliente, a menos de 2 minutos do verdadeiro valor, para obter um nível de confiança de 99% de confiança? Suponha o desvio da população igual a 12 minutos (obs.: sempre arredondamos a resposta para o próximo número inteiro superior.)

24063,2392

)12).(58,2(.22

2/

E

Zn

E = 2 minutos

= 12 minutos

Grau de confiança de 99% implica em:1 - = 99% = 1% = 0,01 58,20050,0

2

ZZ

Page 34: desvio_padrao

ExercíciosA Polícia Rodoviária faz mensalmente uma pesquisa para avaliar a velocidade desenvolvida nas rodovias durante o período de 2 às 4 horas da madrugada. Num período de observação e em um trecho específico, 100 carros passaram por um aparelho de radar a uma velocidade média de 115 Km/h, com desvio padrão de 10 Km/h. a) Estime a verdadeira média (estimativa pontual) da população;b) Construa um intervalo de 98% de confiança para a média da população;

115 Km/h

33,2100

10.33,2.

2

n

sZE

Margem de erro:

Grau de confiança de 98% implica em:1 - = 98% = 2% = 0,02

33,201,0

2

ZZ ExEx Intervalo de confiança

33,211533,2115

[112,67 ;117,33]Km/h

Page 35: desvio_padrao

ExercíciosUma amostra aleatória de 40 contas não-comerciais na filial de um banco acusou saldo médio de R$140,00 com desvio-padrão de R$30,00.a) Construa um intervalo de 95% confiança para a verdadeira média.b) Construa um intervalo de 99% confiança para a verdadeira média.c) A que conclusão podemos chegar com os resultados das letras anteriores?

30,940

30.96,1.

2

n

sZE

Margem de erro:

96,1025,0

2

ZZ

Intervalo de confiança

30,914030,9140

[130,70 ; 149,30] R$

24,1240

30.58,2.

2

n

sZE

Margem de erro:

58,2005,0

2

ZZ

Intervalo de confiança

24,1214024,12140

[127,76 ; 152,24]R$

140+9,30 140+12,24

Page 36: desvio_padrao

ExercíciosUm grupo de pesquisa de mercado constatou que 25% dos 200 fregueses recentemente entrevistados num grande shopping center de Belo Horizonte residem a mais de 5 Km deste local.a) Construa um intervalo de 95% de confiança para a percentagem efetiva de fregueses que moram a mais de 5 km do Shopping Center;b) Qual é o erro provável máximo associado ao intervalo?

25,0ˆ n

Xp

0600,0200

)75,0).(25,0(.96,1

ˆ.ˆ

2

n

qpZE

310,0190,0

0600,0250,00600,0250,0

ˆˆ

p

p

EppEp Intervalo de

confiança

75,025,01ˆ1ˆ pq

Erro máximo 6%.

Page 37: desvio_padrao

Estimativa pontual para a médiaA Biblioteca da faculdade deseja estimar a percentagem de livros de seu acervo que são publicados até 1995. Qual deve ser o tamanho da amostra aleatória para se ter 90% de confiança de ficar menos de 5% da verdadeira proporção?

27325,27205,0

)5,01.(5,0.65,1

ˆ.ˆ2

22

2

2

E

qpZn

Grau de confiança de 90% implica em:1 - = 90% = 10% = 0,10

65,105,0

2

ZZ

Quando, o enunciado do problema não contém informação sobre o tamanho possível da proporção populacional, os cálculos devem basear-se no intervalo mais amplo possível, o que ocorre quando o valor amostral da proporção é igual à: 50,0ˆ p

A proporção de uma amostra piloto seria uma 2ª opção

Page 38: desvio_padrao

www.matematiques.com.bramintas paiva

afonso