EST001 – Elementos de Estatística
Prof. Dr. Clécio da Silva Ferreira - Departamento de Estatística - UFJF 1
Cap. 4 - Estimação por Intervalo
Amostragem e inferência estatística
População: consiste na totalidade das observações em que estamos
interessados.
Nº de observações na população é denominado tamanho=N.
Amostra: um subconjunto de observações selecionadas a partir de uma
população. Tamanho da amostra: n.
Definição: As variáveis aleatórias (X1, X2,..., Xn) são uma amostra
aleatória (aa ou iid) de tamanho n se
a) Os Xi’s forem variáveis aleatórias independentes e
b) Cada Xi tiver a mesma distribuição de probabilidades.
Quando a amostragem é aleatória podemos fazer inferências sobre a
população a partir de uma amostra.
Estatística: é qualquer função das observações em uma amostra aleatória.
Parâmetro: descrição numérica de uma característica da população,
geralmente desconhecida.
Exemplos de parâmetros: média de altura de uma população; variância,
proporção de peças defeituosas, etc...
EST001 – Elementos de Estatística
Prof. Dr. Clécio da Silva Ferreira - Departamento de Estatística - UFJF 2
Estimação de Parâmetros
Estimador: é uma estatística usada para estimar um parâmetro
populacional, a partir de uma amostra aleatória.
Exemplos de estimadores:
a) X (média amostral): estimador da média populacional;
b) S2 (variância amostral): estimador da variância populacional;
c) S (desvio padrão amostral): estimador do desvio padrão
populacional
EST001 – Elementos de Estatística
Prof. Dr. Clécio da Silva Ferreira - Departamento de Estatística - UFJF 3
d) p (proporção amostral): estimador da proporção populacional, etc.
O valor que um estimador assume uma determinada amostra é denominado
estimativa do parâmetro.
Objetivo: Estimar um parâmetro de uma população de uma variável X
(que pode ser a média , a variância 2, o desvio padrão , a proporção
de objetos com determinada característica de interesse, etc) de uma
população em estudo consiste na determinação do valor numérico do
mesmo a partir de uma estatística adequada definida numa amostra
aleatória extraída da população em estudo.
Na prática selecionamos apenas uma amostra, produzindo apenas uma
estimativa.
Como um estimador é uma variável aleatória, o mesmo tem média e
variância.
Assim, mesmo que o estimador seja não tendencioso a estimativa obtida
pode estar muito distante da verdadeira média populacional.
Então, outra propriedade desejável é que o estimador tenha uma
variância pequena, reduzindo assim a possibilidade da estimativa ser
muito diferente do valor do parâmetro.
Acurácia: observações próximas (em torno) do valor alvo, real ou
esperado.
Precisão: observações próximas da média do conjunto de observações
(baixa variabilidade).
EST001 – Elementos de Estatística
Prof. Dr. Clécio da Silva Ferreira - Departamento de Estatística - UFJF 4
EST001 – Elementos de Estatística
Prof. Dr. Clécio da Silva Ferreira - Departamento de Estatística - UFJF 5
Estimação pontual No processo de estimação por ponto admite-se como valor numérico
do parâmetro a estimativa calculada a partir de uma amostra aleatória
extraída da população em estudo.
Exemplo: Na estimação por ponto da média populacional de uma
variável X admite-se que x , onde x é uma estimativa de dada por
n
xx
n
i i 1
sendo x1, x2, ..., xn observações da variável X uma amostra de tamanho n
extraída da população de observações desta variável para estimar a média
populacional .
Existem outros processos de estimação pontual, não
abordados aqui.
No processo de estimação por intervalo, usa-se a distribuição
amostral do estimador para a construção de um intervalo, sendo que
este intervalo tem uma probabilidade =1- α, especificada a priori, de
conter o verdadeiro valor do parâmetro estimado.
O intervalo é denominado intervalo de confiança de 100% e a
probabilidade é denominada nível de confiança. Os níveis de
confiança usuais são 0,95 (95%) e 0,99(99%).
Intervalo de Confiança:
Expressa o grau de incerteza associado com uma estimativa.
Intervalo com 100(1- α)% de confiança para o parâmetro θ:
Interpretação: Se K amostras aleatórias de mesmo tamanho n forem
coletadas e um IC de 100(1- α)% for calculado para cada amostra, então
100(1- α)% desses K intervalos contem o valor verdadeiro do parâmetro θ.
Observações:
Quanto maior for o IC, menor é sua precisão.
A metade do IC é sua precisão.
EST001 – Elementos de Estatística
Prof. Dr. Clécio da Silva Ferreira - Departamento de Estatística - UFJF 6
Distribuições Amostrais
o A seleção da amostra a partir de um plano amostral probabilístico
faz com qualquer estimador (estatística) seja uma VA. Por que?
Por causa da aleatoriedade introduzida pelo sorteio realizado
no processo de amostragem.
o Uma estatística é uma VA aleatória e a sua distribuição de
probabilidades é chamada de distribuição amostral.
o Consideraremos um plano amostral por amostragem aleatória
simples (AAS) com reposição com n = 2.
5,3
16
15
16
25,4
16
34
16
45,3
16
33
16
25,2
16
12XE
nXV
2222
2
25,1625,0
16
1)5,35(...
16
2)5,35,2(
16
1)5,32()(
EST001 – Elementos de Estatística
Prof. Dr. Clécio da Silva Ferreira - Departamento de Estatística - UFJF 7
o Observe que a distribuição da população e a distribuição da média
amostral têm a mesma média (valor esperado).
o A distribuição da média amostral é mais concentrada e é
parecida com a distribuição Normal.
Distribuição Amostral da Média
o O esquema abaixo resume o que vimos até agora:
EST001 – Elementos de Estatística
Prof. Dr. Clécio da Silva Ferreira - Departamento de Estatística - UFJF 8
o Se consideramos uma AAS nXXX ,...,, 21 e o estimador X , a
distribuição de X terá as seguintes propriedades:
o )(XE
o n
XV2
)(
.
Teorema Central do Limite: Se X1, X2,..., Xn for uma aa de tamanho de
uma população (finita ou infinita), com média µ e variância σ2 finita, então
a forma limite da distribuição de
,
onde Z é a distribuição normal padrão.
Em geral para 30n a aproximação é boa.
A distribuição T de Student com =n1 graus de liberdade. A distribuição T é simétrica, tem esperança matemática igual a zero e
variância igual a ).2/( nn A forma da desta distribuição depende de seu
número de graus de liberdade da mesma. O gráfico a seguir ilustra esta
distribuição para = 1, = 4 e = 20.
(a) = 1 (b) = 4 (c) = 20
Figura 1
Se é suficientemente grande (na prática, 30) a distribuição t se
aproxima da distribuição normal padrão.
As probabilidades dos valores da distribuição t de Student se
encontram no apêndice. Os valores t>0 da variável T nesta tabela são tais
que P(Tt)=,
EST001 – Elementos de Estatística
Prof. Dr. Clécio da Silva Ferreira - Departamento de Estatística - UFJF 9
Intervalos de Confiança para parâmetros populacionais
1) Intervalo de confiança para a média populacional
Suponha que a população de uma variável X tenha distribuição
normal com média igual a e desvio padrão .
Figura 2
O intervalo de confiança de 100 % para a média populacional é dado
por
,
onde é o quantil da distribuição T(n-1).
Para n grande (n>30), pode-se utilizar o quantil da normal no lugar
do quantil da T de Student. Ou seja,
,
onde é o quantil da normal padrão.
Exemplo: Um pesquisador observou o custo de produção, em R$, numa
amostra de 10 unidades de um artigo produzido por certo fabricante
escolhidas aleatoriamente da produção, encontrando os seguintes valores:
10, 11, 7, 9, 6, 7, 10, 7, 6 e 8. Construa e interprete um intervalo de 95%
para o custo médio de produção do artigo considerado.
Solução
1,810
81
10
10
1 i ix
x
79,1
90
81
9
685
)110(10110
2210
1
10
1
2
i ii i xx
s
EST001 – Elementos de Estatística
Prof. Dr. Clécio da Silva Ferreira - Departamento de Estatística - UFJF 10
Sendo =0,95, =0,05, o coeficiente de confiança, ,95,0t é um valor da
variável T tal que 95,0)( 025,0025,0 tTtP como ilustra o gráfico a seguir.
Figura 3
A variável T tem distribuição t de Student com
=n1=101=9 graus de liberdade. Pela tabela da T de Student tem-
se para = 9 e = 0,05 que 025,0t = 2,26.
Assim sendo, o intervalo de confiança de 95% para o custo médio
deste artigo é
57,026,21,857,026,21,8 39,9$R81,6$R
Com este resultado acredita-se que a probabilidade de que o intervalo
acima contenha o custo médio das unidades deste artigo é de 0,95.
1.1) Determinação do tamanho da amostra para estimação da média
Na construção de um intervalo de confiança de 100% para a média
da população de uma variável X deve-se inicialmente estipular a precisão
do intervalo de confiança desejado e em função desta precisão dimensionar
o tamanho da amostra. Na amostragem com reposição constata-se que a
precisão deste intervalo é
Xst
Considerando amostragem com reposição
n
ssX
Logo,
n
st
Então
2
22
Stn
EST001 – Elementos de Estatística
Prof. Dr. Clécio da Silva Ferreira - Departamento de Estatística - UFJF 11
A estimativa S é determinada a partir de uma amostra inicial
denominada amostra piloto com n’ elementos (sendo n’ arbitrário e nunca
inferior a 30) e considera-se = para se determinar o valor t. Se n for
maior que n’, o tamanho da amostra definitiva será n e deve-se acrescentar
às n’ observações da amostra piloto novas observações até completar a
amostra de tamanho n; se o valor n calculado for menor ou igual a n’, a
amostra piloto já é suficiente e o tamanho da amostra definitiva será n =
n’.
Exemplo: Um pesquisador deseja estimar o preço médio de um produto
nos pontos de venda de certa região, de modo que o erro de estimação seja
no máximo igual a R$2,00, admitindo-se um nível de confiança de 95%. O
pesquisador dispõe de uma amostra piloto de 40 pontos de venda nos quais
o desvio padrão do preço do produto é igual a R$12,00. Qual deve ser o
tamanho da amostra?
Solução
Não tendo sido informado o tamanho da população (número de
pontos de venda da região) admite-se amostragem com reposição ou
amostragem sem reposição de uma população muito infinita ou população
finita muito maior que a amostra e assim sendo, o tamanho da amostra é
2
22
stn
Pelos dados do problema, tem-se que = 2 e = 12. Sendo =
0,95 e = , tem-se da tabela t de Student tem-se que 95,0t =1,96. Então, o
tamanho da amostra para estimar o preço médio do produto nos pontos de
venda da região é
2
22
2
1296,1
n 139 n
2) Intervalo de confiança para a proporção populacional
Suponha que certa população tenha uma proporção de objetos com
uma característica de interesse para o pesquisador (por exemplo, pode
ser a proporção de unidades defeituosas de certo artigo numa linha de
produção).
EST001 – Elementos de Estatística
Prof. Dr. Clécio da Silva Ferreira - Departamento de Estatística - UFJF 12
Neste caso, o estimador não tendencioso de é a proporção amostral
p, que é uma variável aleatória que associa a uma amostra de n objetos a
proporção p de objetos na amostra com a característica de interesse, ou
seja,
Temos que
Para grandes amostras (n 30), a variável aleatória
tem distribuição aproximadamente normal padronizada. Logo,
onde
é o quantil 1-α/2 da normal padrão (por exemplo, se α=5%,
z0.025=1.96).
Tentando isolar π, teríamos
Porém, temos uma dependência do próprio parâmetro nas
inequações. Temos duas saídas para resolver este problema:
1. Substituir o valor de dentro da raiz pelo seu valor estimado p.
Assim, o intervalo de confiança “otimista” de nível 1-α para é
dado por
.
2. Como é uma parábola com concavidade voltada para
baixo, podemos substituir a equação pelo seu máximo, que é de ¼
(quando ). Obtemos então um intervalo de confiança
“conservador”, dado por
EST001 – Elementos de Estatística
Prof. Dr. Clécio da Silva Ferreira - Departamento de Estatística - UFJF 13
.
Exemplo: Um produtor deseja estimar a proporção de itens de certo artigo
na linha de produção de sua empresa que apresentam defeito de fabricação.
Para esta finalidade, retirou uma amostra de 200 itens retirados
aleatoriamente da linha de produção, constatando que 16 destes
apresentam defeito de fabricação.
Construa e interprete um intervalo de confiança de 95% para a
proporção de itens na linha de produção que apresentam defeito de
fabricação.
Solução: A proporção de “sucessos” (itens defeituosos) na amostra é de p = 16/200=8%. Sendo =1-α=0,95 tem-se . Então o intervalo de confiança “otimista” de 95% para a proporção de itens defeituosos na linha de produção é
.
Por outro lado, sendo “conservador”, o intervalo resultante é dado por
Notem a grande diferença entre os dois intervalos. Isso irá sempre
acontecer quando a estimativa pontual da proporção for “afastada” de ½.
3.1) Determinação do tamanho da amostra para a estimação da
proporção
Como no caso da média, para se construir um intervalo de confiança
de para a proporção populacional deve-se dimensionar o
tamanho da amostra para uma precisão preestabelecida do intervalo de
confiança desejado.
A precisão do intervalo é
Psz
Logo,
n
ppz
)1(2/
EST001 – Elementos de Estatística
Prof. Dr. Clécio da Silva Ferreira - Departamento de Estatística - UFJF 14
Resolvendo-se a equação para n tem-se que
2
2
2/ )1(
ppz
n
A estimativa p da proporção populacional pode ser obtida a partir de
uma amostra piloto como no caso da média. Caso seja muito difícil obter
uma estimativa inicial da proporção e considerando-se que n atinge um
valor máximo quando p = 0.5, pode-se arbitrar este valor para p. Sugere-se
um tamanho de amostra piloto em torno de n=200.
Caso não seja feita a amostra piloto, pode-se tomar o valor máximo
p(1-p), que é ¼. Neste caso existe o risco de que, em determinadas
situações, sejam obtidas amostras de tamanho muito maior que o
necessário, com .4
2
2
2/
zn
Exemplo: Com o objetivo de estimar a proporção de itens defeituosos
numa produção, um administrador de produção deseja extrair uma amostra
aleatória de itens da referida produção para tal fim. Uma amostra piloto de
40 itens apresentou 4 defeituosos. Qual deve ser o tamanho da amostra
definitiva para que o erro de estimação da proporção de defeituosos na
população seja de no máximo 3% a um nível de confiança de 95%?
Solução: Não tendo sido informado o tamanho da população (número de
itens produzidos), admite-se amostragem com reposição ou amostragem
sem reposição de uma população infinita ou muito maior que a amostra e,
assim sendo, o tamanho da amostra é
2
2
2/ )1(
ppz
n
A estimativa de obtida a partir da amostra piloto é 1,040
4p .
Pelos dados do problema, tem-se que = 0,03. Sendo = 0,95
tem-se, pela tabela da normal padrão, que 025,0z =1,96. Então, o tamanho da
amostra para estimar a proporção de itens defeituosos na produção é
2
2
03,0
)1,01(1,096,1
n 385 n
Neste caso deve-se acrescentar 345 itens à amostra piloto antes de se
construir o intervalo de confiança para a proporção. Desconsiderando a
amostra piloto, teríamos .106803,0*4
96,1
2
2
n
EST001 – Elementos de Estatística
Prof. Dr. Clécio da Silva Ferreira - Departamento de Estatística - UFJF 15
Figura 4: Estimativas de proporções amostrais de M=100 amostras
aleatórias de tamanho n=50 de uma Bernoulli(p=0.1).
A Figura 4 ilustra a situação de utilização de uma amostra piloto de
n=50, onde a proporção amostral foi de p=0.1. Ao replicar
“artificialmente” amostras de mesmo tamanho com probabilidade p=0.1,
notem que as proporções amostrais resultantes podem divergir bastante.
Ou seja, utilizar resultados de amostras pilotos de tamanho pequeno para
calcular tamanho de amostras é arriscado. Aumentando o tamanho da
amostra piloto para n=200, os valores são mais próximos, conforme pode
ser visto na Figura 5.
EST001 – Elementos de Estatística
Prof. Dr. Clécio da Silva Ferreira - Departamento de Estatística - UFJF 16
Figura 5: Estimativas de proporções amostrais de M=100 amostras
aleatórias de tamanho n=200 de um Bernoulli(p=0.1).
EST001 – Elementos de Estatística
Prof. Dr. Clécio da Silva Ferreira - Departamento de Estatística - UFJF 17
Apêndice
TABELA: Distribuição normal padrão.
P(Z>z)
0 z
áreatabulada
segunda decimal de z
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641 0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247 0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859 0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483 0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121
0,5 0,3085 0 ,3050 0 ,3015 0 ,2981 0 ,2946 0 ,2912 0 ,2877 0 ,2842 0 ,2810 0 ,2776 0,6 0,2743 0 ,2709 0 ,2676 0 ,2643 0 ,2611 0 ,2578 0 ,2546 0 ,2514 0 ,2483 0 ,2451 0,7 0,2420 0 ,2389 0 ,2358 0 ,2327 0 ,2296 0 ,2266 0 ,2236 0 ,2206 0 ,2177 0 ,2148 0,8 0,2119 0 ,2090 0 ,2061 0 ,2033 0 ,2005 0 ,1977 0 ,1949 0 ,1922 0 ,1894 0 ,1867 0,9 0,1841 0 ,1814 0 ,1788 0 ,1762 0 ,1736 0 ,1711 0 ,1685 0 ,1660 0 ,1635 0 ,1611
1,0 0,1587 0 ,1562 0 ,1539 0 ,1515 0 ,1492 0 ,1469 0 ,1446 0 ,1423 0 ,1401 0 ,1379 1,1 0,1357 0 ,1335 0 ,1314 0 ,1292 0 ,1271 0 ,1251 0 ,1230 0 ,1210 0 ,1190 0 ,1170 1,2 0 ,1151 0 ,1131 0 ,1112 0 ,1093 0 ,1075 0 ,1056 0 ,1038 0 ,1020 0 ,1003 0 ,0985 1,3 0 ,0968 0 ,0951 0 ,0934 0 ,0918 0 ,0901 0 ,0885 0 ,0869 0 ,0853 0 ,0838 0 ,0823 1,4 0 ,0808 0 ,0793 0 ,0778 0 ,0764 0 ,0749 0 ,0735 0 ,0722 0 ,0708 0 ,0694 0 ,0681
1,5 0 ,0668 0 ,0655 0 ,0643 0 ,0630 0 ,0618 0 ,0606 0 ,0594 0 ,0582 0 ,0571 0 ,0559 1,6 0 ,0548 0 ,0537 0 ,0526 0 ,0516 0 ,0505 0 ,0495 0 ,0485 0 ,0475 0 ,0465 0 ,0455 1,7 0 ,0446 0 ,0436 0 ,0427 0 ,0418 0 ,0409 0 ,0401 0 ,0392 0 ,0384 0 ,0375 0 ,0367 1,8 0 ,0359 0 ,0352 0 ,0344 0 ,0336 0 ,0329 0 ,0322 0 ,0314 0 ,0307 0 ,0301 0 ,0294 1,9 0 ,0287 0 ,0281 0 ,0274 0 ,0268 0 ,0262 0 ,0256 0 ,0250 0 ,0244 0 ,0239 0 ,0233
2,0 0 ,0228 0 ,0222 0 ,0217 0 ,0212 0 ,0207 0 ,0202 0 ,0197 0 ,0192 0 ,0188 0 ,0183 2,1 0 ,0179 0 ,0174 0 ,0170 0 ,0166 0 ,0162 0 ,0158 0 ,0154 0 ,0150 0 ,0146 0 ,0143 2,2 0 ,0139 0 ,0136 0 ,0132 0 ,0129 0 ,0125 0 ,0122 0 ,0119 0 ,0116 0 ,0113 0 ,0110 2,3 0 ,0107 0 ,0104 0 ,0102 0 ,0099 0 ,0096 0 ,0094 0 ,0091 0 ,0089 0 ,0087 0 ,0084 2,4 0 ,0082 0 ,0080 0 ,0078 0 ,0075 0 ,0073 0 ,0071 0 ,0069 0 ,0068 0 ,0066 0 ,0064
2,5 0 ,0062 0 ,0060 0 ,0059 0 ,0057 0 ,0055 0 ,0054 0 ,0052 0 ,0051 0 ,0049 0 ,0048 2,6 0 ,0047 0 ,0045 0 ,0044 0 ,0043 0 ,0041 0 ,0040 0 ,0039 0 ,0038 0 ,0037 0 ,0036 2,7 0 ,0035 0 ,0034 0 ,0033 0 ,0032 0 ,0031 0 ,0030 0 ,0029 0 ,0028 0 ,0027 0 ,0026 2,8 0 ,0026 0 ,0025 0 ,0024 0 ,0023 0 ,0023 0 ,0022 0 ,0021 0 ,0021 0 ,0020 0 ,0019 2,9 0 ,0019 0 ,0018 0 ,0017 0 ,0017 0 ,0016 0 ,0016 0 ,0015 0 ,0015 0 ,0014 0 ,0014
3,0 0,00135 3,5 0,000 233 4,0 0,000 031 7 4,5 0,000 003 40 5,0 0,000 000 287
EST001 – Elementos de Estatística
Prof. Dr. Clécio da Silva Ferreira - Departamento de Estatística - UFJF 18
Top Related