Inferência Estatística –
Distribuições Amostrais e TCL
� Introdução e conceitos fundamentais
� Distribuição amostral
� Teorema central do limite
1
Divisão da Estatística
�� DescritivaDescritiva
�� InferênciaInferência
2
Idéia fundamentalIdéia fundamental
Inferência Estatística
Dar informação sobre o Dar informação sobre o todotodo com com base no conhecimento da base no conhecimento da parteparte
3
“Não é preciso beber toda a garrafa “Não é preciso beber toda a garrafa para saber se o vinho é bom.” para saber se o vinho é bom.”
�������� Pesquisas são feitas com amostrasamostras , mas o pesquisador quer estender os resultadosestender os resultados que obteve para toda a populaçãopopulação .
populaçãopopulação
amostraamostra
pesquisaspesquisas
interesseinteresse
Pesquisador Pesquisador quer fazer quer fazer inferênciainferência
4
ConceitoConceito:: É o conjunto de procedimentos estatísticos quetêm por finalidade generalizar conclusões de uma amostrapara uma população.
Inferência estatísticaInferência estatística
⇒⇒⇒⇒ Erro provávelGeneralização= Inferência
Exemplo: Pesquisas eleitorais no Rio Grande do Sul
Resultados
Amostragem(deve garantir a
Candidato A - 25% Candidato B – 18% Candidato C – 12%
�
��
�
�
��
�
��
�
�
��
�
��
�
�
�
�
��
��
�
�
�
�
��
�
�
�
�
�� �
�
�
���
5
Amostra (de 1000 a 2000 entrevistados)População
(8 milhões de eleitores)
(deve garantir a representatividade)
��
�� �
����� �
��
N = tamanho N = tamanho da populaçãoda população n = tamanho n = tamanho
da amostrada amostra (1, 1)
(1, 2)14 4 A amostra é A amostra é
Exemplo
com reposiçãocom reposição
[X1, X2]
n=2
(1, 2)16
5 4
32
4 4
3
1 (1, 3)
(6, 6)
. . .
A amostra é A amostra é uma variável uma variável
aleatóriaaleatória
[X1, X2] X S2
N=10
6
[X1, X2]
(1, 1)
(1, 2)
(6, 6). . .
(1, 3)
X S
. . . . . .
1,5x2 =1x1 =
2x3 =
6xk =
0s21 =
0,5s22 =
2s23 =
0s2k =
Amostra: [X1, X2, ..., Xn]
Como a amostra é uma variável aleatória, qualquer função da amostra (soma, média, variância) também será uma variável aleatória.
Variável aleatóriaVariável aleatória
X S2EstatísticasEstatísticas
Variáveis aleatóriasVariáveis aleatóriasX Variáveis aleatóriasVariáveis aleatórias
. . .
1x
2x
kx. . .
21s22s
2ks
Se temos k amostras Se temos k amostras de mesmo tamanho n, de mesmo tamanho n,
temos k médias e temos k médias e variânciasvariâncias
EstatísticaEstatística é qualquer valor obtido em função da amostra .
7
EstatísticaEstatística é qualquer valor obtido em função da amostra .
�������� Como as estatísticas são variáveis aleatórias, também terãoalguma distribuição de probabilidade com média, variância, etc.
DistribuiçãoDistribuição amostralamostral é a distribuição de probabilidade deuma estatística .
Exemplo:
O mecânico de uma oficina de regulagem para carros 1.0, 1.4, 2.0,cobra pelo serviço 40, 45 e 50 reais, respectivamente. Seja a variávelX = valor cobrado pelo mecânico, com a seguinte distribuição deprobabilidade:
a) Determine a média e a variância da população .
X = x 40 45 50 Σ P(X = x) 0,2 0,3 0,5 1
46,50,5500,3450,240p(x)x µE(X) =×+×+×=== ∑
8
46,50,5500,3450,240p(x)x µE(X)XSx
=×+×+×=== ∑∈
15,2546,50,5)500,3450,2(40
µ)E(XσV(X)2222
222
=−×+×+×=−==
Exemplo:
O mecânico de uma oficina de regulagem para carros 1.0, 1.4, 2.0,cobra pelo serviço 40, 45 e 50 reais, respectivamente. Seja a variávelX = valor cobrado pelo mecânico, com a seguinte distribuição deprobabilidade:
X = x 40 45 50 Σ P(X = x) 0,2 0,3 0,5 1
b) Suponha a retirada de uma amostra de tamanho nn == 22 , comreposição.
9
Quantas e quais são as possíveis amostras retiradas da população equal a probabilidade associada a cada uma?
Determine a média e a variância da distribuição amostral da média .
n = 2 → [X1, X2]onde:→ k = Nn = 32 = 9 quantas
X = x 40 45 50 Σ P(X = x) 0,2 0,3 0,5 1
Amostra [X1, X2] P [X1, X2] X
1 (40, 40) 0,2 . 0,2 = 0,04 40
2 (40, 45) 0,2 . 0,3 = 0,06 42,5
3 (40, 50) 0,2 . 0,5 = 0,10 45
onde:k = número de amostras possíveis N = tamanho da populaçãon = tamanho da amostra
10
3 (40, 50) 0,2 . 0,5 = 0,10 45 4 (45, 40) 0,06 42,5
5 (45, 45) 0,09 45
6 (45, 50) 0,15 47,5 7 (50, 40) 0,10 45
8 (50, 45) 0,15 47,5
9 (50, 50) 0,25 50
quais
Distribuição amostral da média das amostras de tamanho 2
xX = 40 42,5 45 47,5 50 Σ
P( xX = ) 0,04 0,12 0,29 0,3 0,25 1
46,5
0,25500,347,50,29450,1242,50,0440
)xp( xµ)XE(XSx
X
=×+×+×+×+×=
== ∑∈
= µ (média da população)
11
7,625
46,50,25)500,1242,50,04(40
µ)XE(σ)XV(2222
2X
22X
=−×++×+×=
−==
K
= metade de σ2 (variância da população)
Exemplo:
O mecânico de uma oficina de regulagem para carros 1.0, 1.4, 2.0,cobra pelo serviço 40, 45 e 50 reais, respectivamente. Seja a variávelX = valor cobrado pelo mecânico, com a seguinte distribuição deprobabilidade:
X = x 40 45 50 Σ P(X = x) 0,2 0,3 0,5 1
c) Suponha a retirada de uma amostra de tamanho nn == 33 , comreposição.
12
reposição.
Quantas e quais são as possíveis amostras retiradas da população equal a probabilidade associada a cada uma?
Determine a média e a variância da distribuição amostral da média .
n = 3 → [X1, X2 , X3] → k = Nn = 33 = 27
Quantas?Quantas?
Quais?Quais?
Amostra [X1, X2, X3] P[X1, X2, X3] X Amostra [X1, X2, X3] P[X1, X2, X3] X1 (40, 40, 40) 0,008 40 15 (45, 45, 50) 0,045 46,72 (40, 40, 45) 0,012 41,7 16 (45, 50, 40) 0,030 453 (40, 40, 50) 0,020 43,3 17 (45, 50, 45) 0,045 46,74 (40, 45, 40) 0,012 41,7 18 (45, 50, 50) 0,075 48,35 (40, 45, 45) 0,018 43,3 19 (50, 40, 40) 0,020 43,36 (40, 45, 50) 0,030 45 20 (50, 40, 45) 0,030 457 (40, 50, 40) 0,020 43,3 21 (50, 40, 50) 0,050 46,78 (40, 50, 45) 0,030 45 22 (50, 45, 40) 0,030 45
13
8 (40, 50, 45) 0,030 45 22 (50, 45, 40) 0,030 459 (40, 50, 50) 0,050 46,7 23 (50, 45, 45) 0,045 46,7
10 (45, 40, 40) 0,012 41,7 24 (50, 45, 50) 0,075 48,311 (45, 40, 45) 0,018 43,3 25 (50, 50, 40) 0,050 46,712 (45, 40, 50) 0,030 45 26 (50, 50, 45) 0,075 48,313 (45, 45, 40) 0,018 43,3 27 (50, 50, 50) 0,125 5014 (45, 45, 45) 0,027 45
Distribuição amostral da média das amostras de tamanho 3
xX = 40 41,7 43,3 45 46,7 48,3 50 Σ
P( xX = ) 0,008 0,036 0,114 0,207 0,285 0,225 0,125 1
2 2 2V(X) E(X )= σ = − µ
= µ (média da população)
Xx SXE(X) x p(x)
, , , ,
,
∈= µ =
= × + × + + ×=
∑
40 0 008 41 7 0 036 50 0 125
46 5
K...
14
2 2 2X XV(X) E(X )
( , , , , ) 4 ,
,
= σ = − µ
= × + × + + × −=
2 2 2 240 0 008 41 7 0 036 50 0 125 6 5
5 083
K
= um terço de σ2 (variância da população)
...
Amostras de tamanho n = 2
População
46,5µE(X) ==
15,25σV(X) 2 ==µ=)XE(
7,625σ)XV( 2X == = σ2/2
Amostras de tamanho n = 2
46,5µ)XE( X == = µ
Amostras de tamanho n = 3
nσ
)XV(2
=
µ=)XE(
σσ2
===σ
15
5,083σ)XV( 2X == = σ2/3
Amostras de tamanho n = 3
46,5µ)XE( X == = µn
σ
nσ
)XV(X ===σ
Erro padrão da média
Distribuição de probabilidade da população
X = x 40 45 50 Σ P(X = x) 0,2 0,3 0,5 1
Distribuição amostral da média das amostras de tamanho 2
xX = 40 42,5 45 47,5 50 Σ
P( xX = ) 0,04 0,12 0,29 0,3 0,25 1
16
Distribuição amostral da média das amostras de tamanho 3
xX = 40 41,7 43,3 45 46,7 48,3 50 Σ
P( xX = ) 0,008 0,036 0,114 0,207 0,285 0,225 0,125 1
Comparando o histograma da população X com os histogramas da
Distribuição da média das amostras de tamanho 2
Distribuição da média das amostras de tamanho 3
Distribuição da população
17
Comparando o histograma da população X com os histogramas da média para as amostras de tamanhos 2 e 3, observamos que,
mesmo a distribuição da população não sendo simétri ca, a distribuição amostral da média tende para a simetria à medida que
o tamanho da amostra aumenta .
18
Qual é a distribuição da média?Qual é a distribuição da média?
�� Se a população (X) de onde foi extraída a amostra aleatória não tiver distribuição normal, então a distribuição amostral da média se aproximará da normal à medida que o tamanho da amostra (n) cresce (Teorema Central do Limite ).
�� Se a população (X) de onde foi extraída a amostra aleatória tiver distribuição normal, então a distribuição amostral da média será normal.
As médias são iguais, mas a se X ~ N (µ, σ2),
amostra (n) cresce (Teorema Central do Limite ).
19
iguais, mas a variância de é n
vezes menor.Xentão, ~ N (µ, σ2/n)X
Exercício proposto: Sabe-se a variável X (peso do queijo ralado contido em pacotinhos de 100g vendidos em supermercados) tem distribuição normal de média 100 e desvio padrão 10.
(a) Qual a probabilidade de encontrar um pacote de queijo ralado com peso entre 95g e 105g? com peso entre 95g e 105g?
(b) Se 16 pacotes são escolhidos ao acaso em um supermercado, qual a probabilidade do peso médio estar entre 95g e 105g?
Solução:
(a) Como X é uma N(100, 102) vem:
20
P(95 < X < 105)= P(-0,5 < Z < 0,5) = 2 . 0,1915 = 38,30%
(b) Neste caso é uma N(100; 2,52), então:
P(95 < < 105)= P(-2,0 < Z < 2,0) = 2 . 0,4772 = 95,44%X
� Como estimar a probabilidade de obter cara ao lançar uma moeda?
Teorema Central do Limite
(exemplo para proporção)
moeda?
� Seja π a probabilidade de sair cara ao lançar a moeda
� Supondo a moeda honesta, uma estimativa adequada seria ½
� Conde de Buffon (1707-1788) em 4.040 lançamentos da � Conde de Buffon (1707-1788) em 4.040 lançamentos da moeda encontrou 2048 caras, logo a estimativa foi 0,5069
� Karl Pearson (1857-1937) em 24.000 lançamentos encontrou 12.012 caras, logo a estimativa foi 0,5005
21
0,9
1,0
p1 p2 p3 p4 p5
Simulação para estimar a probabilidade de cara com uma amostra de tamanho 30
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
Est
imat
iva
de ππ ππ
p1 p2 p3 p4 p5
0,0
0,1
0,2
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
tamanho da amostra (n)
22
1,0
Simulação para estimar a probabilidade de cara com uma amostra de tamanho 100
0,3
0,4
0,5
0,6
0,7
0,8
0,9
Est
imat
iva
de
ππ ππ
p1 p2 p3 p4 p5
0,0
0,1
0,2
0 10 20 30 40 50 60 70 80 90 100
Tamanho da amostra (n)
23
0,9
1,0
p1 p2 p3 p4 p5
Simulação para estimar a probabilidade de cara com uma amostra de tamanho 500
0,2
0,3
0,4
0,5
0,6
0,7
0,8
Est
imat
iva
de
ππ ππ
0,0
0,1
0,2
0 50 100 150 200 250 300 350 400 450 500
Tamanho da amostra (n)
24
Top Related