Estatística Aplicada à Engenharia
Prof. Lupércio F. Bessegato - UFJF 1
Estatística Aplicada à Engenharia 1
DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO PONTUAL
ROTEIRO
1. Introdução 2. Teorema Central do Limite 3. Conceitos de estimação pontual 4. Métodos de estimação pontual 5. Referências
Estatística Aplicada à Engenharia 2
INTRODUÇÃO
POPULAÇÃO E AMOSTRA
• População: • Conjunto de elementos que apresentam pelo menos uma
característica em comum
• População Alvo: • População de interesse da pesquisa
• Amostra: • Qualquer subconjunto não vazio da população
Estatística Aplicada à Engenharia 4
Estatística Aplicada à Engenharia
Prof. Lupércio F. Bessegato - UFJF 2
CARACTERÍSTICAS DA AMOSTRA
CARACTERÍSTICAS DA POPULAÇÃO
ESTATÍSTICA DESCRITIVA
INFERÊNCIA ESTATÍSTICA
PROBABILIDADE
População
Amostra
EXTRAÇÃO DE AMOSTRAS
ALEATÓRIAS
Estatística Aplicada à Engenharia 5
TÉCNICAS DE AMOSTRAGEM
• Procedimento a ser adotado na seleção dos elementos da amostra
• O objetivo central é obter uma amostra representativa • Amostra que representa toda a população da melhor
maneira possível
• A representatividade depende de: • Metodologia adotada para seleção da amostra • Tamanho da amostra
Estatística Aplicada à Engenharia 6
PROBLEMA FUNDAMENTAL DA ESTATÍSTICA
A partir da observação de amostras, COMO podemos tirar CONCLUSÕES sobre a POPULAÇÃO ?
Estatística Aplicada à Engenharia 7
PLANEJANDO UM EXPERIMENTO
• Identificar seu objetivo
• Coletar dados amostrais
• Usar procedimento aleatório para evitar vício
• Analisar dados e tirar conclusões
Estatística Aplicada à Engenharia 8
Estatística Aplicada à Engenharia
Prof. Lupércio F. Bessegato - UFJF 3
ERRO AMOSTRAL
• Diferença entre um resultado amostral e o verdadeiro resultado populacional • são resultantes de flutuações amostrais aleatórias.
Estatística Aplicada à Engenharia 9
ERRO NÃO–AMOSTRAL
• Incorreção na coleta, registro ou análise de dados amostrais
• Exemplos • Coleta tendenciosa de amostra • Utilização de instrumento descalibrado • Registro incorreto de dados amostrais
Estatística Aplicada à Engenharia 10
INFERÊNCIA ESTATÍSTICA
• Definição: • Procedimentos para generalizar características de uma
população a partir da informação contida na amostra.
• Baseia-se na Teoria de Probabilidades
• Áreas: • Estimação de parâmetros • Testes de hipóteses.
Estatística Aplicada à Engenharia 11
ESTIMAÇÃO DE PARÂMETROS
• Estimação Pontual
• Estimação Intervalar • Intervalos de Confiança
Estatística Aplicada à Engenharia 12
Estatística Aplicada à Engenharia
Prof. Lupércio F. Bessegato - UFJF 4
TESTE DE HIPÓTESES
• Hipótese: • Afirmação (alegação) sobre característica populacional
• Teste de Hipóteses: • Procedimento padrão para se testar uma afirmativa sobre
característica populacional
Estatística Aplicada à Engenharia 13
CONCEITOS FUNDAMENTAIS
• Amostra aleatória: • As variáveis aleatórias X1, X2, ..., Xn são uma amostra
aleatória de tamanho n, se: • Forem independentes • Cada Xi tiver mesma distribuição de probabilidades
Estatística Aplicada à Engenharia 14
• Parâmetro: • Quantidades de interesse da população • Em geral, desconhecidas • Média de uma população (µ) • Desvio-padrão de uma população (σ)
• Representadas por letras gregas • Notação para estimador qualquer: θ
Estatística Aplicada à Engenharia 15
CONCEITOS
• Estatística: • Qualquer função da amostra
• Estimador: • Qualquer função da amostra que não dependa de
parâmetros desconhecidos • Exemplo : Alguns estimadores da amostra aleatória X1, X2, ...,
Xn: X(1) = mín(X1, X2, ..., Xn) X(n) = máx(X1, X2, ..., Xn)
Estatística Aplicada à Engenharia 16
n
XX
n
ii
n
∑== 1
( )1
2
12
−
−=∑=
n
XXS
n
ii
CONCEITOS
Estatística Aplicada à Engenharia
Prof. Lupércio F. Bessegato - UFJF 5
• Distribuição amostral: • Distribuição de probabilidades de um estimador
• Exemplo: • Distribuição amostral da média • Parâmetros da distribuição amostral da média
Estatística Aplicada à Engenharia 17
( ) XnX µ=E ( )n
X Xn
2
Var σ=
CONCEITOS
• Espaço paramétrico (Θ) • Conjunto de possíveis valores que o parâmetroθpode assumir
• Exemplo: Seja a amostra aleatória X1, X2, ..., Xn de X ~ N(µ, σ2)
• Se σ2 = 1, então θ = µ é o parâmetro desconhecido e Θ = {µ, –∞ < µ < ∞}
• Se µ = 0, então θ = σ2 é o parâmetro desconhecido e
Θ = {σ2, σ2 > 0}
Estatística Aplicada à Engenharia 18
CONCEITOS
• Estimador de θ • Qualquer estatística que assuma valores em Θ.
• Notação:
• Exemplo: Alguns estimadores para a média µ de uma população • Média da amostra • Mediana da amostra • X1
Estatística Aplicada à Engenharia 19
θ̂
CONCEITOS
• Estimativa de parâmetro populacional: • é um valor específico, ou um intervalo de valores, usado para
estimar parâmetro populacional
• Estimativa pontual: • é um único valor numérico de uma estatística θ
Estatística Aplicada à Engenharia 20
CONCEITOS
Estatística Aplicada à Engenharia
Prof. Lupércio F. Bessegato - UFJF 6
TEOREMA CENTRAL DO LIMITE (TCL)
TEOREMA CENTRAL DO LIMITE
• Seja X1, X2, ..., Xn uma amostra aleatória de tamanho n de uma população (finita ou infinita), com média µ e variância finita σ2. Então
quando n → ∞.
Estatística Aplicada à Engenharia 22
Z = Xn −µσ / n
~ N(0,1)
• Comentários: • A aproximação normal para a média amostral depende do
tamanho da amostra
• Com população contínua, unimodal e simétrica, na maioria dos casos, o TCL trabalha bem para pequenas amostras (n = 4, 5).
• Em muitos casos de interesse prático, a aproximação normal será satisfatória para n ≥ 30
• Se n < 30, o TCL funcionará se a distribuição da população não for muito diferente da normal
Estatística Aplicada à Engenharia 23
TEOREMA CENTRAL DO LIMITE EXEMPLO – SIMULAÇÃO
• População exponencial com média 1: • λ = 1 • Geração de 10.000 valores dessa população • Amostra de tamanho 1 (n = 1)
Estatística Aplicada à Engenharia 24
Estatística Aplicada à Engenharia
Prof. Lupércio F. Bessegato - UFJF 7
Amostra n =1
Estatística Aplicada à Engenharia 25
> mean(amostra); sd(amostra) [1] 0.9990838 [1] 1.010478
Amostra n = 2
Estatística Aplicada à Engenharia 26
> mean(media_n); sd(media_n) [1] 1.012711 [1] 0.7129089
• Amostras de tamanhos 2, 4, 10 e 20
Estatística Aplicada à Engenharia 27
n_2 n_4 n_10 n_20 n 2.000 4.000 10.000 20.000 media 0.995 1.000 0.996 0.999 dp 0.704 0.502 0.319 0.222
EXEMPLO – SIMULAÇÃO
• População com densidade em U: • f(x) = 12 (x – 0,5)2
• Geração de 10.000 valores dessa população
• Amostra de tamanho 1 (n = 1)
Estatística Aplicada à Engenharia 28
Estatística Aplicada à Engenharia
Prof. Lupércio F. Bessegato - UFJF 8
Amostra n =1
Estatística Aplicada à Engenharia 29
> mean(amostra); sd(amostra) [1] 0.5061657 [1] 0.3877259
Amostra n = 2
Estatística Aplicada à Engenharia 30
> mean(media_n); sd(media_n) [1] 1.012711 [1] 0.7129089
Amostras de tamanhos 2, 4, 10 e 20
Estatística Aplicada à Engenharia 31
n 2.000 4.000 10.000 20.000 media 0.502 0.499 0.499 0.499 Dp 0.274 0.196 0.122 0.086
COMPARAÇÃO DE POPULAÇÕES
• Considere duas populações: • População 1: média µ1 e variância σ1
2 • População 2: média µ2 e variância σ2
2
• Amostras aleatórias das duas populações? • Amostra da população 1 de tamanho n1: • Amostra da população 2 de tamanho n2:
Estatística Aplicada à Engenharia 32
X1X2
Estatística Aplicada à Engenharia
Prof. Lupércio F. Bessegato - UFJF 9
• Caso 1: As duas populações são normais independentes • Distribuição amostral da diferença
• Média da diferença de médias amostrais:
• Variância da diferença de médias amostrais:
Estatística Aplicada à Engenharia 33
COMPARAÇÃO DE POPULAÇÕES
X1 − X2 ~ N(µdif ,σ2dif )
µdif = E X1 − X2( ) = E X1( )−E X2( ) = µ1 −µ2
σ dif2 =Var X1 − X2( ) =Var X1( )+Var X2( ) = σ1
2
n1+σ 22
n2
• Caso 2: populações não normais com tamanhos amostrais maiores que 30
• Pode-se usar o TCL para aproximar a distribuição amostral da diferença:
Estatística Aplicada à Engenharia 34
COMPARAÇÃO DE POPULAÇÕES
DISTRIBUIÇÃO AMOSTRAL APROXIMADA DE DIFERENÇA DE MÉDIAS AMOSTRAIS
• Suponha: • Duas populações independentes, com médias µ1 e µ2 e
variâncias σ12 e σ2
2 • Amostras aleatórias independentes de tamanhos n1 e n2
dessas populações
se as condições do TCL se aplicarem.
Estatística Aplicada à Engenharia 35
Z =X1 − X2( )− µ1 −µ2( )
σ12
n1+σ 22
n2
~ N(0,1)
A vida efetiva de um componente usado no motor de uma turbina de um avião a jato é uma variável aleatória com média 5000 horas e desvio-padrão 40 horas. Suponha normalidade e independência onde necessário. O fabricante do motor introduz uma melhor ia no processo de fabr icação desse componente, que aumenta a vida média para 5050 horas e diminui o desvio-padrão para 30 horas. Uma amostra aleatória de 16 componentes é selecionada do processo antigo e outra de 25 elementos é selecionada. Qual a probabilidade de que a diferença das média amostrais seja no mínimo de 25 horas? Estatística Aplicada à Engenharia 36
EXEMPLO – VIDA DE MOTOR
Estatística Aplicada à Engenharia
Prof. Lupércio F. Bessegato - UFJF 10
C O N C E I T O S
ESTIMAÇÃO PONTUAL
PROPRIEDADES DE UM ESTIMADOR
• Alguma propriedades importantes:
• Vício
• Consistência
• Eficiência
Estatística Aplicada à Engenharia 38
VÍCIO
• Vício de um estimador:
• Um estimador é não viciado (não viesado, não tendencioso) para um parâmetro θ se
• A esperança de um estimador está relacionada com sua exatidão
Estatística Aplicada à Engenharia 39
Vicio θ̂( ) = E θ̂ −θ( ) = E θ̂( )−θ;θ̂
E θ̂( ) =θ;
• Exemplos: • A média amostral é não viciada para estimar a média
populacional:
• X1 (primeiro item coletado da amostra) é não viciado para estimar a média populacional:
Estatística Aplicada à Engenharia 40
( ) XnX µ=E
( ) XX µ=1E
VÍCIO
Estatística Aplicada à Engenharia
Prof. Lupércio F. Bessegato - UFJF 11
• A variância amostral
é não viciada para estimar a variância populacional (σ2)? Em outras palavras, verifique se
Estatística Aplicada à Engenharia 41
VÍCIO
E(S2 ) =σ 2.
S2 = 1n−1
Xi − X( )2
i=1
n
∑
VARIÂNCIA DE ESTIMADOR
• e estimadores não viciados para θ• Variâncias diferentes
• É mais provável que θ1 produza uma estimativa mais próxima de θ.
Estatística Aplicada à Engenharia 42
θ̂1 θ̂2
Var θ̂1( ) <Var θ̂2( )
ESTIMADOR DE VARIÂNCIA MÍNIMA
• Se considerarmos todos os estimadores não tendenciosos para θ, aquele com a menor variância será chamado de estimador não tendencioso de variância mínima;
• Esse estimador é o mais provável, dentre todos os não viciados, para produzir uma estimativa que seja mais próxima do valor verdadeiro.
Estatística Aplicada à Engenharia 43
ERRO-PADRÃO
• O erro-padrão de um estimador é o seu desvio-padrão
• O erro-padrão do estimador está relacionado com sua precisão;
Estatística Aplicada à Engenharia 44
θ̂
σθ̂= Var θ̂( );
Estatística Aplicada à Engenharia
Prof. Lupércio F. Bessegato - UFJF 12
• S e o e r r o - p a d r ã o e n v o l v e r p a r â m e t r o s desconhecidos que possam ser estimados, então a substituição daqueles valores produz um erro-padrão estimado • O erro-padrão da média amostral será
• Se não conhecermos σ, substituímos pelo desvio-padrão amostral. O erro-padrão estimado da média amostral será
Estatística Aplicada à Engenharia 45
ERRO-PADRÃO
σ X =σn;
σ̂ X =Sn;
• Quando o estimador seguir uma distribuição normal, podemos estar confiantes que o valor verdadeiro do parâmetro estará entre dois erros-padrão da estimativa • Esse resultado é muito útil para grandes valores de n
• Nos casos em que o estimador é não viciado e não normalmente distribuído • Estimativa do parâmetro desviará do valor verdadeiro em
mais de 4 erros-padrão no máximo 6% das vezes
Estatística Aplicada à Engenharia 46
ERRO-PADRÃO
• Quadro comparativo:
Estatística Aplicada à Engenharia 47
PRECISÃO VS. EXATIDÃO
Definição: Um estimador é consistente se, à medida em que o tamanho amostral aumenta, seu valor esperado converge para o parâmetro de interesse e sua variância converge para zero.
Estatística Aplicada à Engenharia 48
θ̂
• O estimador é consistente se
• Consistência é uma propriedade assintótica (grandes amostras);
limn→∞
E θ̂( ) =θ e limn→∞
Var θ̂( ) = 0;
CONSISTÊNCIA
Estatística Aplicada à Engenharia
Prof. Lupércio F. Bessegato - UFJF 13
• Exemplos: • A média amostral é consistente para estimar a média
populacional;
• O primeiro item coletado da amostra não é consistente para estimar a média populacional.
Estatística Aplicada à Engenharia 49
CONSISTÊNCIA
• O erro quadrático médio de um estimador para o parâmetro θ é definido como
• EQM – Vício e erro-padrão
• O EQM é um critério importante para comparar dois estimadores;
Estatística Aplicada à Engenharia 50
ERRO QUADRÁTICO MÉDIO
EQM θ̂( ) = E θ̂ −θ( )2;
θ̂
EQM θ̂( ) =Var θ̂( )+ Vicio θ̂( )⎡⎣
⎤⎦2;
• Estimadores tendenciosos podem ser preferíveis a estimadores não viciados se tiverem um menor EQM;
• Estimativa baseada em θ1 estaria provavelmente mais próxima do valor verdadeiro do que a baseada em θ2;
Estatística Aplicada à Engenharia 51
ERRO QUADRÁTICO MÉDIO
• Estimador ótimo para θ: • Tem EQM menor ou igual ao EQM de qualquer outro
estimador, para todos os valores de θ no espaço paramétrico;
• Estimadores ótimos raramente existem;
Estatística Aplicada à Engenharia 52
ERRO QUADRÁTICO MÉDIO
Estatística Aplicada à Engenharia
Prof. Lupércio F. Bessegato - UFJF 14
• No caso em que é um estimador não viciado para um parâmetro θ, então
Estatística Aplicada à Engenharia 53
θ̂
EQM θ̂( ) =Var θ̂( ).
ERRO QUADRÁTICO MÉDIO EFICIÊNCIA
• Dados dois estimadores e , não viciados para um parâmetro θ, dizemos que é mais eficiente que se
Estatística Aplicada à Engenharia 54
θ̂1 θ̂2θ̂1
θ̂2
Var θ̂1( ) <Var θ̂2( ).
• Exemplo: • No caso de amostra proveniente de distribuição Normal. • Média amostral e mediana amostral são não viciadas para
estimar a média populacional:
• Média amostral e mediana amostral são consistentes para estimar a média verdadeira:
• A média amostral é mais eficiente que a mediana amostral para estimar a média populacional
Estatística Aplicada à Engenharia 55
E X( ) = µ e E !X( ) = µ;
EFICIÊNCIA
Var X( ) = σ2
n e Var !X( ) = π2
σ 2
n;
Var X( )Var !X( )
=σ 2
nπ2σ 2
n
=2π≈ 0,64 <1;
REFERÊNCIAS
Estatística Aplicada à Engenharia
Prof. Lupércio F. Bessegato - UFJF 15
BIBLIOGRAFIA RECOMENDADA
• Montgomery, D. C. (LTC) Estatística Aplicada e Probabilidade para Engenheiros
• Pinheiro, J. I. D et al. (Campus) Probabilidade e Estatística: Quantificando a Incerteza
Estatística Aplicada à Engenharia 57
Top Related