Estimacão Estatística

10
  INFERÊNCIA ESTATÍSTICA ISEL ADM 1 2. ESTIMAÇÃO Suponhamos que X , representa uma certa população ou universo. O comportamento de X  é conhecido quando se conhece a sua distribuição e o valor dos parâmetros caracterizadores dessa distribuição. Se ( ; ) f x    for a função de probabilidade ou de densidade da variável X ,   é neste caso o parâmetro desconhecido. Os métodos de estimação são utilizados precisamente para estimar um valor para um certo parâmetro desconhecido. Existem três grandes áreas dentro da estimação paramétrica: Estimação pontual: produção de um valor, que se pretende que seja o melhor para um determinado parâmetro da população, com base na informação amostral. Estimação intervalar: construção de um intervalo que, com certo grau de certeza previamente definido, contenha o verdadeiro valor do parâmetro da população. Estimação por testes de Hipóteses: trata-se de uma metodologia que permite validar ou não determinadas hipóteses sobre os parâmetros de uma ou mais populações. 2.1 Estimação pontual O objectivo da estimação pontual é produzir um valor para  , que pertença ao conjunto de valores admissíveis que o parâmetro pode assumir, de acordo com a distribuição de X . Por exemplo, se X segue uma Binomial, ( , )  X B n p , os parâmetros da população desconhecidos são o n e o p, sendo 0 1 e 0  p n . Definição de Estimador: Designa-se genericamente por: 1 2 ˆ  , ,..., n  X X X  , sendo uma estatística (portanto, uma variável aleatória função da amostra)

description

estimação ao processo de atribuição de um valor a um parâmetro, para o qual não se conhece o valor absoluto.

Transcript of Estimacão Estatística

  • INFERNCIA ESTATSTICA

    ISEL ADM

    1

    2. ESTIMAO

    Suponhamos que X, representa uma certa populao ou universo. O

    comportamento de X conhecido quando se conhece a sua distribuio e o

    valor dos parmetros caracterizadores dessa distribuio. Se ( ; )f x for a funo

    de probabilidade ou de densidade da varivel X, neste caso o parmetro

    desconhecido. Os mtodos de estimao so utilizados precisamente para

    estimar um valor para um certo parmetro desconhecido.

    Existem trs grandes reas dentro da estimao paramtrica:

    Estimao pontual: produo de um valor, que se pretende que seja o melhor

    para um determinado parmetro da populao, com base na informao

    amostral.

    Estimao intervalar: construo de um intervalo que, com certo grau de

    certeza previamente definido, contenha o verdadeiro valor do parmetro da

    populao.

    Estimao por testes de Hipteses: trata-se de uma metodologia que permite

    validar ou no determinadas hipteses sobre os parmetros de uma ou mais

    populaes.

    2.1 Estimao pontual

    O objectivo da estimao pontual produzir um valor para , que pertena ao

    conjunto de valores admissveis que o parmetro pode assumir, de acordo com

    a distribuio de X. Por exemplo, se X segue uma Binomial, ( , )X B n p , os

    parmetros da populao desconhecidos so o n e o p, sendo 0 1e 0p n .

    Definio de Estimador: Designa-se genericamente por: 1 2 , ,..., nX X X ,

    sendo uma estatstica (portanto, uma varivel aleatria funo da amostra)

  • INFERNCIA ESTATSTICA

    ISEL ADM

    2

    cujas realizaes fornecem aproximaes (estimativas) para o parmetro

    desconhecido.

    (obs: Qualquer estimador uma estatstica, mas nem todas as estatsticas so estimadores.)

    Um estimador no mais do que uma frmula, funo de variveis que

    assumem determinados valores para uma dada amostra concreta, no

    envolvendo nenhum valor desconhecido. Ou seja, com as observaes de uma

    amostra concreta a referida frmula produz um valor determinado a que

    chamamos estimativa para o parmetro desconhecido.

    Definio de Estimativa: valor especifico assumido por um estimador, obtido

    quando se concretiza uma amostra concreta na frmula matemtica do

    estimador. Representa-se por .

    Exemplo: A estatstica X um estimador do valor mdio , isto , para uma

    amostra concreta, obtemos uma estimativa x para .

    Propriedades desejveis nos estimadores Para estimar um certo parmetro da populao, podem-se utilizar estimadores

    alternativos. A escolha do melhor estimador deve ser feita tendo em conta

    algumas propriedades desejveis num bom estimador. Essas propriedades

    dependem da dimenso da amostra considerada.

    Propriedades desejveis num bom estimador obtido a partir de amostras

    pequenas:

    No Enviesamento: Um estimador diz-se no enviesado ou centrado

    para , se E .

    Exemplos: o A mdia amostral um estimador centrado do valor mdio da populao,

    pois j vimos anteriormente que: E X .

  • INFERNCIA ESTATSTICA

    ISEL ADM

    3

    o A varincia amostral

    2

    2

    1 1

    ni

    i

    X XS

    n

    um estimador centrado de 2 , pois

    demonstra-se que 2 2E S .

    Esta propriedade s por si no suficiente para optar por, um entre dois

    estimadores, no caso por exemplo dos mesmos terem varincias muito

    diferentes.

    Eficincia: Um estimador diz-se eficiente se dentro da classe dos

    estimadores no enviesados ou centrados, tiver varincia mnima (o que

    significa que a magnitude dos erros de estimao mnima).

    Exemplo: Demonstra-se que, de entre os estimadores para o valor mdio de uma

    populao normal, a mdia amostral um estimador eficiente.

    Suficincia: Um estimador diz-se suficiente, quando obtido utilizando

    toda a informao disponvel na amostra, relevante para a estimao do

    parmetro.

    Nota: Estas propriedades tambm so vlidas para amostras grandes

    Propriedades desejveis num bom estimador obtido a partir de amostras

    grandes (propriedades assintticas):

    No enviesamento assinttico: Um estimador diz-se no enviesado

    assintoticamente quando a mdia da distribuio do estimador converge

    para o parmetro medida que a dimenso da amostra aumenta, ou seja,

    quando n tende para infinito tem-se: lim ( )nE .

    Por exemplo, o estimador 2S (varincia da amostra), um estimador no

    enviesado assintoticamente para a varincia da populao 2 .

  • INFERNCIA ESTATSTICA

    ISEL ADM

    4

    Consistncia: Um estimador diz-se consistente simples ou em

    probabilidade se medida que a dimenso da amostra aumenta se tem,

    1, 0nP .

    Eficincia assinttica: Um estimador diz-se assintoticamente mais

    eficiente se, de entre os estimadores consistentes em mdia quadrtica, for o que

    apresenta distribuio assinttica com varincia mnima.

    Nota: um estimador consistente em mdia quadrtica se, medida que

    aumenta a dimenso da amostra, se verifica 2lim ( ) 0nE .

    Definidas as propriedades desejveis dos estimadores, a questo que se coloca

    seguidamente a de saber como os definir. Existem diversos mtodos

    alternativos de estimao pontual, nomeadamente o mtodo dos momentos e o

    mtodo da mxima verosimilhana, os quais no sero estudados nesta unidade

    curricular.

    2.2 Estimao por Intervalos

    A grande limitao dos mtodos de estimao pontual a de no fornecerem

    qualquer informao relativa ao rigor das estimativas efectuadas, ou seja, a

    grandeza do erro de amostragem. Esta dificuldade ultrapassada recorrendo

    aos intervalos de confiana. Na estimao por intervalos, vamos construir um

    intervalo, que com certo grau de certeza, previamente fixado, contenha o

    verdadeiro valor do parmetro.

  • INFERNCIA ESTATSTICA

    ISEL ADM

    5

    Definio de Estimador Intervalar

    Um estimador intervalar para o parmetro um intervalo de limites

    aleatrios 1 2 , , que tem uma certa probabilidade de conter o verdadeiro

    valor do parmetro ( desejvel que essa probabilidade seja elevada). Os limites

    do intervalo so aleatrios porque 1 2 e so estatsticas amostrais, so

    portanto variveis aleatrias, j que dependem da amostra aleatria

    1 2, ,..., nX X X . Amostras diferentes produzem estimativas de intervalo

    diferentes.

    S possvel construir um intervalo de confiana para um parmetro,

    associando-lhe um determinado coeficiente de confiana se for conhecida a

    distribuio do estimador intervalar utilizado.

    Definio de Intervalo de confiana de nvel (1 ) 100%

    Um intervalo de confiana a (1 ) 100% para o parmetro , representa-se

    por (1 ) 100% 1 2 ] [ ,I , em que os limites de confiana so aleatrios tais que:

    1 2 1P , sendo (1 ) 100% o nvel ou coeficiente de confiana e

    o nvel de significncia.

    2.2.1 Metodologia utilizada na construo de intervalos de confiana

    A metodologia para a construo de um intervalo de confiana para um dado

    parmetro segue os seguintes passos:

    1. definio da populao, da sua distribuio e do parmetro a estimar;

    2. escolha da varivel fulcral, ou seja, da estatstica que vamos utilizar para

    obter a estimativa intervalar para o parmetro;

  • INFERNCIA ESTATSTICA

    ISEL ADM

    6

    A varivel fulcral um estimador pontual para o parmetro que contm o

    parmetro na sua expresso e cuja distribuio no depende dele, nem de

    quaisquer outros valores que se desconheam.

    3. Determinao da distribuio da varivel fulcral;

    4. Escolha do nvel de significncia , ou do nvel de confiana

    100(1 )% , os valores mais usuais so 90%, 95% e 99%;

    5. Construo do intervalo aleatrio;

    6. Determinao dos limites do intervalo aleatrio;

    7. Determinao dos limites do intervalo de confiana concretos, a partir

    dos valores de uma amostra concreta 1 2( , ,..., )nx x x .

    Exemplo

    A varivel aleatria X representa o tempo de processamento em milsimas de

    segundo, de um novo processador desenvolvido por uma empresa de

    hardware. Considere que o tempo segue uma distribuio normal com desvio

    padro 3.0 . Com base numa amostra aleatria de dimenso 25 a qual

    forneceu uma mdia amostral 48x milsimas de segundo, construa um

    intervalo de confiana ao nvel de 95% para o verdadeiro valor mdio do tempo

    de processamento.

    1) , 0.3X N ; Parmetro a estimar: .

    2) Para estimar , vamos utilizar o estimador pontual X , a mdia amostral.

    Dado que a caracterstica em estudo tem distribuio normal com desvio

    padro conhecido, sabemos por aplicao do teorema do limite central que

    ,X Nn

    e portanto

    (0,1)

    XN

    n

    . Assim a varivel fulcral a escolher

    neste caso

    X

    Z

    n

    .

    3) A distribuio da varivel fulcral

    0,1

    XN

    n

    .

  • INFERNCIA ESTATSTICA

    ISEL ADM

    7

    4) Nvel de confiana 100(1 )% = 95%.

    5)

    1 12 2

    0.95X

    P z z

    n

    6) 1.96 1.96 0.95P X Xn n

    7) Considerando agora as observaes da amostra, obtm-se a estimativa

    48x , que aps ser substituda nos limites aleatrios do intervalo, produz a

    estimativa intervalar ao nvel de confiana de 95% para , dada por

    47.882 , 48.118 .

    No exemplo dado foi relativamente fcil de determinar a varivel fulcral a

    utilizar, bem como a sua distribuio terica, que com se viu essencial para a

    construo do intervalo. Na construo de um intervalo de confiana para um

    certo parmetro a varivel fulcral a utilizar depende do parmetro

    desconhecido, da distribuio da caracterstica em estudo na populao ser ou

    no conhecida e da dimenso da amostra. Assim, o quadro resumo que se segue

    apresenta a varivel fulcral e a sua distribuio, em funo do parmetro

    desconhecido, de existirem ou no outros parmetros desconhecidos

    intervenientes, para alm do que estamos a estimar, da distribuio da

    populao e da dimenso da amostra.

    O processo de construo de uma estimativa intervalar para qualquer um dos

    parmetros que esto na 1 coluna do quadro resumo segue as mesmas etapas

    que descrevemos ao obter o intervalo de confiana para a mdia populacional

    .

  • INFERNCIA ESTATSTICA

    ISEL ADM

    8

    Quadro resumo das distribuies das estatsticas mais importantes

    Parmetro 2

    conhecido?

    Tipo de populao

    Dimenso da amostra

    Distribuio amostral da Varivel fulcral

    Sim

    Normal Qualquer 0,1X

    N

    n

    Qualquer 30n 0,1X

    N

    n

    No

    Normal 30n 1nX

    tS

    n

    Normal ou outra

    30n 0,1X

    NS

    n

    2

    Normal Qualquer 2

    2

    121

    n

    Sn

    p

    Bernoulli 30n

    0,1

    1

    p pN

    p p

    n

    1 2

    2 21 2

    e

    conhecidas

    Normais Quaisquer

    1 2 1 2

    2 2

    1 2

    1 2

    ( ) ( )(0,1)

    X XN

    n n

    1 2

    2 21 2

    e

    desconhecidas

    Normais ou outras 1 2

    30 e 30 n n

    1 2 1 2

    2 2

    1 2

    1 2

    ( ) ( )(0,1)

    X XN

    S S

    n n

    1 2

    2 21 2

    e

    desconhecidas

    (2 2

    1 2 )

    Normais 1

    30n e

    230n

    1 2

    1 2 1 22

    2 2

    1 1 2 2

    1 2 1 2

    ( ) ( )

    ( 1). ( 1) 1 1.

    2

    n n

    X Xt

    n S n S

    n n n n

    1 2p p

    Bernoulli 1 230 e 30 n n

    1 2 1 2

    1 1 2 2

    1 2

    ( ) ( )(0,1)

    (1 ) (1 )

    p p p pN

    p p p p

    n n

    2

    1

    2

    2

    Normais Quaisquer

    2 2

    1 21 22 2

    2 1

    . F( -1, 1)S

    n nS

  • INFERNCIA ESTATSTICA

    ISEL ADM

    9

    2.2.2 Interpretao de um intervalo de confiana

    A probabilidade do intervalo aleatrio

    0,95] [ 1.96 1.96I X Xn n

    conter o verdadeiro valor de de 0.95. Trata-se de um intervalo aleatrio

    pois os seus limites dependem de X que uma varivel aleatria, dependente

    da amostra seleccionada.

    O que varia de amostra para amostra o valor concreto, x que a varivel

    aleatria X vai assumir, variando com ele a localizao do intervalo de

    confiana (e no a sua amplitude), como se pode ver na figura seguinte.

    Fazendo uma interpretao frequencista do intervalo de confiana, podemos

    dizer que se recolhssemos 100 amostras aleatrias da mesma dimenso e se

    para cada uma delas fosse calculado o intervalo acima referido,

    aproximadamente 95 destes intervalos conteriam o parmetro , enquanto que

    os outros 5 no o conteriam.

    No exemplo anterior, ao calcularmos o intervalo de confiana para uma

    amostra concreta obtivemos o intervalo 47.882 , 48.118 . J no se pode

    afirmar que a probabilidade deste intervalo conter parmetro de 0.95, pois

  • INFERNCIA ESTATSTICA

    ISEL ADM

    10

    este intervalo tem dois limites determinados (no aleatrios), e portanto ele

    contm ou no contm o parmetro .

    2.2.3 Planeamento da dimenso da amostra a recolher em funo da preciso da estimativa

    A preciso do intervalo de confiana ao nvel (1 )100% para a mdia metade

    da sua amplitude, portanto 2

    1/z n ,

    21

    /z s n , ou 2

    /t s n . Antes de recolher a

    amostra possvel determinar a dimenso da amostra, que permite obter um

    intervalo com um dado nvel de confiana (1 )100% , garantindo que o erro

    mximo cometido preciso inferior a um valor E previamente fixado.

    O menor inteiro n que verifique a desigualdade 2

    1/z n E ou

    21

    /z s n E , ou

    2

    /t s n E , ser obtido resolvendo as respectivas inequaes, o que nos conduz

    aos seguintes resultados, respectivamente:

    2

    2

    1z

    nE

    , 22

    1z s

    nE

    , e 22

    t sn

    E

    .

    Podemos verificar que a dimenso amostral inversamente proporcional ao

    quadrado da preciso fixada. Frequentemente a varincia populacional

    desconhecida. Nesse caso antes de determinar n temos de utilizar uma amostra

    preliminar 30n para obter a varincia amostral 2s .

    Exemplo: Para os dados do exemplo anterior, qual dever ser a dimenso da

    amostra a recolher se pretendermos estimar o tempo mdio de processamento

    com um erro inferior a 0,09 milsimas de segundo, ao nvel de confiana de

    95%?

    Substituindo 2

    11,960z , 0,3 e E=0,09, em

    2

    2

    1z

    nE

    , obtm-se:

    21,96 0,3

    430,09

    n n

    .