Aula 8 Estatistica Unicamp

6
Introdução aos Modelos Probabilísticos Prof. Sebastião de Amorim UNICAMP – 2007 1 2007 Prof. Amorim UNICAMP Estatísticas de Ordem Seja X uma variável aleatória, com certa f.d.p. f X . Suponha n observações independentes de X: X 1 , X 2 , X 3 , , X n . Vamos agora ordenar os valores observados: X (1) , X (2), X (3) , , X (i) , , X (n) Na notação acima, usual no estudo de estatísticas de ordem, X (1) é o menor valor entre as n observações de X; X (2) é a segunda menor, e assim por diante, até a maior de todas, X (n) . Nesta seção investigaremos o comportamento probabilístico de X (i) , a i-ésima estatística de ordem de X 1 , X 2 , X 3 , , X n , e chegaremos a resultados muitíssimo interessantes que, quando bem compreendidos e assimilados pelo estudante, promoverão no mesmo uma pequena mas substantiva revolução intelectual. Comecemos com as estatísticas de ordem extremas: X (1) e X (n) . Seja x X X F x P{X x} f y dy , a função de distribuição acumulada de X. Vamos agora deduzir a expressão da f.d.p. de X (1) . Teorema A f.d.p. de X (1) é dada por f (1) =n[1 F X (x)] n-1 f X (x). Prova: Note primeiro que o evento {X (1) >x} { X 1 >x, X 2 >x, X 3 >x, , X n >x}. Logo P{X (1) x} = 1 P{X (1) > x} = 1 P{X 1 >x, X 2 >x, X 3 >x, , X n >x} = 1 [ P{X<x} } n Representando a função acumulada de distribuição de probabilidades (fadp) de X (1) por F (1) , temos: F (1) (x) = P{X (1) x} = 1 [ P{X>x} } n = 1 [ 1 P{X x} ] n = 1 [1 F X (x)] n Mas a fdp f (1) (x) é a derivada de F (1) (x), logo, 1 1 1 1 1 1 1 n n n X X X X d d d d f x F x F x F x n F x F x dx dx dx dx Portanto, 1 1 1 n X X f x n F x f x

description

Material de Estatistica Unicamp

Transcript of Aula 8 Estatistica Unicamp

  • Introduo aos Modelos Probabilsticos Prof. Sebastio de Amorim

    UNICAMP 2007

    1

    2007 Prof. Amorim UNICAMP

    Estatsticas de Ordem

    Seja X uma varivel aleatria, com certa f.d.p. fX. Suponha n observaes independentes de X:

    X1, X2, X3, , Xn. Vamos agora ordenar os valores observados:

    X(1), X(2), X(3), , X(i), , X(n)

    Na notao acima, usual no estudo de

    estatsticas de ordem, X(1) o menor valor entre as n observaes de X; X(2) a segunda

    menor, e assim por diante, at a maior de todas, X(n). Nesta seo investigaremos o

    comportamento probabilstico de X(i), a i-sima estatstica de ordem de X1, X2, X3, , Xn, e

    chegaremos a resultados muitssimo interessantes que, quando bem compreendidos e

    assimilados pelo estudante, promovero no mesmo uma pequena mas substantiva revoluo

    intelectual.

    Comecemos com as estatsticas de ordem extremas: X(1) e X(n).

    Seja x

    X XF x P{X x} f y dy

    , a funo de distribuio acumulada de X. Vamos agora

    deduzir a expresso da f.d.p. de X(1).

    Teorema A f.d.p. de X(1) dada por f(1)=n[1 FX(x)]n-1fX(x).

    Prova: Note primeiro que o evento {X(1) >x} { X1 >x, X2>x, X3>x, , Xn>x}. Logo

    P{X(1) x} = 1 P{X(1) > x} = 1 P{X1 >x, X2>x, X3>x, , Xn>x}

    = 1 [ P{Xx} }n = 1 [ 1 P{X x} ]

    n = 1 [1 FX(x)]

    n

    Mas a fdp f(1)(x) a derivada de F(1)(x), logo,

    11 1 1 1 1 1n n nX X X Xd d d df x F x F x F x n F x F xdx dx dx dx

    Portanto,

    1

    11 nX Xf x n F x f x

  • Introduo aos Modelos Probabilsticos Prof. Sebastio de Amorim

    UNICAMP 2007

    2

    Q.E.D.

    De forma anloga encontraremos a fdp de X(n).

    Teorema A fdp de X(n) dada por f(n)(x)= n[FX(x)]n-1fX(x).

    Prova: Basta notar que {X(n) } { X1 x, X2 x, X3 x, , Xn x}. Logo,

    F(n)(x) = P{X(n) x} = P{ X1 x, X2 x, X3 x, , Xn x} = [ P{X x} ]n

    Logo

    1

    1 1 1

    n n

    X X X

    d d df x F x F x F x n F x f x

    dx dx dx

    Q.E.D.

    Exemplo:

    Seja X~U(0, 1), logo, f(x)=1, em (0, 1), e 0 fora deste intervalo; FX(x)=x, para 0

  • Introduo aos Modelos Probabilsticos Prof. Sebastio de Amorim

    UNICAMP 2007

    3

    Prova: A condio para que X(i) seja igual a x, que,

    uma das n observaes caia numa vizinhana estreita de x: entre x e x+x, para um x

    muito pequeno. Existem n alternativas para a observao que cair naquele intervalo.

    das (n-1) observaes restantes, (i 1) caiam abaixo de x. Existem 11inC opes

    alternativas para estas observaes.

    As demais (n i) caiam acima de x+x. claro, so as observaes restantes, no

    existe alternativa.

    Assim:

    P{X(i)[x, x+x)} 11

    1 1i n ii

    n X X X Xn C F x F x x F x x F x

    n

    11

    0 1 1i n i X Xi

    x n X Xi

    F x x F xf x Lim n C F x F x x

    x

    Lembrando que X X

    X Xx

    F x x F xf x Lim

    , o resultado segue imediatamente.

    Q.E.D.

    A figura ao lado compara as

    funes de densidade de

    probabilidade de X~N(0, 1),

    com a de X(10.000), o maior

    valor observado numa

    seqncia de 10.000

    observaes independentes

    de X. interessante notar

    que, embora valores como

    x=4 seja muito raros em

    uma normal padro, eles so bastante provveis, quando se fala do maior resultado em dez mil

    observaes independentes de X~N(0, 1).

    O estudo do comportamento probabilstico das estatsticas de ordem trs revelaes

    interessantes sobre fenmenos como o do inevitvel aparecimento de valores extremos em

    populaes muito grandes. Tomemos, por exemplo, o caso das habilidades congnitas para

    alguma disciplina ou atividade do complexo multivariado do interesse humano. Cada criana

    0

    1

    2

    -3 -2 -1 0 1 2 3 4 5 6

  • Introduo aos Modelos Probabilsticos Prof. Sebastio de Amorim

    UNICAMP 2007

    4

    vem ao mundo, parece, com uma predisposio congnita para jogar futebol, e esta

    predisposio natural, este nvel de habilidade congnita, varia muito entre as crianas. No ,

    aqui inapropriado supor que este F (ndice de futebol) varia entre as crianas segundo uma

    distribuio normal, com um

    certo valor mdio

    caracterstica natural do

    gnero humano e uma

    certa varincia idem.

    Assim, a maioria das

    crianas estaria na faixa de

    mediocridade futebolstica

    congnita. Qualquer criana

    deste grupo, interessando-se desde cedo pelo futebol, e sendo exposta prtica do mesmo,

    evoluiria para ser, na juventude e vida adulta, um peladeiro clssico, uns melhores e outros

    piores, mas peladeiro, no mximo um timo varzeano de fim de semana. Acima desta faixa

    intermediria de, digamos, um e meio desvio padro abaixo e acima da mdia, comea a

    regio dos futebolistas de algum destaque. Penso que um jovem com habilidade congnita

    entre 1,5 e 2 desvios padres, e que tenha ao longo da vida cultivado esta habilidade,

    participar do time da faculdade e, no emprego, ser o craque do time de sua repartio, sendo

    sempre convidado para jogar. No oposto simtrico estariam os pernas de pau contumazes.

    Geralmente esses nunca desenvolvem gosto pelo jogo e, no futebol, sero no mximo

    torcedores. Os que insistirem em jogar sero os pernas de pau, vtimas das gozaes usuais

    nas peladas. Acima dos 2,5 e at os 3,5 desvios padres esto as crianas que, se forem

    exposta ao jogo e cultivarem o gosto e a prtica, sero levadas para participar das peneiras

    dos times profissionais e algumas podero seguir carreira profissional, e talvez venham a fazer

    nome na segundona do brasileiro.

    Acima da linha dos 3,5 desvios padres acima da mdia, comea a faixa da turma do potencial

    srio. Com uma freqncia de 232ppm, eles so talentos extraordinrios. Existem, no Brasil,

    entre os marmanjos apenas, e de mamando a caducando, uns 20 mil indivduos que vieram ao

    mundo com um nvel de habilidade congnita para o jogo do futebol nesta faixa. curioso

    pensar que muitos deles talvez no tenham tido, ou no venham a ter, nenhuma exposio ao

    jogo do futebol, e passaram ou venham a passar a vida sem nunca saber deste seu dom

    natural. Imaginem se Pel houvesse nascido numa senzala, 100 anos antes.

    -5 -4 -3 -2 -1 0 1 2 3 4 5

  • Introduo aos Modelos Probabilsticos Prof. Sebastio de Amorim

    UNICAMP 2007

    5

    Agora, na faixa superior aos 4, 5 ou 6 desvios padres, esto os craques absolutos e

    histricos. Baseado na

    teoria da probabilidade,

    em particular nos

    teoremas demonstrados

    acima, que Pel,

    Garrincha, os Ronaldos

    e Maradona vieram ao

    mundo naquela regio

    rarefeita do talento

    congnito extremo para

    jogar futebol e tiveram, claro, a sorte de terem sido notados ou se notarem a tempo.

    Outros, no expostos a tempo ao jogo do futebol, certamente passaram ou passaro a vida em

    branco em futebol nunca sabendo do gigantesco prmio com que foram congenitamente

    contemplados pela natureza. Na figura acima vemos tambm a fdp de X(100.000.000) em cem

    milhes de observaes de X~N(0, 1).

    Uma maneira de se visualizar o

    que significa estar a 6 desvios

    padres acima da mdia

    atravs do parmetro altura.

    Imagine uma populao humana

    masculina adulta. Supor para a

    estatura dos indivduos desta

    populao, uma distribuio

    normal, com mdia igual a 175

    cm, com um desvio padro de

    8cm, bem razovel. Assim, um

    indivduo situado a 6 desvios

    padres acima da mdia, teria

    223 cm de altura e, ao lado de

    um indivduo com estatura

    mdia (175 cm), estabeleceria uma relao de estatura semelhante representada na figura

    acima.

    Embora, tenhamos nos referido aqui habilidade para o futebol e estatura dos seres humanos,

    as idias apresentadas valem para qualquer das habilidades intelectuais ou fsicas, ou mesmo

    as caracterstica antropomtricas dos mesmos. Pense nas habilidades potenciais congnitas

    para as cincias, em suas diversas vertentes, as artes, as relaes humanas. Que tal a

    0

    1

    2

    3

    -3 -2 -1 0 1 2 3 4 5 6 7

  • Introduo aos Modelos Probabilsticos Prof. Sebastio de Amorim

    UNICAMP 2007

    6

    habilidade potencial congnita para ... Matemtica. Um garotinho acima da linha dos 6 desvios

    padres acima de mdia resolver, de cabea, sistemas equaes lineares com trs equaes

    e trs variveis, j aos 7 anos de idade.

    (continua...)

    Normal Extrema: Probabilidades nas caudas da Normal

    z P[X>+z] z 1-(z) =

    P[X>+z]

    z

    1-(z) =

    P[X>+z]

    1,281551566 10-1

    1,0 1,586553E-01 8,0 6,220961E-16

    2,326347874 10-2

    1,5 6,680720E-02 8,5 9,479535E-18

    3,090232306 10-3

    2,0 2,275013E-02 9,0 1,128588E-19

    3,719016485 10-4

    2,5 6,209665E-03 9,5 1,049452E-21

    4,264890794 10-5

    3,0 1,349898E-03 10,0 7,619853E-24

    4,753424341 10-6

    3,5 2,326291E-04 10,5 4,319006E-26

    5,199337582 10-7

    4,0 3,167124E-05 11,0 1,910660E-28

    5,612001242 10-8

    4,5 3,397673E-06 11,5 6,595771E-31

    5,997807011 10-9

    5,0 2,866516E-07 12,0 1,776482E-33

    6,361340804 10-10

    5,5 1,898956E-08 12,5 3,732564E-36

    6,706022333 10-11

    6,0 9,865880E-10 13,0 7,998828E-38

    7,034479173 10-12

    6,5 4,015999E-11 13,5 1,061269E-40

    7,348796103 10-13

    7,0 1,279976E-12 14,0 1,096607E-43

    7,650018175 10-14

    7,5 3,197442E-14 14,5 6,057495E-48

    15,0 5,530710E-50