capitulo04 - econometria 1

download capitulo04 - econometria 1

of 32

description

curso econometria 1 professor moises resende filho. para graduacao em economia

Transcript of capitulo04 - econometria 1

  • Anlise de Regresso Mltipla: infernciaAula 28/04/2014

    Prof. Moiss A. Resende Filho

    Introduo Econometria (ECO 132497)

    28 de abril de 2014

    Moiss Resende Filho (ECO/UnB) (Wooldridge, captulo 4) 28/04/2014 1 / 32

  • Suposies ou hipteses

    At agora assumimos:RLM.1: y = 0 + 1x1 + 2x2 + . . .+ kxk + u (o modelo ouprocesso gerador dos dados linear nos parmetros).RLM.2: temos uma amostra f(xi1, xi2, ..., xik , yi ) : i = 1, ..., ngaleatria retirada da populao, tal queE (ui jxl1, xl2, ..., xlk ) = 0, i 6= l .RLM.3: colinearidade no perfeita ou: n (k + 1), cada varivelexplicativa apresenta variabilidade na amostra e nenhuma varivel uma combinao linear das demais variveis explicativas.

    RLM.4: E (ui jxi1, xi2, ..., xik ) = E (u) = 0 (a mdia condicional doerro zero).RLM.5: a varincia do erro u, seja l quais forem os valores dex1, x2, ..., xk

    Var(ujx1, x2, ..., xk ) = Var(u) = 2 (homocedasticidade).Moiss Resende Filho (ECO/UnB) (Wooldridge, captulo 4) 28/04/2014 2 / 32

  • Consequncias

    Sob RLM.1 a RLM.3, possvel calcular as estimativas MQO

    bj = ni=1 brijyini=1 br2ij , j = 1, ..., ka partir da amostra aleatria f(xi1, xi2, ..., xik , yi ) : i = 1, ..., ng, onde brij o resduo da regresso de xj sobre as demais variveis explicativas. Sob RLM1 a RLM.4, os estimadores MQO so no viesados(Teorema 3.1) ou E (bj ) = j , j = 0, 1, ..., k, mas se xk foi omitido,ento, pode ser que E (ui jxi1, xi2, ..., xik ) = E (u) = 0 tenha sido violada,tal que ej = bj + bkeje

    E (ej ) = j + kejonde ej o coeciente de xj , j = 1, ..., k 1 na regresso auxiliar de xksobre as demais variveis explicativas do modelo.Moiss Resende Filho (ECO/UnB) (Wooldridge, captulo 4) 28/04/2014 3 / 32

  • Consequncias

    A suposio RLM.5 fundamental para se obter frmulas simples paraos estimadores da varincia dos estimadores de MQO e para a discusso deecincia de MQO, tal que, sob RLM.1 a RLM.5 (hipteses deGauss-Markov) e conditional nos valores das variveis explicativas nasamostras

    Var(bj ) = 2SQTj (1 R2j ) , j = 1, ..., konde SQTj = ni=1(xij xj )2 e R2j = 1 i

    br 2ijSQTj

    o R2 da regresso de xjem x1, x2, ..., xj1, xj+1, ..., xk , ou seja, uma regresso auxiliar de xj sobreas demais variveis explicativas do modelo. Ainda, sob RLM.1 a RLM.5 (hipteses de Gauss-Markov), osestimadores MQO so BLUE.

    A suposio RLM.3 elimina a possibilidade de R2j = 1, o que ocorrerias se xj fosse determinado exatamente por uma funo linear dasoutras variveis explicativas.

    Moiss Resende Filho (ECO/UnB) (Wooldridge, captulo 4) 28/04/2014 4 / 32

  • Consequncias

    Conhecemos os dois primeiro momentos da distribuio amostral debj . pois sob RLM.1 a RLM.4,E (bj ) = j , j = 0, 1, ..., k (1)

    e sob RLM1 a RLM.5 (hipteses de Gauss-Markov),

    Var(bj ) = 2STQj (1 R2j ) , j = 1, ..., k. (2)e 2 = SQR/(n k 1) um estimador no viesado de 2.

    Para sermos capazes de testar hipteses sob j , usando procedimentosexatos de teste (ou amostras nitas), precisamos conhecer a mdia ea varincia dos estimadores MQO e tambm a distribuio amostralde cada um deles.

    Moiss Resende Filho (ECO/UnB) (Wooldridge, captulo 4) 28/04/2014 5 / 32

  • Consequncias

    Escreva bj = ni=1 brij yini=1 br 2ij , j = 1, ..., k comoj = j +

    n

    i=1wijui ,

    onde wij so funes de f(xi1, ..., xik ) : i = 1, ..., ng, ou simplemente,wij brijni=1 br 2ij onde brij o resduo da regresso de xj sobre as demaisvariveis explicativas. Conditional em f(xi1, ..., xik ) : i = 1, ..., ng, j herda a distribuio defui : i = 1, .., ng, que uma amostra aleatria da distribuiopopulacional de u. Sendo assim, devemos assumir alguma distribuio de probabilidadepara ui (Hiptese RLM.6 a seguir).

    Moiss Resende Filho (ECO/UnB) (Wooldridge, captulo 4) 28/04/2014 6 / 32

  • Normalidade do erro

    Hiptese RLM.6 (Normalidade)O erro populacional u independente de (x1, ..., xk ) e normalmentedistribudo com mdia zero (RLM.2: E (ui jxl1, xl2, ..., xlk ) = 0, i 6= l eRLM.4: E (ujx1, ..., xk ) = 0, ou exogeneidade estrita) e varincia 2constante (RLM.5: Var(ujx1, ..., xk ) = Var(u) = 2), tal que:

    u Normal(0, 2)ou

    ui iidNormal(0, 2), i = 1, ..., n. RLM.2 + RLM.3 + RLM.6 impem independncia completa entre u e(x1, x2, ..., xk ) (no somente independncia da mdia e varincia de u e(x1, x2, ..., xk )), o que justica chamar xj , j = 1, ..., k de variveisindependentes.

    Moiss Resende Filho (ECO/UnB) (Wooldridge, captulo 4) 28/04/2014 7 / 32

  • Normalidade do erro

    O importante sob MRL.6 que zemos uma suposio bem especcasobre a distribuio populacional de u, u Normal(0, 2), que umafuno densidade de probabilidade (fdp) em forma de sino:

    0.1

    .2.3

    .4f(u)

    0 u

    Moiss Resende Filho (ECO/UnB) (Wooldridge, captulo 4) 28/04/2014 8 / 32

  • Normalidade do erro

    comum assumir-se nomarlidade dos erros, mas a razo para isso nemsempre se sustenta. Usualmente, o argumento pr normalidade baseia-se no fato de que u a soma de vrios fatores no-observveis independentes, porexemplo, u = a1 + a2 + ...+ am para um m grande tal que se possaaplicar o teorema central do limite. Saber se a normalidade de u pode ser assumida uma questo emprica(p.ex., teste Jarque-Bera dos resduos). Em ltima anlise, como no caso de RLM.5, a hiptese RLM.6 mantida por convenincia, pois muito difcil fazer inferncia em amostrasnitas sem a hiptese de normalidade. As suposies, pressupostos ou hipteses RLM.1 a RLM.6 so chamadasde pressupostos do modelo clssico de regresso linear (MCRL) pararegresses de dados de seo cruzada. Em termos prticos: pressupostos do MCRL = pressupostos deGauss-Markov (RLM.1 a RLM.5) + normalidade dos erros (RLM.6).

    Moiss Resende Filho (ECO/UnB) (Wooldridge, captulo 4) 28/04/2014 9 / 32

  • Distribuies amostrais dos estimadores MQO

    Um fato importante sobre variveis aleatrias normalmente eindependentemente distribudas que qualquer combinao lineardelas tambm normalmente distribuda (vide propriedade Normal.4, p.49do Apndice B em pdf do Wooldridge). Assim, como ui iidNormal(0, 2), i = 1, ..., n, ento

    j = j +n

    i=1wijui Normal [j ,Var(j )]

    onde wij brijni=1 br 2ij e brij o resduo da regresso de xj sobre as demaisvariveis explicativas e

    Var(j ) =2

    SQTj (1 R2j ).

    Moiss Resende Filho (ECO/UnB) (Wooldridge, captulo 4) 28/04/2014 10 / 32

  • Distribuies amostrais dos estimadores MQO

    TEOREMA 4.1. (Distribuies Amostrais Normais)Sob as hipteses do MCRL (RLM1 a RLM.6) e conditional nos valoramostral das variveis independentes (f(xi1, ..., xik ) : i = 1, ..., ng),

    j Normal [j ,Var(j )]

    com Var(j ) =2

    SSTj (1R 2j ) .Portanto, subtraindo a mdia e dividindo pelo desvio padro, obtm-se avarivel aleatria normal padronizada

    j jdp(j )

    Normal(0, 1).

    Mas no conhecemos 2, o que nos fora a utilizar2 = SQR/(n k 1), o estimador no viesado de 2.

    Moiss Resende Filho (ECO/UnB) (Wooldridge, captulo 4) 28/04/2014 11 / 32

  • Distribuies amostrais dos estimadores MQO

    TEOREMA 4.2. (A distribuio t para os EstimadoresPadronizados)Sob as hipteses do MCRL (RLM.1 a RLM.6),

    j jep(j )

    tn(k+1) (3)

    onde ep(j ) =p

    SSTj (1R 2j ), =

    rni=1 bu2in(k+1) , (k + 1) o nmero de

    parmetros estimados por MQO no modeloy = 0 + 1x1 + 2x2 + . . .+ kxk + u e (n k 1) o nmero degraus de liberdade da distribuio t de student. A distribuio t surge da diviso da varivel aleatria normal padro(jjdp(j )

    ) pela varivel aleatria qui-quadrado (ep(j )

    dp(j )), sendo as duas

    variveis independentes- vide apndice B do Wooldridge, p.50.

    Moiss Resende Filho (ECO/UnB) (Wooldridge, captulo 4) 28/04/2014 12 / 32

  • A distribuio t

    De fato, porque substitumos (uma constante de valor desconhecido)por (um estimador que varia de amostra para amostra) que trocamos adistribuio nomal padro pela distribuio t. Assim, j se distribui segundo uma distribuio t, mas o erro-padroda distribuio amostra de j deve ser estimado em cada amostra. Apesar de a distribuio t apresenta uma forma de sino, ela maisespalhada que a normal padro, Normal(0, 1).

    E (tgl ) = 0, se gl > 1

    Var(tgl ) =gl

    gl 2 > 1, se gl > 2

    Moiss Resende Filho (ECO/UnB) (Wooldridge, captulo 4) 28/04/2014 13 / 32

  • A distribuio t

    Nunca teremos um nmero muito pequeno de graus de liberdade (gl), talque: Quando gl = 10, Var(tgl ) = 1.25, que 25% maior que a varincia deNormal(0, 1). Quando gl = 120, Var(tgl ) 1.017, que apenas 1,7% maior que a danormal padro. A medida que gl ! ,

    tgl ! Normal(0, 1).

    Moiss Resende Filho (ECO/UnB) (Wooldridge, captulo 4) 28/04/2014 14 / 32

  • A distribuio t

    A diferena entre a normal padro e a distribuio t praticamentenenhuma para gl > 120. O grco abaixo apresenta a funo densidade de probabilidade (fdp)normal padro e t6gl .

    0.1

    .2.3

    .4

    -4 -2 0 2 4

    standard normal t with 6 df

    Moiss Resende Filho (ECO/UnB) (Wooldridge, captulo 4) 28/04/2014 15 / 32

  • Testes de hiptese sobre um nico parmetro do modelo

    Utilizamos o resultado da distribuio t para testar a hiptese nula (H0)de que xj no tem qualquer efeito sobre y :

    H0 : j = 0

    A hiptese nula sempre sobre um parmetro populacional. Uma hiptese alternativa bilateral:

    H1 : j 6= 0 Hipteses alternativas unilaterais:

    H1 : j > 0H1 : j < 0

    Moiss Resende Filho (ECO/UnB) (Wooldridge, captulo 4) 28/04/2014 16 / 32

  • Testes de hiptese sobre um nico parmetro do modelo

    Por exemplo, no modelo

    log(salarioh) = 0 + 1educ + 2exper + 3perm+ u

    H0 : 2 0 ou 2 = 0 - uma vez controlado para escolaridade (educ) epermanncia no emprego corrente (perm), o nmero de anos no mercadode trabalho (exper) no afeta o log do salrio hora (log(salarioh)). H1 : 2 > 0.

    Portanto, o primeiro passo para implementar um teste de hiptese denir a hiptese nula e hiptes alternativa.

    Moiss Resende Filho (ECO/UnB) (Wooldridge, captulo 4) 28/04/2014 17 / 32

  • Testes de hiptese sobre um nico parmetro do modelo

    O segundo passo, estabelecer a estatstica do teste e a suadistribuio amostral.

    Para H0 : j = 0, utilizamos a estatstica t ou a razo t

    tj =j

    ep(j )

    onde ep(j ) =p

    SQTj (1R 2j ), =

    rni=1 bu2in(k+1) .

    Como ep(j ) uma estimativa de dp(j ), tj mede o quantosdesvios-padro estimados ou erros-padro, j se afasta de zero. O Teorema 4.2., diz que a distribuio amostral, tal quetj =

    jep(j )

    tn(k+1).

    Moiss Resende Filho (ECO/UnB) (Wooldridge, captulo 4) 28/04/2014 18 / 32

  • Testes contra uma alternativa unilateral

    Primeiro, consideremos a hiptese alternativaH1 : j > 0

    que efetivamente implica a hiptese nula

    H0 : j 0

    Em termos prticos, se rejeitamos j = 0 ento rejeitamos tambmj < 0, de modo que, basta estabelecer H0 : j = 0 e agir como seno nos importssemos sobre valores negativos do parmetro j .

    Moiss Resende Filho (ECO/UnB) (Wooldridge, captulo 4) 28/04/2014 19 / 32

  • Testes contra uma alternativa unilateral

    Sumrio dos passos de um teste de hiptese para um alternativaunilateral:1. Dena a hiptese nula, por exemplo, H0 : j 0 ou, simplesmente,H0 : j = 0.2. Dena a hiptese alternativa, por exemplo, H1 : j > 0.3. Estabelea a estatstica do teste e a sua distribuio amostral, por

    exemplo, tj =j

    ep(j ) tn(k+1).

    4. Dena, o nvel de signicncia (ou, simplesmente, o nvel (level) outamanho (size)) do teste, que probabilidade de rejeitar a hiptese nulaquando esta verdadeira (Erro Tipo I).5. Obtenha o valor crtico, c > 0, tal que seja possvel, ao nvel designicncia pr-estabelecido, aplicar a regra de rejeio

    tj > c

    Moiss Resende Filho (ECO/UnB) (Wooldridge, captulo 4) 28/04/2014 20 / 32

  • Testes contra uma alternativa unilateral

    Suponha que gl = 28 e utilizemos um teste ao nvel de 5%. O valor crtico da distribuio t com 28 graus de liberdade a 5%, talque, Pr (t c) = 0, 05, t5%;28gl . = c5%;28gl . = 1, 701 para um testemonocaudal, pode ser obtido na Tabela G.2 (p. 652 do Wooldridge) oucom o computador (Scientic Workplace) TInv(0.95; 28) = 1.7011.

    0

    regionrejection

    Area = .05

    1.701

    Moiss Resende Filho (ECO/UnB) (Wooldridge, captulo 4) 28/04/2014 21 / 32

  • Testes contra uma alternativa unilateral

    Com 28 g.l., a regra de rejeio de H0 : j = 0 em favor de H1 : j > 0,ao nvel de 5%,

    tj =j

    ep(j )> 1, 701

    Precisamos de uma estatstica t maior que 1, 701 para concluirmos queh suciente evidncia contra H0. Se tj 1.701, no rejeitamos H0 em favor de H1 ao nvel designicncia de 5% e 28 graus de liberdade.

    Moiss Resende Filho (ECO/UnB) (Wooldridge, captulo 4) 28/04/2014 22 / 32

  • Testes contra uma alternativa unilateral

    Mantendo gl = 28, mas para outros nveis de signicncia, normalmete,10% e 1%, temos:

    c10%;28gl = 1, 313

    c5%;28gl = 1, 701

    c1%;28gl = 2, 467

    Quanto menor o nvel de signicncia, maior o valor crtico. Se rejeitamos H0 a 1%, tambm rejeitaramos a 5% e 10%. Se no rejeitamos H0 a 10%, tambm no rejeitaramos a 5% e 1%.

    Moiss Resende Filho (ECO/UnB) (Wooldridge, captulo 4) 28/04/2014 23 / 32

  • Testes contra uma alternativa unilateral

    Para amostras de tamanho grande, tal que gl > 120, podemos utilizaros valores crticas da distribuio normal padro, correspondentes a linhagl = na Tabela G.2 do livro texto.

    c10% = 1, 282

    c5% = 1, 645

    c1% = 2, 362

    os quais podem ser arredondados para 1, 28, 1, 65 e 2, 36. O valor crtico1.65 especiamente comum em testes unilaterais.

    Moiss Resende Filho (ECO/UnB) (Wooldridge, captulo 4) 28/04/2014 24 / 32

  • Testes contra uma alternativa unilateral

    EXAMPLO 4.1: Equao do salrio-hora (WAGE1.DTA) til em aplicaes rotular os parmetros com os nomes das variveisao se estabeler as hitptese, por exemplo, educ , exper , perm . Ento

    H0 : exper = 0

    que o nmero de anos de experincia de trabalho no afeta o salrio,uma vez tenham sido controlados edu, exper, perm.

    Moiss Resende Filho (ECO/UnB) (Wooldridge, captulo 4) 28/04/2014 25 / 32

  • Testes contra uma alternativa unilateral

    [lwage = 0, 284(0,104)

    + 0, 092(0,012)

    educ + 0, 0041(0,00172)

    exper + 0, 022(0,003)

    perm

    n = 526, R2 = 0, 316

    Os nmeros em parnteses so os erros-padro, tal que:

    texper =0, 00410, 0017

    2, 38

    que maior que o valor crtico para amostras grandes (gl > 120)c1% = 2, 362. Portanto, rejeita-se H0 : exper = 0 em favor de H1 : exper > 0 aonvel de signicncia de 1%. Um ano a mais de experincia, mantidos educ e perm no tem umagrande signicncia econmica, apenas 0, 41%. de aumento no salrioprevisto.Moiss Resende Filho (ECO/UnB) (Wooldridge, captulo 4) 28/04/2014 26 / 32

  • Testes contra uma alternativa unilateral

    _cons .2843595 .1041904 2.73 0.007 .0796756 .4890435 tenure .0220672 .0030936 7.13 0.000 .0159897 .0281448 exper .0041211 .0017233 2.39 0.017 .0007357 .0075065 educ .092029 .0073299 12.56 0.000 .0776292 .1064288

    lwage Coef. Std. Err. t P>|t| [95% Conf. Interval]

    Total 148.329751 525 .28253286 Root MSE = .44086 Adj R-squared = 0.3121

    Residual 101.455574 522 .194359337 R-squared = 0.3160 Model 46.8741776 3 15.6247259 Prob > F = 0.0000

    F( 3, 522) = 80.39Source SS df MS Number of obs = 526

    . reg lwage educ exper tenure

    texper = 2, 39

    p valor = 0.0172

    = 0.0085 ou 0.85%

    Moiss Resende Filho (ECO/UnB) (Wooldridge, captulo 4) 28/04/2014 27 / 32

  • Testes contra uma alternativa unilateral

    Pelo fato da distribuio t ser simtrica, testar H0 : j = 0 contra.H1 : j < 0

    direto, pois o valor crtico passa a ser c . Assim, rejeita-se H0 se a estatstica

    tj =j

    ep(j )< c

    ; caso contrrio, no se rejeita H0.

    Moiss Resende Filho (ECO/UnB) (Wooldridge, captulo 4) 28/04/2014 28 / 32

  • Testes contra uma alternativa unilateral

    Para gl = 18 e = 5%, o valor crtico c = 1, 734, para um testemonocaudal, segundo a Tabela G.2 (p. 652 do Wooldridge) ou com ocomputador (Scientic Workplace) c = TInv(0.05; 18) = 1.7341, talque a regra de rejeio

    tj < 1.734 outj > 1.734

    Area = .05

    -1.734regionrejection

    0

    Moiss Resende Filho (ECO/UnB) (Wooldridge, captulo 4) 28/04/2014 29 / 32

  • Testes contra uma alternativa unilateral

    EXEMPLO: Nota no exame nal e faltas s aulasAmostra de 680 alunos em "introductory microeconomics"naMichigan State University em vrios anos.

    A frequncia dos estudantes foi registrada eletronicamente emonitorada por monitores da disciplina.

    nal a nota na prova nal na distiplina em um total de 40 pontos.

    missed o nmero de aulas que o estudante faltou em um total de 32aulas.

    priGPA o IRA acumulado at o incio da disciplina "introductorymicroeconomics".

    ACT a nota do teste de avaliao para em curso superior.(min 13,max 32).

    Baixe os dados (disponveis no formato Stata emhttps://sites.google.com/site/rese0013/attend.dta) para o seucomputador e clique sobre o arquivo para abrir o Stata.Moiss Resende Filho (ECO/UnB) (Wooldridge, captulo 4) 28/04/2014 30 / 32

  • Testes contra uma alternativa unilateral

    O nmero de faltas afeta "negativamente"o desempenho dosalunos no exame nal?Ou no modelo economtrico

    nal = 0 + 1missed + 2priGPA+ 3ACT + u

    testarH0 : missed = 0 contra H1 : missed < 0

    Obtemos 1 = 0, 079 e t1 = 2.25. Como gl = (680 4) = 676 > 120, o valor crtico para amostrasgrandes (gl > 120) -c5% = 1, 65 e -c1% 2.36. Tal que rejeita-se H0 ao nvel de 5%, mas no ao nvel de 1%. Em termos prticos o efeito no grande, faltar 10 aulas a menso emum total de 32 aulas, diminui a nota no exame nal em apenas 0, 8pontos, ou seja, em menos que um ponto.

    Moiss Resende Filho (ECO/UnB) (Wooldridge, captulo 4) 28/04/2014 31 / 32

  • Testes contra uma alternativa unilateral

    _cons 12.37304 1.171961 10.56 0.000 10.07192 14.67416 ACT .4010639 .0532268 7.54 0.000 .2965542 .5055736 priGPA 1.915294 .372614 5.14 0.000 1.183674 2.646914 missed -.0793386 .0352349 -2.25 0.025 -.1485216 -.0101556

    final Coef. Std. Err. t P>|t| [95% Conf. Interval]

    Total 15061.9471 679 22.1825435 Root MSE = 4.2185 Adj R-squared = 0.1978

    Residual 12029.853 676 17.7956405 R-squared = 0.2013 Model 3032.09408 3 1010.69803 Prob > F = 0.0000

    F( 3, 676) = 56.79Source SS df MS Number of obs = 680

    . reg final missed priGPA ACT

    p valor = 0.0252

    = 0.0125 ou 1.25%

    Moiss Resende Filho (ECO/UnB) (Wooldridge, captulo 4) 28/04/2014 32 / 32

    Slide 2: Hipteses do MCRLSlide 3: ConsequnciasSlide 4: ConsequnciasSlide 5: ConsequnciasSlide 6: ConsequnciasSlide 7: Normalidade do erroSlide 8: Normalidade do erroSlide 9: Normalidade do erroSlide 10: Distribuies amostrais de MQOSlide 11: Distribuies amostraisSlide 12: Distribuies amostraisSlide 13: A distribuio tSlide 14: A distribuio tSlide 15: A distribuio tSlide 16: Testes de hiptese sobre um parmetro populacionalSlide 17: Testes de hiptese sobre um parmetro populacionalSlide 18: Testes de hiptese sobre um parmetro populacionalSlide 19: Testes de hiptese contra uma alternativa unilateralSlide 20: Testes de hiptese contra uma alternativa unilateralSlide 21: Testes de hiptese contra uma alternativa unilateralSlide 22: Testes de hiptese contra uma alternativa unilateralSlide 23: Testes de hiptese contra uma alternativa unilateralSlide 24: Testes de hiptese contra uma alternativa unilateralSlide 25: Testes de hiptese contra uma alternativa unilateralSlide 26: Testes de hiptese contra uma alternativa unilateralSlide 27: Testes de hiptese contra uma alternativa unilateralSlide 28: Testes de hiptese contra uma alternativa unilateralSlide 29: Testes de hiptese contra uma alternativa unilateralSlide 30: Testes de hiptese contra uma alternativa unilateralSlide 31: Testes de hiptese contra uma alternativa unilateralSlide 32: Testes de hiptese contra uma alternativa unilateral