Ce423 Aulas10e11 Heterocedasticidade - eco.unicamp.br · Heterocedasticidade Econometria Alexandre...
Transcript of Ce423 Aulas10e11 Heterocedasticidade - eco.unicamp.br · Heterocedasticidade Econometria Alexandre...
HeterocedasticidadeEconometria
Alexandre Gori Maia
Bibliografia Básica:- Maia, Alexandre Gori (2017). Econometria: conceitos e aplicações. Cap. 12..
Ementa:• Definição;• Identificação: Análise Gráfica, Goldfeld-Quandt, Breusch-Pagan, White;• Correção: MQP e MQGF;• Estimadores Robustos para a Variância;
Modelo Clássico de Regressão Linear
2/23
1) Relação Linear entre X e Y: O ajuste só é válido para relações lineares.
2) Os valores de X são fixos em repetidas amostras, não aleatórios:Quem varia é o regressando, o regressor é fixo e dado, qualquer que seja a amostra. Fazemos a pressuposição que dado um valor de X, Y irá variar segundo uma distribuição de probabilidade com valor esperado dado por E(Y|Xi).
3) Esperança condicional dos erros igual a zero, ou seja, E(e|xi)=0: É a mesma coisa afirmar que E(Y|xi)=xi´b.
4) A variabilidade dos erros é constante, ou seja, E(ei2)=s2
Os erros são homocedásticos, ou seja, sua variância é a mesma para qualquer X.
5) Os erros são não autocorrelacionados, ou seja, E(eiej)=0: Não há relação entre valores ordenados dos erros segundo tempo ou espaço.
6) Os erros apresentam distribuição normal: Não é um pressuposto necessário para que os estimadores de MQO sejam MELNV, mas necessário para que as inferências sejam válidas.
Mod
elo
Clá
ssic
o de
Reg
ress
ão L
inea
rDefinição Análise
GráficaGoldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto
Heterocedasticidade - Definição
Homocedasticidade
Homocedasticidade:A variância dos erros e, condicional aos valores das variáveis explanatórias, será constante.
Heterocedasticidade:A variância dos erros será diferente para cada valor condicional de Xji.
221 ),...,,/( s=
iii ki XXXeVar
Heterocedasticidade
221 ),...,,/( iki iii
XXXeVar s=
Y
XjX1
E(Y1)
X2
E(Y2)
Var(e2)=s2
Var(e1)=s2
Y
XjX1 X2
Var(e2)=s22E(Y1)
Var(e1)=s21
E(Y2)
3/23
Definição Análise Gráfica
Goldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto
Heterocedasticidade - CausasPrincipais causas da heterocedasticidade:
- Natureza das variáveis: alguns relacionamentos apresentam tipicamente tendência à heterocedasticia. Por exemplo, renda e poupança.
- Valores extremos: a ocorrência de um valor extremo na amostra pode inflacionar a variabilidade em um determinado ponto do ajuste.
- Falhas na especificação do modelo: a heterocedasticidade pode também ser devida à omissão de importantes variáveis no modelo.
- Transformação dos dados: a transformação das variáveis (por exemplo, proporção ao invés de valores absolutos) ou da forma funcional (modelo log-duplo ao invés de linear) pode eliminar a heterocedasticidade.
2)( iieVar s=iii eXY ++= ba
iii eXY ++= ba iiii eXXY +++= 221 bba
iii eXY ++= ba iii eXY ++= )ln()ln( ba
4/23
Definição Análise Gráfica
Goldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto
Heterocedasticidade - ConsequênciasIneficiência dos Estimadores de MQONa presenção de heterocedasticidade nos erros, os estimadores de MQO continuam sendo não viesados e consistentes, mas deixam de ser eficientes (ou seja, não possuem mais variância mínima). Em outras palavras, seja b o estimador de MQO, então existe outro estimador b* tal que:
Homocedasticia
Y
X
IntervalodeVariaçãodasestimativasde
MQO
IntervalodeVariaçãodasestimativasdeoutrométodo
Heterocedasticia
Y
X
IntervalodeVariaçãodasestimativasde
MQO
IntervalodeVariaçãodasestimativasdeummétodomaiseficiente
)ˆ(*)ˆ( bb VarVar <
^^
5/23
Definição Análise Gráfica
Goldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto
Heterocedasticidade - ConsequênciasTendenciosidade da Variância dos Estimadores:Outra importante consequência da heterocedasticidade é o fato de as estimativas dos erros padrão e de as estatísticas de teste t e F não serem mais válidas, mesmo para amostras grandes, já que a estimativa da variância dos estimadores dos coeficientes será viesada. Em outras palavras, na presença de heterocedasticidade teremos:
Seja o modelo: iii eXY ++= ba
Pelo MQO:åå
=
== ni
2i
ni ii
x
yx
1
1b eå =
= ni
2ix
S1
22ˆ
sb
No caso de heterocedasticia:
No caso de homocedasticia:
não viesado na ausência de heterocedasticidade e
viesado na sua presença
)ˆ()( 2ˆ bb VarSE ¹
2)( s=ieVarå =
= ni ix
Var12
2)ˆ( sb
2)( iieVar s=2
12
122
)()ˆ(åå
=
== ni i
ni ii
x
xVar
sb
6/23
Definição Análise Gráfica
Goldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto
IdentificaçãoPrincipais testes para se detectar a autocorrelação:
Análise gráfica: ê2 ´ Xj
Teste Goldfeld-QuandtIdentificação
Testes Paramétricos
Teste de Breusch-Pagan
Teste de White
7/23
Definição Análise Gráfica
Goldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto
Análise Gráficaê2
Homocedasticidade
A dispersãodos resíduos é a mesma aolongo de X
X
ê2Heterocedasticidade
A dispersãodos resíduos é
uma funçãolinear de X
X
ê2
Heterocedasticidade
A dispersãodos resíduosé uma funçãoquadrática de
X
X
ê2Heterocedasticidade
A dispersão dos resíduos cresce
de maneiraquadrática com os valores de X
constanteσ 2 = i22
i Xσσ =
2i2i1
2i XαX ασ +=
2i
22i Xσσ =
X8/23
Definição Análise Gráfica
Goldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto
Análise GráficaSejam os gastos de 40 famílias com alimentação em função da renda:
A dispersão dos resíduos em função da variável X (renda) sugere que, à medida que a renda cresce, a dispersão dos resíduos também aumenta, indicando a presença de heterocedasticidade, em uma relação aparentemente linear.
iii eRendaAlimentGasto ˆ13,08,40 ++=i
22i Xσσ =
9/23
Definição Análise Gráfica
Goldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto
Teste de Goldfeld-QuandtY
X
Sejam os valores da amostra:
ïî
ïíì
<
=22
211
22
210
σ: σH
σ: σH
Passos para efetuar o teste de Goldfeld-Quandt1- Ordenar as observações da amostra de acordo com os valores de X;2- Omitir c observações centrais para dar mais poder ao teste (c costuma ser igual a 4 para n=30 e c=10 para n=60) e separar observações em duas subamostras de (n-c)/2 observações; 3- Ajustar uma regressão para cada subamostra (cada regressão terá k variáveis independentes);4- Testar hipótese da igualdade dos erros quadráticos médios a partir da estatística F.
Regressão 1
Regressão 2
A omissão de c observações centrais objetiva acentuar a diferença entre o grupo com variância pequena (SQReg1) e com variância grande (SQReg2).
glSQResglSQResF//
1
2= )1(2
+--
= kcnglonde
glglF ,
Fp
Y1 Y2 ... Yn
X1 X2 ... Xn Onde: X1<X2<...<Xn
Para testar a hipótese nula da homocedasticia:
10/23
Definição Análise Gráfica
Goldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto
Teste de Goldfeld-Quandt
99,47,5269,2629
ˆˆ21
22 ===
ssF
Regressão 1
Regressão 2
ïî
ïíì
<
=22
211
22
210
σ: σH
σ: σH
Amostra 1iii eRendaAlimentGasto ˆ18,06,12 ++=
Das 40 observações originais, foram eliminadas 6 observações centrais para dar mais poder ao teste. Restaram dois subconjuntos com 17 observações cada.
Amostra 2iii eRendaAlimentGasto ˆ09,01,75 ++=
Fonte gl SQ QM F pRegressão 1 5967,2 5967,2 11,33 0,0042Resíduos 15 7900,0 526,7Total 16 13867,2
Fonte gl SQ QM F pRegressão 1 2308,6 2308,6 0,88 0,3636Resíduos 15 39449,1 2629,9Total 16 41757,7
estatística de teste:
15,15F
99,40017,0
Rejeita-se H0, ou seja, pode-se afirmar que há diferença entre as variâncias
(heterocedasticidade) com uma probabilidade de erro de apenas 0,17%
E para calcular a probabilidade de erro do tipo I:
Sejam os gastos de 40 famílias com alimentação em função da renda:
11/23
Definição Análise Gráfica
Goldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto
Teste de Breusch-Pagan
Passos para efetuar o teste de White1- Estimar os resíduos do ajuste de MQO para o modelo original de RLM;2- Ajustar um modelo auxiliar relacionando o quadrado dos resíduos às variáveis independentes do modelo original; 3- Calcular a estatística LM pelo produto do número de observações e o R2 do ajuste auxiliar;4- Calcular o valor p associado à estatística em uma distribuição c2 com gl dado pelo número de variáveis explanatórias;
2auxRnLM ´=
2kc
2auxRn´
p
ê2
Xj
iiii eXXY +++= 2211 bba
iiii uXXe +++= 221102ˆ ddd
Onde k é o número de variáveis explanatórias, R2
aux o coeficiente de determinação do ajuste
auxiliar e n o número de observaçõesî
íì
¹==
0:0:
1
210
jHH
ddd
Seja o modelo de RLM com k=2:
Par verificarmos se os resíduos quadráticos têm relação com os regressores:
Para testar a hipótese nula da homocedasticia:
12/23
Definição Análise Gráfica
Goldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto
Teste de Breusch-Pagan - ExemploDo ajuste original por MQO obtivemos:
iii eRendaAlimentGasto ˆ13,08,40 ++=
A partir dos resíduos de MQO, ajustamos o seguinte modelo auxiliar:
iii uRendae ˆ21,55,279,2ˆ2 ++-=
O teste de hipóteses será dado por:
îíì
¹=0:0:
11
10
dd
HH 0,12301,0402 =´=´ auxRn
21c
0,12
0005,0
A probabilidade de erro ao rejeitar H0 é de apenas 0,05%. Em outras palavras, há fortíssimas evidências para afirmarmos que os
erros são heterocedásticos pois ao fazermos tal afirmação estaríamos sujeitos a uma chance de erro de apenas 0,05%.
Sejam os gastos de 40 famílias com alimentação em função da renda:
301,02 =auxRiii uRendae ++= 102ˆ dd
13/23
Definição Análise Gráfica
Goldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto
Teste de White
Passos para efetuar o teste de White1- Estimar os resíduos do ajuste de MQO para o modelo original de RLM;2- Ajustar um modelo auxiliar relacionando o quadrado dos resíduos às variáveis independentes do modelo original, seus quadrados e produtos cruzados; 3- Calcular a estatística LM pelo produto do número de observações e o R2 do ajuste auxiliar;4- Calcular o valor p associado à estatística em uma distribuição c2 com gl dado pelo número de variáveis explanatórias do ajuste auxiliar;
2auxRnLM ´=
2hc
2auxRn´
p
ê2
Xj
iiii eXXY +++= 2211 bba
iiiiiiii uXXXXXXe ++++++= 225
21421322110
2ˆ ddddddOnde h é o número de
variáveis explanatórias, R2
aux o coeficiente de determinação e n o número
de observações, todos referentes ao ajuste
auxiliarîíì
¹===
0:0...:
1
510
jHH
ddd
Seja o modelo de RLM com k=2:
Par verificarmos se os resíduos quadráticos têm relação com os regressores, seus quadrados e seus produtos cruzados:
Para testar a hipótese nula da homocedasticia:
14/23
Definição Análise Gráfica
Goldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto
Teste de White - Exemplo
Do ajuste original por MQO obtivemos:
iii eRendaAlimentGasto ˆ13,08,40 ++=
A partir dos resíduos de MQO, ajustamos o seguinte modelo auxiliar:
O teste de hipóteses será dado por:
6,14366,0402 =´=´ auxRn
22c
58,14
0008,0
A probabilidade de erro ao rejeitar H0 é de apenas 0,08%. Em outras palavras, há fortíssimas evidências para afirmarmos que os
erros são heterocedásticos pois ao fazermos tal afirmação estaríamos sujeitos a uma chance de erro de apenas 0,08%.
Sejam os gastos de 40 famílias com alimentação em função da renda:
366,02 =auxRi
2iii uRendaRendae +++= 210
2ˆ ddd
i2iii uRendaRendae ˆ01,042,75,1923ˆ2 ++-=
îíì
¹==
0:0:
1
210
jHH
ddd
15/23
Definição Análise Gráfica
Goldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto
Correção HeterocedasticidadeDada a equação de RLM:
iki eXXYii++++= 211 ... bba
222
1
2
22
21
0000...00000000
0000...00000000
)()( ss
s
ss
Veee =
úúúú
û
ù
êêêê
ë
é
=
úúúúú
û
ù
êêêêê
ë
é
==
nn
T
v
vv
EVar
eXβy +=A equivalente matricial:
Haverá heterocedasticidade quando:
Se conhecemos vi, podemos corrigir o modelo pela equação:
Se conhecemos V podemos corrigir a equação por:
22)()( iii eEeVar s==Que pode ainda ser representado por:
ii veE 22 )( s=onde o fator vi indica
como varia a variância de e para cada
observação
i
i
i
k
iii
i
ve
vX
vX
vvY ii ++++= 2
11 ...1 bba
Pois, nessa equação, os erros serão homocedásticos:
222
)(1 s==úú
û
ù
êê
ë
é
÷÷ø
öççè
æi
ii
i eEvv
eE
Haverá heterocedasticidade quando:
ΛeΛXβΛy += onde
úúúúú
û
ù
êêêêê
ë
é
=
2
2
1
10000...0000100001
v
vv
Λ
Pois:
22)( ss IΛVΛΛΛee ==TE
16/23
Definição Análise Gráfica
Goldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto
Mínimos Quadrados PonderadosDefinição:Uma vez conhecida a matriz V de variâncias e convariâncias do erros de um modelo de RLM, podemos obter os MELNV transformando as variáveis originais pela matriz L, tal que LTL=V–1. Em outras palavras, seja o modelo:
Esse método é denominado de Mínimos Quadrados Ponderados (MQP), um caso específico do método de Mínimos Quadrados Generalizados (MQG).
eXβy += ondeEntão:
ΛeΛXβΛy += ondeApresentará erros homocedásticos, pois:
yVXXVXΛyΛXΛXΛXβ 1111 )()(ˆ ---- == TTTTTT
Analogamente, teremos:yVXβyVy 11 ˆSQRes -- -= TTT e 2112
ˆ ˆ)(S sb--= XVXT
2)()( sVeee == TEVar
1-= VΛΛT22)( ss IΛVΛΛΛee ==TE
Os estimadores de MQP serão:
17/23
Definição Análise Gráfica
Goldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto
MQP - V ConhecidaMínimos Quadrados Ponderados:Seja o modelo de RLM:
eXβy +=Então teremos:
com heterocedasticidade dada por: 2)( sii veVar =
Sabemos, nessas circunstâncias, que os estimadores de MQP serão os MELNV:
yVXXVXβ 111 )(ˆ ---= TT
Caso vi seja conhecido, a matriz V–1 será dada por:
222
1
0000...00000000
)( ss Ve =
úúúú
û
ù
êêêê
ë
é
=
nv
vv
Var
úúúú
û
ù
êêêê
ë
é
=-
nv
vv
10000...0000100001
2
1
1V
18/23
Definição Análise Gráfica
Goldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto
MQP com V conhecida - Exemplo
2)( sii XeVar =
úû
ùêë
é== ---
14,09,31
)(ˆ 111 yVXXVXβ TT úû
ùêë
é-
-== --
0007,046,046,05,323
ˆ)( 2112ˆ sXVXβ
TS
As estimativas de MQO foram:
Supondo agora que:
Teremos a seguinte matriz de Var-Cov dos erros:
e
As estimativas de MQP seriam:
e
808,138
ˆ
1ˆ
112 =
-=
--=
-- yVXβyVy TTT
knSQRess
Sejam os gastos de 40 famílias com alimentação em função da renda:
22
40
1
...0.........0...
)( ss V=úúú
û
ù
êêê
ë
é=
X
XeVar
úúú
û
ù
êêê
ë
é=-
40
11
1...0.........0...1
X
XV
iii eRendaAlimentGasto ˆ13,08,40 ++=
19/23
Definição Análise Gráfica
Goldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto
MQGF - V DesconhecidaMínimos Quadrados Generalizados Factíveis:Seja o modelo de RLM:
eXβy += com heterocedasticidade dada por: 2)( sii veVar =
As estimativas de vi podem ser substituídas na matriz de ponderações V, agora denominada V, para obtermos os estimadores consistentes (embora viesados) de Mínimos Quadrados Generalizados Factíveis:
yVXXVXβ 111 ˆ)ˆ(ˆ ---= TT
Caso o fator vi seja desconhecido, podemos supor que a variabilidade dos erros seja uma função das variáveis independentes:
iXX
i uee ikki ddd +++= ...2 110
E ajustar a função linear deste modelo a partir dos resíduos de MQO:*
11*0
2 ...)ˆln( ikki uXXeii++++= ddd
*11
*0
2 ...)ln( ikki uXXeii++++= ddd
Uma vez estimada esta função por MQO, as estimativas de vi serão dadas por:
ikki XXi ev ddd ˆ...ˆˆ 11
*0ˆ +++
=
^
d*0 e u*
i são o intercepto e erro do modelo linear
20/23
Definição Análise Gráfica
Goldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto
MQGF com V Desconhecida - Exemplo
úû
ùêë
é== ---
16,06,22ˆ)ˆ(ˆ 111 yVXXVXβ TT
As estimativas de MQO foram:
Supondo agora que:
Ajustando por MQO, estimaremos a relação de heterocedasticidade por:
Finalmente, as estimativas de MQP serão:
Sejam os gastos de 40 famílias com alimentação em função da renda:
indaRe
i uee i102 dd +=
iii eRendaAlimentGasto ˆ13,08,40 ++=
*1
*0
2)ln( iii undaRee ++= dd
iii undaRee ˆ004,0363,3)ˆln( 2 ++= indaRei ev 004,0363,3ˆ +=
E a matriz de ponderações V será estimada por:úúú
û
ù
êêê
ë
é
=
40
1
ˆ...0.........0...ˆ
ˆ
v
vV
21/23
Definição Análise Gráfica
Goldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto
Estimadores RobustosEstimadores da Variância Robustos à Autocorrelação- Esimtador de White:Seja o modelo de RLS:
iii eXY ++= ba
Embora os estimadores de MQO para b continuem não viesados, as estimativas de suas variâncias serão viesadas.Um estimador robusto, ou seja, igualmente válido na presença ou não de heterocedasticidade, pode basear-se na real variância do estimador:
No caso de uma RLM teríamos:
Esse estimador seja robusto à heterocedasticidade, atribuído a White, é válido assintoticamente. Para amostras pequenas, as estatísticas t e F baseadas no estimador robusto não serão válidas.
com heterocedasticidade dada por: 2)( sii veVar =
212
122
)()ˆ(åå
=
== ni i
ni ii
x
xVar
sb
212
122
2ˆ
)(
ˆ
åå
=
==* ni i
ni ii
x
exSb
ikj jji eXY
i++= å =1
ba 212
122
2ˆ
)ˆ(
ˆˆ
åå
=
==* ni j
ni ij
i
i
j u
euSb
Onde ûj é o resíduo do ajuste de Xj em função das demais variáveis independentes
22/23
Definição Análise Gráfica
Goldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto
Estimador Robusto - Exemplo
As estimativas de MQO foram:
Caso os erros sejam homocedásticos, a estimativa de MQO para Var(b ) seria:
Finalmente, a estatística t para testar a significância de b seria:
Sejam os gastos de 40 famílias com alimentação em função da renda:
iii eRendaAlimentGasto ++= ba^
iii eRendaAlimentGasto ˆ13,08,40 ++=
2
12
22ˆ 031,000093,0
463.532.1429.1ˆ
====å =
ni ix
S sb
Por sua vez, uma estimativa robusta à heterocedasticidade para Var(b) seria:^
222
12
122
2ˆ 038,00015,0
)463.532.1(919.453.421.3
)(
ˆ====
åå
=
=* n
i i
ni ii
x
exSb
36,3038,013,0
==tEmbora haja evidências de heterocedasticidade no modelo, devemos ter cautela na interpretação do teste t, já que esta baseada no estimador robusto pode não ser válida para amostras pequenas (n=40).
23/23
Definição Análise Gráfica
Goldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto