ECONOMETRIA - pmbortolon.wikispaces.com 1...O método Econométrico 3. Especificação do modelo...
Transcript of ECONOMETRIA - pmbortolon.wikispaces.com 1...O método Econométrico 3. Especificação do modelo...
ECONOMETRIA
Prof. Patricia Maria Bortolon, D. Sc.
Introdução
Teoria Econômica
Matemática
Fenômenos Econômicos
Inferência Estatística
Teoria Econômica
Teoria Microeconômica
Preço
Demanda
Mas quanto????
Teoria Econômica
Economia Matemática
• Formula equações sem levar em conta se a teoria pode ser medida ou verificada
Estatística Econômica
• Coleta, processamento e apresentação dos dados
Estatística Matemática
• Ferramentas específicas para lidar com dados que não foram gerados por experimentos controlados
O método Econométrico
1. Exposição da teoria ou hipótese
– Keynes: o aumento da renda eleva o consumo, mas não em
proporção igual ao aumento dessa renda.
– Propensão marginal a consumir (PMC) > 0, mas < 1
2. Especificação do modelo matemático da teoria
– Um economista matemático poderia sugerir:
Y
X
Despesa de
consumo
Renda
β1
β2= PMC
consumo
Inclinação = PMC
renda
O método Econométrico
3. Especificação do modelo estatístico ou econométrico
– Se obtivéssemos dados de 500 famílias (consumo e renda) e
plotássemos os pontos no gráfico, todos cairiam em cima da
reta?
– Não. Por que?
– Porque provavelmente outros fatores afetam a decisão de
consumo (tamanho da família, cultura, religião etc...)
– A função definida pelo economista matemático é
determinística
– Para dar conta das relações inexatas o econometrista
escreve:
Modelo
Econométrico
Distúrbio
Termo de erro
Var. aleatória (estocástica)
Representa todos os fatores
que afetam o consumo
mas não são levados
em conta explicitamente
O método Econométrico
4. Obtenção dos dados
Y
X
u
O método Econométrico
5. Estimação dos parâmetros do modelo econométrico
– Vai dar conteúdo empírico à função consumo
– Análise de regressão
– Aumento de US$1 no período amostrado, provoca em
média, um aumento no consumo de US$0,70
– Por que dizemos “em média”? Porque a relação é inexata.
^ indica se tratar de uma estimativa
O método Econométrico
6. Testes de hipóteses
– Keynes: esperava que PMC fosse + e < 1
– Mas, 0,70 é estatisticamente menor que 1?
– 0,70 está suficientemente abaixo de 1, ou é um resultado devido ao
acaso?
7. Projeção ou previsão
– Uma redução de impostos => aumento da renda das famílias => quanto
aumentará o consumo?
8. Uso do modelo para fins de controle ou de política
– Se certo nível de consumo garante certo nível de desemprego a relação
calculada pode ser usada no sentido inverso para descobrir qual o nível
de renda necessário. Políticas podem ser estabelecidas para atingir esse
nível de geração de renda.
Capítulo 1
A natureza da análise de regressão
Fonte: GUJARATI; D. N. Econometria Básica: 4ª Edição.
Rio de Janeiro. Elsevier- Campus, 2006
Origem Histórica
• Altura de filhos de pais altos e de pais baixos tendem
para a altura média da população
• Lei da regressão universal de Galton
• Confirmada por Karl Pearson
• “regressão a mediocridade”
Interpretação moderna da regressão
• Descobrir como a altura média dos filhos varia, dada a
altura dos pais
• Estudo do comportamento de uma variável dependente
em relação a uma ou mais variáveis explanatórias, para
estimar ou prever o valor (médio) da população da
primeira em termos dos valores conhecidos ou fixados
(em amostras repetidas) das segundas.
Ver figura 1.1 e exemplos da página 14 a 16
Relações Estatísticas x Determinísticas
• Determinística (ou funcional)
– Lei da gravitação de Newton
• Estatísticas
– Rendimento das lavouras = f (temperatura, pluviosidade, luz solar,
fertilizantes)
– Um agrônomo consegue prever com exatidão o rendimento se ele
conhecer os valores das variáves à direita da equação?
– Não. Por que?
• Erros de medição
• Influência de outros fatores
– Há uma variabilidade “intrínseca” ou aleatória
Regressão x Causação
• Kendall e Stuart: as ideias de causação devem se
originar de alguma teoria
• Rendimento causa chuva ou chuva causa rendimento?
• O que o faz acreditar na segunda?
– Senso comum
– Não poder controlar a pluviosidade por meio de uma variação
no rendimento da lavoura
• Relação estatística não implica logicamente causação
• A causação irá depender de considerações a priori ou
teóricas
Regressão x Correlação
• Correlação
– Não há diferença entre variável dependente e explanatória
– As duas variáveis são aleatória
– Correlação entre notas de estatística e matemática
• Regressão
– Há uma assimetria no tratamento das variáveis
• Dependente: estatística, aleatória, estocástica, tem distribuição de
probabilidade
• Independente: tem valores fixos em amostras repetidas (ex: alturas)
Mede a força ou grau
de associação linear
entre duas variáveis
Tentamos prever o
valor médio de uma
variável com base nos valores
fixos de outras variáveis
Terminologia e Notação
• Ver quadro da pag. 18
• Análise de regressão simples:
• Análise de regressão múltipla:
Terminologia e Notação
• Variável aleatória: (ou estocástica) – aquela que pode
assumir qualquer valor, + ou - , dentro de um conjunto
de valores com uma dada probabilidade.
Y Variável dependente
Xk Variável explicativa (X1, X2, ... , Xk)
NNo. total de observações na população
T
nNo. total de observações na amostra
t
iSubscrito – dados de corte transversal, coletados em
um ponto no tempo
tSubscrito – dados de séries temporais, coletados ao
longo de um intervalo de tempo
Tipos de Dados
• Séries Temporais
– A variável assume valores em diferentes momentos do tempo
– Cotações intra-diárias de ações, receitas mensais, lucros
anuais
– Estacionária: quando a média e a variância não variam
sistematicamente ao longo do tempo
• Corte Transversal
– Variáveis coletadas em um mesmo momento no tempo
– Lucro líquido das empresas siderúrgicas em 2010
– Heterogeneidade pode ser um problema (ver tab. 1.1 e fig.
1.6)
Tipos de Dados
• Dados combinados
– Ver tab. 1.2 do exercício 1.1
– O IPC de cada país no período 73-97 é uma série temporal
– Os dados dos 7 países em cada ano é um corte transversal
• Dados em painel (longitudinais ou de micropainel)
– Uma mesma unidade em corte transversal é pesquisada ao
longo do tempo
Fontes de Dados
• Economática
• Thomson Reuters
• CVM
• BM&FBovespa
• IBGE
• Banco Central
• Sites de empresas
Exatidão dos Dados
• A maioria dos dados não são experimentais por
natureza, há possibilidade de erros de observação,
intencionais ou não
• Mesmo em dados experimentais: erros de medição
• Questionários: 40% de resposta – viés de seletividade
“Os resultados de sua pesquisa terão a mesma
qualidade dos dados coletados”
Escalas de Medição das Variáveis
• Escala nominal
– Sexo, estado civil
– Para associar observações a categorias específicas
• Escala ordinal
– Classe de renda, nível educacional
– É possível ordenar
• Escala de intervalo
– É possível ordenar e comparar
– Os intervalos são iguais
– Ex.: latitude e longitude
• Escala de razão
– A razão (X1/X2) e a distância (X1 – X2) são significativas
– É possível ordenar
– É possível comparar
– Tem um zero real
Stevens (1946)
Stevens (1946)
Capítulo 2 – Análise de Regressão com
Duas Variáveis
Algumas ideias básicas
Fonte: GUJARATI; D. N. Econometria Básica: 4ª Edição.
Rio de Janeiro. Elsevier- Campus, 2006
Tabela 2.1
• Grupos de renda => valores fixos de X
• Y varia para cada valor fixo de X
• O valor médio de Y aumenta com o aumento da renda
– Para a renda mensal de $80 => consumo médio de $65
– São 10 valores médios para as 10 classes de renda
Valores esperados condicionais
E(Y | X)
Tabela 2.1
• Valor esperado incondicional
– E(Y) = soma dos 60 dados de consumo dividido por 60
– Incondicional pois não leva em consideração os diferentes
níveis de renda
“Qual o valor esperado das despesas de consumo semanais médias
de uma família?”
“Qual o valor esperado das despesas de consumo semanais de uma
família cuja renda mensal é, digamos, de $140?”
$ 121,20
$ 101
LRP
• LRP = Linha de Regressão Populacional
Uma curva de regressão populacional é o lugar geométrico das
médias condicionais da variável dependente para os valores
fixados da variável explanatória.
Ver fig. 2.2
Conceito de Regressão Populacional
Cada média condicional E(Y | Xi) é uma função de Xi,
onde Xi é um dado valor de X.
E(Y | Xi) = f(Xi) :função de esperança condicional FEC
:função de regressão populacional FRP
Qual a forma assumida pela função f(Xi)?
Conceito de Regressão Populacional
Qual a forma assumida pela função f(Xi)?
interceptocoeficiente angular
Parâmetros desconhecidos, mas fixos
Função de regressão populacional
Modelo de regressão populacional
Regressão linear populacional
O significado do termo LINEAR
São lineares nos
parâmetros
O significado do termo LINEAR
O significado do termo LINEAR
• A linearidade relevante para a teoria da regressão é a
nos parâmetros
Linear nos
parâmetros?
Linear nas variáveis?
Sim Não
Sim MRL MRL
Não MRNL MRNL
Especificação estocástica da FRP
• O que podemos dizer sobre os gastos de consumo de
uma dada família e um dado nível de renda?
Yi = E(Y|Xi) + ui
ui = Yi – E(Y|Xi)
- Desvio de um Yi individual em torno de seu valor
esperado
- Distúrbio estocástico
- Termo de erro estocástico
(1)
Especificação estocástica da FRP
Yi = E(Y|Xi) + ui(1)
Gasto médio de consumo
de todas as famílias com
a mesma renda
= elemento sistemático ou
determinístico
Elemento aleatório ou não
sistemático = representa (é uma
proxy) de todas as variáveis
omitidas ou negligenciadas que
podem afetar Y mas não foram
incluídas nos modelos de
Regressão.
Especificação estocástica da FRP
Yi = E(Y|Xi) + ui
E(Yi|Xi) = E[E(Y|Xi)] + E(ui|Xi)
=> E(ui|Xi) = 0=
A pressuposição de que a linha de regressão passa pelas médias
condicionais de Y => que os valores médios condicionais de ui
(condicionais a um dado X) são iguais a zero.
O significado do termo de erro estocástico
• Caráter vago da teoria
– ui é um substituto para todas as variáveis excluídas ou
omitidas do modelo
• Falta de dados disponíveis
– Ex.: no caso do consumo, a riqueza das famílias
• Variáveis essenciais x variáveis periféricas (com pouca
influência)
• Caráter intrinsicamente aleatório do comportamento
humano
• Variáveis proxy pouco adequadas
– Ex.: endividamento, valor de mercado
O significado do termo de erro estocástico
• Princípio da parcimônia
– Navalha de Occam: o modelo de regressão deve ser o mais
simples possível
• Forma funcional equivocada
– Quando é possível inferir a forma funcional a partir de um
gráfico => só no modelo de regressão linear simples
Função de Regressão Amostral
Estimador de β2
Estimador de β1
Estimador de E(Y|Xi)
Estimador = estatística (amostral) = estimativa
Forma Estocástica da FRA
Estimador de ui
Capítulo 3 – Modelo de Regressão de
Duas Variáveis
O Problema da Estimação
Fonte: GUJARATI; D. N. Econometria Básica: 4ª Edição.
Rio de Janeiro. Elsevier- Campus, 2006
Método dos Mínimos Quadrados
Ordinários - MQO
• Recordemos a FRP de duas variáveis:
𝑌𝑖 = 𝛽1 + 𝛽2𝑋𝑖 + 𝑢𝑖
• Como esta não pode ser observada diretamente, temos
que estimá-la a partir da FRA:
𝑌𝑖 = 𝛽1 + 𝛽2𝑋𝑖 + 𝑢𝑖
= 𝑌𝑖 + 𝑢𝑖
• Podemos escrevê-la da seguinte forma:
𝑢𝑖 = 𝑌𝑖 − 𝑌𝑖
= 𝑌𝑖 − 𝛽1 + 𝛽2𝑋𝑖
• E agora?
Método dos Mínimos Quadrados
Ordinários - MQO
• 1ª. sugestão: escolher a FRA tal que 𝑢𝑖 = 𝑌𝑖 − 𝑌𝑖
– Problema: a soma algébrica pode resultar em valor muito
pequeno ou zero, mesmo que os pontos estejam muito
dispersos em torno da reta ajustada (ver fig. 3.1)
• 2ª. sugestão: usar 𝑢𝑖2 = 𝑌𝑖 − 𝑌𝑖
2
= 𝑌𝑖 − 𝛽1 + 𝛽2𝑋𝑖2
𝑢𝑖2 = 𝑓 𝛽1, 𝛽2
Método dos Mínimos Quadrados
Ordinários - MQO
𝑢𝑖2 = 𝑌𝑖 − 𝛽1 − 𝛽2𝑋𝑖
2
𝜕 𝑢𝑖2
𝜕 𝛽1
= −2 𝑌𝑖 − 𝛽1 − 𝛽2𝑋𝑖 = 0
𝜕 𝑢𝑖2
𝜕 𝛽2
= −2 𝑌𝑖 − 𝛽1 − 𝛽2𝑋𝑖 𝑋𝑖 = 0
(1)
(2)
(1) e (2) são as Equações Normais
Método dos Mínimos Quadrados
Ordinários - MQO
• Resolvendo o sistema de equações:
𝛽2 = 𝑋𝑖 − 𝑋 𝑌𝑖 − 𝑌
𝑋𝑖 − 𝑋 2=
𝑥𝑖𝑦𝑖
𝑥𝑖2
𝛽1 = 𝑌 − 𝛽2 𝑋
MQO – Propriedades Numéricas
Obs.: não dependem da forma como os dados são gerados
I. São calculados a partir de quantidades observáveis
(isto é, amostrais)
II. São estimadores pontuais
III. Obtidos os estimadores, a linha de regressão pode ser
facilmente obtida. A linha de regressão tem as
seguintes propriedades:
Propriedades da Linha de Regressão
1. Passa pelas médias amostrais 𝑋 e 𝑌 e pode ser escrita
como 𝑌 = 𝛽1 + 𝛽2 𝑋
2. O valor médio dos Y estimados é igual ao valor médio
dos Y observados 𝑌𝑖 = 𝛽1 + 𝛽2𝑋𝑖 𝑌𝑖 = 𝑌 − 𝛽2
𝑋1
+ 𝛽2𝑋𝑖
𝑌𝑖 = 𝑌 − 𝛽2 𝑋𝑖 − 𝛽2 𝑋 aplicando o somatório
e dividindo por n
𝑌𝑖
𝑛=
𝑌
𝑛− 𝛽2 𝑋𝑖 − 𝑋
𝑌 = 𝑌
Propriedades da Linha de Regressão
3. O valor médio dos resíduos é igual a zero
Da primeira equação normal:
−2 𝑌𝑖 − 𝛽1 − 𝛽2𝑋𝑖 = 0
−2 𝑢𝑖 = 0 𝑢 = 0
Por causa disso a FRA pode ser escrita na forma de
desvios em relação à média:
1º - aplicando somatório em 𝑌𝑖 = 𝛽1 + 𝛽2𝑋𝑖 + 𝑢𝑖 (1)
𝑌𝑖
𝑖
= 𝑛 𝛽1 + 𝛽2 𝑋𝑖 + 𝑢𝑖
0
Propriedades da Linha de Regressão
2º - dividindo por n
𝑌 = 𝛽1 + 𝛽2 𝑋 (2)
3º. – fazendo (1) em (2)
𝑌𝑖 − 𝑌 = 𝛽2 𝑋𝑖 − 𝑋 + 𝑢𝑖 ou
𝑦𝑖 = 𝛽2𝑥𝑖 + 𝑢𝑖 <= formato de desvio 𝛽1 não aparece
FRA: 𝑦𝑖 = 𝛽2𝑥𝑖 + 𝑢𝑖
Propriedades da Linha de Regressão
4º - 𝑢𝑖 não são correlacionados com 𝑌𝑖
A partir do formato de desvio:
𝑦𝑖 = 𝛽2𝑥𝑖 (x 𝑢𝑖) e somatório
𝑦𝑖 𝑢𝑖 = 𝛽2 𝑥𝑖 𝑦𝑖 − 𝛽2𝑥𝑖
𝑦𝑖 𝑢𝑖 = 𝛽2 𝑥𝑖𝑦𝑖 − 𝛽22 𝑥𝑖
2 mas 𝛽2 = 𝑥𝑖𝑦𝑖
𝑥𝑖2
𝑦𝑖 𝑢𝑖 = 𝛽22 𝑥𝑖
2 − 𝛽22 𝑥𝑖
2
𝑦𝑖 𝑢𝑖 = 0 𝑌𝑖 − 𝑌 𝑢𝑖 = 0 é a covariância de 𝑌𝑖 com
𝑢𝑖
Propriedades da Linha de Regressão
4º - 𝑢𝑖 não são correlacionados com 𝑋𝑖, isto é, 𝑢𝑖𝑋𝑖 = 0
Da 2ª. Equação normal:
−2 𝑌𝑖 − 𝛽1 − 𝛽2𝑋𝑖 𝑋𝑖 = 0
𝑢𝑖
Premissas subjacentes ao MQO
• Necessárias para que possamos fazer inferências
MLRC – Modelo de Regressão Linear Clássico
Premissa 1: o modelo de regressão é linear nos
parâmetros
Premissa 2: os valores de X são fixos em amostras
repetidas, ou seja, X é não estocástico. Nossa análise de
regressão é condicional aos valores de X.
Premissa 3: o valor médio do termo de erro ui é zero.
E(ui|Xi) = 0
Os fatores implícitos que afetam ui não afetam
sistematicamente o valor médio de Y.
Premissas subjacentes ao MQO
MLRC – Modelo de Regressão Linear Clássico
Se E(ui|Xi) = γ temos um problema de identificação:
E(Yi|Xi) = β1 + β2Xi + ui
E[E(Yi|Xi)] = E(β1|Xi)+ E(β2Xi|Xi)+ E(ui|Xi)
E(Yi|Xi) = β1 + β2Xi + γ
E(Yi|Xi) = (β1 + γ) + β2Xi
E(Yi|Xi) = β’1 + β2Xi
Ao estimar esse modelo obtemos infinitas soluções para
β1 e γ
Premissas subjacentes ao MQO
MLRC – Modelo de Regressão Linear Clássico
Premissa 4: homocedasticidade de ui
Var(ui|Xi) = E[ui – E(ui|Xi)]2
Var(ui|Xi) = σ2
Se for heterocedástico => 𝑉𝑎𝑟 𝑢𝑖 𝑋𝑖 = 𝜎𝑖2
As variâncias condicionais de Yi também são
homocedásticas.
Var(Yi|Xi) = σ2
Premissas subjacentes ao MQO
MLRC – Modelo de Regressão Linear Clássico
Premissa 5: não há autocorrelação entre os termos de
erro
𝑐𝑜𝑣 𝑢𝑖 , 𝑢𝑗 = 0 ∀ 𝑖 ≠ 𝑗
Premissa 6: covariância entre ui e Xi é igual a zero
𝑐𝑜𝑣 𝑢𝑖 , 𝑋𝑖 = 0 𝐸 𝑢𝑖𝑋𝑖 = 0
– Se X é não estocástico essa premissa é satisfeita automaticamente, uma vez
que nesse caso a covariâcia entre o erro e X é necessariamente zero.
– Importante para que se possa avaliar o efeito isolado de X sobre Y.
– Importante porque se X forem aleatórios ainda assim a teoria da regressão
será aplicável desde que os X não sejam correlacionados com os termos de
erro.
Premissas subjacentes ao MQO
MLRC – Modelo de Regressão Linear Clássico
Premissa 7: n deve ser maior que o número de
parâmetros a serem estimados
Premissa 8: variabilidade dos valores de X – “as
variáveis precisam variar”
𝛽2 = 𝑥𝑖𝑦𝑖
𝑥𝑖2
Premissa 9: o modelo de regressão está especificado na
forma correta (ver eq. 3.2.7 e 3.2.8 e fig. 3.7)
Premissa 10: (para modelos com mais de 2 variáveis) não
há relações lineares perfeitas entre as variáveis
explanatórias
Precisão ou erros-padrão das estimativas
MQO
𝑣𝑎𝑟 𝛽2 =𝜎2
𝑥𝑖2 𝑣𝑎𝑟 𝛽1 =
𝑋𝑖2
𝑛 𝑥𝑖2 𝜎2
Onde 𝜎2 é a variância homocedástica de ui
Obs.:
‒ Quanto maior a variação nos valores de Xi maior a
precisão da estimativa de 𝛽2
‒ Com o aumento de n também aumenta a precisão
Precisão ou erros-padrão das estimativas
MQO
Se 𝜎2 é desconhecido pode ser estimado por
𝜎2 = 𝑢𝑖
2
𝑛 − 2 𝑢𝑖
2= SQR = soma dos quadrados dos resíduos
𝜎 = 𝑢𝑖
2
𝑛 − 2
É o erro padrão da estimativa, é o desvio padrão dos
valores de Y em relação à linha de regressão. Uma
medida da “qualidade do ajustamento”.
Teorema de Gauss-Markov
• 𝛽2 é dito o melhor estimador linear não tendencioso de
β2 se:
1. É linear, por exemplo, em Y
2. É não tendencioso => E( 𝛽2) = β2
3. É eficiente, ou seja, entre todos os estimadores lineares é o
de menor variância (ver fig. 3.8)
Ver propriedades dos estimadores na pag. 723
Qualidade do ajustamento• r2 no caso de regressão com duas variáveis
• R2 no caso de regressão múltipla = coeficiente de determinação
Xi
Y
X
Yi
STQ = (Yi - Y)2
SQR = (Yi - Yi )2
SQReg = (Yi - Y)2
_
_
_
Y
Y
Y_Y
Qualidade do Ajustamento
𝑌𝑖 = 𝑌𝑖 + 𝑢𝑖
(𝑌𝑖 − 𝑌)2= ( 𝑌𝑖 − 𝑌)2+(𝑌𝑖 − 𝑌𝑖)2
𝑆𝑇𝑄 = 𝑆𝑄𝐸 + 𝑆𝑄𝑅 ÷ 𝑆𝑇𝑄
1 =𝑆𝑄𝐸
𝑆𝑇𝑄+
𝑆𝑄𝑅
𝑆𝑇𝑄
1 = 𝑟2 +𝑆𝑄𝑅
𝑆𝑇𝑄
𝑟2 =𝑆𝑄𝐸
𝑆𝑇𝑄=
( 𝑌𝑖 − 𝑌)2
(𝑌𝑖 − 𝑌)2
= (𝑌𝑖 − 𝑌𝑖)
2
(𝑌𝑖 − 𝑌)2=
𝑢𝑖2
(𝑌𝑖 − 𝑌)2
Qualidade do Ajustamento
𝑟2 = 1 −𝑆𝑄𝑅
𝑆𝑇𝑄
• Mede a proporção ou percentual da variação total de Y
explicada pelo modelo de regressão
• No modelo de regressão linear simples, o R2 é igual ao
quadrado do coeficiente de correlação entre X e Y
𝑟2 = 𝑟𝑥𝑦2
Coeficiente de determinação amostral
Qualidade do Ajustamento
• No modelo de regressão linear simples, o R2 é igual ao
quadrado do coeficiente de correlação entre X e Y
𝑟2 = 𝑟𝑥𝑦2
0 ≤ 𝑟2 ≤ 1
Ajuste perfeito 𝑌𝑖 = 𝑌𝑖
Sem relação linear
entre Y e X 𝑌𝑖 = 𝑌
Coeficiente de Correlação Amostral - r
1. Pode ser + ou –
2. −1 ≤ r ≤ 1
3. Simétrica 𝑟𝑥𝑦 = 𝑟𝑦𝑥
4. Independe da escala
𝑟𝑥𝑦 = 𝑟𝑥∗𝑦∗ onde 𝑋𝑖∗ = 𝑎𝑋𝑖 + 𝑐 e 𝑌𝑖
∗ = 𝑏𝑌𝑖 + 𝑑
5. Se X e Y são independentes rxy = 0
mas rxy = 0 não implica independência
5. Não implica relação de causa e efeito
6. Não tem sentido para descrever relações não lineares
Capítulo 4 – Modelo Normal de
Regressão Linear Clássico
MNRLC
Fonte: GUJARATI; D. N. Econometria Básica: 4ª Edição.
Rio de Janeiro. Elsevier- Campus, 2006
Até aqui...
• Com o auxílio do método MQO conseguimos estimar
β1, β2, σ2.
• Sob as premissas do MRLC vimos que os estimadores
desses parâmetros 𝛽1, 𝛽2 e 𝜎2 apresentam propriedades
estatísticas desejáveis tais como não tendenciosidade,
variância mínima etc...
• Falta agora fazer os testes de hipóteses necessários às
inferências sobre a FRP.
• Quão longe 𝛽1, 𝛽2 e 𝜎2 estão dos parâmetros
populacionais β1, β2, σ2?
• Para isso precisamos descobrir as distribuições de
probabilidade de 𝛽1, 𝛽2 e 𝜎2.
𝛽2 = 𝑥𝑖𝑦𝑖
𝑥𝑖2
Do numerador:
𝑥𝑖𝑦𝑖 = 𝑥𝑖 𝑌𝑖 − 𝑌 = 𝑥𝑖𝑌𝑖 − 𝑌 𝑥𝑖
= 𝑥𝑖𝑌𝑖 − 𝑌 𝑋𝑖 − 𝑋
= 𝑥𝑖𝑌𝑖
Daí: 𝛽2 = 𝑥𝑖𝑦𝑖
𝑥𝑖2 =
𝑥𝑖𝑌𝑖
𝑥𝑖2 = 𝑘. 𝑌𝑖
• Como pressupomos que X é não estocástico, nossa
análise de regressão é condicionada aos valores fixos de
Xi.
• 𝛽2 é uma função linear de Yi
𝑌𝑖 = 𝛽1 + 𝛽2𝑋𝑖 + 𝑢𝑖
𝛽2 = 𝑘 𝛽1 + 𝛽2𝑋𝑖 + 𝑢𝑖
• Mas Xi é não estocástico, então a variação de 𝛽2 vai
depender da variação de ui
• Como o MQO não faz qualquer pressuposição sobre a
natureza probabilística de ui, não nos ajuda a fazer
inferências a respeito da FRP a partir da FRA.
A premissa de normalidade de ui
• Normalidade de ui => MNRLC
𝑢𝑖~𝑁 0, 𝜎2
Média: E(ui) = 0
Variância: 𝐸 𝑢𝑖 − 𝐸(𝑢𝑖)2 = 𝐸 𝑢𝑖
2 = 𝜎2
Covariância: 𝑐𝑜𝑣 𝑢𝑖 , 𝑢𝑗 : 𝐸 𝑢𝑖 , 𝑢𝑗 = 0 ∀𝑖 ≠ 𝑗
𝑢𝑖 e 𝑢𝑗 se distribuem independentemente
𝑢𝑖~𝑁𝐼𝐷 0, 𝜎2
Distribuído de maneira normal e independente
Por que a premissa de normalidade?
1. Porque como 𝛽1 e 𝛽2 são funções lineares de 𝑢𝑖 se 𝑢𝑖
estiver normalmente distribuído 𝛽1 e 𝛽2 também
estarão.
• Esperamos que 𝑢𝑖 seja resultado da influência de variáveis
omitidas ou negligenciadas e que esse efeito seja pequeno e
aleatório.
• Pelo Teorema do Limite Central a soma de um grande
número de variáveis aleatórias, independentes e com
distribuição idêntica, tende à distribuição normal.
• Propriedade da distribuição Normal: qualquer função linear
de variáveis com distribuição normal também é normalmente
distribuída.
Por que a premissa de normalidade?
2. A distribuição normal é simples, envolve 2 parâmetros
3. Para amostras menores que 100 elementos a premissa
de normalidade é fundamental. Permite recorrer aos
testes t, F e χ2.
• Se o tamanho da amostra for suficientemente grande
podemos relaxar a premissa de normalidade;
• Para amostras pequenas cabe verificar se a premissa é
adequada.
Propriedades dos estimadores de MQO sob a
premissa de normalidade
1. São não tendenciosos.
2. São eficientes – têm variância mínima.
3. São consistentes – à medida que n aumenta
indefinidamente, os estimadores convergem para os
verdadeiros valores da população.
4. 𝛽1~𝑁(𝛽1, 𝜎 𝛽1
2 ) onde 𝜎 𝛽1
2 = 𝑋𝑖
2
𝑛 𝑥𝑖2 𝜎2
5. 𝛽2~𝑁(𝛽2, 𝜎 𝛽2
2 ) onde 𝜎 𝛽2
2 =𝜎2
𝑥𝑖2
6. (𝑛 − 2) 𝜎2
𝜎2 ~χ𝑛−22
Propriedades dos estimadores de MQO sob a
premissa de normalidade
7. A distribuição de ( 𝛽1 , 𝛽2) é independente de 𝜎2.
8. 𝛽1 e 𝛽2 têm a variância mínima dentro de toda a classe
de estimadores não tendenciosos, sejam lineares ou
não lineares – são BUE.