ECONOMETRIA
Prof. Patricia Maria Bortolon, D. Sc.
Introdução
Teoria Econômica
Matemática
Fenômenos Econômicos
Inferência Estatística
Teoria Econômica
Teoria Microeconômica
Preço
Demanda
Mas quanto????
Teoria Econômica
Economia Matemática
• Formula equações sem levar em conta se a teoria pode ser medida ou verificada
Estatística Econômica
• Coleta, processamento e apresentação dos dados
Estatística Matemática
• Ferramentas específicas para lidar com dados que não foram gerados por experimentos controlados
O método Econométrico
1. Exposição da teoria ou hipótese
– Keynes: o aumento da renda eleva o consumo, mas não em
proporção igual ao aumento dessa renda.
– Propensão marginal a consumir (PMC) > 0, mas < 1
2. Especificação do modelo matemático da teoria
– Um economista matemático poderia sugerir:
Y
X
Despesa de
consumo
Renda
β1
β2= PMC
consumo
Inclinação = PMC
renda
O método Econométrico
3. Especificação do modelo estatístico ou econométrico
– Se obtivéssemos dados de 500 famílias (consumo e renda) e
plotássemos os pontos no gráfico, todos cairiam em cima da
reta?
– Não. Por que?
– Porque provavelmente outros fatores afetam a decisão de
consumo (tamanho da família, cultura, religião etc...)
– A função definida pelo economista matemático é
determinística
– Para dar conta das relações inexatas o econometrista
escreve:
Modelo
Econométrico
Distúrbio
Termo de erro
Var. aleatória (estocástica)
Representa todos os fatores
que afetam o consumo
mas não são levados
em conta explicitamente
O método Econométrico
4. Obtenção dos dados
Y
X
u
O método Econométrico
5. Estimação dos parâmetros do modelo econométrico
– Vai dar conteúdo empírico à função consumo
– Análise de regressão
– Aumento de US$1 no período amostrado, provoca em
média, um aumento no consumo de US$0,70
– Por que dizemos “em média”? Porque a relação é inexata.
^ indica se tratar de uma estimativa
O método Econométrico
6. Testes de hipóteses
– Keynes: esperava que PMC fosse + e < 1
– Mas, 0,70 é estatisticamente menor que 1?
– 0,70 está suficientemente abaixo de 1, ou é um resultado devido ao
acaso?
7. Projeção ou previsão
– Uma redução de impostos => aumento da renda das famílias => quanto
aumentará o consumo?
8. Uso do modelo para fins de controle ou de política
– Se certo nível de consumo garante certo nível de desemprego a relação
calculada pode ser usada no sentido inverso para descobrir qual o nível
de renda necessário. Políticas podem ser estabelecidas para atingir esse
nível de geração de renda.
Capítulo 1
A natureza da análise de regressão
Fonte: GUJARATI; D. N. Econometria Básica: 4ª Edição.
Rio de Janeiro. Elsevier- Campus, 2006
Origem Histórica
• Altura de filhos de pais altos e de pais baixos tendem
para a altura média da população
• Lei da regressão universal de Galton
• Confirmada por Karl Pearson
• “regressão a mediocridade”
Interpretação moderna da regressão
• Descobrir como a altura média dos filhos varia, dada a
altura dos pais
• Estudo do comportamento de uma variável dependente
em relação a uma ou mais variáveis explanatórias, para
estimar ou prever o valor (médio) da população da
primeira em termos dos valores conhecidos ou fixados
(em amostras repetidas) das segundas.
Ver figura 1.1 e exemplos da página 14 a 16
Relações Estatísticas x Determinísticas
• Determinística (ou funcional)
– Lei da gravitação de Newton
• Estatísticas
– Rendimento das lavouras = f (temperatura, pluviosidade, luz solar,
fertilizantes)
– Um agrônomo consegue prever com exatidão o rendimento se ele
conhecer os valores das variáves à direita da equação?
– Não. Por que?
• Erros de medição
• Influência de outros fatores
– Há uma variabilidade “intrínseca” ou aleatória
Regressão x Causação
• Kendall e Stuart: as ideias de causação devem se
originar de alguma teoria
• Rendimento causa chuva ou chuva causa rendimento?
• O que o faz acreditar na segunda?
– Senso comum
– Não poder controlar a pluviosidade por meio de uma variação
no rendimento da lavoura
• Relação estatística não implica logicamente causação
• A causação irá depender de considerações a priori ou
teóricas
Regressão x Correlação
• Correlação
– Não há diferença entre variável dependente e explanatória
– As duas variáveis são aleatória
– Correlação entre notas de estatística e matemática
• Regressão
– Há uma assimetria no tratamento das variáveis
• Dependente: estatística, aleatória, estocástica, tem distribuição de
probabilidade
• Independente: tem valores fixos em amostras repetidas (ex: alturas)
Mede a força ou grau
de associação linear
entre duas variáveis
Tentamos prever o
valor médio de uma
variável com base nos valores
fixos de outras variáveis
Terminologia e Notação
• Ver quadro da pag. 18
• Análise de regressão simples:
• Análise de regressão múltipla:
Terminologia e Notação
• Variável aleatória: (ou estocástica) – aquela que pode
assumir qualquer valor, + ou - , dentro de um conjunto
de valores com uma dada probabilidade.
Y Variável dependente
Xk Variável explicativa (X1, X2, ... , Xk)
NNo. total de observações na população
T
nNo. total de observações na amostra
t
iSubscrito – dados de corte transversal, coletados em
um ponto no tempo
tSubscrito – dados de séries temporais, coletados ao
longo de um intervalo de tempo
Tipos de Dados
• Séries Temporais
– A variável assume valores em diferentes momentos do tempo
– Cotações intra-diárias de ações, receitas mensais, lucros
anuais
– Estacionária: quando a média e a variância não variam
sistematicamente ao longo do tempo
• Corte Transversal
– Variáveis coletadas em um mesmo momento no tempo
– Lucro líquido das empresas siderúrgicas em 2010
– Heterogeneidade pode ser um problema (ver tab. 1.1 e fig.
1.6)
Tipos de Dados
• Dados combinados
– Ver tab. 1.2 do exercício 1.1
– O IPC de cada país no período 73-97 é uma série temporal
– Os dados dos 7 países em cada ano é um corte transversal
• Dados em painel (longitudinais ou de micropainel)
– Uma mesma unidade em corte transversal é pesquisada ao
longo do tempo
Fontes de Dados
• Economática
• Thomson Reuters
• CVM
• BM&FBovespa
• IBGE
• Banco Central
• Sites de empresas
Exatidão dos Dados
• A maioria dos dados não são experimentais por
natureza, há possibilidade de erros de observação,
intencionais ou não
• Mesmo em dados experimentais: erros de medição
• Questionários: 40% de resposta – viés de seletividade
“Os resultados de sua pesquisa terão a mesma
qualidade dos dados coletados”
Escalas de Medição das Variáveis
• Escala nominal
– Sexo, estado civil
– Para associar observações a categorias específicas
• Escala ordinal
– Classe de renda, nível educacional
– É possível ordenar
• Escala de intervalo
– É possível ordenar e comparar
– Os intervalos são iguais
– Ex.: latitude e longitude
• Escala de razão
– A razão (X1/X2) e a distância (X1 – X2) são significativas
– É possível ordenar
– É possível comparar
– Tem um zero real
Stevens (1946)
Stevens (1946)
Capítulo 2 – Análise de Regressão com
Duas Variáveis
Algumas ideias básicas
Fonte: GUJARATI; D. N. Econometria Básica: 4ª Edição.
Rio de Janeiro. Elsevier- Campus, 2006
Tabela 2.1
• Grupos de renda => valores fixos de X
• Y varia para cada valor fixo de X
• O valor médio de Y aumenta com o aumento da renda
– Para a renda mensal de $80 => consumo médio de $65
– São 10 valores médios para as 10 classes de renda
Valores esperados condicionais
E(Y | X)
Tabela 2.1
• Valor esperado incondicional
– E(Y) = soma dos 60 dados de consumo dividido por 60
– Incondicional pois não leva em consideração os diferentes
níveis de renda
“Qual o valor esperado das despesas de consumo semanais médias
de uma família?”
“Qual o valor esperado das despesas de consumo semanais de uma
família cuja renda mensal é, digamos, de $140?”
$ 121,20
$ 101
LRP
• LRP = Linha de Regressão Populacional
Uma curva de regressão populacional é o lugar geométrico das
médias condicionais da variável dependente para os valores
fixados da variável explanatória.
Ver fig. 2.2
Conceito de Regressão Populacional
Cada média condicional E(Y | Xi) é uma função de Xi,
onde Xi é um dado valor de X.
E(Y | Xi) = f(Xi) :função de esperança condicional FEC
:função de regressão populacional FRP
Qual a forma assumida pela função f(Xi)?
Conceito de Regressão Populacional
Qual a forma assumida pela função f(Xi)?
interceptocoeficiente angular
Parâmetros desconhecidos, mas fixos
Função de regressão populacional
Modelo de regressão populacional
Regressão linear populacional
O significado do termo LINEAR
São lineares nos
parâmetros
O significado do termo LINEAR
O significado do termo LINEAR
• A linearidade relevante para a teoria da regressão é a
nos parâmetros
Linear nos
parâmetros?
Linear nas variáveis?
Sim Não
Sim MRL MRL
Não MRNL MRNL
Especificação estocástica da FRP
• O que podemos dizer sobre os gastos de consumo de
uma dada família e um dado nível de renda?
Yi = E(Y|Xi) + ui
ui = Yi – E(Y|Xi)
- Desvio de um Yi individual em torno de seu valor
esperado
- Distúrbio estocástico
- Termo de erro estocástico
(1)
Especificação estocástica da FRP
Yi = E(Y|Xi) + ui(1)
Gasto médio de consumo
de todas as famílias com
a mesma renda
= elemento sistemático ou
determinístico
Elemento aleatório ou não
sistemático = representa (é uma
proxy) de todas as variáveis
omitidas ou negligenciadas que
podem afetar Y mas não foram
incluídas nos modelos de
Regressão.
Especificação estocástica da FRP
Yi = E(Y|Xi) + ui
E(Yi|Xi) = E[E(Y|Xi)] + E(ui|Xi)
=> E(ui|Xi) = 0=
A pressuposição de que a linha de regressão passa pelas médias
condicionais de Y => que os valores médios condicionais de ui
(condicionais a um dado X) são iguais a zero.
O significado do termo de erro estocástico
• Caráter vago da teoria
– ui é um substituto para todas as variáveis excluídas ou
omitidas do modelo
• Falta de dados disponíveis
– Ex.: no caso do consumo, a riqueza das famílias
• Variáveis essenciais x variáveis periféricas (com pouca
influência)
• Caráter intrinsicamente aleatório do comportamento
humano
• Variáveis proxy pouco adequadas
– Ex.: endividamento, valor de mercado
O significado do termo de erro estocástico
• Princípio da parcimônia
– Navalha de Occam: o modelo de regressão deve ser o mais
simples possível
• Forma funcional equivocada
– Quando é possível inferir a forma funcional a partir de um
gráfico => só no modelo de regressão linear simples
Função de Regressão Amostral
Estimador de β2
Estimador de β1
Estimador de E(Y|Xi)
Estimador = estatística (amostral) = estimativa
Forma Estocástica da FRA
Estimador de ui
Capítulo 3 – Modelo de Regressão de
Duas Variáveis
O Problema da Estimação
Fonte: GUJARATI; D. N. Econometria Básica: 4ª Edição.
Rio de Janeiro. Elsevier- Campus, 2006
Método dos Mínimos Quadrados
Ordinários - MQO
• Recordemos a FRP de duas variáveis:
𝑌𝑖 = 𝛽1 + 𝛽2𝑋𝑖 + 𝑢𝑖
• Como esta não pode ser observada diretamente, temos
que estimá-la a partir da FRA:
𝑌𝑖 = 𝛽1 + 𝛽2𝑋𝑖 + 𝑢𝑖
= 𝑌𝑖 + 𝑢𝑖
• Podemos escrevê-la da seguinte forma:
𝑢𝑖 = 𝑌𝑖 − 𝑌𝑖
= 𝑌𝑖 − 𝛽1 + 𝛽2𝑋𝑖
• E agora?
Método dos Mínimos Quadrados
Ordinários - MQO
• 1ª. sugestão: escolher a FRA tal que 𝑢𝑖 = 𝑌𝑖 − 𝑌𝑖
– Problema: a soma algébrica pode resultar em valor muito
pequeno ou zero, mesmo que os pontos estejam muito
dispersos em torno da reta ajustada (ver fig. 3.1)
• 2ª. sugestão: usar 𝑢𝑖2 = 𝑌𝑖 − 𝑌𝑖
2
= 𝑌𝑖 − 𝛽1 + 𝛽2𝑋𝑖2
𝑢𝑖2 = 𝑓 𝛽1, 𝛽2
Método dos Mínimos Quadrados
Ordinários - MQO
𝑢𝑖2 = 𝑌𝑖 − 𝛽1 − 𝛽2𝑋𝑖
2
𝜕 𝑢𝑖2
𝜕 𝛽1
= −2 𝑌𝑖 − 𝛽1 − 𝛽2𝑋𝑖 = 0
𝜕 𝑢𝑖2
𝜕 𝛽2
= −2 𝑌𝑖 − 𝛽1 − 𝛽2𝑋𝑖 𝑋𝑖 = 0
(1)
(2)
(1) e (2) são as Equações Normais
Método dos Mínimos Quadrados
Ordinários - MQO
• Resolvendo o sistema de equações:
𝛽2 = 𝑋𝑖 − 𝑋 𝑌𝑖 − 𝑌
𝑋𝑖 − 𝑋 2=
𝑥𝑖𝑦𝑖
𝑥𝑖2
𝛽1 = 𝑌 − 𝛽2 𝑋
MQO – Propriedades Numéricas
Obs.: não dependem da forma como os dados são gerados
I. São calculados a partir de quantidades observáveis
(isto é, amostrais)
II. São estimadores pontuais
III. Obtidos os estimadores, a linha de regressão pode ser
facilmente obtida. A linha de regressão tem as
seguintes propriedades:
Propriedades da Linha de Regressão
1. Passa pelas médias amostrais 𝑋 e 𝑌 e pode ser escrita
como 𝑌 = 𝛽1 + 𝛽2 𝑋
2. O valor médio dos Y estimados é igual ao valor médio
dos Y observados 𝑌𝑖 = 𝛽1 + 𝛽2𝑋𝑖 𝑌𝑖 = 𝑌 − 𝛽2
𝑋1
+ 𝛽2𝑋𝑖
𝑌𝑖 = 𝑌 − 𝛽2 𝑋𝑖 − 𝛽2 𝑋 aplicando o somatório
e dividindo por n
𝑌𝑖
𝑛=
𝑌
𝑛− 𝛽2 𝑋𝑖 − 𝑋
𝑌 = 𝑌
Propriedades da Linha de Regressão
3. O valor médio dos resíduos é igual a zero
Da primeira equação normal:
−2 𝑌𝑖 − 𝛽1 − 𝛽2𝑋𝑖 = 0
−2 𝑢𝑖 = 0 𝑢 = 0
Por causa disso a FRA pode ser escrita na forma de
desvios em relação à média:
1º - aplicando somatório em 𝑌𝑖 = 𝛽1 + 𝛽2𝑋𝑖 + 𝑢𝑖 (1)
𝑌𝑖
𝑖
= 𝑛 𝛽1 + 𝛽2 𝑋𝑖 + 𝑢𝑖
0
Propriedades da Linha de Regressão
2º - dividindo por n
𝑌 = 𝛽1 + 𝛽2 𝑋 (2)
3º. – fazendo (1) em (2)
𝑌𝑖 − 𝑌 = 𝛽2 𝑋𝑖 − 𝑋 + 𝑢𝑖 ou
𝑦𝑖 = 𝛽2𝑥𝑖 + 𝑢𝑖 <= formato de desvio 𝛽1 não aparece
FRA: 𝑦𝑖 = 𝛽2𝑥𝑖 + 𝑢𝑖
Propriedades da Linha de Regressão
4º - 𝑢𝑖 não são correlacionados com 𝑌𝑖
A partir do formato de desvio:
𝑦𝑖 = 𝛽2𝑥𝑖 (x 𝑢𝑖) e somatório
𝑦𝑖 𝑢𝑖 = 𝛽2 𝑥𝑖 𝑦𝑖 − 𝛽2𝑥𝑖
𝑦𝑖 𝑢𝑖 = 𝛽2 𝑥𝑖𝑦𝑖 − 𝛽22 𝑥𝑖
2 mas 𝛽2 = 𝑥𝑖𝑦𝑖
𝑥𝑖2
𝑦𝑖 𝑢𝑖 = 𝛽22 𝑥𝑖
2 − 𝛽22 𝑥𝑖
2
𝑦𝑖 𝑢𝑖 = 0 𝑌𝑖 − 𝑌 𝑢𝑖 = 0 é a covariância de 𝑌𝑖 com
𝑢𝑖
Propriedades da Linha de Regressão
4º - 𝑢𝑖 não são correlacionados com 𝑋𝑖, isto é, 𝑢𝑖𝑋𝑖 = 0
Da 2ª. Equação normal:
−2 𝑌𝑖 − 𝛽1 − 𝛽2𝑋𝑖 𝑋𝑖 = 0
𝑢𝑖
Premissas subjacentes ao MQO
• Necessárias para que possamos fazer inferências
MLRC – Modelo de Regressão Linear Clássico
Premissa 1: o modelo de regressão é linear nos
parâmetros
Premissa 2: os valores de X são fixos em amostras
repetidas, ou seja, X é não estocástico. Nossa análise de
regressão é condicional aos valores de X.
Premissa 3: o valor médio do termo de erro ui é zero.
E(ui|Xi) = 0
Os fatores implícitos que afetam ui não afetam
sistematicamente o valor médio de Y.
Premissas subjacentes ao MQO
MLRC – Modelo de Regressão Linear Clássico
Se E(ui|Xi) = γ temos um problema de identificação:
E(Yi|Xi) = β1 + β2Xi + ui
E[E(Yi|Xi)] = E(β1|Xi)+ E(β2Xi|Xi)+ E(ui|Xi)
E(Yi|Xi) = β1 + β2Xi + γ
E(Yi|Xi) = (β1 + γ) + β2Xi
E(Yi|Xi) = β’1 + β2Xi
Ao estimar esse modelo obtemos infinitas soluções para
β1 e γ
Premissas subjacentes ao MQO
MLRC – Modelo de Regressão Linear Clássico
Premissa 4: homocedasticidade de ui
Var(ui|Xi) = E[ui – E(ui|Xi)]2
Var(ui|Xi) = σ2
Se for heterocedástico => 𝑉𝑎𝑟 𝑢𝑖 𝑋𝑖 = 𝜎𝑖2
As variâncias condicionais de Yi também são
homocedásticas.
Var(Yi|Xi) = σ2
Premissas subjacentes ao MQO
MLRC – Modelo de Regressão Linear Clássico
Premissa 5: não há autocorrelação entre os termos de
erro
𝑐𝑜𝑣 𝑢𝑖 , 𝑢𝑗 = 0 ∀ 𝑖 ≠ 𝑗
Premissa 6: covariância entre ui e Xi é igual a zero
𝑐𝑜𝑣 𝑢𝑖 , 𝑋𝑖 = 0 𝐸 𝑢𝑖𝑋𝑖 = 0
– Se X é não estocástico essa premissa é satisfeita automaticamente, uma vez
que nesse caso a covariâcia entre o erro e X é necessariamente zero.
– Importante para que se possa avaliar o efeito isolado de X sobre Y.
– Importante porque se X forem aleatórios ainda assim a teoria da regressão
será aplicável desde que os X não sejam correlacionados com os termos de
erro.
Premissas subjacentes ao MQO
MLRC – Modelo de Regressão Linear Clássico
Premissa 7: n deve ser maior que o número de
parâmetros a serem estimados
Premissa 8: variabilidade dos valores de X – “as
variáveis precisam variar”
𝛽2 = 𝑥𝑖𝑦𝑖
𝑥𝑖2
Premissa 9: o modelo de regressão está especificado na
forma correta (ver eq. 3.2.7 e 3.2.8 e fig. 3.7)
Premissa 10: (para modelos com mais de 2 variáveis) não
há relações lineares perfeitas entre as variáveis
explanatórias
Precisão ou erros-padrão das estimativas
MQO
𝑣𝑎𝑟 𝛽2 =𝜎2
𝑥𝑖2 𝑣𝑎𝑟 𝛽1 =
𝑋𝑖2
𝑛 𝑥𝑖2 𝜎2
Onde 𝜎2 é a variância homocedástica de ui
Obs.:
‒ Quanto maior a variação nos valores de Xi maior a
precisão da estimativa de 𝛽2
‒ Com o aumento de n também aumenta a precisão
Precisão ou erros-padrão das estimativas
MQO
Se 𝜎2 é desconhecido pode ser estimado por
𝜎2 = 𝑢𝑖
2
𝑛 − 2 𝑢𝑖
2= SQR = soma dos quadrados dos resíduos
𝜎 = 𝑢𝑖
2
𝑛 − 2
É o erro padrão da estimativa, é o desvio padrão dos
valores de Y em relação à linha de regressão. Uma
medida da “qualidade do ajustamento”.
Teorema de Gauss-Markov
• 𝛽2 é dito o melhor estimador linear não tendencioso de
β2 se:
1. É linear, por exemplo, em Y
2. É não tendencioso => E( 𝛽2) = β2
3. É eficiente, ou seja, entre todos os estimadores lineares é o
de menor variância (ver fig. 3.8)
Ver propriedades dos estimadores na pag. 723
Qualidade do ajustamento• r2 no caso de regressão com duas variáveis
• R2 no caso de regressão múltipla = coeficiente de determinação
Xi
Y
X
Yi
STQ = (Yi - Y)2
SQR = (Yi - Yi )2
SQReg = (Yi - Y)2
_
_
_
Y
Y
Y_Y
Qualidade do Ajustamento
𝑌𝑖 = 𝑌𝑖 + 𝑢𝑖
(𝑌𝑖 − 𝑌)2= ( 𝑌𝑖 − 𝑌)2+(𝑌𝑖 − 𝑌𝑖)2
𝑆𝑇𝑄 = 𝑆𝑄𝐸 + 𝑆𝑄𝑅 ÷ 𝑆𝑇𝑄
1 =𝑆𝑄𝐸
𝑆𝑇𝑄+
𝑆𝑄𝑅
𝑆𝑇𝑄
1 = 𝑟2 +𝑆𝑄𝑅
𝑆𝑇𝑄
𝑟2 =𝑆𝑄𝐸
𝑆𝑇𝑄=
( 𝑌𝑖 − 𝑌)2
(𝑌𝑖 − 𝑌)2
= (𝑌𝑖 − 𝑌𝑖)
2
(𝑌𝑖 − 𝑌)2=
𝑢𝑖2
(𝑌𝑖 − 𝑌)2
Qualidade do Ajustamento
𝑟2 = 1 −𝑆𝑄𝑅
𝑆𝑇𝑄
• Mede a proporção ou percentual da variação total de Y
explicada pelo modelo de regressão
• No modelo de regressão linear simples, o R2 é igual ao
quadrado do coeficiente de correlação entre X e Y
𝑟2 = 𝑟𝑥𝑦2
Coeficiente de determinação amostral
Qualidade do Ajustamento
• No modelo de regressão linear simples, o R2 é igual ao
quadrado do coeficiente de correlação entre X e Y
𝑟2 = 𝑟𝑥𝑦2
0 ≤ 𝑟2 ≤ 1
Ajuste perfeito 𝑌𝑖 = 𝑌𝑖
Sem relação linear
entre Y e X 𝑌𝑖 = 𝑌
Coeficiente de Correlação Amostral - r
1. Pode ser + ou –
2. −1 ≤ r ≤ 1
3. Simétrica 𝑟𝑥𝑦 = 𝑟𝑦𝑥
4. Independe da escala
𝑟𝑥𝑦 = 𝑟𝑥∗𝑦∗ onde 𝑋𝑖∗ = 𝑎𝑋𝑖 + 𝑐 e 𝑌𝑖
∗ = 𝑏𝑌𝑖 + 𝑑
5. Se X e Y são independentes rxy = 0
mas rxy = 0 não implica independência
5. Não implica relação de causa e efeito
6. Não tem sentido para descrever relações não lineares
Capítulo 4 – Modelo Normal de
Regressão Linear Clássico
MNRLC
Fonte: GUJARATI; D. N. Econometria Básica: 4ª Edição.
Rio de Janeiro. Elsevier- Campus, 2006
Até aqui...
• Com o auxílio do método MQO conseguimos estimar
β1, β2, σ2.
• Sob as premissas do MRLC vimos que os estimadores
desses parâmetros 𝛽1, 𝛽2 e 𝜎2 apresentam propriedades
estatísticas desejáveis tais como não tendenciosidade,
variância mínima etc...
• Falta agora fazer os testes de hipóteses necessários às
inferências sobre a FRP.
• Quão longe 𝛽1, 𝛽2 e 𝜎2 estão dos parâmetros
populacionais β1, β2, σ2?
• Para isso precisamos descobrir as distribuições de
probabilidade de 𝛽1, 𝛽2 e 𝜎2.
𝛽2 = 𝑥𝑖𝑦𝑖
𝑥𝑖2
Do numerador:
𝑥𝑖𝑦𝑖 = 𝑥𝑖 𝑌𝑖 − 𝑌 = 𝑥𝑖𝑌𝑖 − 𝑌 𝑥𝑖
= 𝑥𝑖𝑌𝑖 − 𝑌 𝑋𝑖 − 𝑋
= 𝑥𝑖𝑌𝑖
Daí: 𝛽2 = 𝑥𝑖𝑦𝑖
𝑥𝑖2 =
𝑥𝑖𝑌𝑖
𝑥𝑖2 = 𝑘. 𝑌𝑖
• Como pressupomos que X é não estocástico, nossa
análise de regressão é condicionada aos valores fixos de
Xi.
• 𝛽2 é uma função linear de Yi
𝑌𝑖 = 𝛽1 + 𝛽2𝑋𝑖 + 𝑢𝑖
𝛽2 = 𝑘 𝛽1 + 𝛽2𝑋𝑖 + 𝑢𝑖
• Mas Xi é não estocástico, então a variação de 𝛽2 vai
depender da variação de ui
• Como o MQO não faz qualquer pressuposição sobre a
natureza probabilística de ui, não nos ajuda a fazer
inferências a respeito da FRP a partir da FRA.
A premissa de normalidade de ui
• Normalidade de ui => MNRLC
𝑢𝑖~𝑁 0, 𝜎2
Média: E(ui) = 0
Variância: 𝐸 𝑢𝑖 − 𝐸(𝑢𝑖)2 = 𝐸 𝑢𝑖
2 = 𝜎2
Covariância: 𝑐𝑜𝑣 𝑢𝑖 , 𝑢𝑗 : 𝐸 𝑢𝑖 , 𝑢𝑗 = 0 ∀𝑖 ≠ 𝑗
𝑢𝑖 e 𝑢𝑗 se distribuem independentemente
𝑢𝑖~𝑁𝐼𝐷 0, 𝜎2
Distribuído de maneira normal e independente
Por que a premissa de normalidade?
1. Porque como 𝛽1 e 𝛽2 são funções lineares de 𝑢𝑖 se 𝑢𝑖
estiver normalmente distribuído 𝛽1 e 𝛽2 também
estarão.
• Esperamos que 𝑢𝑖 seja resultado da influência de variáveis
omitidas ou negligenciadas e que esse efeito seja pequeno e
aleatório.
• Pelo Teorema do Limite Central a soma de um grande
número de variáveis aleatórias, independentes e com
distribuição idêntica, tende à distribuição normal.
• Propriedade da distribuição Normal: qualquer função linear
de variáveis com distribuição normal também é normalmente
distribuída.
Por que a premissa de normalidade?
2. A distribuição normal é simples, envolve 2 parâmetros
3. Para amostras menores que 100 elementos a premissa
de normalidade é fundamental. Permite recorrer aos
testes t, F e χ2.
• Se o tamanho da amostra for suficientemente grande
podemos relaxar a premissa de normalidade;
• Para amostras pequenas cabe verificar se a premissa é
adequada.
Propriedades dos estimadores de MQO sob a
premissa de normalidade
1. São não tendenciosos.
2. São eficientes – têm variância mínima.
3. São consistentes – à medida que n aumenta
indefinidamente, os estimadores convergem para os
verdadeiros valores da população.
4. 𝛽1~𝑁(𝛽1, 𝜎 𝛽1
2 ) onde 𝜎 𝛽1
2 = 𝑋𝑖
2
𝑛 𝑥𝑖2 𝜎2
5. 𝛽2~𝑁(𝛽2, 𝜎 𝛽2
2 ) onde 𝜎 𝛽2
2 =𝜎2
𝑥𝑖2
6. (𝑛 − 2) 𝜎2
𝜎2 ~χ𝑛−22
Propriedades dos estimadores de MQO sob a
premissa de normalidade
7. A distribuição de ( 𝛽1 , 𝛽2) é independente de 𝜎2.
8. 𝛽1 e 𝛽2 têm a variância mínima dentro de toda a classe
de estimadores não tendenciosos, sejam lineares ou
não lineares – são BUE.
Top Related