Aula 1 - Informações necessárias para a Avaliação Econômica Material Elaborado por Betânia Peixoto.
Aula 6 - Método não-experimental ou de seleção não-aleatória Material Elaborado por Betânia...
Transcript of Aula 6 - Método não-experimental ou de seleção não-aleatória Material Elaborado por Betânia...
Aula 6 - Método não-
experimental ou de seleção
não-aleatória
Material Elaborado por
Betânia Peixoto
Método não-experimental ou de seleção não-aleatória
Uma das metodologia para realizar a avaliação de impacto quando a seleção entre tratados e controle é não-aleatória.
Plano de Aula
Um pouco de econometria. Regressão Linear: intuição e procedimentos. Relação entre outras variáveis que afetam o indicador
de interesse e que são diferentes entre os grupos. Viés de variável omitida.
Discussão do problema existente para a avaliação quando a seleção entre tratados e não-tratados não foi aleatória.
Método não-experimental ou de seleção não-aleatória
Nos projetos sociais, em geral, a seleção dos participantes do programa não é feita de forma aleatória: ou porque dentro dos elegíveis, selecionamos, por
exemplo, os mais vulneráveis. Quando a seleção não é aleatória não temos mais um
grupo de controle automático. ou porque todas as pessoas elegíveis para participar
do programa efetivamente participam do programa,
Regressão
Idéia: esse instrumental permite verificar a relação entre as características que afetam o indicador de impacto, inclusive o programa, independente uma das outras.
A regressão linear permite ver a relação entre múltiplas variáveis com o indicador de impacto.
Objetivo
O objetivo da análise de regressão é encontrar uma função linear que permita: Descrever e compreender a relação entre uma
variável dependente e uma ou mais variáveis independentes.
Modelo de Regressão Linear Simples- Exemplo 1
Suponha que o objetivo é verificar a relação entre o número de efetivo policial alocado nos municípios e o número de homicídios nestes município, para realizar projeções de alocação policial.
A tabela seguinte registra uma amostra representativa extraída dos registros dos municípios, com número de efetivo policial e número de crime.
Analisar a possibilidade de definir um modelo que represente a relação entre as duas variáveis ou amostras.
EFETIVO 30 21 35 42 37 20 8 17 35 25CRIME 430 335 520 490 470 210 195 270 400 480
Solução Para analisar a relação entre as duas variáveis no
Exemplo 1, foi construído o gráfico de dispersão dos crimes em função do efetivo policial. Nesse gráfico pode-se ver que os municípios com mais policiais têm mais crimes.
0
100
200
300
400
500
600
0 5 10 15 20 25 30 35 40 45
Efetivo
Cri
me
O gráfico de dispersão mostra que os crimes e o efetivo estão correlacionados de forma positiva. A linha tracejada foi ajustada tentando equilibrar
os pontos acima da reta com os pontos abaixo dela.
Essa reta é uma das muitas possíveis retas que poderiam ser ajustadas.
0
100
200
300
400
500
600
0 5 10 15 20 25 30 35 40 45
Efetivo
Cri
me
Modelo do Ajuste de uma Reta
O ajuste de uma reta é um modelo de regressão linear que relaciona a variável dependente y e a variável independente x por meio da equação de uma reta do tipo:
É importante observar que, da mesma forma como a média resume uma variável aleatória, a reta de regressão resume a relação linear entre duas variáveis aleatórias e, conseqüentemente, da forma como a média varia entre amostras do mesmo tamanho extraídas da mesma população, as retas também variarão entre amostras da mesma população.
bxay
Observação
A linearedade contida na função da regressão linear é referente apenas aos parâmetros, não nas variáveis. Assim o método permite construir funções lineares nos parâmetros, mas que expressão relação não linear entre as variáveis y e x.
Exemplo: Relação quadrática entre y e x2cxbxay
O objetivo do Exemplo 1 é ajustar uma reta a partir dos valores das amostras retiradas da população, considerando que a alocação de efetivo é a variável independente x, e os crimes, a variável dependente y.
Uma primeira forma de fazer isso é ajustar manualmente essa reta tentando equilibrar os pontos acima e abaixo dessa reta, como foi feito no gráfico do Exemplo 1.
Como esse procedimento permite o ajuste de diversas retas, é necessário estabelecer um objetivo de eficiência de ajuste possível de medir, como é mostrado a seguir.
Voltando ao Exemplo 1
Uma primeira forma é ajustar uma reta horizontal de valor igual à média dos valores da variável dependente y, que é uma reta de regressão com b=0.
Esse critério não necessita de regressão.
Critério de ajuste 1:
Outra forma é ajustar uma reta que divida os pontos observados de forma que a soma dos desvios seja nula. Entretanto, como há muitas retas que cumprem
com essa condição, esse critério não poderá ser utilizado.
Critério de ajuste 2:
Outra forma é ajustar uma reta de forma que minimize a soma dos quadrados dos desvios, (lembre a definição de variância).
O objetivo da regressão é encontrar os coeficientes a e b da reta de regressão que minimizam a soma dos quadrados dos desvios dos valores da amostra y com relação aos correspondentes valores da reta de regressão.
Lembrando que:
bxay
Critério de ajuste da regressão
Interpretando:
O coeficiente “b” é a declividade da reta e define o aumento ou diminuição da variável y por unidade de variação da variável x.
A constante “a” é o valor de y quando x=0 bxay
Estimação bxayi ˆNo modelo estimado para o ajuste da reta se
verifica que: Para um único valor de xi pode haver um ou mais
valores de yi. Por exemplo, no gráfico de dispersão do exemplo 1 para x=35 há dois valores das variáveis dependentes y=400 e y=520.
Mas há apenas um único estimado para cada valor de xi.
Para cada valor de xi há uma diferença entre o valor observado yi e o valor estimado . Essa diferença é denominada desvio (di).
y
y
Y=117,07+9,73X
Variável Omitida
Será que não existe mais dada que afeta o crime além do efetivo policial?
Quando omitimos variáveis que deveriam estar presentes em uma equação de regressão o efeito omitido estará contido no termo do erro, fazendo com que a reta não seja bem ajustada.
Regressão Linear Múltipla
O modelo de regressão linear que foi apresentado é o mais simples deles e nem sempre atende à modelagem mais complexa, como a de avaliação de impacto.
Por exemplo, como vimos no Exemplo 1, o
número de crimes não dependem somente do efetivo, pois há uma parte da variação dos crimes que não é explicada pelo efetivo policial.
O desenvolvimento da equação de regressão linear múltipla é similar ao da equação de regressão linear simples incluindo a dependência de duas ou mais variáveis independentes. A ferramenta de análise Regressão realizam análises de regressão múltipla.
Dispondo de um grupo de amostras do mesmo tamanho, sendo uma variável dependente y e n variáveis independentes xi, o objetivo é determinar os coeficientes da equação da reta:
cujos coeficientes minimizam a soma dos quadrados dos desvios da variável com relação a y.
nnxbxbxbay 2211ˆ
Regressão Linear Multipla
Exemplo 2
Neste exemplo, queremos relacionar a quantidade de crime y com o número de efetivo x1 e o tamanho da população (x2 em milhares).
Para encontrar essa relação linear foi extraída a amostra de valores de municípios.
21 44,0046,7145,818ˆ xxy
Observações Importantíssimas
Os coeficientes estimados medem a relação da variável x com y livre do efeito das demais variáveis incluídas no modelo.
Como a distância de yi a , (ou desvio) não é zero para todas as observações, existe um erro de estimação quando falamos em regressão linear.
Y
Relembrando: Impacto = ATT = E[Yp, P=1] - E[Ysp, P=1] Não observamos Ysp quando P=1.
Se E[Ysp, P=1] ≠ E[Yc, P=0]Erro: ε= E[Ysp, P=1] - E[Yc, P=0] (1)
O ATT é dado por:ATT = E[Yp, P=1] - E[Yc, P=0] + ε (2)Substituindo (1) em (2)ATT = E[Yp, P=1] - E[Yc, P=0] + {E[Ysp, P=1] - E[Yc,
P=0] }
Problema da avaliação
Viés ou erro
O Erro ou Viés
O Erro é causado pelas características diferentes entre tratado e controle que levam à que o indicador de impacto seja diferente entre os grupos.
Como fazer então...
...quando temos um grupo de controle com características diferentes do grupo de tratamento, características essas que afetam o indicador de interesse?
Aplicamos a regressão para controlarmos o impacto do programa do efeito das variáveis que tornam os grupos tratado e controle diferentes.
Regressão Aplicada à Avaliação de ImpactoProcedimentos:1)Quais são as características que tornam os
grupos diferentes e que afetam o indicador de impacto individual?
Em um programa para melhorar o desempenho escolar das crianças poderia ser: educação dos pais, renda familiar, região onde moram, saneamento básico, se participam de outro programa social, ...
Procedimentos
n ‘Estimar a regressão em que o indicador de impacto é a variável dependente. As variáveis independentes são uma dummy para a participação do programa e as demais variáveis que tornam os grupos diferentes e que afetam o indicador de impacto.
Ou seja, queremos olhar o efeito da participação no programa (dummy de participação) livre do efeito das demais características que tornam os grupos diferentes e afetam esse indicador.
Modelo de Regressão LinearPara isso vamos escrever a seguinte equação:
Indicador de impacto = + *programa + *x2 + *x3 +*x4+...+
Programa = 1 se o indivíduo participa do programa.
Programa = 0 se o indivíduo não participa do programa.
Interpretação
identifica o indicador de impacto de quem recebe zero em todas as variáveis.
, , ,... indicam a relação/associação de cada variável com o indicador de impacto, livre do efeito das demais variáveis incluídas no modelo.
é o erro que existe por não conseguirmos determinar perfeitamente o indicador de impacto
Impacto
“” mede o impacto de participar do programa sobre o indicador de impacto, livre do efeito das outras variáveis incluídas.
Mas não esqueçam, temos que fazer o teste t de hipótese para ver se o resultado se mantém na população.
H0: = 0H1: ≠ 0
Ou seja:
A regressão linear nos dará uma medida de (e dos demais coeficientes), bem como o teste t e o p-valor dos coeficientes.
Vários programas estatísticos podem ser usados para ‘estimar’ essa equação...
Limitações do método em avaliação
Se tratado e controle forem muito diferentes teremos viés no impacto estimado decorrentes de:
Variáveis Omitidas (observáveis e não observáveis)
Ausência de suporte comum
Na prática
1) Obter observações de Y para participantes e para não participantes [Y é o indicador para o qual queremos avaliar se houve impacto].
2) Criar a variável programa (1 para quem participou e zero para quem não participou).
3) Obter observações das variáveis que afetam o indicador de interesse e que são diferentes entre os participantes e os não participantes.
4) Estimar a equação: Y = + *programa + *X1 + *X2 + ;
Y = indicador de resultado de interesse. programa = variável de interesse (igual a 1 caso
o indivíduo tenha participado do programa). X1, X2 = variáveis que são correlacionadas com
o Y e que são diferentes entre os grupos de tratamento e de controle.
Comentários Finais
Aula de hoje: aprendemos a realizar a avaliação de impacto quando a seleção de tratados e não-tratados não foi aleatória.
Na próxima aula: aprenderemos um método para aperfeiçoar a seleção dos controles de forma que a aplicação do método aprendido hoje será mais confiável.