USO DE MODELOS DE ESPAÇO DE ESTADOS … · nível e de valores atípicos. 15 Uso de Modelos de...
Transcript of USO DE MODELOS DE ESPAÇO DE ESTADOS … · nível e de valores atípicos. 15 Uso de Modelos de...
Marcelo Martins Cruz (IBGE )Marcelo Trindade Pitta (Fund. SEADE)
Denise Britz do Nascimento Silva (IBGE)
USO DE MODELOS DEESPAÇO DE ESTADOS
PARA A ESTIMAÇÃO DATAXA DE DESOCUPAÇÃO
NA PME/IBGE
State-Space M odels to Estim ate theUnem ploym ent Rate
2
Desafio: Atender a demanda crescente deinformações
!O compromisso de continuidade das sérieshistóricas versus a introdução de novosaperfeiçoamentos nas pesquisas amostrais
!(connection x methodological changes)
!Trabalho realizado para estimação empequenos domínios (work focussed on smallarea estimation)
3
O Problema (In the beginning…)• É interesse dos Institutos de Nacionais de
Estatística de diversos países produzirestatísticas oficiais precisas para pequenosdomínios (ou pequenas áreas).
• Pequenos Domínios: amostras pequenas para asquais não se consegue obter estimativas comboa precisão através dos procedimentostradicionais de amostragem (small areadefinition).
• Utilização de métodos de análise de sériestemporais para estimação em pequenas áreas(small area estimation).
4
O Problema• Desenvolver métodos de séries temporais para
estimação em pequenos domínios em pesquisasamostrais repetidas no tempo ( time series modelsto small area estimation)
• Necessidade de desenvolvimento do tema no país(D. Souza, F. Moura e H. Migon; R. Assunção)(Brazilian literature)
• Extensa bibliografia internacional (J.N.K Rao, D.Pfeffermann, P. Bell) (international bibliography)
• A Pesquisa Mensal de Emprego do IBGE (PME)fornece informações conjunturais sobre o mercadode trabalho em seis regiões metropolitanas do país.(Brazilian Labour Force Survey)
5
A PME (nova metodologia – a partir de 2002)Brazilian Labour Force Survey)
•Painel: um painel corresponde a um conjunto dedomicílios selecionados. A cada mês são investigados 8painéis de domicílios. 75% de sobreposição nasamostras de dois meses consecutivos (monthlyoverlapping survey).
•Esquema de rotação: um painel que entra na amostrano instante t permanece na amostra durante 4 meses(4 visitas), não é visitado durante 8 meses,retornando no 13º mês sendo pesquisado por mais 4meses. (rotation scheme – 8 panels – 4-8-4)
•Base de Dados: série da taxa de desocupação daRegião Metropolitana de São Paulo no períodofevereiro/2002 – fevereiro/2005.
6
Análise de Séries Temporais dePesquisas Amostrais
• Seja yt uma estimativa para o parâmetropopulacional θt obtida através da amostraobservada no tempo t
• yt - estimativa amostral no mês t
• θt - valor populacional (parâmetro desconhecidono mês t)
• et - erro amostral no mês t (sampling error)
ttt ey += θ
7
Análise de Séries Temporais dePesquisas Amostrais Periódicas
• Série observada sujeita a erros amostrais(time series are obtained from repeatedsample surveys)
• Erros amostrais correlacionados no tempo• Autocorrelação da série observada gerada
pelo desenho amostral• Correlated sampling errors due to the
survey rotation pattern
8
Análise de Séries Temporais dePesquisas Amostrais PeriódicasUsual Alternativa
y T S It t t t= + +
t tty eθ= +
tt t tT S Iθ = + +
Extração de Sinalna presença de ruído(signal extraction)
9
Modelo Estrutural Básico para asTaxas de Desocupação por Sexo
(masculino)
),0(~ 2LH
LHt N ση
),0(~ 2IH
Ht NI σ
H H Ht t tH H Ht t t
y I
L S
θ
θ
= +
= +
1 1
1
H H H LHt t t t
H H RHt t t
L L R
R R
η
η− −
−
= + +
= +11
1
H H SHt t j t
j
S S η−=
= − +∑
),0(~ 2RH
RHt N ση
),0(~ 2SH
SHt N ση
Basic structural m odel to estim ateunem ploym ent rate by sex (m ale)-
no sam pling error m odel
10
Modelo Multivariado Básico para as Taxasde Desocupação - Multivariate BSM
• No modelo multivariado : ascomponentes estocásticas das duasséries ; ; esão correlacionadas.
,LH LMt tη η
,LH LMt tη η
,LH LMt tη η,LH LMt tη η,RH RMt tη η,RH RMt tη η
,RH RMt tη η ,SH RM
t tη η
,IH IMt tη η,IH IMt tη η
,IH IMt tη η
't t t ty Z Iα= +
% %%%1t tt ttα α η−= +
% % %T G
[ ]' 1 0 1 0 0 0 0 0 0 0 0 0 0 I(2)Z = ⊗M%
[ ]M10t
H10t
M1t
H1t
Mt
Ht
Mt
Ht
Mt
Ht
't SSSSSSRRLL −−−−= Kα
11
Incorporação da Restrição (Benchmark)( Pfeffermann e Burck, 1990)
• Determinação dos pesos:Mt
Mt
Ht
Htt ywywy +=
Mt
Ht
M
MM
H
HH
MH
t
yy
PEAPD*
PEAPEA
PEAPD*
PEAPEA
PEAPDPD
PEAPDy
PEAPEA
PEAPEA MH
+=
+=
+==
W eights = labourforce participation
rates by sex
12
Incorporação da Restrição (Benchmark)( Pfeffermann e Burck, 1990)
Mt
Mt
Ht
Htt ywywy +=
( )
Ht
A Mt t
Pubt
yy y
y
=
%
( ) ' '
1 00 1A
H Mt t
Z Zw w
=
% %
( )
0
Ht
A Mt t
II I
=
%
( ) ( ) ' ( )A A At t t ty Z Iα= +
% %%%1t tt ttα α η−= +
% % %T G
The benchm ark
13
Filtro Modificado ( Pfeffermann e Burck, 1990)( ) ( ) ( ) 1 ( ) ( ) '
| | 1 | 1 | 1
( ) ( ) ( ) ( ) ( ) ( ) '
ˆ ˆ ˆ( ) ( )A A P A At t t t t t t t t t t t
P A P A P Pt t t t t t
Z F y Z
I K Z K K
α α α−− − −= + −
= − + ∑ −∑
% %% % %%
%(A) (A)
t t/t -1
P
P P
∑=∑
000)( tP
t
t∑ é a matriz de covariâncias do irregular.
( )( )
2
( )( )
HHPubt P
tA M H M H H M MMPubt t t t t t t t
H H M Mt t t t PubH PubM Pub
IE I I I w I w I
w I w I
σσ
σ σ σ
∑ ∑ = + =
+
14
Encadeamento da Série da PME(series connection)
• Inicialização difusa do filtro de Kalman ocasionaperda de informação (initialization of the kalmanfilter uses a lot of past information)
• Para solucionar este problema foi realizado oencadeamento das séries da PME nos períodos(1995-2002) e (2002-2005)
• Foi utilizado o procedimento REGARIMA do X12-ARIMA para correção do efeito de mudança denível e de valores atípicos.
15
Uso de Modelos de Espaço de Estados para aEstimação da Taxa de Desocupação na PME/IBGE
0,00
0,02
0,04
0,06
0,08
0,10
0,12
0,14
0,16
mar/02 jul/02 nov/02 mar/03 jul/03 nov/03 mar/04 jul/04 nov/04 mar/05 jul/05
Rio de Janeiro
São Paulo
Resultados serão para RJ e SP
16
0,00
0,02
0,04
0,06
0,08
0,10
0,12
0,14
0,16
jan/95 jan/96 jan/97 jan/98 jan/99 jan/00 jan/01 jan/02 jan/03 jan/04 jan/05
PME antiga com intervenção
PME antiga
PME nova
Região Metropolitana do Rio de Janeiro
17
Região Metropolitana de São Paulo
0,00
0,02
0,04
0,06
0,08
0,10
0,12
0,14
0,16
jan/95 jan/96 jan/97 jan/98 jan/99 jan/00 jan/01 jan/02 jan/03 jan/04 jan/05
PME antiga com intervenção
PME antiga
PME nova
18
Coeficientes de Variação (CV) das Estimativas dasTaxas de Desocupação por Sexo - São Paulo
4
5
6
7
dos Homens %
das Mulheres
Plano Am ostral
0
1
2
3
4
5
6
7
mar/02 mai/02 jul/02 set/02 nov/02 jan/03 mar/03 mai/03 jul/03 set/03 nov/03 jan/04 mar/04 mai/04 jul/04 set/04 nov/04 jan/05 mar/05
dos Homens
%
das Mulheres M odelo
CV for Sam pleEstim ates
CV for m odel based estim ates
19
Até aqui..(until now)
• Modelos de Espaço de Estados paraestimação em pequenos domínios semconsiderar erro amostral
• State Space model to small areaestimation without taking intoaccount the sampling error
20
• É possível, a partir das 8 taxas de desocupação porGRUPO DE ROTAÇÃO, estimar a FAC e FACP dosERROS AMOSTRAIS [Pfeffermann, Feder e Signorelli].(time series model for the sampling errors)
PME-IBGE: 4-8-4
Isso permite a explicitação de um modelo AR(p) para et.
ttmt eyy ˆˆ −=
ty é a estimativa amostral no mês t ; mty é a estimativa da taxa sob o modelo no mês t; e
te é a estimativa do erro amostral sob o modelo no mês t.
sendoM odelbasedestim ate
21
• Variação anual• Variação mensal• Tendência• Sazonalidade e a propriedade• “robustez em termos de agregação de variáveis”
tmt yversusy
Sam ple estim ateM odel basedestim ate
22
tttttttt eISLyouey +++=+=θ
1 1
1
Lt t t t
Rt t t
L L R
R R
η
η− −
−
= + +
= +
11
1
St t j t
j
S S η−=
= − +∑1
et t te eφ η−= +
),0(~),0(~),0(~),0(~),0(~ 22222I
Ite
etS
StR
RtL
Lt NNNNN σησησησηση
ttt IZy +=~
'
~α
ttt~
1~~ηαα GT += −
[ ])(
~
)'(
~
'
~
eMEB ZZZ M=
23
Características Relevantes Esperadas
Tendência e Sazonalidade
24
Taxa de Desocupação Total - RJTendência e Sazonalidade
-0,02
0,00
0,02
0,04
0,06
0,08
0,10
0,12
abr/03 ago/03 dez/03 abr/04 ago/04 dez/04 abr/05 ago/05
Tendência
Sazonalidade
____ origem 2002____ origem 2000
25
Resultados da Modelagem para RM do
Rio de Janeiro
26
0,00
0,02
0,04
0,06
0,08
0,10
0,12
0,14
0,16
fev/01jun/01out/01fev/02jun/02out/02fev/03jun/03out/03fev/04jun/04out/04fev/05jun/05
tmt yversusy
RJ
27
-0,04
-0,03
-0,02
-0,01
0
0,01
0,02
0,03
0,04
fev/02 jun/02 out/02 fev/03 jun/03 out/03 fev/04 jun/04 out/04 fev/05 jun/05
1tt yy −−
Variação anual
-0,04
-0,03
-0,02
-0,01
0
0,01
0,02
0,03
0,04
fev/01 jun/01 out/01 fev/02 jun/02 out/02 fev/03 jun/03 out/03 fev/04 jun/04 out/04 fev/05 jun/05 out/05
Variação mensal
RJ
m12t
mt yy −−
12tt yy −−
m1t
mt yy −−
28
0,00
0,02
0,04
0,06
0,08
0,10
0,12
0,14
0,16
fev/01 fev/02 fev/03 fev/04 fev/05
0,00
0,02
0,04
0,06
0,08
0,10
0,12
0,14
0,16
fev/01 fev/02 fev/03 fev/04 fev/05
Tendência da estimativa pelo MODELO
Tendência da estimativa AMOSTRAL
RJ
TRAMO-SEATS / X-12-ARIMA / STATE-SPACE
mty
ty
29
RJ
TRAMO-SEATS / X-12-ARIMA / STATE-SPACE
Sazonalidade da estimativa AMOSTRAL
-0,02
-0,01
0,01
0,02
fev/01 fev/02 fev/03 fev/04 fev/05
Sazonalidade da estimativa pelo MODELO mty
ty
-0,02
-0,01
0,01
0,02
fev/01 fev/02 fev/03 fev/04 fev/05
SAZONALIDADES
30
RJ
Via STAMP: Método direto x Método indireto
Sazonalidade da estimativa pelo MODELO
-0,011
-0,009
-0,007
-0,005
-0,003
-0,001
0,001
0,003
0,005
0,007
0,009
abr/03 jul/03 out/03 jan/04 abr/04 jul/04 out/04 jan/05 abr/05 jul/05
Sazonalidade da estimativa AMOSTRAL
-0,011
-0,009
-0,007
-0,005
-0,003
-0,001
0,001
0,003
0,005
0,007
0,009
abr/03 jul/03 out/03 jan/04 abr/04 jul/04 out/04 jan/05 abr/05 jul/05
robustez em termos de agregação
das variáveis
mty
ty
31
Resultados da Modelagem para RM de São Paulo
32
tmt yversusy
SP
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0,16
fev/01 jun/01 out/01 fev/02 jun/02 out/02 fev/03 jun/03 out/03 fev/04 jun/04 out/04 fev/05
33
Variação anual
Variação mensal
SP-0,04
-0,03
-0,02
-0,01
0
0,01
0,02
0,03
0,04
fev/02 jun/02 out/02 fev/03 jun/03 out/03 fev/04 jun/04 out/04 fev/05
-0,04
-0,03
-0,02
-0,01
0,00
0,01
0,02
0,03
0,04
fev/01jun/01out/01fev/02jun/02out/02fev/03jun/03out/03fev/04jun/04out/04fev/05
34
Tendência da estimativa pelo MODELO
Tendência da estimativa AMOSTRAL
SP
TRAMO-SEATS / X-12-ARIMA / STATE-SPACE
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0,16
fev/01 ago/01 fev/02 ago/02 fev/03 ago/03 fev/04 ago/04 fev/05
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0,16
fev/01 ago/01 fev/02 ago/02 fev/03 ago/03 fev/04 ago/04 fev/05
mty
ty
35
SP
TRAMO-SEATS / X-12-ARIMA / STATE-SPACE
Sazonalidade da estimativa AMOSTRAL
Sazonalidade da estimativa pelo MODELO
-0,02
-0,015
-0,01
-0,005
0
0,005
0,01
0,015
0,02
fev/01 ago/01 fev/02 ago/02 fev/03 ago/03 fev/04 ago/04 fev/05
-0,02
-0,015
-0,01
-0,005
0
0,005
0,01
0,015
0,02
fev/01 ago/01 fev/02 ago/02 fev/03 ago/03 fev/04 ago/04 fev/05
mty
ty
36
Considerações Finais• Utilização de modelos de espaço de
estados para estimar os componentesestruturais de séries temporais depesquisas amostrais.
• Diferenças entre os diversos métodos(X12/tramoSEATS/STATE-SPACE)referem-se ao erro amostral.
37
Bibliografia
PFEFFERMANN,D.;TILLER,R.State-space modeling with correlated measurementswith application to small area estimation underbenchmark constraints. SRI Methodology WorkingPaper m03/11, 2003. University of Southampton.
RAO,J.N.K. Small Area Estimation.2003
PFEFFERMANN,D.;BURCK,L. Robust small areaestimation combining time series and cross-sectionaldata. Survey Methodology,December1990.
PFEFFERMANN,D. Small area estimation-newdevelopments and directions. Survey Methodology,2002.
38