Previsão de Vendas nos Mercados de Vestuário e de Alimentos
Transcript of Previsão de Vendas nos Mercados de Vestuário e de Alimentos
PREVISÃO DE VENDAS NOS MERCADOS DE VESTUÁRIO E
ALIMENTOS
Flavia Corrêa Pinho e Mariana de Castro Agra
Projeto de Graduação apresentado ao Curso de
Engenharia de Produção da Escola Politécnica,
Universidade Federal do Rio de Janeiro, como
parte dos requisitos necessários à obtenção do
título de Engenheiro.
Orientador: André Assis de Salles
Rio de Janeiro
Agosto de 2015
ii
PREVISÃO DE VENDAS NOS MERCADOS DE VESTUÁRIO E
ALIMENTOS
Flavia Corrêa Pinho e Mariana de Castro Agra
PROJETO DE GRADUAÇÃO SUBMETIDO AO CORPO DOCENTE DO CURSO DE
ENGENHARIA DE PRODUÇÃO DA ESCOLA POLITÉCNICA DA UNIVERSIDADE FEDERAL DO
RIO DE JANEIRO COMO PARTE DOS REQUISITOS NECESSÁRIOS PARA A OBTENÇÃO DO
GRAU DE ENGENHEIRO DE PRODUÇÃO.
Examinado por:
Prof. André Assis de Salles, D.Sc.
Prof. Vinícius Carvalho Cardoso, D.Sc.
Profa. Thereza Cristina Nogueira de Aquino, D.Sc.
RIO DE JANEIRO, RJ - BRASIL
AGOSTO DE 2015
iii
Corrêa Pinho, Flavia e de Castro Agra, Mariana
Previsão de Vendas nos Mercados de Vestuário e de Alimentos /
Flavia Corrêa Pinho e Mariana de Castro Agra. – Rio de Janeiro:
UFRJ/ Escola Politécnica, 2015.
xi, 72 p.: il.; 29,7 cm.
Orientador: André Assis de Salles
Projeto de Graduação – UFRJ/ POLI/ Engenharia de Produção,
2015.
Referências Bibliográficas: p. 55-56.
1. Setor de Alimentos. 2. Setor de Vestuário. 3. Modelos
Econométricos de Previsão. I. Salles, André Assis de. II.
Universidade Federal do Rio de Janeiro, Escola Politécnica,
Engenharia de Produção. III. Titulo.
iv
Resumo do Projeto de Graduação apresentado à Escola Politécnica/ UFRJ como
parte dos requisitos necessários para a obtenção do grau de Engenheiro de Produção.
Previsão de Vendas nos Mercados de Vestuário e Alimentos
Flavia Correa Pinho e Mariana de Castro Agra
Agosto 2015
Orientador: Prof. André Assis de Salles
Curso: Engenharia de Produção
O presente trabalho tem como objetivo realizar modelos de previsão de vendas
para séries de Vestuário e Alimentos. A partir de dados extraídos do site do IBGE,
análises estatísticas através de modelos econométricos, foi possível desenvolver um
modelo satisfatório para a previsão de vendas das séries em questão, de acordo com os
critérios comparativos.
Além da importância dos setores analisados, a escolha do trabalho é justificada
pelo interesse das autoras no tema, uma vez que a atual vida profissional das mesmas
faz parte dessas indústrias. Em paralelo, temos também o apreço das mesmas pelas
disciplinas de Estatística ministradas ao longo do curso.
v
Abstract of Undergraduate Project presented to POLI/UFRJ as a partial fulfillment
of the requirements for the degree of Engineer
Sales Forecast in Clothing and Food Markets
Flavia Correa Pinho and Mariana de Castro Agra
August 2015
Advisor: André Salles
Course: Industrial Engineering
This work aims to achieve sales forecasting models for Clothing and Food series.
From IBGE site data, statistical analysis through econometric models, it was possible to
develop a satisfactory model to forecast the sales of the analyzed series, according to
the comparative criteria.
Besides the importance of the sectors, this work's choice is justified by the
interest of the authors on the subject, since their current professional life take part on
these industries. In parallel, we also have their appreciation on statistic courses taught
throughout the Engineering Course.
vi
AGRADECIMENTOS
Dedico o presente trabalho à minha família e amigos, que me apoiaram durante
toda a vida acadêmica.
Agradeço à Deus por nunca me abandonar. Sou muito grata pela oportunidade
que estou tendo de estudar e me formar me uma das melhores faculdades do Brasil.
Dedico, também, ao Professor Orientador e a todos os outros Professores que
me ajudaram durante o caminho.
Flavia Correa Pinho
Gostaria de agradecer ao Professor André Salles pela sua dedicação e orientação,
não apenas durante a elaboração deste projeto de graduação, mas também ao longo
das disciplinas que ministrou.
À minha família que sempre me deu o apoio necessário, não só na elaboração
dessa monografia como também em todos os momentos da minha vida.
Aos meus amigos, que sempre contribuíram para tornar mais agradável qualquer
situação enfrentada, fosse boa ou ruim.
E, por fim, agradeço a todos que de alguma forma ajudaram e colaboraram para
que esse trabalho fosse possível.
Mariana de Castro Agra
vii
SUMÁRIO
1. INTRODUÇÃO ............................................................................................................. 1
2. COMPORTAMENTO DAS VENDAS NOS SETORES ...................................................... 4
2.1 Setor de Alimentos .................................................................................................. 4
2.2 Setor de Vestuário ................................................................................................... 5
3. DADOS UTILIZADOS ................................................................................................... 9
3.1 Caracterização dos Dados ....................................................................................... 9
3.2 Resumo Estatístico .................................................................................................. 9
3.2.1 Setor de Alimentos ............................................................................................. 9
3.2.2 Setor de Vestuário ............................................................................................ 10
3.2.3 Análise Comparativa das Estatísticas Básicas................................................... 11
3.3 Teste de Normalidade ........................................................................................... 12
3.3.1 Análise Gráfica .................................................................................................. 12
3.3.2 Teste Jarque-Bera ............................................................................................. 14
3.3.3 Consequência da violação do pressuposto de normalidade............................ 18
3.4 Teste de Estacionariedade .................................................................................... 19
3.4.1 Análise Gráfica .................................................................................................. 19
3.4.2 Teste de Raiz Unitária ....................................................................................... 20
3.4.3 Consequência da violação do pressuposto de estacionarieadade .................. 23
3.5 Teste de Homocedasticidade ................................................................................ 23
3.5.1 Teste de Pesaran .............................................................................................. 23
3.5.2 Consequência da violação do pressuposto de homocedasticidade ................ 24
3.6 Teste de Autocorrelação ....................................................................................... 24
3.6.1 Análise Gráfica .................................................................................................. 24
3.6.2 Teste de Durbin-Watson .................................................................................. 25
3.6.3 Consequência da violação do pressuposto de não autocorrelação ................ 27
viii
4. METODOLOGIA ........................................................................................................ 28
4.1 Modelos de Previsão ............................................................................................. 28
4.1.1 Modelo Autorregressivo com Variáveis Dummy.............................................. 28
4.1.2 Modelo de Amortecimento Exponencial Duplo com Efeito Sazonal Aditivo ... 29
4.1.3 Modelo ARIMA ................................................................................................. 30
4.1.4 Modelo SARIMA ............................................................................................... 32
4.2 Medidas de Ajuste dos Modelos de Previsão ....................................................... 34
5. RESULTADOS OBTIDOS ............................................................................................ 36
5.1 Modelos de Previsão e Análises de Resíduos ....................................................... 36
5.1.1 Modelo Autorregressivo com Variáveis Dummy.............................................. 36
5.1.2 Modelo Holt Winters Aditivo (EWMA) ............................................................. 41
5.1.3 Modelo ARIMA ................................................................................................. 45
5.1.4 Modelo SARIMA ............................................................................................... 47
5.2 Comparação dos Modelos .................................................................................... 50
5.2.1 Comparação dos Modelos de acordo com as Medidas de Ajuste ................... 50
5.2.2 Comparação dos Modelos de acordo com Atendimento aos Pressupostos ... 51
5.2.3 Previsão – Valores Reais – Melhores Modelos ................................................ 52
6. COMENTÁRIOS FINAIS ............................................................................................. 54
REFERÊNCIAS BIBLIOGRAFICAS....................................................................................... 56
Apêndice 1: Vendas de Alimentos e de Vestuário ......................................................... 58
Apêndice 2: Código do R para cálculo de Assimetria e Curtose ..................................... 59
Apêndice 3: Código do R para Teste de Estacionariedade ............................................. 59
Apêndice 4: Resultados do R para Teste de Estacionariedade ...................................... 59
Apêndice 5: Resultados do EViews - Teste de Estacionariedade - Parâmetros do R ..... 60
Apêndice 6: Resultados do EViews – Estacionariedade – Alimentos ............................. 62
Apêndice 7: Resultados do EViews – Estacionariedade – Vestuário .............................. 65
ix
Apêndice 8: Código R – Instalação e Utilização Função auto.arima() ............................ 68
Apêndice 9: Código R – Instalação e Utilização Função arima() – modelos SARIMA ..... 68
Apêndice 10: Modelo de Holt-Winters Aditivo – Alimentos .......................................... 69
Apêndice 11: Modelo de Holt-Winters Aditivo – Vestuário ........................................... 70
Apêndice 12: Previsão e Resíduos – ARIMA (1,0,2) – Alimentos ................................... 71
Apêndice 13: Previsão e Resíduos – ARIMA (0,0,0) – Vestuário .................................... 72
x
ÍNDICE DE FIGURAS
Figura 1 - Gráficos de Dispersão ......................................................................... 12
Figura 2 - Distribuição de Probabilidade Normal – Alimentos ........................... 13
Figura 3 - Distribuição de Probabilidade Normal – Vestuário ............................ 13
Figura 4 - Teste de Normalidade - Alimentos ..................................................... 15
Figura 5 - Teste de Normalidade - Vestuário ...................................................... 15
Figura 6 - Teste de Normalidade - Primeira diferença - Alimentos .................... 16
Figura 7 - Teste de Normalidade - Primeira diferença - Vestuário ..................... 16
Figura 8 - Teste de Normalidade - 1ª Transf. Logarítmica - Alimentos .............. 17
Figura 9 - Teste de Normalidade - 1ª Transf. Logarítmica - Vestuário .............. 17
Figura 10 - Teste de Normalidade - 2ª Transf. Logarítmica - Alimentos ............ 18
Figura 11 - Teste de Normalidade - 2ª Transf. Logarítmica - Vestuário ............. 18
Figura 12 - Série Transformada de Alimentos .................................................... 19
Figura 13 - Série Transformada de Vestuário ..................................................... 20
Figura 14 - Exemplos de Autocorrelação entre Resíduos ................................... 25
Figura 15 - Sequência para Utilização do ARIMA ............................................... 30
Figura 16 - Previsão Vendas de Alimentos - Modelo Autorregressivo ............... 38
Figura 17 - Previsão Vendas de Vestuário - Modelo Autorregressivo ................ 38
Figura 18 - Gráficos de Resíduos em (t) x (t-1) - Modelo Autorregressivo ......... 40
Figura 19 - Modelo Holt-Winters Aditivo – Alimentos ....................................... 42
Figura 20 - Modelo Holt-Winters Aditivo – Vestuário ........................................ 42
Figura 21 - Gráficos de Resíduos em (t) x (t-1) - Modelo Holt-Winters .............. 44
Figura 22 - Gráfico do modelo ARIMA (1,0,2) - Alimentos ................................. 45
Figura 23 - Gráfico do modelo ARIMA (0,0,0) - Vestuário .................................. 46
Figura 24 - Gráfico do modelo SARIMA (1,0,2)(0,1,0)[12] - Alimentos .............. 47
Figura 25 - Gráfico do modelo SARIMA (0,0,0)(0,1,0)[12] - Vestuário ............... 48
Figura 26 - Gráficos de Resíduos em (t) x (t-1) - Modelo SARIMA ...................... 50
xi
ÍNDICE DE TABELAS
Tabela 1 - Resumo Estatístico - Setor de Alimentos ........................................... 10
Tabela 2 - Resumo Estatístico - Setor de Vestuário ............................................ 10
Tabela 3 - Comparação de Amplitude ................................................................ 11
Tabela 4 - Resumo dos Resultados - Vendas Transformadas de Alimentos ....... 36
Tabela 5 - Resumo dos Resultados - Vendas Transformadas de Vestuário ....... 37
Tabela 6 - Resultados Teste de Pesaran - Modelo Autorregressivo - Alimentos 39
Tabela 7 - Resultados Teste de Pesaran - Modelo Autorregressivo - Vestuário 39
Tabela 8 - Teste de Durbin-Watson - Autorregressivo - Alimentos .................... 40
Tabela 9 - Resultados de Parâmetros e Erro - Holt-Winters Aditivo .................. 41
Tabela 10 - Resultados Teste de Pesaran - Modelo Holt-Winters - Alimentos .. 43
Tabela 11 - Resultados Teste de Pesaran - Modelo Holt-Winters - Vestuário ... 43
Tabela 12 - Resultados ARIMA (1,0,2) - Alimentos ............................................. 45
Tabela 13 - Resultados ARIMA (0,0,0) - Vestuário .............................................. 46
Tabela 14- Resultados SARIMA (1,0,2)(0,1,0)[12] - Alimentos ........................... 47
Tabela 15 - Resultados SARIMA (0,0,0)(0,1,0)[12] - Vestuário ........................... 48
Tabela 16 - Resultados Teste de Pesaran - Modelo SARIMA - Alimentos .......... 49
Tabela 17 - Resultados Teste de Pesaran - Modelo SARIMA - Vestuário ........... 49
Tabela 18 - Comparação entre Modelos - Medidas de Ajuste ........................... 51
Tabela 19 - Comparação entre Modelos - Atendimento aos Pressupostos ....... 52
Tabela 20 - Resultados da Previsão .................................................................... 52
Tabela 21 - Comparação Vendas em 2014 e 2015 ............................................. 53
Tabela 22 - Teste de Estacionariedade Alimentos - Parâmetros do R ............... 60
Tabela 23 - Teste de Estacionariedade Vestuário - Parâmetros do R ................ 61
Tabela 24 - Estacionariedade Série Alimentos - Teste 1 .................................... 62
Tabela 25 - Estacionariedade Série Alimentos - Teste 2 .................................... 63
Tabela 26 - Estacionariedade Série Alimentos - Teste 3 .................................... 64
Tabela 27 - Estacionariedade Série Vestuário - Teste 1 ..................................... 65
Tabela 28 - Estacionariedade Série Vestuário - Teste 2 ..................................... 66
Tabela 29 - Estacionariedade Série Vestuário - Teste 3 ..................................... 67
1
1. INTRODUÇÃO
Dois setores econômicos de grande relevância no cenário brasileiro são os
setores de alimentos e de vestuário. O setor de alimentos, por exemplo, representa 15%
do faturamento total do setor industrial brasileiro, além de empregar mais de 1 milhão
de trabalhadores. Por sua vez, o setor de vestuário também mostra relevante
participação, visto que o Brasil ocupa o 5º lugar no ranking mundial de produção de
têxteis e o 4º lugar no ranking de confeccionados.
Por sua vez, prever o comportamento que vendas de modo geral vão apresentar
é importante em qualquer setor e em qualquer estado econômico, tanto de recessão
quanto de crescimento. Entretanto, quanto maior a representatividade das vendas no
todo, maior o impacto que a qualidade de uma previsão trará para a economia como
um todo.
Portanto, dada a relevância dos setores de alimentos e de vestuário no cenário
nacional e a importância de realizar uma correta previsão do comportamento futuro
que as vendas destes setores irão apresentar, justifica-se a necessidade de elaborar
modelos que tenham a capacidade de realizar esta previsão.
Além do fato de os setores analisados serem de grande relevância para o Brasil,
a realização deste projeto de graduação envolvendo a aplicação de modelos
econométricos para a formulação de um modelo de previsão para séries históricas de
vendas do mercado de alimentos e de vestuário também pode ser explicada por outras
duas razões.
A primeira delas está relacionada com o interesse que as duas alunas tiveram
durante toda a faculdade por temas relacionados à estatística. Já a escolha do mercado
de alimentos e de vestuário é justificada por uma segunda razão, que é o fato de cada
uma das alunas estar estagiando em empresas desses ramos.
Desta forma, a realização deste trabalho vai contribuir não apenas para
aprimorar o conhecimento sobre modelos econométricos de previsão, mas também
2
melhorar o entendimento do comportamento dos setores de mercado em que ambas
estão empregadas.
Portanto, o objetivo principal deste trabalho é o estudo do comportamento das
vendas dos setores de alimentos e de vestuário através de modelos econométricos.
Através deste estudo, será possível formular um modelo de previsão de vendas para
estes dois setores e, com isso, melhorar o entendimento sobre como tais setores se
comportam.
Para que o presente trabalho seja explicado da melhor forma possível, sua
estrutura foi organizada de forma que a priori seja feita uma caracterização dos dois
setores a serem estudados, de forma a contextualizar o leitor sobre a peculiaridade dos
mesmos e o comportamento de suas vendas.
Em seguida, será feita uma análise das estatísticas básicas das séries de vendas
dos mesmos, de modo comparativo. Logo após o resumo básico estatístico, os quatro
principais pressupostos serão testados para ambas as séries: normalidade,
estacionariedade, homocedasticidade e autocorrelação. A violação dos pressupostos e
suas respectivas consequências também serão aqui explicitadas.
Uma vez testados os pressupostos e realizadas quaisquer transformações
necessárias para que os mesmos possam ser atendidos, a literatura dos modelos de
previsão será descrita. Para que possa ser escolhido o melhor modelo, critérios de
comparação serão estabelecidos.
Os melhores resultados encontrados para cada um dos modelos de previsão
serão descritos na última seção. Para cada uma das duas séries, o melhor modelo será
escolhido levando em conta os resultados e os critérios comparativos.
Em suma, o trabalho está dividido em 6 capítulos e uma seção adicional de
apêndices. Além do capítulo 1 que traz esta introdução, temos a caracterização dos
setores no capítulo 2. No capítulo 3 encontram-se as análises e testes realizados com os
dados empregados no trabalho. No capítulo 4 são apresentadas as metodologias que
serão empregadas para a construção dos modelos. No capítulo 5 estão os resultados
obtidos a partir dos modelos. A conclusão do trabalho no formato de comentários finais
3
encontra-se no capítulo 6 e as referências utilizadas para embasar todo o estudo em
seguida. Ao final, estão listados os apêndices que trazem informações adicionais sobre
o estudo.
4
2. COMPORTAMENTO DAS VENDAS NOS SETORES
2.1 Setor de Alimentos
A indústria de alimentos é um setor de grande representatividade no cenário
nacional. Segundo Gouveia (2006), este setor é responsável por aproximadamente 15%
do faturamento total do setor industrial brasileiro e, além disso, emprega um total de
trabalhadores superior a 1 milhão.
Em 2014, segundo dados da Associação Brasileira das Indústria de Alimentação
(ABIA), com um faturamento de R$525,8 bilhões, a indústria da alimentação (produtos
alimentares e bebidas) representou 10,2% do PIB e teve uma participação de 22,5% no
faturamento da indústria de transformação.
Também é interessante ressaltar que este é um setor crítico em qualquer
economia, não apenas na brasileira. Isto se deve ao fato de se tratar de um setor muito
abrangente e por fornecer um produto essencial à sobrevivência de qualquer
população. Neste ponto deve-se destacar uma grande diferença entre a indústria de
alimentos e a de vestuário, pois a primeira tem um caráter mais essencial enquanto a
segunda apresenta-se como fornecedora de bens mais supérfluos.
Com relação aos diferentes setores que compõe a indústria de alimentos,
aqueles que mais se destacam são a indústria de derivados de carne, que contribuiu com
22% do faturamento do total em 2014; de bebidas, que contribuiu com 19,2% do
faturamento da indústria de alimentos e de beneficiamento de cereais/café/chá, que
teve uma participação de 11% no faturamento do setor também em 2014.
O Brasil também é um grande exportador de alimentos. Segundo Gouveia (2006),
o país possui uma superávits comerciais sistemáticos nesse setor, pois a quantidade de
exportações é muito superior às importações. Os principais produtos destinados à
exportação são derivados de carne, açúcar, soja, suco de laranja e café. O principal
destino das exportações brasileiras de alimentos é a União Europeia.
Além das exportações, outro grande consumidor dos produtos da indústria de
alimentos é o setor de serviços de alimentação que absorve cerca de 25% do total
5
produzido pelas indústrias de alimentos. Este segmento apresenta uma taxa de
crescimento anual superior a 10% e compreende restaurantes, padarias, bares, fast
foods, lojas de conveniência etc. Quando as vendas do setor de serviços de alimentação
são comparadas com o restante das vendas no varejo, seu crescimento é
consideravelmente maior, tendo sido o dobro deste em 2005. (Gouveia, 2006)
Um fator que certamente contribui para este comportamento do setor de
serviços de alimentação foi o aumento de renda que ocorreu nos últimos anos. Dados
da Pesquisa de Orçamentos Familiares (POF) realizada pelo IBGE (2002-2003)
mostraram que o aumento da renda permitiu uma diversificação dos padrões de
consumo das classes de menor rendimento. Quando os resultados da POF realizada em
2008-2009 são comparados com os da realizada em 2002-2003, percebe-se que os
gastos com alimentação fora de casa subiram de 24% para 31%.
Além disso, um estudo sobre o consumo de alimentos fora do domicílio no Brasil
mostraram que um aumento de 10% na renda familiar contribui para um aumento de
3% no percentual de alimentos consumidos fora do domicílio. (Bezerra, et al., 2013)
As perspectivas para 2015 segundo o presidente da ABIA, Edmundo Klotz, são de
que o setor deve crescer cerca de 2,5% no volume de produção industrial. Espera-se um
total de R$ 40 bilhões em exportações do setor.
2.2 Setor de Vestuário
A indústria do vestuário representa um dos mais importantes setores da
indústria de transformação nacional. Ela é responsável por promover empregos, uma
vez que seus processos demandam intensiva mão-de-obra. Temos no Vestuário uma
indústria com oferta e demanda em constante ascensão no cenário nacional atual, o que
a torna muito promissora. Podemos dizer que o Brasil é um país com consumidores em
potencial. O poder de aquisição dos brasileiros vem aumentando, juntamente com a
cultura consumista, tornando-o um país propício para o sucesso da indústria do
vestuário.
Segundo Abell (1991) a indústria do vestuário é definida por seus consumidores.
Além de seus produtos serem classificados como de primeira prioridade, as
6
necessidades do consumidor muitas vezes vão além das características básicas. A roupa
deixa de ser apenas uma “cobertura” ou “proteção”, e passa a ser um objeto de
identidade. Através do vestuário os seres humanos afirmam e expõem suas diferentes
personalidades.
Neste setor, a demanda é influenciada pelo cenário econômico e pela
sazonalidade. Podemos dizer também que diferenças regionais implicam em culturas e
hábitos diversos, o que influencia nas necessidades de consumo da população local.
O segmento têxtil e o segmento de confecções compõem a indústria do
vestuário. A indústria têxtil é responsável pela fabricação de tecidos, que depois serão
transformados em produtos acabados pela indústria de confecções. Podemos dizer que
os maiores custos do segmento têxtil reside nos insumos usados para fabricação de
tecidos, bem como a energia elétrica gasta na produção, enquanto a maior parte dos
custos do segmento de confecções encontram-se na mão-de-obra.
O Sudeste é a maior região têxtil e de confecções do País, tendo como focos
principalmente o Polo de Americana (SP), Nova Friburgo (RJ) e Monte Sião (MG). Dados
do IEMI/ABIT de 2011 colocam o Brasil em 5º lugar no ranking mundial de produção de
têxteis e em 4º lugar no ranking de confeccionados. A maior parte da sua produção é
destinada ao mercado interno. O setor têxtil no Brasil é bastante heterogêneo, uma vez
que seus players possuem diferentes portes e processos produtivos.
A indústria da moda depende do setor têxtil e de confecções. Essa indústria é
caracterizada por estar em metamorfose constante, uma vez que reflete as mudanças
da vida econômica, cultural, social, política e estética. A sociedade e os indivíduos que
nela vivem usam a moda para se comunicar e explicitar seus gostos e estilos de vida. Um
grupo de pessoas com um estilo de vida similar estão inclinados a se expressar e se vestir
de forma parecida. Estilos de vida emergentes e inovadores são interpretados por
designers da indústria do vestuário e transformados em mercadorias e conceitos de
moda (Cholachatpinyo et al., 2002).
Segundo Christopher e Towill (2001), as variações da indústria da moda são
muito difíceis de prever, devido à volatilidade da demanda. De acordo com esses
7
autores, até mesmo durante um curto período de tempo essa demanda não se
comporta de forma linear e é raramente estável, seja a medição feita item a item ou
mesmo semana a semana, por exemplo.
Por outro lado, devido às complicações que essa indústria envolve, é necessário
que sejam feitas previsões de mercado e vendas. Ciarniéne e Vienanzidiene (2014)
afirmam que os longos períodos de tempo de fabricação de tecidos, combinados com as
longas distâncias entre as unidades de produção e os varejistas, faz com que tanto a
produção quanto as vendas e os custos-benefícios de fabricar os produtos da moda
exijam uma previsão, para que então seja possível afirmar o tamanho da escala de
produção e suas vantagens.
Em seu artigo Ciarniéne e Vienanzidiene (2014) também dizem que as tendências
da moda e sua natureza sazonal implicam em um ciclo de vida curto de estilos de
produto. Como a moda muda sempre, os produtos acompanham essa metamorfose,
juntamente com o mercado e seus consumidores. A carga de produção precisa muitas
vezes ser diminuída ou aumentada para alcançar um equilíbrio, visando atender os picos
sazonais.
Ciarniéne e Vienanzidiene (2014) explicam sucintamente quatro estágios de vida
da moda:
1) Produção de matérias – primas (principalmente tecidos)
2) Criação de produtos (peças de vestuário) por designers e fabricantes
3) Vendas de varejo
4) Formas diversas de marketing e propaganda que divulguem o produto com o
intuito de aumentar as vendas
Todos esses estágios objetivam satisfazer a demanda do consumidor e consistem
em setores separados e interdependentes, cujos participantes visam a obtenção de
lucros através de suas atividades. Essas atividades são exercidas e conduzidas pela
demanda do mercado, bem como pelas regras que regem o tamanho da produção.
No contexto atual da indústria da moda, com todas essas variáveis de demanda,
como se pode observar, a grande quantidade e diversidade de características de
8
produtos ofertados gera uma necessidade cada vez maior de realização de uma previsão
de vendas para que haja ganhos na cadeia de suprimentos.
De acordo com Siqueira (2008), os erros de previsão podem causar vendas
perdidas ou excesso de estoque, dentre outros problemas operacionais, que culminam
na insatisfação do comprador. A falta de produtos disponíveis em lojas, por exemplo, é
um fator crucial para que o desejo e satisfação do cliente não sejam atendidos.
9
3. DADOS UTILIZADOS
3.1 Caracterização dos Dados
Os dados que serão utilizados neste trabalho foram gerados pela Pesquisa
Mensal do Comércio – PMC, cujo objetivo é gerar indicadores que viabilizam o
acompanhamento do desempenho do comércio varejista do Brasil. Esta pesquisa é
realizada mensalmente pelo IBGE e investiga a receita bruta de revenda de empresas
formais com 20 ou mais empregados e que tenham o comércio varejista como principal
atividade.
As duas séries históricas que serão utilizadas são provenientes da Tabela 3418 -
Índices de volume e de receita nominal de vendas no comércio varejista (IBGE-PMC,
2015), por tipos de índice e atividades (2011 = 100). As categorias selecionadas para
estudo são:
Hipermercados, supermercados, produtos alimentícios, bebidas e fumo
Tecidos, vestuário e calçados
Ambas as séries abrangem o período de janeiro de 2009 a janeiro de 2015 e,
portanto, correspondem a um total de 73 observações. Estes dados podem ser vistos no
Apêndice 1.
Também é importante ressaltar que tais séries são dados relativos, que foram
calculados através da comparação entre os níveis de volume da Receita Bruta de
Revenda do mês com a média mensal obtida no ano de 2011. Portanto, são números
adimensionais.
3.2 Resumo Estatístico
3.2.1 Setor de Alimentos
Utilizando a série histórica de vendas do setor de alimentos e a ferramenta de
análise de dados (estatística descritiva) do Excel, foi possível obter todos os resultados
abaixo, com exceção da assimetria e curtose. Tais estatísticas foram calculadas
10
separadamente utilizando o software R. O código utilizado para o cálculo encontra-se
no Apêndice 2.
Tabela 1 - Resumo Estatístico - Setor de Alimentos
Fonte: Elaboração Própria
3.2.2 Setor de Vestuário
Utilizando a série histórica de vendas do setor de vestuário e a ferramenta de
análise de dados (estatística descritiva) do Excel, foi possível obter todos os resultados
abaixo, com exceção da assimetria e curtose. Tais estatísticas foram calculadas
separadamente utilizando o software R. O código utilizado para o cálculo encontra-se
no Apêndice 2.
Tabela 2 - Resumo Estatístico - Setor de Vestuário
Fonte: Elaboração Própria
11
3.2.3 Análise Comparativa das Estatísticas Básicas
Ao invés de analisar cada resultado separadamente, optou-se por realizar uma
comparação entre as estatísticas básicas de cada setor, pois desta forma ficariam mais
evidentes as diferenças existentes e possivelmente isso será importante para identificar
as particularidades de cada setor, que deverão ser levadas em conta nos modelos de
previsão.
Primeiramente, é possível verificar que a média de vendas do setor de alimentos
é maior que no setor de vestuário. Isso faz sentido intuitivamente, visto que alimentos
são produtos mais essenciais que vestuário.
Uma diferença bem marcante entre as duas séries fica evidente através das
medidas de dispersão dos dados. Se considerarmos o desvio padrão, por exemplo,
verifica-se que é maior para a série de vestuário tanto em valor absoluto quanto se
calculado como um percentual da média. Isto mostra que os dados variam menos em
relação à média no setor de alimentos.
Outro exemplo que reforça a maior dispersão dos dados de vestuário é a
amplitude, que pode ser calculada através da diferença entre os valores mínimos e
máximos de cada série, como mostra o quadro abaixo.
Tabela 3 - Comparação de Amplitude
Fonte: Elaboração Própria
Os gráficos de dispersão dos dados também deixam claro que existe uma maior
variabilidade na série de vestuário do que na série de alimentos:
12
Figura 1 - Gráficos de Dispersão
Fonte: Elaboração Própria
3.3 Teste de Normalidade
3.3.1 Análise Gráfica
Segundo Gujarati (2004), uma das formas de testar a normalidade de séries
temporais é o gráfico de distribuição de probabilidade normal que compara o valor
esperado para variáveis caso estas sejam normalmente distribuídas com os valores reais
apresentados pelas séries. Foram realizados tais gráficos para ambas as séries e os
resultados encontram-se nas figuras a seguir.
13
Figura 2 - Distribuição de Probabilidade Normal – Alimentos
Fonte: Elaboração Própria
Figura 3 - Distribuição de Probabilidade Normal – Vestuário
Fonte: Elaboração Própria
A análise do gráfico da série de alimentos parece indicar que a série é
normalmente distribuída, pois os valores esperados estão muito próximos dos valores
reais. Já no caso da série de vestuário, há alguns pontos que estão destoando
consideravelmente dos valores esperados.
A seguir serão realizados testes formais para verificar se as séries seguem ou não
distribuições normais, mas vale ressaltar que é possível que tais divergências estejam
relacionadas à sazonalidade que parece existir de acordo com os gráficos de dispersão
das séries (ver Figura 1 - Gráficos de Dispersão).
14
3.3.2 Teste Jarque-Bera
Outro teste utilizado para a verificar se uma série segue uma distribuição normal
é o teste de Jarque-Bera (JB). Este teste leva em consideração a assimetria e a curtose
da série (cujos valores já foram calculados e apresentados nas tabelas de resumo
estatístico, ver Tabela 1 - Resumo Estatístico - Setor de Alimentos e Tabela 2 - Resumo
Estatístico - Setor de Vestuário), são utilizados para calcular a seguinte estatística de
teste (ver Gujarati, 2004):
𝐽𝐵 = 𝑛 [𝑆²
6+
(𝐾 − 3)²
24 ]
Nesta fórmula temos os seguintes parâmetros:
n = tamanho da amostra
S = coeficiente de assimetria
K = coeficiente de curtose
De acordo com Gujarati (2004), a estatística JB segue uma distribuição qui-
quadrada com dois graus de liberdade quando o tamanho da amostra é suficientemente
grande. As hipóteses verificadas quando este teste é realizado são:
Hipótese nula: Resíduos são normalmente distribuídos
Hipótese alternativa: Resíduos não são normalmente distribuídos
Portanto, caso o valor p da estatística JB seja suficientemente baixo (o que
acontecerá caso o valor de JB seja suficientemente alto), não é possível aceitar a
hipótese de normalidade. Por outro lado, caso o valor da estatística JB seja
suficientemente próximo de zero, não se rejeita a hipótese de normalidade. (Hyndman
e Athanasopoulos, 2013)
O valor crítico para efeito de comparação da estatística calculada JB deve ser
consultado na tabela da distribuição qui-quadrado, com dois graus de liberdade e foi
escolhido o nível de significância de 5%. Portanto, o valor crítico é 0,102587.
15
Os valores da estatística JB foram calculados através da funcionalidade de
Estatísticas de Séries do software EViews. Os resultados para as séries encontram-se nas
tabelas abaixo:
Figura 4 - Teste de Normalidade - Alimentos
Fonte: Elaboração Própria
Figura 5 - Teste de Normalidade - Vestuário
Fonte: Elaboração Própria
Como pode ser visto, para ambos os casos a estatística JB está muito elevada e o
valor p (Probability), muito baixo. Como a normalidade é pressuposto de muitos
modelos de previsão, foram feitas algumas transformações da série com o intuito de
torná-la mais próxima de uma série normalmente distribuída.
Duas possibilidades que podem ser tentadas quando se deseja normalizar uma
série são a realização de diferenças e de razões entre os dados. A seguir serão mostradas
algumas transformações realizadas, bem como os resultados para a estatística JB.
16
Resultados para 𝑌𝑡 − 𝑌𝑡−1
Como pode ser visto, o valor da estatística JB diminuiu, mas ainda está muito
distante de zero.
Figura 6 - Teste de Normalidade - Primeira diferença - Alimentos
Fonte: Elaboração Própria
Figura 7 - Teste de Normalidade - Primeira diferença - Vestuário
Fonte: Elaboração Própria
Resultados para ln (𝒀𝒕
𝒀𝒕−𝟏 )
Neste caso, a melhoria foi mais significativa que no modelo anterior, por isso foi
feita uma variação desta transformação que será apresentada a seguir.
17
Figura 8 - Teste de Normalidade - 1ª Transf. Logarítmica - Alimentos
Fonte: Elaboração Própria
Figura 9 - Teste de Normalidade - 1ª Transf. Logarítmica - Vestuário
Fonte: Elaboração Própria
Resultados para ln (𝑌𝑡
𝑌𝑡−1 + 𝑌𝑡−2)
Os resultados para esta transformação das séries são significativamente
melhores do que os resultados anteriores, pois a estatística JB diminui
consideravelmente e, por sua vez, o valor p aumentou também aumentou.
O ideal seria termos séries para as quais o valor da estatística fosse inferior ao
valor crítico citado anteriormente. Entretanto, como o objetivo deste trabalho não é a
discussão da normalização de séries de dados, seguiremos com esta transformação e
serão feitas as ressalvas adequadas com relação às possíveis consequências da violação
do pressuposto de normalidade.
Portanto, deste ponto em diante, quando se falar em “séries transformadas”
estará sendo feita alusão às séries decorrentes da transformação ln (𝑌𝑡
𝑌𝑡−1 + 𝑌𝑡−2).
18
Figura 10 - Teste de Normalidade - 2ª Transf. Logarítmica - Alimentos
Fonte: Elaboração Própria
Figura 11 - Teste de Normalidade - 2ª Transf. Logarítmica - Vestuário
Fonte: Elaboração Própria
3.3.3 Consequência da violação do pressuposto de normalidade
De acordo com Hair et al. (2009), a severidade da não-normalidade se baseia em
duas dimensões: a forma de distribuição transgressora e o tamanho da amostra. A forma
de distribuição é medida pela assimetria e pela curtose, de modo que a partir de seus
valores podemos concluir se a série é normal ou não. Em relação ao tamanho da
amostra, temos que amostras maiores reduzem o efeito nocivo da não-normalidade.
Quando ocorre a violação do pressuposto de normalidade para os resíduos,
temos que a principal consequência nociva é que os intervalos de confiança dos
parâmetros podem não ser confiáveis, uma vez que a suposição de normalidade é usada
19
para construí-los. Algumas medidas podem ser tomadas no caso da não-normalidade,
tais como: descartar os valores discrepantes, aumentar o tamanho da amostra, ou
realizar uma transformação logarítmica das variáveis (Seward e Doane, 2014).
Neste caso, vale ressaltar que foram realizadas mudanças logarítmicas, que
tornaram as séries mais próximas de uma distribuição normal, mas sem que seja possível
aceitar a hipótese de normalidade com elevado grau de confiabilidade.
3.4 Teste de Estacionariedade
O pressuposto de estacionariedade das séries temporais é necessário para vários
dos modelos que serão testados para a previsão ao longo deste trabalho. Por isso, a
estacionariedade das séries transformadas de vendas de alimentos e de vestuário será
verificada através dos testes apropriados.
3.4.1 Análise Gráfica
Segundo Gujarati (2004), antes de realizar testes formais para verificar
características de séries temporais, é sempre aconselhável plotar os dados em gráficos
e fazer uma análise qualitativa inicial. Por isso, foram elaborados os gráficos a seguir.
Figura 12 - Série Transformada de Alimentos
Fonte: Elaboração Própria
20
Figura 13 - Série Transformada de Vestuário
Fonte: Elaboração Própria
A análise dos gráficos parece indicar que o valor da expressão ln (𝑌𝑡
𝑌𝑡−1 + 𝑌𝑡−2)
seria independente do tempo t tanto para vendas quanto para alimentos, o que levaria
à não rejeição da hipótese de estacionariedade das séries.
Com o intuito de fazer uma verificação formal, foi realizado o teste de raiz
unitária, que será apresentado no próximo tópico.
3.4.2 Teste de Raiz Unitária
A base do teste de raiz unitária é o processo de raiz unitária descrito pela
equação abaixo (ver Gujarati, 2004):
𝑌𝑡 = 𝜌𝑌𝑡−1 + 𝑢𝑡 , −1 ≤ 𝜌 ≤ 1
Para que tenhamos uma raiz unitária e, portanto, uma série não-estacionária, é
preciso que 𝜌 = 1. Entretanto, por razões teóricas, o teste realizado não é apenas uma
regressão tendo 𝑌𝑡 como variável dependente de 𝑌𝑡−1. A equação acima é então
reescrita da seguinte forma:
∆𝑌𝑡 = 𝛿𝑌𝑡−1 + 𝑢𝑡
Nesta equação, se δ = 0, temos que ρ = 1 e que, portanto, a série possui uma raiz
unitária e é não-estacionária. Neste caso, parece que deveria ser feita uma regressão da
primeira diferença de 𝑌𝑡 (∆𝑌𝑡) em relação a 𝑌𝑡−1 e então testar a hipótese de δ = 0. Mas
21
vale ressaltar que o valor estimado t do coeficiente estimado δ não segue uma
distribuição t, mas sim a estatística τ (tau), cujos valores críticos foram mapeados por
Dickey e Fuller (1979).
Além destas questões já levantadas, também deve ser considerado o fato de que
existem equações diferentes para o caso de a série possuir as seguintes características:
Passeio aleatório: ∆𝑌𝑡 = 𝛿𝑌𝑡−1 + 𝑢𝑡
Passeio aleatório com intercepto: ∆𝑌𝑡 = 𝛽1 + 𝛿𝑌𝑡−1 + 𝑢𝑡
Passeio aleatório com intercepto e tendência: ∆𝑌𝑡 = 𝛽1 + 𝛽2𝑡 + 𝛿𝑌𝑡−1 + 𝑢𝑡
Tais equações são baseadas na premissa de que os termos que representam os
resíduos 𝑢𝑡 são não correlacionados. Para os casos em que os termos 𝑢𝑡 são
correlacionados, Dickey e Fuller propuseram um modelo de teste “aumentado”, que é
denominado teste de Dickey-Fuller Aumentado (conhecido pela sigla ADF do inglês
Augmented Dickey-Fuller Test). Neste teste, as equações listadas acima são acrescidas
do seguinte termo:
∑ 𝛼𝑖
𝑚
𝑖=1
∆𝑌𝑡−1 + 휀𝑡
Neste caso, o termo 휀𝑡 é o ruído branco. O número de defasagens m deve ser
determinado empiricamente e este termo é responsável por garantir que o termo de
erro seja não correlacionado.
O teste realizado para testar a estacionariedade das séries de vendas de
alimentos e de vestuário é o Teste de Dickey-Fuller Aumentado. Para tanto foram
empregados dois softwares diferentes, o R e o EViews.
3.4.2.1 Teste Dickey-Fuller Aumentado – Software R
Primeiramente, foi realizado o teste de estacionariedade utilizando o pacote
“tseries” do software R (o código completo para a instalação e realização do teste
encontra-se no Apêndice 3). Neste pacote, está disponível a função “adf.test” que
realiza o teste de Dickey-Fuller Aumentado, que testa as seguintes hipóteses:
𝐻0: Tem raiz unitária, de modo que não é estacionário
22
𝐻1: Não tem raiz unitária, de modo que é estacionário
Como pode ser visto nos resultados detalhados no Apêndice 4, o teste retornou
a hipótese alternativa para ambas as séries. De acordo com tais resultados, com 95% de
confiabilidade, não se aceitaria a hipótese nula de existência de raiz unitária e, portanto,
ambas as séries seriam consideradas estacionárias. Neste caso, o pressuposto de
estacionariedade estaria atendido.
Entretanto, como o R não traz os resultados para os valores p dos coeficientes e,
portanto, não é possível determinar se são estatisticamente significativos, optamos por
realizar testes de estacionariedade também no software EViews.
3.4.2.2 Teste Dickey-Fuller Aumentado – Software EViews
Inicialmente, foram replicados os testes do R através da inserção dos mesmos
parâmetros (defasagem, ou lag order, igual a 4; intercepto e tendência linear, de acordo
com a documentação do R para a função “adf.test()”).
Como pode ser visto nos resultados do Apêndice 5, apesar de não aceitarmos a
hipótese nula com elevado grau de confiabilidade (superior a 95% nos dois casos), a
análise dos coeficientes da tendência para as duas séries mostra que estes não
apresentam significância estatística em nível aceitável. Portanto, não deveríamos
aceitar o resultado calculado pelo R.
Por isso, seguimos com os testes no EViews para investigar de forma mais
adequada a estacionariedade das séries. Para facilitar a análise, serão descritos
separadamente os procedimentos realizados para a série de alimentos e para a série de
vestuário.
No caso da série de alimentos, foi realizado um teste com até 11 defasagens,
intercepto e tendência linear. Como pode ser visto no Teste 1 de Alimentos do Apêndice
6, o resultado indica estacionariedade. Entretanto, a significância estatística de alguns
parâmetros não é aceitável (ver coeficientes das defasagens de índice 7 a 10).
Deste modo, foi testado um novo modelo, agora com até 9 defasagens, cujos
resultados encontram-se Teste 2 de Alimentos do Apêndice 6. Novamente, o modelo
23
indica estacionariedade, mas o valor p do coeficiente de tendência está muito elevado.
Por isso, foi realizado um terceiro teste, também com até 9 defasagens e intercepto,
mas agora sem incluir tendência.
A partir deste último (ver Teste 3 de Alimentos do Apêndice 6), obtivemos bons
resultados, verificando que não se rejeita a hipótese nula de existência de raiz unitária.
Portanto, com elevado grau de confiabilidade e com parâmetros estatisticamente
significativos, é possível não aceitar a hipótese nula de existência de não
estacionariedade (isto é, existência de raiz unitária). Isto implica em aceitar que a série
transformada para as vendas de alimentos é estacionária.
Para a série transformada de vestuário, a mesma linha de raciocínio foi seguida.
Primeiramente um teste com até 11 defasagens, com intercepto e tendência (ver Teste
1, Apêndice 7). Depois um teste com até 9 defasagens (ver Teste 2, Apêndice 7), e, por
fim, um modelo com até 9 e sem tendência (ver Teste 3, Apêndice 7).
No caso dessa série, este o terceiro teste também apresentou um resultado
favorável. Portanto, é possível aceitar que a série transformada para as vendas de
vestuário também atende ao pressuposto de estacionariedade.
3.4.3 Consequência da violação do pressuposto de estacionarieadade
A maioria dos procedimentos de análise estatística de séries temporais supõe
que estas sejam estacionárias. Quando elas não apresentam esta característica, às vezes
é preciso transformá-las para obter a estacionariedade. Temos como diferenciação mais
usada o método de diferenças sucessivas da série original (Morettin, 2006).
A violação do pressuposto de estacionariedade dos regressores ou da variável
dependente pode ocasionar vários problemas de estimação, seja em relação a intervalos
de confiança ou mesmo previsões errôneas.
3.5 Teste de Homocedasticidade
3.5.1 Teste de Pesaran
O Teste de Pesaran é utilizado para verificar se a variância dos resíduos é
constante, ou seja, se pode ser considerada a presença de homocedasticidade. A
presença ou não de heterocedasticidade é detectada com base nos resultados da
24
regressão em que a variável dependente é o valor do quadrado dos resíduos, enquanto
a variável independente é o valor estimado da variável dependente original. Esse teste
permite identificar se os resíduos estão ou não aumentando à medida que a variável
independente cresce.
O teste de Pesaran será calculado junto aos modelos de previsão no presente
trabalho, pois depende dos resíduos e dos valores previstos gerados por cada modelo.
A fórmula utilizada no teste é (ver Salles, 2005):
𝑒2 = 𝛽1 + 𝛽2�̂�
Caso a regressão acima exista, não se rejeita a heterocedasticidade.
3.5.2 Consequência da violação do pressuposto de homocedasticidade
Caso haja a violação do pressuposto de homocedasticidade, ou seja, caso não se
rejeite a heterocedasticidade, a presença do problema tende a não viesar as estimativas
dos parâmetros. Nesse caso, as variâncias estimadas não serão corretas, de modo que
as inferências sobre os parâmetros estarão mal especificadas.
Temos que as técnicas inferenciais são componentes importantes da análise de
dados. Tendo a presença de heterocedasticidade, as análises baseadas em testes de
hipóteses se tornam inválidas. Na prática, é difícil conhecermos a verdadeira forma
como a heterocedasticidade se apresenta (Wooldridge, 2013).
Em caso de rejeição da hipótese nula de homocedasticidade, será necessário
utilizar algum método de estimação que leve em conta a violação da suposição de
homocedasticidade.
3.6 Teste de Autocorrelação
3.6.1 Análise Gráfica
Assim como nos testes de normalidade e de estacionariedade é feita uma forte
recomendação por Gujarati (2004) para a realização de análises gráficas, o mesmo
ocorre para os testes de autocorrelação. Neste caso, os gráficos a serem analisados são
dos resíduos gerados por cada um dos modelos no período t versus os resíduos no
período (t-1).
25
A ideia é que caso este gráfico apresente padrões bem definidos, isto seria um
forte indício de autocorrelação entre os resíduos. Nos exemplos abaixo, por exemplo,
os resíduos da Figura 14(a) apresentam autocorrelação positiva, enquanto na Figura
14(b), apresentam autocorrelação negativa.
Figura 14 - Exemplos de Autocorrelação entre Resíduos
Extraído de (Gujarati, 2004)
Portanto, para fazer esta análise qualitativa de existência ou não de
autocorrelação entre os resíduos, serão feitos gráficos análogos aos exemplos
apresentados acima para cada um dos modelos gerados.
3.6.2 Teste de Durbin-Watson
Um dos teste mais utilizados para a verificação de autocorrelação nos resíduos
é o teste de Durbin-Watson. A estatística de teste pode ser calculada conforme abaixo
(ver Gujarati, 2004):
𝐷 = ∑ (�̂�𝑡 − �̂�𝑡−1)²𝑡=𝑛
𝑡=2
∑ �̂�𝑡²𝑡=𝑛𝑡=1
O argumento �̂�𝑡 da equação representa o resíduo medido no tempo “t”,
enquanto �̂�𝑡−1 representa o resíduo do período imediatamente anterior a �̂�𝑡. Podemos
26
perceber que no numerador temos (n-1) observações, pois uma observação se perde à
medida que estamos tratando de diferenças sucessivas.
A aplicação do teste de Durbin-Watson requer que certos pressupostos sejam
seguidos, tais como:
i) O modelo de regressão precisa incluir o termo intercepto
ii) As variáveis explicativas não são estocásticas
iii) Assume-se que o termo �̂�𝑡 é normalmente distribuído
iv) O modelo não permite que esteja faltando alguma observação
O critério de decisão desse modelo está baseado nos valores tabelados por
Durbin-Watson para os limites superiores (𝐷𝑢) e inferiores (𝐷𝑖) da estatística D. Os
valores estão tabelados (ver Gujarati, 2004). As hipóteses do teste são:
Hipótese nula: Ausência de autocorrelação
Hipótese alternativa: Presença de autocorrelação
Os critérios de decisão são (ver Salles, 2005):
Se D < 2:
i. Se D < 𝐷𝑖, hipótese nula é rejeitada
ii. Se D < 𝐷𝑖 < 𝐷𝑢, o teste é inconclusivo
iii. Se D > 𝐷𝑢, a hipótese nula não é rejeitada
Se D > 2:
i. Se D < 4 - 𝐷𝑢, a hipótese nula não é rejeitada
ii. Se 4 - 𝐷𝑢< D < 4 - 𝐷𝑖, o teste é inconclusivo
iii. Se D > 4 - 𝐷𝑖, a hipótese nula é rejeitada
Calcularemos mais à frente o teste de Durbin-Watson junto aos modelos de
previsão para as séries de Alimentos e Vestuário. Entretanto, vale ressaltar que este
teste só poderá ser aplicado ao modelo autorregressivo e, por isso, a autocorrelação dos
demais será avaliada apenas pela análise gráfica.
27
3.6.3 Consequência da violação do pressuposto de não autocorrelação
No caso da violação do pressuposto de não autocorrelação, ou seja, no caso da
presença de autocorrelação, temos possibilidade de viés nas estimativas se o problema
for decorrente da ausência de variáveis relevantes no modelo.
Além disso, o problema também pode ser decorrente de uma má especificação
da forma funcional ou de uma má especificação dinâmica do modelo.
28
4. METODOLOGIA
4.1 Modelos de Previsão
4.1.1 Modelo Autorregressivo com Variáveis Dummy
Um modelo autorregressivo é aquele em que variável dependente é explicada
por uma combinação linear de valores passados da mesma variável (Hyndman e
Athanasopoulos, 2013). Um exemplo de modelo autorregressivo denominado modelo
AR(p) é representado pela equação abaixo:
𝑦𝑡 = 𝑐 + ∅1𝑦𝑡−1 + ∅1𝑦𝑡−1 + ⋯ + ∅𝑝𝑦𝑝−1 + 𝑒𝑡
Ainda segundo Hyndman e Athanasopoulos (2013), modelos autorregressivos
normalmente são restritos a séries estacionárias. Como foi visto no tópico 3.4, é possível
aceitar a hipótese de estacionariedade com elevado grau de confiabilidade e, portanto,
o pressuposto é atendido para a utilização de modelos autorregressivos. Para as séries
transformadas em questão, foi utilizado um modelo AR(1).
Além disso, os gráficos das variáveis de vendas tanto de alimentos quanto de
vestuário indicam a possibilidade de existência de sazonalidade, visto que há um
comportamento que se repete anualmente de acréscimo e decréscimo de vendas em
determinados meses. Apesar de estarem sendo consideradas as séries transformadas
de alimentos e de vendas, é possível verificar nos gráficos das Figura 12 e Figura 13 que
o comportamento sazonal parece ter se mantido, mesmo após a transformação.
Por este motivo, além da componente autorregressiva já citada, foi realizada
uma regressão múltipla com a utilização de variáveis dummy. As variáveis dummy são
variáveis artificiais que assumem os valores 0 ou 1 e são utilizadas para explicar aspectos
qualitativos relacionados à variável dependente do modelo. (Gujarati, 2004)
Foram utilizadas onze variáveis dummy, que correspondem aos meses 1, 2, 3 e
assim por diante até 11. Neste ponto vale ressaltar que apesar de serem doze meses,
foram utilizadas onze variáveis dummy pelo fato de que quando todas assumirem o valor
zero, será identificado o efeito do décimo segundo mês. De acordo com Hyndman e
29
Athanasopoulos (2013), este ponto de atenção é conhecido como a “armadilha da
dummy”, uma vez que caso sejam incluídas tantas dummies quanto os efeitos que se
deseja explicar, o modelo irá falhar. A regra geral, segundo eles, é usar sempre uma
variável dummy a menos do que o número de efeitos qualitativos que se deseja explicar
no modelo.
4.1.2 Modelo de Amortecimento Exponencial Duplo com Efeito Sazonal Aditivo
Este método de estimativa desenvolvido por Holt (1957) e Winters (1960) é
indicado para séries temporais que apresentam sazonalidade e tendência. Além da
equação de previsão, o método é composto por três outras equações de amortecimento
para os seguintes fatores (Salles, 2005):
Nível da série no período t, 𝐸𝑡= α (𝑌𝑡 − 𝑆𝑡−𝑝) + (1 − α)(𝐸𝑡−1 + 𝑇𝑡−1)
Tendência para a série no período t, 𝑇𝑡= β (𝐸𝑡 − 𝐸𝑡−1) + (1 − β) 𝑇𝑡−1
Fator sazonal para o período t, 𝑆𝑡= λ (𝑌𝑡 − 𝐸𝑡) + (1 − λ) 𝑆𝑡−𝑝
A previsão da variável dependente é dada pela equação:
𝑌𝑡+�̂� = 𝐸𝑡 + 𝑛𝑇𝑡 + 𝑆𝑡+𝑛−𝑝
Como é possível notar, o modelo é composto por três parâmetros de
amortecimento, sendo eles α, β e λ. O cálculo destes parâmetros é realizado com a
utilização do Solver, do Excel. Com esta ferramenta, é construída uma função objetivo
que visa à minimização do erro dos valores previstos (MAPE – Erro Médio Percentual
Absoluto) e, com isso, melhora os resultados. São adicionadas restrições para que tais
parâmetros variem de 0 a 1. O método do Solver que faz essa otimização é o GRG Não
Linear, não tendo sido possível utilizar o LP Simplex devido ao fato de o problema não
atender às condições de linearidade exigidas.
A letra p é utilizada para denotar o período de sazonalidade, que pode ser
entendido como o número de temporadas existentes em um ano. Em ambas as séries
temporais exploradas neste trabalho, a letra m assumirá o valor 12.
Para o cálculo dos primeiros doze fatores sazonais, a seguinte expressão foi
utilizada (ver Salles, 2005):
30
𝑆𝑡 = 𝑌𝑡 − ∑𝑌𝑖
𝑝
𝑝𝑖=1 , t = 1, 2, 3, ..., p
4.1.3 Modelo ARIMA
O Modelo ARIMA (autoregressive integrated moving average models) foi lançado
por Box & Jenkins (1970). A ênfase deste método não está na construção de equações
simples ou de modelos de equações simultâneas, mas na análise da propriedades
probabilísticas ou estocásticas de séries temporais.
O Modelo ARIMA é conhecido por sua precisão em previsões e por sua
flexibilidade ao tratar vários tipos de séries temporais. Este modelo impõe a linearidade
como restrição na função de geração de dados (Khandelwal et al., 2015).
De acordo com Gujarati (2004), diferentemente dos modelos de regressão
tradicionais, nos quais 𝑌𝑡 é explicado por 𝑋1, 𝑋2, ..., 𝑋𝑘, o modelo ARIMA permite que 𝑌𝑡
seja explicado por seus próprios valores passados ou defasados, além de termos de erros
estocásticos. Para determinar o modelo do tipo ARIMA que melhor representa a série
temporal a ser utilizada para fazer as previsões, podemos nos basear na sequência
abaixo:
Figura 15 - Sequência para Utilização do ARIMA
Fonte: Elaboração Própria
Para a aplicarmos o modelo ARIMA de Box e Jenkins, é preciso que a série
temporal em estudo seja estacionária, ou de outro modo, não apresente tendência. Para
um bom ajuste do modelo, faz-se necessária a utilização de técnicas em que a estrutura
residual forme um white noise (ruído branco). O resíduo é uma variável aleatória
independente e identicamente distribuída. É sabido que quando não apresenta ruído
branco, um modelo apresenta dependência nos valores passados e tende a ser auto
correlacionado.
Podemos representar o ARIMA a partir da equação abaixo (ver Felipe, 2012):
31
Os componentes desta equação são:
𝛼0: Constante no modelo
𝛼1: Parâmetro que ajusta os valores passados de 𝑌𝑡 (assim como 𝛼𝑝 e assim
por diante)
ε : Esses valores correspondem aos componentes erráticos, que são porções
não-controláveis do modelo, chamados de ruído branco
β: os parâmetros beta permitem escrever a série a partir dos choques
passados, ou seja, a partir dos erros
Também é possível escrever a equação da seguinte forma (ver Felipe (2012)):
Além disso, vale ressaltar que a notação do modelo é ARIMA (p, q, d), onde (ver
Hyndman e Athanasopoulos, 2013):
p : Ordem da porção autorregressiva do modelo
d : Grau de primeira diferenciação envolvida
q: Ordem da porção de média móvel do modelo
Considera-se que cada erro tem distribuição normal, média zero, variância
constante e não são correlacionados. Dizemos que a sequência de componentes
erráticos apresenta um processo ruído branco se para cada período de tempo (t)
tivermos:
i)
ii)
iii)
Ou seja, respectivamente:
i) Média zero
ii) Variância constante
iii) Covariância nula para todo valor de s
32
Iremos utilizar o modelo de previsão ARIMA mais adiante, uma vez que ele parte
do princípio que os modelos econométricos podem ser desenvolvidos a partir de
informações tiradas de suas próprias séries de dados.
O cálculo do modelo ARIMA será feito através da função auto.arima(), do pacote
“forecast” disponível no software R. O código para sua instalação e utilização pode ser
visto no Apêndice 8.
Segundo Hyndman e Athanasopoulos (2013), a função auto.arima() utiliza uma
variação do algoritmo de Hyndman e Khandakar, que combina testes de raízes unitárias,
minimização de 𝐴𝐼𝐶𝑐 e também utiliza o Método de Máxima Verossimilhança.
O 𝐴𝐼𝐶𝑐 é a medida conhecida como Corrected Akaike Information Criterion, que
é utilizada para verificar o ajuste de modelos. Quanto menor for essa medida, melhor
ajustado estará o modelo. A correção é feita para remover biases que podem ser
gerados quando o tamanho da amostra é muito pequeno. Por sua vez, o Método de
Máxima Verossimilhança que é um procedimento para otimizar a escolha dos
parâmetros de modelos. (Hyndman e Athanasopoulos, 2013)
Quando utilizada, a função auto.arima() retorna o modelo ARIMA que melhor se
ajusta aos dados.
4.1.4 Modelo SARIMA
Box e Jenkings (1976) generalizaram o modelo ARIMA para lidar com séries que
apresentam auto correlação sazonal. Deste modo, criaram o SARIMA, que seria o ARIMA
sazonal multiplicativo. O modelo SARIMA deve ser utilizado quando a sazonalidade se
faz presente na série temporal.
Sabemos que os modelos ARIMA tratam da auto correlação dos valores da série
em instantes sucessivos. Quando os dados são observados em períodos inferiores ao
intervalo de um ano, a série também pode apresentar auto correlação para uma estação
de sazonalidades. Conhecemos como SARIMA os modelos que contemplam as séries
que apresentam auto correlação sazonal (Samohyl et al., 2013).
O modelo SARIMA (integrado autorregressivo e médias móveis com
sazonalidade) pode ser denotado por SARIMA (p,q,d) x (P,Q,D)s, onde d é o grau de
33
diferenciação e D o grau de diferenciação sazonal, quando temos em 𝑋𝑡 um processo
sazonal auto regressivo integrado de média móvel da ordem (p,q,d)x (P,Q,D)s. A partir
da equação e explicação abaixo, será possível entender melhor os parâmetros do
modelo. Segundo Becker (2010), seja 𝑋𝑡 um processo estocástico que satisfaz a equação:
𝛷(𝐵𝑠)∅(𝐵)(1 − 𝐵)𝑑(1 − 𝐵𝑠)𝐷(𝑋𝑡 − 𝜇) = 𝛩(𝐵𝑠)𝜃(𝐵)휀𝑡
Onde:
𝜇: Média do processo
휀𝑡: Processo de ruído branco
s: Sazonalidade
B: Operador de defasagem (ou seja, 𝐵𝑗(𝑋𝑡) = 𝑋𝑡−𝑗 e 𝐵𝑠𝑗(𝑋𝑡) = 𝑋𝑡−𝑠𝑗)
(1 − 𝐵)𝑑: Operador diferença
(1 − 𝐵𝑠)𝐷: Operador diferença sazonal
∅ ( ): Polinômio de ordem p
𝜃 ( ): Polinômio de ordem q
𝛷 ( ): Polinômio de ordem P
𝛩 ( ): Polinômio de ordem Q
Os polinômios de ordem p, q, P e Q são definidos por suas respectivas equações
abaixo:
p: ∅(𝑧) = ∑ (−∅𝑙)𝑧𝑙𝑝𝑙=0
q: 𝜃(𝑧) = ∑ (−𝜃𝑚)𝑧𝑚𝑞𝑚=0
P: 𝛷(𝑧) = ∑ (−𝛷𝑟)𝑧𝑟𝑃𝑟=0
Q: 𝛩(𝑧) = ∑ (−𝛩𝑚)𝑧𝑚𝑄𝑚=0
Onde:
34
∅0 = Φ0 = −1 = 𝜃0 = Θ0
∅𝑙 , 1 ≤ 𝑙 ≤ 𝑝, 𝜃𝑚, 1 ≤ 𝑚 ≤ 𝑞, 𝛷𝑟 , 1 ≤ 𝑟 ≤ 𝑃, 1 ≤ 𝑙 ≤ 𝑄 : são constantes reais
A parte (p,q,d) do modelo trata da parte não sazonal, enquanto (P,Q,D) trata da
parte sazonal.
Com relação ao cálculo do modelo SARIMA, este será realizado através do
software R. Entretanto, não há uma função que calcule automaticamente quais são os
melhores modelos ARIMA com sazonalidade, isto é, os melhores modelos ARIMA.
Portanto, os modelos serão calculados através da função arima(), que também
está disponível no pacote “forecast” do software R. Mas será preciso testar diferentes
modelos, variando as componentes sazonais P, Q e D até encontrar o modelo com
melhor ajuste. As componentes (P, Q, D) devem ser inseridas no parâmetro “seasonal”
da função arima(). O código necessário para instalação e utilização desta função pode
ser visto no Apêndice 9.
4.2 Medidas de Ajuste dos Modelos de Previsão
Uma fase muito importante do processo de previsão é a escolha do melhor
modelo e isto só pode ser feito se tivermos critérios de comparação entre os diversos
modelos gerados. Além disso, faz sentido que tais critérios sejam determinados de
acordo com o grau de ajuste do modelo à realidade que se está tentando prever.
Portanto, a seguir serão apresentadas as medidas de ajuste que serão calculadas
para os modelos gerados e, posteriormente, serão utilizadas para escolher o modelo
mais adequado.
Erro Médio Absoluto (Mean Absolute Error – MAE), que é calculado segundo a
fórmula (ver Hyndman e Athanasopoulos, 2013):
𝑀𝐴𝐸 =∑ |𝑌𝑖 − 𝑌�̂�|
𝑛𝑖=1
𝑛
Erro Quadrado Médio (Mean Square Error – MSE), que é calculado segundo a
fórmula (ver Hyndman e Athanasopoulos, 2013):
35
𝑀𝑆𝐸 =∑ (𝑌𝑖 − 𝑌�̂�)²𝑛
𝑖=1
𝑛
Erro Padrão (Root Mean Square Error – RMSE), que é calculado segundo a
fórmula (ver Hyndman e Athanasopoulos, 2013):
𝑅𝑀𝑆𝐸 = √∑ (𝑌𝑖 − 𝑌�̂�)²𝑛
𝑖=1
𝑛
Soma dos Quadrados dos Erros de Previsão (Prediction Errors Sum of Squares –
PRESS), que é calculado segundo a fórmula (ver Shedden, 2014):
𝑃𝑅𝐸𝑆𝑆 = ∑(𝑌𝑖 − 𝑌𝑖−1̂)²
𝑛
𝑖=1
Erro Médio Percentual (Mean Percentage Error – MPE), que é calculado pela
fórmula (ver Salles, 2005):
𝑀𝑃𝐸 =1
𝑛 ∑ (
𝑌𝑖 − 𝑌�̂�
𝑌𝑖)
𝑛
𝑖=1
Erro Absoluto Médio Percentual (Mean Absolute Percentage Error – MAPE), que
é calculado pela fórmula (ver Hyndman e Athanasopoulos, 2013):
𝑀𝐴𝑃𝐸 =1
𝑛 ∑ |
𝑌𝑖 − 𝑌�̂�
𝑌𝑖|
𝑛
𝑖=1
36
5. RESULTADOS OBTIDOS
Tendo discutido a metodologia envolvida com a aplicação dos diferentes
modelos e também após a realização dos devidos testes com as séries a serem previstas,
serão apresentados os melhores resultados obtidos para cada um dos modelos.
5.1 Modelos de Previsão e Análises de Resíduos
5.1.1 Modelo Autorregressivo com Variáveis Dummy
5.1.1.1 Modelo de Previsão
A regressão foi realizada através da ferramenta de análise de dados do Excel e
os seguintes resultados foram obtidos:
Tabela 4 - Resumo dos Resultados - Vendas Transformadas de Alimentos
Fonte: Elaboração Própria
37
Tabela 5 - Resumo dos Resultados - Vendas Transformadas de Vestuário
Fonte: Elaboração Própria
Como pode ser visto nos quadros de resumo de resultados, os modelos estão
bem ajustados devido aos seguintes motivos:
Foi comprovada a existência de regressão, tanto pelo R ajustado (que está
próximo de 1) quanto pela estatística F (que é suficientemente alta)
Foi verificado que os estimadores são estatisticamente significativos, pois o valor
p de cada um deles é suficientemente baixo. Aqui cabe uma única ressalva com
relação ao valor p do coeficiente de ∆𝑌(𝑡−1) para a série transformada de
vestuário, pois este resultado não está tão bom quanto os demais. Entretanto
como os demais resultados ficaram satisfatórios e ao nível de significância de
83% é possível aceitar a significância estatística deste coeficiente, o modelo não
será descartado.
Os gráficos de comparação entre os valores reais e a previsão também sugerem
o bom ajuste do modelo, como pode ser visto a seguir:
38
Figura 16 - Previsão Vendas de Alimentos - Modelo Autorregressivo
Fonte: Elaboração Própria
Figura 17 - Previsão Vendas de Vestuário - Modelo Autorregressivo
Fonte: Elaboração Própria
5.1.1.2 Teste de Homocedasticidade
Tendo gerado o modelo, é importante verificar a presença de
homocedasticidade entre os resíduos gerados. Para tanto, foi realizado o Teste de
Pesaran, que gerou os seguintes resultados:
39
Tabela 6 - Resultados Teste de Pesaran - Modelo Autorregressivo - Alimentos
Fonte: Elaboração Própria
Tabela 7 - Resultados Teste de Pesaran - Modelo Autorregressivo - Vestuário
Fonte: Elaboração Própria
Os resultados mostram que tanto para a série transformada de alimentos quanto
para a série transformada de vestuário, o valor F calculado foi inferior ao F tabelado.
Portanto, não existe regressão. Como não existe regressão, pode-se aceitar a não
violação ao pressuposto de homocedasticidade para os modelos autorregressivos com
variáveis dummy.
5.1.1.3 Teste de Autocorrelação
Como comentado anteriormente, a análise inicial de autocorrelação será feita
através da análise dos gráficos dos resíduos gerados pelos modelos.
40
Figura 18 - Gráficos de Resíduos em (t) x (t-1) - Modelo Autorregressivo
Fonte: Elaboração Própria
A análise dos gráficos não apresenta nenhum padrão muito marcante, que
deixasse clara a existência de autocorrelação entre os resíduos dos modelos. Mas é
válido ressaltar que este teste é muito subjetivo e, por isso, não podemos descartar a
hipótese de existir autocorrelação.
Além da análise gráfica, no caso do modelo autorregressivo é possível realizar o
teste de Durbin-Watson para avaliar a existência de autocorrelação entre os resíduos.
Os resultados da aplicação dos testes para ambas as séries encontram-se abaixo:
Tabela 8 - Teste de Durbin-Watson - Autorregressivo - Alimentos
Fonte: Elaboração Própria
41
Como D > 2 e (4 - 𝐷𝑢) < D < (4 - 𝐷𝑖), o teste é inconclusivo para a série de
alimentos.
Por sua vez, os resultado para a série transformada de vestuário estão listado a
seguir:
Tabela 9 - Teste de Durbin-Watson - Autorregressivo - Vestuário
Fonte: Elaboração Própria
Como D < 2 e D < 𝐷𝑖, a hipótese nula é rejeitada e, portanto, a série transformada
de vestuário não atende ao pressuposto de não autocorrelação. Portanto, utilizar este
modelo traria as consequências já comentadas devido à violação deste pressuposto.
5.1.2 Modelo Holt Winters Aditivo (EWMA)
5.1.2.1 Modelo de Previsão
Como foi comentado no tópico 4.1.2, os cálculos para o modelo Holt-Winters
Aditivo foram realizados no Excel e, com a ajuda do Solver, foram obtidos os seguintes
resultados para os parâmetros e erro médio (neste caso foi calculado o erro absoluto
médio percentual (MAPE)):
Tabela 9 - Resultados de Parâmetros e Erro - Holt-Winters Aditivo
Fonte: Elaboração Própria
42
Podemos ver que os resultados foram relativamente bons, sendo que a previsão
da série transformada de alimentos parece ser um pouco mais confiável do que a da
série transformada de vestuário. Tais resultados serão melhor avaliados quando todas
as medidas de erro forem consideradas.
Abaixo, os resultados podem ser analisados graficamente:
Figura 19 - Modelo Holt-Winters Aditivo – Alimentos
Fonte: Elaboração Própria
Figura 20 - Modelo Holt-Winters Aditivo – Vestuário
Fonte: Elaboração Própria
Como podemos observar, em ambos os casos a previsão ficou muito próxima das
vendas realizadas até o período de corte estudado, indicando confiabilidade na análise.
As tabelas com os cálculos de nível, tendência e sazonalidade podem ser encontradas
43
no Apêndice 10, para a série transformada de alimentos e no Apêndice 11, para a de
vestuário.
5.1.2.2 Teste de Homocedasticidade
Tendo gerado o modelo, é importante verificar a presença de
homocedasticidade entre os resíduos gerados. Para tanto, foi realizado o Teste de
Pesaran, que gerou os seguintes resultados:
Tabela 10 - Resultados Teste de Pesaran - Modelo Holt-Winters - Alimentos
Fonte: Elaboração Própria
Tabela 11 - Resultados Teste de Pesaran - Modelo Holt-Winters - Vestuário
Fonte: Elaboração Própria
A análise dos resultados gerados pelos Testes de Pesaran mostra que no caso do
modelo de Holt-Winters para a série transformada de alimentos, o valor F calculado foi
inferior ao F tabelado. Portanto, não existe regressão. Como não existe regressão, pode-
44
se aceitar a não violação ao pressuposto de homocedasticidade para o modelo de Holt-
Winters para a série transformada de alimentos.
Por outro lado, não se pode rejeitar a existência de heterocedasticidade para a
série transformada de vestuário, pois o valor de F calculado foi superior ao F tabelado.
Portanto, caso se decida trabalhar com este modelo para a previsão de vendas
de vestuário, será preciso levar em consideração as consequências da violação do
pressuposto de homocedasticidade.
5.1.2.3 Teste de Autocorrelação
Como comentado anteriormente, a análise inicial de autocorrelação será feita
através da análise dos gráficos dos resíduos gerados pelos modelos.
Figura 21 - Gráficos de Resíduos em (t) x (t-1) - Modelo Holt-Winters
Fonte: Elaboração Própria
Assim como ocorreu com os resultados para o modelo autorregressivo com
dummies, a análise dos gráficos não apresenta nenhum padrão muito marcante, que
deixasse clara a existência de autocorrelação entre os resíduos dos modelos. No
45
entanto, é válido ressaltar que este teste é muito subjetivo e, por isso, não podemos
descartar a hipótese de existir autocorrelação.
5.1.3 Modelo ARIMA
5.1.3.1 Modelo de Previsão
Como foi comentado no tópico 4.1.3, o cálculo dos modelos ARIMA foi realizado
no software R, que retornou os seguintes resultados para a série transformada de
alimentos:
Tabela 12 - Resultados ARIMA (1,0,2) - Alimentos
Fonte: Elaboração Própria
O gráfico gerado para a previsão de 10 períodos da série transformada de
alimentos encontra-se abaixo:
Figura 22 - Gráfico do modelo ARIMA (1,0,2) - Alimentos
Fonte: Elaboração Própria
46
Por sua vez, os resultados gerados para a série transformada de vestuário
encontram-se abaixo:
Tabela 13 - Resultados ARIMA (0,0,0) - Vestuário
Fonte: Elaboração Própria
Figura 23 - Gráfico do modelo ARIMA (0,0,0) - Vestuário
Fonte: Elaboração Própria
Nos Apêndices 12 e 13 é possível encontrar os valores previstos para 10 períodos
e também os resíduos gerados por cada um dos modelos para as séries transformadas
de alimentos e vestuário, respectivamente.
Como pode ser visto principalmente nos gráficos e nas medidas de erro, os
modelos não fornecem boas previsões. Isto muito possivelmente está relacionado ao
fato de o modelo ARIMA não levar em consideração componentes sazonais.
Portanto, espera-se que o modelo SARIMA apresente resultados melhores, uma
vez que é uma extensão do modelo ARIMA com a inclusão dos fatores sazonais. Além
disso, pelo fato de os resultados não terem ficado satisfatórios, o modelo ARIMA não
será incluído nos testes de homocedasticidade e autocorrelação dos resíduos, assim
como não será considerado na comparação entre os melhores modelos.
47
5.1.4 Modelo SARIMA
5.1.4.1 Modelo de Previsão
Para o cálculo do presente modelo, foi feito uso da função arima() do software
R. Os coeficientes da parte sazonal do modelo SARIMA foram colocados no parâmetro
“seasonal” da função. Para obtenção dos melhores resultados possíveis, foram testados
diferentes valores dos coeficientes P, Q e D sucessivas vezes até a escolha dos valores
usados.
O melhor modelo para a série transformada de alimentos foi o ARIMA
(1,0,2)(0,1,0)12, cujo resultado e gráfico encontram-se abaixo:
Tabela 14- Resultados SARIMA (1,0,2)(0,1,0)[12] - Alimentos
Fonte: Elaboração Própria
Figura 24 - Gráfico do modelo SARIMA (1,0,2)(0,1,0)[12] - Alimentos
Fonte: Elaboração Própria
Por sua vez, o melhor modelo SARIMA para a série transformada de vestuário foi
o ARIMA (0,0,0)(0,1,0)12, cujo resultado e gráfico encontram-se abaixo:
48
Tabela 15 - Resultados SARIMA (0,0,0)(0,1,0)[12] - Vestuário
Fonte: Elaboração Própria
Figura 25 - Gráfico do modelo SARIMA (0,0,0)(0,1,0)[12] - Vestuário
Fonte: Elaboração Própria
Como esperado, os resultados obtidos com a utilização do modelo SARIMA
ficaram muitos melhores do que aqueles obtidos através de modelos ARIMA. Isto está
relacionado ao fato de o SARIMA incluir os componentes sazonais no modelo.
5.1.4.2 Teste de Homocedasticidade
Tendo gerado o modelo, é importante verificar a presença de
homocedasticidade entre os resíduos gerados. Para tanto, foi realizado o Teste de
Pesaran, que gerou os seguintes resultados:
49
Tabela 16 - Resultados Teste de Pesaran - Modelo SARIMA - Alimentos
Fonte: Elaboração Própria
Tabela 17 - Resultados Teste de Pesaran - Modelo SARIMA - Vestuário
Fonte: Elaboração Própria
Os resultados mostram que tanto para a série transformada de alimentos quanto
para a série transformada de vestuário, o valor F calculado foi inferior ao F tabelado.
Portanto, não existe regressão. Como não existe regressão, pode-se aceitar a não
violação ao pressuposto de homocedasticidade para os modelos gerados pelo método
SARIMA.
5.1.4.3 Teste de Autocorrelação
Como foi feito para os modelos anteriores, a análise inicial de autocorrelação
será feita através da análise dos gráficos dos resíduos gerados pelos modelos.
50
Figura 26 - Gráficos de Resíduos em (t) x (t-1) - Modelo SARIMA
Fonte: Elaboração Própria
Assim como ocorreu com os resultados para o modelo autorregressivo com
dummies, a análise dos gráficos não apresenta nenhum padrão muito marcante, que
deixasse clara a existência de autocorrelação entre os resíduos dos modelos. No
entanto, é válido ressaltar que este teste é muito subjetivo e, por isso, não podemos
descartar a hipótese de existir autocorrelação.
5.2 Comparação dos Modelos
5.2.1 Comparação dos Modelos de acordo com as Medidas de Ajuste
Como foi citado no tópico de metodologia, foram levantadas diferentes medidas
de ajuste para verificação da qualidade dos modelos e também para possibilitar a
comparação entre eles.
Na tabela abaixo, é possível verificar os resultados para as diferentes medidas de
ajuste, tanto para a série transformada de alimentos quanto para a série transformada
de vestuário.
51
Tabela 18 - Comparação entre Modelos - Medidas de Ajuste
Fonte: Elaboração Própria
No caso da série de alimentos, fica muito evidente que o modelo que gera o
melhor ajuste é o modelo autorregressivo com variáveis dummy, pois este é o que
apresenta os melhores resultados para todas as medidas de erro calculadas.
Por outro lado, no caso da série de vestuário não há um modelo que é superior
aos demais em todas as medidas de erro. Considerando as medidas absolutas de erro,
aquele que melhor se ajusta é o modelo autorregressivo com variáveis dummy. Por
outro lado, se as medidas relativas forem consideradas, o melhor modelo é o de Holt-
Winters.
5.2.2 Comparação dos Modelos de acordo com Atendimento aos Pressupostos
Semelhante à análise feita no tópico anterior, foi elaborada uma tabela de
comparação para verificar o atendimento dos modelos aos pressupostos teóricos. Os
resultados encontram-se abaixo:
52
Tabela 19 - Comparação entre Modelos - Atendimento aos Pressupostos
Fonte: Elaboração Própria
Como não foi possível realizar um teste formal para verificar o atendimento ao
pressuposto de não autocorrelação para os modelos Holt-Winters e SARIMA, optou-se
por não preencher a tabela acima com base na análise gráfica.
5.2.3 Previsão – Valores Reais – Melhores Modelos
Com base nos resultados apresentados nos dois tópicos anteriores, os modelos
mais indicados para realização da previsão das vendas em ambos os setores é o
autorregressivo com dummies.
Para tornar os resultados da previsão mais tangíveis, foi feita a transformação
inversa dos valores previstos para a série transformada. As tabelas abaixo mostram os
resultados encontrados para ambas as séries:
Tabela 20 - Resultados da Previsão
Fonte: Elaboração Própria
53
Com tais resultados, foi possível realizar uma comparação entre os índices de
vendas para os anos de 2014 e 2015 para ambas as séries. Tais resultados são úteis para
prever o comportamento do setor ao longo do ano de 2015.
Tabela 21 - Comparação Vendas em 2014 e 2015
Fonte: Elaboração Própria
54
6. COMENTÁRIOS FINAIS
O presente trabalho tinha como principal objetivo estudar os mercados de
Alimentos e Vestuário a partir de modelos econométricos, e assim entender melhor seus
comportamentos, realizando uma previsão de vendas para os mesmos. A partir da
análise comparativa de alguns modelos de previsão, seria escolhido o de melhor
aderência para cada série.
Como a comparação formal entre os três modelos para o critério de não
autocorrelação não seria viável, a escolha do melhor modelo foi feita sem considerar os
resultados dos testes de Durbin-Watson para os modelos autorregressivos.
Neste caso, com base nas medidas de ajuste, o melhor modelo para a previsão
da série de alimentos seria o modelo autorregressivo com variáveis dummy.
Por sua vez, levando em consideração apenas as medidas de ajuste, haveria uma
dúvida entre o modelo autorregressivo e o de Holt-Winters para a série de vestuário. No
entanto, como foi constatado que o modelo de Holt-Winters não atende ao pressuposto
de homocedasticidade, conclui-se que o modelo mais adequado para a previsão da série
de vestuário também seria o autorregressivo.
Como foi constatado que o modelo autorregressivo não atende ao pressuposto
de não autocorrelação para a série de vestuário, aqui cabe a ressalva de que o modelo
pode gerar viés nas estimativas, pois as estimativas dos mínimos quadrados não tem
variância mínima. Com o intuito de corrigir este problema, sugere-se que as variáveis
sejam novamente transformadas, o que pode ser feito através do método das primeiras
diferenças, por exemplo.
Além disso, o fato de as séries não atenderem ao pressuposto de normalidade
também gera a necessidade de ressaltar que mesmo que os modelos estejam bem
ajustados, os resultados devem ser vistos com ressalvas. Uma possibilidade para futuros
trabalhos seria trabalhar com outra distribuição de probabilidade que não fosse a
normal. Mais à frente também poderia ser realizada uma análise a partir de modelos
55
heterocedásticos, seguindo uma linha de raciocínio diferente da apresentada neste
trabalho, que levou em conta o pressuposto da homocedasticidade.
Com relação à previsão em si, os resultados obtidos com base nos modelos
selecionados exibidos na Tabela 21 mostram que para ambas as séries é possível esperar
um aumento das vendas no ano de 2015 em comparação com os resultados de 2014.
No caso da série de alimentos, a previsão indica um aumento de 2,95% na média de
vendas de 2015 em relação ao ano anterior. Já no caso da série de vestuário, o aumento
esperado é de 2,18% para o mesmo período.
As dificuldades enfrentadas ao realizar as análises explicitadas não foram muitas.
Por um lado, não se pode dizer que a curva de aprendizado pode ser percorrida de forma
fácil, mas por outro sabemos que qualquer esforço leva a uma recompensa e bons
resultados, o que nos motiva a seguir a diante. Aprender a usar novos softwares,
entender mais sobre estatística, analisar as vendas dos mercados nas quais ambas
autores encontram-se empregadas fez valer todos os esforços.
56
REFERÊNCIAS BIBLIOGRAFICAS
ABELL, Derek. Definição do Negócio - Ponto de Partida do Planejamento Estratégico. São
Paulo: Atlas, 1991
Becker, M., 2010. Modelos para Previsão em Series Temporais: Uma Aplicação para a
Taxa de Desemprego na Região Metropolitana de Porto Alegre. Monografia apresentada
para a obtenção do grau de Bacharel em Estatística. Universidade Federal do Rio Grande
do Sul, Instituto de Matemática, Departamento de Estatística.
Bezerra, I. N., Souza, A. d. M., Pereira, R. A. & Sichieri, R., 2013. Consumo de alimentos
fora do domicílio no Brasil. Revista de Saúde Pública, Volume 47, pp. 200-211.
Box, G.E.P. and Jenkins, G.M. (1970). Time Series Analysis: Forecasting and Control. San
Francisco: Holden-Day. (Revised edition published 1976)
Christopher, M., & Towill, D. (2001). An Integrated Model for the Design of Agile Supply
Chains. International Journal of Physical Distribution and Logistics Management, 31,
235-246
Cholachatpinyo, A., Fletcher, B., Padgett, I. & Crocker, M. (2002). A. conceptual model
of the fashion process – part 1: The fashion transformation process model. Journal of
Fashion Marketing and Management, 6, 11-23
Ciarniéne, R., & Vienanzidiene, M. (2014).Management of contemporary fashion
industry: characteristics and challenges. 19th International Scientific Conference;
Economics and Management 2014, 23-25, April 2014, Riga, Latvia
D. A. Dickey and W. A. Fuller, “Distribution of the Estimators for Autoregressive Time
Series with a Unit Root,” Journal of the American Statistical Association, vol. 74, 1979,
pp. 427–431.
Felipe, I. 2012. Aplicação de Modelos Arima em Séries de Preço de Soja no Norte do
Paraná. Tekhne e Logos, Botucatu, SP, v.3, n.3.
Gouveia, F., 2006. Indústria de alimentos: no caminho da inovação e de novos produtos.
Inovação Uniemp, Volume II, pp. 32-37.
57
Gujarati, D. N., 2004. Basic Econometrics. 4ª ed. s.l.:The McGraw-Hill Companies.
Hair, J., Black, W., Babin, B., 2009. Análise Multivariada de Dados, 6ed, pp 82.
Hyndman, R. J. & Athanasopoulos, G., 2013. Forecasting: principles and practice.
Melbourne: OTexts.
IBGE-PMC, 2015. Tabela 3418 - Índices de volume e de receita nominal de vendas no
comércio varejista, por tipos de índice e atividades. [Online]
Available at: http://www.sidra.ibge.gov.br/bda/tabela/listabl.asp?c=3418&z=p&o=19
[Acesso em 01 04 2015].
Khandelwal, I., Adhikari, R., Verma, G., 2015. Time Series Forecasting Using Hybrid
ARIMA and ANN Models based on DWT Decomposition. International Conference on
Intelligent Computing, Communication & Convergence. Procedia Computer Science,
Volume 48, pp. 173 - 179.
Morettin, L., 2006. Estatística Básica - Probabilidade e Inerência. Volume único.
Salles, A., 2005. Apostila Análise de Regressão. s.l.:s.n.
Samohyl, R., Moro, G., Hennign, E., Walter, O., 2013. Aplicação de um modelo SARIMA
na previsão de vendas de motocicletas. Exacta – EP, São Paulo, v. 11, n. 1, p. 77-88
Seward, L., Doane, D., 2014. Estatística aplicada à Administração e Economia, 4ed, p.
574-575
Shedden, K., 2014. Regression diagnostics. Michigan: s.n.
Siqueira, Leonardo (2008). PREVISÃO DE VENDAS TOP-DOWN OU BOTTOM-UP? UM
ESTUDO DE CASO
Wooldridge, J., 2013. Introdução à Econometria - Uma Abordagem Moderna, Editora
THOMSON.
58
Apêndice 1: Vendas de Alimentos e de Vestuário
Data Alimentos Vestuario Data Alimentos Vestuario
jan/2009 82,30 72,00 fev/2012 102,20 73,50
fev/2009 78,80 59,80 mar/2012 110,70 87,80
mar/2009 84,10 68,90 abr/2012 105,90 87,80
abr/2009 87,70 75,20 mai/2012 103,70 111,40
mai/2009 86,40 90,70 jun/2012 104,50 108,70
jun/2009 81,80 93,10 jul/2012 105,30 102,80
jul/2009 86,40 85,10 ago/2012 107,80 100,50
ago/2009 89,20 81,30 set/2012 107,20 91,40
set/2009 85,90 76,40 out/2012 108,60 95,70
out/2009 93,40 85,10 nov/2012 108,50 104,10
nov/2009 89,40 89,10 dez/2012 134,70 196,20
dez/2009 113,60 170,90 jan/2013 105,90 86,30
jan/2010 90,70 73,60 fev/2013 100,10 73,80
fev/2010 87,90 66,50 mar/2013 115,20 92,90
mar/2010 97,10 79,70 abr/2013 100,20 96,80
abr/2010 92,50 87,70 mai/2013 106,40 112,50
mai/2010 93,50 101,50 jun/2013 103,70 105,30
jun/2010 91,50 97,10 jul/2013 108,20 109,00
jul/2010 96,00 96,00 ago/2013 113,80 104,20
ago/2010 95,60 91,90 set/2013 108,20 91,80
set/2010 94,30 86,20 out/2013 112,10 99,20
out/2010 99,60 93,60 nov/2013 114,80 110,50
nov/2010 94,40 97,30 dez/2013 137,90 202,20
dez/2010 120,60 187,60 jan/2014 111,80 88,90
jan/2011 94,50 80,80 fev/2014 105,60 79,10
fev/2011 90,20 75,90 mar/2014 112,00 86,10
mar/2011 98,50 84,20 abr/2014 110,30 91,80
abr/2011 102,20 89,00 mai/2014 109,30 114,80
mai/2011 95,30 107,10 jun/2014 104,50 102,70
jun/2011 94,00 108,10 jul/2014 108,20 104,50
jul/2011 100,40 97,30 ago/2014 112,10 103,40
ago/2011 99,30 92,70 set/2014 106,10 91,80
set/2011 97,60 86,80 out/2014 114,20 99,80
out/2011 101,90 91,50 nov/2014 113,20 112,50
nov/2011 100,20 97,70 dez/2014 136,60 195,40
dez/2011 126,10 189,00 jan/2015 112,00 88,30
jan/2012 102,50 82,00
59
Apêndice 2: Código do R para cálculo de Assimetria e Curtose
Foi preciso instalar o pacote “e1071”, pois este possui as funções necessárias
para o cálculo de assimetria e curtose. O código para cálculo é:
Os resultados gerados pelo programa são:
Vale ressaltar que as séries de vendas de alimentos e de vestuário já haviam sido
previamente carregadas nas variáveis “serieAlimentos” e “serieVest”, respectivamente.
Apêndice 3: Código do R para Teste de Estacionariedade
Apêndice 4: Resultados do R para Teste de Estacionariedade
60
Apêndice 5: Resultados do EViews - Teste de Estacionariedade -
Parâmetros do R
Tabela 22 - Teste de Estacionariedade Alimentos - Parâmetros do R
Null Hypothesis: ALIMENTOS_LN_2RAZ has a unit root
Exogenous: Constant, Linear Trend
Lag Length: 4 (Fixed) t-Statistic Prob.* Augmented Dickey-Fuller test statistic -3.898010 0.0175
Test critical values: 1% level -4.103198
5% level -3.479367
10% level -3.167404 *MacKinnon (1996) one-sided p-values.
Augmented Dickey-Fuller Test Equation
Dependent Variable: D(ALIMENTOS_LN_2RAZ)
Method: Least Squares
Date: 08/08/15 Time: 22:56
Sample (adjusted): 2009M06 2014M11
Included observations: 66 after adjustments Variable Coefficient Std. Error t-Statistic Prob. ALIMENTOS_LN_2RAZ(-1) -1.840924 0.472273 -3.898010 0.0003
D(ALIMENTOS_LN_2RAZ(-1)) 0.505940 0.417961 1.210494 0.2309
D(ALIMENTOS_LN_2RAZ(-2)) 0.029528 0.336179 0.087834 0.9303
D(ALIMENTOS_LN_2RAZ(-3)) -0.062224 0.227287 -0.273768 0.7852
D(ALIMENTOS_LN_2RAZ(-4)) -0.065817 0.136573 -0.481917 0.6316
C -1.258091 0.322300 -3.903480 0.0002
@TREND(2009M01) -0.000165 0.000560 -0.295302 0.7688 R-squared 0.677736 Mean dependent var -0.002061
Adjusted R-squared 0.644963 S.D. dependent var 0.143426
S.E. of regression 0.085460 Akaike info criterion -1.981527
Sum squared resid 0.430904 Schwarz criterion -1.749291
Log likelihood 72.39040 Hannan-Quinn criter. -1.889760
F-statistic 20.67993 Durbin-Watson stat 1.957836
Prob(F-statistic) 0.000000
61
Tabela 23 - Teste de Estacionariedade Vestuário - Parâmetros do R
Null Hypothesis: VESTUARIO_LN_2RAZ has a unit root
Exogenous: Constant, Linear Trend
Lag Length: 4 (Fixed) t-Statistic Prob.* Augmented Dickey-Fuller test statistic -7.312746 0.0000
Test critical values: 1% level -4.103198
5% level -3.479367
10% level -3.167404 *MacKinnon (1996) one-sided p-values.
Augmented Dickey-Fuller Test Equation
Dependent Variable: D(VESTUARIO_LN_2RAZ)
Method: Least Squares
Date: 08/08/15 Time: 22:57
Sample (adjusted): 2009M06 2014M11
Included observations: 66 after adjustments Variable Coefficient Std. Error t-Statistic Prob. VESTUARIO_LN_2RAZ(-1) -3.282941 0.448934 -7.312746 0.0000
D(VESTUARIO_LN_2RAZ(-1)) 1.943075 0.367551 5.286545 0.0000
D(VESTUARIO_LN_2RAZ(-2)) 1.217269 0.295349 4.121462 0.0001
D(VESTUARIO_LN_2RAZ(-3)) 0.717407 0.198181 3.619964 0.0006
D(VESTUARIO_LN_2RAZ(-4)) 0.251569 0.131592 1.911729 0.0608
C -2.271697 0.316218 -7.183967 0.0000
@TREND(2009M01) -0.000460 0.001698 -0.270772 0.7875 R-squared 0.709938 Mean dependent var -0.007258
Adjusted R-squared 0.680440 S.D. dependent var 0.462411
S.E. of regression 0.261400 Akaike info criterion 0.254471
Sum squared resid 4.031456 Schwarz criterion 0.486707
Log likelihood -1.397549 Hannan-Quinn criter. 0.346239
F-statistic 24.06742 Durbin-Watson stat 2.105083
Prob(F-statistic) 0.000000
62
Apêndice 6: Resultados do EViews – Estacionariedade – Alimentos
Tabela 24 - Estacionariedade Série Alimentos - Teste 1
Null Hypothesis: ALIMENTOS_LN_2RAZ has a unit root
Exogenous: Constant, Linear Trend
Lag Length: 11 (Automatic - based on SIC, maxlag=11) t-Statistic Prob.* Augmented Dickey-Fuller test statistic -3.226907 0.0892
Test critical values: 1% level -4.121303
5% level -3.487845
10% level -3.172314 *MacKinnon (1996) one-sided p-values.
Augmented Dickey-Fuller Test Equation
Dependent Variable: D(ALIMENTOS_LN_2RAZ)
Method: Least Squares
Date: 07/31/15 Time: 16:20
Sample (adjusted): 2010M01 2014M11
Included observations: 59 after adjustments Variable Coefficient Std. Error t-Statistic Prob. ALIMENTOS_LN_2RAZ(-1) -4.325478 1.340441 -3.226907 0.0023
D(ALIMENTOS_LN_2RAZ(-1)) 2.964375 1.231905 2.406335 0.0203
D(ALIMENTOS_LN_2RAZ(-2)) 2.567874 1.122001 2.288655 0.0268
D(ALIMENTOS_LN_2RAZ(-3)) 2.262836 1.012823 2.234186 0.0305
D(ALIMENTOS_LN_2RAZ(-4)) 1.889756 0.905885 2.086087 0.0427
D(ALIMENTOS_LN_2RAZ(-5)) 1.570181 0.796304 1.971835 0.0548
D(ALIMENTOS_LN_2RAZ(-6)) 1.193004 0.687286 1.735819 0.0894
D(ALIMENTOS_LN_2RAZ(-7)) 0.841970 0.577689 1.457480 0.1519
D(ALIMENTOS_LN_2RAZ(-8)) 0.487858 0.464835 1.049528 0.2995
D(ALIMENTOS_LN_2RAZ(-9)) 0.151616 0.352512 0.430103 0.6692
D(ALIMENTOS_LN_2RAZ(-10)) -0.224654 0.236237 -0.950970 0.3467
D(ALIMENTOS_LN_2RAZ(-11)) -0.539256 0.122779 -4.392076 0.0001
C -2.953202 0.913674 -3.232229 0.0023
@TREND(2009M01) -0.000666 0.000362 -1.840520 0.0723 R-squared 0.949153 Mean dependent var 0.000699
Adjusted R-squared 0.934463 S.D. dependent var 0.141360
S.E. of regression 0.036188 Akaike info criterion -3.596457
Sum squared resid 0.058932 Schwarz criterion -3.103482
Log likelihood 120.0955 Hannan-Quinn criter. -3.404020
F-statistic 64.61548 Durbin-Watson stat 2.046789
Prob(F-statistic) 0.000000
63
Tabela 25 - Estacionariedade Série Alimentos - Teste 2
Null Hypothesis: ALIMENTOS_LN_2RAZ has a unit root
Exogenous: Constant, Linear Trend
Lag Length: 9 (Automatic - based on SIC, maxlag=9) t-Statistic Prob.* Augmented Dickey-Fuller test statistic -6.545362 0.0000
Test critical values: 1% level -4.115684
5% level -3.485218
10% level -3.170793 *MacKinnon (1996) one-sided p-values.
Augmented Dickey-Fuller Test Equation
Dependent Variable: D(ALIMENTOS_LN_2RAZ)
Method: Least Squares
Date: 07/31/15 Time: 16:21
Sample (adjusted): 2009M11 2014M11
Included observations: 61 after adjustments Variable Coefficient Std. Error t-Statistic Prob. ALIMENTOS_LN_2RAZ(-1) -5.400710 0.825120 -6.545362 0.0000
D(ALIMENTOS_LN_2RAZ(-1)) 4.028642 0.784543 5.135018 0.0000
D(ALIMENTOS_LN_2RAZ(-2)) 3.318903 0.716340 4.633143 0.0000
D(ALIMENTOS_LN_2RAZ(-3)) 3.015341 0.634080 4.755458 0.0000
D(ALIMENTOS_LN_2RAZ(-4)) 2.500844 0.546552 4.575677 0.0000
D(ALIMENTOS_LN_2RAZ(-5)) 2.247512 0.473576 4.745834 0.0000
D(ALIMENTOS_LN_2RAZ(-6)) 1.633374 0.393037 4.155780 0.0001
D(ALIMENTOS_LN_2RAZ(-7)) 1.283709 0.305544 4.201396 0.0001
D(ALIMENTOS_LN_2RAZ(-8)) 0.741168 0.199137 3.721894 0.0005
D(ALIMENTOS_LN_2RAZ(-9)) 0.548995 0.115823 4.739968 0.0000
C -3.693276 0.560330 -6.591252 0.0000
@TREND(2009M01) -0.000666 0.000518 -1.285342 0.2047 R-squared 0.835392 Mean dependent var -0.005352
Adjusted R-squared 0.798439 S.D. dependent var 0.145348
S.E. of regression 0.065255 Akaike info criterion -2.446648
Sum squared resid 0.208651 Schwarz criterion -2.031394
Log likelihood 86.62277 Hannan-Quinn criter. -2.283906
F-statistic 22.60701 Durbin-Watson stat 2.832757
Prob(F-statistic) 0.000000
64
Tabela 26 - Estacionariedade Série Alimentos - Teste 3
Null Hypothesis: ALIMENTOS_LN_2RAZ has a unit root
Exogenous: Constant
Lag Length: 9 (Automatic - based on SIC, maxlag=9) t-Statistic Prob.* Augmented Dickey-Fuller test statistic -6.514539 0.0000
Test critical values: 1% level -3.542097
5% level -2.910019
10% level -2.592645 *MacKinnon (1996) one-sided p-values.
Augmented Dickey-Fuller Test Equation
Dependent Variable: D(ALIMENTOS_LN_2RAZ)
Method: Least Squares
Date: 08/05/15 Time: 21:52
Sample (adjusted): 2009M11 2014M11
Included observations: 61 after adjustments Variable Coefficient Std. Error t-Statistic Prob. ALIMENTOS_LN_2RAZ(-1) -4.991700 0.766240 -6.514539 0.0000
D(ALIMENTOS_LN_2RAZ(-1)) 3.630428 0.725465 5.004276 0.0000
D(ALIMENTOS_LN_2RAZ(-2)) 2.952268 0.661370 4.463870 0.0000
D(ALIMENTOS_LN_2RAZ(-3)) 2.691803 0.585760 4.595400 0.0000
D(ALIMENTOS_LN_2RAZ(-4)) 2.228824 0.507191 4.394451 0.0001
D(ALIMENTOS_LN_2RAZ(-5)) 2.020207 0.442173 4.568811 0.0000
D(ALIMENTOS_LN_2RAZ(-6)) 1.455726 0.370326 3.930934 0.0003
D(ALIMENTOS_LN_2RAZ(-7)) 1.155040 0.290556 3.975278 0.0002
D(ALIMENTOS_LN_2RAZ(-8)) 0.665890 0.191567 3.476008 0.0011
D(ALIMENTOS_LN_2RAZ(-9)) 0.515313 0.113552 4.538103 0.0000
C -3.438369 0.527467 -6.518644 0.0000 R-squared 0.829842 Mean dependent var -0.005352
Adjusted R-squared 0.795811 S.D. dependent var 0.145348
S.E. of regression 0.065679 Akaike info criterion -2.446275
Sum squared resid 0.215686 Schwarz criterion -2.065625
Log likelihood 85.61138 Hannan-Quinn criter. -2.297095
F-statistic 24.38447 Durbin-Watson stat 2.712124
Prob(F-statistic) 0.000000
65
Apêndice 7: Resultados do EViews – Estacionariedade – Vestuário
Tabela 27 - Estacionariedade Série Vestuário - Teste 1
Null Hypothesis: VESTUARIO_LN_2RAZ has a unit root
Exogenous: Constant, Linear Trend
Lag Length: 11 (Automatic - based on SIC, maxlag=11) t-Statistic Prob.* Augmented Dickey-Fuller test statistic -3.376527 0.0644
Test critical values: 1% level -4.121303
5% level -3.487845
10% level -3.172314 *MacKinnon (1996) one-sided p-values.
Augmented Dickey-Fuller Test Equation
Dependent Variable: D(VESTUARIO_LN_2RAZ)
Method: Least Squares
Date: 07/31/15 Time: 16:09
Sample (adjusted): 2010M01 2014M11
Included observations: 59 after adjustments Variable Coefficient Std. Error t-Statistic Prob. VESTUARIO_LN_2RAZ(-1) -4.750737 1.406989 -3.376527 0.0015
D(VESTUARIO_LN_2RAZ(-1)) 3.365800 1.289792 2.609568 0.0123
D(VESTUARIO_LN_2RAZ(-2)) 2.965953 1.174865 2.524504 0.0152
D(VESTUARIO_LN_2RAZ(-3)) 2.585304 1.059426 2.440288 0.0187
D(VESTUARIO_LN_2RAZ(-4)) 2.190918 0.945223 2.317884 0.0251
D(VESTUARIO_LN_2RAZ(-5)) 1.820157 0.829695 2.193766 0.0335
D(VESTUARIO_LN_2RAZ(-6)) 1.408811 0.715266 1.969631 0.0551
D(VESTUARIO_LN_2RAZ(-7)) 1.017976 0.596787 1.705762 0.0949
D(VESTUARIO_LN_2RAZ(-8)) 0.620033 0.477891 1.297437 0.2011
D(VESTUARIO_LN_2RAZ(-9)) 0.221607 0.358706 0.617795 0.5398
D(VESTUARIO_LN_2RAZ(-10)) -0.192312 0.239138 -0.804188 0.4255
D(VESTUARIO_LN_2RAZ(-11)) -0.579148 0.119454 -4.848279 0.0000
C -3.282865 0.972227 -3.376644 0.0015
@TREND(2009M01) -0.001138 0.000471 -2.414132 0.0199 R-squared 0.992866 Mean dependent var 0.000898
Adjusted R-squared 0.990805 S.D. dependent var 0.454810
S.E. of regression 0.043612 Akaike info criterion -3.223252
Sum squared resid 0.085592 Schwarz criterion -2.730277
Log likelihood 109.0859 Hannan-Quinn criter. -3.030814
F-statistic 481.7433 Durbin-Watson stat 1.716825
Prob(F-statistic) 0.000000
66
Tabela 28 - Estacionariedade Série Vestuário - Teste 2
Null Hypothesis: VESTUARIO_LN_2RAZ has a unit root
Exogenous: Constant, Linear Trend
Lag Length: 9 (Fixed) t-Statistic Prob.* Augmented Dickey-Fuller test statistic -6.592242 0.0000
Test critical values: 1% level -4.115684
5% level -3.485218
10% level -3.170793 *MacKinnon (1996) one-sided p-values.
Augmented Dickey-Fuller Test Equation
Dependent Variable: D(VESTUARIO_LN_2RAZ)
Method: Least Squares
Date: 07/31/15 Time: 16:12
Sample (adjusted): 2009M11 2014M11
Included observations: 61 after adjustments Variable Coefficient Std. Error t-Statistic Prob. VESTUARIO_LN_2RAZ(-1) -5.968696 0.905412 -6.592242 0.0000
D(VESTUARIO_LN_2RAZ(-1)) 4.628167 0.877768 5.272651 0.0000
D(VESTUARIO_LN_2RAZ(-2)) 3.830114 0.828778 4.621401 0.0000
D(VESTUARIO_LN_2RAZ(-3)) 3.344835 0.756045 4.424119 0.0001
D(VESTUARIO_LN_2RAZ(-4)) 2.626404 0.654642 4.011973 0.0002
D(VESTUARIO_LN_2RAZ(-5)) 2.238235 0.541517 4.133268 0.0001
D(VESTUARIO_LN_2RAZ(-6)) 1.636407 0.412084 3.971055 0.0002
D(VESTUARIO_LN_2RAZ(-7)) 1.375641 0.294442 4.672018 0.0000
D(VESTUARIO_LN_2RAZ(-8)) 0.865502 0.180440 4.796607 0.0000
D(VESTUARIO_LN_2RAZ(-9)) 0.664768 0.106329 6.251984 0.0000
C -4.161801 0.625198 -6.656772 0.0000
@TREND(2009M01) -0.000545 0.001438 -0.378867 0.7064 R-squared 0.867574 Mean dependent var -0.020162
Adjusted R-squared 0.837845 S.D. dependent var 0.474677
S.E. of regression 0.191145 Akaike info criterion -0.297180
Sum squared resid 1.790283 Schwarz criterion 0.118073
Log likelihood 21.06400 Hannan-Quinn criter. -0.134439
F-statistic 29.18336 Durbin-Watson stat 3.199866
Prob(F-statistic) 0.000000
67
Tabela 29 - Estacionariedade Série Vestuário - Teste 3
Null Hypothesis: VESTUARIO_LN_2RAZ has a unit root
Exogenous: Constant
Lag Length: 9 (Fixed) t-Statistic Prob.* Augmented Dickey-Fuller test statistic -6.705316 0.0000
Test critical values: 1% level -3.542097
5% level -2.910019
10% level -2.592645 *MacKinnon (1996) one-sided p-values.
Augmented Dickey-Fuller Test Equation
Dependent Variable: D(VESTUARIO_LN_2RAZ)
Method: Least Squares
Date: 07/31/15 Time: 16:15
Sample (adjusted): 2009M11 2014M11
Included observations: 61 after adjustments Variable Coefficient Std. Error t-Statistic Prob. VESTUARIO_LN_2RAZ(-1) -5.901204 0.880078 -6.705316 0.0000
D(VESTUARIO_LN_2RAZ(-1)) 4.558613 0.850973 5.356945 0.0000
D(VESTUARIO_LN_2RAZ(-2)) 3.761820 0.801979 4.690670 0.0000
D(VESTUARIO_LN_2RAZ(-3)) 3.279133 0.729558 4.494683 0.0000
D(VESTUARIO_LN_2RAZ(-4)) 2.567519 0.630454 4.072495 0.0002
D(VESTUARIO_LN_2RAZ(-5)) 2.187886 0.520442 4.203901 0.0001
D(VESTUARIO_LN_2RAZ(-6)) 1.597836 0.395875 4.036212 0.0002
D(VESTUARIO_LN_2RAZ(-7)) 1.348420 0.283086 4.763287 0.0000
D(VESTUARIO_LN_2RAZ(-8)) 0.849763 0.174083 4.881373 0.0000
D(VESTUARIO_LN_2RAZ(-9)) 0.657243 0.103559 6.346551 0.0000
C -4.136358 0.616234 -6.712315 0.0000 R-squared 0.867186 Mean dependent var -0.020162
Adjusted R-squared 0.840623 S.D. dependent var 0.474677
S.E. of regression 0.189501 Akaike info criterion -0.327042
Sum squared resid 1.795527 Schwarz criterion 0.053607
Log likelihood 20.97479 Hannan-Quinn criter. -0.177862
F-statistic 32.64655 Durbin-Watson stat 3.171947
Prob(F-statistic) 0.000000
68
Apêndice 8: Código R – Instalação e Utilização Função auto.arima()
No código abaixo, está descrito o procedimento necessário para instalar o pacote
“forecast”, bem como os passos necessários para calcular o melhor ajuste dos
parâmetros do modelo ARIMA, para plotar o gráfico, exibição dos resultados, previsão
de 10 períodos e exibição dos resíduos.
Apêndice 9: Código R – Instalação e Utilização Função arima() –
modelos SARIMA
No código abaixo, está descrito o procedimento necessário para instalar o pacote
“forecast”, bem como os passos necessários para a geração de modelos SARIMA através
da função ARIMA, para plotar o gráfico, exibição dos resultados, previsão de 10 períodos
e exibição dos resíduos.
Aqui cabe ressaltar que os parâmetros P, Q e D (referentes à parte sazonal)
devem ser inseridos no parâmetro “seasonal = list (order = c (P, Q, D), period = 12)”. O
número de períodos de sazonalidade deve ser incluído no parâmetro “period”.
69
Apêndice 10: Modelo de Holt-Winters Aditivo – Alimentos
70
Apêndice 11: Modelo de Holt-Winters Aditivo – Vestuário
71
Apêndice 12: Previsão e Resíduos – ARIMA (1,0,2) – Alimentos
A tabela abaixo mostra os resultados gerados pelo R para a previsão de 10
períodos para a série transformada de alimentos segundo modelo ARIMA (1,0,2).
Por sua vez, a tabela abaixo mostra os resíduos gerados pelo mesmo modelo:
72
Apêndice 13: Previsão e Resíduos – ARIMA (0,0,0) – Vestuário
A tabela abaixo mostra os resultados gerados pelo R para a previsão de 10
períodos para a série transformada de vestuário segundo modelo ARIMA (0,0,0).
Por sua vez, a tabela abaixo mostra os resíduos gerados pelo mesmo modelo: