MÉTODOS QUANTITATIVOS APLICADOS -...
Transcript of MÉTODOS QUANTITATIVOS APLICADOS -...
MÉTODOS QUANTITATIVOS APLICADOS
Prof. Danilo Monte-Mor
2
Métodos Quantitativos
Aulas 1 e 2
Análise Exploratória de Dados
3
Currículum Vitae Danilo Soares Monte Mor
Prof. Dr. e especialista em Métodos Quantitativos e Métodos de Otimização, com ênfase em Finanças e Accounting Based Valuation Models.
Formação Acadêmica
- Doutorado em Ciências Contábeis e Administração de Empresas pela Fucape Business School. 2011-2014
- Doutorado sanduíche na University of Arkansas – 2013.
- Mestrado em Economia pela Universidade Federal do Espírito Santo - UFES. 2009 - 2010
- Licenciatura em Matemática pela Universidade Federal deViçosa - UFV . 2005-2008.
Atuação Docente
Professor de Fucape Business School nos cursos:
• Métodos Quantitativos
• Estatística
• Cálculo
• Métodos de Otimização
• Econometria
• Análise de Cenários Econômicos
• Finanças Corporativas
4
Conteúdo do Curso
Parte 1 – Estatística Descritiva
i. Tipos de variáveis
ii. Distribuição de Freqüência
iii. Histograma, box-plot
iv. Medidas de posição (Média Aritmética, Média Ponderada, Média Geométrica, Moda, Mediana, Percentil, Quartil)
v. Medidas de dispersão (Variância, Desvio Padrão, Desvio Médio, Intervalo Interquartil, Amplitude, Coeficiente de Variação)
vi. Correlação , Covariância
5
Conteúdo do Curso
Parte 2 – Inferência Estatística
i. Lei dos grandes números
ii. Teorema do limite central
iii. População e amostra
iv. Intervalo de confiança para média com variância conhecida
v. Intervalo de confiança para média com variância desconhecida
vi. Teste de hipótese
6
Parte 3 – Análise de Regressão Linear
i. Modelo de Regressão Linear Simples e Múltipla
ii. Coeficiente de correlação linear
iii. Método dos Mínimos Quadrados
iv. Equação de regressão estimada
v. Coeficiente de determinação
vi. Teste de hipótese sobre os parâmetros do modelo (teste t)
vii. Estimação por intervalo - Intervalo de confiança para os parâmetros do modelo
viii. Previsão – Estimativa por ponto e por intervalo
ix. Endogeneidade
Conteúdo do Curso
7
Conteúdo do Curso
Parte 4 – Prova
8
Referências Bibliográficas
•LEVINE David M., STEPHAN, David, KREHBIEL,T.C. e BERENSON, Mark L. Estatística: Teoria e aplicações. Rio de Janeiro: Livros Técnicos e Científicos Editora, 5ª. Edição 2008. •WOOLDRIDGE, J. M. Introdução à Econometria. São Paulo: Thomson Learning, 2006.
• Anderson, R. A., Sweeney, J. D. e Williams, T. A. Estatística Aplicada à Administração e Economia.
Pioneira. Thomson Learning. 2003
• Lapponi, J. C. Estatística Usando Excel. Lapponi Treinamento e Editora Ltda
• Neter,J., Kutner,M. H. , Et. Al. Applied Linear Regression Models. Irwin. 1996
9
Análise Exploratória de Dados
10
Tipos de Variáveis
• Qualitativas
• Ordinal (Rating do fundo)
http://www.bmfbovespa.com.br/shared/iframe.aspx?altura=600&idioma=pt-br&url=http://www.bmfbovespa.com.br/rendafixa/FormConsultaFUN_RatingEmissoes.asp
• Nominal (Tipo do fundo)
http://portal.anbima.com.br/fundos-de-investimento/classificacao-de-fundos/classificacao-anbima-de-fundos/Pages/classificacao.aspx
11
• Quantitativas
• Discreta (Número de dias que a taxa de retorno do fundo foi superior a taxa de retorno do Ibovespa)
• Contínua (Taxa de Retorno)
Base ECONOMÁTICA ( Trabalho final)
Tipos de Variáveis
12
Organizar os dados
Ibovespa
-0,08
-0,06
-0,04
-0,02
0
0,02
0,04
0,06
2/jan 22/jan 11/fev 2/mar 22/mar 11/abr 1/mai
Taxa de Retorno do Ibovespa
Período : 2 de Janeiro de 2004 a 11 de maio de 2004
13
Resumo dos Dados – Tabela de Freqüência
Faixa Freqüência Absoluta Freqüência Relativa
Entre 3,1 % e 7,0 % 7 7,9
Entre 2,1 % e 3,0 % 8 9,0
Entre 1,1 % e 2,0 % 12 13,5
Entre 0 % e 1,0 % 18 20,2
Entre - 0,1 % e - 1,0 % 12 13,5
Entre - 1,1 % e - 2,0 % 12 13,5
Entre - 2,1 % e - 3,0 % 13 14,6
Entre - 3,1 % e - 7,0 % 7 7,9
Total 89 100,0
Taxa de Retorno do Ibovespa
Período : 2 de Janeiro de 2004 a 11 de maio de 2004
14
Amostra Salário Anual
1 R$ 51.814,00
2 R$ 52.669,70
3 R$ 51.780,30
4 R$ 51.587,90
. .
. .
. .500 R$ 51.752,00
Salário anualFreqüência
Absoluta
Freqüência
Relativa
49.500,00 a 49.999,99 2 0,004
50.000,00 a 50.499,99 16 0,032
50.500,00 a 50.999,99 52 0,104
51.000,00 a 51.499,99 101 0,202
51.500,00 a 51.999,99 133 0,266
52.000,00 a 52.499,99 110 0,220
52.500,00 a 52.999,99 54 0,108
53.000,00 a 53.499,99 26 0,052
53.500,00 a 53.999,99 6 0,012
Total 500 1
Salário Anual
Resumo dos Dados – Tabela de Freqüência
15
Distribuição de Probabilidade do Salário Anual
Resumo dos Dados – Histograma
16
Distribuição Normal
0,00
0,10
0,20
0,30
0,40
0,50
-3 -2 -1 0 1 2 3
Características da distribuição Normal
• Simétrica em torno da média
• A área sob a curva é 1
17
Distribuição Simétrica
0,0
5,0
10,0
15,0
20,0
25,0
30,0
35,0
%
0 1 2 3 4 5 6
Dias de Uso do Cheque Especial
18
Distribuição Assimétrica à Direita
0,0
5,0
10,0
15,0
20,0
25,0
30,0
35,0
%
0 1 2 3 4 5 6
Dias de Uso do Cheque Especial
19
Distribuição Assimétrica à Esquerda
0,0
5,0
10,0
15,0
20,0
25,0
30,0
35,0
%
0 1 2 3 4 5 6
Dias de Uso do Cheque Especial
20
0,0
5,0
10,0
15,0
20,0
25,0
30,0
35,0
%
0 1 2 3 4 5 6
Dias de Uso do Cheque Especial
0,0
5,0
10,0
15,0
20,0
25,0
30,0
35,0
%
0 1 2 3 4 5 6
Dias de Uso do Cheque Especial
0,0
5,0
10,0
15,0
20,0
25,0
30,0
35,0
%
0 1 2 3 4 5 6
Dias de Uso do Cheque Especial
• Assimetria
Distribuição Simétrica
Distribuição inclinada para a esquerda Distribuição inclinada para a direita
Distribuição Assimétrica à Direita Distribuição Assimétrica à Esquerda
21
Medidas Resumo
• Média Aritmética
• Média Ponderada
•Moda
• Mediana
• Percentil
• Quartil
Medidas de Posição
22
X : Taxa de Retorno do Ibovespa;
Xi : Taxa de Retorno do Ibovespa no i-ésimo dia;
n: tamanho da amostra em estudo (n=9 dias).
Definições
Dia i Xi
1/abr 1 X1 0,023
2/abr 2 X2 0,013
5/abr 3 X3 0,009
6/abr 4 X4 -0,003
7/abr 5 X5 -0,028
8/abr 6 X6 0,012
12/abr 7 X7 0,002
13/abr 8 X8 -0,007
14/abr 9 X9 -0,014
1-t
t
P
PlnX
23
Medidas de Posição
n
X
X
n
1ii
• Média Aritmética (Retorno - Valor Esperado da Taxa de Retorno)
Dia i Xi
1-Apr 1 X1 0.023
2-Apr 2 X2 0.013
5-Apr 3 X3 0.009
6-Apr 4 X4 -0.003
7-Apr 5 X5 -0.028
8-Apr 6 X6 0.012
12-Apr 7 X7 0.002
13-Apr 8 X8 -0.007
14-Apr 9 X9 -0.014
Soma 0.0076
Média 0.0008 0,08 %
24
Medidas de Posição
• Média Ponderada
Valor esperado do ativo A1 = 0,045 =
Valor esperado do ativo A2 = 0,058 =
Carteira de investimento composta dos ativos A1 e A2, respectivamente nas proporções W e 1- W. Seja W=0,40.
Valor esperado da carteira = 0,40 (0,045) + 0,60 (0,058) = 0,0528 = 5,28 %
n
1i
iiP XWX 0 < Wi < 1 1Wn
1i
i
n
1i
iiP XWX
1
2
25
• Mediana
-0,028 -0,014 -0,007 -0,003 0,002 0,009 0,012 0,013 0,023
É a realização que ocupa a posição central da série de observações arranjadas na ordem ascendente (classificação do menor valor para o maior).
n par
n ímpar
1 2 3 4 5 6 7 8 9
%2,0002,0XXXMediana 5
2
19
2
1n
%5,00055,0
2
009,0002,0
2
XX
2
XX
2
XX
Mediana65
12
10
2
101
2
n
2
n
Medidas de Posição
-0,028 -0,014 -0,007 -0,003 0,002 0,009 0,012 0,013 0,023 0,028
1 2 3 4 5 6 7 8 9 10
26
• Moda
É a realização mais freqüente do conjunto de valores observados
Valor Freqüência
3,03 1
3,10 1
3,11 1
3,12 1
3,13 3
3,15 1
3,18 1
Medidas de Posição
27
Medidas de Posição
Obtenha a Média Aritmética, Geométrica, Mediana e a Moda para os meses de Janeiro e Fevereiro
Data Retorno - Ibovespa Data Retorno - Ibovespa1/3/2002 0.0279 2/1/2002 -0.00501/4/2002 0.0046 2/4/2002 -0.01161/7/2002 0.0033 2/5/2002 0.01861/8/2002 -0.0148 2/6/2002 0.00021/9/2002 -0.0104 2/7/2002 -0.0050
Janeiro Fevereiro
Janeiro Fevereiro
Média Aritmética
Média Geométrica
Mediana
Moda
28
• Percentil
10 % - valor da amostra tal que 10 % das observações são menores do que ele;
80 % - valor da amostra tal que 80 % das observações são menores do que ele;
1100
p)1n(percentildoposição
Dados ordenados
8,11100
10)19(%10percentildoposição
Percentil 10 % = (0,8)*(-0,014) + (0,2)*(-0,028) = -0,016 = -1,6 %
Medidas de Posição
-0,028 -0,014 -0,007 -0,003 0,002 0,009 0,012 0,013 0,023
29
IBOVESPA
.050
.044
.038
.031
.025
.019
.013
.006
.000
-.006
-.012
-.019
-.025
-.031
-.037
-.044
-.050
-.056
-.062
12
10
8
6
4
2
0
Std. Dev = .02
Mean = -.002
N = 89.00
Medidas de Posição
Percentil 5 % = VaR(5%) = -0,042 = 4,2 %
VaR Empírico - (Value at Risk – Valor em Risco): representa a pior perda esperada em um dado horizonte de tempo associada a um nível de confiança (probabilidade)
(Ex.: 95% de confiança).
30
Medidas de Posição
Calcule o VaR empírico (5%) para o retorno do fundo apresentado.
Retorno
-0.0349
-0.0326
-0.0164
-0.0148
-0.0115
-0.0104
-0.0085
0.0013
0.0027
0.0033
0.0046
0.0056
0.0192
0.0279
31
• Quartil
Primeiro quartil ( Q1 )
Percentil 25 % - valor da amostra tal que 25 % das observações são menores do que ele;
Segundo quartil ( Q2 )
Percentil 50 % - valor da amostra tal que 50 % das observações são menores do que ele (mediana);
Terceiro quartil ( Q3 )
Percentil 75 % - valor da amostra tal que 75 % das observações são menores do que ele;
Medidas de Posição
32
5 7 9 11 13 15 17 19
Box-Plot
Q1 Q3
Q2 máximo mínimo
Q3+1,5(Q3-Q1) Q1-1,5(Q3-Q1)
33
5 7 9 11 13 15 17 19
Q1 Q3
Q2 máximo mínimo
Q3+1,5(Q3-Q1) Q1-1,5(Q3-Q1)
*
Possível
Outlier
Box-Plot
34
5 7 9 11 13 15 17 19
Q1 Q3
Q2 máximo mínimo
Q3+1,5(Q3-Q1) Q1-1,5(Q3-Q1)
*
Possível
Outlier
Box-Plot
35
Box-Plot
-0,0800 -0,0600 -0,0400 -0,0200 0,0000 0,0200 0,0400 0,0600 0,0800
Mínimo = -0,0633
Ibovespa
-0,08
-0,06
-0,04
-0,02
0
0,02
0,04
0,06
2/jan 22/jan 11/fev 2/mar 22/mar 11/abr 1/mai
36
Medidas de Posição
Faça o Box Plot para os rendimentos mensais obtidos pelo fundo de investimento apresentado.
Mês Rendimento
Janeiro 120
Fevereiro 140
Março 110
Abril 130
Maio 150
Junho 160
Julho 140
Agosto 130
Setembro 145
Outubro 125
Novembro 120
Dezembro 110
37
Medidas Resumo
• Variância
• Desvio Padrão
• Desvio Médio
• Intervalo Interquartil
• Amplitude
• Coeficiente de Variação
Medidas de Dispersão
38
• Amplitude : (valor máximo – valor mínimo)
Valor Mínimo : menor valor da amostra
Valor Máximo : maior valor da amostra
• Intervalo Interquartil (IQ): (Terceiro Quartil–Primeiro Quartil)
Medidas de Dispersão
39
Medidas de Dispersão
Rendimento em R$ (mil)
Mês Fundo 1 Fundo 2 Fundo 3
Janeiro 14 25 0
Fevereiro 12 10 20
Março 16 7 22
Média 14 14 14
Qual fundo apresenta a maior variabilidade ?
40
Medidas de Dispersão
Mês Fundo 1 Desvio Fundo 2 Desvio Fundo 3 Desvio
Janeiro 14 0 25 11 0 -14
Fevereiro 12 -2 10 -4 20 6
Março 16 2 7 -7 22 8
Média 14 14 14
Desvio : distância de cada ponto à média
XXi
41
Medidas de Dispersão
Mês Fundo 1 Desvio Fundo 2 Desvio Fundo 3 Desvio
Janeiro 14 0 25 11 0 -14
Fevereiro 12 -2 10 -4 20 6
Março 16 2 7 -7 22 8
Média 14 14 14
0XXn
1i
i
42
• Desvio Médio
n
XXn
1ii
S*=
Medidas de Dispersão
Mês Fundo 1 Fundo 2 Fundo 3
Janeiro 14 25 0
Fevereiro 12 10 20
Março 16 7 22
Média 14 14 14
Desvio Médio 1,3 7,3 9,3
43
Medidas de Dispersão
Mês Fundo 1 Desvio Fundo 2 Desvio Fundo 3 Desvio
Janeiro 14 0 25 11 0 -14
Fevereiro 12 -2 10 -4 20 6
Março 16 2 7 -7 22 8
Média 14 14 14
1n
)XX(
S
n
1i
2
i2
• Variância Amostral
amostraliânciavar S = • Desvio Padrão Amostral
Mês Fundo 1 Fundo 2 Fundo 3
Janeiro 14 25 0
Fevereiro 12 10 20
Março 16 7 22
Média 14 14 14
Variância 4,0 93,0 148,0
Desvio Padrão 2,0 9,6 12,2
44
Medidas de Dispersão
O indicador estatístico mais comum do risco de um ativo é o
desvio padrão ( S ), o qual mede a dispersão em torno do valor esperado.
1n
)XX(
S
n
1i
2
i2
• Variância amostral
amostraliânciavar S = • Desvio padrão amostral
• Variância populacional 2 N
)X(N
1i
2
i
: Média populacional
alpopulacioniânciavar = • Desvio padrão populacional
45
Medidas de Dispersão
Mês Fundo 1 Fundo 2 Fundo 3
Janeiro 14 30 5
Fevereiro 13 26 20
Março 16 14 8
Média 14.3 23.3 11.0
Qual fundo apresenta a maior variabilidade ?
46
• Coeficiente de Variação : medida de dispersão relativa usada na comparação do risco de ativos que diferem nos retornos esperados.
Média
PadrãoDesvio CV = x 100
Medidas de Dispersão
Mês Fundo 1 Fundo 2 Fundo 3
Janeiro 14 30 5
Fevereiro 13 26 20
Março 16 14 8
Média 14,3 23,3 11,0
Desvio Padrão 1,5 8,3 7,9
Coeficiente de Variação 10,7 35,7 72,2
47
• Coeficiente de Variação : medida de dispersão relativa usada na comparação do risco de ativos que diferem nos retornos esperados.
Média
PadrãoDesvio CV = x 100
Mês Fundo 1 Fundo 2 Fundo 3
Janeiro 14 30 5
Fevereiro 13 26 20
Março 16 14 8
Média 14,3 23,3 11,0
Desvio Padrão 1,5 8,3 7,9
Coeficiente de Variação 10,7 35,7 72,2
Medidas de Dispersão
48
Média 2000 4000 10000 20000 50000
Desvio Padrão 200 200 200 200 200
Coeficiente de Variação 10.00 5.00 2.00 1.00 0.40
Medidas de Dispersão
Menor Variabilidade Maior Variabilidade
49
Obtenha a Variância, o Desvio Padrão e o Coeficiente de Variação para os meses de Janeiro e Fevereiro. Qual mês apresentou o maior risco ? Justifique.
Data Retorno - Ibovespa Data Retorno - Ibovespa1/3/2002 0.0279 2/1/2002 -0.00501/4/2002 0.0046 2/4/2002 -0.01161/7/2002 0.0033 2/5/2002 0.01861/8/2002 -0.0148 2/6/2002 0.00021/9/2002 -0.0104 2/7/2002 -0.0050
Janeiro Fevereiro
Janeiro Fevereiro
Variância
Desvio Padrão
Coeficiente de Variação
Medidas de Dispersão
50
Medidas Resumo
• Coeficiente de Correlação
• Covariância
Medidas de Associação entre Duas Variáveis Quantitativas
51
Coeficiente de correlação : 0,93637
-6
-4
-2
0
2
4
6
-6 -4 -2 0 2 4
Retorno do Mercado (%)
Reto
rno
do
Ati
vo
(%
)
Coeficiente de Correlação
O coeficiente de correlação é uma medida descritiva da força da associação linear entre duas variáveis. Os valores do coeficiente de correlação estão sempre entre –1 e 1.
Forte Correlação Linear Positiva entre as Variáveis
As séries se movimentam na mesma direção
52
Coeficiente de correlação : 1,0
Coeficiente de Correlação
Correlação Positiva Perfeita entre as Variáveis
Tempo
Ret
orn
o
53
Coeficiente de correlação : -0,98
0
5
10
15
20
25
30
35
40
45
0 5 10 15 20 25 30
Custo
Lu
cro
Forte Correlação Linear Negativa entre as Variáveis
Coeficiente de Correlação
54
Coeficiente de correlação : - 1,0
Coeficiente de Correlação
Correlação Negativa Perfeita entre as Variáveis
Tempo
Ret
orn
o
55
Coeficiente de correlação : 0,07
Não existe Correlação Linear entre as variáveis
Coeficiente de Correlação
-6 -4 -2 0 2 4 6
56
r : Coeficiente de correlação linear entre duas variáveis
-1 < r < 1
r = 0 não existe correlação linear entre as variáveis
r = 1 existe correlação linear positiva perfeita entre as variáveis
r = - 1 existe correlação linear negativa perfeita entre as variáveis
l r l 0,70 existe uma forte correlação linear entre as variáveis
l r l < 0,70 existe uma fraca correlação entre as variáveis
Coeficiente de Correlação Linear
57
Correlação e Covariância
n
1i
ii
yx
n
1i y
i
x
i YYXX1)-(nSS
1
S
YY
S
XX
1-n
1Y)Corr(X,
• Coeficiente de Correlação Amostral
• Covariância Amostral
1-n
YYXX
Y)Cov(X,
n
1i
ii
yx SS
Y)Cov(X,Y)Corr(X,
• Relação entre a Correlação e a Covariância
58
Obtenha a Covariância e a Correlação para o conjunto de dados. Interprete o coeficiente de correlação.
Faça o gráfico de dispersão entre as variáveis.
Retorno do Mercado Retorno do Ativo
0.457 1.548
-1.608 -0.930
0.928 3.114
2.463 2.956
-0.336 -0.404
0.619 0.742
-1.021 -0.226
0.662 2.795
-1.437 -0.724
2.778 5.334
Exercício
59
Exercício
No arquivo Aula1 - dados.xls estão apresentados o retorno do Ibovespa e de
9 fundos de investimentos.
a) Qual o fundo mais correlacioado com o ibovespa ?
60
Exercício
No arquivo Aula1- dados.xls estão apresentados o retorno do Ibovespa e de
9 fundos de investimentos.
a) Obtenha para cada fundo o gráfico da série no tempo (gráfico linha). Através da análise gráfica qual fundo apresenta a maior volatilidade ?
b) Obtenha para cada fundo o box-plot e o coeficiente de assimetria. Qual fundo apresentou a distribuição mais assimétrica ? Quais fundos apresentaram valores aberrantes ?
c) Obtenha para cada fundo a média e a mediana. Qual fundo apresentou o maior retorno médio no período ? Qual fundo apresentou o maior retorno mediano no período ?
d) Obtenha para cada fundo o desvio padrão e o coeficiente de variação. Qual fundo apresentou a maior variabilidade ?
e) Obtenha para cada fundo o VaR(5%) (Value at Risk) empírico.
DANILO SOARES MONTE-MOR
Doutor em Administração e Ciências Contábeis [email protected]
TEL: 27 40094444