investigando a previs~ao da curva de juros brasileira ... de economa... · palavras chave: curva de...
TRANSCRIPT
Investigando a Previsao da Curva de Juros Brasileira: Modelos de FatoresLineares, VAR Bayesiano e Modelagem ARFIMA
Joao F. CaldeiraDepartamento de Economia e PPGE
Universidade Federal do Rio Grande do Sul
Hudson S. TorrentDepartamento de Estatıstica e PPGE
Universidade Federal do Rio Grande do Sul
Abstract
Producing accurate forecasts of the term structure of interest rates is crucial for bond portfolio management,derivatives pricing, and risk management. Unfortunately, when analyzing brazilian yield curve, all the fore-casting models proposed so far in the macroeconomic and financial literature have a hard time in producingforecasts more accurate than a simple no-change forecast (i.e. a random walk forecast). In this paper weconsider a bunch of models in order to investigate which ones are more appropriate to forecast yield curve inBrazil. In particular, we consider two estimators not before considered in the literature for Brazil: BayesianVAR and ARFIMA class models. In the forecast exercise conducted in this paper the methods Bayesian VARand ARFIMA present a valuable performance.
Resumo
A previsao acurada da estrutura a termo da taxa de juros e crucial para gestao de portfolio de tıtulos,precificacao de derivativos e gestao de risco. Entretanto, quando analisada a curva de juros para o mer-cado brasileiro, os modelos de previsao propostos na literatura de macroeconomia e financas apresentam,na maioria dos casos, performance preditiva inferior a performance de um simples processo random walk.Portanto, neste trabalho consideramos uma serie de modelos, a fim de investigar quais sao aqueles mais apro-priados para a previsao da curva de juros no Brasil. Em particular, consideramos dois estimadores ainda naoconsiderados na literatura para o Brasil: VAR Bayesiano e modelos da classe ARFIMA. No exercıcio de previ-sao apresentado no paper, os metodos VAR Bayesiano e ARFIMA apresentam uma performance interessante.
Keywords: Term structure of interest rate, Forecasting, nonlinear models, parametric models.Palavras Chave: Curva de juros, Previsao, modelos nao lineares, Modelos parametricos.JEL C53, E43, G17
∗Autor Correspondente: J. F. Caldeira, Departamento de Economia e PPGE – UFRGS; E-mail: [email protected]; Tel.:+55-(51)3308-3440; Fax: +55-(51)3308-4050.
Preprint submitted to 34o EBE 24 de setembro de 2012
1. Introducao
A estrutura a termo da taxa de juros define a relacao entre o yield de um tıtulo de renda fixa e o
tempo ate o vencimento do seu fluxo de caixa (maturidade). Assim, a curva de juros zero-cupom fornece a
relacao para tıtulos que fazem apenas um pagamento, na maturidade. A curva de juros zero-cupom serve
como base para precificacao de outros instrumentos de renda fixa e como input para varios modelos como,
por exemplo, gestao de risco, polıtica monetaria e precificacao de deriviativos. Embora os precos de tıtulos
zero-cupom possam ser usados para construir a curva de juros diretamente, a falta de liquidez do mercado e o
limitado espectro de maturidades disponıveis levam a necessidade da estimacao atraves dos precos de tıtulos
com cupom. Produzir previsoes precisas da estrutura a termo das taxas de juros e crucial para a gestao de
carteira de tıtulos de renda fixa, precificacao de derivativos e gestao de risco. Diversos trabalhos apresentam
formas alternativas, bem sucedidas, de previsao para a curva de juros zero-cupom para a economia americana.
Porem, quando se trata da curva de juros brasileira, grande parte dos modelos de previsao propostos ate agora
na literatura macroeconomica e financeira tem apresentado dificuldades em produzir previsoes mais precisas
do que um simples processo random walk.
Mais detalhadamente, os modelos para construcao de curvas de juros existentes podem podem ser di-
vididos em tres classes: os modelos de nao arbitragem; os modelos de equilıbrio; e modelos estatısticos ou
parametricos. O primeiro grupos contem modelos que se baseiam no paradigma de nao-arbitragem. Os
modelos de nao arbitragem tem foco no perfeito ajuste da estrutura a termo em um dado ponto do tempo,
assegurando que nao existam possibilidades de arbitragem, o que e importante para o aprecamento de deri-
vativos. Exemplos de modelos desta classe sao Ho & Lee (1986), Heath et al. (1992), Hull & White (1990)
e Dai & Singleton (2002). Na maioria dos casos a implementacao pratica destes modelos envolve impor uma
especificacao afim a um conjunto de fatores latentes. Os modelos afins da estrutura a termos funcionam
muito bem para ajuste da curva de juros (ver, por exemplo, de Jong, 2000; Dai & Singleton, 2002) mas
apresentam fraco desempenho quando o objetivo e fazer previsao. Duffee (2002) mostra que e difıcil bater
o random walk em termos de previsoes usando um modelo afim tradicional de nao-arbitragem da estrutura
a termo. Esta primeira classe de modelos tem a clara vantagem de ser fundamentada na teoria de financas,
enquanto o segundo grupo e aquele que ate agora produziu os melhores resultados na precisao das previsoes
de amostra. Os modelos de equilıbrio tem foco na modelagem da taxa instantanea, utilizando tipicamente
modelos afins, depois disso, as taxas de outros vencimentos podem ser derivadas sob varias suposicoes acerca
do premio de risco. Estes modelos tentam prever a curva de juros futura atraves de informacoes contidas
nas taxas forwards atuais. Modelos desta classe foram desenvolvidos em Vasicek (1977) Cox et al. (1985),
Duffie & Kan (1996) e Cochrane & Piazzesi (2005). Ang & Piazzesi (2003) mostram que impor condicao de
nao-arbitragem em modelos afim melhoram a previsao fora da amostra, mas o ganho em relacao ao random
walk ainda e pequeno, ja Almeida & Vicente (2008) encontram evidencias ligeiramente mais favoraveis a este
respeito. Hordahl et al. (2006), Favero et al. (2007) e Monch (2008) analisaram modelos com variaveis
macroeconomicas e mostraram que estas variaveis contribuem para uma melhor previsao da dinamica da
curva de juros.
A classe de modelos estatısticos ou parametricos e composta por modelos de componentes principais,
modelos de fatores ou de variaveis latentes, bem como por modelos de interpolacao. De acordo com Matzner-
Lober & Villa (2004), grande parte da intuicao a respeito da dinamica da rentabilidade de tıtulos de renda
fixa provem de modelos dessa classe, como em Litterman e Scheinkman (1991) e em Pearson & Sun (1994).
2
Dentre os modelos de fatores, o modelo de Nelson & Siegel (1987) e suas variantes, por exemplo, os modelos
de Diebold & Li (2006) e Svensson (1994a) sao os mais populares entre gestores de renda fixa e bancos centrais
conforme relatorio do BIS (2005). Diebold & Li (2006) argumentam que, apesar dos grandes desenvolvimentos
na modelagem teorica da estrutura a termo dos juros, pouca atencao foi dada a previsao da estrutura a termo.
Os modelos de nao arbitragem sao focados no ajuste para um dado ponto do tempo e tem muito pouco a
dizer sobre dinamica ou previsao fora da amostra. Ja os modelos de equilıbrio possuem algumas implicacoes
dinamicas dado um certo premio de risco, o que possibilita algum tipo de conclusao a respeito de previsoes
fora da amostra. Entretanto, ainda de acordo com Diebold & Li (2006), a maioria dos trabalhos dedicados
a modelos de equilıbrio focaram na performance dentro da amostra. Excecoes sao Duffee (2002), que mostra
que os modelos livre de arbitragem tem baixa performance em previsoes fora da amostra; e Egorov et al.
(2011) que mostram que modelos afins com volatilidade estocastica sao capazes de prever a distribuicao
condicional conjunta da rentabilidade dos tıtulos de renda fixa.
Tanto as especificacoes de Nelson & Siegel (1987) como Svensson (1994a) sao capazes de reproduzir uma
variedade das possıveis formas assumidas pela curva de juros. Entretanto, os modelos parametricos nao sao
imunes a problemas. Os modelos Nenslon & Siegel e Sensson nao sao formulados em uma estrutura dinamica
e o primeiro modelo nao e condizente com nao-arbitragem (ver Filipovic, 2009; Bjork & Christensen, 1999;
Diebold et al. , 2005; Christensen et al. , 2009, 2011). A primeira desvantagem foi abordada por Diebold
& Li (2006) , que aplicaram iterativamente uma versao simplificada do modelo de Nelson & Siegel para um
conjunto de dados dinamicos da curva de juros. Posteriormente, estimaram modelos de series de temporais
para as series dos fatores a fim de gerar previsoes para a curva de juros de zero-cupom, (a esse respeito ver
Diebold et al. , 2006; Almeida et al. , 2008; Caldeira et al. , 2010). Alguns autores dedicaram atencao ao
segundo problema, por exemplo, (ver Christensen et al. , 2007, 2009; Laurini & Hotta, 2010).
Fama & Bliss (1987) propuseram uma metodologia para construcao da estrutura a termo via taxas
forwards estimadas para as maturidades observadas. O metodo consiste em sequencialmente construir as
taxas forwards necessarias para precificar sucessivamente tıtulos com maturidades mais longas, chamadas de
taxas forwards nao-suavizadas de Fama e Bliss. A taxa de juros a termo resultante deste procedimento e
uma funcao com saltos (descontınua) em relacao ao vencimento do tıtulo que esta sendo utilizado (ver Hagan
& West, 2005).
Embora os modelos parametricos sejam importantes ferramentas para a estimacao e previsao da curva
de juros americana, esses modelos apresentam performance preditiva menos interessante, quando analisado o
mercado brasileiro de curva de juros. Nesse sentido, acreditamos ser desejavel buscar e investigar alternativas
capazes de superar a performance preditiva desses modelos para o Brasil. Vamos considerar neste trabalho,
alem de parte dos modelos supracitados, duas formas alternativas de estimacao da curva de juros zero-
cupom brasileira: VAR bayesiano e modelagem ARFIMA. O primeiro estimador proposto, VAR Bayesiano,
e motivado pelo recente trabalho de previsao de curva de juros para a economia americana de Carriero et al.
(2012). A ideia aqui e investigar se o processo de analise dos dados, inerentes a metodologia bayesiana, e
capaz de trazer ganhos para a previsao de curva de juros para o caso brasileiro. Mais detalhes sobre essa
metodologia serao dados em secoes posteriores. Alem disso, propomos investigar a performance de modelos
da classe ARFIMA na previsao da taxa de juros. A intuicao para a utilizacao dessa classe de modelos para
o caso brasileiro reside no seguinte fato: a quase totalidade das maturidades, se observadas ao longo do
tempo, se comporta como um processo proximo ao random walk. Ou seja, cada maturidade certamente nao
3
e um processo da classe ARMA e tambem nao parece apresentar estrutura de autocorrelacao suficiente que
justifique a utilizacao de modelos da classe ARIMA. A ideia aqui e, portanto, abrir a possibilidade de que o
processo seja algo entre um processo I(0) (estacionario) e um processo I(1) (raiz unitaria).
Este trabalho, portanto, tem por objetivo investigar uma serie de metodos, a fim de contribuir para a
previsao da curva de juros zero-cupom da economia brasileira. O trabalho possui mais cinco secoes alem
desta introducao. Na secao seguinte definimos o objeto de estudo, qual seja, a curva de juros zero-cupom. Na
secao 3 descrevemos os modelos autorregressivos utilizados para fazer previsao da curva de juros; na quarta
secao, desenvolvemos a metodologia de metodos parametricos tradicionalmente usados em previsao para a
curva de juros. Na secao 5, a performance preditiva dos metodos parametricos citados e comparada com a
performance dos modelos autorregressivos. A secao 6 estabelece algumas conclusoes.
2. Estrutura a termo, conceitos e notacoes
Estrutura a termo da taxa de juros descreve a relacao entre as taxas de juros e tıtulos com diferentes ma-
turidades. A taxa de juros de curto prazo e a taxa de juros anualisada de um perıodo de tempo inifinitesimal.
Na pratica, entretanto, a taxa de juros para horizonte de tres meses e considerada uma melhor aproximacao
da taxa de curto prazo porque, por exemplo, emprestimos overnight sao afetados por fatores que os modelos
de estrutura a termo nao cobrem (Anderson & Sleath, 2001). Neste artigo definimos a taxa de juros de curto
prazo como:
rt = yt(0) = limτ→0
yt(τ)
onde t denota o momento no tempo, τ a maturidade e yt(τ) a correspondente taxa de juros. Seja Bt(τ) o
preco de um tıtulo zero-cupom no tempo t que paga $1.00 na maturidade, τ , e yt(τ) a correspondente taxa
de juros.
Bt(τ) = exp [−yt(τ)τ ] (1)
Rescrevendo a equacao (1) obtem-se uma forma de descrever a taxa de juros como uma funcao do valor
do tıtulo:
yt(τ) = −1
τlog(Bt(τ)). (2)
Desde que Bt(τ) e um fator de desconto simples, e claro que yt(τ) nao pode assumir valores negativos para
assegurar que o fator de desconto descrito em (2) assuma valores entre zero e um.
Na pratica, no entanto, surgem complicacoes, apesar de serem observados tıtulos negociados com dife-
rentes maturidades, a curva de juros nao e diretamente observada, muito menos curvas de juros zero-cupom
para vencimentos padronizados. Assim, a curva de juros deve ser estimada a partir dos precos dos tıtulos
observados. As taxas forward implıcitas sao definidas como taxas de retornos marginais que os investidores
requerem para manter tıtulos de diferentes maturidades. O conjunto de taxas forward instantaneas, f(u),
estao relacionadas aos precos de um tıtulo zero-cupom com maturidade τ , Bt(τ) por:
Bt(τ) = exp
[−∫ τ
0
f(u)du
](3)
A equacao (3) mostra que para medir estas taxas forwards diretamente do mercado requer um conjunto de
precos de tıtulos zero-cupom observaveis para um continuum de maturidades (a funcao de desconto). Na
4
pratica as funcoes de desconto nao sao diretamente observaveis – sao observados apenas os precos de tıtulos
com e sem cupons. No entanto, o preco observado de cada tıtulo pode ser escrito em termos desta funcao
de desconto. Fazendo ci denotar o fluxo de caixa de um tıtulo no tempo τi e n refere-se ao numero de
pagamentos restantes, o preco do tıtulo, P (ci, τi) i = 1, . . . , n, pode ser expresso como:
P (ci, τi) =
n∑i=1
ciB(τi) (4)
Juntamente com a equacao (3), isto mostra que ha uma relacao direta entre os precos dos tıtulos que
sao observados e as taxas forward instantaneas. Outras complicacoes surgem, entretanto, por que embora
sejam negociados tıtulos com diversas maturidades, nao sao observadas em cada perıodo de tempo yields
para maturidades padronizadas. Assim, as curvas de juros precisam ser estimadas a partir dos precos dos
tıtulos observados. Um abordagem amplamente usada para construcao de curvas de juros foi proposta por
McCulloch (1971, 1975), que modela a curva de desconto atraves de splines polinomiais.1
3. Previsao da Curva de Juros com Modelos Auto-regressivos
Nesta secao sao apresentados os dois modelos auto-regressivos, BVAR e ARFIMA, que sao a maior
contribuicao deste trabalho, por nao terem sido ate entao aplicados ao problema de previsao da curva de juros
brasileira. Alem disso, diferentes modelos auto-regressivos comumente considerados na literatura de previsao
de curva de juros sao apresentados. Sao eles randon walk e modelos lineares (modelos autorregressivos e
vetores autorregressivos).
3.1. Vetor Auto-regressivo Bayesiano (BVAR)
Considere o seguinte vetor autorregressivo:
yt = A + Byt−1 + εt, (5)
O modelo VAR acima pode ser escrito em uma notacao mais compacta, definido como um sistema de regressoes
multivariado:
YT×N
= XT×K
FK×N
+ ET×N
(6)
Onde Y = [yh+1, . . . , yT ]′, X = [X1, . . . ,XT ]
′com Xt =
[Y′t−1 . . . ,Y
′t−p,1,
], F = [Ah,Bh]
′e uma matriz
K×N contendo todos os coeficientes e E = [εh+1, . . . , εT ]′e a matriz de resıduos. Note que o vetor de taxas de
juros yt e regredido diretamente sobre yt−h, o que significa que e empregado um modelo diferente para cada
horizonte de previsao, abordagem direta, discutida anteriormente. Alternativamente pode ser empregada a
abordagem powering up.2 A abordagem direta implica que a previsao h-passos a frente e uma funcao linear
dos coeficientes: yt+h = Ah + Bhyt, enquanto na abordagem tradicional as previsoes multi passos a frente e
funcao nao-linear dos coeficientes estimados.
A confianca na prior e imposta definindo os momentos a seguir para a distribuicao a priori dos coeficientes:
1Para mais detalhes e aplicacoes deste metodo, ver Hagan & West (2006) e Hayden & Ferstl (2010).2Para uma discussao e comparacao destas abordagens alternativas ver, por exemplo, Marcellino et al. (2006), Carriero et al.
(2011) e Pesaran et al. (2011).
5
E[Bijh
]=
δi se i = j
0 se i 6= j, Var
[Bijh
]= θ
σ2i
σ2j
(7)
Assume-se que os coeficientes em Bijh tem prior independente e normalmente distribuıda. Finalmente, a
especificacao e concluıda assumindo que o intercepto Ah tem prior normal difusa e a matriz dos resıduos tem
prior Wishart invertida, Σ ∼ iW (v0, S0), em que v0 e S0 sao parametros de escala e forma da prior, onde
Σ = diag(σ2
1 , . . . , σ2N
).
Banbura et al. (2010) sugerem definir δi = 1 para todo i, refletindo a crenca de que todas as variaveis
sao caracterizadas por elevada peristencua. As taxas de juros, independente da maturidade, sao processos
que exibem elevada persistencia, portanto, nao e surpreendente que um modelo autorregressivo simples e
processos Random Walk sem drift produzem boas previsoes das taxas de juros. Assim, e razoavel supor que a
prior de cada taxa de juros em (6) siga um AR univariado com elevada persistencia, ou seja, E [B] = 0.99×I,
tambem e necessario avaliar o quao forte e a confianca na prior definindo uma variancia.
O hiperparametro θ controla a proximidade da prior em torno do random walk ou AR e governa a
importancia relativa da confianca na priori em relacao as informacoes contidas nos dados. Para θ → 0 a
posterior e igual a prior e os dados nao influenciam as estimativas. Se θ →∞, por outro lado, a expectativa
posterior coincide com as estimativas de OLS. Banbura et al. (2010) argumentam que θ devere ser escolhido
levando-se em conta o tamanho do sistema. A medida que o numero de variaveis aumenta o parametro deve
ser reduzido para evitar overfitting (ver, De Mol et al. , 2008).
Para operacionalizar a prior e preciso escolher o valor do hiperparametro θ. Assim como em Carriero
et al. (2012), neste trabalho o valor de θ e definido de forma a maximiaxar a densidade marginal que pode
ser obtida integrando para todos os coeficientes do modelo, i.e., definindo o conjunto de todos os coeficientes
do modelo como Θ, a densidade maginal e:
p(Y ) =
∫p (Y |Θ) p (Θ) dΘ (8)
Considerando a prior como uma distribuicao normal Wishart invertida a densidade p(Y ) pode ser computada
em forma fechada (ver Bauwens et al. , 2000). Em cada ponto do tempo θ e escolhido de forma a maximizar:
θ∗t = argθ
max ln p(Y ) (9)
Para a escolha do parametro θ e considerado um grid de valores, θ ∈ 2e−16, 4e−16, 6e−16, 8e−16, 1e−15, 0.00001,
0.0001, 0.001, 0.01, 0.1, 10. Como e estimado um modelo para cada horizonte de previsao, tambem e seleci-
onado um θ∗ otimo para cada horizonte. O valor otimo de θ∗ fica proximo a 0.001 para todos os horizontes
de previsao considerados, sendo que se o parametro for mantido fixo em 0.001 para toda a amostra os re-
sultados sao muito similares. O fator σ2i /σ
2j e um parametro de escala que leva em conta diferentes escalas
e variabilidade dos dados. O parametro de escala e definido de acordo com Carriero et al. (2012) igual a
variancia dos resıduos de um modelo autorregressivo univariado para as variaveis.
A distribuicao a priori normal invertida de Wishart pode ser escrita como:
vec (F) |Σ ∼ N (vec (F0) ,Σ⊗ Ω0) , e Σ ∼ iW (S0, α0) (10)
6
onde os parametros da prior F0 Ω0, S0 e α0 sao escolhidos de tal forma que a esperanca e variancia de F
coincidam com o previsto pela equacao (7), E[Fh] = F0 e Var[Fh] = Σ ⊗ Ω0. Em que a esperanca de Σ e
igual a matriz de covariancia dos resıduos e os elementos de Ω0 sao dados por Var[Bijh
]em (7). Como e
usada uma prior iW conjugada, a distribuicao posterior tambem sera normal Wishart invertida:
vec (F) |Σ ∼ N(F,Σ⊗ Ω
), Σ|Y ∼ IW (S, α) (11)
as barras denotam distribuicoes posteriores dos parametros. Definindo F e E como as estimativas de OLS,
tem-se que F =(Ω−1
0 + X′X)−1 (
Ω−10 F0 + X′Y
), Ω =
(Ω−1
0 F0 + X′X)−1
, α = α0 + T e S = F′X′XF +
F′0Ω−10 F0 + F0 + E ′E − F′Ω
−1F.
Para realizar inferencia e previsao e necessario a distribuicao posterior conjunta e as distribuicoes marginais
dos parametros F e Σ. Pode-se usar as posteriores condicionais em (11) como base de um algoritmo Gibbs
sampling que gera realizacoes a partir das condicionais Σ|Y e Fh|Σ,Y e produz uma sequencia de realizacoes
da distribuicao conjunta posterior, Fh|Σ,Y e posteriores da marginal Σ|Y e Fh|Σ,Y, bem como a distribuicao
posterior de qualquer funcao destes coeficientes (por exemplo, previsoes multi-passos). Caso o interesse seja
apenas pela distribuicao posterior de F (ao inves de qualquer funcao linear da mesma) existe uma alternativa
a simulacao, que e atraves da integracao de (11):
vec (F) |Y ∼ N(
vec(F),Ω−1, S, α
).3 (12)
O valor esperado desta distribuicao e dado por:
F =(Ω−1
0 + X′X)−1 (
Ω−10 F0 + X′Y
)(13)
que pode ser calculada facilmente. Lembrando que F e o estimador de OLS e usando as equacoes normais
(X′X)−1F = X′Y a equacao (13) pode ser reescrita como:
F =(Ω−1
0 + X′X)−1
(Ω−1
0 F0 + X′XF)
(14)
a qual mostra que a media posterior de F e uma media ponderada do estimador de OLS e da media a-priori
F0, sendo que os pesos sao proporcionais ao inverso de suas respectivas variancias. Quando θ → 0 a estimativa
posterior colapsa para F = F0, com uma prior difusa θ →∞ a estimativa posterior colapsa para a estimativa
irrestrita de OLS.
Dado a media posterior F =[A0,B0
]′, pode-se obter previsoes h-passos a frente atraves de:
Yt+h = Ah + BhYt (15)
Banbura et al. (2010) mostram que e possıvel implementar a prior descrita acima atraves de um conjunto
de observacoes dummy (para detalhes ver, Banbura et al. , 2010; Carriero et al. , 2012).
3Para uma derivacao desta equacao ver Carriero et al. (2012).
7
3.2. Modelos ARFIMA
Os modelos da classe ARFIMA se caracterizam como processos de memoria longa fracionalmente inte-
grados. A presenca de memoria longa pode ser definida de forma heurıstica em termos da persistencia das
autocorrelacoes observadas, como descrito em Baillie (1996). No caso da curva de juros do mercado brasileiro,
ao considerarmos a funcao de autocorrelacao referente a uma determinada maturidade, observada ao longo do
tempo, percebemos uma estrutura de autocorrelacao com decaimento lento. Tomando a primeira diferenca
do processo, o resultado e um processo com estrutura de correlacao as vezes semelhante a um processo white
noise ou a algum processo com autocorrelacao significativa, mas que nao se parece com um processo da
classe ARMA. Desse modo, modelar o processo original para cada maturidade atraves de modelos ARIMA
parece nao ser o mais correto. Por outro lado, parece haver estrutura de correlacao a ser modelada, de modo
que tratar a serie como um random walk pode resultar em perda de informacao. Ou seja, a distincao entre
modelos I(0) e I(1) para o objeto de estudo pode ser excessivamente restritivo e o processo ARFIMA, sendo
entendido como algo intermediario, pode gerar melhores previsoes.
Um processo da classe ARFIMA(p,d,q) pode ser definido como
βp(L)(1− L)dyt = αq(L)et,
onde L e o operador de defasagens; βp(L) =∑pj=0 βjL
j ; αq(L) =∑qj=0 αjL
j , com α0 = 1; βp(L)αq(L) 6= 0
para |L| ≤ 1 e et ∼ RB(0, σ2e) estacionario e invertıvel. Se −0, 5 < d < 0, 5 entao o processo yt e chamado
de um processo ARFIMA(p,d,q). Utilizamos nesse trabalho a funcao arfima do pacote forecast, presente
no software R para realizar a estimacao da ordem do processo e de seus coeficientes. A previsao foi feita a
partir da funcao forecast presente no mesmo pacote.
3.3. Random Walk (RW)
O primeiro e mais importante modelo competidor e o Random Walk (RW). As previsao do RW para a
taxa de juros de maturidade τ no tempo t+ h e dada por:
yt+h(τ) = yt(τ) (16)
Duffee (2002) e Diebold & Li (2006) mostraram que bater as previsoes do Random Walk para a curva de
juros e uma tarefa difıcil, portanto, neste trabalho as previsoes do RW e o benchmark em relacao ao qual
serao comparadas as previsoes de todos os demais competidores.
3.4. Modelos Autorregressivos Univariados (AR)
Tambem sao realizadas previsoes atraves de modelos autorregressivos univariados. Previsoes de tal pro-
cesso podem ser produzidas de duas formas alternativas. A primeira forma e conhecida como abordagem
powering-up. Nesta abordagem e estimado o seguinte modelo:
yt+h(τ) = α+ βyt+h−1(τ) + εt (17)
8
para a maturidade generica τ . A previsao um passo a frente e obtida por yt+1(τ) = α+ βyt+h−1(τ), enquanto
as previsoes para o horizonte de h-passos a frente sao obtidas por:
yt+h(τ) = α+ βyt+h−1(τ)
Alternativamente, pode-se usar a abordagem direta. Esta abordagem otimiza diretamente a funcao de perda
relevante, i.e., o Erro Quadratico Medio da Previsao h-passos a frente (MSFE) e provou ser mais robusta,
mas menos eficaz (ver, por exemplo, Marcellino et al. , 2006; Pesaran et al. , 2011; Carriero et al. , 2012).
O modelo a ser estimado e dado por:
yt(τ) = αh + βhyt−h(τ) + εt (18)
ou seja, a variavel no tempo t e projetada diretamente sobre seu valor no perıodo (t − h) de forma que os
coeficientes estimados sintetizam o efeito h-passos a frente. Note que diferentes valores para αh e βh sao
obtidos para cada horizonte de previsao. As previsoes sao derivadas como:
yt+h(τ) = ατh + βτhyt(τ) + εt (19)
Neste trabalho sao estimadas as duas abordagens, sendo rotuladas de AR(pu) e AR(di), respectivamente.
Note-se que para o horizonte de 1-passo a frente dos dois metodos produzem os mesmos resultados.
Uma questao relevante quando se trabalha com modelos autorregressivos e a escolha do tamanho do lag.
Os modelos descritos acima sao AR(1), mas em princıpio poderia ser empregada outra ordem de defasagem,
p. Tambem foram consideradas outras especificacoes dinamicas e foram re-estimados ambos os modelos AR
(com abordagem power-up e direta), sendo que o tamanho do lag foi por meio dos Criterio de Informacao
Bayesiano (BIC) e Akaike (AIC). A ordem de defasagem oscila entre 1 e 4, dependendo do perıodo de
tempo considerado, mas os resultados finais sao semelhantes aos obtidos com a especificacao AR(1), mais
simples. Portanto, sao apresentados apenas os resultados da especificacao AR(1), os demais resultados estao
disponıveis mediante solicitacao.
3.5. Vetores Autorregressivos (VAR)
As previsoes com modelos V AR sao produzidas de forma semelhante as previsoes dos modelos AR uni-
variados. Espeficamente, as previsoes atraves de V AR powering-up sao obtidas como segue. O modelo de
regressao e:
yt = A + Byt−1 + εt, (20)
onde yt = (yt(τ1), yt(τ2), . . . , yt(τN ))′. A previsao um passo a frente e produzida como yt = A + Byt−1,
enquanto que previsoes h-passos a frente sao obtidas como:
yt+h = A + Byt+h−1 (21)
No caso da abordagem direta as previsoes sao obtidas da seguinte forma. O modelo de regressao e:
yt = Ah + Bhyt−h + εt, (22)
9
onde yt = (yt(τ1), yt(τ2), . . . , yt(τN ))′. Note que diferentes matrizes Ah e Bh sao usadas para cada horizonte
de previsao. As previsoes sao derivadas como:
yt+h = Ah + Bhyt (23)
Sao considerados resultados para ambas as abordagens, rotulando-as de V AR(pu) e V AR(di), respectiva-
mente. Note que para horizonte de um passo a frente os dois metodos produzem o mesmo resultado. Tambem
foram consideradas outras especificacoes com maior ordem de defasagem, porem os resultados sao bastante
pobres e estao disponıveis mediante solicitacao.
4. Modelos Parametricos de Fatores para Previsao da Curva de Juros
Nesta secao apresentamos os modelos de fatores amplamente abordados na literatura de previsao da curva
de juros. O princıpio basico desses modelos esta na especificacao de uma funcao valor, que e definida sobre
todo o domınio das maturidades. Enquanto as varias abordagens nesta classe de modelos defendem diferentes
escolhas da funcao, compartilham a abordagem geral de que os parametros do modelo sejam determinados
atraves da minimizacao dos desvios quadrados dos precos observados em relacao aos teoricos. Nesta secao
sao apresentados alguns dos principais modelos parametricos para prever a curva de juros, conforme relatorio
do BIS (2005). Os modelos parametricos oferecem uma descricao conceitualmente simples e parcimoniosa da
estrutura a termo da taxa de juros.
4.1. Modelo de Nelson & Siegel
Nelson & Siegel (1987), propoem uma funcao parcimoniosa para modelar a taxa forward instantanea como
uma funcao, f(τ,b), de um vetor de parametros relativamente pequeno, b. Neste caso as taxas forward sao
definidas como:
ft(τ, β) = β1 + β2 exp
(−τλ
)+ β3
τ
λexp
(−τλ
)(24)
com o vetor de parametros a ser estimado b = (β1, β2, β3, λ). Estes parametros podem ser interpretadas
como sendo relacionados ao nıvel de longo prazo da curva de juros, a taxa de curto prazo, inclinacao da curva
de juros e uma curvatura na curva. A funcao ft(τ, β) tem caracterısticas desejaveis para capturar a forma
da estrutura a termo. Uma delas e a existencia dos limites da funcao ft(τ, β) para τ =∞ e para τ = 0, i.e.:
ft(τ, β)τ→∞
= β1
ft(τ, β)τ→0
= β1 + β2
Diebold & Li (2006) propuseram uma versao dinamica do modelo de Nelson & Siegel (1987) e alcancam bons
resultados em termos de previsao da curva de juros para fora da amostra. O ponto de partida e a seguinte
interpolacao da curva de juros:
yt(τ) = β1 + β21− e−λτ
λτ+ β3
(1− e−λτ
λτ− eλτ
)(25)
10
onde b = (β1, β2, β3, λ) sao os parametros. Diebold & Li (2006) interpretam a equacao (25) de uma forma
dinamica como um modelo de fatores latentes em que β1, β2 e β3 sao fatores de nıvel, inclinacao e curvatura
variantes no tempo e os termos que multiplicam estes fatores sao suas respectivas cargas:
yt(τ) = β1t + β2t1− e−λτ
λτ+ β3t
(1− e−λτ
λτ− eλτ
)(26)
Para as maturidades longas, as taxas a vista e forwards aproximam-se assintoticamente do valor β1, o qual
deve ser positivo. (β1 + β2) determinam o valor inicial da curva na maturidade zero. Assim, β2 representa o
desvio da assıntota β1. Alem disso, (β1 + β2) tambem deve ser positivo. Os dois parametros restantes β3 e
τ sao responsaveis pela curvatura. A magnitude da curvatura e dada pelo valor absoluto de β3, enquanto a
direcao e dada pelo sinal: um sinal negativo indica uma forma de U , enquanto um sinal positivo indica forma
de U invertido. τ , o qual tambem deve ser positivo, determina a posicao da curvatura.
4.2. Modelo de Svensson
Para melhorar a flexibilidade das curvas e o ajuste, Svensson (1994b) amplia o modelo de Nelson & Siegel
(1987) incluindo mais um parametro que pode ser interpretado como uma segunda curvatura. A precisao
extra e alcancada ao custo de adicionar mais dois parametros, β4 e τ2, os quais precisam ser estimados. A
curva de juros resultante e dada por:
yt(τ) = β1t + β2t
(1− e−λ1τ
λ1τ
)+ β3t
(1− e−λ1tτ
λ1τ− e−λ1τ
)+ β4t
(1− e−λ2τ
λ2τ− e−λ2τ
). (27)
Esta especificacao permite uma segunda curvatura na curva de juros. Assim, o metodo de Svensson
(1994b) e mais flexıvel e geralmente tem melhor ajuste que o modelo de Nelson & Siegel (1987), com o custo
de ser menos parcimonioso. Um potencial problema de multicolinearidade no modelo de SV surge se os para-
metros de decaimento λ1 e λ2 assumem valores similares. Para contornar o problema de multicolinearidade,
Pooter (2007) propoe substituir o ultimo termo em (27), i.e, − exp −τλ2por − exp −2τ
λ2. Esta especificacao e
chamada aqui de modelo de Svensson ajustado.
4.3. Modelo de Tres Fatores de Bliss
Uma segunda opcao para tornar o modelo de Nelson-Siegel mais flexıvel e obtida relaxando a restricao
de que os componentes de inclinacao e curvatura sao governados pelo mesmo parametro de decaimento λ.
Bliss (1997) estima a estrutura a termo da curva de juros atraves de um modelo com tres fatores, similar ao
modelo de Nelson-Siegel, mas que permite dois parametros de decaimento diferentes, λ1 e λ2. A curva de
juros resultante e dada por:
yt(τ) = β1t + β2t1− e−λ1τ
λ1τ+ β3t
(1− e−λ2τ
λ2τ− eλ2τ
)(28)
Obviamente, o modelo de Bliss sera diferente do modelo de Nelson-Siegel apenas se λ1 6= λ2.
4.4. Procedimentos de estimacao
A abordagem mais direta e amplamente usada para estimacao dos fatores e parametros dos modelos (26),
(27) e (28) consiste em um procedimento de duas etapas (Diebold & Li, 2006). Na primeira etapa, a equacao
11
da curva de juros e tratada como um modelo cross section e e empregado o metodo de mınimos quadrados
para estimar os fatores para todos os perıodos de tempo individualmente. Na segunda etapa, a dinamica
dos fatores e especificada e ajustada por modelos de series de tempo. Para simplificar o procedimento de
estimacao, Diebold & Li (2006) sugerem reduzir o vetor de parametros para b = (β1, β2, β3) fixando o valor
de λt em um valor especificado a priori, o qual e mantido fixo, ao inves de trata-lo como um parametro
desconhecido. Almeida et al. (2008), propoem o uso de quatro regras para determinar o valor do parametro
de decaimento, em que para cada uma delas o parametro e otimizado com base no horizonte de previsao
desejado.
O primeiro passo do procedimento de estimacao produz series de tempo dos valores estimados para cada
um dos K fatores; βi,tTt=1, para i = 1, . . . ,K. O proximo passo e estimar a dinamica dos fatores da
equacao dos estados. Para cada especificacao do modelo e estimado um modelo AR(1) para cada fator ou,
alternativamente, modela-se a dinamica dos fatores atraves de um V AR(1).
A escolha dos parametros de decaimento para os modelos de Nelson-Siegel e Svensson e restrita ao intervalo
entre 0.04 e 0.5, pois estes valores correspondem ao peso maximo para a curvatura da estrutura a termo na
maior (48 meses) e na menor (6 meses) maturidade da base de dados, respectivamente. Seguindo estas
restricoes, constroi-se o conjunto Φ = 0.04 + 0.001j491j=1. Dado λj ∈ Φ e a correspondente matriz de
pesos dos fatores Λ(λj) e, baseado neles, o vetor de fatores bt e estimado por OLS em cada perıodo t. O
parametro de decaimento escolhido λ ∈ Φ e o que minimiza a raız da soma do erro quadratico medio. Mais
especificamente, λ e escolhido de forma a minimizar a diferenca entre as taxas de juros obtidas pelo modelo,
y, e as taxas observadas, y. O problema de otimizacao pode ser apresentado como:
λ = argminλ∈Φ
√√√√ 1
TN
T∑t=1
N∑i=1
(yt(τi)− yt(τi, λ,bt|t−1)
)2onde T e o numero de curvas de juros na amostra.
Nos modelos de Svensson e Bliss o problema e similar, com a diferenca de que neste caso e necessario
encontrar dois parametros (λ1, λ2) do conjunto Θ = (λι1, λι2)|λ1 ∈ Φ, λ2 ∈ Φ. Assim, (λ1, λ2) resolvem o
seguinte problema:
(λ1, λ2
)= argmin
(λ1,λ2)∈Θ
√√√√ 1
TN
T∑t=1
N∑i=1
(yt(τi)− yt(τi, λ1, λ2,bt|t−1)
)2.
5. Dados, Metodologia de Previsao e Analise Fora da Amostra
5.1. Descricao dos Dados
A base de dados empregada aqui consiste das taxas diarias de fechamento dos contratos de DI-futuro
negociados na BM&F. As maturidades constantes foram computadas atraves do metodo Cubic Splines. A
tabela 1 resume algumas estatısticas descritivas da curva de juros para o perıodo. Alguns fatos estiliazados
comuns a dados de curvas de juros estao claramente presentes: a curva media da amostra e positivamente
inclinada e concava, volatilidade e decrescente com a maturidade e as autocorrelacoes sao altas. Outro ponto
a destacar e que mesmo se tratando de um perıodo amostral nao muito longo, percebe-se ampla variacao entre
as taxas mınimas e maximas para todas as maturidades, refletindo o comportamento da polıtica monetaria
12
no perıodo. As tres ultimas colunas trazem as autorrelacoes com defasagens de 1, 5 e 21 dias uteis, observa-se
tambem que as taxas de juros para maturidades mais curtas exibem maior persistencia para os tres nıveis de
defasagens analisados, o que esta de acordo com a literatura relacionada ao tema.
Tabela 1: Estatısticas descritivas da curva de juros brasileira. Perıodo Amostral 2007:01 - 2010:12.
Maturidade τ Media Std. Dev. Skew Kurt Min Max ρ(1) ρ(5) ρ(21)
Meses
1 10.80 1.64 8.51 14.13 0.169 1.957 0.999 0.996 0.9673 10.82 1.65 8.58 14.34 0.220 2.006 0.999 0.997 0.9696 10.88 1.67 8.59 14.52 0.264 2.071 0.999 0.997 0.9689 10.94 1.69 8.58 14.69 0.306 2.132 0.999 0.996 0.96712 11.09 1.72 8.61 15.32 0.386 2.241 0.999 0.995 0.96115 11.34 1.73 8.73 16.04 0.495 2.373 0.998 0.992 0.95018 11.60 1.72 8.99 16.40 0.572 2.461 0.998 0.989 0.93821 11.85 1.68 9.35 16.92 0.655 2.565 0.997 0.986 0.92524 12.04 1.61 9.55 17.12 0.718 2.659 0.996 0.982 0.91127 12.21 1.55 9.79 17.26 0.805 2.815 0.995 0.979 0.89430 12.33 1.49 10.06 17.44 0.912 3.026 0.995 0.975 0.87733 12.43 1.45 10.27 17.62 1.005 3.290 0.994 0.972 0.85936 12.50 1.41 10.42 17.78 1.085 3.586 0.993 0.968 0.84339 12.60 1.32 10.71 17.83 1.281 4.180 0.992 0.961 0.81442 12.68 1.24 11.09 17.93 1.465 4.910 0.990 0.955 0.788
Nota: Esta tabela apresenta estatısticas descritivas das taxas de juros diarias para diferentes maturida-des. A tres ultimas colunas contem autocorrelacoes com defasagem de um dia, uma semana e um mes,respectivamente.
A figura 1 mostra o grafico das series temporais para o conjunto de maturidades empregadas e ilustra
como o nıvel da curva de juros e spread variam substancialmente ao longo do perıodo amostral. Por exemplo,
o ultimo ano da amostra usado para analise das previsoes fora da amostra e caracterizado por elevacao das
taxas de juros, principalmente para as maturidades mais curtas, que respondem mais diretamente a polıtica
de elevacao de juros implementada pelo Banco Central no primeiro semestre de 2010. Nota-se tambem que
nao apenas o nıvel da estrutura a termo flutua ao longo do tempo, mas tambem a inclinacao e curvatura. A
curvatura assume varios formatos, desde formas suaves a formas invertidas, tipo S.
Outra caracterıstica observada nos dados da curva de juros utilizados e a rejeicao da hipotese nula de
normalidade para toda a amostra, devido a assimetria positiva e excesso de curtose. Alem disso, alguns fatos
estilizados na literatura a respeito de curvas de juros sao tambem observados, como o fato de que curvas de
juros normalmente sao positivamente inclinadas, as taxas de juros para as maturidades mais curtas sao mais
volateis e apresentam maior persistencia.
5.2. Medidas Estatısticas de Performance
A fim de avaliar as previsoes, e empregado o erro quadratico medio das previsoes (MFSE). Seja yMt+h(τ)
a previsao de yt+h(τ) obtida pelo modelo M. O Erro Quadratico Medio de Previsao (MFSE) do modelo
13
Figura 1: Term-Structure Dynamics over Time
Note: This figure details the evolution of the term structure of interest rates over 1972:01-2000:12. Weexamine monthly data, constructed using the unsmoothed Fama-Bliss method. The maturities we showare 3, 6, 9, 12, 15, 18, 21, 24, 30, 36, 48, 60, 72, 84, 96, 108 and 120 months. Panel A presents a3-dimensional plot, Panel B provides time-series plots for selected maturities..
M para a previsao da taxa de juros de maturidade τ para o horizonte h e:
MSFEMτ,h =1
T −K∑(
yMt+h(τ)− yt+h(τ))2
(29)
em que a soma e calculada sobre todas as previsoes (T − K) produzidas. A acuracia das previsoes sao
avaliadas em termos erro quadratico medio das previsoes relativos ao Random Walk :
RMSFEMτ,h =MSFEMτ,hMSFERWτ,h
(30)
Para dar uma ideia do nıvel absoluto dos erros e facilitar a comparacao com outros estudos sao apresentados
tambem a Raiz do Erro Quadratico Medio do Random Walk, i.e.,√MSFERWτ,h . Como e padrao na literatura,
os resultados sao apresentados em termos de taxas de juros percentuais anualizadas. Por exemplo, um
RMSFE de 0.26 indica um erro de 26 pontos base na previsao da taxa de juros anualizada.
Para avaliar se as previsoes de dois modelos concorrentes sao diferentes estatisticamente significantes e
empregado o teste de Diebold & Mariano (ver, Diebold & Mariano, 1995; McCracken, 2007) para testar
a acuracia das previsoes. As previsoes geradas por cada modelo sao comparadas com aquelas obtidas com
o Random Walk. Seja dini=1 uma funcao das diferencas dos erros quadraticos das previsoes obtidas pelo
modelo M e pelo Random Walk. A o valor de di e calculado como:
di(yMt+h(τ)− yt+h(τ)
)2 − (yRWt+h (τ)− yt+h(τ))2
(31)
14
As variaveis yMt+h(τ) e yRWt+h (τ) sao as previsoes no tempo t, h-passos a frente do modeloM e Random Walk,
respctivamente. Diebold & Mariano (1995) propuseram um teste para checar se o diferencial de perda medio
di = 1n
∑ni=1 di e estatisticamente diferente de zero, o qual e definido por:
DM =d√δn
d−→ N(0, 1) (32)
onde δ e uma estimativa da matriz de covariancia de longo prazo de di. Neste trabalho sao empregadas as
estimativas de δ de Newey & West (1987), as quais permitem controlar para a presenca de correlacao serial
nos erros de previsao.
5.3. Previsoes fora da amostra
Nas subsecoes seguintes descrevemos o exercıcio de previsao implementado nesse estudo. As previsoes
sao realizadas atraves de um esquema rolling window e sao considerados os seguintes horizontes de previsao
h = 1, 5, 21, 63, 126, i.e, diario, semanal, mensal, trimestral e semestral. Seja κ a origem de previsao, isto e,
o momento no tempo no qual uma iteracao de previsao e implementada. O esquema de previsao recursiva
consiste em estimar os parametros aumentando recursivamente origem da previsao de κ = K = 500 ate
κ = T −h. No esquema de previsao rolling window, a janela fixa de tamanho K = 500 que termina na origem
de previsao e comeca no tempo κ − K + 1 e sequencialmente atualizada.4 Sao utilizadas 15 maturidades
na estimacao (τ = 1, 3, 4, 6, . . . , 30, 36, 42 e 48 meses). O ultimo ano da amostra e usado para analise das
previsoes fora da amostra.
A abordagem para fazer previsao da curva de juros com os modelos da classe Nelson-Siegel consiste em
fazer previsoes dos fatores, e entao usar os fatores previstos para ajustar previsoes da curva de juros. As
previsoes no tempo t, para t+ h, da taxa de juros com maturidade τ , sao dadas por:
yt+h|t(τ) = β1,t+h|t + β2,t+h|t
(1− e−λτ
λτ
)+ β3,t+h|t
(1− e−λτ
λτ− e−λτ
).
As previsoes dos fatores sao obtidas atraves de processos AR e VAR.
Na tabela 2 apresentamos o RMSE para as previsoes para diversos horizontes de previsao. Algumas
caracterısticas merecem destaque. Para previsao um passo a frente, percebe-se uma melhor performance dos
modelos VAR(pu), ARIMA, ARFIMA, BVAR e DL(VAR) para maturidades mais curtas (ate 9 meses). Para
as demais maturidades, os modelos AR(pu) e AR(di) apresentam melhor performance. E importante notar
que, para horizonte de 1-passo a frente, e sabido na literatura a dificuldade para se superar a performance
do random walk. Para previsao cinco passos a frente, percebe-se uma performance destacada do modelo
BVAR para maturidades mais curtas (ate 9 meses). Para previsao vinte e um passos a frente, percebe-se
uma melhor performance do modelo BVAR para as maturidades 1 e 3 meses; uma performance destacada
do modelo de fatores SV(AR) para as maturidades de 6-meses ate a maturidade de 33-meses. Vale tambem
ressaltar a performance consistente do modelo ARFIMA nesse caso. Para horizonte de 3 meses, destacam-se
4Note-se que K = 500 equivale a cerca de 2 anos de dados. Foram considerados outros tamanhos de janela, mas os resultadospermanecem qualitativamente semelhantes.
15
Tabela 2: Erro Quadratico Medio Relativo, Base de Dados de DI-FuturoPerıodo 2010:01 - 2010:12.
Nota: A Tabela contem os Erros Quadraticos Medios das Previsoes relativos ao Random Walk obtidas usando cada um dos modelos competi-dores para horizontes de 1- e 5- passos a frente, 1-, 3- e 6- meses a frente. O perıodo de avaliacao vai de 2010:01 a 2010:12. Para o RandomWalk e apresentado o erro quadratico medio das previsoes (RFMSE). Os modelos competidores considerados sao modelos lineares estimadoscom abordagens direta e powering-up (AR(pu), AR(di), VAR(pu) e VAR(di), VAR Bayesiano (BVAR), modelos de Diebold & Li e Svenssoncom dinamica dos fatores modelada por AR e VAR). Os asteriscos indicam o nıvel ao qual o teste de Giacomini & White (2006) rejeita ahipotese nula de igualdade na acuracia das previsoes (∗, ∗∗ e ∗∗∗ significam rejeicao ao nıvel de 10%, 5% e 1%, respectivamente).
Maturidade 1- 3- 6- 9- 12- 15- 18- 21- 24- 27- 30- 33- 36- 42- 48-Mes Meses Meses Meses Meses Meses Meses Meses Meses Meses Meses Meses Meses Meses Meses
Horizonte: 1-passoa frente
RW (Root 0.04 0.04 0.04 0.05 0.05 0.05 0.06 0.06 0.06 0.06 0.07 0.07 0.08 0.08 0.08blaMSFE)AR(pu) 1.03 1.03 1.02 1.01 1.00 1.00 1.00 0.99 0.99 0.99 0.99 0.99 0.99 0.99 0.99AR(di) 1.03 1.03 1.02 1.01 1.00 1.00 1.00 0.99 0.99 0.99 0.99 0.99 0.99 0.99 0.99VAR(pu) 0.95 0.96 0.97 1 1.03 1.04 1.05 1.07 1.08 1.08 1.07 1.06 1.07 1.06 1.03VAR(di) 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1ARIMA 0.96 0.97 0.97 0.97 0.99 1.01 1.01 1.00 1.01 1.01 1.01 1.01 1.00 1.00 1.00ARFIMA 0.96 0.95 0.97 0.98 1.01 1.02 1.01 1.02 1.00 1.00 1.00 1.00 1.00 1.01 1.01BVAR 0.93 0.94 0.96 0.98 1.00 1.01 1.01 1.01 1.01 1.01 1.01 1.01 1.00 1.00 1.00DL(AR) 3.78 1.65 2.13 2.49 1.92 1.1 1.34 1.77 1.88 1.74 1.56 1.22 1.08 1.55 1.92DL(VAR) 0.95 0.94 0.96 0.98 1 1.01 1.02 1.02 1.02 1.02 1.02 1.02 1.01 1.01 1.01SV(AR) 1.18 1.47 1.32 1.17 1.14 1.06 1.06 1.02 1.06 1.13 1.06 0.99 1.03 1.05 1.03SV(VAR) 1.21 1.39 1.30 1.26 1.15 1.06 1.08 1.08 1.07 1.11 1.07 1.00 1.01 1.02 1.05Horizonte: 5-passosa frente
RW (Root 0.10 0.11 0.12 0.14 0.15 0.15 0.15 0.15 0.15 0.16 0.16 0.17 0.17 0.18 0.18blaMSFE)AR(pu) 1.10 1.09 1.06 1.04 1.01 1.00 0.99 0.99 0.99 0.99 0.99 0.99 0.99 0.99 0.99AR(di) 1.09 1.08 1.06 1.04 1.01 1.01 1.00 0.99 0.99 0.99 0.99 0.99 0.99 0.99 0.99VAR(pu) 1.06 1.07 1.05 1.05 1.03 1.03 1.03 1.03 1.02 1.02 1.02 1.02 1.02 1.02 1.02VAR(di) 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1ARIMA 0.87 0.88 0.91 0.95 0.97 0.99 1.00 1.01 1.01 1.01 1.00 1.02 1.00 1.00 1.00ARFIMA 0.88 0.86 0.92 0.95 0.96 0.99 0.99 1.01 0.98 0.99 0.99 0.99 0.99 1.00 1.01BVAR 0.78 0.83 0.88 0.95 1.01 1.04 1.04 1.04 1.03 1.03 1.02 1.02 1.02 1.02 1.02DL(AR) 1.71 0.91 1.04 1.15 1.06 0.99 1.08 1.19 1.19 1.11 1.08 1.01 1.02 1.17 1.30DL(VAR) 1.12 1.11 1.09 1.07 1.06 1.05 1.05 1.06 1.06 1.05 1.05 1.05 1.05 1.04 1.04SV(AR) 1.12 1.00 0.99 0.96 0.97 0.99 0.98 0.98 0.99 0.99 0.96 0.96 1.04 1.09 1.11SV(VAR) 1.09 1.12 1.15 1.13 1.05 1.03 1.04 1.06 1.05 1.04 1.03 1.00 1.01 1.01 1.03Horizonte: 21-passosa frente
RW (Root 0.31 0.31 0.33 0.37 0.38 0.36 0.35 0.34 0.33 0.34 0.34 0.34 0.34 0.35 0.34blaMSFE)AR(pu) 1.21 1.19 1.15 1.09 1.04 1.01 0.99 0.98 0.98 0.97 0.96 0.97 0.96 0.97 0.97AR(di) 1.14 1.13 1.10 1.06 1.01 0.99 0.97 0.96 0.96 0.95 0.95 0.95 0.95 0.96 0.97VAR(pu) 1.22 1.22 1.20 1.18 1.15 1.15 1.13 1.12 1.12 1.10 1.09 1.09 1.08 1.08 1.09VAR(di) 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1ARIMA 0.83 0.82 0.88 0.96 0.97 1.00 0.99 1.03 1.06 1.02 0.99 1.03 1.00 0.99 1.00ARFIMA 0.87 0.77 0.85 0.91 0.93 0.97 0.98 1.00 0.97 0.97 0.96 0.97 0.96 0.97 0.98BVAR 0.52 0.69 0.78 0.90 1.00 1.08 1.12 1.13 1.12 1.11 1.10 1.09 1.08 1.08 1.08DL(AR) 1.04 0.77 0.79 0.85 0.88 0.95 1.02 1.07 1.07 1.01 1.00 0.99 1.00 1.07 1.13DL(VAR) 0.65 0.70 0.78 0.91 1.02 1.08 1.15 1.22 1.26 1.24 1.26 1.28 1.27 1.27 1.27SV(AR) 1.01 0.70 0.70 0.71 0.74 0.77 0.79 0.85 0.89 0.89 0.92 0.96 1.11 1.23 1.34SV(VAR) 1.20 1.11 1.11 1.12 1.10 1.15 1.16 1.16 1.15 1.10 1.08 1.04 1.05 1.07 1.12Horizonte: 3-mesesa frente
RW (Root 0.77 0.77 0.79 0.80 0.76 0.69 0.63 0.58 0.53 0.53 0.52 0.51 0.5 0.51 0.51blaMSFE)AR(pu) 1.39 1.36 1.32 1.24 1.12 1.04 0.97 0.94 0.91 0.89 0.90 0.90 0.92 0.94 0.96AR(di) 0.99 0.96 0.94 0.88 0.82 0.78 0.76 0.76 0.77 0.78 0.79 0.83 0.90 0.96 1.01VAR(pu) 1.44 1.45 1.43 1.41 1.41 1.41 1.4 1.40 1.40 1.37 1.33 1.31 1.26 1.22 1.20VAR(di) 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1ARIMA 1.06 1.06 1.09 1.13 0.97 1.02 1.00 1.08 1.06 1.08 0.99 1.02 1.00 1.00 1.00ARFIMA 1.15 1.03 1.03 0.92 0.88 0.88 0.89 0.91 0.86 0.86 0.86 0.88 0.91 0.94 0.96BVAR 0.61 0.69 0.74 0.83 0.95 1.06 1.06 1.14 1.24 1.24 1.26 1.31 1.26 1.22 1.20DL(AR) 0.82 0.75 0.73 0.71 0.71 0.77 0.84 0.92 0.97 0.97 1.00 1.06 1.10 1.10 1.06DL(VAR) 0.63 0.69 0.74 0.83 0.95 1.07 1.23 1.46 1.63 1.59 1.59 1.67 1.65 1.62 1.58SV(AR) 1.11 1.05 1.01 0.94 0.93 0.97 1.02 1.04 1.05 0.99 0.94 0.95 0.97 1.03 1.06SV(VAR) 1.33 1.39 1.37 1.31 1.27 1.31 1.37 1.42 1.45 1.39 1.35 1.33 1.25 1.22 1.21Horizonte: 6-mesesa frente
RW (Root 1.26 1.26 1.26 1.26 1.21 1.14 1.03 0.9 0.77 0.69 0.67 0.64 0.54 0.54 0.55blaMSFE)AR(pu) 2.01 1.93 1.86 1.71 1.44 1.23 1.05 0.92 0.81 0.72 0.72 0.73 0.82 0.92 0.98AR(di) 2.59 2.33 2.16 1.84 1.48 1.22 1.09 1.04 1.08 1.09 1.03 1.08 1.34 1.42 1.45VAR(pu) 0.82 0.84 0.85 0.87 0.95 1.02 1.14 1.32 1.55 1.68 1.69 1.8 2.22 2.21 2.17VAR(di) 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1ARIMA 1.54 1.41 1.44 1.45 1.23 1.36 1.32 1.07 1.09 1.08 0.99 1.00 1.00 0.99 1.00ARFIMA 1.39 1.23 1.29 1.05 0.89 0.73 0.66 0.57 0.51 0.52 0.56 0.62 0.79 0.92 0.98BVAR 0.72 0.80 0.82 0.85 0.93 0.99 0.83 0.72 0.71 0.72 0.80 0.93 1.16 1.25 1.10DL(AR) 0.93 0.89 0.89 0.87 0.81 0.76 0.74 0.74 0.75 0.77 0.76 0.77 0.90 0.97 1.01DL(VAR) 2.15 1.92 1.81 1.61 1.33 1.08 0.87 0.75 0.73 0.72 0.80 0.94 1.21 1.31 1.29SV(AR) 1.15 0.97 0.9 0.82 0.82 0.88 0.96 1.05 1.14 1.19 1.15 1.16 1.32 1.32 1.26SV(VAR) 1.84 1.97 2.04 2.02 1.89 1.77 1.73 1.76 1.85 1.87 1.77 1.72 1.73 1.55 1.39
16
os modelos BVAR e DL(VAR) para maturidades curtas (1 a 9-meses); para maturidades intermediarias e
longas, destaque para o modelo ARFIMA. Para horizonte h = 6 meses, esse padrao se repete. Novamente
destaque para o modelo BVAR para maturidades curtas (1 a 9-meses) e performance destacada para o modelo
ARFIMA para maturidades intermediarias e longas.
De modo geral, podemos perceber que o estimador BVAR e os modelos de fatores apresentaram perfor-
mance interessante para maturidades mais curtas, superando o random walk em diversas situacoes. Ja o
estimador ARFIMA e os modelos AR foram interessantes para previsao de maturidades intermediarias e lon-
gas, superando o random walk a partir do horizonte de 21 passos a frente. Em comparacao com a literatura
de previsao de curva de juros americana, percebe-se uma performance relativamente pobre do modelos de
fatores quando considerado o objetivo de previsao da curva de juros brasileira. Para o Brasil, os modelos
auto-regressivos (BVAR, ARFIMA e AR) mostraram-se mais uteis do que os modelos de fatores. Isso sugere
uma que mais pesquisa deve ser conduzida na tentativa de um modelo que descreva mais razoavelmente o
formato e dinamica da curva de juros brasileira.
6. Conclusao
Neste trabalho investigamos a performance preditiva da estrutura a termo da taxa de juros para o caso
do Brasil a partir de diversos modelos existentes na literatura de financas. Consideramos neste trabalho
os populares modelos de fatores e, alem disso, introduzimos dois estimadores alternativos que ainda nao
haviam sido aplicados para previsao de curva de juros no Brasil. Um deles e o estimador Bayesian VAR,
recentemente proposto por Carriero et al. (2012) e aplicado a previsao de curva de juros do EUA. Alem
disso, consideramos modelos da classe ARFIMA, sob o argumento de que tratar a serie temporal para uma
determinada maturidade como I(0) seria falso, mas tambem trata-la como I(1) poderia ser sobremaneira
restritivo. Como resultado pratico, para a amostra considerada, vimos que os modelos de fatores, populares
na previsao de curva de juros, tem papel relevante para previsao de maturidades mais curtas, mas nao
constituem opcao interessante para as demais maturidades. Isso ilustra uma certa peculiaridade da curva de
juros brasileira em relacao a curva de juros americana, visto que os modelos de fatores se mostram bem valiosos
para previsao desta. Isto posto, vimos que o estimador BVAR se mostrou bastante relevante para previsao
de maturidades mais curtas. Os modelos ARFIMA e AR se destacaram para maturidades intermediarias e
longas. Portanto, a performance destacada de modelos auto-regressivos vis-a-vis modelos de fatores sugere
que mais investigacoes sao necessarias, a fim de se estabelecer um modelo que descreva bem a curva de juros
para o Brasil.
17
Referencias
Almeida, Caio, & Vicente, Jose. 2008. The role of no-arbitrage on forecasting: Lessons from a parametric
term structure model. Journal of Banking & Finance, 32(12), 2695–2705.
Almeida, Caio, Gomes, Romeu, Leite, Andre, & Vicente, Jose. 2008. Movimentos da Estrutura a
Termo e Criterios de Minimizacao do Erro de Previsao em um Modelo Parametrico Exponencial. Revista
Brasileira de Economia, 62(4), 497–510.
Anderson, Nicola, & Sleath, John. 2001 (Mar.). New estimates of the UK real and nominal yield
curves. Bank of England working papers 126. Bank of England.
Ang, Andrew, & Piazzesi, Monika. 2003. A no-arbitrage vector autoregression of term structure dyna-
mics with macroeconomic and latent variables. Journal of Monetary Economics, 50(4), 745–787.
Baillie, Richard T. 1996. Long memory processes and fractional integration in econometrics. Journal of
Econometrics, 73, 5–59.
Banbura, Marta, Giannone, Domenico, & Reichlin, Lucrezia. 2010. Large Bayesian vector auto
regressions. Journal of Applied Econometrics, 25(1), 71–92.
Bauwens, Luc, Lubrano, Michel, & Richard, Jean-Francois. 2000. Bayesian Inference in Dynamic
Econometric Models. Oxford University Press.
BIS. 2005 (Oct.). Zero-coupon yield curves: technical documentation. BIS Papers 25. Bank for International
Settlements (Monetary and Economic Department).
Bjork, T., & Christensen, B.J. 1999. Interest Rate Dynamics and Consistent Forward Rate Curves.
Mathematical Finance, 9, 323–348.
Bliss, Robert R. 1997. Testing term structure estimation methods. Advances in Futures and Options
Research, 9(1), 197–231.
Caldeira, Joao F., Moura, Guilherme V., & Portugal, Marcelo S. 2010. Efficient Yield Curve
Estimation and Forecasting in Brazil. EconomiA, 11(1), 27–51.
Carriero, Andrea, Kapetanios, George, & Marcellino, Massimiliano. 2011. Forecasting large
datasets with Bayesian reduced rank multivariate models. Journal of Applied Econometrics, 26(5), 735–
761.
Carriero, Andrea, Kapetanios, George, & Marcellino, Massimiliano. 2012. Forecasting govern-
ment bond yields with large Bayesian vector autoregressions. Journal of Banking & Finance, 36(7),
2026–2047.
Christensen, Jens H. E., Diebold, Francis X., & Rudebusch, Glenn D. 2009. An arbitrage-free
generalized Nelson-Siegel term structure model. Econometrics Journal, 12, 33–64.
Christensen, Jens H.E., Diebold, Francis X., & Rudebusch, Glenn D. 2007. The affine arbitrage-
free class of Nelson-Siegel term structure models. Tech. rept.
18
Christensen, Jens H.E., Diebold, Francis X., & Rudebusch, Glenn D. 2011. The affine arbitrage-
free class of Nelson-Siegel term structure models. Journal of Econometrics, 164(1), 4–20.
Clark, Todd E., & McCracken, Michael W. 2009. Improving Forecast Accuracy By Combining
Recursive And Rolling Forecasts. International Economic Review, 50(2), 363–395.
Cochrane, John H., & Piazzesi, Monika. 2005. Bond Risk Premia. American Economic Review, 95(1),
138–160.
Cox, John C, Ingersoll, Jonathan E, Jr, & Ross, Stephen A. 1985. A Theory of the Term Structure
of Interest Rates. Econometrica, 53(2), 385–407.
Dai, Qiang, & Singleton, Kenneth J. 2002. Expectation puzzles, time-varying risk premia, and affine
models of the term structure. Journal of Financial Economics, 63(3), 415–441.
de Jong, Frank. 2000. Time-series and Cross-section Information in Affine Term Structure Models. Journal
of Business and Economic Statistics, 18(1), 300–314.
De Mol, Christine, Giannone, Domenico, & Reichlin, Lucrezia. 2008. Forecasting using a large
number of predictors: Is Bayesian shrinkage a valid alternative to principal components? Journal of
Econometrics, 146(2), 318–328.
Diebold, F. X., & Mariano, R. 1995. Comparing Preditive Acuracy. Journal of Business and Economic
Statistics, 13, 253–263.
Diebold, Francis X., & Li, Canlin. 2006. Forecasting the term structure of government bond yields.
Journal of Econometrics, 130(2), 337–364.
Diebold, Francis X., Piazzesi, Monika, & Rudebusch, Glenn D. 2005. Modeling Bond Yields in
Finance and Macroeconomics. American Economic Review, 95(2), 415–420.
Diebold, Francis X., Rudebusch, Glenn D., & Borag[caron]an Aruoba, S. 2006. The macroeco-
nomy and the yield curve: a dynamic latent factor approach. Journal of Econometrics, 131(1-2), 309–338.
Duffee, Gregory R. 2002. Term Premia and Interest Rate Forecasts in Affine Models. Journal of Finance,
57(1), 405–443.
Duffie, D., & Kan, R. 1996. A Yield-Factor Model of Interest Rates. Mathematical Finance, 6(4), 379–406.
Egorov, Alexei V., Li, Haitao, & Ng, David. 2011. A tale of two yield curves: Modeling the joint term
structure of dollar and euro interest rates. Journal of Econometrics, 162(1), 55–70.
Fama, Eugene F, & Bliss, Robert R. 1987. The Information in Long-Maturity Forward Rates. American
Economic Review, 77(4), 680–92.
Favero, Carlo A., Niu, Linlin, & Sala, Luca. 2007. Term Structure Forecasting: No-arbitrage Restric-
tions vs. Large Information Set. Tech. rept.
Ferraty, F., & Vieu, P. 2006. Nonparametric functional data analysis: theory and practice. 1st edn.
19
Filipovic, Damir. 2009. Term-Structure Models: A Graduate Course. Springer Finance.
Giacomini, Raffaella, & White, Halbert. 2006. Tests of Conditional Predictive Ability. Econometrica,
74(6), 1545–1578.
Hagan, P., & West, G. 2005. Interpolation schemes for curve construction. Applied Mathematical Finance.
Hagan, P., & West, G. 2006. Interpolation methods for curve construction. Applied Mathematical Finance,
13(2), 89–129.
Hayden, Josef, & Ferstl, Robert. 2010. Zero-coupon yield curve estimation with the package termstrc.
Journal of Statistical Software, 36(i01), 1–34.
Heath, David, Jarrow, Robert, & Morton, Andrew. 1992. Bond Pricing and the Term Structure of
Interest Rates: A New Methodology for Contingent Claims Valuation. Econometrica, 60(1), 77–105.
Ho, TSY, & Lee, S.B. 1986. Term Structure Moevements and the Pricing of Interest Rate Contingent
Claims. The Journal of Finance, 41, 1011–1029.
Hull, John, & White, A. 1990. Valuating Derivative Securities Using the Explicit Finite Difference
Method. The Journal of Financial and Quantitaive Analysis, 25, 87–100.
Hordahl, Peter, Tristani, Oreste, & Vestin, David. 2006. A joint econometric model of macroeco-
nomic and term-structure dynamics. Journal of Econometrics, 131(1-2), 405–444.
Laurini, Marcio P., & Hotta, Luiz K. 2010. Bayesian extensions to diebold-li term structure model.
International Review of Financial Analysis, 19, 342–350.
Marcellino, Massimiliano, Stock, James H., & Watson, Mark W. 2006. A comparison of direct
and iterated multistep AR methods for forecasting macroeconomic time series. Journal of Econometrics,
135(1-2), 499–526.
Matzner-Lober, Eric, & Villa, Christophe. 2004. Functional Principal Component Analysis of the
Yield Curve. In: 21th International Conference AFFI. Association Francaise de Finance.
McCracken, M. W. 2007. Asymtoptics for out of sample tests of Granger Causality. Journal of Econome-
trics, August, 719–752.
McCulloch, J Huston. 1971. Measuring the Term Structure of Interest Rates. Journal of Business, 44(1),
19–31.
McCulloch, J Huston. 1975. The Tax-Adjusted Yield Curve. Journal of Finance, 30(3), 811–30.
Monch, Emanuel. 2008. Forecasting the yield curve in a data-rich environment: a no-arbitrage factor-
augmented VAR approach. Journal of Econometrics, 146(1), 26–43.
Nelson, Charles R., & Siegel, Andrew F. 1987. Parsimonious Modeling of Yield Curves. The Journal
of Business, 60(4), 473–489.
20
Newey, Whitney K, & West, Kenneth D. 1987. A Simple, Positive Semi-definite, Heteroskedasticity
and Autocorrelation Consistent Covariance Matrix. Econometrica, 55(3), 703–08.
Pearson, Neil D, & Sun, Tong-Sheng. 1994. Exploiting the Conditional Density in Estimating the Term
Structure: An Application to the Cox, Ingersoll, and Ross Model. Journal of Finance, 49(4), 1279–1304.
Pesaran, M. Hashem, & Timmermann, Allan. 2007. Selection of estimation window in the presence of
breaks. Journal of Econometrics, 137(1), 134–161.
Pesaran, M. Hashem, Pick, Andreas, & Timmermann, Allan. 2011. Variable selection, estimation
and inference for multi-period forecasting problems. Journal of Econometrics, 164(1), 173–187.
Pooter, Michiel De. 2007 (June). Examining the Nelson-Siegel Class of Term Structure Models. Tinbergen
Institute Discussion Papers 07-043/4. Tinbergen Institute.
Ramsay, J.O., & Silverman, B.W. 1997. Functional Data Analysis. 1st edn.
Svensson, Lars E. O. 1994a (Sept.). Estimating and Interpreting Forward Interest Rates: Sweden 1992-
1994. IMF Working Papers 94/114. International Monetary Fund.
Svensson, Lars E. O. 1994b (Sept.). Estimating and Interpreting Forward Interest Rates: Sweden 1992-
1994. IMF Working Papers 94/114. International Monetary Fund.
Vasicek, Oldrich. 1977. An equilibrium characterization of the term structure. Journal of Financial
Economics, 5(2), 177–188.
21