基于APF算法的贝叶斯金融厚尾MSSV模型研究Word文档下载推荐.docx

上传人:b****7 文档编号:22646665 上传时间:2023-02-05 格式:DOCX 页数:23 大小:29.33KB
下载 相关 举报
基于APF算法的贝叶斯金融厚尾MSSV模型研究Word文档下载推荐.docx_第1页
第1页 / 共23页
基于APF算法的贝叶斯金融厚尾MSSV模型研究Word文档下载推荐.docx_第2页
第2页 / 共23页
基于APF算法的贝叶斯金融厚尾MSSV模型研究Word文档下载推荐.docx_第3页
第3页 / 共23页
基于APF算法的贝叶斯金融厚尾MSSV模型研究Word文档下载推荐.docx_第4页
第4页 / 共23页
基于APF算法的贝叶斯金融厚尾MSSV模型研究Word文档下载推荐.docx_第5页
第5页 / 共23页
点击查看更多>>
下载资源
资源描述

基于APF算法的贝叶斯金融厚尾MSSV模型研究Word文档下载推荐.docx

《基于APF算法的贝叶斯金融厚尾MSSV模型研究Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《基于APF算法的贝叶斯金融厚尾MSSV模型研究Word文档下载推荐.docx(23页珍藏版)》请在冰豆网上搜索。

基于APF算法的贝叶斯金融厚尾MSSV模型研究Word文档下载推荐.docx

具有重要的意义.

MSSV模型中具有两个潜在变量,分别为波动

变量和状态变量,它们反映了观测序列中的有效信

息.由于模型中潜在变量的存在以及模型在状态空

间的非线性结构,使得无法得到模型的解析形式.

随着计算机技术的发展,抽样模拟技术越来越成熟,

状态空间为非线性非高斯的模型估计成为可能.在

贝叶斯方法的基础上,发展了两种应用广泛的抽样

仿真技术,一种是马尔可夫链蒙特卡洛方法

(MarkovChainMonteCarlomethod,简称MCMC),

Gibbs抽样方法是其中最简单也是应用最广泛的一

种抽样方法,然而Gibbs抽样方法对模型和参数的

设定有较大的依赖性,且不适用于在线数据(on—

linedata).

针对在线数据的时变性以及序贯特点,发展了

另外一种抽样模拟技术,即序贯马尔可夫方法(Se—

quenti~MarkovChain,简称SMC)oDoucet和de—

Freitas等深入讨论了SMC方法的理论和应用,特

别介绍了其中应用较广的粒子滤波算法J.为了

克服一般粒子滤波算法具有的退化现象,Pitt和

Shephard引入了辅助变量粒子滤波算法(Auxiliary

收稿日期:

2009—04—15;

修复日期:

2009—07—08

基金项目:

国家自然科学基金项目《随机波动预测模型的贝叶斯分析及其在金融领域中研究》(70771038);

教育部人文社

会科学规划项目《时间序列计量经济模型的贝叶斯分析及其应用研究)(063AglO001)

作者简介:

朱慧明(1966一),男,湖南湘潭人,教授,博士生导师,研究方向:

贝叶斯计量经济模型;

郝立亚(1983一),女,河北邯郸人,博士生,研究方向:

金融工程与风险管理.

3

ParticleFilter,简称APF)并应用于SV模型的波动

估计,显示了该算法相对于其他模拟型算法的优越

性并且指出该算法具有对异常点的优秀探测能

力【9J9.Liu和West提出使用参数后验分布的核密

度估计作为更新粒子的重要性密度函数,以保证估

计的收敛性,从而解决了APF算法的参数估计问

题[1oI.

粒子滤波方法在国内也得到了广泛的关注和研

究,杨小军和潘泉等在Bayes框架内分析了序贯重

要性采样原理,总结了粒子滤波器发展过程中的各

种改进策略和新变种,讨论了粒子滤波器在各个领

域的应用及进展[11].卢发兴,吴玲对比分析了卡

尔曼滤波和粒子滤波各自的优缺点,为实际应用中

算法的选择提供依据[12J.而对于APF算法,目前

只有程水英和张剑云采用该算法解决空对海BO—

TMA中的非线性滤波问题,并通过仿真实验说明其

具有良好的非线性滤波估计性能u.

本文主要研究厚尾MSSV模型,将厚尾分布设

定为t分布,构建MSSV—t模型,采用APF算法估

计模型参数,预测波动及潜在波动状态,通过自由度

的变化与MSSV模型进行比较分析.在仿真分析

的基础上,对中国上证综指股价波动进行实证研究,

证明基于APF算法的MSSV—t模型在潜在波动

状态的预测及突发事件的探测方面具有优良性质,

同时具备提高波动预测精度的能力.

二,模型结构分析

Taylor于1986年指出,波动过程的原动力是经

济突发事件而不是价格的走势[¨

].在此基础上,

Shephard定义了SV模型的一般表达形式为[]:

fyt=exp(7Jt/2)e,£f~i.i.N(0,1)

(1)

【vt=口+触一l+,qt~i.i.aN(O,-C2)

(2)

其中,Yt为t时刻的观测变量,为波动的对数形

式,且与条件独立.£和为误差项,且分别服

从方差为1和r的独立正态分布.口和J9代表波动方

程中的参数项.

在一般SV模型的基础上,令S代表潜在波动

状态,其状态空间定义为{1,2,…,H},设其服从转

移概率为P舀=Pr(&

:

IS卜l=i)的一阶马尔可

夫过程.在波动方程的截距项中引入服从一阶马尔

可夫过程的状态变量S,将一般SV模型的式

(2)转

化为式(3)的形式,与式

(1)共同组成MSSV模型的

般表达式.

4

~ot=+£一1十r/t,r/t~N(0,r)(3)

此处,r/t互相独立同分布.由于金融时间序列存在

波动的群集性特征,MSSV模型在刻画突发事件对

波动的影响方面优于一般SV模型.然而该模型在

刻画金融时间序列其他特性时具有诸多局限,如对

新息的正态性假设使得对风险管理尤为重要的一些

极端点被忽略,从而成为该模型的一个主要缺

陷[16].考虑到厚尾分布对极端值的描述能力,令观

测方程的新息服从t分布,构建了MSSV—t模型,

可以克服一般MSSV模型对极端点的拟和失效问

题.同时,由于t分布以自由度为中介与正态分布相

联系,通过选取不同的自由度,可以不断逼近正态分

布,从而对MSSV—t模型和MSs,,模型进行对比研

究.

MSSV—t模型主要描述波动的波动聚集性和

厚尾特征,模型的基本形式如下:

f(I)~(Yt10,ev,)

【(£J7.1卜.1,Sf)~N(£laj+£一1,r)

t=1,2,…,丁(4)

其中(Yt10,eVt)代表一个t分布的密度函数,定

义为

(Ytl0,ev,)

(1+;

xp(Vt)))r(/2)~/

torexp()…一~

(5)

此处S代表潜在波动状态,它直接影响波动水平参

数的取值,而的取值决定波动的水平进而表

现为观测值的变化,这是该模型的作用机理.参数卢

反映了波动的持续性,LamoLlreux和Lastrapes指出

正是由于对不同波动水平聚集性的忽略使得对的

估计存在高估的可能[17].Carlos和Hedibert对西班

牙股票市场的实证分析中指出在随机波动模型中引

入服从马尔可夫转换的状态变量可以使得对值的

估计小于一般模型的估计值,从而展现了该模型的

优越性[儒].故值的估计精度从一定程度上可以作

为评判模型优劣的一个重要指标.代表t分布的自

由度,选取t分布作为厚尾特征的刻画分布主要是

由于t分布可以通过自由度与正态分布产生联系,

即当,c一00,t分布即为正态分布.在实际操作中,

=

30时则可以近似服从正态分布.利用这一关系,

可以对MSsV—t模型和MSSV模型进行对比研究.

为了方便起见,假设代表模型中的潜在变

量,即=(&

),其他参数均表示为.对该模型

朱慧明,郝立亚,曾惠芳:

的分析也即对波动变量和状态变量的预测以及参数

的估计.估计参数时,采用Hamilton的方

法[],将转化成式(6)所示的形式:

=1+(6)

此处&

gt;

0,J:

=2,3,…,h,为示性函数,当

S≥时,=1,否则,/j=0.由于参数在取值

范围上的限制,故对其进行估计时,将其转化为

log(p/(1一P的形式.

三,APF算法设计

随着金融业和计算机信息技术的发展,金融市

场上的时间分割越来越小,信息反应越来越灵敏,这

造就了大量的在线数据.对于时变的市场状况,利

用MCMC算法进行估计时,每次运算都基于整体数

据,这无论在运算量上还是在灵敏度上都达不到实

际操作的要求.Carlos和Hedibert也在其研究中指

出,由于在实践过程中往往需要根据最新信息做出

即时的判断引,故基于整体数据的统计方法在实践

应用中总是失效的.然而,SMC算法基于序贯分析

的思想,当接收到新的数据时,可以及时反映到模型

中并提取其中的有效信息,对模型参变量进行更正

估计.因此该方法较MCMC方法具有灵敏度高,运

算量小,估计精确等优点,具有较高的实践意义.

作为SMC中的一种重要算法,APF算法可以

用来估计类似MSSV-t模型的非线性非高斯状态

空间模型,其核心思想是粒子权重的不重复抽样.

对于模型的未知参数0,一个常规的处理方法是将

其视为潜在变量,但是由于参数对于时间变化的

固定性会使得粒子权重产生退化现象.APF算法

借助于一个辅助变量来实现粒子权重的不重复抽

样,有效地克服了退化问题.

当观测值yt+1已知时,给定粒子集合{z,,

;

},利用Chapman—Kolmogorov方程和蒙特卡洛

近似方法,可以得到如下潜在变量和参数的联合后

验分布的形式:

p(sct+1,Ot+1I1:

l+1)

声(+】IXt+1,Y1:

£;

)p(x£+I'

+】IY1:

p(+1I1:

屯+1;

+1)p(xH1I+1,l:

)P(+1I1:

(M+1JJ:

£)

OC(+1IXt+1;

+1)p(x£+1I+I'

1:

£)(+1Iyl:

N

∑(+lI+1;

+1)p(sc+1I五i,Ot+1)N(+1Imi,f=1

b)(7)

最后一步的结果采用Liu和West的高斯转移密

度函数定义方法[,以保证估计的收敛性,防止参

数估计过程中的高度分散.其中

∑硼

(一)

(一)

=口+(I—a)Ot

∑砌

为t时刻第i个粒子的权重,a和b均为超参数值.

设g∈{1,2,…,N}为辅助变量,用来实现粒子权

重的不重复抽样,则包括辅助变量的联合后验分布

的形式如下:

p(x£+1,Ot+1,glyl:

£+1)

=P(+1If+1)(z+1J西,+1)(+1Jmf,

b)(8)

而重要性密度函数的形式为

q(xf+1,Ot+l,glYl:

t+1)=P(yt十1Ig+1;

mf)p(Xt+1I西,+1)N(Ot+1Im,b)(9)

根据重要性密度函数更新权重,得到新的权重

形式为:

i∞

p(+1Ii+1;

+1)户(+1I,+1)N(+1Im,6v)

p(+1I1;

m)p(+1I,+1)N(+IIm,b2)

(10)

P(+1I1;

mf)

针对MSSV—t模型,假设已经得到初始化的粒

子集{z,,}1,设计出如下APF算法进行模型

拟合分析.

步骤1计算各参数初始粒子均值以及波动

分布参数和{m}..

步骤2计算下一时点的状态中问变量

+1}1和波动中间变量{;

+1}l,此处i+1=

S

t+.+,s+船(St+ls;

).

步骤3按如下的抽样方法,依次更新{g},

{+1}l,{汁i1}1和{i+1}l:

1.从辅助变量分布P(=z)OCP(yt+1I+1,

m)中抽取{}l,其中z∈1,2,…,忌

2.从参数高斯后验分布N(,6.)中抽取

{+.}.

3.从转移概率后验分布P(i+1I.)中抽取

5

{i+}1.

4.从潜在波动变量后验分布N(口++1,

(Z.2)1)中抽取{i+1}l.

步骤4更新粒子权重{川i}.,更新方法为

?

.c

Pm(+1I1;

步骤5重复步骤1~4步,直到训练完所有的

观测值.

四,仿真分析

注意到t分布与正态分布的特殊关系,即当t

分布的自由度趋于无穷大时,可以近似服从正态分

布,因此可以采用不同自由度的值进行对比分析,从

个新的角度对基于APF算法的MSSV—t模型

和一般MSSV模型进行模型比较.为了具有对比

性,采用的是Carlos和Hedibert【18J,ROberto【7J以及

S0和Lain等[0]所共同采用的一组参数值进行数据

模拟,参数值见表1.首先模拟1000个样本量,在

采用APF的方法迭代时,每次迭代取1000个粒子

值.假设状态变量服从二阶马尔可夫过程.超

参数口=0.824,b=0.566.超参数的选取以及所有

参数的先验分布均符合Jeffrey先验分布准则.

首先对自由度为2的典型MSSV—t模型进行

基于APF算法的波动预测及参数估计.图1描述

了模拟数据的状态变量S的真实值,图2综合了观

测数据和波动的预测数据.两个图形对比可以看

出,由于状态变量S的变化是观测数据波动的主要

原因,故两者的变化保持一致,而通过APF方法得

到的波动估计值基本可以反映这种内在的一阶马尔

可夫过程.

状态真实值

0200400600800l000

观测样本量

图1模拟数据的状态变量St图

APF方法一个主要优点即在于它可以克服一

般粒子滤波普遍存在的退化现象.衡量退化现象的

个重要的指标为有效样本量ESS,计算ESS的公

式为:

N(11)

此处W为更新后的样本权重.采用式(11)计

算MSSV—t模型的有效样本量,结果如图3所示.

显然,对于每次迭代所抽取的有效粒子绝大部分都

保持在800以上,故该方法有效地克服了粒子退化

问题.

图2模拟的观测数据和波动的估计值U~图

U2004006008001000

图3APF算法估计MSSV—t模型的

有效样本量图

利用APF算法对自由度分别为2,8,15,30的

四个MSSV—t模型进行参数估计,表1给出了各

个模型参数的真实值以及APF算法估计值.由于

t分布和正态分布的特殊关系,当自由度取30时,

可以近似认为是正态分布.

表1四组模拟数据的APF参数估计值表

容易看出,随着自由度取值的增大,a1,2等参

数的估计值较接近真实值,而参数的估计值反而

越来越偏离真实值,并且正向高估.参数卢在随机

波动类模型中描述波动的持续性.对于金融时序数

据,条件异方差模型和随机波动模型的拟合都显示

出了高度的波动持续性,即值趋近于1.Lam—

oureux和Lastrapes在1990年的研究中指出由于拟

合模型对波动过程中结构差异的忽略会导致这种波

动的高度持续性存在着高估的可能,MSSV模型的

提出正是基于这一思路u'

.本文通过对MSSV模

型进行拓展,采用APF方法进行模型估计,模拟结

果指出对于厚尾数据的拟合采用MSSV—t模型可

以更为精确的对波动持续性参数卢进行估计,从而

更为合理地解释高频数据的波动特征.

值得说明的是,对于自由度为2的厚尾数据,

APF方法对波动的预测较为平缓,这是由对马尔可

夫状态变量的估计偏差造成,但是总体上依然可以

观测样本量(df=2)

反映状态变量的转移变化.图4列出APF方法对

不同自由度的厚尾数据的波动估计值以及相应的真

实值.可见除了自由度为2的极端厚尾分布,APF

方法基本上可以捕捉到信息的变化,并通过状态变

量的一阶马尔可夫过程反映为波动的变化,对于突

发事件引起的异常变化具有良好的过滤筛选能力.

o200400600800looo

观测样本量(df=8)

020*********

观测样本量(df=30)

图4不同自由度模拟数据的波动估计值及真实值图

五,实证研究

采用MSSV—t模型来拟合中国上证综指的股

价波动,运用APF方法进行波动预测和潜在状态变

量以及相关其他参数的估计.数据样本的选取为

2002年1月4日至2008年11月21日,共1664个

观测值.在此区间,中国股市经历了多次熊市和牛

市之间的转变,而其中的一些重大突发事件如汶川

大地震以及美国次贷危机的发生都会造成股价的剧

烈波动.由于股票市场上存在不同水平的波动的聚

集现象,故可采用两阶段马尔可夫潜在状态变量来

描述这种高水平的波动和低水平的波动的聚集.此

外,大量的历史数据表明中国股市具有明显的尖峰

厚尾的特性,可将MSSV模型推广为MSSV—t模

型来拟合中国股市的股价波动.采用APF算法对

该模型进行估计,波动的预测值和观测时间序列的

对比图如图5所示,容易看出,该模型估计得到的波

动值与观测时间序列的变化具有一致性,可以反映

其内在的波动特征.图6直观给出对潜在状态变量

的估计图以及对应于观测时间序列的区间段,潜在

状态变量将波动状态进行了具体的划分,并且该划

分对英语观测时间序列的波动情况具有相合性.表

2对观测时间序列的各个区间段的标志事件进行了

说明,由此可见,基于APF算法的MSSV—t模型

在区分波动的潜在状态方面具有优良的性质,从而

可以准确地刻画波动的特征.

1/4/o21/2/o31/2/o41/4/o51/4/o61/4/o71/2/o8l1/21/o8

观测时间

图5上证综指观测数据和波动的预测值图

上证综指

观测时问

状态援嗣值

图6模型潜在状态预测图

为了进一步说明MSSV—t模型对波动的预测

精度,提取处于第二状态阶段的2006年10月至

2008年11月,对应实际情况对其波动预测值进行

7

研究.与中国宏观形势的强劲走势保持同步,从

2006年7月开始至2007年12月,中国股票市场得

到了飞速的发展,2007年上证综指最高点较年初上

表2各区间段中国股市标志事件表

时间事件

2002年6月国有股减持停止

2002年12月中国QFII制度正式启动

2003年4月卫生部举行新闻发布会公布非典情况

2005年5月股权分制改革启动

2005年11月新证券法颁布,中小企业完成全流通

2..6年.月裹兽詈为全球最大P0在沪

涨2倍,沪深总市值突破30万亿.对于诸如股票市

场的风险投资而言,高收益意味着高风险,而高风险

的内因就是高水平的波动特征.在2007年的牛市

行情之下,宏观调控成为影响股指波动的重要原因.

如2007年5月30日,财政部宣布,即日起将证券交

易印花税上调至0.3%,沪深股市该日跌幅达6%以

上,两市跌停的个股超过900只.2007年年末,随

着房贷新政出台,准备金第十次提高,第六次加息.

上证综指12月18日下跌至4812.16点,大盘近两

个月的调整幅度为21.97%,超过了"

5?

30"

21.47%的调整幅度.进入2008年以来,随着美国

经济的持续衰退,全球金融市场状况不断恶化,加之

自然灾害等突发事件的影响,也使得这一期间内中

国股市处于高水平的波动状况.如2008年1月23

alpha1

日,美联储紧急降息75个基点;

5月1213,四川汶

川县发生7.8级灾难性地震,余震波及全国,至晚问

统计死伤人数8000余人;

9月8日,两房被美国政

府全面接管,次贷危机进一步升级等.这些突发事

件对中国股市的波动影响均在图7中有所体现.

图7上证综指波动预测与大事件对比图

由此可见,采用基于APF算法的MSSV—t模

型可以较好地拟合上证综指的样本数据,能准确把

握由于突发事件而引起的波动的变化,对不同潜在

状态的转移进行了有效的区分和刻画,在提高波动

的预测精度方面具有一定的现实意义.

采用APF方法估计模型的参数,各参数的后验

估计值及90%置信区间如图8所示.其中,波动持

续性参数卢的估计值为0.778,低于其他文献中趋近

于1的估计值,这说明由于模型的选择与估计方

法的配置使得估计精度有所提高,一定程度上避免了

对于波动的过高估计.第一个状态的内部转移概率

11为0.889,接近于1,从而保证了模型和方法的有

效性.自由度的估计值为5,更加印证了该样本数

据的厚尾特征,也说明了采用该模型的合理眭.

log(pll/(1-P..))

图8模型各参数的后验估计值及90%置信区间图

对该模型的APF算法退化情况进行评估,结果

如图9所示.从有效样本量的集中程度可以判断该

方法没有明显的退化现象,可以进行有效的估计.

8

六,结论

基于APF算法,通过对四个不同自由度的

图9模型的有效样本量图

MSSV—t模型潜在状态的预测及参数估计,表明了

对于厚尾数据的拟合采用MSSV—t模型可以更为

精确的估计波动持续性参数,从而较合理地解释

金融时序数据的波动特征,因此证明了MSsV—t

模型较MSSV模型在估计波动持续性方面更加有

参考文献:

效.此外波动真实值和估计值的比较也说明采用

APF方法基本上可以捕捉到信息的变化,并通过状

态变量的一阶马尔可夫过程反映为波动的变化,对

于突发事件引起的异常变化具有良好的过滤筛选能

力.而对中国上证综指的股价波动的实证分析验证

了股票时序数据的厚尾特征,并修正了波动持续性

参数的估计值,进一步证明了基于APF算法的

MSSV—t模型在对潜在波动状态的预测及突发事

件的探测方面的优良性质,对提高波动预测精度具

有一定的现实意义.由于研究的MSSV—t模型只

是厚尾MSSV模型的一种形式,对于其他分布形式

如stable分布是否也具有信息筛选及修正估计波动

持续性参数方面的优良性质有待进一步的研究.

[1]JacquierE,PolsonN,RossiP.Bayesiananalysisofstochasticvolatilitymodels[J].JournalofBusinessandEconomic

Statistics,1994,12(4):

371—417.

[2]KimS,ShephardN,ChibS.Stochasticvolatility:

likdihoodinfer

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 幼儿教育 > 家庭教育

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1