当yt来自子样本集合Y1,没有限制的密度函数是:
(4)
在这里
是标准正态分布密度函数.
当yt来自子样本集合Y2,具有下限的密度函数是:
(5)
在这里
是标准正态分布函数.
当yt来自子样本集合Y3,具有上限的密度函数是
(6)
因此,最后得到Tobit-GARCH模型似然函数:
(7)
同理,可以得到Tobit-AR-GARCH模型似然函数
(8)
而
。
最终,我们可以得到Tobit-AR-GARCH模型对数似然函数
(9)
根据(9),从而得到
.
为了最大化对数似然函数(9),我们让其一阶导数为0,并且起二阶导数小于0。
根据
和
,可以得到
(10-1)
(10-2)
(10-3)
(10-4)
(10-5)
最大似然估计受参数的初始值影响很大(JianqingFan&QiweiYao2005),为了使得到的估计值稳定,笔者利用贝叶斯方法进行参数估计。
(11)
最大似然方法估计参数,根据(10-1)至(10-5)得到估计值,尤其当
是负定矩阵,则根据(10-1)至(10-5)式求出的参数是最大似然估计值。
贝叶斯方法估计参数,同理根据(11)得到估计值。
虽然贝叶斯方法和最大似然方法在样本量足够大的时候效果相似,但是通常大部分的数据量不满足大样本要求,此时用贝叶斯的效果更好。
数据描述统计
中国实施股改政策,股改前后机构投资者在市场中的比重不同,股改后原来的法人股东与流通股东的利益趋于一致,上市公司的投资价值提高,所有的股东行为趋于理性。
因此,笔者随机选用股改后的股票数据——华能国电(600027),其数据来自大智慧。
华能国电股改实施从2006年8月1日,笔者选取该日期以后的股票收盘价数据,共746个。
图12006年8月1至2009年8月28日华能国电(600028)股票日价格
如图1显示,该股票价格波动较大,从开始日价格2元到2007年7份11元左右,随后跌到6元附近,而后在2007年10月攀升至近12元,此后开始下跌。
根据中国股市不超过10%的涨跌停限制,对746个数据进行统计,其中有5次下跌幅度超过10%,9次上涨超过10%。
且其中有1次是连续两天下跌,从2007年5月31日的11.09元到下个交易日的9.98元,接着到下一个交易日的8.97元。
如果股市没有涨跌限制,这次下跌一次到位就是8.80元,因为这样限制使得信息一次不能表达完全而后继续表达。
对这些数据进行描述性统计分析,见表1:
表1数据描述性统计量
统计量
统计值
统计量
统计值
统计量
统计值
均值
5.618
中位数
5.08
偏度
0.546
标准差
2.308
众数
2.25
峰度
-0.627
方差
5.327
变异系数
41.08
极差
9.76
笔者对数据进行正态分布检验,结果拒绝原假设。
同时根据表1利用峰度和偏度联合检验得到统计量为5.93,p值0.025,结论一致也不是正态分布,表明该数据不是正态分布。
GARCH模型建立及其估计
(1)ARCH效应检验
表2Q和LM统计量的ARCH效应检验
滞后阶数
Q统计量
P值
LM统计量
P值
1
707.3482
<.0001
703.0430
<.0001
2
1369.7064
<.0001
703.3330
<.0001
3
1987.2217
<.0001
703.3703
<.0001
4
2558.2074
<.0001
703.5258
<.0001
5
3090.5553
<.0001
703.7360
<.0001
6
3595.4626
<.0001
704.2999
<.0001
7
4076.8086
<.0001
704.3111
<.0001
8
4536.0123
<.0001
704.3210
<.0001
9
4972.3297
<.0001
704.3875
<.0001
10
5389.7849
<.0001
704.5401
<.0001
11
5780.4558
<.0001
705.2277
<.0001
12
6144.2289
<.0001
705.2287
<.0001
根据表2显示,Q统计量和LM统计量的p值都小于0.0001,得知ARCH效应非常强,ARCH模型很适合处理这批数据。
(2)建立ARCH模型
(12)
在忽视tobit现象时,笔者通过AIC,AICC准则建立AR
(1)-GARCH(1,1)t分布模型,该模型的AIC,AICC分别为-1255.13,-1255.04,值较小其对数似然为632.56比较大。
根据表3显示,其相应的参数也比较显著。
表3忽视tobit现象的AR-GARCH模型参数估计
参数
自由度
估计值
标准差
T值
P值
参数标签
1
-1.0014
0.000935
-1071.0
<.0001
1
0.000757
0.000373
2.03
0.0424
1
0.3818
0.0821
4.65
<.0001
1
0.7308
0.0318
22.95
<.0001
df
1
0.2837
0.0422
6.73
<.0001
T分布的自由度
虽然该类模型的R-square都为0.9983,参数比较显著。
但是数据本身不服从正态分布,与模型假设不符。
同时用其他模型得到的AIC,AICC值都很大同时对数似然比较小。
如:
用AR
(1)-GARCH(1,1)时,其对数似然为139.55,而AIC,AICC分别为-271.10和-217.04。
且在忽视tobit现象的时候,计算其自相关系数为0.9519,而用AR-GARCH中该系数为-1.0014,其绝对值大于1(p值<0.0001),与实际不符合。
因此,AR
(1)-GARCH(1,1)模型不适合该数据。
Tobit-AR-GARCH模型及其估计
Tobit-AR-GARCH模型
,
(13)
在不忽视tobit现象时,根据王军伟(2009)处理相关数据模型阶数确定的方法。
首先需要判断AR的阶数。
根据偏自相关系数图2,可以得到AR的阶数至少为1。
计算偏自相关系数应该落在
的区间为
,这时可以确定阶数大于2。
然后按照AR模型得到系数估计,只有AR
(2)参数能够通过检验,因此确定该阶数初始值为2。
根据k=min{[(1-c)k],[(1-d)k]},在这里取c=d=0.1,可以计算出k=1。
图2偏自相关系数和其图
然后,根据AR
(1)模型计算出残差取其平方后,类似与上面的方法可以得到GARCH模型的p和q。
由自相关系数图和偏自相关数图p和q同时取2,依据p=min{[(1-c)p],[(1-d)p]},q=max{[(1-c)q],[(1-d)q]},求出p=1,q=1。
于是可以确定该模型为Tobit-AR
(1)-GARCH
(1)。
利用最大似然估计方法对Tobit-AR
(1)-GARCH
(1)模型进行参数估计,见表4
表4考虑tobit现象的AR-GARCH模型参数估计
参数
自由度
估计值
标准差
T值
P值
a0
1
0.036396
0.016
2.267
0.0237
1
0.9943
0.0036
276.21
<.0001
1
8.51E-9
0
9999.9
0
1
0.8597
0.095557
4.65
<.0001
1
0.0002
0.00012
22.95
0.0776
根据表4显示,估计值不全部显著,比如a0的p值大于0.01,即使放宽以0.05为准则时,
的p值仍大于它不显著。
利用最大似然估计方法计算对数似然值为119.17,AIC值为-228.34,AICC为-228.245。
但是最大似然方法受其初始值的影响很大,有时候很快可以收敛,有时候却很慢,而且每次收敛值都不一样。
因此,选择利用经验贝叶斯进行估计,该方法可以利用先前研究的知识,且结果相较稳定。
表5贝叶斯估计的参数
参数
估计值
标准差
25%分位数
50%分位数
75%分位数
后验等尾区间(95%)
HPD区间(95%)
a0
4.2298
0.4878
3.9094
4.2338
4.5549
3.2622
5.1739
3.2630
5.1741
0.1506
0.1146
0.0739
0.1513
0.2283
-0.0779
0.3730
-0.0753
0.3747
1.3159
0.9421
0.7347
1.0746
1.5852
0.3702
3.7511
0.2249
2.9913
0.8389
0.0643
0.8041
0.8469
0.8835
0.6910
0.9394
0.7180
0.9565
0.5388
0.1189
0.4667
0.5470
0.6219
0.2849
0.7466
0.3095
0.7638
选取DIC值作为评判模型好坏的标准。
DIC类似于AIC、AICC和BIC,但只有DIC可以用于样本非独立的模型。
利用贝叶斯方法进行参数估计得到的DIC值为1377.38。
由轨迹图显示图形非常稳定,说明markov链的均值是常数。
图3-1贝叶斯Tobit-AR
(1)-GARCH
(1)截距a0的诊断图
图3-2贝叶斯Tobit-AR
(1)-GARCH
(1)中AR系数
的诊断图
图3-3贝叶斯Tobit-AR
(1)-GARCH
(1)中GARCH的常数项
诊断图
图3-4贝叶斯Tobit-AR
(1)-GARCH
(1)中GARCH的arch系数项
诊断图
图3-5贝叶斯Tobit-AR
(1)-GARCH
(1)中GARCH的garch系数项
诊断图
图3-1到图3-5中,autocorrelation图显示贝叶斯估计过程中参数抽样的自相关性和有效性。
Posteriordensity图为单一模型后验边际分布。
图3-1到3-5的autocorrelation图都呈现指数型下降,表明在贝叶斯估计下MCMC是收敛的。
Posteriordensity图给出相关参数的光滑、单一模型后验分布。
而且Geweke收敛诊断等相关检验p值大于0.05,见表6。
表6Geweke诊断检验
参数
z统计量
p值
a0
1.9100
0.0561
0.0727
0.9420
1.3003
0.1935
0.1739
0.8620
-0.3804
0.7037
最后,利用后验预测分布对模型进行检验,具体方法见(AndrewGelman,J.B.Carlin,H.S.stern,andD.BRubin,2004),笔者检测了后验预测分布的四个指标,最大值(max),最小值(min),均值(mean)和标准差(sd),如图4。
图4后验预测分布
图4为观测值和四个统计量的p值,红线表示观测值的四个统计量。
如图所示,p值都大于0.01,可以认为预测值和观测数据相吻合,进一步验证利用贝叶斯估计Tobit-AR-GARCH模型的结果结合了先验信息且结果更加稳定、合理。
讨论
本文利用Tobit-AR-GARCH模型,给出贝叶斯估计参数的方法并与最大似然方法进行比较。
举例说明在涨跌限制下确定相关阶数的步骤,利用真实的数据进行分析,验证利用贝叶斯方法的可行性和可靠性。
涨跌停限制不仅股票市场有,国内商品、期货交易所和金融期货交易所均有上市品种的涨跌停板制度。
在国外部分交易所有的上市品种也有类似制度,比如CBOT的豆类以及COMEX的精铜。
现今美国次贷危机爆发引发世界性的经济危机,未来将会有更多的金融市场实施类似的限制,也意味着Tobit时间序列的数据会越来越多。
该模型的研究应运而生,是必要的且具有实际意义的,其可以应用到其他具有类似tobit数据分析中。
然而对于该模型还有很多问题没有得到探讨,如根据Tobit-AR-GARCH模型进行预测,向量化Tobit-AR-GARCH模型来研究多个这类时间序列的方法等。
参考文献
Ma,Christopher,K.R.RameshP.andS.R.Stephen(1989),Volatilitypriceresolutionandtheeffectivenessofpricelimits,JournalofFinancialServicesResearch,3,165-199.
KimK.A,Rhee1S.G.(1997)Pricelimitperformance:
evidencefromtheTokyostockexchange,JournalofFinance,52:
8852901.
Chen.H(1998)Pricelimits,Overreaction,andpriceResolutioninFuturesMarkets,TheJournaloffuturesMarkets,Vol18,No13,243-263.
Chen,ChaoandJeng,JauLian(1996),Theimpactofpricelimitsonforeigncurrencyfuture’spricevolatilityandmarketefficiency,GlobalFinanceJournal,7,13-25.
Phykaktis,KateandKavussanos,ManolisandManalisGikas(1999),PricelimitsandstockmarketvolatilityintheAthensstockexchange,EuropeanFinancialManagement,5,69-84.
Roll,Richard(1989),Pricevolatility,internationalmarketlinks,andtheirimplicationsforregulatorypolicies,JournaloffinancialServicesResearch,3,211-246.
Kim,KennethA.(2001)PricelimitsandstockmarketvolatilityEconomicsLetters,71,131-136.
Geyer.C.J(1991a)MarkovchainMonteCarloMaximumlikelihood,ComputingScienceandstatistics,23th,156-163.
Geyer.C.J(1992)PracticalMarkovchainMonteCarlo,StatisticalScience,Vol.7,No.4,473-483.
Hopke,P.K.,Liu,C.,andRubin,D.B.(2001)Multipleimputationformultivariatedatawithmissingandbelow-thresholdmeasurements:
time-seriesconcentrationofpollutantsintheArctic.Biometrics,57
(1),22-33.
AndrewGelman,J.B.Carlin,H.S.stern,andD.BRubin(2004)BayesianDataAnalysis,158-165
JianqingFanandQiweiYao(2005)NonlinearTimeSeriesnonparametricandparametricmethods,SpringerScientce&BusinessMedia,1-191.
JohnB.H.etAl(1992)TobitMaximum-LikelihoodEstimationforStochasticTimeseriesAffectedbyReceiverSaturation.IEEETRANSACTIONONINFORMATIONTHEORY,Vol.38,No.2.
JohnF.M.andRobertA.M.(1980)TheUsesofTobitAnalysis,TheReviewofEconomicsandStatistics,Vol.62,No.2,pp.318-321.
Park,J.W.,Genton,M.G.andGhoah,S.K.(2007)Censoredtimeseriesanalysiswithautoregressivemovingaveragemodels.CandianJournalofStatistics,35,151-168.