基于GARCH模型对上证指数日对数收益率的实证分析.docx

资源描述

基于GARCH模型对上证指数日对数收益率的实证分析.docx

《基于GARCH模型对上证指数日对数收益率的实证分析.docx》由会员分享，可在线阅读，更多相关《基于GARCH模型对上证指数日对数收益率的实证分析.docx（22页珍藏版）》请在冰豆网上搜索。

基于GARCH模型对上证指数日对数收益率的实证分析.docx

基于GARCH模型对上证指数日对数收益率的实证分析

基于GARCH模型对上证指数收益率的实证分析

于梦梦西南财经大学统计学院统计学学号：

************

[摘要]本文本文选取上海综合指数在2013年1月4日至2014年12月19日期间共475个上证综合指数每日收盘价数据，并处理成对数收益率，在此基础上对中国股市收益率波动性特征进行了分析。

利用ARCH类模型对上海股票市场的波动性进行了检验，发现中国股市具有明显的ARCH效应，结合ARCH模型和GARCH模型的特点，最终筛选出适合的GARCH（1，1）模型对沪市收益率序列的波动做拟合。

本文最后针对中国股市的现存问题，借鉴成熟股市的经验，提出了加快发展中国股市的政策建议。

关键词：

上证综合指数；ARCH效应；ARCH；GARCH模型；波动性

一、引言

作为国际金融市场的一部分，我国股票市场的成长历程还不算漫长。

自从1990年成立以来的20多个年头里，经过几次大起大落已经不断完善和发展。

尤其是近几年来，随着市场规模的大幅度增加，沪深证券市场与国民经济的相关程度也逐步增强。

金融环境动荡的加剧促使人们研究股票价格波动的内在规律。

美国次贷危机的爆发带来了一场史无前例的金融危机，并在全球蔓延。

中国也难逃灾难，我国的上证综合指数也从最高点6，124.04点暴跌至1，664.93点，这一切让我们认识到防范和应对风险的重要性。

也让我们深刻的明白了：

在中国这样一个尚未发展成熟的股票市场中，我们不仅要定性的把握股票价格的走势，更应该定量的研究其内在规律，这样才能使我们在危机来临之际不至于手足无措。

由于股市内部规律非常复杂，变化周期无序，而我国资本市场个人投资者的比例高达99%，投资者个人心理状态不同，同时经济、政治等因素对其影响较大，使股价走势变化莫测，难以把握。

鉴于此，对股市进行合理分析和预测，对于指导投资者合理投资，维护证券交易市场稳定进而促进经济发展有重大意义。

二、文献综述

一直以来，国内外运用ARCH族模型对金融时间序列的研究已经得到了数不胜数的成果。

Engle和Mustafa（1992）对单个股票收益率序列的研究证实了ARCH效应是显著的。

有关条件均值与条件方差的关系，FrenchNchwert和Stambaugh（1987），Glosten，Jagaannathan和Rumkle（1992）的研究结果认为两者是负相关的，且是统计显著的。

1993年他们用EGARCH-M模型对纽约股市的股价指数月度收益进行实证分析，结果也表明存在杠杆效应:

负残差往往引起方差的增长，而正残差则导致方差的减少。

在对国内股市的研究中，张思奇（2002）运用ARMAARCH-M11模型对1992年1月2日到1998年6月3日的上证综指成分股进行实证研究，结果表明，我国股市的有效程度已经得到明显提高，市场已具备某些弱势有效市场特征；吴齐华等（2001）从持股集中度的角度探讨了实力投资者对股票收益率的ARCH效应的影响，他们采用单因素模型，将所选样本的市场收益率作为因变量，将持股集中度变化额作为自变量，考察持股集中度变化对股票的市场收益率的影响程度。

他们认为，导致我国股票市场剧烈波动的主要原因在于政策干预、投机资金的干扰以及上市公司的结构不合理。

钟蓉萨等深入分析了沪、深市场部分股票收益率序列的各阶矩的特征。

张芳[8]发现了收益率序列本身一般不呈现自相关性，但收益率序列的平方却具备较强的自相关性，反映了不同时间上的观测存在着非线性关系。

丁华通过对上海证券市场的A股指数进行分析，得到了股价指数中的ARCH现象，并以此得出了ARCH

（1）和ARCH

（2）模型。

张永东、毕秋香采用上证综合指数每日收盘价数据，应用常用的波动性预测模型预测上海股市的周波动性并比较其样本的预测效果。

结果表明，当采用不同的预测误差统计量作预测模型的预测精度的评价准则时，会导致评价结果的排序不同。

宋逢明、李翰阳建立了股票总体波动性的分解模型和市场波动以及市场个别波动的度量、估计方法，同时对不同的成分趋势进行分析和检验；得出了不同波动性成分随时间变化的确定性趋势。

魏巍贤首次应用广义自回归条件异方差模型及其两种非线性修正模型，该论文是用ARCH族模型分析中国股市波动性的较早的一篇尝试性文章，给研究国内股票市场的价格波动提供了很好的思路。

从以上研究的可以看出：

一、国内研究者的数据多选用2007年以前的股票指数和其他股市变量指标，且近年来我国股市波动程度增大，因而其结论可能是有偏差的。

二、样本范围明显偏小，多数研究采用的是5年之内的数据，这不能准确反映中国股市的发展变化情况。

本文用实证研究方法对我国上海股票市场价格频繁剧烈波动的情况进行分析，从而得出一些有益的结论和启示。

三、中国股市波动特征

中国股市的发展很快，从20世纪80年代中后期一些国有企业自行发行企业职工内部股票，到1990年至1991年规范化的上海、深圳证券交易所的成立，中国股市在过去十多年的发展过程中逐渐自我完善和发展壮大，市价总值从1992年的1048.13亿元上升1999年的26471亿元，占GDP比例从1992年的3.93%上升到1999年的32%，1999年流通市值占GDP比例达到10%左右。

股票市场的建立和发展对解决国有企业筹集资金起到了积极的作用，有利地推动了中国经济体制改革的深入发展。

虽然中国股票市场取得了长足的发展，但与成熟的证券市场相比，仍存在较大差距，突出的表现是证券市场功能以筹资为主，优化资源配置功能相对薄弱；上市公司的股本结构中，占总股本60%的国家股及法人股不能流通；市场投资主体结构不合理，个体投资者比例过大；上市公司普遍存在重筹资、轻转制的倾向，规范运作程度不高，多数公司还没有形成有效的内部制衡机制；市场规模较小；相关法规不完善；监管力量薄弱和监管滞后等。

具体来讲，我国股市波动具有以下特征:

1、股市波动大，股价指数走势难以按牛、熊市划分，时常发生暴涨暴跌行情，熊市中常发生暴涨行情，牛市中常发生暴跌行情。

在中国股市发展过程中，经历了多次大起大落，沪深股市近几年的股价指数几乎每年发生一次暴涨暴跌行情，大部分的涨跌行情在几天或几周内完成，时间短，涨跌幅度大，最高日涨幅达33%，最高年振幅达400%，如上证综合指数从1994年到2000年22日在325.89点至2114.52点间波动。

股市的剧烈波动对投机者产生巨大诱惑力，助长了市场投机行为，使中国股市中靠股价波动投机的股民占大多数。

政策、消息、扩容，企业经营状况的好坏、机构大户操纵、各种非正常途径的谣传等因素都是引起中国股市波动的原因。

2、二级市场大部分日子成交量很少，在股市发生较大波动时成交量急剧增大。

从沪深股市成交量来看，大部分日子两个市场的日成交量只有几亿元，只在“94.8”行情、“5.19”行情与1996年行情期间成交量才达几十亿元至几百亿元。

3、股市上中小散户投资者众多，股票换手率非常高。

国际上成熟股市的年换手率通常在30-50%，甚至更低，即投资者平均持股时间在2-3年以上。

作为新兴股市，大体上以不超过100%为宜，而中国股票市场历年换手率都高达100%以上，最高为1996年深圳股市换手率902%。

这说明中国股票市场投机氛围浓于投资氛围，如此频繁的买进卖出，直接导致股市价格剧烈波动。

4、上市公司经营业绩欠佳，股息率不太高。

相对于其他成熟股市而言，中国股市平均净资产收益率较低，表明中国上市公司运行质量不稳，资源配置和资金使用效率不高，资产获利能力还处于较低的水平。

另外，上市公司的亏损情况有逐年上升的趋势。

由于上市公司经营业绩普遍欠佳，使很多上市公司股票在分红派息时，股息率很低，一般在5%以下，有的根本没有。

虽然对股民而言，股息率的重要性已退居于股价之后，但一旦发了股息，股民心理及其股市行为就发生了变化，股息增长持续时间的长短以及股息增长率的高低对股价的涨落具有直接影响。

5、每一次暴涨暴跌后面都有明显的政策影响.中国股市波动性特征，说明了中国股市的市场机制还不完善，投机性太强，市场主体行为非理性。

那么我国新兴股票市场价格的波动与成熟市场经济国家的股票市场相比有哪些不同，我国股票市场价格的波动性特征适合用什么样的模型来描述，产生这些波动性特征的原因是什么，这些问题都值得我们研究。

四、ARCH类模型概述

（一）ARCH模型

传统的经济计量模型假设样本方差不随时间改变。

为了改进这些模型，Engle（1982）提出了一类新的随机过程模型，称为自回归条件异方差模型，即ARCH模型（autoregressiveconditionalheteroskedasticity，自回归条件异方差），用以捕捉金融数据的时变性与聚类特征。

该模型一般用于对金融时.间序列数据进行集聚性、方差波动性、回归和预测分析，实证效果良好。

ARCH模型的一个假设是:

观测数据方差的统计性描述呈现出自相关的特点，即滞后值函数包括观测误差的方差。

该模型的核心思想是随机扰动项

的条件方差依赖于干扰项的前一期残差平方的大小，以ARCH

（1）模型为例，该模型在t时刻时的条件方差依赖于前一时刻（t-1）的残差平方

的大小。

ARCH模型的形式如下：

式

（1）

的无条件方差是常数，但是其条件分布为：

式

（2）

其中

是信息集。

方程

（1）是均值方程。

其中，

为条件方差，含义是基于过去信息的一期预测方差。

方程

（2）是条件方差方程，由二项组成。

ARCH项

为滞后的残差平方。

ARCH（P）过程可以写为:

式（3）

其中，

服从独立同分布且满足E（

）=0，Var（

）=

，称（3）为自回归条件异方差模型，简称ARCH模型，称序列

服从P阶的ARCH过程，把式

（1）和式（3）构成的模型称为ARCH模型。

ARCH模型及其扩展模型虽然都常常用来描述和解释货币和金融时间序列误差的方差或波动随时间变化的行为，但它们具有各自的特点。

ARCH模型的主要贡献在于发现了经济时间序列中比较明显的变化是可以预测的，并且说明了这种变化是来自某一特定类型的非线性依赖性，而不是方差的外生结构变化。

式

（2）表明过去的波动扰动

对市场未来波动有着正向而减缓的影响，因此波动会持续一段时间，从而模拟了市场波动的集群性现象，但没有说明波动的方向。

从预测的角度来看，当存在ARCH效应时，使用ARCH模型较之仍使用方差为常数的普通最小二乘法而言不仅可以提高预测值的精度，还可以知道预测值的可靠性。

当方差较大时，预测值的置信区间就较大，从而可靠性较差；反之预测值的可靠性较好。

ARCH模型的这种性质在对股票、债券、期货和期权等进行风险分析时具有重要的实用价值。

（二）GARCH模型

许多实际问题中随着时间t的变化，序列{rt}的随机扰动项的条件方差也在变化，即序列具有变方差的特性。

Engel在1982年首先提出了ARCH模型对方差进行建模，来描述股票市场的波动聚类性和持续性。

ARCH模型通过对过去p期非预期回报（Et）的平方的平方的移动平均来捕获回报序列的条件异方差。

但是ARCH（q）模型在实际应用中为得到较好的拟合效果需要很大的阶数q，这增大了待估参数的个数，还会引发诸如解释变量的多重共线性等其他问题。

另外，对于大数q，非限制估计通常会违背q为负数的限定条件。

1986年Bollerslev将ARCH模型推广发展成GARCH模型，GARCH模型考虑了异方差本身的自回归。

GARCH模型可以描述大多数金融报酬时间序列，所以在波动性研究中被广泛采用。

和ARCH相比，GARCH模型的优点在于相对低阶的GARCH模型可以实现高阶ARCH模型对市场变量的预测，过程的识别和参数估计都相对容易。

GARCH模型由均值方程和条件方差方程组合而成。

定义et是一个实值时间离散随机过程，也是包含t时刻所有信息的P域上的信息集，GARCH（p，q）过程定义如下。

它的条件方差表示为：

式（4）

在（4）式中，pM是ARCH项的阶数，q是自回归GARCH项的阶数，p>0并且，

≥0，

0≤i≤p，

和

是滞后算子多项式。

五、上海股市收益率的ARCH效应检验

（一）数据来源和处理

在分析股票市场收益率时，一般将收益率

定义为:

=logP（t）-logP（t-1），Pt为股票市场每日收盘价。

本文选取上海综合指数在2013年1月4日——2014年12月19日之间的每日收盘价Pt作为样本数据，n=475。

每日股票市场收益率

为相邻营业日股指收盘价

的对数一阶差分，有时候，收益率会乘以100，以表示价格变动的百分比形式，因为原始的收益率是一个很小的数字，在计算中存在着大量的舍入误差，所以乘以100的处理可以减少数值误差。

因此上证综合指数的日对数收益率的计算公式如下：

式（5）

本文数据来源网址为：

（二）上证综合指数日对数收益率序列

的统计性描述

对收集到的475个样本数据进行统计描述，得出上证指数收益率序列

的图形如下:

图1上证综合指数收益率

的线形图

从上证综合指数对数收益率序列r的线性图中，可观察到对数收益率波动的“集群”现象：

波动在一些时间段内较小，在有的时间段内非常大。

图2上证综合指数收益率

的描述性统计

观察这些数据，我们可以发现：

样本期内沪市收益率均值为0.066%，标准差为1.10%，偏度为-0.357，左偏峰度为6.29，远高于正态分布的峰度值3，说明收益率

具有尖峰和厚尾特征。

JB正态性检验也证实了这点，统计量为223.69，P值为0.00000，拒绝该对数收益率序列服从正态分布的假设。

说明在极小水平下，收益率

显著异于正态分布。

（三）上证综合指数收益率序列

的平稳性性检验——ADF单位根检验

虽然在金融时间序列中，收益率序列大多是平稳的，但为了使后面的研究建立在一个正确的前提之下，还是有必要对收益率的时间序列进行平稳性检验。

在检验序列平稳性的方法中，单位根检验是使用最多的一种方法。

因此本文对上证对数日收益率进行ADF单位根检验，结果如图所示：

表1上证综合指数收益率序列

的ADF检验结果

NullHypothesis:

Rhasaunitroot

Exogenous:

Constant

LagLength:

0（Automatic-basedonSIC，maxlag=17）

t-Statistic

Prob.*

AugmentedDickey-Fullerteststatistic

-20.79569

0.0000

Testcriticalvalues:

1%level

-3.443921

5%level

-2.867418

10%level

-2.569963

*MacKinnon（1996）one-sidedp-values.

AugmentedDickey-FullerTestEquation

DependentVariable:

D（R）

Method:

LeastSquares

Date:

12/28/14Time:

01:

Sample（adjusted）:

1/07/201312/19/2014

Includedobservations:

474afteradjustments

Variable

Coefficient

Std.Error

t-Statistic

Prob.

R（-1）

-0.958423

0.046088

-20.79569

0.0000

0.063063

0.050755

1.242492

0.2147

R-squared

0.478142

Meandependentvar

0.002765

AdjustedR-squared

0.477036

S.D.dependentvar

1.525537

S.E.ofregression

1.103210

Akaikeinfocriterion

3.038537

Sumsquaredresid

574.4586

Schwarzcriterion

3.056094

Loglikelihood

-718.1332

Hannan-Quinncriter.

3.045442

F-statistic

432.4606

Durbin-Watsonstat

2.002082

Prob（F-statistic）

0.000000

因为在单位根检验时，零假设和备择假设分别是：

H0：

=1，（yt非平稳）

H1：

<1，（yt平稳）

DF>临界值，则接受H0，yt非平稳；

DF<临界值，则拒绝H0，yt是平稳的。

本文中的收益率序列

在1%的显著水平下，ADF检验值-20.80<-3.44，P值为零。

说明rt有一个单位根的概率几乎为0，因此拒绝H0，认为

数据是平稳的。

因此沪市的收益率

拒绝随机游走的假设，收益率序列通常是平稳的时间序列数据。

（四）上证综合指数收益率序列

的相关性检验

为了检验上证指数收益率序列

的相关性，使用EViews软件，对收益率原序列作其AC图和PAC图，如下所示：

表2上证综合指数收益率

的自相关函数分析表

从图中可以看出，序列的自相关和偏自相关系数均落入两倍的估计标准差内，且Q－统计量的对应的p值均大于置信度0.05，故序列在5％的显著性水平上不存在显著的相关性。

（五）均值方程的确定及残差序列自相关检验

由于序列不存在显著的相关性，因此将均值方程设定为白噪声。

设立模型：

式（6）

将r去均值化，得到序列W：

式（7）

其中，r的均值为0.066。

再看W序列的描述性统计：

图3W序列的描述性统计

（六）异方差性检验

从图1中可以看出，

的样本分布具有聚类特征，从统计的角度来说，基本可以看出

序列具有异方差性，因此需要用ARCH检验来检验序列的异方差性。

普通回归方程的ARCH效应检验分为两种：

ARCHLM检验和残差平方图检验。

本文采用第二种方法，即进行残差的平方相关图检验。

1.ARCHLMTest：

拉格朗日乘数检验。

Robinson（1994）提出了一种拉格朗日乘子检验方法，简称LM检验。

Breush-GodfreyLM检验（Lagrangemultiplier，即拉格朗日乘数检验）也可应用于检验回归方程的残差序列是否存在高阶自相关，而且在方程中存在滞后因变量的情况下，LM检验仍然有效。

LM检验原假设为：

直到p阶滞后不存在序列相关，p为预先定义好的整数；备选假设是：

存在p阶自相关。

检验统计量由如下辅助回归计算。

LM检验通常给出两个统计量：

F统计量和T×R2统计量。

LM方法的不足之处在于对模型的要求过于苛刻，即在模型完全识别的情况下才有效，否则估计就不一致;且从整个过程来看，也没有给出分数差分参数d的具体值，仅能够知道估计值大概处于一个什么样的范围。

建立辅助回归方程

式（8）

此处

是回归残差。

原假设：

H0：

序列不存在ARCH效应

即

H0：

可以证明：

若H0为真，则

式（9）

此处，m为辅助回归方程的样本个数。

R2为辅助回归方程的确定系数。

2.残差平方图检验。

该部分采用收益率序列

去均值化后的残差序列W，令Z=w^2，可得到对数收益率残差平方的自相关函数分析图：

表3收益率残差平方的自相关函数分析图

如图所示，序列存在自相关，说明拒绝ARCH模型残差项不存在异方差性的原假设，即所选上证综合指数收益率样本存在明显的异方差性，所以有ARCH效应。

综合上述对上证指数收益率样本序列的ARCH效应（平稳性、自相关性、异方差性）和尖峰厚尾的特征的分析检验，因此有理由认为使用GARCH族模型来描述收益率的波动性是合理的。

六、建立GARCH类模型

（一）模型阶数的确定

在对参数进行估计之前，我们需要确定该模型的阶数。

在这里我们使用AIC信息准则和SC准则来确定其阶数。

常用的GARCH模型包括GARCH（1，1），GARCH（1，2），GARCH（2，1）我们分别用多个模型建模，以下分别以GARCH（1，1）、GARCH（1，2）、GARCH（2，1）三个模型进行尝试。

表4GARCH（1，1）

DependentVariable:

Method:

ML-ARCH（Marquardt）-Normaldistribution

Date:

12/27/14Time:

14:

Sample:

1/04/201312/19/2014

Includedobservations:

475

Convergenceachievedafter10iterations

Presamplevariance:

backcast（parameter=0.7）

GARCH=C

（1）+C

（2）*RESID（-1）^2+C（3）*GARCH（-1）

Variable

Coefficient

Std.Error

z-Statistic

Prob.

VarianceEquation

0.086888

0.045945

1.891128

0.0586

RESID（-1）^2

0.079613

0.019248

4.136257

0.0000

GARCH（-1）

0.852276

0.052525

16.22620

0.0000

R-squared

-0.000000

Meandependentvar

0.000269

AdjustedR-squared

0.002105

S.D.dependentvar

1.101904

S.E.ofregression

1.100744

Akaikeinfocriterion

2.982501

Sumsquaredresid

575.5276

Schwarzcriterion

3.008796

Loglikelihood

-705.3441

Hannan-Quinncriter.

2.992842

Durbin-Watsonstat

1.912677

表5GARCH（1，2）

DependentVariable:

Method:

ML-ARCH（Marquardt）-Normaldistribution

Date:

12/27/14Time:

14:

Sample:

1/04/201312/19/2014

展开阅读全文