上海证券交易市场量价关系实证研究毕业论文.docx
《上海证券交易市场量价关系实证研究毕业论文.docx》由会员分享,可在线阅读,更多相关《上海证券交易市场量价关系实证研究毕业论文.docx(21页珍藏版)》请在冰豆网上搜索。
上海证券交易市场量价关系实证研究毕业论文
---文档均为word文档,下载后可直接编辑使用亦可打印---
摘要
量价关系是研究股票市场的基础,为了逐步揭示价格波动产生的根源,学者们对于股票成交量和股价波动之间关系的实证研究由来已久,得到的结论大多显示交易量与价格波动的确存在显著的正相关关系。
本文选取上海综合指数为研究对象,在2005年3月1日——2018年3月1日之间的每日涨跌幅、交易量为数据样本,建立GARCH模型,对股票成交量和股价波动之间关系进行了实证分析,结果表明股市股价波动与股票成交量具有正相关关系,但这种正相关关系并不显著。
关键词:
股票交易量股价波动量价关系GARCH模型
ABSTRACT
Therelationshipbetweenquantityandpriceisthebasisforthestudyofthestockmarket.Tograduallyrevealtherootcausesofpricefluctuations,scholarshavealonghistoryofempiricalresearchontherelationshipbetweenstockturnoverandstockpricevolatility.Mostoftheconclusionshaveshownthattradingvolumeandpricefluctuationsdoexistsignificantpositivecorrelation.
ThisarticleselectstheShanghaiCompositeIndexastheresearchobject.ThedailyfluctuationsandtradingvolumebetweenMarch1,2005andMarch1,2018aredatasamples,andaGARCHmodelisestablishedtofluctuatethestocktradingvolumeandstockprice.Theempiricalanalysiswasconductedontherelationshipbetweenthestockpricesandstockmarketvolatility,butthepositivecorrelationwasnotsignificant.
Keywords:
stocktradingvolume;pricevolatility;volume-pricerelationship;GARCHmodel
第1章前言
1.1研究背景和意义
1.1.1研究背景
一般经验认为,在股票交易活动中,交易量是风向标和晴雨表,直接反映股票的供求状况,进而影响股票价格的走势,导致股价产生波动。
同时,交易量的变化暗示着股票市场的内在驱动力,分析交易量的变化能在某种程度上对股票价格的未来趋势做出一些预测。
正如华尔街有一句经验之谈:
量驱价变(Ittakesvolumetomakepricesmove)。
而波动性可以这样理解:
是股票价格变化的频率和幅度,是收益上存在的不确定以及一些无法预测的可能性,也就是股票价格的不可预期的变化趋势。
波动性的存在使得股票价格的时间序列充满不确定,也使得股票市场的运动规律极其复杂。
在实证研究中,以科学建模的方式对股价波动进行规律预测是当下普遍采用的研究思路。
学术界最早进行明确的量价关系研究的是Osborn(1959),为了模拟股票价格的波动,在实证中他使用了扩散过程的方法,最后发现能够反映交易量的数据——交易次数(numberoftransactions),与价格波动的方差存在显著的关联关系。
自Osborn开始了对量价关系的实证检验直到今天,股票市场不断发展并趋于成熟,学术界对量价关系的研究也日渐深入并完善,后来的学者在广泛的市场考察、数据分析和模型研究中,得出的普遍结论都表明:
交易量与价格波动存在正相关关系,下文在文献综述部分将详细论述。
对于量价关系的研究,最核心的内容在于理论设想的提出和实证模型的建立,当前研究背景下,模型大多采用ARCH模型族及其衍生产品,而理论上主要是,混合分布假说理论MDH(MixtureDistributionHypothesis)和信息不对称理论。
Clark最早提出了明确的混合分布假说,他认为:
信息流传输的机制,具有潜在的、无可捉摸也无法预测的一些特性,交易量和价格波动受到的驱动在理论上要来自相同的信息流,最直观的佐证就是,当信息流对市场产生影响时,交易量变化和价格波动总是互相伴随出现。
在建立理论模型时,Clark认为交易量或者交易次数能代表信息流速率,所以选择这二者作为替代指标导入模型。
Clark的混合分布假说理论的核心与特别之处在于,他认为日价格波动序列可以看做不同方差的分布集,这种“混合分布”解释了资产日收益波动出现相较于正态分布要更加尖峰厚尾的尖峰态分布的原因,也解释了资产日收益波动为何会表现出互不相关、不对称的特征。
通过以上处理,Clark最终建立了混合分布假说理论模型,并在实证研究中发现,正相关关系存在于价格波动与当期信息流速率之间、存在于交易量与当期信息流速率之间,根据正相关关系的传递特性,可以最终推导得出,正相关关系同样也存在于价格波动与交易量之间,这一结果佐证了学术界关于量价关系的普遍结论。
但是Louhichi(2011)指出,虽然混合分布假说理论模型对价格波动提出了新的解释,通过对信息传输的考量间接证实了量价之间的正相关关系,但却无法进一步从微观结构角度对量价关系实质进行深入研究。
而信息不对称模型主要认为,信息不对称是问题产生的根源,由于信息不对称,不同投资者对同一种股票会做出不同的买入卖出决定,引发交易,造成股价的波动。
这是一个浅显的原理,而学者们在进一步研究中遇到的阻碍在于,明确区分出哪些交易属于由信息驱动,这在现实股票市场的交易中无法做到的。
所以,学者们目前在实证分析中运用较多的研究方法是,将交易量分为平均单笔交易的数量、平均单笔交易的频率导入模型分析。
即便采用了这样的方法,对于信息不对称的具体影响机制,学术界仍尚未得出一致的认知。
1.1.2研究意义
如前文所述,股票市场的运动规律极其复杂,能对股票价格波动产生影响的因素可谓纷纷扰扰,而这些因素如何影响股票价格、影响到怎样的程度尚不能明确考量,再加上股价本身的特点比如动态、非线性等等,使得研究难度更进一层。
因此,逐步建立有效的模型来预测股票价格走势,具有重要的理论意义和现实意义。
千里之行始于足下,交易量在对股票价格波动产生影响的诸多因素中,最为基础直观。
对量价关系的研究是预测股价波动的第一步,具有非常重要的基础意义,因而本文要将交易量引入股票价格的回归模型中,进行实证分析。
所谓的基础意义,Karpoff(1987)提出了以下几方面的总结意见:
(1)对交易量和价格波动关系的实证检验,涉及考察市场规模、解析市场信息传递机制等过程,有利于从微观角度研究市场结构;
(2)如果能够验证量价存在某种联合分布,进行事件研究(EventStudy)检验时即可纳入量价关系,有利于增强检验有效性;
(3)如前文在研究背景中所述,混合分布假说理论很好的解释了解释收益率分布的尖峰特征、量价二者的正相关关系,因此则可以用混合分布假设来解释研究中的某些问题,对于投机价格的经验分布研究具有重要意义。
(4)量与价的本质关系是恒定存在的,对于不同种类的金融产品、在不同的市场上都是不变,研究股票市场的量价关系一定意义上能够“以偏概全”。
Gallant等(1992)也指出,要想获得更有深度和广度的资本市场信息,无疑需要进行股价波动与交易量变化的联合研究,而非股价变动的单一研究。
准确描述量与价二者之间的关系从技术层面来讲是事件研究在统计方法上的突破与进步,又因为量价关系研究涉及金融资产的流动性问题,有利于从微观角度解构金融市场,解释金融资产价格的经验分布。
此外,从政策角度来考虑,量价关系研究可以验证空头交易限制等多种理论假设,有利于具体监管政策的实施,市场监管者还可以从价格和交易量的关系实质中看出市场波动的性质、信息在市场中传递的方向及效率,进而提高监管效率。
1.2文献综述
金融产品的供给和需求是通过交易实现的,市场参与者通过买入和卖出的调整来反映市场对价格水平的接纳程度。
投资者迫切需要股价预测的一定模式或程序以降低交易风险,把握市场动向。
有现实需求就能催生理论供给,量价关系研究在百余年的股市发展历程中始终是一大研究热点。
以下将按照时间顺序,分别概述国内外学者在量价关系研究领域先后得出的结论。
其中,给本文启发最大的是基于GARCH模型的量价关系研究相关论文,是阐述重点。
1.2.1国外文献综述
Ying(1966)以标普500成分指数为研究对象,1957年1月至1962年11月的每日数据为样本进行研究。
结果表明股价波动与交易量之间存在正相关关系,他的依据是当期交易量上涨时,股票价格会上涨;当期交易量下降相应的股票价格则会下跌。
Epps在1975选取了20只债券,在1977又选择了20只个股,进行了相同过程的研究,在1975他发现,在债券价格上涨的时间区间,当期交易量与价格变化绝对值之比,大于债券价格下跌时,当期交易量与价格变化绝对值之比。
1977年他以个股为对象重复这一研究,得到的结果不变。
两项研究选取不同研究对象和不同数据样本,得到的结论是相同的:
股价波动与交易量正相关。
Morgan(1976)在选择数据的时间间隔上做了一些调整,采用51支股票每四天、每月度的数据,结论是,股价波动和交易量之间的正相关关系可以延伸到股价波动方差和交易量之间。
Rogalski(1978)把认股权证也纳入研究范围,发现量价之间的正相关关系在滞后期变得不再明显。
Comiskey.(1987)的创新之处在于利用对数据进行了横截面处理,随后发现,当交易量换手率发生变化时,伴随着股价发生同方向的变化,显然,这意味着研究对象之间存在正相关关系。
Lamoureux和Lastrapes(1990)试图证实混合分布假说理论中认为的:
价格波动和交易量变化受到共同的信息流驱动这一观点。
他们把交易量作为弱外生变量,导入到GARCH模型方程中,结论分为以下两方面,一是验证了最基础的量价正相关;二是,交易量加入到GARCH模型之后,部分对价格造成冲击的因素系数不再显著,验证了混合分布假说理论的以上观点,同时也说明,交易量对股价波动的解释能力很强。
Bessembinder和Seguin(1992,1993)对量价关系进行了分解研究,试图考察成交量是如何影响价格产生波动的,发现非预期交易量对价格波动的影响更显著之后,他们又将非预期交易量分解为正负两个部分,发现为正的那一部分非预期交易量,产生的影响最为显著。
Saatcioglu和Starks(1998)用VAR分析检验拉丁美洲股市,发现在这样一个特殊的新兴市场上,交易量对股价波动具有解释能力,而股价波动却不能反过来解释交易量变化,二者之间的因果关系是单向的。
同样是新兴市场,Silvapulle和Choi(1999)以韩国股票市场KOCSPI指数为研究对象,发现在韩国市场上,量价二者之间的因果关系是双向的,并且既存在线性因果,也存在非线性因果。
TerryA.Marsh,NiklasWagner(2000),对七国市场进行了对比研究,发现在发展最完善的美国市场上,GARCH效应可以完全被交易量所解释;其余大多数国家股票市场上,在GARCH-M模型方程里,交易量能一定程度上被条件回报方差所解释。
Chen.(2001)对1973到2000年间的九国市场进行了联合研究,发现共同点在于,交易量和股价波动的绝对值之间都存在正相关关系;不同点在于股价变化与交易量变化的先后顺序,有些市场上是股价先产生变化,而有些市场是交易量先变化。
Gervais、Kaniel和Mingelgrin(2001)进行了一些研究后认为,大宗股票交易发生,往往意味着较高的收益率产生,而低交易量则代表低收益。
Lee.(2001)以研究中国股票市场为研究对象,得到的研究结果却是中国市场上交易量和股票价格波动的相关关系并不显著。
1.2.2国内文献综述
我国的股票市场从上世纪八十年代末才开始起步,时间相对较短,并且发展上存在一定中国特色。
张维和闫冀楠是早期对量价关系进行实证研究比较有代表性的学者,他们在1998的研究中引入了格兰杰因果(Granger)检验,同时使用Beak-Brock非参数方法,发现在短期内,收益与交易量之间存在的是单向、线性的因果关系;在长期内,收益与交易量之间存在的是双向、非线性的因果关系。
陈怡玲和宋逢明(2000)发现在中国市场上,就个股和指数而言,股价波动和交易量呈现正相关,股价波动的绝对值也与交易量呈正相关,同时发现,交易量和价格波动之间的关系并不对称;接下来他们将交易量解构成预期交易量和非预期交易量,验证结果显示非预期交易量对股价波动的解释能力要更显著。
他们的研究在一定程度上借鉴了Karpoff在(1987)所提出的关于量价关系的解释
刘国光(2003)发现在中国深圳A股市场上,股票交易量和价格波动绝对值正相关,股票交易量和股票收益正相关,而收益变动性和交易量负相关。
赵留彦和王一鸣(2003)在实证中使用了EGARCH模型,除了验证了正相关关系的存在、验证了非预期交易量更为显著的解释作用,一个额外的发现在于,非预期交易量能在一定程度上预测下一期的收益率的波动,而预期交易量部分则对股价波动没有解释作用。
王燕辉和王凯涛(2005)研究了深圳市场,选取深成指在1998年至2004年间的交易数据,根据交易量的不同,对股票进行分组,考察不同组合的收益率特征。
发现短期内,高成交量代表高收益率,但是在长期内,低成交量伴随着高收益率,且这种伴随关系非常明显。
何兴强和王醒云(2005)希望在上证市场上验证混合分布假说理论MixtureDistributionHypothesis(MDH)的可行性,工具上他们选用了GARCH模型和EGARCH模型,发现交易量能有效解释股价波动的GARCH效应,对持续性的解释能力也比较显著,尽管如此,Clark选择交易量或者交易次数作为信息流替代指标的做法也有待推敲,因为交易量不能完全替代市场信息。
李双成、邢志安和任彪(2006)具体研究预期交易量和非预期交易量对股价波动的影响,将这两类交易量导入非对称成分GARCH-M模型短期波动方差方程中,得出的结论如下:
其一,在深市,短期内交易量只能部分解释价格波动持续性,而在沪市则可以完全解释,说明沪市的反映机制要更加迅速、有效;其二,沪深股市数据表现验证了学术界普遍认可的一个结论:
非预期交易量对股价波动的解释能力更为显著,他们认为这说明,非预期交易量所代表的信息流,是造成短期股价波动的根本原因,他们还将交易量分为正负两部分,发现正的交易量对短期价格波动产生的冲击更大。
同样是将交易量解构后加入GARCH模型中,孔东民和毕秋侠(2006)选择正向信息流与负向信息流为依据,将上证50指数包含的50支个股交易量划分为两类,经过实证分析发现,首先是最后建立的模型中,交易量系数为正且显著,表明量价之间显著的正相关关系存在;其次,基于负向信息流的交易量对股价波动的影响要更为显著;最后,在将交易量导入模型后,GARCH效应变得不再显著了。
刘永利等(2007)基于GARCH模型选取中国股市个股数据为样本,研究发现的新观点是:
利空消息对市场波动的冲击影响比利好消息更显著;正的交易量的冲击对市场波动的影响比同等负的交易量冲击更显著
董秀良和吴仁水(2008)在实证中选用多元GARCH模型,发现股价变化对交易量变化起到某种程度的导向作用,于是他们进一步考察了股价波动与交易量之间的波动溢出效应,发现股价对当期成交量具有显著的单向波动溢出效应,反向并不显著。
郭梁和周炜星(2010)选取了高频数据为样本,发现股票价格变化的绝对值和成交量之间,既有正常情况下的正相关关系,又有些反常情况下会存在负相关关系。
第2章理论模型概述
2.1GARCH模型介绍
在对量价关系研究的发展历程中,GARCH模型的出现具有里程碑式的重要意义。
传统的线性结构以及经典的时间序列模型能够帮助我们发现金融数据的一些特性,比如说尖峰厚尾、波动率集聚以及杠杆效应等等,但是传统的研究工具对这些特性的刻画并不能达到深入研究的要求。
为了弥补这些研究工具上的不足,Engle在1982年构建了自回归条件异方差模型,即通常所说的ARCH模型(AutoregressiveConditionalHeteroskedasticity,),站在Engle的肩膀上,Boller-slev在四年后,对异方差的模型表现进行了线性拓展,形成实用性更强、更有效率的广义自回归条件异方差模型,即GARCH模型(GeneralizedAutoregressiveConditionalHeteroskedasticity)。
实用性更强是指,金融市场研究中涉及的时间序列大多是单变量,使用GARCH模型在刻画其特征上能做的更清晰,比如前文提到的波动聚集、条件异方差和长记忆性等。
更有效率是指,GARCH模型建模时需要采用的阶数相对更小。
有鉴于此,本文将建立GARCH模型,以对股票成交量和股价波动之间关系进行实证研究。
GARCH模型作为自回归模型,其中的条件方差中包含自身历史实际数据,GARCH(p,q)模型中p为GARCH项阶数,q为ARCH项阶数,GARCH(p,q)模型的一般形式方程如下所示:
其中
是t时刻随机扰动项的方差,此项是根据历史信息对前一期数据测算出的估计值
GARCH模型的原理,是用长期平均值、前一期代表波动的信息和前一期拟合方差,三者进行函数加权来解释当期拟合方差。
本文对涨跌幅序列进行建模,利用GARCH(1,1)就能达到研究需要,暂无需采用更高的阶数。
GARCH(1,1)模型的条件方差方程如下:
其中,参数
,
,
第3章实证分析
下文将根据GARCH(1,1)模型对股价波动(实证中用涨跌幅数据体现)、成交量进行实证研究,首先进行的是建模前的相关检验
3.1建模前的相关检验
3.1.1数据说明
(1)本文研究对象为上海证券综合指数的每日涨跌幅
,成交量V(单位:
亿股)。
(2)时间区间为2005年3月1日到2018年3月1日,样本数据容量为3175个。
(3)本文的数据来源于同花顺数据库,所使用的统计软件为Eviews。
3.1.2上证综合指数涨跌幅序列
的统计性描述
对上海证券综合指数2005年3月1日到2018年3月1日之间的每日涨跌幅
,成交量V进行统计描述,首先得出的是上证指数涨跌幅序列
图,如下所示:
从上证综合指数2005年3月1日到2018年3月1日这十三年间的对数涨跌幅序列r的线性图中,可以观察到,对数涨跌幅序列的“波动率集聚现象”是相当显著的:
某些时间区间内波动幅度较小,而某些时间区间内波动比较剧烈。
3.1.3上证综合指数涨跌幅序列
的平稳性性检验
序列平稳是进行回归分析的基础,为了保证本文的实证有一个正确的基础,下面首先对涨跌幅的时间序列进行平稳性检验。
本文选择的单位根检验(Unitroottest)中的ADF检验(AugmentedDickey-Fuller),以及Phillips-Perron检验。
涨跌幅序列中如果存在单位根,代表着回归分析中存在伪回归,则认定该序列是不平稳的,需要进一步处理。
两项检验结果如表
(1)和表
(2)所示:
表
(1)涨跌幅序
列
ADF检验表
表
(2)涨跌幅序列
Phillips-Perron检验表
进行假设检验(其中H0为零假设,H1为备择假设):
H0:
P=1,认定涨跌幅序列
非平稳
H1:
P<1,认定涨跌幅序列
平稳
根据表
(1)和表
(2)可知,本文中的涨跌幅序列
在1%的显著水平下:
(1)ADF检验中,t-statistic为-54.96493,远落后于临界值-3.432221;Phillips-Perron检验中,t-statistic为-55.02261,同样远落后于临界值-3.432221,因此拒绝零假设
(2)ADF检验以及Phillips-Perron检验的P值均小于0.01,说明
几乎0概率会存在一个单位根,因此拒绝零假设
综上可以得出结论:
涨跌幅序列
是平稳的
3.1.4上证综合指数涨跌幅序列
的相关性检验
确认平稳性后,将要检验上证指数涨跌幅序列
的相关性,本文使用Eviews软件,对涨跌幅原序列进行自相关(Autocorrelation)分析(结果见表3AC栏),以及偏自相关(PartialAutocorrelation)分析(结果见表4PAC栏)
表(3)上证综合指数涨跌幅序列
相关性分析表
由表(3)可知
(1)涨跌幅序列
的自相关系数以及偏自相关系数数值均属于两倍的估计标准差区间范围内
(2)Q统计量对应的p值,都超过5%的置信度
所以本文认为涨跌幅序列
在5%的显著性水平上,不存在显著的相关性。
另外,滞后4期时,涨跌幅序列
的自相关系数以及偏自相关系数,都存在截尾现象,因此需要进行进一步拟合处理,本文将采用MA()或AR()最大阶数为4的模型对序列进行拟合。
为了提高实验精准度,本文模型选择遵循以下原则:
(1)变量显著
(2)最小信息准则(Akaikeinformationcriterion可以检测模型中拟合数据的优良性)
(3)R-squared最大原则(R-squared代表因变量信息可以被自变量解释的程度)
依据以上原则,最终选定了ARMA(2,2)模型,拟合结果如表(4):
表(4)ARMA(2,2)模型拟合表
ARMA(2,2)模型选定后,首先对残差序列进行相关性检验,结果如表(5)。
表(5)残差序列相关性检验表
从表(5)可知,ARMA(2,2)模型残差序列已经不存在显著的自相关性,下面进行残差平方序列相关性检验。
表(6)残差平方序列相关性检验表
从表(6)可知,残差平方序列尚且存在显著的自相关性,为了确保所建立的GARCH(1,1)模型是正确的,需要首先确认残差序列确实存在ARCH效应,因此进行进一步检验。
在这一步处理中,ARCH可以理解为误差项二阶矩的自回归过程,针对ARCH效应的存在,恩格尔在1982年提出了ARCH-LM检验方法。
该检验原假设认定残差序列不存在自相关,对原序列进行不同阶数的残差回归后得到了表(7)中的F-statistic以及Obs*R-squared两个统计量。
对于这两个统计量,恩格尔是经过总体残差平方的联合显著性进行检验(省略变量),得到F-statistic,而Obs*R-squared是LM检验统计量,表(7)该栏括号内数值是Obs*R-squared的相伴概率。
表(7)ARCH-LM检验结果
滞后阶数
F-statistic
Obs*R-squared
1
2.283684(0.0438)
5.003680(0.0847)
2
4.522026(0.0109)