股市中的成交量数学建模论文.docx
《股市中的成交量数学建模论文.docx》由会员分享,可在线阅读,更多相关《股市中的成交量数学建模论文.docx(16页珍藏版)》请在冰豆网上搜索。
股市中的成交量数学建模论文
股市中的成交量
摘要
目前,中国有几千万股民基民,随着中国经济的持续高速发展,证券投资收益已越来越成为普通百姓财富增长的重要组成部分。
针对题目中的三项问题,运用系统建模及MATLAB、SPSS软件进行分析求解。
问题
(1)中,首先以所给数据中上证指数的开盘价作为研究对象,根据从1990年12月19日开始到2010年12月31日的开盘价与成交量来描述指数与成交量的长期关联程度,运用SPSS进行关联分析得到Pearson(皮尔逊)关联系数为0.712。
证明指数与成交量之间是显著线性相关的。
随机抽取2003年和2009年的开盘价与成交量来描述指数与成交量的短期关联程度,运用SPSS对数据进行分析处理得到Pearson(皮尔逊)关联系数分别为0.311(2003)和0.291(2009)。
问题
(2)中,首先根据生存分析的方法对上证指数与成交量之间的关系进行分析,确定使用位置尺度模型来建立指数与成交量之间的上涨阶段和下跌阶段的数学模型。
为了能够对股指在长时间内进行统计比较,我们采用相对收益率替代股指涨跌点数,使用MATLAB软件编程分析相对收益率与不同的成交量之间的关系得到,成交量大的生存函数曲线较平坦,表示股指涨得较高,而成交量小的生存函数曲线较徒,表示股指相对上涨得较小。
问题(3)中,根据得到的指数与成交量的模型得到成交量与股指存在着线性关系。
当股价上涨,伴随着成交量的稳步放大;当股价下跌,伴随着成交量的逐渐缩小。
股价的上涨和下跌是由成交量推动着,成为其涨跌的内在力量。
关键词:
上证指数;成交量;生存分析;相对收益率;位置尺度模型
一、问题重述
目前,中国有几千万股民基民,随着中国经济的持续高速发展,证券投资收益已越来越成为普通百姓财富增长的重要组成部分。
有经济学家曾形容中国股市是个大赌场,受大资金关照的个股上窜下跳,普通投资者只好踫运气。
然而,现实世界是不存在真正意义的混沌现象,任何貌似混沌的现象其背后都有一定的统计规律,否则各种科学技术毫无存在意义。
大盘指数是反映许多股票交易的综合指标,相对而言被某些大资金完全控制的可能性非常小。
“建仓—拉高—出货”是我国过去、现在和将来(至少不会太短时间内)大资金动作个股的不二模式,跟随大势做个股是主力资金最理想的运作模式,这当然也是普通投资者的最佳操作策略。
由于实体经济具有一定的周期性,那么建立在此基础上的证券市场呈现波浪运动在所难免,更何况还要受到政策面和其他市场的影响。
没有只涨不跌的股市,也没有只跌不涨的股市。
一般地,当股市经过较长时间和较大幅度下跌后,绝大部分投资者悲观绝望,交易低迷,股价超低,但也有人试探进场,随着抛盘衰竭,底部形成;市场投资信心的进一步恢复,资金蜂涌,成交量激剧放大,股票大涨;当广大投资者对未来充满期望的时候,最最理性的投资高手(如07年巴菲特清仓中国石油H股)开始撤退,增量资金衰竭,顶部形成;越来越多投资者对未来开始迷忙,降低了买卖冲动,股指持续大幅下跌;当绝大部分投资完全悲观失望时,新一轮底部悄然而至。
“上证指数”全称“上海证券交易所综合股价指数”,是一个以报告期发行股数为权数的加权综合股价指数,是国内外普遍采用的反映上海股市总体走势的统计指标。
上证指数以"点"为单位,基日定为1990年12月19日,基日指数定为100点。
观察股票交易软件中各种指数的K线图,成交量变化和指数涨跌无一不明显呈现出一定的同步现象。
结合上证指数数据,我们可以建立有关指数与成交量的数学模型,进行定量分析。
要求:
(1)给出指数与成交量长期和短期(波段)关联程度的描述;
(2)分别设计出每一上涨波段、下跌波段的指数关于成交量的(近似)数学模型,并用所给数据(2000-2011年上证指数数据)进行实证分析;
(3)给广大股民写一篇约500字短文,讲述成交量对指数的影响。
二、问题分析
1.问题1
根据给出的1990年12月19日到2010年12月31日上证指数的日开盘价作为研究对象。
分析指数与成交量长期与短期的关联程度。
抽取整个样本来分析指数与成交量的长期的关联程度。
在分析指数与成交量短期的关联程度时,随机抽取样本数据,如2003年和2009年的样本数据。
使用SPSS软件对抽取到的样本数据中的日开盘价与日成交量进行相关分析,得到指数与成交量的长期与短期的关联程度。
2.问题2
股市的指数的连续上涨或下跌可以看成是一种特殊的生存过程。
本文将生存分析的方法引入对股市的分析。
当股指连续上涨到头转为下跌时,可以视作上涨的“死亡”;同样当股指连续下跌到头转为上涨时,可视作下跌的“死亡”,股指就是在这两种状态下不停地进行着“生”、“死”相互转化的。
股指连续涨跌的点数可以看作是连续的生存模型。
根据股市政策的不同,我们研究了2000年到2010年的上证指数数据。
采用相对收益率代替股指的涨跌点数建立股指与成交量的生存模型来研究股指与成交量的关系。
3.问题3
根据建立的数学模型得到的成交量与指数的关系,得出成交量与指数之间存在着线性关系。
成交量的大小反映着股指的涨跌状况。
股民们在选择股票的时候可以将成交量这个因素考虑在内。
但是也不能完全依靠成交量来选择购买哪只股票。
三、模型假设
1.假设所找到的数据真实可靠。
2.假设可以用上证指数的开盘数据来代替股指研究指数与成交量的长期、短期的关联程度。
3.假设用上证指数的收盘数据得到的相对收益率代替股指的涨跌点数。
四、模型建立与求解
1.问题1
使用Pearson方法来计算开盘价与成交量的相关系数r。
|r|表明两变量间相关的程度,r>0表示正相关,r<0表示负相关,r=0表示零相关。
变量的取值区间越大,观测值个数越多,相关系数受抽样误差的影响越小,结果就越可靠,如果数据较少,本不相关的两列变量,计算的结果可能相关。
所以在计算指数与成交量的长期关联程度时采用1990年12月19日到2010年12月31日的所有日开盘与成交量数据来计算相关系数r,在分析指数与成交量的短期的关联程度时,随机抽取某一年的所有日开盘与成交量数据来计算相关系数r。
定义开盘价为变量x,成交量为变量y。
根据Pearson相关系数公式:
(1)
来计算相关系数r。
其中
(2)
为x的离均差平方和;
(3)
为y的离均差平方和;
(4)
为x与y间的离均差积和。
图1为MATLAB软件根据1990年到2010年的日开盘与成交量的数据得到的指数与成交量的走势图。
从图中我们可以看出红线表示上证指数的走势图,绿线表示成交量的走势图。
两条线在相同的时期内走势都很平缓,在大致相同的时期内上升或下降,表现出一定的相关性。
表1为使用SPSS软件对1990年到2010年日开盘与成交量数据分析得到的描述性统计量。
表2是得到的指数与成交量的相关性。
由表2可知1990年—2010年的指数与成交量的Pearson相关系数为r=0.712。
当Pearson相关系数r的取值为在0.70-0.89之间时为高度相关。
可以确定指数与成交量在长期内是高度相关的。
图11990年—2010年上证指数与成交量的走势图
表11990—2010年指数和成交量的描述性统计量
均值
标准差
N
开盘(x)
成交量(y)
1570.9791
3481004.95
1030.03857
4.811E7
4800
4800
表21990—2010年指数和成交量的相关性
开盘(x)
成交量(y)
开盘(x)
Pearson相关性
显著性(双侧)
平方与叉积的和
协方差
N
1
5.177E9
1060979.455
4880
.712**
.000
1.722E14
3.530E10
4880
成交量(y)
Pearson相关性
显著性(双侧)
平方与叉积的和
协方差
N
.712**
.000
1.722E14
3.530E10
4880
1
1.129E19
2.314E15
4880
图3为MATLAB根据2003年的日开盘与成交量数据得到的指数与成交量的走势图。
图3中红色线表示上证指数的走势图,绿色线表示成交量的走势图。
从图中可以看出两条线上升和下降的时间相同,上升和下降的速率不同。
表3为使用SPSS软件根据2003年的日开盘数据与成交量数据得到的短期的指数与成交量描述性统计。
表4为得到的指数与成交量的相关性。
从表中可以看出Pearson相关系数为r=0.311。
当Pearson相关系数r的取值为在0.20-0.39之间时为低度相关。
可以看出指数与成交量在短期内的相关性不是很好。
图32003年指数与成交量的走势图
表32003年指数和成交量的描述性统计量
均值
标准差
N
开盘(x)
成交量(y)
1467.0068
12998544.34
69.61830
7867543.997
241
241
表42003年指数和成交量的相关性
开盘(x)
成交量(y)
开盘(x)
Pearson相关性
显著性(双侧)
平方与叉积的和
协方差
N
1
1163209.735
4846.707
241
.311**
.000
4.094E10
1.706E8
241
成交量(y)
Pearson相关性
显著性(双侧)
平方与叉积的和
协方差
N
.311**
.000
4.094E10
1.706E8
241
1
1.486E16
6.190E13
241
图5为使用MATLAB软件根据2009年日开盘与成交量数据得到的指数与成交量的走势图。
图中红色线代表上证指数的走势图,绿色线代表成交量的指数图。
两条线的的整体趋势相近,可以看出线性相关性不是很好。
表5为使用SPSS软件根据2009年日开盘与成交量的数据得到的短期的指数与成交量的描述性统计量,表6为得到的上证指数与成交量的相关性。
从表中可以看出Pearson相关系数为r=0.291。
当Pearson相关系数r的取值为在0.20-0.39之间时为低度相关。
可以看出指数与成交量在短期内的相关性不是很好。
图52009年上证指数与成交量的走势图
表52009年上证指数与成交量的描述性统计量
均值
标准差
N
开盘(x)
成交量(y)
2758.835205
1.53E8
432.5977768
3.905E7
244
244
表62009年上证指数与成交量的相关性
开盘(x)
成交量(y)
开盘(x)
Pearson相关性
显著性(双侧)
平方与叉积的和
协方差
N
1
4.548E7
187140.837
244
.291**
.000
1.194E12
4.915E9
244
成交量(y)
Pearson相关性
显著性(双侧)
平方与叉积的和
协方差
N
.291**
.000
1.194E12
4.915E9
244
1
3.705E17
1.525E15
244
从上述所有图中可以看出,指数与成交量的长期相关性很好,具有一定的线性相关性。
但是在短期内,指数与成交量的相关性不是很好。
只是走势大体相同。
但是经过做取均值处理将曲线平滑之后,可以看出短期内的线性相关性得到很好的改善。
2.问题2
2.1X在不同时期的生存函数S(r)的估计与比较
本文选取了从2000年-2011年的上证指数进行分析,我们采用相对收益率替代股市指数涨跌点数,即:
我们得到数据的方法如表7:
表7
时间
股指收盘价
每日收益率r(%)
连涨的收益率(%)
连跌的收益率
(%)
01/04/2000
1368.7
0
0
0
01/05/2000
1407.8
2.8589
2.8589
0
01/06/2000
1406
-0.12715
0
-0.12715
01/07/2000
1477.2
5.0582
9.7938
0
01/10/2000
1531.7
3.6936
0
0
01/11/2000
1547.7
1.042
0
0
01/12/2000
1473.8
-4.7756
0
-9.2294
01/13/2000
1437.5
-2.4638
0
0
01/14/2000
1426.2
-0.78124
0
0
01/17/2000
1409
-1.2088
0
0
01/18/2000
1436.9
1.9802
1.9802
0
连涨的收益率xi和连跌的收益率yi数学表达式如下:
令:
k0=0
(5)
(6)
(7)
(8)
X的生存函数S(r)的定义是股指连续上涨的收益率X大于r的概率,即
(9)
它可用连涨收益率大于r者所占的比例来估计:
(10)
X在不同成交量下的生存函数S(r)的经验估计如图4:
图4不同成交量下的生存函数S(r)的经验估计
从图4中可以看出,不同的成交量下连续上涨的收益率X的生存函数是不同的。
成交量大的时期生存函数曲线较平缓,表示股指涨的较高;成交量小的时期生存函数曲线较陡,表示股指上涨的相对较小。
这说明成交量对指数存在着影响。
2.2.模型的建立
本文把连涨或连跌时的成交量V,即连涨或连跌的每日成交量之和,作为协变量来研究连涨连跌的股指与成交量之间的关系。
我们把成交量划分为大成交量和小成交量两种情形,来分析在不同成交量下连涨的收益率X的生存函数。
那么如何从数学上来表示它们之间的这种关系呢?
可以利用位置尺度模型:
假如X的分布是:
(11)
那么
(12)
其中
称为标准对数伽玛分布,其密度函数为:
(13)
一般假设尺度参数λ受协变量即成交量v的影响,并且假设是一种线性关系,而形状参数k与协变量没有多大影响。
即
(14)
进一步假设为:
(15)
可以用极大似然估计和最小二乘法二种方法得到参数值,但是极大似然法中不容易求解极大似然方程,而最小二乘法可以很容量得到参数值。
在这里可得到
,
,其中成交量的单位为百万手。
这样带有协变量即成交量V的连涨收益率X的分布为:
带有协变量即成交量V的连跌收益率Y的分布为:
2.1上涨阶段的实证分析
抽取2000年—2010年之间两组成交量不同的数据做预测分析,得到两种不同成交量下的连涨的股指收益率X的生存函数曲线如图5:
图5:
两种成交量下的连涨收益率X的生存函数曲线
从预测的不同成交量的生存函数曲线中可以看出,红色曲线代表成交量大的生存函数曲线,生存函数曲线较平坦,表示股指涨得较高,蓝色曲线代表成交量小的生存函数曲线,生存函数曲线较徒,表示股指相对上涨得较小。
2.2.下跌阶段的实证分析
抽取2000年到2010年两组不同成交量数据对模型进行实证分析,得到图6。
图6两种成交量下的连跌收益率Y的生存函数曲线
从图中可以看出,成交量大的时候,曲线下跌的速率较慢,表明股指下跌的较慢,而成交量小的时候,曲线下跌的速率较快,表明股指下跌的较快。
3.问题3
股市中有句老话:
“技术指标千变万化,成交量才是实打实的买卖”。
影响股票市场价格变化的因素是多方面的。
但是,决定股价涨跌的主要力量仍然是来自股票市场自身的买卖活动。
传统的理论认为,量价配合的市场是相对稳定的,而若二者发生背驰,则蕴含市场发生反转的可能,并且在一般情况下,量在价先。
在正常的情况下,股价的变化与成交量的变化成正比关系。
这就是说当股价上涨,伴随着成交量的稳步放大;当股价下跌,伴随着成交量的逐渐缩小。
股价的上涨和下跌是由成交量推动着,成为其涨跌的内在力量。
股价指数与成交量同步涨跌,并且几乎同时出现阶段性高点和低点。
即达到上涨的“死亡”点和下跌的“死亡”点。
无论在何种情形下,指数收盘价和成交量之间都存在着协整关系,表明这二者在长期内的确遵循着一种均衡,而且研究进一步表明指数与成交量从长期来看是呈正相关的。
成交量与股票的走势几乎同步,成交量可以作为股票价格的先行指标或预警指标,从而来预测股票价格的未来走势。
我们可以通过成交量来选择股票,成交量大代表这支股票的价格将会继续上涨,股民可以选择考虑买进。
相反成交量小则代表这支股票的价格有可能会下跌。
但是也不排除风险的可能,成交量大有可能是即将达到上涨的“死亡”点,这个时候买进将面临着股指的下跌。
成交量小也有可能是在下跌的“死亡”点。
股指将会上涨。
虽然成交量可以预测股票价格的未来走势,但是股民们在选择股票时还是要慎重考虑。
六、模型优缺点分析
6.1模型优点
1.使用相对收益率r来代替股票的涨跌点数,能够对股指进行长时间内的统计比较。
2.通过比较两组不同成交量的生存函数曲线估计成交量对指数的影响
3.
6.2模型的缺点
1.使用上证指数中的开盘价或者收盘价来代替股指,具有一定的偶然随机性。
2.没有分析风险因子对生存时间的影响
3.
参考文献
[1]盛骤,谢世千,潘承毅.概率论与数理统计.高等教育出版社,2010.
[2]王启华.生存数据统计分析.科学出版社,2007.
[3]刘宪.生存分析模型与应用.高等教育出版社,2010.
[4]杜强,贾丽艳.SPSS统计分析从入门到精通.人民邮电出版社,2011.
[5]卓金武.MATLAB在数学建模中的应用.北京航空航天大学出版社,2011.
[6]王闯,陈卫华.关于成交量对股票指数预测的有效性研究.中南财经政法大学研究生学报,2011
(2).
[7]李大潜.中国大学生数学建模竞赛(第二版).高等教育出版社,2001.
[8]齐欢.数学建模方法.华中理工大学出版社,1996.
[9]叶其孝.大学生建模竞赛辅导教材.湖南教育出版社,2001.
[10]袁震动,洪渊,林武忠.数学建模.华东师范出版社,1997.
[11]韦纪麟.数学建模——方法与范例.西安交通大学出版社,2000.