随机过程及其应用结课论文.docx
《随机过程及其应用结课论文.docx》由会员分享,可在线阅读,更多相关《随机过程及其应用结课论文.docx(18页珍藏版)》请在冰豆网上搜索。
随机过程及其应用结课论文
硕士研究生课程结课论文
《随机过程》
姓名:
xxxx
学号:
xxxx
年级:
14级
学科(领域):
数学
培养单位:
理学院
日期:
2014年11月12日
教师评定:
综合评定成绩:
任课教师签字:
基于时间序列分析的股票预测模型研究
摘要:
在现代金融浪潮的推动下,越来越多的人加入到股市,进行投资行为,以期得到丰厚的回报。
所谓股票预测是指:
根据股票现在行情的发展情况地对未来股市发展方向以及涨跌程度的预测行为。
时间序列数据因为接受到许多偶然因素的影响,会常常表现出随机性,在统计学上称之为序列的依赖关系。
在股票市场上,时间序列预测法常用于对股票价格趋势进行预测,为投资者和股票市场管理方提供决策依据。
本文主要介绍了时间序列分析方法的概念,特点及时间序列模型,包括建模时对数据时间序列的预处理、及模型预测等。
并通过对时间序列分析的实证研究分析,建立时间序列模型,其中包括ARIMA等模型,进行误差分析,说明时间序列分析的方法对于股票价格的预测趋势有一定的参考价值。
关键词:
股票,预测,时间序列分析,ARIMA模型
Studyonpredictionmodeloftimeseriesanalysisbasedonthestock
BianXiaofei
(HeiLongJiangUniversityofscienceandtechnology,HarbinCity)
Abstract:
Inthemodernfinancialwave,moreandmorepeoplejointhestockmarkettoinvest,expectingtogetrichreturn,whichhasgreatlypromotedthestockmarket’sprosperity.Theso-calledstockforecastisdefined:
withthehelpofthestock’srecentcondition,we’llpredictthefuturestock’sdevelopment,includingitslaterdevelopmentdirectionsandfluctuations.Time-seriesdataoftenshowsomekindsofrandomnessanddependencebetweeneachotherbecauseoftheinfluenceofvariousaccidentalfactors.Timeseriesanalysisisoftenusedtopredictthestockprice,whichprovidesdecision-makingbasisforinvestorsandthestockmarketmanagers.
Thisthesismainlyintroducestimeseriesanalysistheory,includingitsnotion,characteraswellastheexpressionanddescriptionofsomemodelsderivedfromit,includingmethodofdatasimulation,methodofparameterestimationandmethodoftestingdegreeoffittingandarrangethembythenumbers.Thereforewecanestablishsomemodels,includingARIMAmodelandsoon.Whilethroughthisempiricalresearchanalysis,wecouldprovethatthemethodhassomevalueforpredictingthestock’strendbymeansofmodelfittingeffectanderroranalysis.
Keywords:
stock,predict,timeseriesanalysis,ARIMAmodel
1引言
股票是股份公司(包括有限公司和无限公司)在筹集资本时向出资人发行的股份凭证,代表着其持有者(即股东)对股份公司的所有权。
股票市场是已经发行的股票按时价进行转让、买卖和流通的市场,包括交易所市场和场外交易市场两部分。
由于它是建立在发行市场基础上的,因此又称作二级市场。
相比而言,股票流通市场的结构和交易活动比发行市场更为复杂,其作用和影响也更大。
自从股票市场出现之后,一些投资者就积极研究其发展规律和发展趋势,并希望从中获得巨大的经济利益。
1.1研究背景
股票价格的预测技术历史悠久,近年来有越来越多的学者假如到这个行列,所以又出现了很多的新方法与新理论。
尽管有很多的理论与技术出现,但总的来说,分为基本分析理论和技术分析理论两大类。
基本分析的宗旨是对于现行的股票的价格是否合理作出假设并由此描述出长期的发展趋势,而技术分析对于投资者来说是为了把握时间上的合理度,即分析投资者何时可以买进何时可以卖出,为投资者提供决策分析。
1.2研究意义
美国有最发达的股票市场,大规模,多层次,以机构投资者为主,与实体经济发展息息相关,以及监管严格,投机性小等特点。
基于以上市场成熟性的特点,并且由于时间序列分析在研究金融市场的一些显著优势,使得我们利用此理论预测金融市场有了非常大的必要。
而相对于美国发达的股票市场和严格的监管制度,我国的证券市场还不成熟,所以时间序列分析理论对分析研究我国金融市场就显得更加重要。
1.3选题依据
本论文之所以采用时间序列的分析方法,其考虑有以下几点,时间序列分析理论的模型比较多,其中的模型不但可以描述平稳时间序列也可以描述非平稳序列,可选择性较强;第二,拟合的精度也比较高,它把拟合模型产生的误差也计算入内;第三,模型很好地反映了序列值之间的关系。
时间系列的分析方法对于股票价格的预测在实际应用中确实有很好的应用价值。
采用各类时间序列统计模型的主要目的就是较大限度地综合利用股票的历史数据信息,尽可能提高预测精度,尤其在经济、管理和统计研究领域,已成为改进和提高预报精度的重要途径。
2时间序列分析的理论
2.1时间序列分析的问题
作者阐述时间序列的特点主要有以下几点:
第一,时间序列中的序列值按照时间的先后顺序排列,但有可能不是关于时间的函数;第二,序列的取值有一定的随机性,不太可能用以前的数据精确预测;第三,相邻时刻有一定的相关性,即在系统学上称之为动态规律性;第四,序列从整体上看一般出现某种趋势或周期性变化的现象。
作者阐述时间序列分析的基本思想是能够利用序列中的观察数据,建立数学模型,可以比较准确地呈现出数据之间的动态依存关系,并以此来预测。
2.2确定与随机性时间序列分析
时间序列依据其特征,有以下几种表现形式,并产生与之相适应的分析方法:
(1)长期趋势变化:
受某种基本因素的影响,数据依时间变化时表现为一种确定倾向,它按某种规则稳步地增长或下降。
使用的分析方法有:
移动平均法、指数平滑法、模型拟和法等;
(2)季节性周期变化:
受季节更替等因素影响,序列依一固定周期规则性的变化,又称商业循环。
采用的方法:
季节指数;(3)循环变化:
周期不固定的波动变化;(4)随机性变化:
由许多不确定因素引起的序列变化。
它所使用的分析方法就是时间序列的分析方法。
2.3时间序列的概念及性质
2.3.1平稳性
定义设
,对任给的
,n维随机变量
的联合分布函数:
下面简单介绍一下几个常用的特征统计量:
(1)均值函数:
;
(2)方差函数:
;
(3)自协方差函数:
;
(4)自相关系数:
2.3.2平稳时间序列
定义:
设
为一时间序列,对任意正整数m,任取
,对任意整数τ,有
,则称序列
为严平稳时间序列。
定义:
如果
满足如下三个条件:
则称
为宽平稳时间序列。
2.3.3平稳时间序列的统计性质
定义:
对于平稳时间序列
,任取
,定义
为时间序列
的延迟k自协方差函数:
。
延迟k自相关函数的概念:
2.3.4平稳性的检验
一般有两种检验平稳性的方法,第一种是描绘时序图和自相关图,根据图上的特征进行判断,另一种是计算出序列的特征统计量进行判断。
第一种方法比较简单,也容易操作,但是带有一定的主观性,故最好使用统计量进行检验的方法来对序列的平稳性进行判断。
时序图检验:
由于平稳序列的均值、方差均为常数,所以时序图中显示的序列的均值应该一直在一个常数附近波动,并且波动的范围不太大,始终保持在一定的范围之内。
自相关检验:
这就是利用自相关图判断序列平稳与否的准则。
2.3.5纯随机性检验
时间按序列经过平稳性检验可以分为平稳时间序列与非平稳时间序列两大类。
可是如果序列的当前值与过去值没有之间没有密切的关系,也就是说,历史数据与以后的数据没有一定的影响,那这样的序列对于我们来说就没有了继续分析的必要,即此序列是白噪声序列。
白噪声序列被定义为:
如果时间序列
满足以下性质:
称序列
为纯随机序列,也称为白噪声(whitenoise)序列。
3平稳时间序列分析
如果一个时间序列经过纯随机性检验被认定是平稳非白噪声序列,可以认为这个序列蕴含着相关的信息,并通过建立线性或非线性模型来模拟此序列的发展趋势,对序列中的有效信息进行提取。
3.1ARMA模型
ARMA模型可以分为AR模型、MA模型和ARMA模型三种。
3.1.1AR模型
定义具有如下结构的模型称为p阶自回归模型,简记为AR(p):
AR(p)模型通常简记为:
AR模型平稳性判别方法主要有以下两种:
(1)特征根判别法:
对于一个AR(p)模型而言,平稳的充要条件是它的特征方程的p个特征根都在单位圆内,并且由自回归系数多项式的根与特征根成倒数的特点,相应的等价判别条件是其自回归系数多项式的解无一例外都在单位圆外。
(2)平稳域判别法:
对于一个AR(p)模型而言,如果没有平稳性的要求,实际上也就意味着对参数向量
没有任何限制,可以通过取遍p维欧式空间的任意一点,但是如果加上了平稳性限制,参数向量
就只能取p维欧式空间的一个子集,使得特征根都在单位内的系数集合:
。
平稳AR模型的统计特性:
均值:
如果AR(p)满足平稳性条件,可以推导出
。
方差:
要得到平稳AR(p)模型的方差,需要借助Green函数。
协方差函数的递推公式:
平稳AR(p)模型的自相关系数递推公式:
3.1.2MA模型
定义具有如下结构的模型称为q阶移动平均(movingaverage)模型,简记为MA(q):
MA(q)模型的一些统计性质:
常数均值:
常数方差:
MA模型的可逆性:
可逆MA模型定义为若一个MA模型能够表示称为收敛的AR模型形式,那么该MA模型称为可逆的MA模型。
其中MA(q)模型的可逆条件是:
MA(q)模型的特征根都在单位圆内
,等价条件是移动平滑多项式的根都在单位外
。
3.1.3ARMA模型
定义:
ARMA(p,q)模型被称之为自回归移动平均模型,其结构如下,简记为:
ARMA(p,q)模型的统计特性:
均值:
协方差:
自相关系数:
从ρ(k)的表达式能够断定ARMA(p,q)的自相关系数是不截尾的,与它能够变换成无穷MA模型是相同的;同理,我们也可以得出ARMA(p,q)的偏相关系数也不截尾。
考虑AR(P)模型、MA(q)模型、ARMA(p,q)模型自相关系数和偏自相关系数的性质,可以总结出以下的规律:
3.2平稳序列建模
如果一个时间序列通过数据的预处理、纯随机性检验得出该序列为平稳非白噪声序列,那么此时就可以通过下面的流程建立模型:
4非平稳序列分析
4.1确定性成分
传统的确定性因素分解为长期趋势、循环波动、季节性变化和随机变化,然而人们在对多种时间序列进行分析时,经常发现长期趋势与没有固定周期的变化比较不容易辨别,另一方面,季节性波动与有固定周期新的变化又比较难以识别,所以现在一般讲确定性因素分解为长期性趋势波动、季节性变化和随机波动。
一般来讲,刻画确定性成分的目的就是,在不受其他外界因素的干扰的情况下,单纯的量化某一个确定性成分对整个序列的影响,并分析各种确定性成分之间的相互作用,以及总体确定性成分对序列的影响。
4.1.1趋势成分
趋势分析方法的目的一般是由于某些时间序列具有非常明显的趋势,而我们要对序列的趋势进行拟合,就会使用一定的拟合方法,一般经常使用的方法有两种,一种是趋势拟合法,另一种是平滑法。
趋势拟合法,顾名思义,就是拟合建立以序列值为因变量,时间为自变量的函数。
可以分为两大类,一类称作线性拟合,另一类称为非线性拟合。
而对于非线性拟合,有两种常见的方法,一种是如果非线性可以转换成线性的,则转化成线性进行拟合;另外一种方法是,对于不能转化成线性模型的,可以采用迭代法来估计模型的参数。
4.1.2季节效应分析
季节效应的一半模型可以表示如下:
计算周期内的各期平均数:
计算季节指数:
4.2非平稳序列的随机分析
4.2.1差分
差分是一种行之有效的的提取序列中信息的方法,对与差分运算来讲,实际上是使用了自回归的方法。
如果序列中可以分析出明显的线性趋势,那么使用一阶差分就可以是序列平稳,假如序列中有不明显的曲线趋势,一般二阶或者三阶差分后的序列就可以提取序列的曲线影响。
当然,对于含有周期性的时间序列来讲,可以使用周期数的k步差分,然后观察序列的平稳与否。
一般地,通过这些方法,可以很有效地分析出序列中的有效信息。
4.2.2ARIMA模型
定义ARIMA(p,d,q)模型可以定义为具有如下结构的模型,记为:
特别地:
当d=0,ARIMA(p,d,q)=ARMA(p,q);
当p=0,ARIMA(p,d,q)=AMA(d,q);
当q=0,ARIMA(p,d,q)=ARI(p,d);
当d=1,p=q=0,ARIMA(p,d,q)为随机游走模型。
4.2.3ARIMA模型建模
ARIMA模型一般是按照以下流程进行:
4.2.4异方差及方差齐性变换
使用ARIMA模型拟合非平稳序列时,对残差有一个很重要的假定——残差序列
为零均值白噪声序列。
也就是说,残差序列需要满足以下三个条件:
假如时间序列中出现异方差的情况,可以对异方差进行以下处理:
(1)假如已知异方差函数的具体形式,进行方差齐性变化;
(2)假如不知异方差函数的具体形式,拟合条件异方差模型。
4.2.5条件异方差模型
在研究宏观经济数据或是金融数据时候,经常会发现所建立的时间时间序列模型的方差不够稳定,大的误差和小的误差会出现很多次。
此时很有可能就是序列中出现了异方差的情况,造成了估计值出现偏差的情形。
这种情况会经常出现在金融市场研究数据、宏观经济数据当中,在特定的某段时间里,预测的误差会相对地大,但是在另一段时间里,预测的误差又会出现相对比较小的情况。
出现这种情况的原因很可能和国家的宏观经济政调控整和金融市场政策的改变有关,此时方差会出现短期的相关性。
ARCH(q)模型的一般结构为:
ARCH模型实质上是使用误差平方和序列的q阶移动平均拟合当期异方差函数值。
对于移动平均模型来讲,因为其自相关系数q阶截尾,那么可以得出ARCH模型对异方差函数的短期自相关还是比较适合的。
5基于时间序列分析的股票预测模型的实证分析
5.1关于样本数据的描述与调整
原始数据,也就是没有经过任何清洗的数据。
本章所做研究的数据为美国道琼斯指数的收盘价,因为美国的证劵历史悠久,数据来源丰富,有比较好的预测价值。
原始数据为2007年6月4日到2008年5月19日美国证交所公布的道琼斯指数的收盘价,数据来源RESSET金融研究数据库。
将原始数据分为两部分,一部分作为训练数据,另一部分作为检验数据。
首先根据试训练据建立时间序列模型,进行预测行为;然后对预测数据与检验数据进行比较,分析误差,优化模型。
原始序列为下图所示:
分析上面的图像可知这是一个非平稳的时间序列,需要对此进行差分,一阶差分后的序列为:
观察差分后的序列,可以主观上近似的认为该序列是平稳的时间序列,在客观上,我们利用SAS/ETS对此序列计算自相关系数与偏自相关系数,结果如下图所示:
并分析白噪声序列:
对于延迟6步和12步来说,
(设置阈值为0.05),则知对于差分后的序列为非白噪声序列,即该序列中隐含有效的信息,可继续对此序列进行分析。
经观察可建立ARIMA(2,1,2)模型,结合模型参数显著性分析,其检验结果为:
由于ARIMA(2,1,2)模型不显著,故可以将模型改为ARIMA(2,1,1),此时模型显著性分析为:
即模型显著。
模型参数检验为:
即模型参数显著。
所以一阶差分后的序列表达式为:
利用此模型对道琼斯指数进行10步预测,可以得到:
其趋势图为下图所示:
其中蓝线表示原序列图,红线表示预测的序列图,上下绿线表示95%的置信区间。
可以分析出,红线序列图有下降的趋势,这样对股票投资者有一定的参考价值(即规避风险)。
5.2结论
通过以上的实证分析研究发现时间序列分析方法确实是研究股票指数的一种非常好的方法,时间序列分析方法的目的就是分析时间序列之间的规律,以期找到预测和决策的依据。
本章采用的时间序列的分析方法不仅考察了股票指数的收盘价的过去值与当前值的关系,同时对模型同拟合产生的误差也作为重要因素进入模型,有利于提高精度;其次可以用来描述任何非平稳的时间序列模型;再次,可以很好的描述时间序列的短期相关性;第四,利用SAS/ETS模块对股票数据进行统计分析很好地克服了统计模型中解释变量多的缺点。
本章正是基于较为成熟的时间序列分析理论的分析、总结的基础上对美国证券的道琼斯指数进行实证分析,找出它们是否有长期稳定的关系,从而给出一定意义的预测分析。
本章中的模型都很好地模拟了时间序列,也具备了很好的预测效果。
但是发现随着预测步长的增加,预测的精度会出现不同程度的下降,而且如果时间序列值发生变化的话,模型的结构和模型的参数值也会相应的发生改变,这说明股票价格趋势的波动模式具有易变性与短期稳定性,即模型对样本具有敏感性。
由于模型是基于局部数据进行建立并进行预测,不能技术反映股票市场最新的状况,即不能做到及时更新金融数据的及时更新,如果我们可以随时将股票市场的数据输入,就可以做到及时更新的情况,就可以很方便快捷的为决策者提供相应的决策支持服务。
另一方面,由于模型的表达式中变量比较多,拟合优度可能会因为差分而损失掉,这也是时间序列分析理论的固有缺陷之一。
参考文献
[1]GeorgeE.P.Box,岚译.时间序列分析预测与控制(第三版).国统计出版社,2002
[2]王振龙.时间序列分析[M].北京:
中国统计出版社,2006
[3]PeterJ.Brokwell,田铮译.时间序列的理论与方法(第二版).高等教育出版社.2006
[4]臧玉卫,张慎,吴育华.中国股票市场的非线性分析[J].天津大学学报(社会科学,2005,(6):
34-37P.
[5]TerenceC.Mills,俞卓菁译.金融时间序列的经济计量模型(第二版).经济科学出版社,2003
[6]杨一文,刘忠贵.基于神经网络、多分辨分析和动力学重建理论的股市趋势预测[J]系统工程理论与实践,2001
[7]JohnR.AmodifiedbathtubcurvewithLatentFailures,ProceedingsAnnualReliabilityandMaintainabilitySymposium,1995
[8]DurrlemanV,NoleghbaliA,RoncalliT.WhichCopulaistherightone.2000
[9]GenestC,Rivest.StatisticalInferenceProceduresforBinvariateArchimedeanCopulas.JournalofAmericanStatisticalAssociation,88(423),1034-1043P.
[10]张世英.协整理论与波动模型:
金融时间序列分析及应用,清华大学出版社,2005
[11]马薇.协整理论与应用[M].21世纪数量经济学方法论与应用丛书,南开大学出版社,2004
[12]靳庭良.单位根检验程序的改进研究[M].西南财经大学出版社,2006
[13]董言治.基于Matlab的时间序列分析与动态数据建模[J].计算机工程,1999,(4)
[14]李育安.如何用SAS产生时间序列数据[J].工作视点,2007,(3):
43—46P.
[15]王燕.应用时间序列分析[M].北京:
中国人民大学出版社,2008
[16]朱世武.基于SAS系统的金融计算[M].北京:
清华大学出版社,2004