ImageVerifierCode 换一换
格式:DOCX , 页数:17 ,大小:653.90KB ,
资源ID:15931196      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/15931196.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(时间序列分析课程报告文档格式.docx)为本站会员(b****6)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

时间序列分析课程报告文档格式.docx

1、列分析理论和方法更趋完善。具体而言,按照时间的顺序把随机事件变化发展的过程记录下来就构成了一个时间 序列。对时间序列进行观察、 研究,找寻它变化发展的规律, 预测它将来的走势就是时 间序列分析。简言之,时间序列分析的基本思想是根据系统有限长度的历史记录 (即已知的观察数据),建立能够比较精确地反映时间序列中所包含的动态依存关系的数学模 型,并借以对系统的未来行为进行预测。典型的时间举例如下图所示:1950 1955 I960 1965 1970 1975 1980美国的罢工数.1951 - 1980(美国劳工部劳工统计局h1770 I78Q 1790 1800 U10 1820 130 184

2、0 1850 186U IM70Wdller X阳黑子数 J770 - 1869.图2.17701869年间太阳黑子数统计从模型构建的基础上讲, 时间序列中的每个观察值大小, 是由各种不同因素在同一时刻发生作用的综合结果。从这些影响因素发生作用的大小和方向变化的时间特性来看, 这些因素造成的时间序列数据的变动分为下面几种:趋势性:某个变量随着时间进展, 呈现一种比较缓慢而长期的持续上升或者下降或者停留的不同属性的变动趋向, 这种变动使得时间序列随机变量的方差在逐渐变化, 进而凸显出一定的统计规律;周期性:时间序列由于外部或者内部变量的影响随着时间的延伸, 交替地出现高峰与低谷的规律;随机性:由

3、于随机白噪声的影响使得时间序列呈现出统计意义上的随机性;因为时间序列本身的特点,常见的基本分析模型有下面几种:1)P阶自回归模型(AR(p)即当前时刻的序列值由过去序列值的线性组合以及当前随机噪声构成;2)Q阶滑动平均模型(MA(q):即当前时刻的序列值由过去的随机噪声和当前随机噪声构成; -13)ARMA 模型(p,q):即包含上述两种影响的时间序列问题, 当前时刻值受过去的序列值以及过去的噪声和当前的噪声影响;4)ARIMA 模型(p,d,q):由Box与Jenkins于上世纪七十年代提出, ARIMA的含义是单积自回归移动平均过程,其含义为:假设一个随机过程其经过 d次差分后可以变换为一

4、个平稳的自回归滑动平均过程, 则该随机过程称为单积(整)自回归移动平均过程,其关键在于通过次数不多的差分使得非 平稳的时间序列模型转化为平稳的时间序列模型 (即普通ARMA模型)。5)其他模型:更为一般的非线性模型,如门限自回归、马尔科夫链;动态系统模型 ,如Kalman滤波,多层递阶预测;多元回归模型;变量场预测模型;当然在实际应用中时间序列的分析方法远不止上述所列的, 这里只是对基本的模型进行概述。时间序列在各个领域都有所应用, 其中典型的应用领域就包括经济学的相关预测, 信号处理领域,大数据挖掘以及气象信息预测等。举例而言,就经济学领域, 诸如在证券领域中得到的观测数据列一般都具有较强的

5、时间变化趋势, 股票价格的数据都是以时间序列的形式出现的。因此,采用时间序列分析法对股市数据进行分析预测是可行的,并且很多文献都 说明了它的有效性;除此之外间序列分析方法在数据挖掘中的应用也取得了一定的进展。 研究者们利用数据挖掘对象,根据时间序列分析方法,提出了基于模糊集合的数据挖掘时间序 列模式算法以及结合当下主流机器学习方法, 比如支持向量机,随机森林等等;还有的则根据某些时间序列所具有的分形特征,分析了利用分形理论中的 R/S分析,发现具有分形特征的时间序列模式的方法;这些方法通过对大型数据库的海量数据分析提出了进行时间序列 模式挖掘的算法,为用户的决策支持和趋势预测提供了依据。 在气

6、候预测领域,基于均生函数的时间序列预测延伸出了很多在气候分析及预测上有很好效果的模型, 实验结果表明这类模型不但能较好地拟合历史实而且对未来 15年的演变趋势也具有一定的预报能力 2。图3.时间序列分析在天气预测中的举例基于R的乘客人数预测本文希望通过借助于 R平台,结合时间序列分析的基本方法,展现对于一般的非平稳 模型的建模分析过程,借此加深对时间序列分析本身的理解以及相关理论知识的算法标准化, 有助于后续对于时间序列分析的应用。首先,本文的数据来源 R本身的数据集AirPassengers ” ,其中包含了 1949-1960年每个月国际航空的乘客数量的数据, 该数据集的特点为具有季节性和

7、趋势性, 是一种非平稳的时间序列,因此大致的思路是通过差分使得数据变得平稳,然后借助 ARIMA模型来实现对规律的预测和分析。 下图展示了该数据集:Feb1仙工AprJunJulAugSepCcttlovDec19911211813212921135148136119104195011512&14113S12 S149170153133114140195114515011631721781991841621661552171iso193131J.8321S2302422 0&191154155323623S2292432 642722 371802Q1155420-41882352272342

8、63 u 二2 93203t195522233267265270315364S47S122742372782642*3173133744134 j55 =3027115S?31S3013S63483SS4224 6S4 674043730S3319583403183总34 354315054 0435931033719593034 2406396-9204725485594 6332405I96041?3914194172535622i5oe461390432图4国际航空乘客数据集概览首先,我对本文中涉及的数据进行时间序列的绘制, 观察变量的总体趋势,并且拟合一条直线,通过这条拟合直线可以大致

9、看出序列的趋势性;图5.乘客人数从19491960的整体变化情况从图上我们可以看出,随着时间轴的延伸,乘客人数是在逐渐递增的, 这是大趋势,从拟合直线的走势可以看出来, 这表明随着经济的逐步发展, 越来越多的人们选择乘飞机去往世界各地,因此也符合现实情况的预期;除此之外,我们可以看到,在每一年的周期内部, 乘客人数的变化也呈现出一定的规律性,大致是在每年的 7,8月左右达到人数值的顶峰,这个我们在后面会做更精确的验证。 总体而言,该数据满足具有季节性和趋势性的特点, 是一种典型的非平稳数据。紧接着,我通过一个均值函数,求出这些年 12个月份的乘客人数在每个月份点上的均值,并绘制如下的箱线图:图

10、7乘客月平均人数箱线图从上图可以看出,一年十二个月份中,每年的 7, 8月份是航空出行的旺季,因此我们也可以借此推测,每年的暑假阶段出行游览的人数较多,这也符合现实生活中的实际情况。 因此,我们可以从简单的绘图以及对比, 发现一些简单的推论, 这些基于数据的合理推论也能给我们的现实生活产生一定的指导意义。图8.未处理原始数据的自相关函数和偏相关函数由自相关函数和偏相关函数, 可以看出该时间序列不是平稳的, 因为其自相关函数和偏 相关函数并未呈典型的指数衰减,不能断定其是截尾的还是拖尾的。因此就上述分析而言,需要对原始数据进行差分,使得整体的序列呈现平稳性。为了使得数据更加符合正态性, 在进行差

11、分之前,我对原始的数据取对数之后在进行一阶差分;图9一阶差分之后的自相关函数和偏相关函数但是因在经过一阶差分之后,可以看出序列的衰减因而可以大致确定确定模型的阶数;为R内置了自动确定模型阶数的函数,因此我们这里直接调取函数。这里我根据序列的数据集大小采用了两种不同的处理方式, 一种是选取包含原始所有数据的数据集, 即通过原来所有的数据来预测下一个周期(即下一年)的乘客人数;另一种则是选取前十一年的数据作为 样本集训练时间序列模型, 剩下后一年的数据作为对比, 相当于一个测试集来验证模型的预测效果。前者的处理是为了模型能够有充足的输入来拟合模型实现更精确的预测, 而后一种则是借助训练集和测试集的划分来验证模型的预测性能, 能够给出一定的泛化性能指标,这样即能够兼顾预测结果的完备性,也能够反映模型本身的性能优劣。1)全序列:原始样本包含了所有的十二年的数据,序列长度为 144 ;根据R自带的ARIMA模型参数自动匹配函数,最后有两组模型参数被选出来,即分别对应时间序列分析模型的两组 (p,d,q),预测的置信区度为 99.5% :1)第一个模型:(0,1,1)其预测结果如下图所示:模型参数检验如下及预测效果如下, 蓝色部分为模型的预测下一个周期的乘客人数, :Csll:atiita (x AirPAssenaers, order

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1