时间序列分析课程报告文档格式.docx

上传人:b****6 文档编号:15931196 上传时间:2022-11-17 格式:DOCX 页数:17 大小:653.90KB
下载 相关 举报
时间序列分析课程报告文档格式.docx_第1页
第1页 / 共17页
时间序列分析课程报告文档格式.docx_第2页
第2页 / 共17页
时间序列分析课程报告文档格式.docx_第3页
第3页 / 共17页
时间序列分析课程报告文档格式.docx_第4页
第4页 / 共17页
时间序列分析课程报告文档格式.docx_第5页
第5页 / 共17页
点击查看更多>>
下载资源
资源描述

时间序列分析课程报告文档格式.docx

《时间序列分析课程报告文档格式.docx》由会员分享,可在线阅读,更多相关《时间序列分析课程报告文档格式.docx(17页珍藏版)》请在冰豆网上搜索。

时间序列分析课程报告文档格式.docx

列分析理论和方法更趋完善。

具体而言,按照时间的顺序把随机事件变化发展的过程记录下来就构成了一个时间序列。

对时间序列进行观察、研究,找寻它变化发展的规律,预测它将来的走势就是时间序列分析。

简言之,时间序列分析的基本思想是根据系统有限长度的历史记录(即已

知的观察数据),建立能够比较精确地反映时间序列中所包含的动态依存关系的数学模型,并借以对系统的未来行为进行预测。

典型的时间举例如下图所示:

19501955I9601965197019751980

美国的罢工数.1951-1980(美国劳工部劳工统计局h

1770I78Q17901800U1018201«

3018401850186UIM70

WdllerX阳黑子数J770-1869.

图2.1770~1869年间太阳黑子数统计

从模型构建的基础上讲,时间序列中的每个观察值大小,是由各种不同因素在同一时刻

发生作用的综合结果。

从这些影响因素发生作用的大小和方向变化的时间特性来看,这些因

素造成的时间序列数据的变动分为下面几种:

趋势性:

某个变量随着时间进展,呈现一种比较缓慢而长期的持续上升或者下降或者停

留的不同属性的变动趋向,这种变动使得时间序列随机变量的方差在逐渐变化,进而凸显出

一定的统计规律;

周期性:

时间序列由于外部或者内部变量的影响随着时间的延伸,交替地出现高峰与低

谷的规律;

随机性:

由于随机白噪声的影响使得时间序列呈现出统计意义上的随机性;

因为时间序列本身的特点,常见的基本分析模型有下面几种:

1)P阶自回归模型(AR(p))

即当前时刻的序列值由过去序列值的线性组合以及当前随机噪声构成;

2)Q阶滑动平均模型(MA(q)):

即当前时刻的序列值由过去的随机噪声和当前随机噪声构成;

-1

3)ARMA模型(p,q):

即包含上述两种影响的时间序列问题,当前时刻值受过去的序列值以及过去的噪声和当前的

噪声影响;

4)ARIMA模型(p,d,q):

由Box与Jenkins于上世纪七十年代提出,ARIMA的含义是单积自回归移动平均过程,其

含义为:

假设一个随机过程其经过d次差分后可以变换为一个平稳的自回归滑动平均过程,则该随机过程称为单积(整)自回归移动平均过程,其关键在于通过次数不多的差分使得非平稳的时间序列模型转化为平稳的时间序列模型(即普通ARMA模型)。

5)其他模型:

更为一般的非线性模型,如门限自回归、马尔科夫链;

动态系统模型,如Kalman滤波,多层

递阶预测;

多元回归模型;

变量场预测模型;

当然在实际应用中时间序列的分析方法远不止上述所列的,这里只是对基本的模型进行

概述。

时间序列在各个领域都有所应用,其中典型的应用领域就包括经济学的相关预测,信

号处理领域,大数据挖掘以及气象信息预测等。

举例而言,就经济学领域,诸如在证券领域

中得到的观测数据列一般都具有较强的时间变化趋势,股票价格的数据都是以时间序列的形

式出现的。

因此,采用时间序列分析法对股市数据进行分析预测是可行的,并且很多文献都说明了它的有效性;

除此之外间序列分析方法在数据挖掘中的应用也取得了一定的进展。

究者们利用数据挖掘对象,根据时间序列分析方法,提出了基于模糊集合的数据挖掘时间序列模式算法以及结合当下主流机器学习方法,比如支持向量机,随机森林等等;

还有的则根

据某些时间序列所具有的分形特征,分析了利用分形理论中的R/S分析,发现具有分形特

征的时间序列模式的方法;

这些方法通过对大型数据库的海量数据分析提出了进行时间序列模式挖掘的算法,为用户的决策支持和趋势预测提供了依据。

在气候预测领域,基于均生函

数的时间序列预测延伸出了很多在气候分析及预测上有很好效果的模型,实验结果表明这类

模型不但能较好地拟合历史实而且对未来1~5年的演变趋势也具有一定的预报能力[2]。

图3.时间序列分析在天气预测中的举例

•基于R的乘客人数预测

本文希望通过借助于R平台,结合时间序列分析的基本方法,展现对于一般的非平稳模型的建模分析过程,借此加深对时间序列分析本身的理解以及相关理论知识的算法标准化,有助于后续对于时间序列分析的应用。

首先,本文的数据来源R本身的数据集"

AirPassengers”,其中包含了1949-1960年

每个月国际航空的乘客数量的数据,该数据集的特点为具有季节性和趋势性,是一种非平稳

的时间序列,因此大致的思路是通过差分使得数据变得平稳,然后借助ARIMA模型来实现

对规律的预测和分析。

下图展示了该数据集:

Feb

1仙工

Apr

Jun

Jul

Aug

Sep

Cct

tlov

Dec

19^9

112

118

132

129

±

21

135

148

136

119

104

1950

115

12&

141

13S

12S

149

170

153

133

114

140

1951

145

150

1"

163

172

178

199

184

162

166

1552

171

iso

193

131

J.83

21S

230

242

20&

191

154

1553

236

23S

229

243

264

272

237

180

2Q1

1554

20-4

188

235

227

234

26^

3u二

293

203

t

1955

2^2

233

267

265

270

315

364

S47

S12

274

237

278

264

2*

317

313

374

413

4j5

^5=

30€

271

15S?

31S

301

3S6

348

3SS

422

46S

467

404

3^7

30S

33€

1958

340

318

3总3

435

■431

505

404

359

310

337

1959

3€0

342

406

396

-920

472

548

559

463

3€2

405

I960

41?

391

419

4€1

^72

535

622

€€i€

5oe

461

390

■432

图4•国际航空乘客数据集概览

首先,我对本文中涉及的数据进行时间序列的绘制,观察变量的总体趋势,并且拟合一

条直线,通过这条拟合直线可以大致看出序列的趋势性;

图5.乘客人数从1949~1960的整体变化情况

从图上我们可以看出,随着时间轴的延伸,乘客人数是在逐渐递增的,这是大趋势,从

拟合直线的走势可以看出来,这表明随着经济的逐步发展,越来越多的人们选择乘飞机去往

世界各地,因此也符合现实情况的预期;

除此之外,我们可以看到,在每一年的周期内部,乘客人数的变化也呈现出一定的规律性,大致是在每年的7,8月左右达到人数值的顶峰,

这个我们在后面会做更精确的验证。

总体而言,该数据满足具有季节性和趋势性的特点,是

一种典型的非平稳数据。

紧接着,我通过一个均值函数,求出这些年12个月份的乘客人数

在每个月份点上的均值,并绘制如下的箱线图:

图7•乘客月平均人数箱线图

从上图可以看出,一年十二个月份中,每年的7,8月份是航空出行的旺季,因此我们

也可以借此推测,每年的暑假阶段出行游览的人数较多,这也符合现实生活中的实际情况。

因此,我们可以从简单的绘图以及对比,发现一些简单的推论,这些基于数据的合理推论也

能给我们的现实生活产生一定的指导意义。

图8.未处理原始数据的自相关函数和偏相关函数

由自相关函数和偏相关函数,可以看出该时间序列不是平稳的,因为其自相关函数和偏相关函数并未呈典型的指数衰减,不能断定其是截尾的还是拖尾的。

因此就上述分析而言,

需要对原始数据进行差分,使得整体的序列呈现平稳性。

为了使得数据更加符合正态性,在

进行差分之前,我对原始的数据取对数之后在进行一阶差分;

图9•一阶差分之后的自相关函数和偏相关函数

但是因

在经过一阶差分之后,可以看出序列的衰减因而可以大致确定确定模型的阶数;

为R内置了自动确定模型阶数的函数,因此我们这里直接调取函数。

这里我根据序列的数

据集大小采用了两种不同的处理方式,一种是选取包含原始所有数据的数据集,即通过原来

所有的数据来预测下一个周期(即下一年)的乘客人数;

另一种则是选取前十一年的数据作为样本集训练时间序列模型,剩下后一年的数据作为对比,相当于一个测试集来验证模型的预

测效果。

前者的处理是为了模型能够有充足的输入来拟合模型实现更精确的预测,而后一种

则是借助训练集和测试集的划分来验证模型的预测性能,能够给出一定的泛化性能指标,这

样即能够兼顾预测结果的完备性,也能够反映模型本身的性能优劣。

1)全序列:

原始样本包含了所有的十二年的数据,序列长度为144;

根据R自带的ARIMA模型参数自动匹配函数,最后有两组模型参数被选出来,即

分别对应时间序列分析模型的两组(p,d,q),预测的置信区度为99.5%:

1)第一个模型:

(0,1,1)

其预测结果如下图所示:

模型参数检验如下及预测效果如下,蓝色部分为模型的预测下一个周期的乘客人数,:

Csll:

atiita(x»

AirPAssenaers,order

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 幼儿教育 > 幼儿读物

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1