应用时间序列实验报告.docx
《应用时间序列实验报告.docx》由会员分享,可在线阅读,更多相关《应用时间序列实验报告.docx(25页珍藏版)》请在冰豆网上搜索。
应用时间序列实验报告
工程学院课程设计
《时间序列分析课程设计》
学生学号:
学院:
理学院
专业班级:
专业课程:
时间序列分析课程设计
指导教师:
2017年6月2日
考核项目
考核容
得分
平时考核(20分)
出勤情况、实训态度、效率;知识掌握情况、基本操作技能、知识应用能力、获取知识能力
实验一(20分)
完成此实验并获得实验结果
实验二(20分)
完成此实验并获得实验结果
实验三(20分)
完成此实验并获得实验结果
文档资料(20分)
表达能力、文档写作能力和文档的规性
总评成绩
指导教师评语:
1.实验一澳大利亚常住人口变动分析
1971年9月—1993年6月澳大利亚常住人口变动(单位:
千人)情况如表1-1所示(行数据)。
表1-1
63.2
67.9
55.8
49.5
50.2
55.4
49.9
45.3
48.1
61.7
55.2
53.1
49.5
59.9
30.6
30.4
33.8
42.1
35.8
28.4
32.9
44.1
45.5
36.6
39.5
49.8
48.8
29
37.3
34.2
47.6
37.3
39.2
47.6
43.9
49
51.2
60.8
67
48.9
65.4
65.4
67.6
62.5
55.1
49.6
57.3
47.3
45.5
44.5
48
47.9
49.1
48.8
59.4
51.6
51.4
60.9
60.9
56.8
58.6
62.1
64
60.3
64.6
71
79.4
59.9
83.4
75.4
80.2
55.9
58.5
65.2
69.5
59.1
21.5
62.5
170
-47.4
62.2
60
33.1
35.3
43.4
42.7
58.4
34.4
(1)判断该序列的平稳性与纯随机性。
(2)选择适当模型拟合该序列的发展。
(3)绘制该序列拟合及未来5年预测序列图。
1.1实验目的
掌握用SAS软件对数据进行相关性分析,判断序列的平稳性与纯随机性,选择模型拟合序列发展。
1.2实验原理
(1)平稳性检验与纯随机性检验
对序列的平稳性检验有两种方法,一种是根据时序图和自相关图显示的特征做出判断的图检验法;另一种是单位根检验法。
(2)模型识别
先对模型进行定阶,选出相对最优的模型,下一步就是要估计模型中未知参数的值,以确定模型的口径,并对拟合好的模型进行显著性诊断。
(3)模型预测
模型拟合好之后,利用该模型对序列进行短期预测。
1.3实验容
(1)判断该序列的平稳性与纯随机性
时序图检验,根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常识值附近波动,而且波动的围有界。
如果序列的时序图显示该序列有明显的趋势性或周期性,那么它通常不是平稳序列。
对自相关图进行检验时,可以用SAS系统ARIMA过程中的IDENTIFY语句来做自相关图。
而单位根检验我们用到的是DF检验。
以1阶自回归序列为例:
该序列的特征方程为:
特征根为:
当特征根在单位圆时:
该序列平稳。
当特征根在单位圆上或单位圆外时:
该序列非平稳。
对于纯随机性检验,既白噪声检验,可以用SAS系统中的IDENTIFY语句来输出白噪声检验的结果。
(2)选择适当模型拟合该序列的发展
先对模型进行定阶,选出相对最优的模型,下一步就是要估计模型中未知参数的值,以确定模型的口径,并对拟合好的模型进行显著性诊断。
ARIMA过程的第一步是要IDENTIFY命令对该序列的平稳性和纯随机性进行识别,并对平稳非白噪序列估计拟合模型的阶数。
使用命令如下:
procprintdata=example3_20;
IDENTIFYVAR=peoplenlag=8minicp=(0:
5)q=(0:
5);
run;
(3)绘制该序列拟合及未来5年预测序列图
模型拟合好之后,利用该模型对序列进行短期预测。
预测命令如下:
forecastlead=5id=timeout=results;
run;
其中,lead指定预期数;id指定时间变量标识;out指定预测后期的结果存入某个数据集。
利用存储在临时数据集RESULTS里的数据,我们可以绘制拟合预测图,相关命令如下:
procgplotdata=results;
plotpeople*time=1forecast*time=2l95*time=3u95*time=3/overlay;
symbol1c=redi=nonev=star;
symbol2c=blacki=joinv=none;
symbol3c=greeni=joinv=nonel=32;
run;
1.4实验过程
按照实验的过程运行程序,对程序结果的分析如下:
(1)判断该序列的平稳性与纯随机性
图1-11971年9月-1993年6月澳大利亚季度常住人口变动序列时序图
时序图显示澳大利亚季度常住人口围绕在52千人附近随机波动,没有明显趋势或周期,基本可视为平稳模式。
图1-2序列自相关图
自相关图显示该序列的自相关系数一直都比较小,始终控制在2倍的标准差围以,故认为该序列是平稳序列。
图1-3序列的单位根检验结果
根据第五列、第六列输出的结果我们可以判断,当显著性水平
取0.05时,序列非平稳,但当消除线性趋势之后序列平稳。
图1-4白噪声检验输出结果
可以看到延迟6阶、12阶的检验P值均小于0.05,故拒绝原假设,认为该序列为非白噪声序列(非纯随机序列)。
(2)选择适当模型拟合该序列的发展
图1-5IDENTIFY命令输出的最小信息量结果
最后一条信息显示,在自相关延迟阶数也小于等于5的所有ARMA(p,q)模型中,BIC信息量相对于最小的是ARMA(1,3)模型。
图1-6ESTIMATE命令输出的未知参数结果
图1-7ESTIMATE命令输出的拟合统计量结果
图1-8ESTIMATE命令输出的系数矩阵
图1-9ESTIMATE命令输出的残差自相关检验结果
从输出结果可以看出由于延迟各阶的LB统计量的P值均显著大于
(
),所以该拟合模型显著成立。
图1-10ESTIMATE命令输出的拟合模型形式
该输出形式等价于:
或记为:
(3)绘制该序列拟合及未来5年预测序列图
图1-11FORECAST命令输出的5年预测结果
拟合效果图如图1-11:
图1-12拟合效果图
2.实验二我国铁路货运量分析
我国1949—2008年每年铁路货运量(单位:
万吨)数据如表2-1所示。
表2-1
年
货运量
年
货运量
年
货运量
1949
5589
1969
53120
1989
151489
1950
9983
1970
68132
1990
150681
1951
11083
1971
76471
1991
152893
1952
13217
1972
80873
1992
157627
1953
16131
1973
83111
1993
162794
1954
19288
1974
78772
1994
163216
1955
19376
1975
88955
1995
165982
1956
24605
1976
84066
1996
171024
1957
27421
1977
95309
1997
172149
1958
38109
1978
110119
1998
164309
1959
54410
1979
111893
1999
167554
1960
67219
1980
111279
2000
178581
1961
44988
1981
107673
2001
193189
1962
35261
1982
113495
2002
204956
1963
36418
1983
118784
2003
224248
1964
41786
1984
124074
2004
249017
1965
49100
1985
130709
2005
269296
1966
54951
1986
135635
2006
288224
1967
43089
1987
140653
2007
314237
1968
42095
1988
144948
2008
330354
请选择适当的模型拟合该序列,并预测2009—2013年我国铁路货运量。
2.1实验目的
掌握用SAS软件对数据进行相关性分析,掌握对非平稳时间序列的随机分析,选择合适模型,拟合序列发展。
2.2实验原理
ARIMA模型的预测和ARMA模型的预测方法非常类似。
模型的一般表示方法为:
同时可以简记为:
式中,
为零均值白噪声序列。
我们可以从上式看出,ARIMA模型的实质就是差分与ARMA模型的组合,这说明任何非平稳序列如果能通过适当阶数的差分实现差分后平稳,就可以对差分后序列进行ARMA模型拟合。
(1)对差分平稳后的序列可以使用ARIMA模型进行拟合,ARIMA建模操作流程如图2-1所示。
图2-1建模流程
2.3实验容
由于ARMA模型是ARIMA模型的一种特例,所以在SAS系统中这两种模型的拟合都放在ARMA过程中。
先利用时序图分析模型是否平稳,可以运用实验一的程序来实现。
再对该序列进行1阶差分运算,同时考虑差分后序列的平稳性,添加如下命令:
difhuoyunliang=dif(huoyunliang);
命令“difhuoyunliang=dif(huoyunliang);”是指令系统对变量进行的1阶差分后的序列值赋值给变量difhuoyunliang,其中dif()是差分函数。
利用差分函数得出平稳模型。
再对模型进行定阶和进行预测。
模型定阶:
identifyvar=difhuoyunliang
(1)nlag=8minicp=(0:
5)q=(0:
5);
模型预测:
forecastlead=5id=time;
2.4实验过程
(1)判断序列的平稳性
图2-2我国1949—2008年每年铁路货运量时序图
通过分析可知,该时序图有明显的上升趋势,所以为非平稳序列。
在此,对该序列进行1阶差分运算。
图2-31阶差分后序列时序图
图2-41阶差分后序列自相关图
通过分析可知,时序图显示差分后序列没有明显的非平稳特征;自相关图显示序列有很很强的短期相关性,所以可认为1阶差分后序列平稳。
对平稳的1阶查分序列进行白噪声检验,检验结果如图
图2-51阶差分后序列白噪声检验
默认显著性水平为0.05的条件下,由于延迟6阶、12阶的P值为0.0012和0.0098,小于0.05,所以该差分后序列不能视为白噪声序列,即差分后的序列还蕴含着不容忽视的相关信息可供提取。
(2)对平稳非白噪声查分序列进行拟合
图2-6IDENTIFY命令输出的最小信息量结果
最后一条信息显示,在自相关延迟阶数也小于等于5的所有
模型中,BIC信息量相对于最小的是
模型。
考虑到前面已经进行的1阶差分运算,实际上是用
模型拟合原序列。
图2-7ESTIMATE命令输出的未知参数结果
图2-8ESTIMATE命令输出的拟合统计结果
图2-8ESTIMATE命令输出的残差自相关检验结果
显然,拟合检验统计量的P值均显著大于显著性水平
(
),所以可以认为改残差序列即为白噪声序列,显著性检验显示两参数均显著,这说明
模型对该序列建模成功。
图2-10ESTIMATE命令输出的拟合模型形式
输出结果显示,序列
的拟合模型为
模型口径为:
等价记为:
利用拟合模型对序列做5期预测,结果如图2-10:
图2-112009-2013我国铁路货运量预测
3.实验三美国月度事故死亡数据分析
据美国国家安全委员会统计,1973—1978年美国月度事故死亡数据如表3-1所示。
表3-1
时间
死亡人数
时间
死亡人数
时间
死亡人数
1973年1月
9007
1975年1月
8162
1977年1月
7792
1973年2月
8106
1975年2月
7306
1977年2月
6957
1973年3月
8928
1975年3月
8124
1977年3月
7726
1973年4月
9137
1975年4月
7870
1977年4月
8106
1973年5月
10017
1975年5月
9387
1977年5月
8890
1973年6月
10826
1975年6月
9556
1977年6月
9299
1973年7月
11317
1975年7月
10093
1977年7月
10625
1973年8月
10744
1975年8月
9620
1977年8月
9302
1973年9月
9713
1975年9月
8285
1977年9月
8314
1973年10月
9938
1975年10月
8433
1977年10月
8850
1973年11月
9161
1975年11月
8160
1977年11月
8265
1973年12月
8927
1975年12月
8034
1977年12月
8796
1974年1月
7750
1976年1月
7717
1978年1月
7836
1974年2月
6981
1976年2月
7461
1978年2月
6892
1974年3月
8038
1976年3月
7776
1978年3月
7791
1974年4月
8422
1976年4月
7925
1978年4月
8129
1974年5月
8714
1976年5月
8634
1978年5月
9115
1974年6月
9512
1976年6月
8945
1978年6月
9434
1974年7月
10120
1976年7月
10078
1978年7月
10484
1974年8月
9823
1976年8月
9179
1978年8月
9827
1974年9月
8743
1976年9月
8037
1978年9月
9110
1974年10月
9129
1976年10月
8488
1978年10月
9070
1974年11月
8710
1976年11月
7874
1978年11月
8633
1974年12月
8680
1976年12月
8647
1978年12月
9240
请选择适当模型拟合该序列的发展。
3.1实验目的
掌握用SAS软件对数据进行相关性分析,掌握对非平稳时间序列的随机分析,选择合适模型,拟合序列发展。
3.2实验原理
在SAS系统中有一个AUTOREG程序,可以进行残差自相关回归模型拟合。
残差自回归模型的构思是首先通过确定性因素分解方法提取序列中主要的确定性信息:
(1)
式中,
为趋势效应拟合;
为季节效应拟合。
考虑到因素分解方法对确定性信息的提取可能不够充分,因而需要进一步检验残差序列
的自相关性。
如果检验结果显示残差序列的自相关性不显著说明确定性回归模型
(1)对信息的提取比较充分,可以停止分析。
如果检验结果显示残差序列的自相关显著,说明确定性回归模型
(1)对信息的提取不充分,这时可以考虑对残差序列拟合自回归模型,进一步提取相关信息:
这样构造的模型:
这就是自回归模型。
3.3实验容
首先建立数据集和绘制时序图参照实验一,接下来建立因变量关于时间的回归模型。
主要程序如下:
procautoregdata=example4_3;
modeldeath=time/dwprob;
输出如下三方面结果:
普通最小二乘估计结果、回归误差分析、最终拟合模型,详细分析见下面的实验过程。
3.4实验过程
(1)绘制时序图
图3-11973—1978年美国月度事故死亡数据的时序图
时序图显示,有一定规律性的波动,所以考虑使用误差自回归模型拟合该序列的发展。
图3-2序列关于变量
的线性回归模型的最小二乘估计结果
输出结果显示,DW统计量的值等于0.6020,输出概率显示残差序列显著正相关,所以应该考虑对残差序列拟合自相关模型。
(2)建立关于时间的回归模型
输出结果的详细分析:
该部分输出信息包括误差平方和(SSE)、自由度(DFE)、均方误差(MSE)、根号均方误差(RootMSE)、SBC信息量、AIC信息量、回归部分相关系数平方(RegressR-Square)、总的相关系数平方(TotalR-Square),DW统计量及所有待估计参数的自由度、估计值、标准差、
值和
统计量的P值,如图3-3所示。
图3-3普通最小二乘估计结果
回归误差分析:
该部分共输出四个信息:
残差序列自相关图、逐步回归消除的不显著项报告、初步均方误差(MSE)、自回归参数估计值。
如图所示:
图3-4自回归误差分析输出结果
输出的残差序列自相关图显示残差序列有非常显著的1阶正相关性。
逐步回归消除报告显示除了延迟1阶的序列值显著自相关外,延迟其他阶数的序列值均不具有显著的自相关性,因此延迟2~5阶的自相关项被剔除。
最终拟合模型如下图3-5所示:
图3-5最终拟合模型输出结果
拟合模型为:
拟合图如图3-6
图3-6拟合效果图
课程设计体会
通过一周的实训,让我对应用时间序列这一门课程有了更深的理解和掌握,让我从前一段的理论知识学习进入到了应用与实践,实践出真知,平常所学的理论只有通过实践,自己动手之后才能真正感觉到知识的乐趣。
在整个实验过程中,所有的代码都是由我来负责编写及修改的,同时,我也负责对自己用代码得出的结果进行截图以及进行结果分析。
实验一要求我们绘制时序图,判平稳、进行纯随机性检验、绘制样本自相关图、模型识别以及模型定阶。
通过观察时序图的是否具有明显的趋势性或周期性来得出模型是否平稳;样本自相关图显示出来的性质可以检验我们通过时序图得出的结论是否正确,之后的纯随机性检验是为了确定平稳序列是否值得我们继续分析下去;之后进行相对最优定阶,当然这个定阶,只能作为定阶参考,因为使用这种方法定阶未必比经验定阶准确,之后得出拟合模型的具体形式及进行序列预测。
实验二是建立在实验一的基础上来做的,实验二我们选用的是ARIMA模型来做的,但是与实验一不同的是,实验二对模型进行了差分运算,因为差分运算可以将一个非平稳序列转化平稳序列,之后对差分序列进行ARMA模型拟合,这样结合实验一和实验二我们便可以得出实验二模型。
实验三我们选择的是残差自回归模型进行拟合的,通过查阅,我知道了残差自回归模型是一种拟合非平稳时间序列的方法,它既能提取序列的确定性,,又能提取其随机性信息,不仅提高了模型的拟合精度,同时也使的结果变得更实际,也更易解释。
但是在实际操作的过程中,我发现这个模型拟合确实比其他模型拟合难,以至于自己对得出的结果都无法肯定对错。
通过三个实验,只能说让我初步的了解到了这门课的有意思之处,同时,也让我对SAS这个软件有了初步的认知,就比如说在操作过程中一个不显眼的小字符错了,程序就会一遍遍的报错,但是在实际操作过程中,我们又非常容易忽视掉这些,从而导致我们有时候会花费许多时间在这上面。
所以我们平常思考问题做事情都要认真严谨。
当然在整个实训过称中,要非常感老师对我们的教导,通过老师的指导,才能让我们顺利的完成这次实训。
为期一周的实训已经结束了,但由于端午节放假,实训时间就缩短为了3天,所以时间上很紧。
但是我们还是完成了试验,收获了很多,一方面学习到了以前没有用过的SAS软件,另一方面把所学的时间序列分析在实际中得到了应用,还有团队合作能力得到了加强。
第一天老师介绍了实训的软件SAS,并讲了一些基础知识和基本的操作步骤,并把时间序列的知识进行了大致的回顾。
接下来上机做了一些简单的练习,练习了一下SAS的简单操作步骤,知道了怎么把数据导入数据集,接着练习了第二章的课后习题,通过输出的序列的时序图和序列自相关图来判断该序列的平稳性和纯随机性。
在这个过程中需要调试程序,刚开始输入了课本上的程序,但运行有错误,仔细查看不是字母打错就是缺少标点符号,经过几次不断地改进,得到了正确的结果。
第二天老师讲解了平稳性序列的分析,对建模步骤和具体要用到的函数做了详细说明,由于是三个人合作完成一份实验,所以我的工作就是了解整个试验建模的过程和思想然后编写文档,把我队友软件输出的结果加以分析。
这是三个人完成的第一个试验,所以速度上不是很快。
在期间也遇到了很多问题,比如我们对模型的选择、对结果的分析都存在争议,但最后都得到了解决。
第三天时间更加的紧,由于昨天一天做了有个试验,可是一共有三个试验,所以在第三天也就是最后一天要完成另外两个试验。
这两个试验是第四章非平稳序列的随机分析,好在有了实验一的基础,程序就相对简单了一些,但我编辑文档的工作量就很大。
在我和队友交流了经过调试后要选用的模型和结果分析后我就开始了两个试验的文档编辑工作。
期间有对自己所选模型是否是最合适的模型产生过怀疑,但通过和同学老师的交流得到了解决。
最后的一步工作就是对整个文档的排版,因为去年参见过数学建模,所以在排版方面还有一定的基础,按照实验报告的格式进行了排版。
总结一下,就我自己而言之前对时间序列这门课的掌握程度还不高,通过实训得到了提高,但平心而论对知识的把握还是不够完善和系统,希望以后的学习中能得到提高。
还要感老师,对我们完成试验的帮助和对疑问的解答,老师对我们真的是认真负责,老师!
经过一周的学习与实践,应用时间序列分析这门科学让我受益颇多。
首先实践阶段第一个接触的就是SAS软件,在SAS系统中有一个专门进行计量经济与时间序列分析的模块。
同时,由于SAS系统具有全球一流的数据仓库功能,因此在进行海量数据的时间序列分析时具有很大的优势。
而在学习SAS软件时遇到了不少的障碍,经过老师的讲解后还是有许多功能不是太了解,导致在进行实践操作时出了不少的错误,后来经过咨询老师解决了问题。
在除了学习SAS软件外,我们需要进一步掌握的是时间序列中的一些案例模型。
在进行分析时,有许多都用到了ARMA模型,这时我们就需要结合理论知识与SAS。
其中拟合序列的发展,确定并检验序列的平稳性等等都是需要解决的问题。
在解决这些问题时,每一步都是一个需要细心与耐心的过程。
当其中任何一处出现小的失误都会使结果出现错误,进而解