时间序列作业ARMA模型.docx
《时间序列作业ARMA模型.docx》由会员分享,可在线阅读,更多相关《时间序列作业ARMA模型.docx(21页珍藏版)》请在冰豆网上搜索。
时间序列作业ARMA模型
一案例分析的目的
本案例选取2001年1月,到2013年我国铁路运输客运量月度数据来构建ARMA模型,并利用该模型进行外推预测分析。
二、实验数据
数据来自中经网统计数据库
时间
数量(亿)
2001-01
0.93
2001-02
0.85
2001-03
0.81
2001-04
0.81
2001-05
0.87
2001-06
0.75
2001-07
0.91
2001-08
0.95
2001-09
0.81
2001-10
0.85
2001-11
0.72
2001-12
0.72
2002-01
0.78
2002-02
0.93
2002-03
0.87
2002-04
0.80
2002-05
0.85
2002-06
0.73
2002-07
0.91
2002-08
0.96
2002-09
0.83
2002-10
0.86
2002-11
0.73
2002-12
0.74
2003-01
0.90
2003-02
0.96
2003-03
0.83
2003-04
0.71
2003-05
0.33
2003-06
0.53
2003-07
0.83
2003-08
0.95
2003-09
0.84
2003-10
0.88
2003-11
0.78
2003-12
0.76
2004-01
1.05
2004-02
0.95
2004-03
0.83
2004-04
0.83
2004-05
0.91
2004-06
0.82
2004-07
1.00
2004-08
1.03
2004-09
0.85
2004-10
0.90
2004-11
0.77
2004-12
0.78
2005-01
0.93
2005-02
1.06
2005-03
0.93
2005-04
0.91
2005-05
0.97
2005-06
0.86
2005-07
1.08
2005-08
1.12
2005-09
0.94
2005-10
1.00
2005-11
0.86
2005-12
0.85
2006-01
1.07
2006-02
1.13
2006-03
0.99
2006-04
0.99
2006-05
1.07
2006-06
0.96
2006-07
1.20
2006-08
1.22
2006-09
1.02
2006-10
1.10
2006-11
0.93
2006-12
0.93
2007-01
0.99
2007-02
1.11
2007-03
1.20
2007-04
1.03
2007-05
1.14
2007-06
1.02
2007-07
1.31
2007-08
1.35
2007-09
1.14
2007-10
1.21
2007-11
1.03
2007-12
1.07
2008-01
1.19
2008-02
1.29
2008-03
1.19
2008-04
1.16
2008-05
1.17
2008-06
1.15
2008-07
1.38
2008-08
1.41
2008-09
1.25
2008-10
1.26
2008-11
1.08
2008-12
1.03
2009-01
1.33
2009-02
1.36
2009-03
1.18
2009-04
1.25
2009-05
1.29
2009-06
1.15
2009-07
1.42
2009-08
1.50
2009-09
1.22
2009-10
1.36
2009-11
1.11
2009-12
1.09
2010-01
1.27
2010-02
1.42
2010-03
1.41
2010-04
1.33
2010-05
1.38
2010-06
1.34
2010-07
1.60
2010-08
1.62
2010-09
1.38
2010-10
1.53
2010-11
1.23
2010-12
1.22
2011-01
1.52
2011-02
1.57
2011-03
1.41
2011-04
1.55
2011-05
1.53
2011-06
1.51
2011-07
1.82
2011-08
1.79
2011-09
1.61
2011-10
1.63
2011-11
1.34
2011-12
1.31
2012-01
1.65
2012-02
1.56
2012-03
1.45
2012-04
1.65
2012-05
1.49
2012-06
1.62
2012-07
1.80
2012-08
1.85
2012-09
1.69
2012-10
1.51
2012-11
1.42
2012-12
1.48
2013-01
1.88
2013-02
1.40
2013-03
1.69
2013-04
1.75
2013-05
1.62
2013-06
1.80
2013-07
1.99
2013-08
2.03
2013-09
1.92
2013-10
1.64
数据来源:
中经网数据库
三、ARMA模型的平稳性
首先绘制出N的折线图,如图
从图中可以看出,N序列具有较强的非线性趋势性,因此从图形可以初步判断该序列是非平稳的。
此外,N在每年同期出现相同的变动方式,表明N还存在季节性特征。
下面对N的平稳性和季节季节性进行进一步检验。
四、单位根检验
为了减少N的变动趋势以及异方差性,先对N进行对数处理,记为LN其曲线图如下:
GENR LN= LOG(N)
对数后的N趋势性也很强。
下面观察N的自相关表,选择滞后期数为36,如下:
从上图可以看出,LN的PACF只在滞后一期是显著的ACF随着阶数的增加慢慢衰减至0,因此从偏/自相关系数可以看出该序列表现一定的平稳性。
进一步进行单位根检验,打开LN选择存在趋势性的形式,并根据AIC自动选择滞后阶数,单位根检验结果如下:
T统计值的值小于临界值,且相伴概率为0.0001,因此该序列不存在单位根,即该序列是平稳序列。
五、季节性分析
趋势性往往会掩盖季节性特征,从LN的图形可以看出,该序列具有较强的趋势性,为了分析季节性,可以对LN进行差分处理来分析季节性:
Genr=DLN=LN–LN(-1)
观察DLN的自相关表,如下:
DLN在之后期为6、12、18、24、30、36处的自相关系数均显著异于0,因此,该序列是以周期6呈现季节性,而且季节自相关系数并没有衰减至0,因此,为了考虑这种季节性,进行季节性差分:
GENRSDLN=DLN–DLN(-6)
再做关于SDLN的自相关表,如下:
SDLN在滞后期36之后的季节ACF和PACF已经衰减至0,下面对SDLN建立SARMA模型。
六、滞后阶数的初步确定
观察SDLN的自相关、偏自相关图,ACF和PACF在滞后期1和滞后期6还有滞后期12异于0,其余均与0无异,因此,SARMA(p,q)(k,m)s中p和q均不超过1,k和m均不超过2.6考虑到高洁移动平均模型估计较为困难,而且自回归模型的检验可以表示无穷的移动平均过程,因此q尽可能取较小的取值。
本例拟选择SARMA(1,0)(1,0)6、SARMA(1,0)(1,1)6、SARMA(1,0)(1,2)6、SARMA(1,0)(2,1)6、SARMA(1,1)(1,0)6、SARMA(1,1)(1,1)6、SARMA(1,1)(1,2)6、SARMA(1,1)(0,1)6八个模型来拟合SDLN。
七、ARMA模型的参数估计
1.分析SARMA(1,0)(1,0)6分析该模型的估计以及残差的检验。
LSSDLNCAR
(1)SAR(6)
回归结果如表所示:
分析SARMA(1,0)(1,1)6分析该模型的估计以及残差的检验。
LSSDLNCAR
(1)SAR(6)
回归结果如表所示:
分析SARMA(1,0)(1,2)6分析该模型的估计以及残差的检验。
LSSDLNCAR
(1)SAR(6)sar(6)SAR(12)
回归结果如表所示:
分析SARMA(1,0)(2,1)6分析该模型的估计以及残差的检验。
LSSDLNCAR
(1)SAR(12)SAR(6)
回归结果如表所示:
分析SARMA(1,1)(1,0)6分析该模型的估计以及残差的检验。
LSSDLNCAR
(1)ma
(1)SAR(6)
回归结果如表所示:
分析SARMA(1,1)(1,1)6分析该模型的估计以及残差的检验。
LSSDLNCAR
(1)ma
(1)SAR(6)sma(6)
回归结果如表所示:
分析SARMA(1,1)(1,2)6分析该模型的估计以及残差的检验。
LSSDLNCAR
(1)ma
(1)SAR(6)sma(12)
回归结果如表所示:
分析SARMA(1,1)(2,1)6分析该模型的估计以及残差的检验。
LSSDLNCAR
(1)ma
(1)SAR(12)sma(6)
回归结果如表所示:
各个模型的AIC、SC、残差检验结果汇总如下
AIC
SC
平稳性
可逆性
残差是否满足白噪声
SARMA(1,0)(1,0)6
-1.239755
-1.176719
是
是
否
SARMA(1,0)(1,1)6
-1.555852
-1.471805
是
是
否
SARMA(1,0)(1,2)6
-1.579857
-1.537164
是
是
否
SARMA(1,0)(2,1)6
-1.541566
-1.436507
是
是
否
SARMA(1,1)(1,0)6
-1.456963
-1.372916
是
是
否
SARMA(1,1)(1,1)6
-1.719041
-1.613982
是
是
是
SARMA(1,1)(1,2)6
-1.762844
-1.636773
是
是
是
SARMA(1,1)(2,1)6
-1.696093
-1.566339
是
是
是
综合来看选择SARMA(1,1)(1,2)6对数据的拟合是最优的。
六、模型的预测
在SARMA(1,1)(1,2)6中选择动态估计,预测2013.11月的序列值,预测图如图:
上图中左边是预测值与置信区间,右边是预测的误差。
Bootmeansquarederror代表均方误差方,MAE表示平均绝对误差,MAPE表示平均绝对误差百分比。
Theil不等系数中biasproportion表示偏误,即预测均值与真实均值的偏离程度;varianceproportion表示方误差,用来反映波动与真实波动之间的差异;covarianceproportion表示协方差误,反映残存非系统预测误差,该误差占比越大,预测效果越好。
本例中的协方差误(0.415544)要大于方差误(0.347297),因此预测效果较好。