时间序列分析第五章上机指导Word文档下载推荐.docx
《时间序列分析第五章上机指导Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《时间序列分析第五章上机指导Word文档下载推荐.docx(16页珍藏版)》请在冰豆网上搜索。
考虑对该序列进行1阶差分运算,同时考察查分后序列的平稳性,在原程序基础上添加相关命令,程序修改如下:
dataexample5_1;
procarima;
identifyvar=x
(1);
estimatep=1;
forecastlead=5id=t;
run;
语句说明:
(1)DATA步中的命令“difx=dif(x);
”,这是指令系统对变量x进行1阶差分,差分后的序列值赋值给变量difx。
其中dif()是差分函数,假如要差分的变量名为x,常见的几种差分表示为:
1阶差分:
dif(x)
2阶差分:
dif(dif(x))
k步差分:
difk(x)
(2)我们在GPLOT过程中添加绘制了一个时序图“difx*t”,这是为了直观考察1阶差分后序列的平稳性。
所得时序图如图5-50所示。
图5-50序列difx时序图
时序图显示差分后序列difx没有明显的非平稳特征。
(3)“identifyvar=x
(1);
”,使用该命令可以识别查分后序列的平稳性、纯随机性和适当的拟合模型阶数。
其中x
(1)表示识别变量x的1阶差分后序列。
SAS支持多种形式的差分序列识别:
var=x
(1),表示识别变量x的1阶查分后序列Δxt;
var=x(1,1),表示识别变量x的2阶查分后序列Δ2xt;
var=x(k),表示识别变量x的k步差分后序列Δkxt;
var=x(k,s),表示识别变量x的k步差分后,再进行s步查分后序列ΔsΔkxt。
识别部分的输出结果显示1阶查分后序列difx为平稳非白噪声序列,且具有显著的自相关系数不截尾、偏自相关系数1截尾的性质。
(4)“estimatep=1;
”对1阶差分后序列Δxt拟合AR
(1)模型。
输出拟合结果显示常数项不显著,添加或修改估计命令如下:
estimatep=1nonit;
这是命令系统不要常数项拟合AR
(1)模型,拟合结果显示模型显著且参数显著。
如图5-51所示。
图5-51序列difx模型拟合结果
输出结果显示,序列xt的拟合模型为ARIMA(1,1,0)模型,模型口径为:
Δxt=艾普龙t/1-0.66933B
或等阶记为:
xt=1.66933xt-1-0.66933xt-2+艾普龙t
(5)“forecastlead=5id=t;
”,利用拟合模型对序列xt作5期预测。
一、建立数据集,绘制时序图
dataexample5_2;
inputx@@;
lagx=lag(x);
t=_n_;
cards;
3.038.4610.229.8011.962.83
8.4313.7716.1816.8419.5713.26
14.7824.4828.1628.2732.6218.44
25.2538.3643.7044.4650.6633.01
39.9760.1768.1268.8478.1549.84
62.2391.49103.20104.53118.1877.88
94.75138.36155.68157.46177.69117.15;
procgplotdata=example5_2;
plotx*t=1;
symbol1c=blacki=joinv=star;
输出时序图如5-52所示。
图5-52序列x时序图
时序图显示,序列X有一个明显的随时间线性递增的趋势,同时又有一定规律性的波动,所以不妨考虑使用误差自回归模型拟合该序列的发展。
二、因变量关于时间的回归模型
procautoregdata=example5_2;
modelx=t/dwprob;
(1)“procautoregdata=example5_2;
”指令SAS系统对临时数据集example5_2进行回归程序分析。
(2)“modelx=t/dwprob;
”指令SAS系统以变量t作为自变量,变量x作为因变量,建立线性模型:
并给出残差序列DW检验统计量的分为点。
本例中,序列x关于变量t的线性回归模型最小二乘估计输出结果如图5-53所示。
图5-53序列x关于变量t的线性回归模型最小二乘估计结果
本例输出结果显示,DW统计量的值等于0.7628,输出概率显示残差序列显著正相关。
所以应该考虑对残差序列拟合自相关模型,修改AUTOREG程序如下:
modelx=t/nlag=5backstepmethod=ml;
Model语句是指令系统对线性回归模型的残差序列显示延迟5阶的自相关图,并拟合延迟5阶自相关模型,特别注意,SAS输出的自回归模型结构为:
即输出的自相关回归参数值与我们习惯定义的自回归参数值相差一个负号。
由于自相关延迟阶数的确定是由我们尝试选择的,所以nlag得阶数通常会指得大一些。
这就导致残差自回归模型中可能有部分参数不显著,
因而添加逐步回归选项backstep,指令系统使用逐步回归的方法筛选出显著自相关因子,并使用极大似然的方法进行参数估计。
输出如下四方面的结果:
1因变量说明如图5-54所示:
图5-54因变量说明
2普通最小二乘估计结果
该部分输出信息包括差平方和(SSE)、自由度(DFE)、均方误差(MSE)、根号均方误差(RootMSE)、SBC信息量。
回归部分相关系数平方(regressrsquare)、总的相关系数平方(totelrsquare),DW统计量(durbinwatson)及所有待参数的自由度、估计值、标准差、t值和统计量的P值。
如图5-55所示。
图5-55普通最小二乘估计结果
3回归误差分析
该部分共输出四方面的信息:
残差序列自相关图、逐步回归消除的不显著项报告、初步均方误差(MSE)、自回归参数估计值。
本例该部分输出结果如图5-56所示。
图5-56自回归误差分析输出结果
本例输出的残差序列自相关图显示残差序列有非常显著的1阶正相关性。
逐步回归消除报告显示除了1阶的序列值显著自相关外,延迟其他阶数的序列值均不具有显著的自相关性,因此延迟2阶-5阶的自相关项被剔除。
初步均方误差为
4、最终拟合模型
该部分包括三方面的汇总信息:
收敛状况、极大似然估计结果和回归系数估计。
本例该部分输出结果如图5-57所示。
图5-57最终拟合模型输出结果
本例得到最终拟合模型为:
为了得到直观的拟合效果,我们可以利用OUTPUT命令将拟合结果存入SAS数据集中,并对输出结果作图,相关命令如下:
outputout=outp=xppm=trend;
modelx=t/nlag=5backstepmethod=mlnoint;
procgplotdata=out;
plotx*t=2xp*t=3trend*t=4/overlay;
symbol2v=stari=nonec=black;
symbol3v=nonei=joinc=redw=2l=3;
symbol4v=nonei=joinc=greenw=2;
“outputout=outp=xppm=trend;
”,该命令是指令系统将部分结果输入临时数据集OUT,选择输出的第一个信息为整体模型的拟合值(P值),该拟合变量取名为XP;
选择输出的第二个信息为线性趋势拟合值(PM值),还可以选择R选项输出拟合残差项,本例不要求输出此项。
输出图像如图5-58所示。
图5-58拟合效果图
三、延迟因变量回归模型
modelx=lagx/lagdep=lagx;
run;
(1)首先在DATA步中添加命令“lagx=lgax(x);
”,该语句指令系统使用延迟函数生成序列x的1阶延迟序列,并将该序列赋值给变量lagx,即
(2)“modelx=lagx/lagdep=lagx;
”指令系统建立带有延迟变量的回归模型
并通过LAGDEP选项指定被延迟的因变量名。
本例输出结果如图5-59所示。
图5-59带延迟因变量回归分析结果
由于带有延迟因变量,所以这种场合在回归模型估计结果中输出的是durbinh统计量。
本例中durbinh统计量的分布函数达到0.3853,这表示残差序列不存在显著的相关性,不需要考虑对残差序列继续拟合自回归模型。
在注意参数检验结果,如图5-60所示。
图5-60参数估计结果
在显著性水平默认为0.05的条件下,截距项不显著(P值大于0.05),所以可以考虑在模型拟合命令中增加NOINT选项。
最后输出拟合结果,并绘制拟合时序图相关命令如下:
modelx=lagx/lagdep=lagxnoint;
outputout=outp=xp;
plotx*t=2xp*t=3/overlay;
模型拟合部分输出的信息表示最终的拟合模型为:
输出的拟合效果图如图5-61所示。
图5-61带有延迟因变量的回归模型拟合效果图
本例中由于没有残差自回归项,最终拟合值就是趋势值,所以只需绘制其中之一即可。
5.8.3
介绍GARCH模型拟合,相关程序如下:
Dataexample5_3;
Inputx@@;
T=_n_;
Cards;
10.7713.3016.6419.5418,9710.5224.36
23.5127.1630.8031.8431.6332.6834.90
33.8533.0935.4635.3239.9437.4735.24
33.0332.6735.2032.3632.3438.4538.17
32.1439.7049.4247.8648.3463.5063.56
67.6164.5966.1767.5076.1279.3178.85
81.3487.0686.4193.2082.9572.9661.10
61.2771.5888.3498.7097.3197.1791.17
80.2085.1281.4070.8757.7552.3567.50
87.9585.4684.5598.16102.42113.02119.95
122.37126.96122.79127.96139.20141.05140.87
137.08145.53145.59134.36122.54106.9297.23
110.39132.40152.30154.91152.69162.67160.31
142.57146.54153.83141.81157.83162.79142.07
139.43181.49166.84154.28150.12165.17170.32
;
procgplotdata=example5_3:
symbollc=blacki=jionv=star;
procautoregdata=example5_3;
modelx=t/nalg=5dwprobarchtest;
modelx=t/nalg=2nointgarch=(p=1,q=1);
outputout=outp=presidual=residuallcl=lclucl=uclcev=cev;
dataout;
setout;
l95=-1.96*sqrt(51.42515);
u95=1.96*sqrt(51.42515);
Lcl_GARCH=-1.96*sqrt(cev);
Ucl_GARCH=1.96*sqrt(cev);
Lcl_p=p-1.96*sqrt(cev);
Ucl_p=p+1.96*sqrt(cev);
poltresidual*t=2l95*t=3LCL-garch*t=4u95*t=UCL-garch*t=4/ovctlay
poltX*t=5lcl*t=3LCL-p*t=3UCL-p*t=4/overlay;
symbol2c=greeni=needlev=none;
symbol3c=blacki=joinv=nonew2l=2;
symbol4c=redi=joinvnone;
symbol5c=greeni=joinv=none;
该时序输出图如图5-62所示
图5-62序列时序图
时序图显示序列具有显著线性递增趋势,且波动幅度随时间递增,所以考虑使用AUTOREG过程建立序列{xt},关于时间t的线性回归模型,并检验残差序列的自相关和易方差性,如果检验结果显示残差序列具有显著之相关性,建立参差回归模型;
如果残差序列具有显著的异方差性,则需建立条件异方差模型,则要建立条件异方差模型。
(1)“modelx=t/nlag=5dwprobarchtest;
”该命令指令系统建立序列{xt},关于时间t的线性回归模型,并检验残差系列5阶延迟的自相关性,并输出DW检验的p值,同时对残差序列进行异方差检验。
DW检验结果显示残差序列具有显著的正自相关性,如图5-63所示。
图5-63普通最小二乘输出结果
图5-64残差序列自相关图
参数估计结果显示回归模型常数截距项不显著,如图5-65所示。
图5-65线性回归模型参数估计结果
异方差检验结果显示,残差序列具有显著的异方差性,且具有显著的长期相关性,如图5-66所示。
图5-66异方差检验结果
(2)“modelx=t/nlag=2nointgarch=(p=1,q=1);
”综合考虑残差序列自相关性和异方差性检验结果,尝试拟合无回归常数项的AR
(2)-GARCH(1,1)模型。
模型最终拟合结果如图5-67所示。
参数检验结果显示除GARCH(1,1)模型中的常数项不显著外,其他模型均显著,整个模型的R2高达0.9954,且正态性检验不显著(p值为0.3106),这与假定GARCH的残差函数εt/√ht服从正态分布相吻合,所以可以认为该模型拟合成功。
最终模型口径为:
图5-67普通最小二乘估计输出结果
(3)”outputout=outp=presidual=residuallcl=lclucl=uclcev=cev;
”,将估计值(P=),残差(residuai=),序列置信下线(lcl=),序列置信下线(Ucl=),条件方差(cev)的结果存入临时数据集work.out。
残差序列方差齐性假定下95%的置信下限:
残差序列方差齐性假定下95%的置信上限:
残差序列条件方差假定下95%的置信下限:
残差序列条件方差假定下95%的置信上限:
条件方差假定下,序列的95%置信下限Lcl_p=p-1.96*sqrt(cev);
条件方差假定下,序列的95%置信上限Ucl_p=p+1.96*sqrt(cev);
分别绘制两种拟合效果图,图5-68是针对残差序列的波动性拟合情况,及在方差齐性和非齐性两种假定下的置信区间,绘图命令如下:
plotresidual*t=3LCL_arch*t=4u95*t=3UCL_arch*t=4/overlay;
图5-69是原系列的拟合情况,即在方差齐性和非极性两种假定下的置信区间,绘图命令如下:
plotx*t=2lcl*t=3LCL_p*t=4ucl*t=3UCL_p*t=4/overlay
图中中间的波动曲线为残差序列或原序列,虚线为根据无条件方差得到的95%置信区间,而实线为根据条件方差得到的95%置信区间。
图5-68残差序列在两种方差假设下的置信区间效果图
图5-69序列在两种方差假定下的置信区间效果图
而实线为根据条件方差得到的95%置信区间。