时间序列分析SAS第3章.docx
《时间序列分析SAS第3章.docx》由会员分享,可在线阅读,更多相关《时间序列分析SAS第3章.docx(26页珍藏版)》请在冰豆网上搜索。
![时间序列分析SAS第3章.docx](https://file1.bdocx.com/fileroot1/2023-6/15/73b1148b-0273-4712-83df-400232f28b55/73b1148b-0273-4712-83df-400232f28b551.gif)
时间序列分析SAS第3章
佛山科学技术学院
应用时间序列分析实验报告
实验名称第三章平稳时间序列分析
专业班级10数学与应用数学姓名林敏杰学号2010214222
一、上机练习
程序及其结果分析:
dataex3_1;
inputx@@;
time=_n_;
cards;
0.30-0.450.360.000.170.452.15
4.423.482.991.742.400.110.96
0.21-0.10-1.27-1.45-1.19-1.47-1.34
-1.02-0.270.14-0.070.10-0.15-0.36
-0.50-1.93-1.49-2.35-2.18-0.39-0.52
-2.24-3.46-3.97-4.60-3.09-2.19-1.21
0.780.882.071.441.500.29-0.36
-0.97-0.30-0.280.800.911.951.77
1.800.56-0.110.10-0.56-1.34-2.47
0.07-0.69-1.960.041.590.200.39
1.06-0.39-0.162.071.351.461.50
0.94-0.08-0.66-0.21-0.77-0.520.05
;
procgplotdata=ex3_1;
plotx*time=1;
symbol1c=redI=joinv=star;
run;
结果分析:
上图是数据对应的时序图,从图上曲线分析来看,数据并没有周期性或者趋向性规律,因而可以初步判断这是平稳数列。
procarimadata=ex3_1;
identifyVar=xnlag=8;
run;
结果分析:
本过程中,我们建立了8阶自回归分析模型,图上依次是变量的描述性统计量、样本自相关图、样本逆相关图和样本偏自相关图。
由于本次实验探究的是平稳序列,因而样本逆相关图先不作分析。
从自相关图来看,自相关系数趋于0的速度是比较快的,再结合时序图来看,可以确定这组数列是属于平稳数列。
从最后的纯随机检验结果分析来看,P<0.0001,因而这是非白噪声序列。
综上所述,该数列是平稳非白噪声序列,因为我们可以建立ARMA模型,对数据进行拟合。
首先观察自相关图和偏自相关图,从这两图来看,自相关图是4阶截尾的,而篇相关系数是拖尾的。
因而我们可以考虑建立MA(4)模型,为了避免个人经验不足而导致模型建立错误,我们可以通过计算机来判断确定。
procarimadata=ex3_1;
identifyVar=xnlag=8minicp=(0:
5)q=(0:
5);
run;
结果分析:
从上图可以看出,在众多模型中,MA(4)模型的BIC信息量是最小的,因而我们接下来会采用MA(4)模型来进行分析,这与我们上面人工判断分析的结果也是吻合的。
estimateq=4;
run;
结果分析:
以上是我们建立的MA(4)模型中的参数结果。
其中,我们可以看出,常数项对应的t统计量的P值是0.9968,它是>0.05的,也就说明它是不显著的,而其他参数均是显著的,为了使模型拟合得更优,我们应该除去常数项,再进行模型分析比较。
estimateq=4noint;
run;
结果分析:
以上是我们删去了常数项之后的结果。
从上述参数分析来看,所有的参数的t检验统计量的P值都是<0.001的,因而它们都是显著的。
因而我们建立了MA(4)模型如下:
forecastlead=5id=timeout=results;
run;
结果分析:
以上是我们对数据进行了5期的预测,其预测数据均可以从上图中看出来。
其中,数据从左往右分别表示序列值的序号、预测值、预测值的标准差、95%的置信下限和95%的置信上限。
以下我们把这些预测的数据用图来表现出来:
procgplotdata=results;
plotx*time=1forecast*time=2l95*time=3u95*time=3/overlay;
symbol1c=blacki=nonev=star;
symbol2c=redi=joinv=none;
symbol3c=greeni=joinv=nonel=32;
run;
结果分析:
该图为预测的图像,其中,红色线段表示预测出来的数列,绿色的两条线段分别表示95%的置信下限和95%的置信上限,而黑色的星号标识则是对应的样本数据值。
从图来分析,我们可以看出,黑色的样本数据值跟我们预测出来的线段非常的吻合,因而模型建立得很不错。
再结合上一步骤的参数结果,也就是预测的数据误差来看,误差都是非常的小,因而对数据的5期预测值也是非常的可靠。
在对比第一个步骤的时序图,我们可以发现,在预测的5个期间段中,样本数据并没有很大程度的波动或很明显的趋势,但是相对偏向于下降的趋势,而它对应的置信区间也是最大的,因而数据会稳定在这期间中,尽管如此,数据也不会有明显的波动,都是相对稳定的。
二、课后习题(老师布置的习题部分)
17.datalianxi3_17;
inputx@@;
time=_n_;
cards;
126.482.478.151.190.976.2104.587.4
110.52569.353.539.863.646.772.9
79.683.680.760.37974.449.654.7
71.849.1103.951.682.483.677.879.3
89.685.558120.7110.565.439.940.1
88.771.48355.989.984.8105.2113.7
124.7114.5115.6102.4101.489.871.570.9
98.355.566.178.4120.597110
;
procgplotdata=lianxi3_17;
plotx*time=1;
symbol1c=redI=joinv=star;
run;
结果分析:
上图是数据对应的时序图,从图上曲线分析来看,数据并没有周期性或者趋向性规律,因而可以初步判断这是平稳数列。
procarimadata=lianxi3_17;
identifyVar=xnlag=8;
run;
结果分析:
本过程中,我们建立了8阶自回归分析模型,图上依次是变量的描述性统计量、样本自相关图、样本逆相关图和样本偏自相关图。
由于本次实验探究的是平稳序列,因而样本逆相关图先不作分析。
从自相关图来看,自相关系数趋于0的速度是比较快的,再结合时序图来看,可以确定这组数列是属于平稳数列。
从最后的纯随机检验结果分析来看,P<0.0001,因而这是非白噪声序列。
综上所述,该数列是平稳非白噪声序列,因为我们可以建立ARMA模型,对数据进行拟合。
首先观察自相关图和偏自相关图,从这两图来看,偏自相关图是1阶截尾的,而篇相关系数是拖尾的。
因而我们可以考虑建立AR
(1)模型,为了避免个人经验不足而导致模型建立错误,我们可以通过计算机来判断确定。
procarimadata=lianxi3_17;
identifyVar=xnlag=8minicp=(0:
5)q=(0:
5);
run;
结果分析:
从上图可以看出,在众多模型中,MA(4)模型的BIC信息量是最小的,因而我们接下来会采用MA(4)模型来进行分析,这与我们上面人工判断分析的结果也是吻合的。
estimatep=1;
run;
结果分析:
以上是我们建立的AR
(1)模型中的参数结果。
其中,我们可以看出所有的参数均是显著的,为了使模型拟合得更优,我们应该除去常数项,再进行模型分析比较。
forecastlead=5id=timeout=results;
run;
结果分析:
以上是我们对数据进行了5期的预测,其预测数据均可以从上图中看出来。
其中,数据从左往右分别表示序列值的序号、预测值、预测值的标准差、95%的置信下限和95%的置信上限。
以下我们把这些预测的数据用图来表现出来:
procgplotdata=results;
plotx*time=1forecast*time=2l95*time=3u95*time=3/overlay;
symbol1c=blacki=nonev=star;
symbol2c=redi=joinv=none;
symbol3c=greeni=joinv=nonel=32;
run;
结果分析:
该图为预测的图像,其中,红色线段表示预测出来的数列,绿色的两条线段分别表示95%的置信下限和95%的置信上限,而黑色的星号标识则是对应的样本数据值。
从图来分析,我们可以看出,黑色的样本数据值跟我们预测出来的线段非常的吻合,因而模型建立得很不错。
再结合上一步骤的参数结果,也就是预测的数据误差来看,误差都是非常的小,因而对数据的5期预测值也是非常的可靠。
在对比第一个步骤的时序图,我们可以发现,在预测的5个期间段中,样本数据并没有很大程度的波动或很明显的趋势,但是相对偏向于下降的趋势,而它对应的置信区间也是最大的,因而数据会稳定在这期间中,尽管如此,数据也不会有明显的波动,都是相对稳定的。
18.
datalianxi3_18;
inputx@@;
time=_n_;
cards;
0.970.451.611.261.371.431.321.230.840.891.18
1.331.210.980.910.611.230.971.100.740.800.81
0.800.600.590.630.870.360.810.910.770.960.93
0.950.650.980.700.861.320.880.680.781.250.79
1.190.690.920.860.860.850.900.540.321.401.14
0.690.910.680.570.940.350.390.450.990.840.62
0.850.730.660.760.630.320.170.46
;
procgplotdata=lianxi3_18;
plotx*time=1;
symbol1c=redI=joinv=star;
run;
结果分析:
上图是数据对应的时序图,从图上曲线分析来看,数据并没有周期性或者趋向性规律,因而可以初步判断这是平稳数列。
procarimadata=lianxi3_18;
identifyVar=xnlag=8;
run;
结果分析:
本过程中,我们建立了8阶自回归分析模型,图上依次是变量的描述性统计量、样本自相关图、样本逆相关图和样本偏自相关图。
由于本次实验探究的是平稳序列,因而样本逆相关图先不作分析。
从自相关图来看,自相关系数趋于0的速度是比较快的,再结合时序图来看,可以确定这组数列是属于平稳数列。
从最后的纯随机检验结果分析来看,P<0.0001,因而这是非白噪声序列。
综上所述,该数列是平稳非白噪声序列,因为我们可以建立ARMA模型,对数据进行拟合。
首先观察自相关图和偏自相关图,从这两图来看,偏自相关图是1阶截尾的,而自相关系数是拖尾的。
因而我们可以考虑建立AR
(1)模型,为了避免个人经验不足而导致模型建立错误,我们可以通过计算机来判断确定。
procarimadata=lianxi3_18;
identifyVar=xnlag=8minicp=(0:
5)q=(0:
5);
run;
结果分析:
从上图可以看出,在众多模型中,AR
(1)模型的BIC信息量是最小的,因而我们接下来会采用AR
(1)模型来进行分析,这与我们上面人工判断分析的结果也是吻合的。
estimatep=1;
run;
结果分析:
以上是我们建立的AR
(1)模型中的参数结果。
其中,我们可以看出所有的参数均是显著的因而模型建立成立。
forecastlead=5id=timeout=results;
run;
结果分析:
以上是我们对数据进行了5期的预测,其预测数据均可以从上图中看出来。
其中,数据从左往右分别表示序列值的序号、预测值、预测值的标准差、95%的置信下限和95%的置信上限。
以下我们把这些预测的数据用图来表现出来:
procgplotdata=results;
plotx*time=1forecast*time=2l95*time=3u95*time=3/overlay;
symbol1c=blacki=nonev=star;
symbol2c=redi=joinv=none;
symbol3c=greeni=joinv=nonel=32;
run;
结果分析:
该图为预测的图像,其中,红色线段表示预测出来的数列,绿色的两条线段分别表示95%的置信下限和95%的置信上限,而黑色的星号标识则是对应的样本数据值。
从图来分析,我们可以看出,黑色的样本数据值跟我们预测出来的线段非常的吻合,因而模型建立得很不错。
再结合上一步骤的参数结果,也就是预测的数据误差来看,误差都是非常的小,因而对数据的5期预测值也是非常的可靠。
在对比第一个步骤的时序图,我们可以发现,在预测的5个期间段中,样本数据并没有很大程度的波动或很明显的趋势,但是相对偏向于下降的趋势,而它对应的置信区间也是最大的,因而数据会稳定在这期间中,尽管如此,数据也不会有明显的波动,都是相对稳定的。
19.
datalianxi3_19;
inputx@@;
time=_n_;
cards;
81.989.479.081.484.885.988.080.382.6
83.580.285.287.283.584.382.984.782.9
81.583.487.781.879.685.877.989.785.4
86.380.783.890.584.582.486.783.081.8
89.379.382.788.079.687.883.679.583.3
88.486.684.679.786.084.283.084.883.6
81.885.988.283.587.283.787.383.090.5
80.783.186.590.077.584.784.687.280.5
86.182.685.484.782.881.983.686.884.0
84.282.883.082.084.784.488.982.483.0
85.082.281.686.285.482.181.485.085.8
84.283.586.585.080.485.786.786.782.3
86.482.582.079.586.780.591.781.683.9
85.684.878.489.985.086.283.085.484.4
84.586.285.683.285.783.580.182.288.6
82.085.085.285.384.382.389.784.883.1
80.687.486.883.586.284.182.384.886.6
83.578.188.881.983.380.087.283.386.6
79.584.182.290.886.579.781.087.281.6
84.484.482.288.980.985.187.184.076.5
82.785.183.390.481.080.379.889.083.7
80.987.381.185.686.680.086.683.383.1
82.386.780.2
;
procgplotdata=lianxi3_18;
plotx*time=1;
symbol1c=redI=joinv=star;
run;
结果分析:
上图是数据对应的时序图,从图上曲线分析来看,数据并没有周期性或者趋向性规律,因而可以初步判断这是平稳数列。
procarimadata=lianxi3_18;
identifyVar=xnlag=8;
run;
结果分析:
本过程中,我们建立了8阶自回归分析模型,图上依次是变量的描述性统计量、样本自相关图、样本逆相关图和样本偏自相关图。
由于本次实验探究的是平稳序列,因而样本逆相关图先不作分析。
从自相关图来看,自相关系数趋于0的速度是比较快的,再结合时序图来看,可以确定这组数列是属于平稳数列。
从最后的纯随机检验结果分析来看,P<0.0001,因而这是非白噪声序列。
综上所述,该数列是平稳非白噪声序列,因为我们可以建立ARMA模型,对数据进行拟合。
首先观察自相关图和偏自相关图,从这两图来看,偏自相关图是不明显截尾,而自相关系数是1阶截尾的。
因而我们可以考虑建立MA
(1)模型,为了避免个人经验不足而导致模型建立错误,我们可以通过计算机来判断确定。
procarimadata=lianxi3_18;
identifyVar=xnlag=8minicp=(0:
5)q=(0:
5);
run;
结果分析:
从上图可以看出,在众多模型中,MA1模型的BIC信息量是最小的,因而我们接下来会采用MA
(1)模型来进行分析,这与我们上面人工判断分析的结果也是吻合的。
estimateq=1;
run;
结果分析:
以上是我们建立的MA
(1)模型中的参数结果。
其中,我们可以看出所有的参数均是显著的因而模型建立成立。
forecastlead=1id=timeout=results;
run;
结果分析:
以上是我们对数据进行了1期的预测,其预测数据均可以从上图中看出来。
其中,数据从左往右分别表示序列值的序号、预测值、预测值的标准差、95%的置信下限和95%的置信上限。
以下我们把这些预测的数据用图来表现出来:
procgplotdata=results;
plotx*time=1forecast*time=2l95*time=3u95*time=3/overlay;
symbol1c=blacki=nonev=star;
symbol2c=redi=joinv=none;
symbol3c=greeni=joinv=nonel=32;
run;
结果分析:
该图为预测的图像,其中,红色线段表示预测出来的数列,绿色的两条线段分别表示95%的置信下限和95%的置信上限,而黑色的星号标识则是对应的样本数据值。
从图来分析,我们可以看出,黑色的样本数据值跟我们预测出来的线段非常的吻合,因而模型建立得很不错。
再结合上一步骤的参数结果,也就是预测的数据误差来看,误差都是非常的小,因而对数据的1期预测值也是非常的可靠。
在对比第一个步骤的时序图,我们可以发现,在预测的1个期间段中,样本数据并没有很大程度的波动或很明显的趋势,但是相对偏向于下降的趋势,而它对应的置信区间也是最大的,因而数据会稳定在这期间中,尽管如此,数据也不会有明显的波动,都是相对稳定的。
三、实验体会
这一章是针对平稳非白噪声序列所建立的一种常用模型。
对我们日后分析数据,以及建立数据模型有非常大的影响。
学完这一章后,我们对SAS的应用有了一种比较实际的应用了。
数据与时间存在一种特殊的关系,有时候不一定能从理论上说出来,但是我们可以通过对大量的数据进行分析,发现其中的规律,并建立好适应的模型,这样有助于我们探究数据,同时对我们预测数据也起到非常大的作用。
从这一章,我们可以看到,第三章虽然是独立分开的一个章节,但是它与第一第二章都离不开,有着一定的联系,之前的内容都是作为铺垫,先对数据进行初步分析,然后再建模,再预测。
生活中很多时候需要我们对未知的事情进行估计,进行预测,因而需要我们建立好适当的,比较精确的模型,而这一章只是教了我们其中的一种,之后还有很多种情况需要我们慢慢探究。
但是,再探究之余,我们不能忘了最基础的数据分析,这是我们建模前的必要工作。