时间序列分析SAS第3章.docx

资源描述

时间序列分析SAS第3章.docx

《时间序列分析SAS第3章.docx》由会员分享，可在线阅读，更多相关《时间序列分析SAS第3章.docx（26页珍藏版）》请在冰豆网上搜索。

时间序列分析SAS第3章.docx

时间序列分析SAS第3章

佛山科学技术学院

应用时间序列分析实验报告

实验名称第三章平稳时间序列分析

专业班级10数学与应用数学姓名林敏杰学号2010214222

一、上机练习

程序及其结果分析：

dataex3_1;

inputx@@;

time=_n_;

cards;

0.30-0.450.360.000.170.452.15

4.423.482.991.742.400.110.96

0.21-0.10-1.27-1.45-1.19-1.47-1.34

-1.02-0.270.14-0.070.10-0.15-0.36

-0.50-1.93-1.49-2.35-2.18-0.39-0.52

-2.24-3.46-3.97-4.60-3.09-2.19-1.21

0.780.882.071.441.500.29-0.36

-0.97-0.30-0.280.800.911.951.77

1.800.56-0.110.10-0.56-1.34-2.47

0.07-0.69-1.960.041.590.200.39

1.06-0.39-0.162.071.351.461.50

0.94-0.08-0.66-0.21-0.77-0.520.05

;

procgplotdata=ex3_1;

plotx*time=1;

symbol1c=redI=joinv=star;

run;

结果分析：

上图是数据对应的时序图，从图上曲线分析来看，数据并没有周期性或者趋向性规律，因而可以初步判断这是平稳数列。

procarimadata=ex3_1;

identifyVar=xnlag=8;

run;

结果分析：

本过程中，我们建立了8阶自回归分析模型，图上依次是变量的描述性统计量、样本自相关图、样本逆相关图和样本偏自相关图。

由于本次实验探究的是平稳序列，因而样本逆相关图先不作分析。

从自相关图来看，自相关系数趋于0的速度是比较快的，再结合时序图来看，可以确定这组数列是属于平稳数列。

从最后的纯随机检验结果分析来看，P<0.0001，因而这是非白噪声序列。

综上所述，该数列是平稳非白噪声序列，因为我们可以建立ARMA模型，对数据进行拟合。

首先观察自相关图和偏自相关图，从这两图来看，自相关图是4阶截尾的，而篇相关系数是拖尾的。

因而我们可以考虑建立MA（4）模型，为了避免个人经验不足而导致模型建立错误，我们可以通过计算机来判断确定。

procarimadata=ex3_1;

identifyVar=xnlag=8minicp=（0:

5）q=（0:

5）;

run;

结果分析：

从上图可以看出，在众多模型中，MA（4）模型的BIC信息量是最小的，因而我们接下来会采用MA（4）模型来进行分析，这与我们上面人工判断分析的结果也是吻合的。

estimateq=4;

run;

结果分析：

以上是我们建立的MA（4）模型中的参数结果。

其中，我们可以看出，常数项对应的t统计量的P值是0.9968，它是>0.05的，也就说明它是不显著的，而其他参数均是显著的，为了使模型拟合得更优，我们应该除去常数项，再进行模型分析比较。

estimateq=4noint;

run;

结果分析:

以上是我们删去了常数项之后的结果。

从上述参数分析来看，所有的参数的t检验统计量的P值都是<0.001的，因而它们都是显著的。

因而我们建立了MA（4）模型如下：

forecastlead=5id=timeout=results;

run;

结果分析：

以上是我们对数据进行了5期的预测，其预测数据均可以从上图中看出来。

其中，数据从左往右分别表示序列值的序号、预测值、预测值的标准差、95%的置信下限和95%的置信上限。

以下我们把这些预测的数据用图来表现出来：

procgplotdata=results;

plotx*time=1forecast*time=2l95*time=3u95*time=3/overlay;

symbol1c=blacki=nonev=star;

symbol2c=redi=joinv=none;

symbol3c=greeni=joinv=nonel=32;

run;

结果分析：

该图为预测的图像，其中，红色线段表示预测出来的数列，绿色的两条线段分别表示95%的置信下限和95%的置信上限，而黑色的星号标识则是对应的样本数据值。

从图来分析，我们可以看出，黑色的样本数据值跟我们预测出来的线段非常的吻合，因而模型建立得很不错。

再结合上一步骤的参数结果，也就是预测的数据误差来看，误差都是非常的小，因而对数据的5期预测值也是非常的可靠。

在对比第一个步骤的时序图，我们可以发现，在预测的5个期间段中，样本数据并没有很大程度的波动或很明显的趋势，但是相对偏向于下降的趋势，而它对应的置信区间也是最大的，因而数据会稳定在这期间中，尽管如此，数据也不会有明显的波动，都是相对稳定的。

二、课后习题（老师布置的习题部分）

17.datalianxi3_17;

inputx@@;

time=_n_;

cards;

126.482.478.151.190.976.2104.587.4

110.52569.353.539.863.646.772.9

79.683.680.760.37974.449.654.7

71.849.1103.951.682.483.677.879.3

89.685.558120.7110.565.439.940.1

88.771.48355.989.984.8105.2113.7

124.7114.5115.6102.4101.489.871.570.9

98.355.566.178.4120.597110

;

procgplotdata=lianxi3_17;

plotx*time=1;

symbol1c=redI=joinv=star;

run;

结果分析：

上图是数据对应的时序图，从图上曲线分析来看，数据并没有周期性或者趋向性规律，因而可以初步判断这是平稳数列。

procarimadata=lianxi3_17;

identifyVar=xnlag=8;

run;

结果分析：

本过程中，我们建立了8阶自回归分析模型，图上依次是变量的描述性统计量、样本自相关图、样本逆相关图和样本偏自相关图。

由于本次实验探究的是平稳序列，因而样本逆相关图先不作分析。

从自相关图来看，自相关系数趋于0的速度是比较快的，再结合时序图来看，可以确定这组数列是属于平稳数列。

从最后的纯随机检验结果分析来看，P<0.0001，因而这是非白噪声序列。

综上所述，该数列是平稳非白噪声序列，因为我们可以建立ARMA模型，对数据进行拟合。

首先观察自相关图和偏自相关图，从这两图来看，偏自相关图是1阶截尾的，而篇相关系数是拖尾的。

因而我们可以考虑建立AR

（1）模型，为了避免个人经验不足而导致模型建立错误，我们可以通过计算机来判断确定。

procarimadata=lianxi3_17;

identifyVar=xnlag=8minicp=（0:

5）q=（0:

5）;

run;

结果分析：

estimatep=1;

run;

结果分析：

以上是我们建立的AR

（1）模型中的参数结果。

其中，我们可以看出所有的参数均是显著的，为了使模型拟合得更优，我们应该除去常数项，再进行模型分析比较。

forecastlead=5id=timeout=results;

run;

结果分析：

以上是我们对数据进行了5期的预测，其预测数据均可以从上图中看出来。

其中，数据从左往右分别表示序列值的序号、预测值、预测值的标准差、95%的置信下限和95%的置信上限。

以下我们把这些预测的数据用图来表现出来：

procgplotdata=results;

plotx*time=1forecast*time=2l95*time=3u95*time=3/overlay;

symbol1c=blacki=nonev=star;

symbol2c=redi=joinv=none;

symbol3c=greeni=joinv=nonel=32;

run;

结果分析：

从图来分析，我们可以看出，黑色的样本数据值跟我们预测出来的线段非常的吻合，因而模型建立得很不错。

再结合上一步骤的参数结果，也就是预测的数据误差来看，误差都是非常的小，因而对数据的5期预测值也是非常的可靠。

18.

datalianxi3_18;

inputx@@;

time=_n_;

cards;

0.970.451.611.261.371.431.321.230.840.891.18

1.331.210.980.910.611.230.971.100.740.800.81

0.800.600.590.630.870.360.810.910.770.960.93

0.950.650.980.700.861.320.880.680.781.250.79

1.190.690.920.860.860.850.900.540.321.401.14

0.690.910.680.570.940.350.390.450.990.840.62

0.850.730.660.760.630.320.170.46

;

procgplotdata=lianxi3_18;

plotx*time=1;

symbol1c=redI=joinv=star;

run;

结果分析：

上图是数据对应的时序图，从图上曲线分析来看，数据并没有周期性或者趋向性规律，因而可以初步判断这是平稳数列。

procarimadata=lianxi3_18;

identifyVar=xnlag=8;

run;

结果分析：

本过程中，我们建立了8阶自回归分析模型，图上依次是变量的描述性统计量、样本自相关图、样本逆相关图和样本偏自相关图。

由于本次实验探究的是平稳序列，因而样本逆相关图先不作分析。

从自相关图来看，自相关系数趋于0的速度是比较快的，再结合时序图来看，可以确定这组数列是属于平稳数列。

从最后的纯随机检验结果分析来看，P<0.0001，因而这是非白噪声序列。

综上所述，该数列是平稳非白噪声序列，因为我们可以建立ARMA模型，对数据进行拟合。

首先观察自相关图和偏自相关图，从这两图来看，偏自相关图是1阶截尾的，而自相关系数是拖尾的。

因而我们可以考虑建立AR

（1）模型，为了避免个人经验不足而导致模型建立错误，我们可以通过计算机来判断确定。

procarimadata=lianxi3_18;

identifyVar=xnlag=8minicp=（0:

5）q=（0:

5）;

run;

结果分析：

从上图可以看出，在众多模型中，AR

（1）模型的BIC信息量是最小的，因而我们接下来会采用AR

（1）模型来进行分析，这与我们上面人工判断分析的结果也是吻合的。

estimatep=1;

run;

结果分析：

以上是我们建立的AR

（1）模型中的参数结果。

其中，我们可以看出所有的参数均是显著的因而模型建立成立。

forecastlead=5id=timeout=results;

run;

结果分析：

以上是我们对数据进行了5期的预测，其预测数据均可以从上图中看出来。

其中，数据从左往右分别表示序列值的序号、预测值、预测值的标准差、95%的置信下限和95%的置信上限。

以下我们把这些预测的数据用图来表现出来：

procgplotdata=results;

plotx*time=1forecast*time=2l95*time=3u95*time=3/overlay;

symbol1c=blacki=nonev=star;

symbol2c=redi=joinv=none;

symbol3c=greeni=joinv=nonel=32;

run;

结果分析：

从图来分析，我们可以看出，黑色的样本数据值跟我们预测出来的线段非常的吻合，因而模型建立得很不错。

再结合上一步骤的参数结果，也就是预测的数据误差来看，误差都是非常的小，因而对数据的5期预测值也是非常的可靠。

19.

datalianxi3_19;

inputx@@;

time=_n_;

cards;

81.989.479.081.484.885.988.080.382.6

83.580.285.287.283.584.382.984.782.9

81.583.487.781.879.685.877.989.785.4

86.380.783.890.584.582.486.783.081.8

89.379.382.788.079.687.883.679.583.3

88.486.684.679.786.084.283.084.883.6

81.885.988.283.587.283.787.383.090.5

80.783.186.590.077.584.784.687.280.5

86.182.685.484.782.881.983.686.884.0

84.282.883.082.084.784.488.982.483.0

85.082.281.686.285.482.181.485.085.8

84.283.586.585.080.485.786.786.782.3

86.482.582.079.586.780.591.781.683.9

85.684.878.489.985.086.283.085.484.4

84.586.285.683.285.783.580.182.288.6

82.085.085.285.384.382.389.784.883.1

80.687.486.883.586.284.182.384.886.6

83.578.188.881.983.380.087.283.386.6

79.584.182.290.886.579.781.087.281.6

84.484.482.288.980.985.187.184.076.5

82.785.183.390.481.080.379.889.083.7

80.987.381.185.686.680.086.683.383.1

82.386.780.2

;

procgplotdata=lianxi3_18;

plotx*time=1;

symbol1c=redI=joinv=star;

run;

结果分析：

上图是数据对应的时序图，从图上曲线分析来看，数据并没有周期性或者趋向性规律，因而可以初步判断这是平稳数列。

procarimadata=lianxi3_18;

identifyVar=xnlag=8;

run;

结果分析：

本过程中，我们建立了8阶自回归分析模型，图上依次是变量的描述性统计量、样本自相关图、样本逆相关图和样本偏自相关图。

由于本次实验探究的是平稳序列，因而样本逆相关图先不作分析。

从自相关图来看，自相关系数趋于0的速度是比较快的，再结合时序图来看，可以确定这组数列是属于平稳数列。

从最后的纯随机检验结果分析来看，P<0.0001，因而这是非白噪声序列。

综上所述，该数列是平稳非白噪声序列，因为我们可以建立ARMA模型，对数据进行拟合。

首先观察自相关图和偏自相关图，从这两图来看，偏自相关图是不明显截尾，而自相关系数是1阶截尾的。

因而我们可以考虑建立MA

（1）模型，为了避免个人经验不足而导致模型建立错误，我们可以通过计算机来判断确定。

procarimadata=lianxi3_18;

identifyVar=xnlag=8minicp=（0:

5）q=（0:

5）;

run;

结果分析：

从上图可以看出，在众多模型中，MA1模型的BIC信息量是最小的，因而我们接下来会采用MA

（1）模型来进行分析，这与我们上面人工判断分析的结果也是吻合的。

estimateq=1;

run;

结果分析：

以上是我们建立的MA

（1）模型中的参数结果。

其中，我们可以看出所有的参数均是显著的因而模型建立成立。

forecastlead=1id=timeout=results;

run;

结果分析：

以上是我们对数据进行了1期的预测，其预测数据均可以从上图中看出来。

其中，数据从左往右分别表示序列值的序号、预测值、预测值的标准差、95%的置信下限和95%的置信上限。

以下我们把这些预测的数据用图来表现出来：

procgplotdata=results;

plotx*time=1forecast*time=2l95*time=3u95*time=3/overlay;

symbol1c=blacki=nonev=star;

symbol2c=redi=joinv=none;

symbol3c=greeni=joinv=nonel=32;

run;

结果分析：

从图来分析，我们可以看出，黑色的样本数据值跟我们预测出来的线段非常的吻合，因而模型建立得很不错。

再结合上一步骤的参数结果，也就是预测的数据误差来看，误差都是非常的小，因而对数据的1期预测值也是非常的可靠。

在对比第一个步骤的时序图，我们可以发现，在预测的1个期间段中，样本数据并没有很大程度的波动或很明显的趋势，但是相对偏向于下降的趋势，而它对应的置信区间也是最大的，因而数据会稳定在这期间中，尽管如此，数据也不会有明显的波动，都是相对稳定的。

三、实验体会

这一章是针对平稳非白噪声序列所建立的一种常用模型。

对我们日后分析数据，以及建立数据模型有非常大的影响。

学完这一章后，我们对SAS的应用有了一种比较实际的应用了。

数据与时间存在一种特殊的关系，有时候不一定能从理论上说出来，但是我们可以通过对大量的数据进行分析，发现其中的规律，并建立好适应的模型，这样有助于我们探究数据，同时对我们预测数据也起到非常大的作用。

从这一章，我们可以看到，第三章虽然是独立分开的一个章节，但是它与第一第二章都离不开，有着一定的联系，之前的内容都是作为铺垫，先对数据进行初步分析，然后再建模，再预测。

生活中很多时候需要我们对未知的事情进行估计，进行预测，因而需要我们建立好适当的，比较精确的模型，而这一章只是教了我们其中的一种，之后还有很多种情况需要我们慢慢探究。

但是，再探究之余，我们不能忘了最基础的数据分析，这是我们建模前的必要工作。

展开阅读全文