《应用时间序列分析》实验手册共19页文档文档格式.docx
《《应用时间序列分析》实验手册共19页文档文档格式.docx》由会员分享,可在线阅读,更多相关《《应用时间序列分析》实验手册共19页文档文档格式.docx(14页珍藏版)》请在冰豆网上搜索。
打开数据
2.绘制时序图
可以如下图所示选择序列然后点Quick选择Scatter或者XYline;
绘制好后可以双击图片对其进行修饰,如颜色、线条、点等
绘制散点图
年份和产出的散点图
(二)自相关图检验
例2.3
导入数据,方式同上;
在Quick菜单下选择自相关图,对Qiwen原列进行分析;
可以看出自相关系数始终在零周围波动,判定该序列为平稳时间序列。
序列的相关分析
输入序列名称
选择相关分析的对象
序列的相关分析结果:
1.可以看出自相关系数始终在零周围波动,判定该序列为平稳时间序列2.看Q统计量的P值:
该统计量的原假设为X的1期,2期……k期的自相关系数均等于0,备择假设为自相关系数中至少有一个不等于0,因此如图知,该P值都>
5%的显著性水平,所以接受原假设,即序列是纯随机序列,即白噪声序列(因为序列值之间彼此之间没有任何关联,所以说过去的行为对将来的发展没有丝毫影响,因此为纯随机序列,即白噪声序列.)有的题目平稳性描述可以模仿书本33页最后一段.
(三)平稳性检验还可以用:
单位根检验:
ADF,PP检验等;
非参数检验:
游程检验
序列的单位根检验
表示不包含截距项
单位根检验的方法选择
ADF检验的结果:
如图,单位根统计量ADF=-0.016384都大于EVIEWS给出的显著性水平1%-10%的ADF临界值,所以接受原假设,该序列是非平稳的。
二、纯随机性检验
计算Q统计量,根据其取值判定是否为纯随机序列。
例2.3的自相关图中有Q统计量,其P值在K=6、12的时候均比较大,不能拒绝原假设,认为该序列是白噪声序列。
另外,小样本情况下,LB统计量检验纯随机性更准确。
第三章平稳时间序列建模实验教程
一、模型识别
1.打开数据
2.绘制趋势图并大致判断序列的特征
绘制序列散点图
输入散点图的两个变量
序列的散点图
3.绘制自相关和偏自相关图
在数据窗口下选择相关分析
选择变量
选择对象
序列相关图
4.根据自相关图和偏自相关图的性质确定模型类型和阶数
如果样本(偏)自相关系数在最初的d阶明显大于两倍标准差范围,而后几乎95%的自相关系数都落在2倍标准差的范围以内,而且通常由非零自相关系数衰减为小值波动的过程非常突然。
这时,通常视为(偏)自相关系数截尾。
截尾阶数为d。
本例:
自相关图显示延迟3阶之后,自相关系数全部衰减到2倍标准差范围内波动,这表明序列明显地短期相关。
但序列由显著非零的相关系数衰减为小值波动的过程相当连续,相当缓慢,该自相关系数可视为不截尾
偏自相关图显示除了延迟1阶的偏自相关系数显著大于2倍标准差之外,其它的偏自相关系数都在2倍标准差范围内作小值随机波动,而且由非零相关系数衰减为小值波动的过程非常突然,所以该偏自相关系数可视为一阶截尾
所以可以考虑拟合模型为AR
(1)
自相关系数
偏相关系数
模型定阶
拖尾
P阶截尾
AR(p)模型
Q阶截尾
MA(q)模型
ARMA(P,Q)模型
具体判别什么模型看书58到62的图例。
二、模型参数估计
根据相关图模型确定为AR
(1),建立模型估计参数
在ESTIMATE中按顺序输入变量cxccx(-1)或者cxcar
(1)选择LS参数估计方法,查看输出结果,看参数显著性,该例中两个参数都显著。
细心的同学可能发现两个模型的C取值不同,这是因为前一个模型的C为截距项;
后者的C则为序列期望值,两个常数的含义不同。
建立模型
输入模型中变量,选择参数估计方法
参数估计结果
图5:
图6:
三、模型的显著性检验
检验内容:
整个模型对信息的提取是否充分;
参数的显著性检验,模型结构是否最简。
模型残差
残差的平稳性和纯随机性检验
对残差序列进行白噪声检验,可以看出ACF和PACF都没有显著异于零,Q统计量的P值都远远大于0.05,因此可以认为残差序列为白噪声序列,模型信息提取比较充分。
常数和滞后一阶参数的P值都很小,参数显著;
因此整个模型比较精简,模型较优。
四、模型优化
当一个拟合模型通过了检验,说明在一定的置信水平下,该模型能有效地拟合观察值序列的波动,但这种有效模型并不是唯一的。
当几个模型都是模型有效参数显著的,此时需要选择一个更好的模型,即进行优化。
优化的目的,选择相对最优模型。
优化准则:
最小信息量准则(AnInformationCriterion)
指导思想
似然函数值越大越好
未知参数的个数越少越好
AIC准则的缺陷
在样本容量趋于无穷大时,由AIC准则选择的模型不收敛于真实模型,它通常比真实模型所含的未知参数个数要多
但是本例中滞后二阶的参数不显著,不符合精简原则,不必进行深入判断。
第四章非平稳时间序列的确定性分析
第三章介绍了平稳时间序列的分析方法,但是自然界中绝大多数序列都是非平稳的,因而对非平稳时间序列的分析跟普遍跟重要,人们创造的分析方法也更多。
这些方法分为确定性时序分析和随机时序分析两大类,本章主要介绍确定性时序分析方法。
一个序列在任意时刻的值能够被精确确定(或被预测),则该序列为确定性序列,如正弦序列、周期脉冲序列等。
而某序列在某时刻的取值是随机的,不能给以精确预测,只知道取某一数值的概率,如白噪声序列等。
Cramer分解定理说明每个序列都可以分成一个确定序列加一个随机序列,平稳序列的两个构成序列均平稳,非平稳时间序列则至少有一部分不平稳。
本章先分析确定性序列不平稳的非平稳时间时间序列的分析方法。
确定性序列不平稳通常显示出非常明显的规律性,如显著趋势或者固定变化周期,这种规律性信息比较容易提取,因而传统时间序列分析的重点在确定性信息的提取上。
常用的确定性分析方法为因素分解。
分析目的为:
①克服其他因素的影响,单纯测度某一个确定性因素的影响;
②推断出各种因素彼此之间作用关系及它们对序列的综合影响。
一、趋势分析
绘制序列的线图,观测序列的特征,如果有明显的长期趋势,我们就要测度其长期趋势,测度方法有:
趋势拟合法、平滑法。
(一)趋势拟合法
1.线性趋势拟合
例1:
以澳大利亚政府1981-1990年每季度消费支出数据为例进行分析。
导入数据
绘制线图,序列有明显的上升趋势
长期趋势具备线性上升的趋势,所以进行序列对时间的线性回归分析。
序列支出(zc)对时间(t)进行线性回归分析
回归参数估计和回归效果评价
可以看出回归参数显著,模型显著,回归效果良好,序列具有明显线性趋势。
运用模型进行预测
预测效果(偏差率、方差率等)
图7:
绘制原序列和预测序列的线图
图8:
原序列和预测序列的线图
图9:
残差序列的曲线图
可以看出残差序列具有平稳时间序列的特征,我们可以进一步检验剔除了长期趋势后的残差序列的平稳性,第三章知识这里不在叙述。
2.曲线趋势拟合
例2:
对上海证券交易所1991.1-2001.10每月月末上正指数序列进行拟合。
绘制曲线图
可以看出序列不是线性上升,而是曲线上升,尝试用二次模型拟合序列的发展。
模型参数估计和回归效果评价
因为该模型中T的系数不显著,我们去掉该项再进行回归分析。
新模型参数估计和回归效果评价
新模型的预测效果分析
原序列和预测序列值
原序列和预测序列值曲线图
计算预测误差
对预测误差序列进行单位根检验
拒绝原假设,认为序列没有单位根,为平稳序列,说明模型对长期趋势拟合的效果还不错。
同样,序列与时间之间的关系还有很多中,比如指数曲线、生命曲线、龚柏茨曲线等等,其回归模型的建立、参数估计等方法与回归分析同,这里不再详细叙述。
(二)平滑法
除了趋势拟合外,平滑法也是消除短期随机波动反应长期趋势的方法,而其平滑法可以追踪数据的新变化。
平滑法主要有移动平均方法和指数平滑法两种,这里主要介绍指数平滑方法。
例3:
对北京市1950-1998年城乡居民定期储蓄所占比例序列进行平滑。
打开序列,进行指数平滑分析
系统自动给定平滑系数趋势
给定方法为选择使残差平方和最小的平滑系数,该例中平滑系数去0.53,超过0.5用一次平滑效果不太好
平滑前后序列曲线图
用二次平滑修匀原序列
可以看出,平滑系数为0.134,平均差为4.067708,修匀或者趋势预测效果不错。
二次平滑效果图
例4:
对于有明显线性趋势的序列,我们可以采用Holt两参数法进行指数平滑
对北京市1978-2000年报纸发行量序列进行Holt两参数指数平滑
报纸发行量的曲线图
Holt两参数指数平滑(指定平滑系数)
预测效果检验
系统自动给定平滑系数时平滑效果
原序列与预测序列曲线图
(其中FXSM为自己给定系数时的平滑值,FXSM2为系统给定系数时的平滑值)
二、季节效应分析
许多序列有季节效应,比如:
气温、商品零售额、某景点旅游人数等都会呈现明显的季节变动规律。
例5:
以北京市1995-2000年月平均气温序列为例,介绍季节效应分析操作。
建立月度数据新工作表
新工作表中添加数据
五年的月度气温数据
进行季节调整(移动平均法)
移动平均季节加法
12个月的加法调整因子
打开三个序列(季节调整序列、原序列、调整后序列)
三个序列(季节调整序列、原序列、调整后序列)取值
三个序列(季节调整序列、原序列、调整后序列)曲线图
另外季节调整还可以用X11,X12等方法进行调整。
三、综合分析
前面两部分介绍了单独测度长期趋势和季节效应的分析方法,这里介绍既有长期趋势又有季节效应的复杂序列的分析方法。
附录1.11对1993——2000年中国社会消费品零售总额序列进行确定性分析
绘制1993——2000年中国社会消费品零售总额时序图
可以看出序列中既有长期趋势又有季节波动
进行季节调整
12个月的季节因子
经季节调整后的序列SSA
对经季节调整后序列进行趋势拟合
趋势拟合序列SSAF与序列SSA的时序图
扩展时间区间后预测长期趋势值SSAF
经季节调整预测2001年12个月的零售总额值
预测2001年12个月的零售总额值
图10:
预测序列与原序列的时序图
第五章非平稳序列的随机分析
非平稳序列的确定性分析原理简单操作方便易于解释,但是只提取确定性信息,对随机信息浪费严重;
且各因素之间确切的作用关系没有明确有效的判断方法。
随机分析方法的发展弥补了这些不足,为人们提供更加丰富、更加精确的时序分析工具。
对非平稳时间序列的分析,要先提取确定性信息再研究随机信息。
一、差分法提取确定性信息
确定性信息的提取方法有第四章学习的趋势拟合、指数平滑、季节指数、季节多元回归等,本章主要介绍差分法提取确定性信息。
差分实质:
自回归
差分方式:
对线性趋势序列进行1阶差分、对曲线趋势序列进行低阶差分、对固定周期序列进行周期差分
附录1.2线性趋势:
对产出序列进行一阶差分
详细分析过程如下:
绘制线性图,观察序列的特征
观察发现序列具有较明显的线性趋势
进行一阶差分运算
一阶差分运算公式
一阶差分序列
一阶差分曲线图
观察一阶差分序列均值方差稳定,进一步进行平稳性分析。
绘制一阶差分序列的相关图
自相关图均不显著,Q统计量不显著
因此,差分后序列问白噪声序列,一阶差分将序列的信息提取充分。
附录1.12曲线序列:
北京市民用车拥有量序列差分分析
绘制原序列曲线图
可以看出,1950年到1999年北京市居民民用车拥有量序列具有曲线趋势,现用低阶差分法提取确定性信息。
绘制一阶差分序列的曲线图
一阶差分序列曲线图
可以看出一阶差分序列仍然具有趋势,继续进行差分分析;
二阶差分的命令的D(QC,2),低阶差分的命令为D(QC,K)。
对原序列进行二阶差分
二阶差分序列曲线图
从二阶差分序列曲线图可以看出二阶差分序列中没有中长期趋势,二阶差分提取了长期趋势。
自相关分析
对序列的二阶差分序列进行自相关分析
二阶差分序列相关图
可以看出二阶差分序列具有短期相关性的特征,无确定性信息,为平稳序列。
附录1.13固定周期序列:
奶牛月产奶量序列差分分析
导入数据(月度数据)
绘制序列曲线图
可以看出本序列既有长期趋势又有周期性因素,因此我们首先进行一阶差分提取趋势特征,再进行12步周期差分提取周期信息。
可以看出序列不再具有趋势特征,一阶差分提取了线性趋势
对序列进行一阶差分
对一阶差分序列进行12步周期差分
绘制周期差分后序列
上述操作也可以用D(OP,1,12)命令来实现,即一阶——12步差分,因此直接绘制序列D(OP,1,12)的时序图结果如图6。
周期差分后序列的相关图
可以看出序列自相关系数12阶显著,说明还是有一定的周期性
对上面的序列再进行12步差分,绘制曲线图
序列的相关图
可以看出12阶相关系数仍然显著,且相关系数比D12D1序列的相关系数还大,因此我们就进行到上一步骤即可。
差分的方式小结
对线性趋势的序列,一阶差分即可提取确定性信息,命令为D(X);
对曲线趋势的序列,低阶差分即可提取序列的确定性信息,命令为D(X,a);
对具有周期性特点的序列,k步差分即可提取序列的周期性信息,命令为D(X,0,k)。
对既有长期趋势又有周期性波动的序列,可以采用低阶——k步差分的操作提取确定性信息,操作方法为D(X,a,k)。
非平稳序列如果经过差分变成平稳序列,则我们称这类序列为差分平稳序列,差分平稳序列可以使用ARIMA模型进行拟合。
二、ARIMA模型
差分平稳序列在经过差分后变成平稳时间序列,之后的分析可以用ARMA模型进行,差分过程加上ARMA模型对差分平稳序列进行的分析称为ARIMA模型。
附录1.14分析1952-1988年中国农业实际国民收入指数序列
先观测序列的时序图,可知序列具有线性长期趋势,需要进行1阶差分。
1952-1988年中国农业实际国民收入指数时序图
再观测差分序列的时序图
中国农业实际国民收入指数1阶差分后序列的时序图
国农业实际国民收入指数1阶差分后序列的相关分析
由图可知,序列1阶自相关显著,序列平稳;
Q统计量P值小于0.05,非白噪声;
同时,偏自相关拖尾、自相关一步截尾,建立ARIMA(0,1,1)模型。
(建立ARIMA(0,1,1)模型,是因为偏自相关拖尾,所以第一个数值为0,然后因为序列进行了一阶差分,所以中间数值为1,又自相关图一阶截尾,所以最后一个数值为1.)
中国农业实际国民收入指数的ARIMA(0,1,1)模型
模型残差的相关性分析
从图4和图5分析可知,残差为白噪声,模型信息提取充分;
模型参数显著,模型精简,因此建立的ARIMA(0,1,1)模型合格,模型具体情况如下式:
(1-B)S=5.0156+(1-0.7082B)
预测1989-2000年农业实际国民收入指数
1989-2000年农业实际国民收入指数预测图
三、季节模型
1.简单季节模型
附录1.13对1962.1——1975.12平均每头奶牛月产奶量序列进行分析
根据前面的分析可知,经过1——12步差分后,op变成平稳时间序列。
序列D(OP,1,12)的相关分析图
经过相关分析看出自相关图具有短期相关性,是平稳时间序列;
Q统计量的P值有小于0.05的情况,因此序列为平稳非白噪声序列。
又观测自相关和偏自相关图,识别方程为一阶自回归方程
序列D(OP,1,12)的AR
(1)模型
模型残差的相关分析
分析可知残差为白噪声,因而模型提取信息充分;
观测图2可知模型参数显著,因而AR
(1)模型可以提取平稳序列D(OP,1,12)的信息。
模型的具体信息为
(1-B)(1-B
OP=
2.乘积季节模型
当序列中长期趋势、季节效应、随机波动可以很容易分开,我们用简单季节模型进行分析;
但更为常见的是序列的三个部分不能简单分开,而是相互关联,这时要用乘积季节模型。
附录1.17试分析1948-1981年美国女性(大于20岁)月度失业率序列
首先观测序列的时序图
1948-1981年美国女性(大于20岁)月度失业率序列时序图
由时序图可知,序列既有长期趋势又有周期性,因此进行1阶——12步差分
进行1阶——12步差分
D(S,1,12)的时序图
从时序图可以看出D(S,1,12)均值稳定,也没有明显的周期性,方差有界;
通过相关分析,具体分析序列的平稳性,如图4。
图4中可以看出自相关两阶显著,但是12阶也是显著的,因此在趋势平稳中又包含了周期性因素。
D(S,1,12)的相关分析
用ARMA模型拟合序列D(S,1,12)尝试如下:
AR(1,12)模型拟合序列D(S,1,12)
AR(1,12)模型拟合序列D(S,1,12)的残差相关图
可以看出模型残差非白噪声,模型提取信息不充分。
MA(1,12)模型拟合序列D(S,1,12)
MA(1,12)模型拟合序列D(S,1,12)残差相关图
可以看出模型残差也非白噪声,模型提取信息不充分。
这种情况下我们尝试乘积季节模型
ARMA(1,1)×
(1,0,1)
拟合序列D(S,1,12)
模型的参数
可以看出SAR(12)的参数并不显著,因此删除该项。
图11:
(0,0,1)
图12:
(0,0,1)
图13:
乘积模型的残差相关图
可以看出乘积模型的残差为白噪声序列,该模型提取序列的信息充分;
参数都显著,因此模型精简;
模型的具体形式为:
)S=
希望以上资料对你有所帮助,附励志名言3条:
1、上帝说:
你要什么便取什么,但是要付出相当的代价。
2、目标的坚定是性格中最必要的力量源泉之一,也是成功的利器之一。
没有它,天才会在矛盾无定的迷径中徒劳无功。
3、当你无法从一楼蹦到三楼时,不要忘记走楼梯。
要记住伟大的成功往往不是一蹴而就的,必须学会分解你的目标,逐步实施。