SAS学习系列37时间序列分析报告Ⅰ平稳性及纯随机性检验.docx
《SAS学习系列37时间序列分析报告Ⅰ平稳性及纯随机性检验.docx》由会员分享,可在线阅读,更多相关《SAS学习系列37时间序列分析报告Ⅰ平稳性及纯随机性检验.docx(15页珍藏版)》请在冰豆网上搜索。
SAS学习系列37时间序列分析报告Ⅰ平稳性及纯随机性检验
37.时间序列分析I—平稳性及纯随机性检验
(一)基本概念
一、什么是时间序列?
为了研究某一事件的规律,依据时间发生的顺序将事件在多个时刻的数值记录下来,就构成了一个时间序列。
对时间序列进行观察、研究,找寻它变化发展的规律,预测它将来的发展趋势就是时间序列分析。
例如,国家或地区的年度财政收入,股票市场的每日波动,气象变化,工厂按小时观测的产量等等。
注:
随温度、高度等变化而变化的离散序列,也可以看作时间序列。
二、时间序列的特点
(1)顺序性;
(2)随机性;
(3)前后时刻(不一定相邻)的依存性;
(4)整体呈趋势性和周期性。
三、时间序列的分类
按研究对象的数目:
一元时间序列、多元时间序列;
按序列统计特性:
平稳时间序列、非平稳时间序列;
按分布规律:
高斯时间序列、非高斯时间序列。
四、研究方法
1.平稳时间序列分析;
2.非平稳时间序列分析(确定性分析、随机性分析)。
五、其它
任何时间序列经过合理的函数变换后都可以被认为是由下列三部分叠加而成:
(1)趋势项部分;
(2)周期项部分;
(周期项);随机信号和随机噪声。
时间序列分析的主要任务就是:
上面三部分分解出来,是研究平
稳随机过程的变化规律,建立特定的ARIMA模型(要求大体平稳、
可能含有周期但不能有规则性的线性指数等类型趋势项)。
六、方法性工具
1.差分运算
(1)k步差分
间隔k期的观察值之差:
△k二xt-xt-k
(2)p阶差分
△Xt=Xt-Xt-i称为一阶差分;
p
厶pxt-汀,-二'(-1)、CPxt卩」称为p阶差分;
i=0
SAS函数实现:
diffn(x)
2.延迟算子
延迟算子作用于时间序列,时间刻度减小1个单位(序列左移一位):
Bxt二Xt-i,,Bpxt=xt-p.
SAS函数实现:
lagn(x)
用延迟算子表示k步差分和p阶差分为:
△k=Xt-Xt-k=(1-B)Xt
p
:
pxt=(l-B)p八(-1)0心
i-0
(二)平稳时间序列
一、概念
平稳时间序列按限制条件的严格程度,分为
严平稳时间序列:
序列所有的统计性质都不会随着时间的推移而发生变化;
宽平稳时间序列:
序列的主要性质近似稳定,即统计性质只要保证序列的二阶矩平稳,即对任意的时间t,s,k,序列X满足:
EX:
EX:
—z
Eg-再)(兀-儿)-E(X十从)(兀心-从")
二、平稳时间序列的统计性质
(1)均值为常数;
(2)自协方差只依赖于时间跨度;
若定义自协方差函数为
丫(t,s)=E(X-t)(Xs-as)
则可由二元函数简化为一元函数丫(t-s),得延迟k自协方差函数:
丫(k)二丫(t’t+k)
由此易知平稳时间序列必具有常数方差:
D(X)二E(X-at)2=Y(t,t)=Y(0)
时间序列自相关函数:
jDXtDXs
延迟k自相关函数:
E(Xt」t)(Xtk」tk)二(k)一(k)
.DXtDXtk.(0)(0)(0)
基本性质:
(1)p(0)=1;
(2)p(-k)=p(k);
(3)自相关阵为对称负定阵;
(4)非唯一性。
注意:
协方差函数和相关函数——度量两个不同事件(X,Yt)彼此之间的相互影响的程度。
自协方差函数和自相关函数一一度量用一事件(X)在两个不同时期之间的相互影响的程度。
三、样本估计值
总体均值的估计值:
延迟k自协方差函数的估计值:
n-k
力(旺-壬)(兀斗—壬)
7間=旦
总体方差的估计值:
£(兀苗久0)-胡一—
延迟k自相关函数的估计值:
童)
/(0)
四、平稳性检验
(1)时序图检验
若无明显的趋势性和周期性,则平稳;
(2)自相关图检验
零均值平稳序列的自相关函数要么截尾要么拖尾;若时间序列零
均值化后出现缓慢衰减或周期性衰减,则说明存在趋势性和周期性
(非平稳);
(3)单位根检验就是通过检验时间序列自回归特征方程的特征
根是在单位圆内(平稳)还是在单位圆及单位圆外(非平稳)。
通常
用ADF检验法。
Dickey和Fuller(1979)利用如下的广义自回归模型
其中,△Xj,t表示x的一阶差分;Xj,t-1表示延迟一期;△Xj,t-k表示延迟k期再一阶差分;£k,t表示扰动项。
上述回归模型生成的Xj,t-1的t值正好对应ADF统计量,做假设检验:
H0:
非平稳;H:
平稳。
t值在1%,5%,10%置信水平的临界值分别为:
-3.524233,-2.902358,-2.588587.以此判断序列是否
平稳。
注:
若X不平稳,可以依次对X做一阶、二阶…差分,直到序
列平稳例1.平稳性检验一一ADF检验的SAS实现。
代码:
datasimulation;doi=1to100;x=rannor(1234);output;
end;
run;
datatimeseries;setsimulation;
x_1st_lag=Iag1(x);
x_1st_diff=dif1(x);x_1st_diff_1st_lag=dif1(lag1(x));x_1st_diff_2nd」ag=dif1(lag2(x));x_1st_diff_3rd」ag=dif1(lag3(x));x_1st_diff_4th」ag=dif1(lag4(x));x_1st_diff_5th」ag=dif1(lag5(x));run;
procregdata=timeseries;modelx1stdiff=x1stlagx1stdiff1stlag
x1stdiff2ndlag
x1stdiff3rdlag
x1stdiff4thlag
x_1st_diff_5th」ag;run;
运行结果:
REG过程模型:
MODEL1因变量:
x1stdiff
读取的观测数
100
使用的观测数
94
具有缺失值的观测数
6
方差分析
源自由度平方和均方F值Pr>F
模型6111.3808218.5634715.25<.0001
误差87105.884241.21706
校正合计93217.26507
均方根误差1.10320R方0.5126
因变量均值0.02507调整R方0.4790
变异系数4399.76165
参数估计值
变量
自由度
参数估计值
标准误差t值Pr
>|t|
Intercept
1
-0.01634
0.11418-0.14
0.8866
x_1st_lag
1
-0.70975
0.20949-3.39
0.0011
x1stdiff1stlag
1
-0.26217
0.19212-1.36
0.1759
x1stdiff2ndlag
1
-0.15780
0.17907-0.88
0.3806
x1stdiff3rdlag
1
-0.01973
0.16308-0.12
0.9040
x1stdiff4thlag
1
0.07067
0.139380.51
0.6134
x1stdiff5thlag
1
0.00340
0.105910.03
0.9745
x_1st_lag的
t值二
-3.39P值二
0.0011<0.05判断)故拒绝原假设H0,即序列平稳
五、纯随机性检验
若序列值彼此之间没有任何相关性,即过去的行为对未来的发展没有丝毫影响,此时称为纯随机序列。
从统计分析的角度而言,纯随机序列是没有任何分析价值的序列。
因此,为了确保平稳序列还值不值得分析,还需要对平稳序列进行纯随机性检验。
1.纯随机序列(白噪声序列)
若对任取的时间t和s,时间序列Xt满足:
(1)E(Xt)=卩;(常数均值)
(2)r(t,s)=(T2,若t=s;(方差齐性)
(3)r(t,s)=0,若t工s.(纯随机性)
则称Xt为纯随机序列或白噪声序列(白光具有该特性),简记为X~WN@,(T2)。
白噪声序列是最简单的平稳时间序列。
随机生成的1000
个服从标准正态分布的白噪声序列观察值:
标准正态分布白噪声序列Xt
2.纯随机性检验
Barlett证明:
n个观察值的纯随机时间序列,延迟为k(工0)的自相关函数p(k)近似服从正态分布N(0,1/n).
由此可以构造QBp统计量(适合样本数n》50)和Qb统计量(适合小样本)来检验序列的纯随机性:
Qbp-吃门讥)~才帥)
t=l
Qis=«(«+2)g(性~*(桝)
再做假设检验:
H0:
p
(1)=p
(2)=…二p(m),即延迟wm的序列之间相互独立;
H:
至少有一个p(k)半0,即延迟wm的序列之间有相关性。
注:
m—般取值为6、12。
这是因为平稳序列通常具有短期相关性,只要序列时期足够长,自相关系数都会收敛于零。
例2.数据如下表,时间间隔为天,起始时间自定义
10
15
10
10
12
10
7
7
10
14
8
17
14
18
r3
9
11
r10
6
12
「14
10
25
r29
33
33
12
19
16
19
19
12
34
15
36
29
26
21
17
19
13
20
24
12
6
14
6
12
9
11
r17
12
8
P14
14
12
5
8
10
3
16
8
8
7
12
6
10
8
10
5
(1)判断该序列xt的平稳性及纯随机性;
(2)判断xt的一阶差分yt的平稳性及纯随机性。
代码:
datadatasl;
inputx_t@@;
time=intnx('day','01jan2014'd,_n_-1);
formattimemonyy.;
cards;
10
15
10
10
12
10
7
7
10
14
8
17
14
18
3
9
11
10
6
12
14
10
25
29
33
33
12
19
16
19
19
12
34
15
36
29
26
21
17
19
13
20
24
12
6
14
6
12
911
17
12
8
14
14
12
5
8
10
3
16
8
8
7
12
6
10
8
10
5
run;
procgplotdata=datas1;
plotx_t*time;
symboli=joinv=starcv=redci=green;
run;
procarimadata=datasl;
identifyvar=x_tnlag=24;
run;
datadatas2;
setdatas1;
y_t=dif1(x_t);
run;
procgplotdata=datas2;
ploty_t*time;
symboli=joinv=starcv=redci=green;run;
procarimadata=datas2;
identifyvar=y_tnlag=24;
run;
运行结果:
从时序图看,X有明显的周期性和递增递减趋势,故不平稳
"x_r?
的毎势和根关分析
从ACF图看,X的自相关系数递减到零的速度相当缓慢,在很长
的延迟时期里,自相关系数一直为正,而后又一直为负,故判断该序列非平稳
白噪声的自相关检查
至滞后
卡方
自由度
Pr>卡方
自相关
6
64.02
6
<.0001
0.5060.539
0.3740.291
0.258
0.148
12
88.98
12
<.0001
0.2700.186
0.1780.258
0.207
0.226
18
96.32
18
<.0001
0.138-0.027-0.053-0.112-0.139-0.155
24
137.26
24
<.0001
-0.145-0.284-0.229-0.306-0.211-0.313
延迟为6、12的检验P值均小于0.05,故拒绝原假设,认为X
为非纯随机序列(非白噪声序列)
y_-tw
I
iIIpr*
JAHTiJiriFXJ14rtlliWill
tint
Y的时序图波动范围有界且没有明显的周期性、递增(递减)趋
势,故可以初步判断该序列平稳。
05IB1533350&Wis5PS3
从ACF自相关图看,延迟1阶后的样本自相关系数很快衰减到零附近,且1阶后的样本自相关系数均落在了两倍标准误的范围之内,且在零值附近波动,故可认为Y平稳。
白噪声的自相关检查
至滞后
卡方
自由度
Pr>卡方
自相关
6
29.46
6
<.0001
-0.5290.195-0.080-0.059
0.092-0.256
12
35.94
12
0.0003
0.216-0.075
-0.0700.101-0.0480.104
18
38.61
18
0.0032
0.075-0.142
0.045-0.032
-0.026-0.022
24
57.43
24
0.0001
0.173-0.214
0.129-0.158
0.195-0.165
延迟为6、12的检验P值均小于0.05,故拒绝原假设,认为Y
为非纯随机序列(非白噪声序列)