预测课程论文Word格式文档下载.doc
《预测课程论文Word格式文档下载.doc》由会员分享,可在线阅读,更多相关《预测课程论文Word格式文档下载.doc(11页珍藏版)》请在冰豆网上搜索。
在建模的过程中,模型的定阶是最关键的问题。
文章运用了SAS软件进行数据分析及建模,SAS系统提供的相对最优模型识别可以对模型进行客观的定阶,一定程度上可避免人为定阶带来的主观误差,并且提高模型预测的准确度。
三、数据来源
本文选用我国1950—2009年年度进出口总额的统计数据进行分析,数据来源于《中国统计年鉴2010》,经整理后见表1。
表11950—2009年年度进出口额(单位:
亿美元)
年份
进口
出口
1950
5.8
5.5
1980
199.41
180.99
1951
12
7.6
1981
220.14
220.07
1952
11.2
8.2
1982
192.85
223.21
1953
13.5
10.2
1983
213.9
222.26
1954
12.9
11.5
1984
274.1
261.39
1955
17.3
14.1
1985
422.52
273.5
1956
15.6
16.5
1986
429.04
309.42
1957
20.31
22.14
1987
432.16
394.37
1958
25.06
27.26
1988
552.68
475.16
1959
28.92
31.72
1989
591.42
525.38
1960
26.48
25.71
1990
533.45
620.91
1961
17.47
19.42
1991
637.91
719.1
1962
13.73
19.13
1992
805.85
849.4
1963
14.5
1993
1039.59
917.44
1964
17.1
22.5
1994
1156.15
1210.06
1965
22.46
25.63
1995
1320.84
1487.8
1966
24.82
26.81
1996
1388.33
1510.48
1967
21.69
23.88
1997
1423.7
1827.92
1968
20.68
23.4
1998
1402.37
1837.12
1969
19.17
24.29
1999
1656.99
1949.31
1970
22.79
23.07
2000
2250.94
2492.03
1971
21.29
27.83
2001
2435.53
2660.98
1972
28.51
36.93
2002
2951.7
3255.96
1973
52.08
58.76
2003
4127.6
4382.28
1974
77.91
71.08
2004
5612.29
5933.26
1975
79.26
76.89
2005
6599.53
7619.53
1976
66.6
69.43
2006
7914.61
9689.78
1977
71.48
75.2
2007
9561.15
12200.6
1978
111.31
99.55
2008
11325.67
14306.93
1979
156.21
136.14
2009
10056.88
12015.34
四、ARIMA模型简介
ARIMA模型是由统计学家Box和Jenkins提出的,又称B-J模型,其所依赖的原理是:
某些时间序列是依赖于时间t的一组随机变量,构成该时序的单个序列值虽然具有不确定性,但整个序列的变化却有一定的规律性,可以用相应的数学模型(即ARIMA)近似描述。
通过对该数学模型的分析研究,能够从本质上认识时间序列的结构与特征,达到最小方差意义下的最优预测。
(一)ARIMA(p,d,q)模型的形式[2]。
ARIMA模型有四种基本类型:
自回归(AR)模型、移动平均(MA)模型、自回归移动平均(ARMA)模型以及差分自回归移动平均模型(ARIMA)。
1.AR(p)模型:
P阶自回归模型,满足下面的方程:
(1)
其中:
c参数为常数;
是自回归系数;
p为自回归模型阶数;
是均值为0、方差为的白噪声序列。
2.MA(q)模型:
q阶的移动平均模型,满足下面的方程:
,
(2)
参数为常数;
参数,,,是q阶移动平均模型的系数;
3.ARMA(p,q)模型将纯AR(p)与纯MA(q)结合,得到一个一般的自回归移动平均方程ARMA(p,q):
,t=l,2,3,⋯,T(3)
其中为回归系数,,,,为移动平均系数,是模型的待估参数。
当p=0时,ARMA(p,q)=MA(q);
当q=0时,ARMA(p,0)=AR(p)。
4.ARIMA(p,d,q)模型:
通过对不平稳的时间序列进行d阶差分,将其转化为平稳时间序列,然后建立ARMA(p,q)模型。
设是d阶单整时间序列,即~I(d),则:
(4)
为平稳时间序列,即~I(0),于是可以对建立ARMA(p,q)模型:
(5)
公式(5)表明如果一个序列是单整序列,那么该序列可以由其自身的滞后值以及随机扰动项来解释。
即如果该序列平稳(它的行为并不会随着时间的推移而变化),那么就可以通过该序列过去的行为来预测未来。
(二)ARIMA(p,d,q)模型建模思路[3]
Box和Jenkins提出了具有广泛影响的建模思想,能够对实际建模起到指导作用,其建模思想可以分为以下五个步骤:
1.对原时间序列进行平稳性检验,如果序列不满足平稳性条件,可以通过差分变换(如果差分的阶数是d,则进行d阶差分)或者其他变换,如对数差分变换使序列满足平稳性的条件。
将非平稳时间序列转化为平稳时间序列,实现短期的均衡,是对非平稳时间序列进行ARMA分析的必要前提。
2.对原时间序列进行白噪声检验。
若序列为白噪声,则分析结束;
若序列为非白噪声序列,则可以拟合ARIMA模型。
3.对模型进行定阶,通过计算能够描述时间序列特征的一些统计量,如自相关(AC)系数和偏自相关(PAC)系数,以确定ARMA模型的阶数p和q。
另外运用AIC准则或者SBC准则对模型进行识别,从而达到在初始估计中选择尽可能少的参数,简化建模过程的目的。
4.对模型的未知参数进行估计,并检验参数的显著性,以及模型本身的合理性。
5.进行诊断分析,以证实所得模型确实与所观察到的数据特征相符。
在ARIMA(p,d,q)建模过程中,需要一些统计量和检验来分析模型形式的选择是否适宜。
所需要的统计量和检验包括:
检验模型参数显著性水平的t统计量;
模型的残差序列应为白噪声序列,可采用检验序列相关的方法或残差单位根检验方法进行检验。
五、ARIMA模型的建立
(一)进出口序列平稳性检验
本文用{x}代表中国出口额年度数据序列,用{y}代表中国进口额年度数据序列,则绘制{x}与{y}序列的时序图如图1、图2所示。
图1序列{x}的时序图
图2序列{y}的时序图
从时序图可以看出{x}与{y}序列均呈现指数变化趋势,即两序列为非平稳序列,故需对其取对数再做平稳性检验。
本文采用ADF(AugmentedDickey—Fuller)方法进行序列单位根检验,对序列{lnx}与{lny}的检验结果如下图3、图4所示。
图3序列{lnx}的ADF检验结果
图4序列{lny}的ADF检验结果
检验结果显示,无论考虑何种类型的模型,检验统计量的P值(第6列)均显著大于(=0.05),所以可以认为两序列均为非平稳序列,需要对序列进行差分运算再做平稳性检验,对差分后的序列{Dlnx}与{Dlny}的检验结果如下图5、图6所示。
图5序列{Dlnx}的ADF检验结果
图6序列{Dlny}的ADF检验结果
检验结果表示所有变量在5%的显著水平上均通过ADF检验。
(二)进出口序列白噪声检验
我们知道如果一个序列是纯随机序列,那它的序列值之间应该没有任何相关关系,也就是说很难根据历史信息预测未来年份的进出口额[2],故在建立A