季节调整中国化与NBSSA软件研发项目研究报告文档格式.docx
《季节调整中国化与NBSSA软件研发项目研究报告文档格式.docx》由会员分享,可在线阅读,更多相关《季节调整中国化与NBSSA软件研发项目研究报告文档格式.docx(22页珍藏版)》请在冰豆网上搜索。
Yt=0+1X1t+2X2t+…+kXkt+ut(3-1)
其中yt是待调整时间序列,即前面所说的原始序列。
Xit,i=0,1,…,k,是解释变量,其中包括各种离群值变量,日历效应变量,以及假日效应变量等。
βi,i=0,1,…,k是回归系数。
ut是随机误差序列,应该满足回归模型设定的假定条件。
对于季节性经济时间序列来说,回归后得到的残差通常是自相关的。
所谓RegARIMA建模方法就是在回归式(3-1)的基础上同时对误差项ut建立季节时间序列模型。
表达式如下,
p(L)P(Ls)dsDut=q(L)Q(Ls)vt(3-2)
其中ut即是来自式(3-1)中的ut。
是一阶差分算子,d表示差分次数。
s是s期的季节差分算子,D表示季节差分次数。
dsDut表示对ut进行一阶差分d次,季节差分D次后为平稳序列。
vt是白噪声序列。
上式称作(p,d,q)(P,D,Q)s阶季节时间序列模型或乘积季节模型。
注意:
如果d=D=0(即无需差分),通常将式(3-1)中的ut改用其对均值的离差代替,即用ut-μ代替ut,其中μ=E(ut)。
将式(3-1)写成,
ut=(Yt–β0-
),
并代入式(3-2),可以写成,
p(L)P(Ls)dsD(Yt–β0-
)=q(L)Q(Ls)vt(3-3)
RegARIMA模型(3-3)可以理解为
(1)在回归模型(3-1)的基础上,令误差项ut服从SARIMA模型(3-2);
(2)从yt中减去回归因子的影响后,建立SARIMA模型。
把式(3-3)写成,
dsD(Yt–β0-
)=
(3-4)
令wt=
,wt被假定为平稳序列,并表达为p(L)P(Ls)wt=q(L)Q(Ls)vt。
模型(3-4)式的另一种写法是
(1-L)d(1-Ls)DYt=(β0+
)(1-L)d(1-Ls)D+wt(3-5)
上式强调的是RegARIMA模型中的回归变量Xit,i=0,1,…,k,同Yt一样,用ARIMA模型的差分算子(1-L)d(1-Ls)D进行了差分。
式(3-1)中的回归因子(解释变量)Xit主要包括各种离群值(outlier)变量与日历相关的影响变量以及假日效应变量等。
X-13A-S软件将这些功能集中到了第一阶段RegARIMA模块中。
在X-13A-S的X11季节调整程序中,仍保留了在不规则成分中对这些效应的处理功能。
但X-13A-S软件说明书建议在第一阶段处理离群值效应、日历效应和假日效应等,对原始序列进行预调整。
在X-13A-S程序中,离群值被分为5类,即加性离群值(AO),水平漂移(LS),暂时变化(TC),斜线变动(RP)和季节性离群值SO。
分述如下,
下面介绍7种可能在季节性经济序列中产生影响的效应,它们都属于日历效应。
分述如下。
(1)固定季节效应。
(2)闰年效应。
(3)月份长度效应。
(4)季度长度效应。
(5)交易日效应。
(6)工作日效应。
(7)移动假日效应。
(4)X11在默认状态下的计算原理
以月度序列、加法模型为例,假设序列Yt不含离群值、已经通过前向预测、后向预测对序列进行了扩展,所以序列两端不需要使用修正公式。
省略极端值(extremevalue)调整过程。
由于在X-11体系的季节调整程序中,对趋势成分和循环成分不再细分,视为一种成分,所以这里按照加法分解模型将Yt分解为趋势-循环(Ct)、季节(St)和不规则(It)三种成分:
Yt=Ct+St+It,
季节调整序列用At表示,则Yt=At+St。
X11季节调整计算过程也分为3个阶段。
(1)初始估计At,
(2)再次估计At,(3)估计最终Henderson趋势和不规则成分。
第1阶段:
初始估计At
1.使用“中心化12项”移动平均(2×
12)估计趋势循环成分Ct。
2.估计季节-不规则成分:
(S+I)
=Yt-
3.对每个月份应用3×
3移动平均估计预备季节成分:
=M3×
3[
]
4.估计季节调整后序列A
。
A
=(C+I)
这是初次估计的季节调整后序列,所包含的季节性因素已经很少了。
接下来X11方法将基于A
序列继续进行移动平均。
第2阶段:
再次估计At
1.用13项Henderson移动平均估计趋势循环成分Ct。
C
=H13(A
)
2.估计季节-不规则成分。
(S+I)
5移动平均估计最终季节成分。
5[
4.估计季节调整后序列
=(C+I)
=Yt-
第3阶段:
估计最终Henderson趋势和不规则成分
1.估计最终趋势。
C
=H2H+1(A
)
2.估计最终不规则成分。
=
-
最终得到分解序列的加法模型:
Yt=
+
三、中国假日效应的处理
(1)中国固定假日效应的处理
中国每周工作天数体制转换、固定假日、调休、黄金周等实施期间的沿革示意图见图4-1。
每周6天工作制
(1995年5月以前)
每周5天工作制
(1995年5月始)
元旦法定假日1天,2000年1月始伴以调休(休3天)
五一节法定假日1天
(2000年5月以前)
五一劳动节法定假日3天
(2000年5月始)
五一节法定假日改回1天
(2008年5月始)
无五一黄金周
五一黄金周,伴以调休
(2000:
52007:
5)
取消五一黄金周
(2008年5月始取消)
国庆节法定假日1天
(1999年10月以前)
国庆节法定假日3天
(1999年10月始)
无十一黄金周
十一黄金周,伴以调休
1990:
11995:
51999:
102008:
52030:
12
图4-1中国工作体制转换、固定假日、调休、黄金周等因素变化示意图
①关于中国月度交易日效应变量的定义与计算
下面以2009年9月为例介绍当出现跨月调休时,中国交易日效应变量的计算过程。
第1步:
以公元纪年的日历为基础生成新的日历。
由于2009年9月涉及到黄金周调休,所以要先调整9月份的日历。
“国务院办公厅关于2009年部分节假日安排的通知”(见本研究报告后附录3)规定,将2009年9月27日(星期日)的公休日调至10月7日(星期三),而把10月7日(星期三)调至9月27日按工作日处理。
所以,对于2009年9月27日来说,其交易日的性质由周日变成周三。
这导致2009年9月的周日减少1天,周三增加1天。
对于2009年10月7日来说,其交易日的性质由周三变成了周日,导致2009年10月的周日增加1天,周三减少1天。
见图4-2。
图4-2按国务院放假通知生成2009年9月和10月份新定义的工作日和休息日(新日历)示意图。
第2步:
计算中国月度交易日效应变量。
以新生成的日历为基础,则在计算2009年9月的交易日效应变量时,周日的天数就由原来的4天变为现在的3天,周三的天数由原来的5天变为现在的6天,而其他交易日的天数不变。
若用m12009,9,…,m62009,9,m72009,9分别表示2009年9月份调整后周一、周二、…、周日的天数,则,
m12009,9=4
m22009,9=5
m32009,9=6
m42009,9=4
m52009,9=4
m62009,9=4
m72009,9=3
则中国交易日效应变量T1t,T2t,…,T6t(分别表示调整后的周一、周二、…、周六效应变量)在2009年9月的取值依次是
T12009,9=m12009,9–m72009,9=4-3=1
T22009,9=m22009,9–m72009,9=5-3=2
T32009,9=m32009,9–m72009,9=6-3=3
T42009,9=m42009,9–m72009,9=4-3=1
T52009,9=m52009,9–m72009,9=4-3=1
T62009,9=m62009,9–m72009,9=4-3=1
1990年1月至2030年12月中国交易日效应变量T1t,T2t,…,T6t的赋值结果见本研究报告后附录4。
②关于中国月度工作日效应变量的定义与计算
中国月度工作日效应变量WDt的定义方法是,以公元纪年日历为基础,根据我国固定假日,国务院通知的黄金周调休方案重新计算每月中工作日和休息日的天数。
由于1990年1月至1995年4月我国实行的是6天工作制,所以,中国月度工作日效应变量WDt的值按下式计算
WDt=(调整后的每月工作日天数)-6(调整后的每月周日天数)
由于1995年5月至2030年12月我国实行的是5天工作制,所以,中国月度工作日效应变量WDt的值按下式计算
WDt=(调整后的每月工作日天数)-(5/2)(调整后的每月周六、周日天数)
仍以2009年9月月份为例,说明具体计算过程。
根据公元纪年的日历,2009年9月共有22个工作日,8个休息日。
根据国务院调休方案,9月27日(周日)调到10月7日位置形成黄金周,同时把10月7日(周三)的工作日调到9月27日位置按工作日处理。
于是,经调整后,2009年9月份的工作日是23个(比原日历增加一天),休息日7个(比原日历减少一天)。
则2009年9月份WD2009,9的值是
WD2009,9=23-(5/2)7=5.5
1990年1月至2030年12月中国月度工作日效应变量WDt的值见研究报告后附录4的最后一列。
(2)中国移动假日效应的处理
中国移动假日春节、中秋节和端午节在阳历中的移动范围示意图见图4-10。
春节
1月21日2月20日
端午节
5月28日6月24日
中秋节
9月8日10月6日
1990-1-12030-12-31
图4-10中国移动假日,春节、端午节、中秋节的移动范围示意图
春节对经济序列的影响方式是不一样的。
我们为春节效应变量设计了4种赋权方式,并对春节效应变量采用多段定义方式。
4种赋权方式分别是在春节影响到的每天里
(1)按等值赋权,
(2)按“”字型赋权,(3)按“V”字型赋权和(4)按“M”字型赋权。
下面以月度序列为例,按“”字型赋权方式,仍设定春节对节前的影响天数为20天,节中节后的影响天数为15天,介绍计算春节效应变量的方法。
“”字型赋权春节效应变量应该定义两个,即节前效应变量spr1t,和节后效应变量spr2t。
如果按“”字型赋权,那么春节前20天至春节前1天,每天对经济变量的影响权数应该依次是1/20,2/20,…,20/20。
春节向前大于20天,则影响权数为零。
春节日至春节后15天,每天对经济变量的影响权数应该依次是15/15,14/15,…,1/15。
春节向后大于15天,影响权数为零。
如图4-15所示,图中t=0处的垂线代表春节日,
图4-15春节对经济序列的影响每天按“”字型赋权
以2010年为例,春节在2月14日。
因为设定春节对节前的影响天数为20天,所以,前20天落在1月的天数为7天,落在2月的天数是13天,因此spr1t在1月的值是
spr12010,1=
在2月的值是,
spr12010,2=
因为春节节前效应不涉及对3至12月的影响,所以spr1t在2010年3至12月的值应该都是零。
则spr1t在2010年1至12月的取值是
spr12010,1~2010,12=(0.13,0.87,0,0,0,0,0,0,0,0,0,0)
因为春节节后效应设定的是15天(从2月14至2月28日),全部落在2月份,所以对应2010年2月,spr22010,2=1;
对应2010年其它月份,spr22010,t=0,t=1,3,…,12。
则spr2t在2010年1至12月的取值是
spr22010,1~2010,12=(0,1,0,0,0,0,0,0,0,0,0,0)
同理,依据日历,可计算出设定春节对节前的影响天数为20天,节中节后的影响天数为15天,按“”字型方式赋权的春节节前效应变量spr1t和春节节后效应变量spr2t从1990年1月至2030年12月的值。
对序列spr1t和spr2t中的每一相同月份的值分别做中心化处理,
X1t,j=spr1tj-
j=1,2,…,12
X2t,j=spr2tj-
1990年1月至2030年12月的X1t,j、X2t,j序列图见图4-16和图4-17。
数值见本报告后附表5。
图4-16“”字型权的春节节前效应变量X1t,j图4-17“”字型权的春节节后效应变量X2t,j
仿照上述定义方式,就可以计算出“V”字型权春节节前、节后效应变量(2个)和“M”型赋权春节节前、节后效应变量(4个)。
以月度序列为例,设定春节对节前的影响天数为20天,节中节后的影响天数为15天,按“V”字型和“M”字型赋权方式计算的6个春节效应变量(XV1t,j、XV2t,j、XM1t,j、XM2t,jXM3t,j、XM4t,j)的值见本报告后附表5。
关于处理中秋节效应,我们定义了节前、节中后2个变量。
节前最大影响天数设定为10天,节中和节后效应合并,最大影响天数设定为10天。
也就是说,季节调整软件NBS-SA对中秋节节前效应的处理可以在1~10天中任意选择。
对中秋节节中后效应的处理可以在1~10天中任意选择。
对中秋节效应变量的赋权方式设计了等权、“V”字型权和“”字型权3种。
关于端午节对经济变量的影响,我们定义了节前效应变量。
并设定端午节对节前的最大影响天数是10天。
也就是说,季节调整软件NBS-SA中对端午节节前效应的影响可以在1~10天中任意选择。
对端午节效应变量的赋权方式设计了等值赋权一种。
四、研制季节调整软件NBS-SA
国家统计局版季节调整软件NBS-SA的研制是本项目的创新之一。
季节调整软件NBS-SA研制成功为国家统计局确立季节调整数据和经济指标的环比增长率发布体系奠定了坚实的基础。
季节调整软件NBS-SA是在美国普查局季节调整软件X-13A-S基础上开发的。
X-13A-S核心计算部分未作改动,只是在中国工作日效应和交易日效应的处理方面嵌入了结合中国国情所特有的一些节假日效应。
所有X-13A-S软件原有的计算功能依然可以运用程序语句在NBS-SA软件中实现运算。
NBS-SA与X-13A-S相比,我们主要做了如下创新:
1.季节调整软件NBS-SA在X-13A-S基础上对视窗做了全面汉化。
NBS-SA主视窗见图5-1
图5-1NBS-SA软件主视窗
2.在使用NBS-SA调整经济序列之前,增加了显示经济序列折线图的画图功能。
示意图见图5-2。
图5-2NBS-SA软件中的画图功能
3.在保留X-13A-S软件的交易日效应和工作日效应的同时,我们增加了中国交易日效应和中国工作日效应两个选项。
关于移动假日效应的处理,增加了调整中国移动假日效应的选项功能。
选项视窗见图5-3上部。
关于春节的赋权方式有四种,即“均匀”、“型”、“V型”和“M型”。
注意:
NBS-SA软件中,春节前的最大选择天数是45天,即节前影响天数是在1~45天之间任意选择。
节后最大选择天数是30天,即节后影响天数是在1~30天之间任意选择。
图5-3NBS-SA软件中的假日效应选项功能
比如,春节对GDP产值序列的影响应该是“V”字型的。
春节对铁路客流量的影响应该是“M”字型的。
关于中秋节效应,我们设计了三种赋权类型,即“均匀”、“型”、“V型”。
端午节定义了1个效应变量,即节前效应变量。
端午节效应变量是按等权设计的。
怎样选择端午节对应的2个天数选择框,参见本研究报告第7章,国家统计局版季节调整软件NBS-SA使用说明书。
在图5-3的下部“其它变量”的选择框处可以输入如季节变量、离群值变量、闰年效应变量、季度长度变量、月度长度变量等,用以消除这些因素的影响。
4.能输出一个中文的“季节调整原始登记表”。
这对于建立完整的季节调整档案,保留季节调整过程的原始信息有重要意义。
5.调整结束后能够输出一个EXCEL格式的“序列与增长率分析表”。
其中包括原始序列、季节调整序列、季节因子分量、趋势循环分量、不规则分量、同比增长率(%)、环比增长率(%)、折年率(%)计算结果以及样本外一年的原始序列和季节因子分量的预测值(即月度数据预测12个月的值,季度数据预测4个季度的值),见图5-5。
图5-5NBS-SA软件输出的调整结果—“序列与增长率分析表”
6.编写《中国季节调整软件NBS-SA使用说明书》。
五、中国主要宏观经济序列季节调整试算结果
从2010年年初开始,国家统计局利用NBS-SA软件对季度国内生产总值(GDP)、月度规模以上工业增加值、月度城镇固定资产投资完成额、月度社会消费品零售总额等主要经济指标进行季节调整内部试算。
通过试算,一方面,对国家统计局版季节调整软件NBS-SA进行检验测试,在实践中不断改进和完善软件。
另一方面,对每个季(月)度的试算结果进行分析评估,从多角度评判试算结果的准确性。
此外,通过试算,发现我国现有的基础统计数据在环比统计中存在的问题,检验有关解决方法的合理性和可行性。
从试算情况看,国家统计局版季节调整软件适合我国经济指标的季节调整,试算结果基本符合我国经济发展的实际情况。
主要宏观经济序列季节调整前的同比增长率见表8-1,季节调整后的环比增长率试算结果见表8-2,同比增长率和环比增长率序列图分别见图8-1至图8-10。
表8-1:
主要经济指标未经季节调整同比增速
单位:
%
季度指标
GDP
月度指标
规模以上
工业增加值
城镇固定资产投资完成额
社会消费品零售总额
CPI
2009年1季度
6.5
2009年1月
—
18.5
1.0
2009年2季度
8.1
2009年2月
11
26.5
11.6
-1.6
2009年3季度
9.6
2009年3月
8.3
28.6
14.7
-1.2
2009年4季度
11.3
2009年4月
7.3
30.5
14.8
-1.5
2010年1季度
11.9
2009年5月
8.9
32.9
15.2
-1.4
2010年2季度
10.3
2009年6月
10.7
33.6
15.0
-1.7
2010年3季度
2009年7月
10.8
-1.8
2009年8月
12.3
33
15.4
2009年9月
13.9
33.3
15.5
-0.8
2009年10月
16.1
33.1
16.2
-0.5
2009年11月
19.2
32.1
15.8
0.6
2009年12月
17.5
1.9
2010年1月
14.0
1.5
2010年2月
12.8
26.6
22.1
2.7
2010年3月
18.1
26.4
18.0
2.4
2010年4月
17.8
26.1
2.8
2010年5月
16.5
25.9
18.7
3.1
2010年6月
13.7
25.5
18.3
2.9
2010年7月
13.4
24.9
17.9
3.3
2010年8月
24.8
18.4
3.5
2010年9月
13.3
24.5
18.8
3.6
表8-2:
主要经济指标季节