居民消费价格指数的时间序列模型分析Word格式.docx
《居民消费价格指数的时间序列模型分析Word格式.docx》由会员分享,可在线阅读,更多相关《居民消费价格指数的时间序列模型分析Word格式.docx(13页珍藏版)》请在冰豆网上搜索。
参考文献-----------------------------------------------------------------------------------------10页
引言
居民消费价格指数不仅是反映通货膨胀的首要指标,也是与居民生活水平密切相关的重要指数,该指数被用来监控和预警宏观经济运行状态,并作为重要依据来调整我国的财政政策和货币政策。
目前研究居民消费价格指数的文章主要是定性分析的文章较多,而利用该指数的月度数据建立时间序列模型,经过检验后做出短期预测比较少见。
有些国内学者已经利用带卡尔曼滤波的结构时间序列模型和剔出各种影响因素的季节调整的X-12-ARIMA模型的文章来分析和预测月度数据的变动。
本文从居民消费价格指数(CPI)的概念入手,分析了1995年至2004年月度数据的具体变动情况,根据我国CPI数据的特点和时间序列分析理论中的建模思想,建立了实用的乘积季节模型进行分析,从模型对原始数据的拟合效果看乘积季节模型能够较好的拟合CPI的波动规律,并依照模型进行了短期预测。
在2005年前4个月的预测值中,根据前三个月已有数据来看预测效果较好,其它月份的预测效果还需有观测数据后才能验证。
一、居民消费价格指数的概念和经济意义
居民消费价格指数(ConsumerPriceIndex),即商品进入消费领域的价格或消费者购买价格,是反映一定时期内城乡居民购买并用于消费的一组代表性商品和服务项目价格水平的变化趋势和变动幅度的统计指标,以零售量或居民消费量为权数,反映消费者所支付价格水平(国家统计局《中国经济景气月报》)。
它的计算包括食品、能源及用品衣着、家庭设备用品及维修服务、医疗用品和个人用品、交通和通信、娱乐教育文化用品及服务和居住八项。
该价格指数的使用极为广泛,不仅在管理层分析和制定货币政策,价格政策、居民消费政策、工资政策以及进行国民经济核算时提供科学依据,也为经济个体生产和投资决策时提供必要的参考依据。
居民消费价格指数(CPI)的发布在我国经历了两个阶段,在2000年以前,我国国家统计局是根据调查资料直接按加权算术平均公式:
,计算和公布月环比、月度同比和年度同比三种价格指数。
从2001年1月份开始,国家统计局开始改用国际通用方法,采用国际上通用的链式拉斯贝尔公式:
,编制以2000年平均价格为基期的居民消费价格指数(CPI),替代原有的以上年同期为基期的居民消费价格指数。
新的居民消费价格指数的产品抽样数量由原来的325种增加到550种左右,主要增加了汽车、汽油、移动电话、电脑等商品,以及家庭服务收费、电话月租费、有线电视费、非义务教育收费、健身活动费、物业管理费、自有住房需缴纳的税费、旅游收费、车辆购买使用维修的有关费用等。
在我国,全国居民消费价格指数替代全国商品零售价格指数作为衡量通货膨胀指标,同时也是直接反映居民生活水平的主要指标。
居民消费价格指数的影响因素众多,它的变化既反应了居民生活水平的波动,也反映了物价水平的波动。
价格水平是消费者最关心的、最现实的、最直接的利益问题。
管理好物价、稳定好物价,也是政府当前宏观调控的重要目标之一。
在市场经济中,生产者和消费者需要依据价格信号调节供求关系,政府需要依据价格信号采用适当的宏观经济政策。
经济要平稳运行,需要政府及时把握社会总供给和社会总需求的平衡关系,而社会供求关系反映到经济总量中,要有价格总指数来体现。
价格指数上涨,表明供不应求;
价格指数下降,表明供过于求。
这是经济学的基本常识。
所以,居民消费价格指数不仅是衡量通货膨胀率的重要指标,而且也是监控宏观经济供求均衡的重要指数,需要根据价格指数的变动来调整财政和货币政策,以保证经济整体的均衡。
在我国自2003年十一月,价格指数迅速上升至1.030,在2004年的第二季度和第三季度持续攀升,而于第四季度有所回落,在我国价格指数波动幅度较大,趋势不明朗,由各种影响因素入手,运用结构性的因果模型分析和预测往往难度比较大,精确度也很难提高。
由于居民消费价格指数是一个时间序列数据,可以根据时间序列理论,从过去的数据资料中找出它本身的规律来,并用来预测未来的变化趋势。
本文对CPI建立了乘积季节模型进行分析,从模型对原始数据的拟合效果看乘积季节模型能够很好的拟合CPI的波动规律。
二、数据的结构检验及初步分析
分析中采用的数据是来自国家统计局《中国经济景气月报》的月度数据,从1995年1月至2005年2月,数据个数总计122个,做数据的散点图,如下图1所示。
数据类型采用以上年同月为基期的环比数据,这样数据就从一定程度上剔出了季度影响,在分析中采用的1995年1月至2004年12月120个数据,没有采用2005年的数据,它将用于检验建立模型后的预测效果。
该数据简单起见也可以不用换算2001年前后的数据。
由于居民消费价格指数(CPI)编制方法的改革,采用统计口径不同所造成的2001年前后的数据差异在此可以忽略不计。
这里也可以用回归模型的结构稳定性检验——Chow(邹至庄1960)检验来证明2001年前后的数据没有发生结构性的变化。
图1:
我国居民消费价格指数数据(1995.1至2004.12)
首先假定在回归方程中随机误差项服从同方差正态分布,两随机误差项互相独立。
时期1:
1995.1-2000.12DD12LOGSER06=C
(1)+[MA
(1)=C
(2),SMA(12)=C(3)]n1=60
时期2:
2001.1-2004.12DD12LOGSER06*=C
(1)*+[MA
(1)*=C
(2)*,SMA*(12)=C(3)*]n2=60
采用Eviews3.0中的Chow检验,选定2000年12月的数据为结构发生变化的时期,零假设是参数在2001年前后的CPI数据没有发生结构性的变动,是稳定的。
得结果如下表1所示,根据F分布表,可得在1%的显著性水平下,F的临界值为4.79,在10%的显著性水平下,F的临界值为2.35,在5%的显著性水平下,F的临界值为3.07(其中分子的自由度为2,分母的自由度为118,取120)
F=2.151﹤2.35,所以我们不能拒绝参数是稳定的零假设,即参数不存在结构性变动,也即2001年前后的数据没有发生显著的结构性变动。
我们认为2001年前后由于统计口径的不同造成的数据变动可以忽略不计,该数据是可以直接用于计算和比较的。
表1:
模型参数结构性变化的Chow检验
ChowBreakpointTest:
2000:
12
F-statistic
2.151358
Probability
0.098455
Loglikelihoodratio
6.627905
0.084752
如图1所示,我国居民消费价格指数经历了自1995年以来的下降趋势,这也是我国经济我国自1993年对国民经济进行宏观调控后,物价水平开始回落。
从1995年以来物价经历的一次大幅度的回落,从指数上反映是一直在下降。
随后亚洲金融危机爆发,我国经济受到一定影响,此时物价指数进入负增长阶段,而且出现了轻微的通货紧缩现象。
从居民消费价格指数上可以看出,至1999年物价回落至最低点,引发了关于中国经济是否进入“通货紧缩”的争论。
此后由于中国管理层的宏观调控及时全面,我国国民经济发展出现了重要转机,至2000年经济增长明显加快,经济运行质量显著提高,在国民经济良性发展的大背景下,市场价格出现了积极的变化,通货紧缩不仅得到有效的消除,而且扭转了价格指数持续二年下降的局面,全国居民消费价格总水平比1999年上升了0.4个百分点。
关于通货膨胀没有一个固定的标准,国际上一般认为,1%以下是没有通货膨胀甚至被认为是通货紧缩;
1%~5%是温和的通货膨胀;
超过5%是严重的通货膨胀。
自2003年起,中国经济进入新一轮上升通道,各级政府加大基础设施的投资,银行信贷也出现井喷式增长,导致固定资产投资增长速度较快。
与此同时,物价上涨主要由2004年上半年货币供应量增长相对较快、国际油价持续高位盘整、服务项目价格的政策上调和粮价的回升所致,以及新一轮的房地产行业和汽车行业投资热潮兴起,引发了对钢铁、电力等原材料和能源需求的不断扩大,引发了我国价格指数飙升。
2004年第二季度居民消费价格指数高达1.044,第三季度更是上涨至1.053。
物价的大幅波动引发了我们对居民消费价格指数的关注,其中准确的短期预测更是我们需要的,下文从季节调整模型的历史和思想开始,建立了适合该指数特点的乘积季节模型。
三、季节调整模型的历史和建模思想
以月度和季度作为时间观察单位的时间序列通常具有一年一度的周期性,这种周期性是季节因素的影响造成的,在经济分析中称之为季节性。
在经济时间序列数据中,这种季节性可以掩盖和遮蔽了原数据的规律性,影响我们的进一步升入的研究数据。
在分析之前,剔出季节性因素,这就是季节调整。
季节调整最早是有美国经济学家PersonsW.M.在1919年提出的,成功预测了1919年经济繁荣和1920年的经济衰退,自此,季节调整方法受到广泛的重视和深入的研究。
1931年Macauley提出了季节调整的比率滑动平均法,该方法成为后来广泛应用的X-11程序的基础。
1965年ShiskinJ.推出著名的X-11季节调整程序,该程序在美国得到广泛的应用。
在Box,和Jenkins建立随机模型,Tiao(刁锦寰)和Hillmer找出了与X-11程序相对应的ARIMA模型基础上,加拿大的Dagum提出了X-11-ARIMA程序,扩展了ARIMA模型的时间序列在季节调整中向前或向后的能力。
美国的普查局的Findley等人在上个世纪的90年代提出了以X-11-ARIMA方法为基础的X-12-ARIMA方法,该方法弥补了X-11-ARIMA程序的不足之处,改进了X-11-ARIMA在建模和诊断能力方面的缺陷。
该方法在欧洲统计界得到好评,被推荐到欧洲中央银行使用,并在统计部门和其它经济机构广泛使用。
X-12-ARIMA方法是由X-12及ARIMA方法合并而成,ARIMA方法的基本思路是:
对于经常遇到的非平稳的数据,经过多次差分,转化为平稳的时间序列数据,再由平稳数据入手。
X-12的思路是把时间序列分解成四部分组成:
趋势
(Trend)循环
(Cycle)季节
(Seasonal)和不规则项
(Irregular),X-12采用的是移动平均的方法消除季节因素的影响。
乘积季节模型的一般形式为:
,这里
表示同一周期内不同周期的相关关系,
则描述不同周期的同一周期点上的相关关系;
另一方面,从结构形式上看,它是随季节模型与ARIMA模型的结合式,故称之为乘积季节模型,其阶数用(n,d,m)×
(p,D,q)s表示。
四、我国CPI数据的建模和预测
其基本建模过程可以归纳如下:
1、对数据作散点图,若采用的是B-J建模方法来建立季节性时间序列模型,首先要判明周期性,即S取值。
从直观上判断序列数据是否是平稳的,然后从自相关函数图(ACF)、偏自相关函数图(PACF)和ADF单位根检验进一步分析数据的特性;
2、如果数据是不平稳的,对数据进行平稳化。
根据数据的不同特征进行不同的调整,主要有取对数,多次差分或开方处理,直到自相关函数图和偏自相关函数图是显著的趋于零,和通过单位根检验;
3、由获得的平稳的数据,进行初步的模型识别,建立相应的模型:
根据时间序列模型识别规则,若偏自相关函数图是截尾的,而自相关函数图是拖尾的,则模型可以判断为AR(p);
若自相关函数图是截尾的,而偏自相关函数图是拖尾的,则模型可以判断为MA模型;
若平稳时间序列的自相关函数图和偏自相关函数图都是拖尾的,该数据适合ARMA模型;
4、对选定的模型进行参数估计,估计暂定的模型参数,运用检验是否具有统计意义;
5、根据上一步的结果,对暂定模型进行适应性检验,决定是否接受暂定模型,当模型的适应性检验表明模型不是最优的模型时,可根据检验所提供的有关改进模型的信息,重新拟合改进模型,并根据AIC准则,选定最好的模型;
(一)数据的平稳化检验
作时间序列分析时,要求数据是平稳的,这样才可以直接进行分析,但在实际操作中,特别是经济数据几乎都是有一定趋势的,不是平稳数据,这时就要首先对原始数据进行平稳化处理,剔出趋势的影响,用平稳化的数据进行时间序列分析。
在分析时,首先对原始数据进行平稳性检验,如图1,从中可以看出该指数有下降趋势,不是平稳的数据。
也可以作滞后4期的扩展ADF单位根检验,结果如下,-2.007261>
在1%CriticalValue下的-3.4922,表明该数据不是平稳的。
表2:
原始数据的单位根检验
ADFTestStatistic
-2.007261
1%CriticalValue*
-3.4922
5%CriticalValue
-2.8884
10%CriticalValue
-2.5809
此外图2所示是原数据的自相关和偏自相关函数图,我们知道,一个零均值得平稳序列的自相关函数和偏自相关函数要么是截尾,要么是拖尾。
而图中的偏自相关函数是截尾,自相关函数缓慢衰减,结果也表明该数据是不平稳的。
图2:
原始数据的相关图
(二)数据的平稳化过程
在作进一步的分析之前,需要对数据进行平稳化处理。
对原始数据先取对数,得到:
,然后进行一阶差分处理,
,从
的自相关函数图和偏自相关函数图3中可以看出数据中存在的季节性,第十二个数据明显超出致信区间,在随后的十二的整数倍的数据比如第二十四、三十六上均较大,可见数据中的季节性还没有剔出,选定周期S为12。
图3原始数据对数变换后的相关图
再作数据的季节差分,
。
最后结果如下,图4是
的散点图,可以看出序列的趋势消失,可以看作是白噪声序列,从中可大致得出
时间序列是平稳的。
图4原始数据对数季节差分后散点图
表3是扩展的ADF单位根检验结果,如图所示,在滞后4期的扩展ADF单位根检验中,-4.199952<
在1%CriticalValue下的-3.4952,表明经平稳化后的数据是平稳的。
表3:
对数及季节差分后序列的单位根检验结果
-4.199952
-3.4952
-2.8897
-2.5816
又从ACF图和PACF图5中可以看出样本的自相关值和偏自相关值很快落入置信区间,故序列的趋势已基本消失。
图5对数及季节差分后序列的相关图
(三)建立乘积季节模型
平稳序列的自相关和偏自相关函数具有规范的统计特性,因而就可以从实际序列的样本自相关函数和偏自相关函数来推断模型的信息,可通过该法初步判定模型的阶数,它的特点是简单易行,操作简单,但精度不高,尤其是当样本的个数未能足够多时,其精度更不理想。
根据平稳序列的自相关和偏自相关函数图由Box-Jenkins法初步选定模型。
要精确判断模型的阶数时需要采用最佳准则函数定阶法,准则函数最早由日本文部省数理统计研究所赤池弘次教授(Akaike)提出来。
该方法是首先确定一个准则函数,使得模型拟合原始数据的接近程度和模型中待定参数的多寡都进入函数的考虑中,建模时采用准则函数值最小的模型。
常用的是AIC准则,它由赤池首先提出并成功的运用到AR模型中,随后扩展到ARMA模型阶数识别中去。
定义AIC准则函数如下:
AIC(n)=ln
^2(n)+2n/N
其中
^2为拟合残差的平方,
经过反复拟合,得出较为理想的模型,拟合(0,0,1)×
(0,1,1),运用最小二乘回归估计,表4是拟合结果,
,即模型为:
AIC准则统计量为-7.301474,效果比较好。
F统计量的值为71.68228,大于在1%的致信水平下F的临界值4.79,P值几乎为零。
D-W统计量为1.933212,接近于2,倾向于无自相关。
可以说诊断模型是可行的,可用于预测。
表4:
模型估计结果
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
0.000504
0.000273
1.849505
0.0672
MA
(1)
0.174483
0.061465
2.838750
0.0054
SMA(12)
-0.865522
0.031997
-27.04998
0.0000
R-squared
0.929568
Meandependentvar
0.001132
AdjustedR-squared
0.921483
S.D.dependentvar
0.009469
S.E.ofregression
0.006198
Akaikeinfocriterion
-7.301474
Sumsquaredresid
0.003995
Schwarzcriterion
-7.226535
Loglikelihood
393.6289
F-statistic
71.68228
Durbin-Watsonstat
1.933212
Prob(F-statistic)
0.000000
此外,在残差的正态性检验中,结果如图6其中J-B的统计量0.3971<
在5%的显著性水平上的J-B值5.99,则不能拒绝原假设:
残差服从正态分布。
此外,P值为0.819918,均值也接近于零,表明残差是符合正态分布。
图6残差的正态性检验
其中图7是实际值和预测值的拟合图,从中也可以看出这一点,该拟和图是经过数据转换,根据拟合公式,计算出拟合值,将数据倒推回去再进行拟合,拟合的效果较好,残差值接近白噪声序列。
图7模型的拟和值、真实值和残差图
(四)预测和分析
采用Eviews3.0作为分析工具,根据上一步拟合模型,做出2005年的四个月的预测值,其中1月、2月和3月的预测值与实际值的比较如表5,
表5:
对2005年4个月的预测结果与真实值
obs
2005:
01
02
03
04
预测值
102.1447
102.5033
103.3958
102.5997
实际值
101.9
103.9
102.7
#
从比较中可以看出误差较小,说明估计模型比较合适,预测的可靠性较高。
其预测的均方根误差为:
MSRE(MeanSquareRootError)=0.887,表明预测的平均误差为0.887%,不足一个百分点,模型的预测精度很高。
这里比较的数据只有三个,预测的数据较少,说明时间序列预测中短期预测比较准确。
而随后的预测数据留待实践的检验,这里不再评述。
(注:
MSRE=100×
k为预测期数目,Y为实际值,
为预测值)
结语
(一)预测的合理性和可行性
在分析中,根据时间序列分析理论的具体要求,步骤上,从原环比数