基于某时间序列arma模型的分析报告.docx
《基于某时间序列arma模型的分析报告.docx》由会员分享,可在线阅读,更多相关《基于某时间序列arma模型的分析报告.docx(12页珍藏版)》请在冰豆网上搜索。
基于某时间序列arma模型的分析报告
针对乳制品月产量数据的时间序列分析
摘要:
随着经济的发展,乳制品产业对国民健康水平的影响逐渐加大。
该文从乳制品行业月产量的角度出发,采用时间序列数据分析方法,对我国自1990年至2010年以来的乳制品行业月产量进行了建模分析,并在得到模型后对其进行了预测。
从分析结果来看,我国的乳制品产量在2004年发生突变,特定的月份也会对其产生影响,并且在不同的时间,影响会发生变化。
关键词:
乳制品;月份特征;产量突变;产量预测;
背景:
纵观自1949年发展至今,整个行业可以分为四个发展阶段:
1、缓慢发展阶段(1949~1977):
这段时期,我国乳产业受国家经济状况制约发展缓慢。
2、迅速扩阶段(1978~1992):
由于开始实行多种所有制进行奶牛饲养与奶制品加工,原奶与乳品的产量、种类、质量都有明显的提高
3、结构调整阶段(1993~1998):
1993年开始,乳品供给增长明显快于消费增长速度,产能出现比较严重的过剩,乳粉出现滞积,部分乳品企业发展艰难。
4、高速增长阶段(1999~至今):
1998年起,乳制品产业经过产品结构大力调整,经济效益明显提高,随着消费需求的迅速增长,乳制品产量也连年增长,乳产业已经从一个传统产业摇身一变成为一个产业。
从市场格局上看,乳制品企业可以分为4类:
1、以伊利、蒙牛为代表的全国性企业;2、以光明、三鹿、维维等为代表的区域性企业;3、以三元、佳宝为代表的本省省会企业;4、以雀巢为代表的外资企业。
在行业中,企业之间的竞争非常激烈,特别地,在近十年中市场竞争引起了市场格局的极大改变。
本文将选取1993年1月起到2010年6月的月产量数据进行时间序列分析,尝试建立该时序的时间序列模型及其详细的建立过程,并对模型结果给出必要的经济意义解释。
建立模型过程:
1、建模过程使用eviews软件,将1990年1月到2010年6月总计246个月度数据输入eviews中,Yt即是产量月度序列,现作出散点图如下:
通过观察上图,认为不同时间下的Yt的数值差异过大,并且波动程度也差别过大,故先将序列作取对数处理,作出散点图如下:
通过观察上图,认为该序列是一个典型的结构突变的过程,突变位置始于2003年12月。
故需要加入突变虚拟变量进行检测。
从图中我们观察到,突变过程精确来说应属于渐进式的突变,但在突变区间只有2~3个月份,相对于200多个月份来说可以忽略,故在选择突变类型时认为是水平突变,即从2003年12月开始水平突变。
由于不知是否存在斜率突变,故我们一齐将水平突变变量与斜率突变变量加入检验。
2、即建立模型:
,检验结果如下:
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
0.674340
0.034742
19.41010
0.0000
TREND(1989M12)
0.009680
0.000357
27.14478
0.0000
DL
2.076061
0.061744
33.62361
0.0000
DL*TREND(2003M12)
0.002085
0.001182
1.763334
0.0791
R-squared
0.981355
Meandependentvar
2.554138
AdjustedR-squared
0.981123
S.D.dependentvar
1.631446
S.E.ofregression
0.224148
Akaikeinfocriterion
-0.136897
Sumsquaredresid
12.15861
Schwarzcriterion
-0.079899
Loglikelihood
20.83828
Hannan-Quinncriter.
-0.113946
F-statistic
4245.683
Durbin-Watsonstat
0.608538
Prob(F-statistic)
0.000000
可以看到,常数项、时间趋势项及水平突变三个变量均显著,而斜率突变并不显著。
故我们将其舍去,接着用模型再做一次回归:
现在可以看出,三个变量均显著。
即现在认为我们正确的加入趋势项和水平突变变量。
3、考虑到LOGY是一个月度数据,并且从散点图上也可以明显观察到存在着季节特征,故我们为了研究其十二个月的特征,我们继续加入11个虚拟变量(当月份为i时等于1,否则为0)继续回归,结果如下:
可以看到,只有d1,d2,d6三个月度变量在5%的水平下是显著的,所以我们剔除不显著变量再回归一次:
现在得到的这个模型,常数项、趋势项、水平突变变量及月度变量均显著。
4、所以接下来我们要讨论的就是这个突变过程究竟是随机趋势过程还是趋势平稳过程,所以我们将采用Perron检验进行检验,即我们用该模型退势后的残差序列进行单位根检验:
突变点在2003年12月,即大概在整个序列的2/3的位置,根据Perron检验表查得在%5水平下临界值应位于-3.780~-3.76之间,故我们明显可以拒绝原假设即认为该残差序列是一个平稳过程,即LOGY是一个趋势平稳序列。
所以,当确定LOGY是一个可以避免很多诸如虚假回归等问题的趋势平稳序列后,我们可以放心继续修正模型。
5、现在,我们开始研究模型中是否存在ARMA成分,故作出LOGY退势后的残差序列的自相关偏相关图如下:
从图中可以看到,残差序列是一个平稳的ARMA过程,可能存在AR
(1)、AR(3)、MA
(1)、MA
(2)、MA(3),故我们继续将这五个ARMA成分加入模型中:
发现常数项开始不显著,AR(3)显著性并不好,MA(3)很不显著,但由于常数项并非关键成分,故我们将其剔除继续尝试:
现在,AR(3)与MA(3)的显著性在%5的水平下完全可以拒绝,故我们将其剔除,余下变量即模型:
继续回归:
可以看到,现在的模型中,加入的ARMA成分都显著,接下来我们看看残差序列的自相关与偏相关图:
从图中,我们观察到该模型的残差序列已经接近白噪声,即我们认为我们已经加入了正确的ARMA成分。
所以现在的模型为;
其中是白噪声。
从回归结果中我们可以看出,无论是系数的显著性,还是模型的拟合度,都令人满意。
另外经过检验,没有发现有异方差、序列相关、多重共线性等问题的存在。
6、模型的最终调整:
经过尝试预测,我们发现一个不容忽视的问题,即往往1月的产量往往被低估,而6月份的产量的季节特征似乎又消失了,故我们怀疑是否D1的系数在序列后期已发生变化,而同时D6是否开始变得不显著。
解决方案:
所以我们新生成一个DN1序列,DN1与D1的区别就在于2003年12月前均为0,其余不变;新生成一个序列D_6,在2003年12月前,D_6与D6一样,后期其余均为0.我们在原来模型中加入DN1,用D_6代替D6进行回归:
从结果发现,月度特征果然发生了变化,1月虚拟变量的系数果然需要被调高0.102,而6月的季节特征在2004年后就不再显著。
从而验证了我们的猜想。
经过尝试预测检测,没有出现比较异常的拟合值,故认为已经得到目前最好的模型,即:
模型解释:
经过层层分析,我们得到最后的模型,即使一个带有结构突变、季节虚拟变量、ARMA成分的模型:
1、首先对于时间趋势项t,其系数为0.017,证明logYt是有一个稳定的时间增长趋势,对于其它条件保持不变,下一月的产量相对于本月将增加0.017个百分点(可看做一个增长模型),说明我国的乳产业多年来一直保持向上增长的势头。
并且由于logYt的线性增长,Yt将呈现指数增长。
2、季节虚拟变量D1、D2、D6的系数分别为-0.258、-0.154、0.095,经过查验资料表明,1月、2月是产奶淡季,这时候奶牛的产量会因为气候因素而降低,但是降低的程度在2003年12月以后会减弱;而6月是一个产奶旺季,而且此时社会对乳制品的订单会迅速增加,这反过来也会刺激产量提升,但这个特征会在2003年12月以后消失。
即在2003年以前,保持其他条件不变,1月会降低产量的0.258个百分点,2月会降低产量的0.154个百分点,6月会增加0.095个百分点;在2003年12月以后,1月会发生改变,只会降低产量的0.191个百分点,6月份的季节特征会消失。
3、对水平突变变量DL,说明从04年左右开始,乳制品产量出现了一个短时间的飞跃,这与乳产业经历数年滞积与低迷后发生迅速的行业调整有着紧密的关系。
蒙牛企业就是在04年占有的市场份额迅速增加。
4、至于
模型预测:
1、样本预测:
我们采用静态方法进行样本预测,下图为预测值和真实值的点线图及误差结果:
其中,logY为实际值,logYF为预测值。
我们可以看到,采用样本静态预测得到的预测值十分接近实际值,误差比较理想。
下图是取了反函数得到Y的预测值与真实Y的值:
2、接下来我们采用静态预测方法进行样本外一期预测(左序列为预测值,右序列为真实值):
预测值为184t。
通过近一年的真实数据和预测值的比较,我们发现预测值的吻合度还是相当高的,预测误差基本控制在5%以。
通过网上查阅资料,发现2010年7月的产量179吨,预测误差为(184-179)/179=0.027,即2.7%的预测误差。
故可以认为我们得到一个预测效果很好的模型。