基于arima模型的工业总产值时间序列分析.docx

上传人:b****6 文档编号:4772988 上传时间:2022-12-08 格式:DOCX 页数:7 大小:21.92KB
下载 相关 举报
基于arima模型的工业总产值时间序列分析.docx_第1页
第1页 / 共7页
基于arima模型的工业总产值时间序列分析.docx_第2页
第2页 / 共7页
基于arima模型的工业总产值时间序列分析.docx_第3页
第3页 / 共7页
基于arima模型的工业总产值时间序列分析.docx_第4页
第4页 / 共7页
基于arima模型的工业总产值时间序列分析.docx_第5页
第5页 / 共7页
点击查看更多>>
下载资源
资源描述

基于arima模型的工业总产值时间序列分析.docx

《基于arima模型的工业总产值时间序列分析.docx》由会员分享,可在线阅读,更多相关《基于arima模型的工业总产值时间序列分析.docx(7页珍藏版)》请在冰豆网上搜索。

基于arima模型的工业总产值时间序列分析.docx

基于arima模型的工业总产值时间序列分析

基于arima模型的工业总产值时间序列分析

基于arima模型的工业总产值时间序列分析基于ARIMA模型的工业总产值时间序列分析摘要:

工业的发展情况能在某种程度上反映当地的经济水平,对大量的工业总产值数据进行定性与定量的分析,能够在一定程度上刻画数据变化的规律,并根据得出的规律建立适当的数学模型,从而预测以后的工业总产值数据。

本模型以某地1990年--1997年的工业总产值历史数据为基础,基于Eviews以及spss的分析与检验,对数据进行了变化特征的分析处理,在此基础上进行了差分和取对数等数据处理后,得到平稳序列。

除此之外,本文还运用Eviews软件分离出季节因子之后,同时求出季节因子,并建立了适当的ARIMA模型,然后再对模型进行检验。

最后将预测结果与真实值进行比较,结果表明拟合度较好,具有一定的实用性。

关键词:

时间序列工业产值季节因子EViewsSPSSARIMA模型1、问题重述在科学技术迅速发展的当今时代,一个国家的工业化水平是衡量一个国家的综合国力大小强弱的重要指标。

它直接影响这个国家的政治经济的发展。

所以每个国家都在积极发展自己的工业,提高工业化的水平跻身于世界工业强国之列。

对工业总产量进行研究,找出其内在规律,预测未来,从而能根据预测数据提出相关政策建议,对促进工业乃至整个国家的经济发展具有重大的意义。

根据所给的某地工业总产值的历年数据(数据见附录1),从而来探究以下的问题:

1)根据数据分析当地工业总产值的变化特征.2)根据变化特征试建立合理的模型描绘这种特征3)若有季节性变化,试分离出季节性变化因子,求出季节性因子.2、数据处理1)我们来用Excel软件求出来各年度的工业总产值之和,平均数以及各个月份的平均数据,并画出来相关图像(见附录2)。

另外,我们还运用了SPSS软件对个年份之间的数据进行相关性分析[1],找出个年份工业总产值之间的关系。

表1生产总值的年度数据表2各个月份的平均数据2)根据表中工业总产值的数据,我们先生成时间序列图进行分析,利用Eviews程序得到图1。

图1原始工业生产总值数据图观察图形,发现序列具有明显的增长趋势,由此初步判断使用时间序列模型来进行建模分析。

3、问题分析根据所给的总产值数据,我们分别对各个年份和各个月份之间的数据进行计算和分析,再分析各年份数据之间的相关性,以便分析当地工业总产值的变化特征。

由我们所分析的数据结果和所得到的原始数据图像,我们必须综合各方面来进行建模。

对于问题1)我们运用相关软件结合图像和相关理论知识分析数值特点。

对于问题2)工业生产总值数据是时间序列数据[2],在原始数据的基础上建立出平稳的时间序列,再根据自相关和偏相关图像确定相关模型的阶数,利用Eviews做出ARMA模型的参数估计[3],最终确定所合理的模型来描绘数据的变化特征。

对于问题3)在问题2)的基础上,再结合附录2中的图2,我们认为该组数据有季节变化的因素,运用季节乘法模型离出季节性变化因子,求出季节性因子。

四、模型假设1)假设表1的工业总产值数据都准确无误、真实。

2)假设工业总产值不会受其他因素的影响,只受季节性的影响。

3)假设在获取数据的途中,没有太大的影响因子导致数据大幅度的变化。

5、符号说明----工业总产值的月份数据。

----年度工业总产值之和。

----年度平均工业总产值。

----工业总产值的月份数据取对数后再进行一阶差分。

----数据消除季节性因子后的数据。

6、模型建立1)关于问题1的求解:

分析表1中的数据和附录2中的图1,我们可以很直观地看到年度工业总产值是在逐年增长的,并且1997年的年度工业总产值为53805.72,是1990年工业总产值19737.20的2.7倍,在七年内,该地区的工业总产值将近翻了两倍,说明工业发展速度之快。

再观察1990年--1997年八年内各个月份的平均数据,结合相关图像如下:

图2各月平均数据图我们可以看到该数据在各个月份的分布是不均匀的,在1到2月份总产值普遍较低,其中2月份总产值为12个月中的最低值2309.98,之后开始逐渐上升,而到了7月份左右,有了相对的下降趋势,直到9月份又开始回升,其中12月份的工业总产值达到全年最高3739.844875。

接下来,我们又通过spss软件[4]找出表1工业总产值之间的相互关系,对其进行二元变量的相关分析[1]。

结果如下:

x0x1x2x3x4x5x6x7x0Pearson相关性1.766(**).625(*).676(*).639(*).663(*).719(**).663(*)x1Pearson相关性.766(**)1.938(**).818(**).944(**).922(**).909(**).956(**)x2Pearson相关性.625(*).938(**)1.922(**).996(**).981(**).896(**).976(**)x3Pearson相关性.676(*).818(**).922(**)1.930(**).954(**).878(**).897(**)x4Pearson相关性.639(*).944(**).996(**).930(**)1.990(**).924(**).986(**)x5Pearson相关性.663(*).922(**).981(**).954(**).990(**)1.940(**).985(**)x6Pearson相关性.719(**).909(**).896(**).878(**).924(**).940(**)1.939(**)x7Pearson相关性.663(*).956(**).976(**).897(**).986(**).985(**).939(**)1表3各年份数据变量之间的相关性注:

代表1990年,代表1991年,代表1992年,代表1993年,代表1994年,代表1995年,代表1996年,代表1997年。

**在0.01水平(双侧)上显著相关。

*在0.05水平(双侧)上显著相关。

在表3中,每个行变量与列变量交叉单元格处是二者的相关统计量。

1990年工业总产值与1992年、1993年、1994年、1995年、1997年工业总产值之间的相关系数依次为0.625、0.676、0.639、0.663、0.663,1990年工业总产值与这几年的工业总产值虽然有一定的正相关关系,但相关系数普遍较低。

而自从1991年开始,各个年份之间的相关系数都是明显显著的,具有高度的正相关关系。

特别地,1992年工业总产值与1994年工业总产值的相关系数为0.996,说明这两年的工业总产值之间具有非常密切的关系。

这些结果提供的信息与实际情况基本一致,反映了1990年的工业总产值可能是因为机器设备不完善、技术水平落后、管理机制不合理等一系列原因导致的,从1991年开始可能由于机器的购置,人才的引入,管理机制的改善等原因,造成与1900年工业总产值之间的一定程度的差异。

2)关于问题2的求解:

把原始数列看成一个随时间推移而形成的随机时间序列,分析时间序列的特征,对工业总产值数据y进行ARMA模型的拟合。

根据时间序列的折线图(图1),可以看出序列是非平稳的。

根据软件,我们可以分离出该序列的长期趋势图如下:

图3某地的工业总产值的长期趋势图为了消除趋势同时减小序列的波动,便于能够对序列进行分析,要对数据做平稳化处理。

常用的有两种方法:

取对数法和差分法,本文采用的是两者结合的方法,对序列进行处理。

我们先定义了一列新的数据dy,为原始数据取对数后一节差分后所得,即dy=log(y)-log(y(-1),并得到了相关折线图(图4),根据图像,我们可以很清楚地看到该序列趋于平稳,大部分数据在水平线上下浮动。

图4原始数据取对数后一节差分后的数据图像由于谬误相关和谬误回归问题的存在,检验变量的非平稳性就显得十分重要了,用相关图可以判断时间序列的非平稳性,通过图形也可以直观地判断,但相比之下,运用统计量进行统计检验将会更为准确。

以下我们将用统计检验中最为普遍应用的一种检验方法,也是检验序列平稳性的标准方法:

单位根检验法。

所以我们对dy序列数据进行了ADF检验结果,如图5所示。

图5dy序列的ADF检验检验结果表明t统计量的值是-3.990087均小于1%、5%、10%下的检验值,且其p值0.0023也小于0.05。

所以,至少可以在99%的置信度下拒绝原假设,认为该时间序列dy(dy=log(y)-log(y(-1)))不存在单位根,即dy为一个平稳的时间序列。

ARMA(p,q)模型的识别与定阶可以通过样本的自相关与偏自相关函数的观察获得。

log(y)一阶差分后自相关与偏自相关系数如图6图6dy的自相关与偏自相关图其自相关与偏自相关图显示序列的趋势已经基本消除,dy序列的自相关系数在滞后二期后呈衰减趋于零,表现为拖尾性;在偏自相关分析图中,滞后五期的偏自相关系数显著不为零,但之后逐渐衰减趋于零,也可以认为序列的偏自相关系数也具有拖尾性。

所以我们初定AR的阶数为5,MA的阶数为2,建立ARMA(5,2)模型,其参数估计如下:

图7ARMA(5,2)模型的参数估计另外,我们还进行了ARMA(5,1)、ARMA(5,0)、ARMA(4,2)、ARMA(4,1)和ARMA(4,0)等模型分别作了参数估计,其结果见附录3,综合以上六种模型的参数估计,我们根据比较可知,ARMA(5,2)模型的所有系数都通过了假设检验,且拟合优度比其他五个模型都大,故初步选择ARMA(5,2)模型更合适。

为了检验该模型的合理性,我们还作了模型检验,首先画出来ARMA(5,2)模型的残差序列图如下:

图8ARMA(5,2)模型的残差序列图同时我们还对ARMA(5,2)模型做残差序列检验,残差相关系数如下:

图9ARMA(5,2)模型的残差相关系数结果显示,检验统计量Q值均小于对应自由度卡方分布的检验值,且Prob列读出拒绝原假设的概率较大,均大于0.05,所以残差序列为白噪声序列[2],即ARMA(5,2)模型通过检验,所以最终选择ARMA(5,2)模型。

因此从图7ARMA(5,2)模型的参数估计可知,ARMA(5,2)模型为:

去掉差分后形式为:

将对数形式化为指数形式,得到最终的模型是:

3)关于问题3的求解:

由于图2各月平均数据图可以观察到,该列时间序列的数据是存在季节性因素的,于是我们将图6的自相关和偏自相关系数的阶数扩大为25后,我们得到如下图像:

图10dy的25阶自相关与偏自相关图由图10可以看出,取对数一阶差分后序列的自相关系数并没有呈衰减趋于零;在偏自相关分析图中,滞后的偏自相关系数显著不为零,也可以认为序列的偏自相关系数不具有拖尾性和结尾性,因此阶数p在此时还不能确定.但当k=12时,样本的自相关系数和偏相关系数显著不为0,表明季节性因素存在,故我们用Eviews软件画出来其季节因子图:

图11季节因子图另外再用spss对模型进行季节性因子[4]分析得到如下结果:

seasonalFactorsseriesName:

yPeriod123456seasonalFactor-343.43-663.4855.81116.11252.34340.75Period789101112seasonalFactor-135.69-136.37-30.73-5.44112.99437.45表4季节性因子从表中可以看到季节性因子为负数的说明对应月份的生产值不高,且负数值的绝对值越大,表明对于的数字受季节影响却大且为负方向变动,如在表4中,2月份对应的季节因子数值为负数,且绝对值最大,故2月份对应的工业总产值最小,同理,12月所对应的季节因子为正值,且是最大,所以12月份的数据应该为一年中的最大值。

观察图2我们会发现这一结论与Eviews程序得出的图结果是一致的,即与实际情况是一致的。

同时,根据季节乘法模型,我们还分离出来该时间序列数据中的不规则因子如下:

图12不规则因子图根据以上分析,我们定义新的序列sd做季节差分去掉了时间序列中的季节成分,并对该序列进行单位根检验,结果表明该序列为平稳序列。

图13sd的ADF检验该平稳序列的自相关系数和偏自相关系数图如下:

图14sd序列的自相关与偏相关函数由图可以看出,sd序列的自相关系数在滞后一期后呈衰减趋于零,表现为拖尾性;在偏自相关分析图中,滞后三期的偏自相关系数显著不为零,但之后逐渐衰减趋于零,也可以认为序列的偏自相关系数也具有拖尾性,对序列sd进行0均值检验,得到该序列样本平均数是-0.0020,均值标准误为0.0038,序列均值与0无显著差别,表明序列可以直接建立季节模型。

因此阶数p可由显著不为零的偏自相关系数的数目决定[2],观察图ar可以取3,ma可以取1。

因为在问题2的基础上,原始数据经过一阶差分,序列趋势消除,故d=1;经过一阶季节差分,季节性基本消除,故D=1。

所以选用模型。

记取自然对数一阶差分后的工业总产值序列为dy。

观察序列sd的偏自相关图,如图5所示,p=2或p=3比较合适;自相关图显示q=1。

综合考虑,可供选择的(p,q)组合有:

(3,1),(4,0),(2,1)和(3,0)。

由于k=12时,样本自相关和偏相关系数都显著不为0,所以P=Q=1下面分别对,和模型进行参数估计(见附录4),于是又对模型进行参数检验,结果如下:

图15模型的参数检验系数检验均已通过,且模型的拟合度较好。

与问题2模型的检验一样,我们对模型进行检验,分别画出来该模型的残差序列图和残差的自相关和偏相关图像如下:

图16模型的残差序列图图17模型的残差序列自相关与偏相关图结果显示,检验统计量Q值均小于对应自由度卡方分布的检验值,且Prob列读出拒绝原假设的概率较大,均大于0.05,所以残差序列为白噪声序列[10],即模型通过检验,所以最终选择模型某地工业总产值进行分析预测。

预测图如下:

图18模型的预测图从以上图中的数据知道MAPE值均小于5,表明该模型精度已经极高,模型可用,而且通过试验,故选用该模型。

与1997年的真实值比较如下表:

表51997年的真实值与预测值的比较根据比较结果可以看出,模型所预测的1997年的数据与1997年的真实数据比较接近,进一步说明该模型的实用性。

另外,计算结果显示模型拟合效果明显不如其他三个模型,故不予考虑。

比较其他三个模型的检验结果,与另外两个模型相比,模型的AIC和SC值较小,试预测的MAPE值显示其预测精度最高,调整后的样本决定系数(Adjusted2R)虽略小于模型,但是优于模型,并且参数估计结果还显示这三种模型均有未通过检验的参数系数,故不予考虑。

因此我们最终认为模型比较合适。

综上所述,模型的展开式为:

于是,我们用该模型对该地1998年的工业总产值进行了预测,从Eviews软件中我们得到FY序列调出的结果如下:

图18对1998年工业总产值的数据预测7、模型的评价及改进1.模型优点:

1)ARMA模型是一种常用的随机时间序列模型,本模型通过折线图和相关及偏自相关分析可以明显的看出该工业的总产值随时间的变化而增长,并且有明显的季节性变化。

2)建立ARIMA模型对各模型进行参数估计和模型检验,通过消除平稳性和季节性,最终预测出1998年各月的生产总值也符合该工厂生产总值的增长趋势。

3)建立季节性模型时,用Eviews软件分离出了季节性因子并消除季节性,并且同时运用SPSS软件找出来阶因子,这对模型有着很重要的意义。

4)根据以上的对比,发现ARMA模型能比较好的分析、计算我国工业的发展波动情况,具有较好的应用前景。

2.模型缺点:

1)不利于变动范围大的处理。

2)模型模拟实验结果与实际情况可能会有偏差,可能存在的因素有选取的数据上存在一定的误差和参数估计模型检验等误差。

故该模型仍需有修正和完善之处。

8、参考文献[1]作者:

何晓群刘文卿书名:

应用回归分析北京中国人民大学出版社2001年[2]作者:

王振龙胡永宏书名:

应用时间序列分析北京科学出版社2007年[3]作者:

易丹辉书名:

数据分析与EViews应用北京中国人民大学出版社2008年[4]作者:

郝黎仁樊元书名:

spss实用统计分析北京中国水利水电出版社2001年15附录1某地的工业总产值数据表.年月199019911992199319941995199619971月1421.41757.81984.22179.12903.32996.73476.63843.842月1367.41485.71812.42408.72513.82740.32970.33181.263月1719.71893.92274.72869.434093580.93942.64404.494月1759.61969.82328.92916.73499.53746.34067.64520.185月1795.72033.72373.13022.13642.63817.94746.8994638.996月1848.121032515.83274.53871.44046.64417.2994969.937月1637.31836.322882862.933733483.93806.84146.8998月1637.61914.723212864.23463.43510.63746.34198.79月1637.62022.22441.129083663.743703.14011.14536.83910月1637.62045.12502.62911.83753.383810.74129.64783.9111月1637.62069.22608.83101.33973.1740914372.1995034.93912月1637.621362823.83664.34469.024650.7994991.55545.74附录2图1年度总产值之和数据图图2各月平均数据图附录3图1ARMA(5,2)模型的参数估计图2ARMA(5,1)模型的参数估计图3ARMA(5,0)模型的参数估计图4ARMA(4,2)模型的参数估计图5ARMA(4,1)模型的参数估计图6ARMA(4,0)模型的参数估计附录4图1模型的参数估计图2模型的参数估计图3模型的参数估计图4模型的参数估计

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高中教育 > 高考

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1