时间序列期末论文.docx

资源描述

时间序列期末论文.docx

《时间序列期末论文.docx》由会员分享，可在线阅读，更多相关《时间序列期末论文.docx（12页珍藏版）》请在冰豆网上搜索。

时间序列期末论文.docx

时间序列期末论文

ARIMA模型在全国年底总人口预测中的应用

【摘要】：

人口发展与社会经济的发展是密不可分的，研究我国总人口的现状，对我国人口数进行分析和预测，有利于及时控制人口的增长，调节人口平衡，利于政府及时了解发展趋势并做出反应对策，使我国人口发展步入健康的轨道。

本文利用自回归移动平均模型（autoregressivemovingaveragemodel，ARMA）及其建模原理和思路，并结合Eviews软件将ARMA模型应用于1980年——2012年我国年底总人口数据序列的分析和预测。

经检验此模型对原始数据有着较好的拟合度和较高的预测精度。

利用此模型可对我国年底总人口进行合理的预测。

【关键词】：

时间序列；ARMA模型；我国年底总人口；人口预测

一、引言

我国是世界上人口最多的国家，2008年末中国大陆人口13.28亿，，占世界上五分之一人口，亚洲人口的三分之一。

中国人口的发展同中国社会的发展一样经过了漫长而曲折的道路。

在世纪的进程中，目前我国进入了一个全新的时代，要想在21世纪——这个充满竞争与挑战的时代中变的富强、屹立于世界民族之林，全取决于人口的问题能否顺利解决，人口现状等问题，我国必须重视并根据其趋势做出反应对策。

因此，认真分析我国当前人口现状，从中发现其变化的趋势，并对未来总人口进行短期预测，及时采取必要的政治及经济措施来解决人口发展问题，对树立未来的发展目标很有必要。

总之，人口是构成社会的主体，在我国社会主义现代化建设中，人口问题始终是极为重要的问题，而人口问题的本质是发展问题。

人口发展与社会经济的发展也是密不可分的。

基于此，我们利用时间序列中的ARMA模型对我国人口进行预测，对人口的控制起到指导作用，有利于政府采取必要的政治及经济措施来进行调控。

所以，对其进行分析和测试是非常有意义的工作。

二、模型简介

自回归求和滑动平均模型（autoregressiveintegratedmovingaveragemodel）,称为ARIMA模型，是将非平稳时间序列转化为平稳时间序列，然后将因变量仅对它的滞后值以及随机误差项的现值进行回归所建立的模型。

自回归移动平均过程，是由自回归和移动平均两部分共同构造的随机过程，记为ARMA（p，q）。

其中p、q分别表示自回归分量和移动平均分量的最大滞后阶数。

它的表达式为：

当时间序列非平稳时，首先要通过差分或取对数使序列平稳后再建立时间序列模型。

随机过程若经过d次差分后可变换为一个平稳可逆的ARMA（p，q），则称为（p，d，q）阶单整自回归移动平均过程，记为ARIMA（p，d，q）。

建立时间序列模型通常需要以下步骤：

（1）数据预处理

在建模之前首先进行平稳化检验，判断是否为平稳序列，可以通过相关图判断。

如果一个随机过程是平稳的，则其自相关函数呈指数衰减或正弦衰减，而且衰减得快；相反，如果是非平稳过程，则衰减得很慢。

也可以用单位根检验，判断随机过程的平稳性。

单位根检验是检验时序稳定性的一种正式的方法。

若为非平稳序列，则通过差分变换、对数变换对数据进行平稳化、均值化处理。

（2）模型的识别与定阶

模型的识别主要依赖于对时间序列的相关函数（AutocorrelationFunction，ACF）图与偏相关函数（PartialAutocorrelationFunction，PACF）图的分析：

ACF图表现为拖尾衰减特征，而PACF图在p期后出现截尾特征，则该过程适合AR（p）；ACF图在q期后出现截尾特征，而PACF图表现为拖尾衰减特征，则该过程适合MA（q）；ACF图与PACF图都呈拖尾衰减特征通过图形分析选择模型的形式并初步确定p、q的值。

同时利用赤池信息量准则（A-InformationCriterion，AIC）和舒瓦兹准则（SchwarzCriterion，SC）对多种ARMA（p，q）模型进行对比与筛选，选出最优的ARMA（p，q）。

（3）模型的参数估计

对AR（p）模型的参数进行最小二乘法估计，MA（q）和ARMA（p，q）采用迭代式的非线性最小二乘法进行估计。

（4）模型的诊断与检验

模型的诊断与检验包括被估参数的显著性检验和残差的随机性检验。

如果估计的模型中的某些参数不能通过显著性检验，或者残差序列不能近似为一个白噪声序列，则需再次对模型进行识别。

（5）模型的预测

通过对未来值进行预测，与预留的实际值进行比较，得到相对误差，从而进一步判断所拟合的模型的适合程度。

三、文献综述

经我们检索发现，目前尚无对我国2013—2015年底总人口（万人）的预测。

四、实证分析

（1）数据的收集

本文以1980-2012年全国年底总人口数（万人）为样本，原始数据如下表所示：

1980

98,705

1990

114,333

2000

126,743

2010

134,091

1981

100,072

1991

115,823

2001

127,627

2011

134,735

1982

101,654

1992

117,171

2002

128,453

2012

135,404

1983

103,008

1993

118,517

2003

129,227

1984

104,357

1994

119,850

2004

129,988

1985

105,851

1995

121,121

2005

130,756

1986

107,507

1996

122,389

2006

131,448

1987

109,300

1997

123,626

2007

132,129

1988

111,026

1998

124,761

2008

132,802

1989

112,704

1999

125,786

2009

133,450

表1年底总人口数（万人）

本文利用统计软件Eviews，对1980-2012年全国年底总人口数（万人）数据为样本，并用1980-2010年的数据建立ARIMA模型，预测，预测2010-2015年的年底总人口数。

2011-2012年的数据留作模型检验数据，用于跟预测值进行比较，评价预测的精度。

（2）数据预处理

将时间序列命名为y,并使用统计软件Eviews对原始数据进行分析，作出该序列的时序图，如图1所示。

图1.年底总人口数（万人）时序图

从图1中可以看出，年底总人口数随着时间增加的同时也在逐年上涨，有明显的上升趋势。

因此，可以得出这列数据不平稳、方差也不平稳的结论。

采用对数变换的方法，对原序列y做对数变换，即取=,得到新的序列。

利用统计软件Eviews，对新的序列做时序图和单位根检验，如图2、表2所示。

图2.序列的时序图

表2.序列的单位根检验值

由图2可知，序列具有明显的上升趋势，不平稳。

为进一步确定序列的平稳性，对序列进行单位根检验，由表2可知，序列在1%、5%的显著性水平下，ADF检验值为-2.863362，均大于1%、5%的显著性水平下的临界值。

因此，接受存在单位根的结论，说明时间序列是不平稳的。

尽管序列在显著性水平为10%时，ADF检验值小于临界值，但P值大于0.05，同样也说明了序列不平稳。

结果与定性分析一致，即序列不平稳。

因此，在建立模型之前，必须对该序列进行平稳化处理。

此例中，我们可以用差分法来消除序列的趋势。

一阶差分能够消除线性趋势,二次差分能够消除二次曲线趋势。

我们对序列进行二阶差分,得到新的序列,画出序列的时序图，如图3所示。

图3.序列的时序图

由图3可以得出，通过对序列进行取对数、二阶差分处理，原始数据具有的趋势性已被消除，序列呈现出比较小的波动性，基本趋于平稳。

为了使模型更加精确，进行进一步确定序列的平稳性，我们对该序列进行单位根检验，得到ADF检验结果见表3。

表3.序列单位根检验结果

由表2可知，序列在1%、5%以及10%显著性水平下，ADF检验值为-4.624002，均小于各显著性水平下的临界值，说明序列为平稳序列。

能够用序列来拟合模型。

（3）模型的识别

序列滞后18期的自相关和偏自相关函数图（图3）

图3.序列滞后16期的自相关和偏相关图

由图3可以看出，该序列偏自相关函数呈现出拖尾性，自相关图呈现出截尾性，初步判定该模型为ARIMA（0,2,1）模型。

由于只是初步判定，且这个判断具有较大的主观性，所以不妨对该序列建立ARIMA（0,2,2）、ARIMA（1,2,2）等模型来综合比较比较三个模型的AIC和SC值。

（4）模型的估计及检验

运用最小二乘法估计，分别对序列进行MA

（1）、ARIMA（0,2,2）、ARIMA（1,,2,2）进行拟合估计。

结果如表4、表5、表6所示。

表4.ARIMA（0,2,1）模型估计

表5.ARIMA（0,2,2）模型估计

表6.ARIMA（1,2,2）模型估计

对三个模型进行综合比较，ARIMA模型中的MA

（2）的P值显著大于0.05，因此，MA

（2）模型不显著。

ARIMA（1,2,2）模型的AdjustedR-squared为0.639770，明显高于ARIMA（0,2,1）模型，且该模型的AIC值、SC值均小于ARIMA（0,2,1）模型中对应的各值。

但ARIMA（1,2,2）模型的DW值仅为1.741959，明显小于2。

通过对比两个模型的Actual、Fitted、ResidualGraph图以及ResidualGraph图，发现ARIMA（1,2,2）模型的残差序列较ARIMA（0,2,2）有较大的波动。

因此，认为ARIMA（0,2,1）模型能更好的拟合该序列。

紧接着对残差序列进行白噪声的检验。

根据模型ARIMA（0,2,1）对序列进行回归拟合，如图4所示。

模型的残差图如图5所示。

图4.模型拟合的折线图

图5.残差折线图

从图4中可以得到，图中实际值与拟合值基本一致。

从图5中可以看出，残差序列类似白噪声过程，较平稳，没有明显的趋势性，模型拟合效果比较好。

对残差的自相关图和偏相关图进行分析，如图6所示。

图6.残差序列的ACF和PACF值

由图可以得到，模型的残差并不存在相关序列。

为进一步验证结论，对残差序列进行单位根检验，结果如表7所示。

表7.残差序列的单位根检验

由表7可以得到，残差序列的ADF检验值为-5.880284，明显小于显著性水平为1%、5%、10%的临界值，因此序列在1%、5%、10%的显著水平下通过检验，被看作是白噪声序列。

因此，最终选定ARIMA（0,2,1）为模型对序列进行描述。

模型的形式为：

。

（5）模型的预测

运用统计软件Eviews，对拟合模型后的序列进行预测，预测图如图7、图8所示。

图7.模型的动态预测图

图中实线代表的是YF的预测值，两条虚线则提供了2倍标准差的置信区间。

实际值处于2倍标准差之内。

图的右侧给出的是评价预测的一些标准，例如平均预测误差平方和的平方根（RMSE），Theil不相等系数及其分解等。

图8.模型的静态预测图

从图8的预测的评价标准中，可以看到，Theil不相等系数为0.000290，非常小。

综合其他标准，可以得到，静态得到的预测效果较好。

通过静态预测，将2011-2012年的真实值与预测值进行比较，求出预测误差。

如表8所示。

真实值

预测值

预测误差

2011

134735

134707

0.0002078

2012

135404

135409

0.0000369

表8.真实值与预测值的比较

通过计算出的预测误差，可以知道预测值与实际值是很接近的说明该模型的预测精度比较高，模型用于短期的预测效果是较好的。

通过模型的动态预测对2013—2015年年底总人口数预测，可以得到表9。

年份

预测值

年份

预测值

年份

预测值

2013

155404

2014

157556

2015

159738

表9.2013-2015年预测值

从预测结果可以看出，年底总人口随着时间的增长，仍然保持持续上升的趋势。

五、结论

一、运用ARIMA模型进行建模和预测,并对我国总人口这一组真实数据进行了时间序列分析。

分析结果说明，用ARIMA模型对我国总人口进行建模预测是可行且可靠的，可对我国年底总人口进行合理的预测，有利于政府采取必要的政治及经济措施来进行调控，对人口的控制起到指导作用。

二、在运用ARIMA模型对我国总人口预测分析的过程中,我们发现,，该模型对于短期预测较合理，但对于长期预测存在一定缺陷。

该模型的短期预测准确度很高,预测结果的稳定性好,对数据的预测有一定的价值，是一种很好的预测短期总人口量的方法。

三、对我国总人口拟合的ARIMA（0,2,1）模型本身比较简单，对原始数据的要求较少，易于分析和应用。

[参考文献]

[1]国家统计局网站→数据查询→年度数据→人口→年底总人口

[2]应用时间序列分析/王振龙，胡永红主编.—北京：

科学出版社，2007（经济与管理类统计学系列教材）

展开阅读全文