1、159158157156155154153152151API686084767181554536351501491481471461451441431421415387889711399821009583140139138137136135134133132131787363441167269621301291281271261251241231221218985673742515648120119118117115114112111465434966465110109108107106105104103102101948647989392917566599050438079777449407
2、061585752284139383332313029272625242322212019181716151413121110987654321此处一共160个数据,其中1150用来建立模型,我们称为样本,151160用来检验预测值与真实值的误差,我们成为检验值。其中的时间的意义是:t=1代表日期2010-5-30,t=2代表日期2010-5-31,t=3代表日期2010-6-1,以此类推,t=160代表日期2010-11-4。数据中的API为空气污染指数,我国目前采用的空气污染指数(API)分为五个等级,API50,说明空气质量为优,相当于国家空气质量一级标小准;50100,表明空气质量良好
3、,相当于达到国家质量二级标准;100200,表明空气质量为轻度污染,相当于国家空气质量三级标准;200300表明空气质量极差,已严重污染。由SPSS分析出来的结果见表1-2表1-2描述统计量N全距极小值极大值均值标准差方差污染指数66.4118.069326.485有效的 N (列表状态)由表1-2可以看出,数据个数为150个,没有缺失值。=66.41, =18.07数值与平均值的距离见图1-1图1- 1由图1-1可以看出,对任意时间t,都在-与之间,所以我们可以得出结论,该数据没有离群点。综上所述,需要建模的数据正常既没有离群点,也没有缺失值。2.直观分析和相关分析2.1直观分析和特征分析在
4、eviews软件中,我们将该数据命名为liu(t)。用eviews画出的折线图如图2-1图2- 1由图可以看出,该数据围绕60上下波动,但有较明显的周期性。通过eviews画出的柱状统计图见图2-2图2- 2由以上图表可以看出:样本liu(t)的均值=66.4,中位数为64,最大值为116,最小值为28,样本标准差=18.69,偏度为0.24,峰度为2.54,由于相伴概率为0.256,大于0.05,所以我们接受数据服从正态分布的假设,故认为原数据是正态分布数据。检验样本是否服从正态分布也可以用用P-P图和Q-Q图来检验,SPSS做出的PP图见图2-3图2- 3P-P图基本是一条直线,说明它的分
5、布对称,服从正态分布,进一步验证了以上的结论。2.2相关分析在eviews中作出自相关系数和偏相关系数图,结果见图2-4图2- 4自相关系数图和偏相关系数图两侧的虚线之心水平=0.05的置信带,称为barlett线,意思是如果系数落在barlett线内,我们可以认为该系数等于零。由图2-4可以看出,两阶以后的自相关系数和偏相关系数基本都落在barlett线内,所以我们可以认为该数据平稳,为了进一步说明这个问题,我们在进行一次单位根检验以验证该数据的平稳性。2.3平稳性检验在eviews中执行viewUnite root test.检验结果如图2-5图2- 5由上图可以得知,t统计量的值时-6.
6、95,小于显著性水平下的临界值,拒绝原假设,也就是说序列liu(t)不存在单位根,该系统是平稳的,进一步验证了2.2的结果,也证明由图2-1推断出来的季节性是不存在的。由上图知,其中的检验式为: (2-1)3.liu(t)序列的零均值处理3.1数据的零均值化对于均值非零的数据,一般有两种处理方法,一是建立非中心化的ARMA模型,将序列的均值作为一个参数估计,但是需要估计的参数要比中心化的ARMA模型多一个,于是在这里我们采用另一种方法,用样本均值作为样本均值u的估计,即零均值处理,下面是具体过过程。新序列liu1(t)=liu(t)- =liu(t)-66.4。零均值化后的序列数据见附录1.3
7、.2零均值过程的检验在对liu(1)序列执行命令“viewDescriptive StatisticsHistogram and Stats”得到柱状统计图,结果见图3-1图3- 1因为时间序列liu(1)的均值为-0.165,标准差为18,样本均值落在0当中,所以我们接受均值为0的原假设,表明序列liu(1)已经是一个零均值序列。4.模型的识别和初步定阶时间序列liu1(t)的自相关系数和偏相关系数见图4-1图4- 1由上图可以看到,样本的自相关系数较大,而其余的自相关系数都落在barlett线以内,而且当k1时,自相关函数都落在该范围内,所以时间序列liu1(t)在1步后是截尾的,因此可以
8、用MA(1)模型进行拟合。对于偏相关系数,我们也可以看出,只有较大,其余都很小,且大于一阶的样本偏相关系数几乎都满足,虽然为-0.166,其绝对值略大于0.1633,但由于简约性原则,我们仍然认为其偏相关系数在一步之后截尾的,因此可以用AR(1)来对数据拟合。根据Box-Jenkins建模方法,一般初步设定的模型是ARMA(n,n-1),即自回归的阶数比移动平均的阶数高一阶,于是这里我们将初步模型定为ARMA(2,1)。5.模型的参数估计参数的估计一般有三种方法:矩估计;最小二乘估计;极大似然估计。但是由于矩估计太简单,精度低,只实用于做初估计,而极大似然估计计算量非常大,特别是对于ARMA模
9、型,似然函数公式十分复杂,所以我们这里采用最小二乘估计。利用eviews软件可以得到各个模型中的参数的最小二乘估计和剩余平方和和AIC值,ARMA(2,1)模型结果如表5-1表5- 1模型结构参数最小二乘估计AIC值剩余平方和AR(1)8.32205335167.39AR(2)8.28444633182.94MA(1)8.33327035807.65ARMA(1,1)8.31463534438.95ARMA(2,1)8.29803233182.29由于AIC值和剩余平方和越小,模型越恰当,所以,从上表可以看到,选用AR(2)模型最恰当。6.模型的检验6.1参数的显著性检验该模型参数检验的目的是
10、看是否有系数显著为零。在eviews命令窗口中输入“ls liu1 ar(1) ar(2)”便得到参数检验的结果,详细结果见图6-1图6- 1由的相伴概率可以看出,我们应该接受=0的原假设,令=0,继续用AR(1)拟合数据,参数检验的结果如图6-2图6- 2由相伴概率和单位根可以看到,利用AR(1)模型对序列liu1(t)进行拟合比较恰当。6.2模型的适用性检验对AR(1)进行适用性检验,残差序列的样本自相关系数如图6-3图6- 3从自相关系数值可以看出,几乎所有 (6-1)但=-0.167, =0.25不满足式子6-1,这说明序列liu1(t)中还有少量的自相关信息没有被提出出来,这也是该模型的不足。由图6-2所得到的系数可知,
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1