ADF检验中滞后长度的选择.docx
《ADF检验中滞后长度的选择.docx》由会员分享,可在线阅读,更多相关《ADF检验中滞后长度的选择.docx(11页珍藏版)》请在冰豆网上搜索。
ADF检验中滞后长度的选择
ADF检验中滞后长度的选择——基于ARIMA(0,1,q)过程的模拟证据
摘要】在进行ADF检验时如何确定一个最优的滞后长度一直是研究者们关注的问题。
最近的研究表明,不同的滞后长度选择方法对ADF检验的统计推断影响很大。
本文在已有研究的基础上,模拟了更为一般的ARIMA(0,1,q)过程,分析了在不同的数据生成过程、检验式以及样本容量下,各种滞后长度选择方法对ADF检验功效和实际检验水平的影响,最后认为修正的信息准则通常具有较合理的实际检验水平,而从一般到特殊法具有更为稳健的ADF检验性质。
关键词ADF检验滞后长度信息准则修正的信息准则从一般到特殊法
Abstract:
TheoptimallaglengthinestimatingAugmentedDickey-Fullerstatisticshavebeenconcentratedonforyears.PreviousresearchindicatedthatdifferentleglengthselectionmodelsaffectalotonthestatisticalinferenceofADFtest.Basedonalltheresearchesavailable,thispapersimulatesamoregeneralARIMA(0,1,q)processandanalyzestheinfluenceoflaglengthselectioncriterionstothesizeandpoweroftheADFtestwithdifferentdatageneratingprocesses,ADFregressions,andsamplesizes.Finally,itisprovedthattheModifiedInformationCriteriaalwaysshowsamorepropersizeandtheGeneraltoSpecialCriteriahasmorerobustpropertiesinADFtest.
Keywords:
ADFtestLagLengthInformationCriteriaModifiedInformationCriteriaGeneraltoSpecific
一、引言
随着时间序列非平稳问题的提出,单位根检验目前已经成为宏观数据建模前首先要进行的工作。
为此,Dickey和Fuller(1979,1981)[1]提出了著名的ADF检验,并推导了当时间序列yt是ARIMA(p,1,0)过程且满足检验式中滞后差分项长度k≥p时ADF检验统计量的极限分布。
然而,在实际运用ADF检验时,真实的p是不知道的,因此需要研究者自己确定k。
总的来说滞后长度的选择方法主要分为两类。
一类是经验法(ruleofthumb)。
这种方法是研究者任意选择k,或将k表示为样本容量的函数。
另外一类就是根据数据来选择k。
这种方法主要有Akaike(1973)信息准则(AkaikeInformationCriteria,以下简写为AIC)、Schwarz(1978)信息准则(SchwarzInformationCriteria,以下简写为SIC)、Hannan和Quinn(1979)信息准则(HannanandQuinnInformationCriteria,以下简写为HQIC)、从一般到特殊法则(GeneraltoSpecialCriteria,以下简写为GSC)、从特殊到一般法则(SpecialtoGeneralCriteria,以下简写为SGC)等。
此外,在后来的研究中,Weber(1998)又提出了非自相关法则(NoAutocorrelationCriteria),即从一个比较简化的模型开始,逐渐增加滞后差分项直到残差不能拒绝非自相关的原假设。
2001年他又提出了一种考虑滞后长度k在特定区间[kmin,kmax]内的从特殊到一般法,该方法运用了一系列F检验,确定的最优滞后长度是使得比其大的直到kmax的所有滞后差分项对应参数的联合检验均不显著的最小的k。
然而很多学者都指出,ADF检验的结论对滞后长度k的选择非常敏感。
Phillips和Perron(1988)模拟发现当真实数据生成过程为随机游走时,随着检验式中差分项滞后长度的增加,会导致ADF检验的功效和水平都降低。
另外,Schwert(1989)、Agiakloglou和Newbold(1992)以及Harris(1992)等也指出不同的滞后长度选择方法对ADF检验的实际水平和功效有明显影响。
这就引发了关于不同方法确定滞后长度是否以及如何影响ADF统计量极限分布的讨论。
其实早在ADF检验提出不久,Said和Dickey(1984)就证明了对阶数未知的ARMA过程检验单位根时,只要检验式中的滞后长度k满足一定的上界条件和下界条件,仍可以用ADF统计量来检验原过程中单位根的存在。
紧接着,Lewis和Reinsel(1985)提出了一个与Said和Dickey(1984)下界条件等价的条件,并证明当满足该下界条件和Said和Dickey(1984)上界条件时检验式中滞后差分项的参数估计量具有一致性和渐近正态性。
Hannan和Deistler(1988)[2]则提出了各信息准则确定一个平稳可逆的ARMA过程滞后长度的若干性质。
随后,Ng和Perron(1995)明确解答了哪些滞后长度选择方法满足这些上界与下界条件,以及运用它们确定滞后长度如何影响ADF检验统计量极限分布的问题。
首先,该文讨论了检验式中滞后长度k不满足Said和Dickey(1984)或Lewis和Reinsel(1985)下界条件对ADF检验统计量极限分布的影响。
他们认为这时仍渐近服从标准DF分布,同时滞后差分项的参数估计量仍具有一致性,但其向真值收敛的速度要小于(T为样本容量,下同)。
接着,Ng和Perron(1995)将滞后长度的选择准则与上述极限分布条件相比较,证明了在ADF检验中,利用各信息准则确定的滞后长度时不满足下界条件,但统计量仍服从标准DF分布。
而当运用GSC时,如果我们确定的滞后长度最大值满足上界条件和Lewis和Reinsel(1985)下界条件,则滞后差分项的参数估计量具有一致性和渐近正态性,可以用t统计量、F统计量和Wald统计量检验其显著性。
最后通过模拟重点讨论了当数据生成过程为ARIMA(0,1,1)时各方法确定的滞后长度以及对ADF检验功效和实际检验水平的影响。
类似地,Hall(1994)还从一个纯自相关过程入手,给出了当真实数据生成过程是一个ARIMA(p,1,0)过程时,ADF统计量服从DF分布应满足的假设条件。
并讨论了不同滞后长度选择准则对ADF统计量极限分布的影响。
他认为当运用AIC、SIC、HQIC以及GSC确定滞后长度时,满足上述条件,因此ADF统计量仍服从标准DF分布,而运用SGC时不能满足上述条件,从而ADF统计量的极限分布发生变化,不再服从标准DF分布。
最后对于不同的ARIMA(p,1,0)过程,模拟了基于各种准则的ADF检验功效与实际检验水平。
此外,随着研究的不断深入,学者们又从一些新的角度对滞后长度选择的问题进行了探讨。
比如Ng和Perron(2001)将Elliott、Rothenberg、和Stock(1996)[3]以及Dufour和King(1991)[4]提出的局部GLS退势法与Perron和Ng(1996)[5]提出的修正的单位根检验统计量相结合,提出了一系列MGLS统计量来检验单位根。
在这种检验中,他们首度运用了一系列修正的信息准则(ModifiedInformationCriteria,以下简写为MIC)来确定滞后长度,并给出了其局部渐近性质。
MIC与一般信息准则的本质区别就在于它考虑到检验式中一阶滞后项参数估计量的偏差与滞后长度是高度相关的,进而通过加入一个包含一阶滞后项参数估计量的修正项对信息准则拟和不足的问题进行了一定的校正。
Ng和Perron(2005)又重点探讨了在运用各种信息准则时,可用观测值个数(即调整的样本容量)、计算均方误差时的自由度、以及计算惩罚因子(penaltyfactor)时使用的观测值个数对滞后长度选择的影响。
结果表明在有限样本下AIC与SIC选择的滞后长度对上述三个因素非常敏感。
综上所述,已有的研究主要集中在对ARIMA(p,1,0)和ARIMA(0,1,1)过程进行单位根检验时,各方法确定的滞后长度以及相应的单位根检验的功效与实际水平上。
而对ARIMA(0,1,q)即含有单位根的高阶移动平均过程的研究则比较少。
另外,也鲜见MIC与其他方法比较的相关研究。
针对这些问题,本文对Hall(1994),Ng和Perron(1995,2001)的方法和结论进行扩展,在接下来的部分中用蒙特卡罗模拟的方法在有限样本下研究一个更一般的ARIMA(0,1,q)过程,对模拟结果中不同滞后期选择方法尤其是MIC的优劣进行比较,以期找到一种能应用在更一般的数据生成过程中,并使ADF检验推断更真实可靠的滞后长度选择方法。
最后一部分是对全文的总结,并提出了一些滞后项选择及ADF检验中需要注意的问题。
二、模拟结果
根据Hall(1994),Ng和Perron(1995,2001)文章中的结论,运用信息准则和GSC确定滞后长度时,ADF统计量仍服从标准DF分布。
其中运用GSC时滞后差分项以的速度收敛于真值,从而使ADF检验有一个更优的有限样本性质。
MIC是对通常信息准则的修正。
因此本文选取AIC、SIC、MAIC、MSIC以及GSC五种方法来确定ADF检验式中的滞后长度。
重点考察小样本下当误差项为高阶移动平均过程时基于各准则的ADF检验功效和实际检验水平的特征,以及MIC与其他方法相比对ADF检验统计推断的影响和滞后长度选择的异同。
各方法确定滞后长度的原理如下:
首先,AIC与SIC具有相似的形式,选择的滞后长度k满足使
(1)式的值最小。
其中AIC准则中CT=2,SIC准则中CT=logT,表示估计方程的误差均方,它往往随着滞后长度的增加而下降。
是ADF检验式中的解释变量个数,它等于滞后差分项个数k加上常数项以及时间趋势项,会随滞后长度的增加而变大,代表了对过度拟和的惩罚。
因此选择k使
(1)最小意味着在较少参数和较小的残差平方和之间做出选择。
(1)
另外,Ng和Perron(2001)提出了一系列的修正的信息准则即MIC。
其选择的滞后长度是使得目标方程
(2)的值最小的k,依据CT的表达式不同MIC又分别称为MAIC与MSIC。
(2)
它与一般的信息准则的不同就是增加了一个修正因子,其表达式为:
(3)
其中是ADF检验式中一阶滞后项的参数估计量。
Ng和Perron(2001)证明会随着ADF检验式中滞后差分项个数k的增加而减小,尤其当数据生成过程的移动平均部分含有负根时,这种减小更加明显,因此可以有效地校正一般信息准则拟和不足的问题。
GSC则是在ADF检验式中选取r=j+m个滞后差分项,并通过对最后m个参数(i=1,…,m)的显著性进行联合检验来完成的,其中j∈[0,jmax]。
该检验的Wald形式为:
(4)
其中(5)
(6)
它代表所有解释变量的方差协方差矩阵,是中右下方m×m阶的块矩阵。
代表该检验式回归函数的误差均方,其中代表回归式的残差。
检验规则为:
j从最大的取值jmax开始,依次降低其取值直到(4)式表示的统计量显著。
该统计量服从自由度为m的χ2分布。
基于显著性水平α,滞后长度k的取值为①k=j+1,当是统计量所有值中第一个大于临界值的值时。
②k=0,当统计量所有值均小于临界值时。
为了考察误差项为高阶移动平均过程时ADF检验中滞后长度的选择问题,我们对形如(7)式的数据生成过程共10种情况运用上述五种方法选择滞后长度继而进行ADF检验。
(7)
其中L是滞后因子,ut是白噪声,y0=0。
10种数据生成过程如下:
①θ1=0.8,θ2=0.0,θ3=0.0,θ4=0.0;②θ1=0.5,θ2=0.0,θ3=0.0,θ4=0.0;③θ1=-0.5,θ2=0.0,θ3=0.0,θ4=0.0;④θ1=-0.8,θ2=0.0,θ3=0.0,θ4=0.0;⑤θ1=0.8,θ2=0.5,θ3=0.0,θ4=0.0;⑥θ1=0.5,θ2=0.3,θ3=0.0,θ4=0.0;⑦θ1=-0.5,θ2=0.3,θ3=0.0,θ4=0.0;⑧θ1=-0.8,θ2=0.5,θ3=0.0,θ4=0.0;⑨θ1=-0.8,θ2=-0.5,θ3=0.0,θ4=0.0;⑩θ1=0.5,θ2=0.3,θ3=0.2,θ4=0.1。
这10种情况描述了误差项移动平均部分的根在个数、大小、正负等方面的不同情形。
ADF检验的原假设H0:
ρ=1;备择假设H1:
ρ<1。
ADF检验式如下:
(a)
(b)
为考察不同情形下ADF检验的功效和实际检验水平,我们对每种数据生成过程分别取β=1、0.95、0.85,用Rats6.2模拟样本容量T=100时基于两种检验式(a)和(b)的上述检验过程以及T=250时基于检验式(a)的上述检验过程。
对每种情况重复10000次,计算ADF统计量小于临界值的概率,同时记录每次选择的滞后长度,最后计算滞后长度的均值和标准差。
当真实数据生成过程是单位根过程即β=1时,ADF统计量小于临界值的概率就是犯弃真错误的概率,即实际检验水平。
而当真实数据生成过程为平稳过程即β<1时,ADF统计量小于临界值的概率则是1-犯取伪错误的概率,即检验功效。
这里运用GSC确定滞后长度时取m=1,即计算单个参数的t统计量,显著性水平取5%,各准则的最大滞后长度取kmax=20[6]。
根据模拟结果,我们重点比较了各方法在滞后长度选择及其相应的ADF检验功效和实际检验水平方面的异同,并考察了误差项为高阶移动平均时的各种数据生成过程、不同检验式以及样本容量对滞后长度选择及ADF检验统计推断的影响,从而对Hall(1994),Ng和Perron(1995)的结论做了一定的补充。
1.不同准则的比较
滞后长度及其标准差方面(见表1、3、5),总得来说,GSC、AIC与MAIC选择的滞后长度通常要高于SIC与MSIC,前者往往倾向于过度拟和。
具体来说,当DGP中移动平均部分的根为正时,AIC与MAIC、SIC与MSIC选择的平均滞后长度很接近。
当移动平均部分含有负根时,修正的信息准则往往比相应的原准则选择更大的平均滞后长度,并且这一差距随着根更接近于-1或负根个数增加而更加明显,同时滞后长度的标准差也随之增加。
表1滞后长度的均值和标准差检验式(a)T=100
βARIMA(p,d,q)θ1θ2θ3θ4AICSICMAICMSICGSC
1.0ARIMA(0,1,1)0.80.00.00.05.543.062.791.185.292.942.751.238.145.38
1.0ARIMA(0,1,1)0.50.00.00.02.992.721.460.712.812.441.480.826.616.18
1.0ARIMA(0,1,1)-0.50.00.00.02.852.681.340.753.012.551.771.086.716.30
1.0ARIMA(0,1,1)-0.80.00.00.04.623.282.031.346.393.604.502.567.655.73
1.0ARIMA(0,1,2)0.80.50.00.07.393.144.341.307.062.974.261.419.204.77
1.0ARIMA(0,1,2)0.50.30.00.03.792.702.180.813.622.412.160.857.055.89
1.0ARIMA(0,1,2)-0.50.30.00.02.152.780.440.802.392.620.961.176.256.53
1.0ARIMA(0,1,2)-0.80.50.00.03.963.191.311.335.433.393.472.157.295.87
1.0ARIMA(0,1,2)-0.8-0.50.00.06.383.563.222.028.473.756.663.388.715.14
1.0ARIMA(0,1,4)0.50.30.20.15.213.631.631.324.913.431.821.448.305.44
0.95ARIMA(1,0,1)0.80.00.00.05.573.142.771.175.333.172.761.378.095.36
0.95ARIMA(1,0,1)0.50.00.00.02.872.571.440.733.062.751.511.086.596.20
0.95ARIMA(1,0,1)-0.50.00.00.02.552.611.080.763.943.202.681.696.296.31
0.95ARIMA(1,0,1)-0.80.00.00.02.803.110.751.068.544.547.173.826.746.29
0.95ARIMA(1,0,2)0.80.50.00.07.313.094.321.327.113.234.221.629.104.80
0.95ARIMA(1,0,2)0.50.30.00.03.742.552.180.853.782.832.240.967.085.95
0.95ARIMA(1,0,2)-0.50.30.00.01.762.580.270.673.243.131.921.576.116.66
0.95ARIMA(1,0,2)-0.80.50.00.02.723.030.571.016.964.565.223.396.566.21
0.95ARIMA(1,0,2)-0.8-0.50.00.03.223.690.561.2711.114.9610.384.777.565.93
0.95ARIMA(1,0,4)0.50.30.20.15.063.531.611.315.143.582.411.728.175.44
0.85ARIMA(1,0,1)0.80.00.00.05.453.032.731.185.623.962.731.968.005.36
0.85ARIMA(1,0,1)0.50.00.00.02.832.591.360.723.613.571.151.666.556.19
0.85ARIMA(1,0,1)-0.50.00.00.02.022.540.580.735.814.574.413.296.176.55
0.85ARIMA(1,0,1)-0.80.00.00.01.102.490.080.358.726.248.036.065.746.76
0.85ARIMA(1,0,2)0.80.50.00.07.253.034.281.307.363.864.072.219.084.75
0.85ARIMA(1,0,2)0.50.30.00.03.752.642.110.824.173.612.321.617.015.94
0.85ARIMA(1,0,2)-0.50.30.00.01.362.610.120.464.734.353.252.925.936.74
0.85ARIMA(1,0,2)-0.80.50.00.02.022.790.420.716.616.255.405.656.076.57
0.85ARIMA(1,0,2)-0.8-0.50.00.01.632.610.320.586.907.466.757.376.256.63
0.85ARIMA(1,0,4)0.50.30.20.14.983.521.541.275.564.042.842.228.145.44
注:
表中所列和分别代表模拟10000次时各准则确定的(1-βL)yt滞后长度的均值及其标准差。
对同一数据生成过程而言,基于各种信息准则的实际检验水平由小到大分别为:
MAIC、MSIC、AIC、SIC。
尤其是当DGP的移动平均部分含有较大负根时,AIC与SIC的检验尺度扭曲非常严重,在样本容量为100时甚至达到了50%以上(见表2)。
而这时MAIC犯第一类错误的概率都能保持在10%以下。
此时基于GSC的检验尺度扭曲要小于一般的信息准则,但仍大于修正的信息准则,在其他情况下通常介于AIC与SIC之间。
从检验功效来看,基于SIC的检验功效最高,在移动平均部分中含有较大负根时其检验功效非常接近于1。
其次是基于AIC与GSC的检验功效,且前者的略高。
基于修正的信息准则的检验功效最低,尤其是在样本容量为100时更加明显(见表2)。
表2ADF检验的功效和实际检验水平检验式(a)T=100
βARIMA(p,d,q)θ1θ2θ3θ4AICSICMAICMSICGSC
1.0ARIMA(0,1,1)0.80.00.00.00.05660.05690.02390.02110.0596
1.0ARIMA(0,1,1)0.50.00.00.00.06110.06740.03130.02480.0629
1.0ARIMA(0,1,1)-0.50.00.00.00.10080.15800.05160.06760.0981
1.0ARIMA(0,1,1)-0.80.00.00.00.24360.42570.06050.09290.1856
1.0ARIMA(0,1,2)0.80.50.00.00.06040.05310.02180.01750.0594
1.0ARIMA(0,1,2)0.50.30.00.00.05860.05900.02750.02410.0604
1.0ARIMA(0,1,2)-0.50.30.00.00.11870.18630.05760.08150.1043
1.0ARIMA(0,1,2)-0.80.50.0