Eviews60操作关键方法记录本.docx
《Eviews60操作关键方法记录本.docx》由会员分享,可在线阅读,更多相关《Eviews60操作关键方法记录本.docx(23页珍藏版)》请在冰豆网上搜索。
Eviews60操作关键方法记录本
1.用Eviews6.0生产一个0均值的序列或对数数列
1.1.用途及原理
原序列非常的不稳定,不稳定序列可以取均值或者对数数列,让其趋于稳定,才能做预测或者拟合.对于平稳随机过程,我们已经建立了一整套的处理方法。
由于平稳序列的均值、方差、协方差等数字特征并不伴随着时间的推移而变化,且其数字特征具有遍历性,因此可以基于时间序列在过去时点上的信息,建立拟合模型,用于预测时间序列在未来时点上的特征或者可能出现的情景。
但在经济实践中,诸如国内生产总值之类的实际经济统计时间序列经常呈现出系统性地上涨或下降的趋势。
有些时间序列还具有周期性波动的特征,例如社会零售总额的月度时间序列数据等。
诸如此类的时间序列样本数据不可能生成于平稳随机过程,从而可看成来自于非平稳随机过程的样本数据。
然而,非平稳时间序列的数字特征会伴随着时间的推移而变化,亦即其在不同时点上的统计规律性互不相同,且不具有遍历性,因此不能基于序列既往的信息来推测其在未来的可能情景。
于是我们必须建立一套处理非平稳随机过程的专门方法。
其中,设法将其平稳化是处理非平稳随机过程的基本思路。
1.2操作方法
实验操作数据基于甘蔗产量ExcelGZCL
取对数数列变量窗口下操作如下:
相对于原数列取0均值序列操作如下:
第一步,找出原数列的Mean(均值),操作如上。
结果如下。
Mean:
均值Median:
中值(中位数)MaxMin:
最大值,最小值Std.Dev:
样本标准差Skewness:
偏度(直观看来就是密度函数曲线尾部的相对长度,即曲线峰波往哪边偏,偏的是多少,BS)
Kurtosis:
峰度(峰度是用来反映频数分布曲线顶端尖峭或扁平程度的指)
第二步,利用Mean数值做出O均值序列。
操作如下:
出现以下窗口:
输入命令:
X=GZCL-Mean(输入Mean代表的具体数值)
确定后,既可得到相对于原序列的,0均值序列
在对时间序列进行拟合的时候,如果用二次或者n次函数或其他函数方式进行拟合。
需要注意,真实观测值是A-B的范围(1979-2013),样本为35个,B+1,B+2为需要预测的年份,样本最多变成37个。
那么,在建立t的时候,就要给出B+1,B+2的数值,也就是要填进去36,37数字。
如何给时间序列做p-Q检验
在做完ARIMA模型后,得出了MAPE和TIC,差一个p-Q检验,也就是白噪声检验。
做法如下:
在方程输出窗口中,操作如下:
在方程结果输出中,选择如上操作进行倒数第二个的LM检验.输入参数P的值得,然后看一个大的Q的R平方调整的值和概率。
P>0.5才算通过,不然都不算。
LMA方法拟合
以下程序必须在EVIEWS的program窗口下才能运行。
否则会出现错误
seriesid=@trend(1978)
matrix(35,1)dataout=0'35为样本量;1为样本个数
'定义变量
for!
num=1to1
!
count=!
num
!
a=1979
!
b=!
a+20'20+1为步长
!
t=0
vector(35)trend=0
coef(35)count=0
while!
b<2013
smpl!
a!
b
equationeq.lsdc({!
num})cid'dc代表福建水稻趋势单产
eq.makeresidres
seriesess=dc({!
num})-res
for!
k=1to21
!
n=!
t+!
k
ifess({!
k})<>0then
trend({!
n})=trend({!
n})+ess({!
n})
count(!
n)=count(!
n)+1
endif
next
!
a=!
a+1
!
b=!
b+1
!
t=!
t+1
wend
for!
p=1to35
scalarnum=count({!
p})
ifnum=0then
num=1
endif
dataout(!
p,!
count)=trend({!
p})/num
next
next
smpl@all
用Logistic曲线进行农作产量拟合
输入公式:
其中,a、b、k分别是C1、C2、C3。
A代表的是农作物产量的峰值,也就是农作物产量的最大值,
如何用EVIEWS生产一个白噪声序列
wfcreateu1000'generateaworkfileincluding1000observations
seriesx 'WNseries
x=@rnorm 'iidrealizationsfromNormaldistribution
seriesy=0
smpl@first+1@last
y=y(-1)+x'randomwalk
EVIEWS6.0运行过程中常出现的错误提示符号
unmatchedparentheses 这个是告诉你,括号两个肯定不对,要么前后不一样,要么数量不一样。
这个错误告诉你,样本量不足!
异方差的诊断和处理——基于EVIEWS8.0plus实现
利用数据:
thelecturetwo,:
交叉项WLS实验数据
Lsycx1x2
1.发现x1参数检验不过,R2一般,首先怀疑存在WLS。
2.对残差进行White检验.在方程结果输出结果点击。
因为模型中有X1、X2,所以,那个“包含交叉项的要打钩”
3.输出结果解释:
F统计量P=0,说明存在异方差,只有当P>0.05的时候,才能说它没有异方差。
4.如何处理异方差。
首先,现实中,一般直接用稳健标准误去做,如果样本容量够大的话。
EVIES8.0plus似乎和版本6不一样,所以这里用6进行操作。
在第一个框框那个LS&TSLS下面打钩,然后选择的是White方法。
其他的全部都不要动。
输出结果:
普通LS回归:
稳健标准误回归:
由于样本太小,所以t检验还是通不过,如果是大样本是可以通过的,而且,稳健标准误改变是std.Erroe.标准误,而不是参数系数,所以,这是很好的结果。
第二种处理方法:
WLS。
加权最小二乘法。
核心内容是,要通过不断试算,找出W。
其中,计算W的方法采用伍德里奇的方法,可以杜绝负数存在的可能。
W的计算公式为:
W=1/@sqrt(exp(最好的试算)
这里最好的试算,指的是,全部试算参数的t检验T通过,F统计量越大越好。
试算过程链接如下:
..\计量经济学(张玉荣)\thirdlecture\4.1异方差和序列相关.ppt
多重共线性诊断和处理——基于EVIEWS8.0plus实现
多重共线性在多元回归中常常碰到,就是X2和X3互相影响,反而模糊了对Y的影响。
所以多重共线性问题不大,判断多重共线性很简单,就三步。
数据来源:
thethirdlecture:
中国粮食生产数据
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
-26695.08
7507.527
-3.555775
0.0021
X1
5.994511
0.609713
9.831685
0.0000
X2
0.536701
0.057858
9.276245
0.0000
X3
-0.135873
0.029720
-4.571732
0.0002
X4
-0.090822
0.042053
-2.159696
0.0438
X5
-0.007390
0.070511
-0.104814
0.9176
R-squared
0.980829
Meandependentvar
44945.64
AdjustedR-squared
0.975783
S.D.dependentvar
4150.729
S.E.ofregression
645.9230
Akaikeinfocriterion
15.98480
Sumsquaredresid
7927113.
Schwarzcriterion
16.27733
Loglikelihood
-193.8100
Hannan-Quinncriter.
16.06594
F-statistic
194.4114
Durbin-Watsonstat
1.715679
Prob(F-statistic)
0.000000
判断:
第一,Adj-R2很大,说明各个X对Y的解释到位,而且这不是时间序列,应该不会是伪回归。
第二,X4,X5参数都没通过检验。
第三,X4、X5符号方向和现实意义完全相反,X4、X5代表的是受灾面积和农业机械化程度,Y代表粮食产量,X5和Y之间是负影响,这是不可能的。
考虑可能存在多重共线性,同时,做White检验。
为了找到谁和谁高度相关,这里用group-correlation.
然后在对话框里输入要检测的自变量。
得到自相关结果如下:
这个图看横着的和竖着的两个变量的对应的值。
参数越大,说明相关程度越高,很明显这里X4和X1相关系数为0.952746,高度相关。
X5和X4一般相关。
考虑采用step-ls逐步回归来剔除某些变量。
处理方法:
step-ls
选定后会出现和LS不同的对话框,其中上面的部分只包含Y、C的,就是必须包括的变量,而下面的部分就是我们的全部自变量,注意是要全部。
接下来要设置P值达到多少要被剔除出模型。
首先,选择stepwise,在selectionmethod里面,然后有一个p-value,这里系统默认是0.5,要根据我们自己需要改成0.05或者0.01或者0.1,意思是,t统计量的P超过这个值,就被剔除出模型。
1000,1000,2000的意思是迭代的次数,可以多设置一些。
最后的结果就是,X5被剔除了。
注意,被剔除不是X4,虽然在模型correlation中X4和X1高度相关,但可能是由于X5存在导致的。
序列自相关检验和处理——基于EVIEWS8.0plus实现
序列自相关意思是,去年的自己弄死今年的自己。
某个序列在时间抽上不断互相影响,一般来说,时间序列都有惯性,放到ARIMA、协整里没什么事情,一旦进行多元回归就是致命性的。
另外,模型错误,样本量缺失而使用的“木遁·平均扦插之术”,遗落关键变量也会导致这个原因。
数据来源:
中国海关数据
DependentVariable:
Y
Method:
LeastSquares
Date:
05/18/15Time:
17:
16
Sample:
19782001
Includedobservations:
24
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
-5430.842
2440.157
-2.225612
0.0366
X1
46.51077
2.314741
20.09330
0.0000
R-squared
0.948325
Meandependentvar
33050.81
AdjustedR-squared
0.945976
S.D.dependentvar
31871.80
S.E.ofregression
7407.950
Akaikeinfocriterion
20.73815
Sumsquaredresid
1.21E+09
Schwarzcriterion
20.83632
Loglikelihood
-246.8578
Hannan-Quinncriter.
20.76420
F-statistic
403.7405
Durbin-Watsonstat
0.592053
Prob(F-statistic)
0.000000
多重共线性的初步判断是D-W检验和残差图.D-W检验一般认为在2左右算是正常的,小于1.5都算危险.因此,上图可认为存在自相关.做残差图.
残差图可以看到e和e(-1)呈现线性关系,高度相关。
可以认为自相关存在。
自相关的标准做法是对方程输出结果做LM检验。
做LM检验,检验分为1阶和2阶。
选择1阶,就可以看出模型是否存在异方差,选择2阶段,可以看出是否存在2阶自相关。
以这个图,F统计量的P值小于0.05,说明模型存在自相关。
这是选择阶数为2的检验结果,可以看出resid1和resid2都存在p<0.05的情况,说明模型存在1、2阶自相关。
因此,需要用到ar
(2)。
处理方法:
引入时间序列t。
然后用GLM进行回归估计。
Seriest=@trend(startingyear-1)引入时间序列
Lsycx1tar
(1)ar
(2)其中,t是取t2、t3、t4.要试算,找出D-W值最接近于2的。
结果如下,可以看到在t*t*t的情况下,指标最好。
到这里并不算完,这是,要取AR
(1)、AR
(2)的参数。
写入公示:
e=c+c
(1)*(Xt+1.9Xt-1)*(Xt-1-1.2788Xt-2)+c
(2)*(t3+1.9t-13)(-1.27t-23+1.27t-23)+c(3)et-1+U
方程估计结果如图:
可以看出,D-W几乎为2.此时,对模型做LM检验。
可以看出,自相关已经基本被消除。
因此,可以利用此参数对原模型进行变换,此时,e换成y。
Lsy+1.9*y(-1)-1.27*y(-2)cx1+1.9x1*(-1)-1.27*x1(-2)t^3+1.9*t^2-1.27*t^3