因此,残差项存在正的一阶自相关。
广义差分法。
(3)Klein多重共线性检验:
几个解释变量之间的相关系数都低于拟合优度,因此,不存在严重的多重共线性问题。
逐步回归法、岭回归法。
2.对应于原假设,解释变量GDP和FGDP的估计参数的t统计量分别为:
,拒绝原假设
,接受原假设
3.
,(k包含常数项)整个方程显著
4.
=0.02表示在其他条件不变的情况下,国内生产总值每增加1亿美元,出口额将会增加0.02亿美元。
一、检验如下命题:
失业率增加会导致通货膨胀率下降。
模型形式为:
dinf=a+b*unem+u,其中dinf表示通货膨胀率的差分变量,unem表示失业率。
给定5%的检验水平,根据如下估计结果判断下面哪个论述是正确的。
()
A.原假设:
b0;备择假设:
b>0。
t统计量的概率值为0.04*2=0.08,接受原假设。
B.原假设:
b0;备择假设:
b<0。
t统计量的概率值为0.04*2=0.08,接受原假设。
C.原假设:
b0;备择假设:
b>0。
t统计量的概率值为0.04/2=0.02,拒绝原假设。
D.原假设:
b0;备择假设:
b<0。
t统计量的概率值为0.04/2=0.02,拒绝原假设。
1.多重共线性(但不是完全的共线性)不会影响参数OLS估计量的无偏性,但会导致估计量的非有效性。
(F)
2.当模型中存在异方差时,加权最小二乘(WLS)估计量具有有效性,因此WLS估计量的方差小于OLS估计量的方差。
(F)
利用世界102个国家的相关数据分析教育投入对国内生产总值的影响,模型设定如下:
其中,GDP为国内生产总值(单位:
亿美元)、Educ为教育投入(单位:
亿美元)、K为资本(单位:
亿美元)、L为劳动力(单位:
亿人)。
Dum1和Dum2为虚拟变量。
如果是中等收入国家,Dum1=1,否则为0;如果是高收入国家,Dum2=1,否则为0。
Ln表示对变量取自然对数。
回归结果如下(括号内的数字表示t统计量,Se表示回归标准差)。
R2=0.99,Se=0.20
请回答如下问题:
2.(4分)标准差为0.29/4.62=0.06;96个自由度的t分布(或正态分布)的0.025分位数为1.96。
因此,置信区间为[0.29-1.96*0.06,0.29+1.96*0.06],即[0.17,0.41]。
3.(5分)根据参数的含义可以得到新模型的估计结果:
4.(7分)由回归标准差se=SSE/(N-k-1),可得残差平方和SSE=1.92;
由R2可得总离差平方SST=192和回归平方和SSR=190.08。
再由F统计量的公式F=(SSR/k)/[SST/(n-k-1)],可得F=19.01。
1.解释ln(Educ)的参数估计量0.29的经济含义。
教育投入每增长1%,GDP增长0.29%
2.计算1的置信区间估计(置信度0.95)。
3.如果将Dum1和Dum2重新定义如下:
如果是中等收入国家,Dum1=1,否则为0;如果是低收入国家,Dum2=1,否则为0。
根据参数的经济含义重新写出模型的回归结果(只写出参数估计量)。
4.填写如下方差分析表。
平方和
自由度
F统计量
总离差平方和
回归平方和
残差平方和
3.显著性t检验要求参数估计量的抽样分布是正态分布。
(T)
4.尽管有完全的多重共线性,OLS估计量仍然是BLUE。
(F)
5.变量的两两高度相关并不表示高度多重共线性。
(T)
下面哪个假定保证了线性模型y=X+u的OLS估计量的无偏性。
(A)
A.X与u不相关。
B.u是同方差的。
C.u无序列相关。
D.矩阵X是满秩的。
DW自相关检验
(4)Glejser检验
(a)用于检验自相关。
(b)用于检验多重共线性。
(c)可用于检验递增型异方差。
(d)不能用来判断递增型异方差的具体形式。
【答】:
(c)
一、用我国普通高等学校普通本、专科生在校人数Y(单位:
万人)与人均国内生产总值X1(单位:
元)和普通高等学校的数量X2(单位:
所)回归,得结果如下:
1.计算[1]、[2]、[3]、[4]、[5]划线处的5个数字,并给出计算步骤(计算过程与结果保留小数点后4位小数)。
(15分)
解:
[1]=68.242(-14.8672)=-1014.5675(点评:
有把负号丢了的)
[2]=1.0409/13.1623=0.0791
TSS=(436.1948)2(16-1)=2853988.553
[3]=(2853988.553-25730.21)/2853988.553=0.9910
[4]=
[5]=
=
=[(2853988.553-25730.21)/2]/[25730.21/13]
=1414129.172/1979.2469=714.4784
或者[5]=
=
2.根据计算机输出结果,写出二元回归模型表达式。
(5分)
【答】:
=-1014.5675+0.0483X1+1.0409X2
(-14.9)(8.6)(13.2)R2=0.9910,DW=1.4,T=16
3.解释回归系数0.0483和1.0409的经济含义。
(5分)
【答】若维持X2不变,人均国内生产总值X1每增加1元,在校学生数平均增加483人。
若维持X1不变,普通高等学校的数量X2每增加1所,在校学生数平均增加1.04万。
4.给定人均国内生产总值X12006为2万元,普通高等学校数X22006为2千所,
(1)预测2006年普通高等学校普通本、专科生在校人数Y2006。
(2)已知Y2006的分布标准差为s.e.=30,求Y2006的95%的置信区间(已知临界值t0.05(13)=2.16)。
(5分)
【答】
=-1014.5675+0.0483X1+1.0409X2
=-1014.5675+0.048320000+1.04092000=2033.2325万人
Y2006的95%的置信区间是2033.23252.1630=[1968.43252098.0325]
5.模型的异方差White检验结果(采用nocrossterms检验式)如下:
(1)这说明模型误差序列中存在还是不存在异方差?
(2)用2统计量的值5.46写出概率(p值)0.2432的表达式。
(6分)
【答】
(1)不存在异方差。
(2)P{2>5.46}=0.2432
给定一元线性回归模型yt=0+1xt+ut,其中yt,xt是变量,0,1是回归系数,ut是随机误差项。
估计模型用yt=
+
xt+
表示。
yt和xt的均值分别用
和
表示。
试证明模型可决系数R2等于yt和xt的相关系数rxy的平方,即R2=(rxy)2。
(已知(xt-
)
=0)
证明:
R2=
。
(rxy)2=
=
=
已知:
(xt-
)
=0,所以
(rxy)2=
。
两式相等。
三、19642005年中国城镇人口(Y,万人)时间序列如图。
虚拟变量D1和D2的定义和回归结果如下:
(1)按输出结果写出估计方程表达式。
并按D1=D2=0,D1=1,D2=1三个区间分别写出表达式。
(4分)
解:
Y=12208.99-10830.05D1-44701.88D2+320.07t+747.48D1t+1797.51D2t
(90.9)(-29.6)(-38.1)(21.0)(36.2)(52.1)
R2=0.9996,DW=0.8,T=43
(2)利用估计结果简要描述中国城镇人口在此区间的变化过程。
城镇人口在增加过程中为什么会出现两个明显的转折点?
(4分)
解:
中国城镇人口在此区间呈3段式增长。
1964至1978年城镇人口以每年320万人的速度增长。
改革开放以后(1979至1995年)城镇人口以每年1067.55万人的速度增长。
1995年以后城镇人口政策进一步放开,以每年2117.58万人的速度增长。
出现两个明显的转折点,是因为放松城镇人口政策的结果。
(3)用估计方程计算1996年中国城镇人口的拟合值。
(4分)
解:
Y=-32492.89+2117.58t=37387.25(万人)
(4)已知模型误差项不存在异方差,你觉得估计方程还在哪个方面有待改进?
怎样改进为好?
(4分)
解:
模型误差项还存在自相关,应该克服自相关,最简便的方法是建立组合模型。
四、劳动力供给函数的EViews估计结果如下(N=3449)。
解释变量与被解释变量是
Hours:
每周工作小时数(被解释变量)。
Wage:
每小时工资额(欧元)(解释变量)。
Nli:
其它收入(解释变量)。
Sex:
虚拟变量。
女性为1,男性为0(解释变量)。
Age:
年龄(解释变量)。
Married:
虚拟变量。
已婚为1,未婚为0(解释变量)。
Kids:
虚拟变量。
家庭中有小孩为1,无小孩为0(解释变量)。
Educ:
受教育水平(上学的年数)(解释变量)。
(1)写出输出结果对应的模型估计式。
【答】
LnHours=3.38+0.057Lnwage-0.059Lnnli-0.263sex+0.002age
(82.6)(2.9)(-10.2)(13.5)(2.7)
+0.024married-0.142kids+0.038*educ
(1.2)(-5.7)(6.7)R2=0.21,DW=1.9
(2)给定检验水平为5%,说明哪些系数显著地不为零,哪个无显著性,说明原因。
【答】
除了married的系数不显著外,其它的系数都显著不等于零,因为其它系数对应的p值都比0.05小(或,t值都大于1.96),意味着它们在95%的置信水平下都显著不等于零。
(3)给出解释变量SEX对应的回归系数的实际含义。
【答】维持其它变量不变,女性的每周工作时数平均比男性少0.26小时。
(4)有孩子的已婚女性与没有孩子的未婚男性在工作时间上有何差异?
【答】有孩子的已婚女性比没有孩子的未婚男性每周少工作-(-0.263+0.024-0.142)=0.381个小时。
(5)工作时间Hours对工资Wage和其它收入Nli变量的弹性系数分别是多少?
保持其它解释变量不变,当工资上升10%时,工作时间的变化是多少?
【答】
弹性系数分别是:
0.057和-0.059,当工资上升10%时,工作小时会上升0.57%。
(6)求Lnwage回归系数的90%的置信区间(t0.1(3441)=1.64,保留3位小数)。
【答】
Lnwage回归系数的90%的置信区间是
[0.057-1.640.02,0.057+1.640.02]=[0.024,0.09]
(7)假如在回归模型中剔除age,married,kids三个变量,重新估计模型,得R-squared=0.19和sumsquareresiduals=803,计算age、married、kids的回归系数联合为0的F统计量的值。
(保留2位小数)
【答】F=[(SSRR–SSRU)/M]/[(SSRU/(T-K-1)]=[(803-790.26)/3]/(790.26/3441)=18.49
(8)求每周工作小时数Hours=32小时,每小时工资额wage=8欧元条件下,若wage增加1欧元,每周工作时间变化多少?
(保留3位小数)
【答】因为
所以,边际系数为
=0.057(32/8)=0.228,
即保持其它解释变量不变,每周工作小时数Hours=32小时,每小时工资额wage=8欧元条件下,工资上升1欧元,工人会多工作0.228小时。