第二章简单线性回归模型.docx
《第二章简单线性回归模型.docx》由会员分享,可在线阅读,更多相关《第二章简单线性回归模型.docx(14页珍藏版)》请在冰豆网上搜索。
![第二章简单线性回归模型.docx](https://file1.bdocx.com/fileroot1/2022-12/12/04138c4e-f250-4d18-afe7-28bb3264188b/04138c4e-f250-4d18-afe7-28bb3264188b1.gif)
第二章简单线性回归模型
第二章简单线性回归分析
一、填空题
1•计量经济模型普通最小二乘法的基本假定有、、、
。
2•被解释变量的观测值Yi与其回归理论值E(Y)之间的偏差,称为;被解释
变量的观测值Yi与其回归估计值Y之间的偏差,称为。
3.对线性回归模型Y=•XXu进行最小二乘估计,最小二乘法的原理是
4•高斯一马尔可夫定理证明在总体参数的各种线性无偏估计中,普通最小二乘估计量具
有的特性,并由此才使最小二乘法在数理统计学和计量经济学中获得了最广泛的
应用。
5•普通最小二乘法得到的参数估计量具有、、统计性
质。
6•对于丫二bo•RX,•b2X2u,在给定臵信水平下,减小b的臵信区间的途径主要
有、、。
7•总平方和TSS反映之离差的平方和;回归平方和ESS反映了
之离差的平方和;残差平方和RSS反映了之差的平方和。
8•方程F显著性检验的含义是。
9•解释变量t显著性检验的含义是。
、单选题
1.回归分析中定义()
A.解释变量和被解释变量都是随机变量
B.解释变量为非随机变量,被解释变量为随机变量
C.解释变量和被解释变量都为非随机变量
D.解释变量为随机变量,被解释变量为非随机变量
2.
最小二乘原理是指使()达到最小值的原则确定样本回归方程。
总体平方和TSS、残差平方和RSS与回归平方和ESS三者的关系是
12.产量(X,台)与单位产品成本(
Y,元/台)之间的回归方程为V=400-0.6X,
这说明(
B.产量每增加一件,单位产品成本减少0.6元
C.产量每增加一件,单位产品成本平均增加400元
D.产量每增加一件,单位产品成本平均减少0.6元
13.回归模型丫J。
「必匚•Ui,i=1,…,25中,总体方差未知,检验H。
:
=0
时,所用的检验统计量E-服从(
S(b1)
14.设k为回归模型中的参数个数(包括截距项),n为样本容量,RSS为残差平方和,
ESS为回归平方和。
则对总体回归模型进行显著性检验时构造的F统计量为(
ESSRSS
C.F;D.F二
RSSESS
15.根据可决系数R2与F统计量的关系可知,当R2=1时有(
A.F=1;B.F=—1;C.Ft+s;D.F=0
16.线性回归模型的参数估计量b是随机变量Y的函数,即b=(XX)」XY。
所以b
是(
A.随机变量;B.非随机变量;C.确定性变量;D.常量
17.由Y=Xfb可以得到被解释变量的估计值,由于模型中参数估计量的不确定性
及随机误差项的影响,可知Yf是(
A.
确定性变量;B.非随机变量;C.随机变量;D.常量
1n
A.线性回归模型•[X•u的零期望假设是指一'ui-0
n7
B.对模型Y=1。
•打Xj•]2X2•u进行方程显著性检验(即F检验),检验的零
假设是H0:
:
0='二■2
C.相关系数较大意味着两个变量存在较强的因果关系
D.当随机误差项的方差估计量等于零时,说明被解释变量与解释变量之间为函数关系
、多选题
4.
回归平方和7y2是指()。
B.被解释变量的回归值Y?
与其平均值Y的离差平方和
C.被解释变量的总体平方和y2与残差平方和e2之差
D.解释变量变动所引起的被解释变量的离差的大小
E.随机因素影响所引起的被解释变量的离差大小
22
5.在多元线性回归分析中,修正的可决系数R与可决系数R之间()。
A.R2R2;C.R2只能大于零;D.R2可能为负值
6.由下列方程判断模型()属于变量呈线性,模型()属于系数呈线性,模
型()既属于变量呈线性又属于系数呈线性,模型()既不属于变量呈线性也
不属于系数呈线性。
B.Y二■■-1lnXju
D.YJ。
「(tXi)u
F.Y=1「0(1—X「1)u
A.Y=:
°「X:
u;
C.lnYilnXiu;
E.;0/1X1U;
G.Y=1X12X2u
四、简答题
1•什么是相关分析(Correlation)?
2.什么是相关图(Correlationgraph)?
3.什么是相关系数(Correlationcoefficient)?
4.给定一元线性回归模型:
丫=2。
•「X1,u
(1)叙述模型的基本假定;
(2)写出参数■:
0和■:
1的最小二乘估计公式;(3)说明满足基本假定的最小二乘估计量的统计性质;(4)写出随机扰动项方差的无偏估计公式。
5.从经济学和数学两个角度说明计量经济学模型的理论方程中必须包含随机误差项。
6.非线性计量模型转化成线性模型数学处理方法。
7.最小二乘法和最大似然法的基本原理。
8.最小样本容量、满足基本要求的样本容量。
9.拟合优度检验与方程显著性检验的区别与联系。
10.如何缩小被解释变量预测值的臵信区间。
五、实践题
1•下表列出若干对因果关系变量。
对每一对变量,你认为它们之间的关系如何?
是正的、负的、还是无法确定?
并说明理由。
Y
X
GNP
利率
个人储蓄
利率
小麦产出
降雨量
美国国防开支
前苏联国防开支
棒球明星本垒打的次数
其年薪
总统声誉
任职时间
学生计量经济学成绩
其统计学成绩
日本汽车的进口量
美国人均国民收入
票或债券的收益率;rm表示有价证券的收益率(用市场指数表示,如标准普尔500指数);t
表示时间。
在投资分析中,31被称为债券的安全系数3,是用来度量市场的风险程度的,即
市场的发展对公司的财产有何影响。
依据1956~1976年间240个月的数据,Fogler和Ganpathy
得到IBM股票的回归方程;市场指数是在芝加哥大学建立的市场有价证券指数:
Ao
rt=0.72641.0598尙R2二0.4710
(0.3001)(0.0728)
要求:
(1)解释回归参数的意义;
(2)如何解释R2?
(3)安全系数3>1的证券称为不稳定证券,建立适当的零假设及备选假设,并用t检验进行检验(a=5%。
3.某农产品试验产量Y(公斤/亩)和施肥量X(公斤/亩)7块地的数据资料汇总如下:
'X=255,'Y-3050;'、X-1217.71;'、y2=8371.429;'xy=3122.857
后来发现遗漏的第八块地的数据:
X8=20,丫8=400。
要求汇总全部8块地数据后分别用小代数解法和矩阵解法进行以下各项计算,并对计算
结果的经济意义和统计意义做简要的解释。
(1)该农产品试验产量对施肥量X(公斤/亩)回归模型丫=20•*X1•u进行估计。
(2)对回归系数(斜率)进行统计假设检验,显著性水平为0.05。
(3)估计可决系数并进行统计假设检验,显著性水平为0.05。
(4)计算施肥量对该农产品产量的平均弹性。
(5)令施肥量等于50公斤/亩,对农产品试验亩产量进行预测,信度为0.05。
(6)令施肥量等于30公斤/亩,对农产品试验平均亩产量进行预测,显著性水平为0.01。
4.考虑以下预测的回归方程:
£=-1200.10Ft5.33RSR2=0.50
其中:
Yt为第t年的玉米产量(蒲式耳/亩);Ft为第t年的施肥强度(磅/亩);RSt――第t年的降雨量(英寸)
回答下列问题:
(1)从F和RS对Y的影响方面,说出本方程中系数0.10和5.33的含义;
(2)常数项-120是否意味着玉米的负产量可能存在?
(3)假定'-f的真实值为0.40,则估计值是否有偏?
为什么?
(4)假定该方程并不满足所有的古典模型假设,即并不是最佳线性无偏估计值,则是否意味着1rs的真实值绝对不等于5.33?
为什么?
5.设某商品的需求量Y(百件),消费者平均收入X1(百元),该商品价格X2(元)
的统计数据如下:
(至少保留三位小数)
、Y2=67450;'X;=740;YX1=6920;YX?
=4500;n=10
经EViews计算部分结果如下:
(表1、表2、表3中被解释变量均为Y,n=10)
表1
VARIABLE
COEFFICIENT
STD.ERROR
T-STAT
2-TAILSIG
C
99.469295
13.472571
7.3830965
0.000
X1
2.5018954
0.7536147
3.3198600
0.013
X2
-6.5807430
1.3759059
-4.7828436
0.002
R-squared
0.949336
Meanofdependentvar
80.00000
AdjustedR-squared
0.934860
S.D.ofdependentvar
19.57890
S.Eofregression
4.997021
Sumofsquaredresid
174.7915
Durbin-Watsonstat
1.142593
F-statistics
65.58230
表2
VARIABLE
COEFFICIENT
STD.ERROR
T-STAT
Prob.
C
38.40000
8.3069248
4.6226493
0.002
X1
5.200000
0.9656604
5.3849159
0.001
R-squared
0.783768
Meanofdependentvar
80.00000
AdjustedR-squared
0.756739
S.D.ofdependentvar
19.57890
S.Eofregression
9.656604
Sumofsquaredresid
746.0000
Durbin-Watsonstat
1.808472
F-statistics
28.99732
表3
VARIABLE
COEFFICIENT
STD.ERROR
T-STAT
Prob.
C
140.0000
8.5513157
16.371750
0.000
X2
-10.00000
1.3693064
-7.3029674
0.000
R-squared
0.869565
Meanofdependentvar
80.00000
AdjustedR-squared
0.853261
S.D.ofdependentvar
19.57890
S.Eofregression
7.500000
Sumofsquaredresid
450.0000
Durbin-Watsonstat
0.666667
F-statistics
53.33333
完成以下任务,并对结果进行简要的统计意义和经济意义解释(要求列出公式、代入数
据及计算结果,计算结果可以从上面直接引用)。
(1)建立需求量对消费者平均收入、商品价格的线性回归方程并进行估计。
(2)对偏回归系数(斜率)进行检验,显著性水平a=0.05
(3)估计多重可决系数,以显著性水平a=0.05对方程整体显著性进行检验。
并估计校正可决系数。
(4)计算商品需求量分别与消费者平均收入和商品价格的偏相关系数。
(5)用Beta系数分析商品需求量对消费者平均收入的变化以及商品需求量对商品价格的变化哪个更敏感。
(6)需求量对收入的弹性以及需求量对价格的弹性分别是多少。
(7)假如提高消费者收入和降低价格是提高商品需求量的两种可供选择的手段,你将建议采用哪一个,为什么?
(8)设消费者平均收入为700元、商品价格为5元
(9)用需求量对消费者平均收入、商品价格的回归方程,对需求量进行均值区间预测,显著性水平a=0.01
(10)在需求量对消费者平均收入的回归方程和需求量对商品价格的回归方程中,选择拟
合优度更好的一个回归方程,对需求量进行均值区间预测,显著性水平a=0.01
(11)请对以上全部分析过程、结果和需要进一步解决的问题做出说明。
6.设某地区机电行业销售额Y(万元)和汽车产量Xi(万辆)以及建筑业产值X2(千
万元)。
经EViews软件对1981年——1997年的数据分别建立线性模型和双对数模型进行最小二乘估计,结果如下:
表1
DependentVariable:
Y
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
-57.45496
81.02202
-0.709128
0.4899
X1
45.70558
15.66885
2.916971
0.0113
X2
11.93339
1.516553
7.868761
0.0000
R-squared
0.903899
Meandependentvar
545.5059
AdjustedR-squared
0.890170
S.D.dependentvar
193.3659
S.E.ofregression
64.08261
Akaikeinfocriterion
11.31701
Sumsquaredresid
57492.12
Schwarzcriterion
11.46405
Loglikelihood
-93.19457
F-statistic
65.83991
Durbin-Watsonstat
2.103984
Prob(F-statistic)
0.000000
表2
DependentVariable:
Ln(Y)
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
3.734902
0.212765
17.55410
0.0000
Ln(X1)
0.387929
0.137842
2.814299
0.0138
Ln(X2)
0.568470
0.055677
10.21006
0.0000
R-squared
0.934467
Meandependentvar
6.243029
AdjustedR-squared
0.925105
S.D.dependentvar
0.356017
S.E.ofregression
0.097431
Akaikeinfocriterion
-1.660563
Sumsquaredresid
0.132899
Schwarzcriterion
-1.513526
Loglikelihood
17.11479
F-statistic
99.81632
Durbin-Watsonstat
1.839701
Prob(F-statistic)
0.000000
1•写出电行业销售额对汽车产量和建筑业产值的双对数线性回归估计方程。
2.对双对数模型进行经济意义检验和统计意义检验。
3.比较表1和表2,你将选择哪个模型?
为什么?
4•如果有两种可供选择的措施以提高机电行业销售额,措施a提高汽车产量,措施b
增大建筑业产值,你认为哪个措施效果更明显?
为什么?
参考答案
一、填空题
1.零均值,同方差,无自相关,解释变量与随机误差项相互独立(或者解释变量为非随机变量)
2.随机误差项,残差
3.e2八(Y—Y)2八(Y_b。
fX)2
4.有效性或者方差最小性
5.线性,无偏性,有效性
6.提高样本观测值的分散度,增大样本容量,提高模型的拟合优度
7.被解释变量观测值与其均值,被解释变量其估计值与其均值,被解释变量观测值与其估计值
8.模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立
9.检验引入模型中的各个解释变量是否有解释能力。
、单选题
1.B;
2.D;
3.B;
4.C;
5.A;
6.B;
7.B;8.A;9.B
10.B;
11.D;
12.D;
13.D;
14.A;
15.C;
16.A;17.A;18.A
三、多选题
1.BEFHJ;2.
BC;
3.BC;
4.
BC;5.
AD;6.G;ABCG;G;E
四、简答题
1.答:
相关分析(Correlation):
是分析研究两个及两个以上变量间关系密切程度的统计方法,由定性分析(相关图)和定量分析(相关系数)来观察。
在相关分析中,各变量的
地位是平等的。
相关分析是进行回归分析的前提。
定性分析指观察相关图以判断变量之间相
关的数学形式(直线相关、曲线相关)、相关的性质(正相关、负相关、无关)和相关关系的密切程度。
定量分析则通过计算简单相关系数对这种关系的密切程度和性质加以量化。
2.答:
相关图(Correlationgraph)是将两个变量的统计数据在平面直角坐标中绘制散
点图,来观察变量之间的相关关系。
由相关图可以定性判断变量之间关系的密切程度、相关的数学形式、相关的性质。
3.答:
相关系数(Correlationcoefficient):
相关系数是对两个变量间相关关系的密切程度进行数量刻划的统计量。
一般用r来表示,取值范围在-1~1之间,r为正值,变量间为
正相关关系。
r为负值,变量间为负相关关系。
r的绝对值越大,变量间的相关程度越高,
反之,则越低。
r的计算方法有多种。
4•答:
(1)零均值,等方差,无自相关,解释变量与随机误差项相互独立(或者解释变量为非随机变量)
2
b-u
b12
'x
Ve
(3)线性性,无偏性,有效性;(4)sj:
n—2
5.答:
从数学角度,引入随机误差项,将变量之间的关系用一个线性随机方程来描述,
用随机数学的方法来估计方程中的参数;从经济学角度,客观经济现象是十分复杂的,是很
难用有限个变量、某一种确定的形式来描述的,这就是设臵随机误差项的原因。
6.答:
直接臵换法、对数变换法和级数展开法。
7•答:
最小二乘法的基本原理是当从模型总体随机抽取n组样本观测值后,最合理的
参数估计量应该使得模型能最好地拟合样本数据。
最大或然法的基本原理是当从模型总体随
机抽取n组样本观测值后,最合理的参数估计量应该使得从模型中抽取该n组样本观测值的
概率最大。
&答:
所谓—I小样本容量II,即从最小二乘原理和最大或然原理出发,欲得到参数估计量,不管其质量如何,所要求的样本容量的下限。
样本容量必须不少于模型中解释变量的
数目(包括常数项)。
即n>k+1。
虽然当n》k+1时可以得到参数估计量,但除了参数估计量质量不好以外,一些建立模型所必须的后续工作也无法进行。
一般经验认为,当n》30或
者至少n》3(k+1时,才能说满足模型估计的基本要求。
9.答:
区别:
它们是从不同原理出发的两类检验。
拟合优度检验是从已经得到估计的
模型出发,检验它对样本观测值的拟合程度,方程显著性检验是从样本观测值出发检验模型
总体线性关系的显著性。
联系:
模型对样本观测值的拟合程度高,模型总体线性关系的显著
性就强。
10.答:
(1)增大样本容量n;
(2)提高模型的拟合优度,减少残差平方和;(3)提高样本观测值的分散度。