财务知识计量经济学第三章经典单方程计量经济学模型多元线性回归模型最全版.docx

资源描述

财务知识计量经济学第三章经典单方程计量经济学模型多元线性回归模型最全版.docx

《财务知识计量经济学第三章经典单方程计量经济学模型多元线性回归模型最全版.docx》由会员分享，可在线阅读，更多相关《财务知识计量经济学第三章经典单方程计量经济学模型多元线性回归模型最全版.docx（15页珍藏版）》请在冰豆网上搜索。

财务知识计量经济学第三章经典单方程计量经济学模型多元线性回归模型最全版.docx

财务知识计量经济学第三章经典单方程计量经济学模型多元线性回归模型最全版

（财务知识）计量经济学第三章、经典单方程计量经济学模型多元线性回归模型

第三章、经典单方程计量经济学模型：

多元线性回归模型

壹、内容提要

本章将壹元回归模型拓展到了多元回归模型，其基本的建模思想和建模方法和壹元的情形相同。

主要内容仍然包括模型的基本假定、模型的估计、模型的检验以及模型在预测方面的应用等方面。

只不过为了多元建模的需要，在基本假设方面以及检验方面有所扩充。

本章仍重点介绍了多元线性回归模型的基本假设、估计方法以及检验程序。

和壹元回归分析相比，多元回归分析的基本假设中引入了多个解释变量间不存在（完全）多重共线性这壹假设；在检验部分，壹方面引入了修正的可决系数，另壹方面引入了对多个解释变量是否对被解释变量有显著线性影响关系的联合性F检验，且讨论了F检验和拟合优度检验的内在联系。

本章的另壹个重点是将线性回归模型拓展到非线性回归模型，主要学习非线性模型如何转化为线性回归模型的常见类型和方法。

这里需要注意各回归参数的具体经济含义。

本章第三个学习重点是关于模型的约束性检验问题，包括参数的线性约束和非线性约束检验。

参数的线性约束检验包括对参数线性约束的检验、对模型增加或减少解释变量的检验以及参数的稳定性检验三方面的内容，其中参数稳定性检验又包括邹氏参数稳定性检验和邹氏预测检验俩种类型的检验。

检验都是以F检验为主要检验工具，以受约束模型和无约束模型是否有显著差异为检验基点。

参数的非线性约束检验主要包括最大似然比检验、沃尔德检验和拉格朗日乘数检验。

它们仍以估计无约束模型和受约束模型为基础，但以最大似然原理进行估计，且都适用于大样本情形，都以约束条件个数为自由度的分布为检验统计量的分布特征。

非线性约束检验中的拉格朗日乘数检验在后面的章节中多次使用。

二、典型例题分析

例1．某地区通过壹个样本容量为722的调查数据得到劳动力受教育的壹个回归方程为

R2=0.214

式中，edu为劳动力受教育年数，sibs为该劳动力家庭中兄弟姐妹的个数，medu和fedu分别为母亲和父亲受到教育的年数。

问

（1）sibs是否具有预期的影响？

为什么？

若medu和fedu保持不变，为了使预测的受教育水平减少壹年，需要sibs增加多少？

（2）请对medu的系数给予适当的解释。

（3）如果俩个劳动力都没有兄弟姐妹，但其中壹个的父母受教育的年数为12年，另壹个的父母受教育的年数为16年，则俩人受教育的年数预期相差多少？

解答：

（1）预期sibs对劳动者受教育的年数有影响。

因此在收入及支出预算约束壹定的条件下，子女越多的家庭，每个孩子接受教育的时间会越短。

根据多元回归模型偏回归系数的含义，sibs前的参数估计值-0.094表明，在其他条件不变的情况下，每增加1个兄弟姐妹，受教育年数会减少0.094年，因此，要减少1年受教育的时间，兄弟姐妹需增加1/0.094=10.6个。

（2）medu的系数表示当兄弟姐妹数和父亲受教育的年数保持不变时，母亲每增加1年受教育的机会，其子女作为劳动者就会预期增加0.131年的教育机会。

（3）首先计算俩人受教育的年数分别为

10.36+0.13112+0.21012=14.452

10.36+0.13116+0.21016=15.816

因此，俩人的受教育年限的差别为15.816-14.452=1.364

例2．以企业研发支出（R&D）占销售额的比重为被解释变量（Y），以企业销售额（X1）和利润占销售额的比重（X2）为解释变量，壹个有32容量的样本企业的估计结果如下：

其中括号中为系数估计值的标准差。

（1）解释log（X1）的系数。

如果X1增加10%，估计Y会变化多少个百分点？

这在经济上是壹个很大的影响吗？

（2）针对R&D强度随销售额的增加而提高这壹备择假设，检验它不虽X1而变化的假设。

分别在5%和10%的显著性水平上进行这个检验。

（3）利润占销售额的比重X2对R&D强度Y是否在统计上有显著的影响？

解答：

（1）log（x1）的系数表明在其他条件不变时，log（x1）变化1个单位，Y变化的单位数，即Y=0.32log（X1）0.32（X1/X1）=0.32100%，换言之，当企业销售X1增长100%时，企业研发支出占销售额的比重Y会增加0.32个百分点。

由此，如果X1增加10%，Y会增加0.032个百分点。

这在经济上不是壹个较大的影响。

（2）针对备择假设H1：

，检验原假设H0：

。

易知计算的t统计量的值为t=0.32/0.22=1.468。

在5%的显著性水平下，自由度为32-3=29的t分布的临界值为1.699（单侧），计算的t值小于该临界值，所以不拒绝原假设。

意味着R&D强度不随销售额的增加而变化。

在10%的显著性水平下，t分布的临界值为1.311，计算的t值小于该值，拒绝原假设，意味着R&D强度随销售额的增加而增加。

（3）对X2，参数估计值的t统计值为0.05/0.46=1.087，它比在10%的显著性水平下的临界值仍小，因此能够认为它对Y在统计上没有显著的影响。

例3．下表为有关经批准的私人住房单位及其决定因素的4个模型的估计量和相关统计值（括号内为p-值）（如果某项为空，则意味着模型中没有此变量）。

数据为美国40个城市的数据。

模型如下：

式中housing——实际颁发的建筑许可证数量，density——每平方英里的人口密度，value——自由房屋的均值（单位：

百美元），income——平均家庭的收入（单位：

千美元），popchang——1980~1992年的人口增长百分比，unemp——失业率，localtax——人均交纳的地方税，statetax——人均缴纳的州税

变量

模型A

模型B

模型C

模型D

813（0.74）

-392（0.81）

-1279（0.34）

-973（0.44）

Density

0.075（0.43）

0.062（0.32）

0.042（0.47）

Value

-0.855（0.13）

-0.873（0.11）

-0.994（0.06）

-0.778（0.07）

Income

110.41（0.14）

133.03（0.04）

125.71（0.05）

116.60（0.06）

Popchang

26.77（0.11）

29.19（0.06）

29.41（0.001）

24.86（0.08）

Unemp

-76.55（0.48）

Localtax

-0.061（0.95）

Statetax

-1.006（0.40）

-1.004（0.37）

RSS

4.763e+7

4.843e+7

4.962e+7

5.038e+7

0.349

0.338

0.322

0.312

1.488e+6

1.424e+6

1.418e+6

1.399e+6

AIC

1.776e+6

1.634e+6

1.593e+6

1.538e+6

（1）检验模型A中的每壹个回归系数在10%水平下是否为零（括号中的值为双边备择p-值）。

根据检验结果，你认为应该把变量保留在模型中仍是去掉？

（2）在模型A中，在10%水平下检验联合假设H0：

i=0（i=1,5,6,7）。

说明被择假设，计算检验统计值，说明其在零假设条件下的分布，拒绝或接受零假设的标准。

说明你的结论。

（3）哪个模型是“最优的”？

解释你的选择标准。

（4）说明最优模型中有哪些系数的符号是“错误的”。

说明你的预期符号且解释原因。

确认其是否为正确符号。

解答：

（1）直接给出了P-值，所以没有必要计算t-统计值以及查t分布表。

根据题意，如果p-值<0.10,则我们拒绝参数为零的原假设。

由于表中所有参数的p-值都超过了10%，所以没有系数是显著不为零的。

但由此去掉所有解释变量，则会得到非常奇怪的结果。

其实正如我们所知道的，多元回去归中在省略变量时壹定要谨慎，要有所选择。

本例中，value、income、popchang的p-值仅比0.1稍大壹点，在略掉unemp、localtax、statetax的模型C中，这些变量的系数都是显著的。

（2）针对联合假设H0：

i=0（i=1,5,6,7）的备择假设为H1：

i=0（i=1,5,6,7）中至少有壹个不为零。

检验假设H0，实际上就是参数的约束性检验，非约束模型为模型A，约束模型为模型D，检验统计值为

显然，在H0假设下，上述统计量满足F分布，在10%的显著性水平下，自由度为（4，32）的F分布的临界值位于2.09和2.14之间。

显然，计算的F值小于临界值，我们不能拒绝H0，所以βi（i=1,5,6,7）是联合不显著的。

（3）模型D中的3个解释变量全部通过显著性检验。

尽管R2和残差平方和较大，但相对来说其AIC值最低，所以我们选择该模型为最优的模型。

（4）随着收入的增加，我们预期住房需要会随之增加。

所以能够预期β3>0，事实上其估计值确是大于零的。

同样地，随着人口的增加，住房需求也会随之增加，所以我们预期β4>0，事实其估计值也是如此。

随着房屋价格的上升，我们预期对住房的需求人数减少，即我们预期β3估计值的符号为负，回归结果和直觉相符。

出乎预料的是，地方税和州税为不显著的。

由于税收的增加将使可支配收入降低，所以我们预期住房的需求将下降。

虽然模型A是这种情况，但它们的影响却非常微弱。

4、在经典线性模型基本假定下，对含有三个自变量的多元回归模型：

你想检验的虚拟假设是H0：

。

（1）用的方差及其协方差求出。

（2）写出检验H0：

的t统计量。

（3）如果定义，写出壹个涉及0、、2和3的回归方程，以便能直接得到估计值及其标准误。

解答：

（1）由数理统计学知识易知

（2）由数理统计学知识易知

，其中为的标准差。

（3）由知，代入原模型得

这就是所需的模型，其中估计值及其标准误都能通过对该模型进行估计得到。

三、习题

（壹）基本知识类题型

3-1．解释下列概念：

1）多元线性回归

2）虚变量

3）正规方程组

4）无偏性

5）壹致性

6）参数估计量的置信区间

7）被解释变量预测值的置信区间

8）受约束回归

9）无约束回归

10）参数稳定性检验

3-2．观察下列方程且判断其变量是否呈线性？

系数是否呈线性？

或都是？

或都不是？

3-3．多元线性回归模型和壹元线性回归模型有哪些区别？

3-4．为什么说最小二乘估计量是最优的线性无偏估计量？

多元线性回归最小二乘估计的正规方程组，能解出唯壹的参数估计的条件是什么？

3-5．多元线性回归模型的基本假设是什么？

试说明在证明最小二乘估计量的无偏性和有效性的过程中，哪些基本假设起了作用？

3-6．请说明区间估计的含义。

（二）基本证明和问答类题型

3-7．什么是正规方程组？

分别用非矩阵形式和矩阵形式写出模型：

，的正规方程组，及其推导过程。

3-8．对于多元线性回归模型，证明：

（1）

（2）

3-9．为什么从计量经济学模型得到的预测值不是壹个确定的值？

预测值的置信区间和置信度的含义是什么？

在相同的置信度下如何才能缩小置信区间？

为什么？

3-10．在多元线性回归分析中，检验和检验有何不同？

在壹元线性回归分析中二者是否有等价的作用？

3-11．设有模型：

，试在下列条件下：

（1）

（2）

分别求出和的最小二乘估计量。

3-12．多元线性计量经济学模型

1,2,…,n（2.11.1）

的矩阵形式是什么？

其中每个矩阵的含义是什么？

熟练地写出用矩阵表示的该模型的普通最小二乘参数估计量，且证明在满足基本假设的情况下该普通最小二乘参数估计量是无偏和有效的估计量。

3-13．有如下生产函数：

（0.257）（0.219）

其中括号内数值为参数标准差。

请检验以下零假设：

（1）产出量的资本弹性和劳动弹性是等同的；

（2）存在不变规模收益，即。

3-14．对模型应用OLS法，得到回归方程如下：

要求：

证明残差和不相关，即：

。

3-15．

3-16．考虑下列俩个模型：

Ⅰ、

Ⅱ、

要求：

（1）证明：

，，

（2）证明：

残差的最小二乘估计量相同，即：

（3）在何种情况下，模型Ⅱ的拟合优度会小于模型Ⅰ拟合优度。

3-17．假设要求你建立壹个计量经济模型来说明在学校跑道上慢跑壹英里或壹英里之上的人数，以便决定是否修建第二条跑道以满足所有的锻炼者。

你通过整个学年收集数据，得到俩个可能的解释性方程：

方程A：

方程B：

其中：

——某天慢跑者的人数

——该天降雨的英寸数

——该天日照的小时数

——该天的最高温度（按华氏温度）

——第二天需交学期论文的班级数

请回答下列问题：

（1）这俩个方程你认为哪个更合理些，为什么？

（2）为什么用相同的数据去估计相同变量的系数得到不同的符号？

3-18．对下列模型：

（1）

（2）

求出β的最小二乘估计值；且将结果和下面的三变量回归方程的最小二乘估计值作比较：

（3），你认为哪壹个估计值更好？

3-19．假定以校园内食堂每天卖出的盒饭数量作为被解释变量，盒饭价格、气温、附近餐厅的盒饭价格、学校当日的学生数量（单位：

千人）作为解释变量，进行回归分析；假设不管是否有假期，食堂都营业。

不幸的是，食堂内的计算机被壹次病毒侵犯，所有的存储丢失，无法恢复，你不能说出独立变量分别代表着哪壹项！

下面是回归结果（括号内为标准差）：

（2.6）（6.3）（0.61）（5.9）

要求：

（1）试判定每项结果对应着哪壹个变量？

（2）对你的判定结论做出说明。

（三）基本计算类题型

3-20．试对二元线性回归模型：

，（）作回归分析，要求：

（1）求出未知参数的最小二乘估计量；

（2）求出随机误差项的方差的无偏估计量；

（3）对样本回归方程作拟合优度检验；

（4）对总体回归方程的显著性进行检验；

（5）对的显著性进行检验；

（6）当时，写出和Y0的置信度为95%的预测区间。

3-21．下表给出三变量模型的回归结果：

方差来源

平方和（SS）

自由度（d.f.）

平方和的均值（MSS）

来自回归（ESS）

65965

—

来自残差（RSS）

_—

—

总离差（TSS）

66042

要求：

（1）样本容量是多少？

（2）求RSS？

（3）ESS和RSS的自由度各是多少？

（4）求和？

（5）检验假设：

和对无影响。

你用什么假设检验？

为什么？

（6）根据之上信息，你能否确定和各自对的贡献吗？

3-22．下面给出依据15个观察值计算得到的数据：

，，，

，，

，

其中小写字母代表了各值和其样本均值的离差。

要求：

（1）估计三个多元回归系数；

（2）估计它们的标准差；且求出和？

（3）估计、95%的置信区间；

（4）在下，检验估计的每个回归系数的统计显著性（双边检验）；

（5）检验在下所有的部分系数都为零，且给出方差分析表。

3-23．考虑以下方程（括号内为估计标准差）：

（0.080）（0.072）（0.658）

其中：

——年的每位雇员的工资和薪水

——年的物价水平

——年的失业率

要求：

（1）对个人收入估计的斜率系数进行假设检验；（尽量在做本题之前不参考结果）

（2）讨论在理论上的正确性，对本模型的正确性进行讨论；是否应从方程中删除？

为什么？

3-24．下表是某种商品的需求量、价格和消费者收入十年的时间序列资料：

年份

需求量（吨）Y

59190

65450

62360

64700

67400

64440

68000

72400

75710

70680

价格（元）X1

23.56

24.44

32.07

32.46

31.15

34.14

35.30

38.70

39.63

46.68

收入（元）X2

76200

91200

106700

111600

119000

129200

143400

159600

180000

193000

要求：

（1）已知商品需求量是其价格和消费者收入的函数，试求对和的最小二乘回归方程：

（2）求的总变差中未被和解释的部分，且对回归方程进行显著性检验；

（3）对回归参数，进行显著性检验。

3-25．参考习题2-28给出的数据，要求：

（1）建立壹个多元回归模型，解释MBA毕业生的平均初职工资，且且求出回归结果；

（2）如果模型中包括了GPA和GMAT分数这俩个解释变量，先验地，你可能会遇到什么问题，为什么？

（3）如果学费这壹变量的系数为正、且且在统计上是显著的，是否表示进入最昂贵的商业学校是值得的。

学费这个变量可用什么来代替？

3-26．经研究发现，学生用于购买书籍及课外读物的支出和本人受教育年限和其家庭收入水平有关，对18名学生进行调查的统计资料如下表所示：

学生序号

购买书籍及课外读物支出（元/年）

受教育年限（年）

家庭月可支配收入（元/月）

450.5

171.2

507.7

174.2

613.9

204.3

563.4

218.7

501.5

219.4

781.5

240.4

541.8

273.5

611.1

294.8

1222.1

330.2

793.2

333.1

660.8

366.0

792.7

350.9

580.8

357.9

612.7

359.0

890.8

371.9

1121.0

435.3

1094.2

523.9

1253.0

604.1

要求：

（1）试求出学生购买书籍及课外读物的支出和受教育年限和家庭收入水平的估计的回归方程：

（2）对的显著性进行t检验；计算和；

（3）假设有壹学生的受教育年限年，家庭收入水平，试预测该学生全年购买书籍及课外读物的支出，且求出相应的预测区间（α=0.05）。

3-27．根据100对（，）的观察值计算出：

要求：

（1）求出壹元模型中的的最小二乘估计量及其相应的标准差估计量；

（2）后来发现仍受的影响，于是将壹元模型改为二元模型，收集的相应观察值且计算出：

求二元模型中的，的最小二乘估计量及其相应的标准差估计量；

（3）壹元模型中的和二元模型中的是否相等？

为什么？

3-28．考虑以下预测的回归方程：

其中：

——第t年的玉米产量（蒲式耳/亩）

——第t年的施肥强度（磅/亩）

——第t年的降雨量（英寸）

要求回答下列问题：

（1）从和对的影响方面，说出本方程中系数和的含义；

（2）常数项是否意味着玉米的负产量可能存在？

（3）假定的真实值为，则估计值是否有偏？

为什么？

（4）假定该方程且不满足所有的古典模型假设，即且不是最佳线性无偏估计值，则是否意味着的真实值绝对不等于？

为什么？

3-29．已知线性回归模型式中（0，），且（为样本容量，为参数的个数），由二次型的最小化得到如下线性方程组：

要求：

（1）把问题写成矩阵向量的形式；用求逆矩阵的方法求解之；

（2）如果，求；

（3）求出的方差—协方差矩阵。

3-30．已知数据如下表：

-6

要求：

（1）先根据表中数据估计以下回归模型的方程（只估计参数不用估计标准差）：

（2）回答下列问题：

吗？

为什么？

吗？

为什么？

（四）自我综合练习类题型

3-31．自己选择研究对象（最好是壹个实际经济问题），收集样本数据，应用计量经济学软件（建议使用Eviews3.1），完成建立多元线性计量经济模型的全过程，且写出详细研究报告。

四、习题参考答案

（壹）基本知识类题型

3-1．解释下列概念

（1）在现实经济活动中往往存在壹个被解释变量受到多个解释变量的影响的现象，表现为在线性回归模型中有多个解释变量，这样的模型被称为多元线性回归模型，多元指多个解释变量。

（2）形如的关于参数估计值的线性代数方程组称为正规方程组。

3-2．答：

变量非线性、系数线性；变量、系数均线性；变量、系数均线性；变量线性、系数非线性；变量、系数均为非线性；变量、系数均为非线性；变量、系数均为线性。

3-3．答：

多元线性回归模型和壹元线性回归模型的区别表当下如下几方面：

壹是解释变量的个数不同；二是模型的经典假设不同，多元线性回归模型比壹元线性回归模型多了“解释变量之间不存在线性相关关系”的假定；三是多元线性回归模型的参数估计式的表达更复杂；

3-4．在多元线性回归模型中，参数的最小二乘估计量具备线性、无偏性、最小方差性，同时多元线性回归模型满足经典假定，所以此时的最小二乘估计量是最优的线性无偏估计量，又称BLUE估计量。

对于多元线性回归最小二乘估计的正规方程组，

3-5．答：

多元线性回归模型的基本假定有：

零均值假定、随机项独立同方差假定、解释变量的非随机性假定、解释变量之间不存在线性相关关系假定、随机误差项服从均值为0方差为的正态分布假定。

在证明最小二乘估计量的无偏性中，利用了解释变量和随机误差项不相关的假定；在有效性的证明中，利用了随机项独立同方差假定。

3-6．答：

区间估计是指研究用未知参数的点估计值（从壹组样本观测值算得的）作为近似值的精确程度和误差范围。

（二）基本证明和问答类题型

3-7．答：

含有待估关系估计量的方程组称为正规方程组。

正规方程组的非矩阵形式如下：

正规方程组的矩阵形式如下：

推导过程略。

3-16．解：

（1）证明：

由参数估计公式可得下列参数估计值

证毕。

⑵证明：

证毕。

⑶设：

I式的拟合优度为：

II式的拟合优度为：

在⑵中已经证得成立，即二式分子相同，若要模型II的拟合优度小于模型I的拟合优度，必须满足：

。

3-17．答：

⑴方程B更合理些。

原因是：

方程B中的参数估计值的符号和现实更接近些，如和日照的小时数同向变化，天长则慢跑的人会多些；和第二天需交学期论文的班级数成反向变化，这壹点在学校的跑道模型中是壹个合理的解释变量。

⑵解释变量的系数表明该变量的单位变化在方程中其他解释变量不变的条件下对被解释变量的影响，在方程A和方程B中由于选择了不同的解释变量，如方程A选择的是“该天的最高温度”而方程B选择的是“第二天需交学期论文的班级数”，由此造成和这俩个变量之间的关系不同，所以用相同的数据估计相同的变量得到不同的符号。

3-18．答：

将模型⑴改写成，则的估计值为：

将模型⑵改写成，则的估计值为：

这俩个模型都是三变量回归模型⑶在某种限制条件下的变形。

如果限制条件正确，则前俩个回归参数会更有效；如果限制条件不正确则前俩个回归参数会有偏。

3-19．答：

⑴答案且不唯壹，猜测为：

为学生数量，为附近餐厅的盒饭价格，为气温，为校园内食堂的盒饭价格；

⑵理由是被解释变量应和学生数量成正比，且且应该影响显著；和本食堂盒饭价格成反比，这和需求理论相吻合；和附近餐厅的盒饭价格成正比，因为彼此是替代品；和气温的变化关系不是十分显著，因为大多数学生不会因为气温升高不吃饭。

（三）基本计算类题型

3-22．解：

⑴

⑵

其中：

同理，可得：

，

拟合优度为：

⑶

展开阅读全文