回归习题二多元线性回归模型.docx

上传人:b****2 文档编号:23101087 上传时间:2023-04-30 格式:DOCX 页数:11 大小:25.91KB
下载 相关 举报
回归习题二多元线性回归模型.docx_第1页
第1页 / 共11页
回归习题二多元线性回归模型.docx_第2页
第2页 / 共11页
回归习题二多元线性回归模型.docx_第3页
第3页 / 共11页
回归习题二多元线性回归模型.docx_第4页
第4页 / 共11页
回归习题二多元线性回归模型.docx_第5页
第5页 / 共11页
点击查看更多>>
下载资源
资源描述

回归习题二多元线性回归模型.docx

《回归习题二多元线性回归模型.docx》由会员分享,可在线阅读,更多相关《回归习题二多元线性回归模型.docx(11页珍藏版)》请在冰豆网上搜索。

回归习题二多元线性回归模型.docx

回归习题二多元线性回归模型

回归习题二:

多元线性回归模型

1、某地区通过一个样本容量为722的调查数据得到劳动力受教育的一个回归方程为

Y10.360.094Xi0.131X20.210X3

R20.214

其中,丫为劳动力受教育的年数,X1为劳动力家庭中兄弟姐妹的人数,X2和X3分别为母亲和父亲受教育的年数。

问:

(1)X1是否具有预期的影响?

为什么?

若X2和X3保持不变,为了使预测的受教育水平减少一年,需要X1增加多少?

(2)请对X2的系数给予适当的解释。

(3)如果两个劳动力都没有兄弟姐妹,但其中一个的父母受教育的年数为12年,另一个父母受教育的年数为16年,则两人受教育的年数预期相差多少?

2、以企业研发支出(R&D)占销售额的比重为被解释变量Y,以企业销售额X1和利润占销售额的比重X2为解释变量,一个容量为32的样本企业的估计结果如下:

Y0.4720.32logX10.05X2

(1.37)(0.22)(0.046)

R20.099

其中括号中为系数估计值和标准差。

(1)解释logX1的系数。

如果X1增加10%,估计丫会变化多少个百分点?

这在经济上是一个很大的影响吗?

(2)针对R&D强度随着销售额的增加而提高这一备择假设,检验

它不随着X1而变化的假设。

分别在5%和10%的显著性水平

上进行这个检验。

(3)利润占销售额的比重X2对R&D强度Y是否在统计上有显著的影响。

3、下表为有关经批准的私人住房单位及其决定因素的4个模型的估计量和相关统计值(括号内为p值,即以对应的t统计量为临界值的置性度a)(如果某项为空,则意味着模型中没有此变量)。

数据为美国40个城市的数据。

模型如下:

其中,Y为实际颁发的建筑许可证数量,X1为每平方英里的人口密度,X2为自有房屋的均值(单位:

百美元),X3为平均家庭的收入

(单位:

千美元),X4为1980~1992年的人口增长百分比,X5为失

业率,X6为人均交纳的地方税,X7为人均交纳的州税。

变量

模型A

模型B

模型C

模型D

C

813(0.74)

-392(0.81)

-1279(0.34)

-973(0.44)

X1

0.075(0.43)

0.062(0.32)

0.042(0.47)

X2

-0.855(0.13)

-0.873(0.11)

-0.994(0.06)

-0.778(0.07)

X3

110.41(0.14)

133.03(0.04)

125.71(0.05)

116.60(0.06)

X4

26.77(0.11)

29.19(0.06)

29.41(0.001)

24.86(0.08)

X5

-76.55(0.48)

X6

-0.061(0.95)

X7

-1.006(0.40)

-1.004(0.37)

RSS

4.763X107

4.843X107

4.962X107

5.038X107

R2

0.349

0.338

0.322

0.312

?

2

1.488X106

1.424X106

1.418X106

1.399X106

AIC

1.766X106

1.634X106

1.593X106

1.538X106

(1)检验模型A中的每一个回归系数在10%水平下是否为零(括号中的值为p值)。

根据检验的结果,你认为应该把变量保留在模型中还是去掉?

(2)在模型A中,在10%水平下检验联合假设H0:

(3=0(i=1,5,6,7)。

说明备择假设,计算检验统计值,说明其在零假设条件下的分

布,拒绝或接受零假设的标准,说明你的结论。

(3)哪个模型是“最优”的?

解释你的选择标准。

(4)说明最优模型中哪些系数的符号是“错误的”。

说明你的预期符号并解释原因。

确认其是否为正确的符号。

4、中国财政收入(Y)主要来自税收项(T)与其他收入项(0),下表列出了1985~2000年这三项数据的资料。

请对中国财政收入关于税收与其他收入作二元线性回归分析。

(1)估计回归方程的参数及随机干扰项的方差?

2,计算R2及调整

R2。

(2)对方程进行F检验,对参数进行t检验,并构造参数95%的置信区间。

5、多元线性回归模型的基本假设是什么?

试说明在证明最小二

乘估计量的无偏性和有效性的过程中,哪些基本假设起了作用?

6、在多兀线性回归分析中,t检验和F检验有何不同?

在一兀线

性回归分析中二者是否有等价的作用?

7、在一项调查大学生一学期平均成绩(Y)与每周在学习(X1)、

睡觉(X2)、娱乐(X3)与其他各种活动(X4)所用时间的关系的研究中,建立如下回归模型:

Y01X12X23X34X4

如果这些活动所用的时间的总和为一周的总小时数168。

问:

持其他变量不变,而改变其中一个变量的说法是否有意义?

该模型是否有违背基本假设的情况?

如何修改此模型以使其更加合理?

&下表给出三变量模型的回归结果。

方差来源

平方和(SS)

自由度(df)

平方和的均值

(MSS)

来自回归(ESS)

65965

来自残差(RSS)

来自总离差(TSS)

66042

14

(1)求样本容量n,残差平方和RSS,回归平方和ESS及残差平方

和RSS的自由度。

(2)求拟和优度R2及调整的拟和优度R2。

(3)检验假设:

X2和X3对Y无影响。

应米用什么假设检验?

为什么?

(4)根据以上信息,你能否确定X2和X3各自对Y的影响?

9、在一项对社区家庭的对某种消费品的消费需要调查中,得到下表资料。

请对该摄取家庭对该商品的消费需求支出作二元线性回归分

对某商品

商品单

家庭月

对某商品

商品单

家庭月

的消费支

价X1

收入

的消费支

价X1

收入

出Y

X2

出Y

X2

1

591.9

23.56

7620

6

644.4

34.14

12920

2

654.5

24.4

9120

7

680.0

35.30

14340

3

623.6

32.07

10670

8

724.0

38.70

15960

4

647.0

32.46

11160

9

757.1

39.63

18000

5

674.0

31.15

11900

10

706.8

46.68

19300

(1)估计回归方程的参数及随机干扰项的方差?

2,计算R2及调整

R2。

(2)对方程进行F检验,对参数进行t检验,并构造参数95%的置信区间。

(3)如果商品单价变为35元,则某一月收入为20000元的家庭对其的消费支出估计是多少?

构造该估计值的95%的置信区间。

10、下表列出了中国2000年按行业分的全部制造业国有企业及规模以上制造业非国有企业的工业总产值Y,资产合计K及职工人数L。

设定模型为

YAKLe

(1)利用上述资料,进行回归分析。

(2)回答:

中国2000年的制造业总体呈现规模不变状态吗?

工业总产

资产合

职工

工业总产

资产合

职工

值Y/亿元

计K/亿

人数

值Y/亿元

计K/亿

人数

L/万

L/万

1

3722.7

3078.22

113

17

812.7

1118.81

43

2

1442.52

1684.43

67

18

1899.7

2052.16

61

3

1752.37

2742.77

84

19

3692.85

6113.11

240

4

1451.29

1973.82

27

20

4732.90

9228.25

222

5

5149.30

5917.01

327

21

2180.23

2866.65

80

6

2291.16

1758.77

120

22

2539.76

2545.63

96

7

1345.17

939.10

58

23

3046.95

4787.90

222

8

656.77

694.94

31

24

2192.63

3255.29

163

9

370.18

363.48

16

25

5364.83

8129.68

244

10

1590.36

2511.99

66

26

4834.68

5260.20

145

11

616.71

973.73

58

27

7549.58

7518.79

138

12

617.94

516.01

28

28

867.91

984.52

46

13

4429.19

3785.91

61

29

4611.39

18624.94

218

14

5749.02

8688.03

254

30

170.30

610.91

19

15

1781.37

2798.90

83

31

325.53

1523.19

45

16

1243.07

1808.44

33

11、观察下列方程并判断其变量是否呈线性?

系数是否呈线性?

或都

是?

或都不是?

(1)Y0iX3

(2)

YoJogXji

(3)

logYo1logXi

(4)

Y01(2Xi)i

(5)

Y0

i1Xii

(6)

Y10(1Xi1)i

(7)

YXX2i

Y01X1i210

12、多元线性回归模型与一元线性回归模型有哪些区别?

13、请说明区间估计的含义。

14、为什么从计量经济学模型得到的预测值不是一个确定的值?

预测值的置信区间和置信度的含义是什么?

在相同的置信度下如何才能缩小置信区间?

15、假设要求你建立一个计量经济学模型来说明在学校跑道上慢跑半小时或半小时以上的人数,以便决定是否修建第二条跑道以满足所有的锻炼者。

你通过整个学年收集数据,得到两个可能的解释性方程:

(a)Y?

125.015.0X11.0X21.5X3,R20.75

(b)Y?

123.014.0X15.5X23.7X4,R20.73

其中,Y为每天慢跑者的人数,X1为该天的降雨量(单位:

毫米)

X2为该天的日照时间(单位:

小时),X3为该天的最高温度(单位:

华氏温度),X4为第二天需交学期论文的班级数。

请回答下列问题:

(1)这两个方程你认为哪个更合理些,为什么?

(2)为什么用相同的数据去估计相同变量的系数却得到了不同的符号?

16、有人以校园内食堂每天卖出的盒饭数量作为被解释变量,以盒饭的价格、气温、附近餐厅的盒饭价格、学校当日的学生数量作为被解释变量,进行回归分析。

假设你看到如下的回归结果,但并不知道各解释变量是哪一项,试判定每项结果对应着哪一个变量,说明理由。

Y?

10.628.4Xii12.7X2i0.61X3i5.9X4i

(2.6)(6.3)(0.61)(5.9)

R20.63,n35

17、下面给出依据15个观测值计算得到的数据:

Y367.693,X402.76X?

8.0

y266042269,x"84855.096,x2280.0

yix1i74778.346,yix2i4250.9,x1ix2i4796.0

其中,小写字母代表了各值与其样本均值的离差。

(1)估计①,B1,32三个多元回归系数,求出R2与调整R2。

(2)求?

,的标准差,并估计(31,超在95%置信度下的置信区间。

(3)在显著性水平a=5%下,检验估计的每个回归系数的统计显著性。

(4)在a=5%下检验假设:

所有参数都为零。

18、一个关于个人收入与物价水平及失业率的关系的回归方程如下。

W?

8.5620.364Pt0.004Ft12.560Ut

(0.080)(0.072)(0.658)

n19,R20.873

其中,W为第t年的每位雇员的工资和薪水,F为第t年的物价水平,U为第t年的失业率。

(1)对个人收入估计的斜率系数进行假设检验。

(2)讨论Ft-1在理论上的正确性,对本模型的正确性进行讨论。

Ft-1

是否应从方程中删除,为什么?

19、参考双变量回归习题18中给出的数据。

(1)建立一个多元回归模型,解释MBA毕业生的平均初职工资,并且求出回归结果。

(2)如果模型中包括了GPA分数和GMAT分数这两个解释变量,先验地,你可能会遇到什么问题,为什么?

(3)如果学费这一变量的系数为正,并且在统计上是显著的,是否表示进入最昂贵的商业学校是值得的,学费这个变量可用什么来代替?

20、经研究发现,学生用于购买书籍及课外读物的支出与本人受教育年限和其家庭收入水平有关,对18名学生进行调查的统计资料如下(

学生序

购买书籍及课外读物支出Y(元/年)

受教育年限X1/年

家庭人均可支配

收入X2元/月

1

450.5

4

171.2

2

507.7

4

174.2

3

613.9

5

204.3

4

563.4

4

218.7

5

501.5

4

219.4

6

781.5

7

240.4

7

541.8

4

273.5

8

611.1

5

294.8

9

1222.1

10

330.2

10

793.2

7

333.1

11

660.8

5

366.0

12

792.7

6

350.9

13

580.8

4

357.9

14

612.7

5

359.0

15

890.8

7

371.9

16

1121.0

9

435.3

17

1094.2

8

523.9

18

1253.0

10

604.1

(1)求出学生购买书籍及课外读物的支出Y与受教育年限X1和家庭人均收入X2的回归方程估计式。

(2)对別,超的显著性进行t检验,计算R2与调整R2。

(3)假设有一学生的受教育年限X仁10年,家庭人均收入水平

X2=480元/月,试预测该学生全年购买书籍及课外读物的支出,并求出相应的预测区间(a=5%)

21、根据100对(X1,Y)的观测值计算出

22

x-i12,x1y9,y30

(1)求出一元模型中超的OLS估计量及其相应的标准差的估计量。

(2)后来发现Y还受到X2的影响,收集X2的相应观测值并计算

2

x26,x2y8,x1x22

求二元模型中的超和比的OLS估计量及其相应的标准差的估计量。

(3)一元模型中的?

2与二元模型中的?

2是否相等?

为什么?

22、考虑以下预测的回归方程:

Y?

1200.10R5.33R,R20.50

其中,Yt为第t年的玉米产量(单位:

吨/亩),Ft为第t年的施肥强度(单位:

千克/亩),Rt为第t年的降雨量(单位:

毫米)。

(1)从F和R对Y的影响方面,说明本方程中系数0.1和5.33的含义。

(2)常数项-120是否意味着玉米的负产量可能存在?

(3)假定俨的真实值是0.40,则估计值是否有偏?

为什么?

(4)假定该方程并不满足所有的经典模型假设,即并不是最佳线性

无偏估计值,是否意味着R的真实值绝对不等于5.33?

为什

么?

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 艺术

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1