《应用回归分析》课后题答案解析.docx

上传人:b****1 文档编号:23273416 上传时间:2023-05-15 格式:DOCX 页数:70 大小:151.34KB
下载 相关 举报
《应用回归分析》课后题答案解析.docx_第1页
第1页 / 共70页
《应用回归分析》课后题答案解析.docx_第2页
第2页 / 共70页
《应用回归分析》课后题答案解析.docx_第3页
第3页 / 共70页
《应用回归分析》课后题答案解析.docx_第4页
第4页 / 共70页
《应用回归分析》课后题答案解析.docx_第5页
第5页 / 共70页
点击查看更多>>
下载资源
资源描述

《应用回归分析》课后题答案解析.docx

《《应用回归分析》课后题答案解析.docx》由会员分享,可在线阅读,更多相关《《应用回归分析》课后题答案解析.docx(70页珍藏版)》请在冰豆网上搜索。

《应用回归分析》课后题答案解析.docx

《应用回归分析》课后题答案解析

《应用回归分析》部分课后习题答案

第一章回归分析概述

1.1变量间统计关系和函数关系的区别是什么?

答:

变量间的统计关系是指变量间具有密切关联而又不能由某一个或某一些变量唯一确定另外一个变量的关系,而变量间的函数关系是指由一个变量唯一确定另外一个变量的确定关系。

1.2回归分析与相关分析的联系与区别是什么?

答:

联系有回归分析和相关分析都是研究变量间关系的统计学课题。

区别有a.在回归分析中,变量y称为因变量,处在被解释的特殊地位。

在相关分析中,变量x和变量y处于平等的地位,即研究变量y与变量x的密切程度与研究变量x与变量y的密切程度是一回事。

b.相关分析中所涉及的变量y与变量x全是随机变量。

而在回归分析中,因变量y是随机变量,自变量x可以是随机变量也可以是非随机的确定变量。

C.相关分析的研究主要是为了刻画两类变量间线性相关的密切程度。

而回归分析不仅可以揭示变量x对变量y的影响大小,还可以由回归方程进行预测和控制。

1.3回归模型中随机误差项£的意义是什么?

答:

e为随机误差项,正是由于随机误差项的引入,才将变量间的关系描述为一个随机方程,使得我们可以借助随机数学方法研究y与xl,x2・・・..xp的关系,由于客观经济现象是错综复杂的,一种经济现象很难用有限个因素来准确说明,随机误差项可以概括表示由于人们的认识以及其他客观原因的局限而没有考虑的种种偶然因素。

1.4线性回归模型的基本假设是什么?

答:

线性回归模型的基本假设有:

1.解释变量xl.x2-.xp是非随机的,观测值x订.Xi2・・・・.xip是常数。

2.等方差及不相关的假定条件为{E(ei)=0i二1,2・・・.Cov(ei,ej)={o"2

3.正态分布的假定条件为相互独立。

4.样本容量的个数要多于解释变量的个数,即n>p.

1.5回归变量的设置理论根据是什么?

在回归变量设置时应注意哪些问题?

答:

理论判断某个变量应该作为解释变量,即便是不显著的,如果理论上无法判断那么可以采用统计方法来判断,解释变量和被解释变量存在统计关系。

应注意的问题有:

在选择变量时要注意与一些专门领域的专家合作,不要认为一个回归模型所涉及的变量越多越好,回归变量的确定工作并不能一次完成,需要反复试算,最终找出最合适的一些变量。

1.6收集,整理数据包括哪些容?

答;常用的样本数据分为时间序列数据和横截面数据,因而数据收集的方法主要有按时间顺序统计数据和在同一时间截面上统计数据,在数据的收集中,样本容量的多少一般要与设置的解释变量数目相配套。

而数据的整理不仅要把一些变量数据进行折算差分甚至把数据对数化,标准化等有时还需注意剔除个别特别大或特别小的“野值”。

1.7构造回归理论模型的基本依据是什么?

答:

选择模型的数学形式的主要依据是经济行为理论,根据变量的样本数据作出解释变量与被解释变量之间关系的散点图,并将由散点图显示的变量间的函数关系作为理论模型的数学形式。

对同一问题我们可以采用不同的形式进行计算机模拟,对不同的模拟结果,选择较好的一个作为理论模型。

1.8为什么要对回归模型进行检验?

答:

我们建立回归模型的目的是为了应用它来研究经济问题,但如果马上就用这个模型去预测,控制,分析,显然是不够慎重的,所以我们必须通过检验才能确定这个模型是否真正揭示了被解释变量和解释变量之间的关系。

1.9回归模型有那几个方面的应用?

答:

回归模型的应用方面主要有:

经济变量的因素分析和进行经济预测。

1.10为什么强调运用回归分析研究经济问题要定性分析和定量分析相结合?

答:

在回归模型的运用中,我们还强调定性分析和定量分析相结合。

这是因为数理统计方法只是从事物外在的数量表面上去研究问题,不涉及事物质的规定性,单纯的表面上的数量关系是否反映事物的本质?

这本质究竟如何?

必须依靠专门的学科研究才能下定论,所以,在经济问题的研究中,我们不能仅凭样本数据估计的结果就不加分析地说长道短,必须把参数估计的结果和具体经济问题以及现实情况紧密结合,这样才能保证回归模型在经济问题研究中的正确应用。

第二章一元线性回归

2.14解答:

(1)散点图为:

40.00000-

35.00000-

30.00000-

A2500000-

20.00000-

15.00000-

10.00000-O

1.00000

200000

3.00000

4.00CO0

5.00000

 

(2)x与y之间大致呈线性关系。

AAA

(3)设回归方程为y=0o+Qx

II--

A工和厂“xy0产=7

工才-7心)'

(=1

/.可得回归方程为y=-l+7x

A21nA2

⑷b=—-£(X-X)

n-2台

]nAA*

=p斗(y厂(0o+0ix))

lTdO-(-1+7x1))2+(10-(-1+7x2))2+(20-(-1+7x3))2

亍|_+(20—(-1+7x4))'+(40-(-1+7x5))2

=*[16+9+0+49+36]

=110/3

(5)由于人〜"(A,)

.XX

AAf—

t_A-A_(A-Z?

)V^

3Lo-

服从自由度为n-2的t分布。

因而

P|(乜阿<也(,,_2)=l-a

A

=l-a

A

aA

<0ivA+0/2

Vxv

可得Q的置信度为95%的置信区间为(7-2.353x1^33,7+2.353x1^33)

即为:

(2.49,11.5)

4)〜N(0°,(丄+学0)

nL

AA

几-00_00-00

 

服从自由度为n-2的t分布。

因而

Bo-卩0

1<42-2)

=\-a

AAI1(X)2

即p(0°-sl二

‘XX

<0o<0o+b

T丄j

VnL

XX

 

可得厶的置信度为95%的置信区间为(-7.77,5.77)

A-

£(y厂刃'

(6)x与y的决定系数尸=号=490/600^0.817

£(必-刃‘

1=1

(7)

7xVTo212“

=—==a3.66

其中匸

[nI

—ye2=——

n_2召177-2

nA

工(x-x)i=l

15/330股

3

ANOVA

平方和

df

均方

F

显著性

组间(组合)

9.000

2

4.500

9.000

・100

线性项加权的

8.167

1

&167

16.333

.056

偏差

.833

1

.833

1.667

.326

1.000

2

.500

总数

10.000

4

由于尸>化(1、3),拒绝说明回归方程显著,x与y有显著的线性关系。

 

"2.353

・・・接受原假设Hq.卩Z认为屁显著不为0,因变量y对自变量x的一元线性回归成立。

(9)相关系数

工(兀7)(”-刃/=!

£(兀-窃丈(另-刃

70

/0x600

=_Z=«0.904

V60

厂小于表中4=1%的相应值同时大于表中<7=5%的相应值,・・・x与y有显著的线性关系.(10)

序号

.V

y

z\

y

e

1

1

10

6

4

2

2

10

13

-3

3

3

20

20

0

4

4

20

27

-7

5

5

U)

31

6

残差图为:

5.00-

2.50-

o.oo-

-2.50-

•500-

・7.5O-

1.002.00

残差图

3.004.00

5.00

从图上看,残差是围绕尸0随机波动,从而模型的基本假定是满足的。

(11)当广告费a0=4.2万元时,销售收入儿=28.4万元置信度为95%的置信区间

近似为y±2b,即(17.1,39.7)

2.15解答:

(1)散点图为:

5.00-

4.00-

A3.00-

2.00-

1.00-

X与y散点图

1000.00

250.00

500.00

750.00

1250.00

 

(2)X

与y之间大致呈线性关系。

人八八

(3)设回归方程为〉,=0。

+0卫

n--

A工i—zy

0产

f=l

(7;獄豔严。

36

00=y-卩:

x=2.85-0.0036x762=0.1068/.可得回归方程为j=0.1068+0.0036X

A21nA2

⑷b=—E(x->9

n-2x-i

]naA

=—7工(x-(几+3ix))Hi-i

=0.2305

<7=0.4801(5)由于&~N(A,宁)

AA/—

t=卩卩\=(A_0)a/^T

3lo-

服从自由度为n-2的t分布。

因而

PI心)阿<M_2)=l-a

也即:

可得A的置信度为95%的置信区间为

(0.0036-1.860x0.4801/71297860,0.0036+1.860x0.4801/J1297860)

即为:

(0.0028,0.0044)

4>〜N(0。

(丄+学0)

nL-

AA

A)-00_00-00

服从自由度为n-2的t分布。

因而

0o几

A11(r)2

即"(0。

-b」—+8

AIj(X)2

XX

(6)x与y的决定系数

川人一

£()】-刃'

f(y厂齐

/=!

可得人的置信度为95%的置信区间为(-0.356705703)

16.82027

二0.908

1&525

八・["1nA

其中八乏孕〜三議宀)

AN0VA

平方和

df

均方

F

显箸性

组间(组合)

1231497.500

7

175928.214

5.302

・168

线性项加权的

1168713.036

1

1168713.036

35.222

.027

偏差

62784.464

6

10464.077

.315

.885

66362.500

2

33181.250

总数

1297860.000

9

由于尸>代(1、9),拒绝说明回归方程显著,x与y有显著的线性关系。

0.0036x^1297860o一

=o.j4z

0.04801

^/2=1.895

/=8.542>ta!

2

・•・接受原假设H认为屁显著不为0,因变量y对自变量x的一元线性回归成立。

(9)相关系数

>(X—rVv—

J吃()10W

4653

71297860x18.525

=0.9489

 

r小于表中a=l%的相应值同时大于表中67=5%的相应值,・・・x与y有显著的线性关系.

♦系列1

(10)

序号

X

y

y

e

1

825

3・5

3.0768

0.4232

2

215

1

0.8808

0.1192

3

1070

4

3.9588

0.0412

4

550

2

2.0868

-0.0868

5

480

1

1.8348

-0.8348

6

920

3

3.4188

-0.4188

7

1350

4.5

4.9688

-0.4668

8

325

1.5

1.2768

0.2232

9

670

3

2.5188

0.4812

10

1215

5

4.4808

0.5192

从图上看,残差是围绕o=0随机波动,从而模型的基本假定是满足的。

(11)新保单兀=1000时,需要加班的时间为y°=3.7小时。

(12)儿的置信概率为-a的置信区间精确为丫。

±/“(〃-2)严石6即为(2.7,4.7)

AA

近似置信区间为:

儿±2b,即(2.74,4.66)

A—A

(13)可得置信水平为1-型勺置信区间为儿±心2(—2)应6即为(3.33,4.07).

2.16

(1)散点图为:

45000.00-

4000000-

35000.00-

A30000.00-

25000.00-

20000.00-

15000.00-

2000.004000.006000.008000.00

可以用直线回归描述y与x之间的关系.

(2)回归方程为:

y=12112・629+3・314x

直方图

均值5.01E-16标准偏差.=0.99N=51

因变量:

y

 

回归标准化残差

回归标准化残差的标准P-P图

因变量:

y

u.IIIIIn0.00.20.40.60.81.0

期望的累

8

观测的壊积概率

从图上可看出,检验误差项服从正态分布。

第三章多元线性回归

3.11解:

(1)用SPSS算出y,xl,x2,x3相关系数矩阵:

相关性

y

xl

x2

x3

Pearson相关性y

1.000

.556

.731

.724

xl

.556

1.000

・113

.398

x2

.731

・113

1.000

.547

x3

.724

.398

.547

1.000

y

.048

.008

.009

xl

.048

.378

・127

x2

.008

.378

.051

x3

.009

・127

.051

Ny

10

10

10

10

xl

10

10

10

10

x2

10

10

10

10

x3

10

10

10

10

/1.000

0.556

0.731

0.724\

0.556

1.000

0.113

0.398

0.731

0.113

1.000

0.547

所以"

(0.724

0.398

0.547

1.000/

系数.

模型

非标准化系数

标准系

B的95.0%蓋信区间

相关性

共线性统计虽

B

标准误差

试用版

t

Sig.

下限

上限

審阶

部分

容差

VIF

(常量)

-348

.2

80

176.459

-1.974

.096

-780.0

60

83.500

xl

3.754

1.933

.385

1.942

・100

977

8.485

.556

.621

.350

.825

1.211

x2

7.101

2.880

.535

2.465

.049

.053

14.149

.731

.709

.141

.687

1.455

x3

12.447

10.569

.277

1.178

.284

-13.41

5

38.310

.724

.433

.212

.586

1.708

a.因变<:

y

所以三元线性回归方程为$=-348.28+3.754x1+7.10U2+12.447x3

模型汇总

模型

R

R方

调整R方

标准估计的

误差

更改统计虽

R方更改

F更改

dfl

df2

Sig.F更改

1

.898“

.806

.708

23.44188

.806

8.283

3

6

・015

a.预测变量:

(常量).x3,xl.x2o

(3)

由于决定系数R方二0.708R二0.898较大所以认为拟合度较高

(4)

Anovab

模型

平方和

df

均方

F

Sig.

1回归

13655.370

3

4551.790

&283

.015’

残差

3297.130

6

549.522

总计

16952.500

9

a.预测变量:

(常量).x3.xl.x20

b.因变虽:

y

因为F二8.283P二0.015<0.05所以认为回归方程在整体上拟合的好

(5)

系数.

模型

非标准化系数

标准系数

t

Sig.

B的95.0%置信区

相关性

共线性统计量

B

标准误差

试用版

下限

上限

家阶

部分

容差

VIF

1(

-348.280

176.459

-1.974

.096

-780.060

83.500

X1

3.754

1.933

.385

1.942

・100

977

8.485

.556

.621

.350

.825

1.211

x2

7.101

2.880

.535

2.465

.049

.053

11.149

.731

.709

.144

.687

1.455

x3

12.447

10.569

.277

1.178

.284

-13.415

38.310

.724

.433

.212

.586

1.708

a.因变虽:

y

(6)可以看到P值最大的是x3为0.284,所以x3的回归系数没有通过显著检验,应去除。

去除x3后作F检验,得:

Anovab

模型

平方和

df

均方

F

Sig-

1回归

12893.199

2

6446.600

11.117

.007’

残差

4059.301

7

579.900

总计

16952.500

9

a.预测变量:

(常量)•x2.xlo

b.因变虽:

y

由表知通过F检验

继续做回归系数检验

系数.

模型

非标准化系数

标准系数

t

Sig.

B的95•號蓋信区间

相关性

共线性统计

B

标准误差

试用版

下限

上限

零阶

部分

容差

VIF

(常量)

-459.624

153.058

-3.003

.020

-821.547

-97.700

X1

4.676

1.816

.479

2.575

.037

.381

8.970

.556

.697

.476

.987

1.013

x2

&971

2.468

.676

3.634

.008

3.134

14.808

.731

.808

.672

.987

1.013

a.因变量:

y

此时,我们发现Xl,X2的显著性大大提高。

(7)xl:

(-0.997,8.485)x2:

(0.053,14.149)x3:

(-13.415,38.310)

(8)孑=0.385x1*+0.535x2*+0.277x3”

(9)

残差统计量・

极小值

极大值

均值

标准偏差

N

预测值

175.4748

292.5545

231.5000

38.95206

10

标准预测值

-1.438

1.567

.000

1.000

10

预测值的标准误差

10.466

20.191

14.526

3.127

10

调整的预测值

188.3515

318.1067

240.1835

49.83914

10

残差

-25.19759

33.22549

・00000

19.14022

10

标准残差

-1.075

1.417

.000

.816

10

Student化残差

-2.116

1.754

123

1.188

10

已删除的残差

-97.61523

50.88274

-8.68348

43.43220

10

Student化已删除的残差

-3.832

2.294

255

1.658

10

Mahalo距离

.894

5.777

2.700

1.555

10

Cook的距离

.000

3.216

.486

.976

10

居中杠杆值

.099

.642

.300

.173

10

a.因变虽:

y

所以置信区间为(175.4748,292.5545)

(10)由于x3的回归系数显著性检验未通过,所以居民非商品支岀对货运总量影响不大,但是回归方程整体对数据拟合较好

3.12解:

在固定第二产业增加值,考虑第三产业增加值影响的情况下,第一产业每增加一个单位,GDP就增加0.607个单位。

在固定第一产业增加值,考虑第三产业增加值影响的情况下,第二产业每增加一个单位,GDP就增加1.709个单位。

第四章违背基本假设的情况

4.8

0.30-

0.20-

0.10-

o.ocr

-oio-

-020-

-0.30-

i

o

10000

20000

30000

40000

 

居民收入

加权变化残差图上点的散步较之前的残差图,没有明显的趋势,点的散步较随机,因此加权最小二乘估计的效果较最小二乘估计好。

4.9解:

模型

非标准化系数

标准系数

t

Sig.

B

标准误差

试用版

1

(常虽)

・・831

・442

-1.882

.065

X

.004

.000

.839

11.030

.000

a.因变y

由SPSS计算得:

丿二-0.831+0.004x

残差散点图为:

冋归标准化残差

散点图

因变就:

y

ogpOO

OO0

-3-

0.002.004.006.008.001o'oOIZOOu'oO

y

(2)由残差散点图可知存在异方差性再用等级相关系数分析:

相关系数

X

t

Spearman的rhoX

相关系数

1.000

・318,

Sig.(双侧)

.021

N

53

53

T

相关系数

・31&

1.000

Sig.(双侧)

.021

N

53

53

*.在負信度(双测)为0.05时,相关性是显箸的。

P二0.021所以方差与自变量的相关性是显著的。

(3)

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > IT计算机 > 电脑基础知识

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1