14练习题解答第十四章多元回归分析汇总.docx
《14练习题解答第十四章多元回归分析汇总.docx》由会员分享,可在线阅读,更多相关《14练习题解答第十四章多元回归分析汇总.docx(12页珍藏版)》请在冰豆网上搜索。
14练习题解答第十四章多元回归分析汇总
第十四章多元回归分析
练习题:
1.为了研究某社区1500名居民的受教育年数(X)与收入(Y)的关系,随机抽取了20人进行调查,得到下表的结果。
个案编号
1
2
3
4
5
6
7
8
9
10
受教育年数(X)
10
9
12
15
14
9
16
5
6
13
收入(Y)
1000
1000
1300
2000
1900
900
2100
600
800
1400
个案编号
11
12
13
14
15
16
17
18
19
20
受教育年数(X)
19
12
18
7
5
10
20
11
8
12
收入(Y)
3200
1500
3000
800
500
1100
3500
1300
950
1100
根据统计结果,
(1)画出散点图;
(2)X与丫之间是否呈直线关系?
求出回归方程。
(3)计算X与丫的决定系数。
(4)在0.05的显著性水平下,作回归系数的显著性检验。
解:
(1)散点图:
4000.
3000
收入2000-
1000-
0
(2)从散点图可以看出,受教育年数与收入呈现出线性相关的关系;
根据上表数据计算可得:
n=20,'X=231丫=29950,'XY=415900,'X、丫=6918450,
2222
'X=3045,CX)=53361,'Y=59122500,('Y)=897002500
根据一元线性回归方程Y〃=:
a・bX回归直线的斜率b和截距a的计算公式可知:
a二Y_bX二一^b(—=-646.66
2XY-rX)CY)
(3)r
所以,回归方程是Y'a•bX=-646.66+185.64X
=0.954n&X2)-0X)2;n('Y2)—('Y)2
决定系数R=r2=0.910
(4)回归系数的检验:
研究假设H1:
b=0(即B=0)
虚无假设H°:
b=0(即B=0)
用F检验法:
r2/df1r2(n-2)
(1-r2)/df21-r2
df1=k=1
df2=n—k—1=20-1-1=18
其中,k表示自变量的个数,将r2=0.910代入上式可得:
F=182
在0.05的显著性水平下,从F分布表可知df1=1,df2=18时。
否定域是:
F绍.41。
因为F=182在否定域内,所以可否定虚无假设,接受研究假设。
研究结论是:
在0.05的显
著性水平下,该社区居民的受教育年数(X)与收入(Y)呈线性相关的,且教育年数每增加一年,收入增加185.64元。
2.子女的受教育水平(Y)往往受到父母的受教育水平(X1,X0以及家庭经济条件(X3)的影响,我们对某单位10个人进行了调查,得到如下表格:
被调查者受教育
年数(Y)
父亲受教育年数
(XJ
母亲受教育年数
(X2)
家庭经济条件
(X3)
1
15
9
8
中
2
12
8
9
中
3
15
12
11
上
4
19
15
12
上
5
9
7
5
中
6
10
8
8
下
7
9
6
7
中
8
14
9
9
下
9
16
10
12
中
10
18
14
12
上
根据数据统计:
(1)求出各X变量的回归系数,写出回归方程。
(2)计算X与丫的决定系数。
解:
(1)变量X3为定序变量,对其重新赋值:
“上=3,“中=2,“下”。
计算各个变量之间的积距相关系数为:
q=0.920,S=0.886,d=0.600,%=1,r)2=Di=0.848,屉=T=0.719,「23=「32=0.545
将之代入下列方程组:
ry^B1B2r21B3r31
「y2=B「12B2B3「32
ry3二B1r13B2r23B3
计算可得:
B1=0.672,B2=0.360,B3=-0.079
根据上表计算可得:
Y=13.70,Sy=3.59;X!
=9.80,S,=2.97;
X2=9.30,S2=2.41;X3=2.10,Ss=0.74。
将之代入公式:
b3"(§)
S3
a二YfX,「2X2_盼3
可得:
a=1.54,b|=0.81,b2=0.54,b3=-0.38
(2)决定系数:
2
Ryg!
23=Biry1'B2ry2B3ry3
=0.6720.920+0.3600.886-0.0790.600
=0.8898
:
0.90
3•根据武汉市初中生日常行为状况调查的数据(data9),用SPSS分析初中生平时每天做作业时间(xj,看电视时间(x2),睡觉时间(x3)对其目前学习成绩的影响(目前成绩在班级中的大致水平y),并对结果进行解释。
解:
《武汉市初中生日常行为状况调查问卷》:
C2你的成绩目前在本班大致属于
1)上等2)中上等3)中等4)中下等5)下等
C11请你根据自己的实际情况,估算一天内在下面列出的日常课外活动上所花的时间
大约为(请填写具体时间,没有则填“0”
平时(非节假日):
1)做作业小时2)看电视小时8)睡觉小时
C2你的成绩目前在本班大致属于?
”这个题目的选项在data9中,“上等”赋值为1”,
冲上等”赋值为2”,“中等”赋值为”“,“中下等”赋值为”“,“下等赋值为“5”,为了便于分
析,通过Transform-RecodeintoDifferentVariables命令将“下等”赋值为1'“,“中下等”赋值为
2”,冲等”赋值为3”,“中上等”赋值为4”,“上等”赋值为5”生成新变量“成绩层次(cjcc)SPSS的操作步骤如下:
(1打开武汉市初中生日常行为状况调查的数据data9。
次点击Analyze宀Regression宀Linear打开如图14-1(练习)所示的对话框。
图14-1(练习)Linear回归主对话框
自变量“做作业时间c11a1”、"看电视时间c11a2”和“睡觉时间11a8”放在ndependent(s)
框口,将因变量“成绩层次(cjcc)”放置在Dependent框中。
Method栏中选择强制进入法Entero
1点击按钮OK,SPSS依次输出下列结果。
表14-1(练习)纳入线性回归模型的变量
VariablesEntered/Removed
Model
Variables
Entered
VariablesRemoved
Method
1
平时一天睡觉时间,平时
一天看电视时间,平时一天做作业时间
Enter
a.Allrequestedvariablesentered
b.DependentVariable:
成绩层次
表14-2(练习)模型概况
ModelSummary
Model
R
RSquare
AdjustedRSquare
Std.ErroroftheEstimate
1
.143a
.020
.015
1.05142
a.Predictors:
(Constant),平时一天睡觉时间,平时一天
看电视时间,平时一天做作业时间
表14-3(练习)方差分析表
ANOVAb
Model
SumofSquares
df
MeanSquare
F
Sig.
1
Regression
9.629
1
9.629
8.708
.003a
Residual
563.916
510
1.106
Total
573.545
511
a.Predictors:
(Constant),平时一天看电视时间
b.DependentVariable:
成绩层次
表14-4(练习)回归系数结果
Coefficientsa
Model
Unstandardized
Coefficients
StandardizedCoefficients
t
Sig.
B
Std.Error
Beta
1(Constant)
2.921
.2601
11.244
.000
平时一天做作业时间
.032
.031
.048
1.041
.298
平时一天看电视时间
-.156
.055
-.129
-2.858
.004
平时一天睡觉时间
.034
.029
.055
1.183
.238
a.DependentVariable:
成绩层次
从表14-1(练习)可以看出,变量进入分析选择的是强制进入法(Enter),“做作业时
间c11a1”、“看电视时间11a2”和“睡觉时间11a8”三个变量都进入了模型。
表14-2(练习)显示的是模型概况。
结果显示,相关系数为0.143,决定系数为0.02,调整后的决定系数为
0.015,也就是说这三个变量可以解释学生成绩层次的1.5%,模型的拟合度不高。
表14-3(练
习)显示的是模型的方差检验结果。
表14-4(练习)是回归系数的结果,可以看出,弓I进的
三个自变量中对因变量成绩层次有影响的只有平时看电视的时间(p=0.004<0.05),其他
两个变量对成绩层次的影响不显著。
因此,线性回归模型可表示为
y=-0.129x2。
y'=2.921-0.156x2或
4.以下是对青年白领工作/家庭冲突(WFC的影响因素进行多元线形回归分析的结果,请根据所学知识对其进行分析说明。
表1模型概况
ModelSumnaryh
Model
R
RSquare
AdjustedR
Square
Std.ErroroftheEstimate
ChangeStatistics
RSquare
Change
FChange
df1
df2
Sig.FChange
1
.485s
.235
.232
.65358
.235
72.035
1
234
.000
2
.521b
.272
.265
.63922
.036
11.632
1
233
.001
3
.542
.294
.285
.63067
.022
7.363
1
232
.007
4
.556
.309
.297
.62516
.015
5.102
1
231
.025
5
.571e
.326
.312
.61876
.017
5.806
1
230
.017
6
.591f
.349
.332
.60941
.023
8.110
1
229
.005
7
.601g
.361
.341
.60543
.011
4.026
1
228
.046
a.Predictors:
(Consant),加班情况
b.Predictors:
(Consant),加班情况,文化程度
c.Predictors:
(Consant),加班情况,文化程度,每天工作时间
d.Predictors:
(Constant),加班情况,文化程度,每天工作时间,性别(1=男)
e.Predictors:
(Consent),加班情况,文化程度,每天工作时间,性别(1=男),婚姻观
f.Predictors:
(Con5bnt),加班情况,文化程度,每天工作时间,性别(1=男),婚姻观,单位支持
g.Predictors:
(Consent),加班情况,文化程度,每天工作时间,性别(1=男),婚姻观,单位支持,工作自主性
h.DependentVariable:
WFC
表2回归系数表
Coefficients(a)
Model
UnstandardizedCoefficients
Standardized
Coefficients
Beta
t
Sig.
B
Std.Error
7(Constant)
2.673
.467
5.727
.000
加班情况
.147
.023
.396
6.548
.000
文化程度
-.109
.029
-.208
-3.810
.000
每天工作时间
.071
.035
.123
2.063
.040
性别(仁男)*
-.253
.084
-.166
-3.025
.003
婚姻观:
孩子会
.123
.040
.168
3.087
.002
影响工作
单位支持
-.202
.061
-.194
-3.321
.001
工作自主性
.083
.042
.112
2.006
.046
aDependentVariable:
工作/家庭冲突
*参照对象:
0=女
解:
这两个表反映的是线性回归分析的结果。
表1是回归分析模型的概况,因为采用的是逐步回归的方法,所以出现了7个模型,每
个模型对引进一个变量后模型的解释力等信息进行了说明。
从表1下面的注解可以看出因变
量为青年白领工作/家庭冲突(WFC),还可以看出每一个模型中自变量的个数。
RSquare
Change反映了每引进一个自变量,模型解释力的变化情况,从这个表中可以看出,加班情况、文化程度、每天工作时间等7个变量可以解释青年白领工作/家庭冲突的34.1%(决定系
数RSquare为0.361,调整后的决定系数为0.341)。
表2显示的是第7个模型中各自变量对因变量的影响情况,因为采用的是逐步回归的方
法,所以只把对因变量有影响的变量引进了模型(sig小于0.05)。
从各自变量影响力的大
小来看,加班对青年白领工作家庭冲突的影响最大(标准回归系数为0.396),表示每多加
班一天工作/家庭冲突程度就可能会增加0.396。
根据标准回归系数的大小可以看出各自变量
影响力的大小。
再者,从各变量影响的方向来看,加班情况,每天工作时间和孩子会影响工作的婚姻
观都会加大青年白领的工作/家庭冲突,而文化程度每提高一个等级,青年白领的工作/家庭
冲突可以降低0.208,单位为青年白领的工作和家庭问题提供支持(比如请假方便程度,允
许员工工作时适当处理家庭事务等)
都会减轻青年白领的工作/家庭冲突。
从性别角度来看,
男性的工作/家庭冲突程度比女性要低0.166。