北科SPSS软件练习试题word版本.docx
《北科SPSS软件练习试题word版本.docx》由会员分享,可在线阅读,更多相关《北科SPSS软件练习试题word版本.docx(18页珍藏版)》请在冰豆网上搜索。
北科SPSS软件练习试题word版本
北科SPSS软件练习试题
Spss第4次作业
第1题
(1)【实验目的】
学会用spss进行相关分析
(2)【实验内容】
1、对15家商业企业进行客户满意度调查,同时聘请相关专家对这15家企业的综合竞争力进行评分,结果如下表
编号
客户满意度得分
综合竞争力得分
1
90
70
2
100
80
3
150
150
4
130
140
5
120
90
6
110
120
7
40
20
8
140
130
9
10
60
10
20
30
11
80
100
12
70
110
13
30
10
14
50
40
15
60
50
这些数据能否说明企业的客户满意度与综合竞争力存在较强的正相关关系?
为什么?
(3)【操作步骤】
1.输入数据→图形→散点图/点图→选择“简单散点图”→定义→将“综合竞争得分”导入“Y轴”→将“客户满意度得分”导入“X轴”→确定;
2.在数据输出窗口,双击图形空白处→元素→总计拟合线→线性→应用;
3.分析→回归→线性→添加客户满意度得分到因变量,综合竞争力的分到自变量→确定
(4)【输出结果】
输入/除去的变量a
模型
输入的变量
除去的变量
方法
1
综合竞争力得分b
.
输入
a.因变量:
客户满意度得分
b.已输入所请求的所有变量。
模型摘要
模型
R
R方
调整后R方
标准估算的误差
1
.864a
.747
.728
23.344
a.预测变量:
(常量),综合竞争力得分
ANOVAa
模型
平方和
自由度
均方
F
显著性
1
回归
20915.714
1
20915.714
38.381
.000b
残差
7084.286
13
544.945
总计
28000.000
14
a.因变量:
客户满意度得分
b.预测变量:
(常量),综合竞争力得分
系数a
模型
未标准化系数
标准化系数
t
显著性
B
标准误差
Beta
1
(常量)
10.857
12.684
.856
.408
综合竞争力得分
.864
.140
.864
6.195
.000
a.因变量:
客户满意度得分
(5)【结果分析】
拟合线性直线的方程为:
y=10.86+0.86x,相关系数r为0.864,当显著性水平α为0.01时拒绝原假设,表明两个变量(企业的客户满意度与综合竞争力)之前具有较强的线性关系,相关性显著。
第2题
(1)【实验目的】
学会用spss进行相关分析
(2)【实验任务】
为研究香烟消耗量与肺癌死亡率的关系,收集到下表数据。
国家
1930年人均香烟消耗量
1950年每百万男子中死于肺癌的人数
澳大利亚
480
180
加拿大
500
150
丹麦
380
170
芬兰
1100
350
英国
1100
460
荷兰
490
240
冰岛
230
60
挪威
250
90
瑞典
300
110
瑞士
510
250
美国
1300
200
绘制散点图,并计算相关系数,说明香烟消耗量与肺癌死亡率之间是否存在显著的相关关系。
(3)【操作步骤】
1.输入数据→图形→散点图/点图→选择“简单散点图”→定义→将“1950年每百万男子中死于肺癌的人数”导入“Y轴”→将“1930年人均香烟消耗量”导入“X轴”→确定;
2.在数据输出窗口,双击图形空白处→元素→总计拟合线→线性→应用;
3.在数据编辑窗口,分析→相关→双变量→将“1930年人均香烟消耗量”、“1950年每百万男子中死于肺癌的人数”导入变量中→选项→选中“平均值和标准差”、“叉积偏差和协方差”→继续→确定。
(4)【输出结果】
描述统计
平均值
标准差
个案数
客户满意度得分
80.00
44.721
15
综合竞争力得分
80.00
44.721
15
相关性
客户满意度得分
综合竞争力得分
客户满意度得分
皮尔逊相关性
1
.864**
显著性(双尾)
.000
平方和与叉积
28000.000
24200.000
协方差
2000.000
1728.571
个案数
15
15
综合竞争力得分
皮尔逊相关性
.864**
1
显著性(双尾)
.000
平方和与叉积
24200.000
28000.000
协方差
1728.571
2000.000
个案数
15
15
**.在0.01级别(双尾),相关性显著。
(5)【结果分析】
回归分析显著性为0.202,皮尔逊相关系数相差较大,可能是有最后几组差异较大的数据点所影响。
线性回归方程:
1950年每百万男子中死于肺癌人数=67.561+1930年人均香烟消耗量*0.228。
第3题
(1)【实验目的】
学会用spss进行相关分析
(2)【实验任务】
收集到某商品在不同地区的销售额,销售价格以及该地区平均家庭收入的数据,如下表所示:
销售额(万元)
销售价格(元)
家庭收入(元)
100
50
10000
75
70
6000
80
60
12000
70
60
5000
50
80
3000
65
70
4000
90
50
13000
100
40
11000
110
30
13000
60
90
3000
(1)绘制销售额,销售价格以及家庭收入两两变量间的散点图,如果所绘制的图形不能比较清晰地展示变量之间的关系,应对数据如何处理后再绘图?
(2)选择恰当的统计方法分析销售额与销售价格之间的相关关系。
(3)【操作步骤】
步骤:
图形>旧对话框>散点图>矩阵散点图>定义>添加销售额(万元),销售价格(元)家庭收入(元)>确定
步骤:
分析>相关>双变量>销售价格,家庭收入,销售额添加到变量中>选择皮尔逊相关系数>选择双尾显著性检验>确定>>
(4)【输出结果】
相关性
销售价格(元)
家庭收入(元)
销售额(万元)
销售价格(元)
皮尔逊相关性
1
-.857**
-.933**
显著性(双尾)
.002
.000
个案数
10
10
10
家庭收入(元)
皮尔逊相关性
-.857**
1
.880**
显著性(双尾)
.002
.001
个案数
10
10
10
销售额(万元)
皮尔逊相关性
-.933**
.880**
1
显著性(双尾)
.000
.001
个案数
10
10
10
**.在0.01级别(双尾),相关性显著。
(5)【结果分析】
1.从相关性分析表中得出:
销售价格与家庭收入与销售额三者两两相关,并且皮尔逊相关系数绝对值较大成很强的相关性。
2.结论分析:
如图所拟合的直线,销售额与销售价格由较强的负相关。
回归分析
第4题
(1)【实验目的】
学会用spss进行回归分析
(2)【实验任务】
1、数据学生成绩一.sav和学生成绩二.sav,任意选择两门成绩作为解释变量和被解释变量,利用SPSS提供的绘制散点图功能进行一元线性回归分析,请绘制全部样本以及不同性别下两门成绩的散点图,并在图上绘制三条回归直线,其中,第一条针对全体样本,第二条和第三条分别针对男生样本和女生样本,并对各回归直线的拟合效果进行评价。
(3)【操作步骤】
打开“学生成绩一.sav”→图形→散点图/点图→简单散点图→定义→将数据导入“X轴”、“Y轴”→确定;
在查看器中→图形→激活;→选择元素→总计拟合曲线和子组拟合曲线。
分析→回归→线性→将数据导入“因变量”、“自变量”→统计→选中“共线性诊断”→继续→确定。
(4)【输出结果】
ANOVAa
模型
平方和
自由度
均方
F
显著性
1
回归
461.871
1
461.871
7.934
.007b
残差
3376.541
58
58.216
总计
3838.413
59
a.因变量:
chi
b.预测变量:
(常量),math
(5)【结果分析】
上表得出,不论是总体拟合效果还是男女分类拟合效果,都比较差,这说明,这两门成绩的相关性弱。
第5题
(1)【实验目的】
建立多元线性回归方程,分析影响的主要因素。
(2)【实验任务】
请先收集若干年粮食总产量以及播种面积,使用化肥量,农业劳动人数等数据,然后建立多元线性回归方程,分析影响粮食总产量的主要因素,数据文件“粮食总产量.sav”
(3)【操作步骤】
分析—回归—线形
(4)【输出结果】
输入/除去的变量a
模型
输入的变量
除去的变量
方法
1
农业劳动者人数(百万人),粮食播种面积(万公顷),施用化肥量(kg/公顷)b
.
输入
a.因变量:
粮食总产量(y万吨)
b.已输入所请求的所有变量。
模型摘要
模型
R
R方
调整后R方
标准估算的误差
1
.986a
.971
.968
1378.77302
a.预测变量:
(常量),农业劳动者人数(百万人),粮食播种面积(万公顷),施用化肥量(kg/公顷)
ANOVAa
模型
平方和
自由度
均方
F
显著性
1
回归
1989131592.747
3
663043864.249
348.784
.000b
残差
58931465.939
31
1901015.030
总计
2048063058.686
34
a.因变量:
粮食总产量(y万吨)
b.预测变量:
(常量),农业劳动者人数(百万人),粮食播种面积(万公顷),施用化肥量(kg/公顷)
系数a
模型
未标准化系数
标准化系数
t
显著性
B
标准误差
Beta
1
(常量)
-20715.614
7459.573
-2.777
.009
粮食播种面积(万公顷)
2.136
.513
.154
4.167
.000
施用化肥量(kg/公顷)
128.802
13.679
.690
9.416
.000
农业劳动者人数(百万人)
62.461
9.836
.461
6.350
.000
风灾面积比例(%)
-198.598
54.231
-.112
-3.662
.001
a.因变量:
粮食总产量(y万吨)
(5)【结果分析】
结论分析:
从最后的系数的分析表中得出,其中施用化肥量与粮食总产量的相关性最大。
第6题
(1)【实验目的】
完成下列题目
(2)【实验任务】
一家产品销售公司在30个地区设有销售分公司。
为研究产品销售量(y)与销售价格(x1)各地区的人均收入(x2),广告费用(x3)之间的关系,搜集到30个地区的有关数据。
进行多元回归分析所得的结果如下:
表1
模型
离差平方和
Df
均方离差
F
Sig
回归
12026774.1
3
4008924.7
72.79
8.88341E-13
剩余
1431812.6
26
55069.7154
总计
13458586.7
29
4063994.4154
表2
非标准化系数
t
Sig
B
标准误差
常数
7589.1
2448
3.1
0.00457
X1
-117.9
31.95
-3.69
0.00103
X2
80.6
14.76
5.46
0.00001
X3
0.5012
0.126
3.98
0.00049
a)将表1中的数据补齐.
如图一
b)写出销售量与销售价格,年人均收入,广告费用的多元线性回方程,并解释各回归系数的意义。
Y=-117.9X1+80.6X2+0.5012X3+7589.1
c)检验回归方程的线性关系是否显著。
显著
d)检验各回归系数是否显著,
均小于0.05,显著
e)计算判定系数,并解释它的实际意义。
12026774.1/13458586.7=0.91
表明回归方程对样本数据点拟合优度高。
第7题
(1)【实验目的】
用spss预测数据,并估计误差
(2)【实验任务】
试根据“粮食总产量.sav”数据,利用SPSS曲线估计方法选择恰当的模型,对样本期外的粮食总产量进行外推预测,并对平均预测预测误差进行估计。
(3)【操作步骤】
图形,旧对话框,线图,简单,个案组摘要,定义,类别轴选择“年份”,其他统计量变量选择“粮食总产量”。
确定
步骤:
分析,回归,曲线估计,将“粮食总产量”导入因变量。
选择时间,选择二次项和指数分布。
保存,确定。
(4)【输出结果】
二次
模型汇总
R
R方
调整R方
估计值的标准误
.978
.957
.955
1651.679
ANOVA
平方和
df
均方
F
Sig.
回归
1.961E9
2
9.804E8
359.372
.000
残差
8.730E7
32
2728042.572
总计
2.048E9
34
系数
未标准化系数
标准化系数
t
Sig.
B
标准误
Beta
个案顺序
-164.291
113.713
-.217
-1.445
.158
个案序列**2
24.234
3.064
1.187
7.909
.000
(常数)
17269.480
887.803
19.452
.000
指数
模型汇总
R
R方
调整R方
估计值的标准误
.939
.881
.878
.107
ANOVA
平方和
df
均方
F
Sig.
回归
2.828
1
2.828
244.898
.000
残差
.381
33
.012
总计
3.209
34
系数
未标准化系数
标准化系数
t
Sig.
B
标准误
Beta
个案顺序
.028
.002
.939
15.649
.000
(常数)
14169.354
525.997
26.938
.000
因变量为ln(粮食总产量(y万吨))。
(5)【结果分析】
分析1:
由线图可以看出,粮食总产量非线性增加,因此,可以通过曲线估计进行分析。
所以在用二次曲线和指数曲线拟合。
分析2:
指数曲线模型,明显优于二次曲线模型,
所以利用指数模型进行合理预测未来粮食总产量。