北科SPSS软件练习试题Word格式.docx
《北科SPSS软件练习试题Word格式.docx》由会员分享,可在线阅读,更多相关《北科SPSS软件练习试题Word格式.docx(18页珍藏版)》请在冰豆网上搜索。
14
50
15
这些数据能否说明企业的客户满意度与综合竞争力存在较强的正相关关系?
为什么?
(3)
【操作步骤】
1.输入数据→图形→散点图/点图→选择“简单散点图”→定义→将“综合竞争得分”导入“Y轴”→将“客户满意度得分”导入“X轴”→确定;
2.在数据输出窗口,双击图形空白处→元素→总计拟合线→线性→应用;
3.分析→回归→线性→添加客户满意度得分到因变量,综合竞争力的分到自变量→确定
(4)
【输出结果】
输入/除去的变量a
模型
输入的变量
除去的变量
方法
综合竞争力得分b
.
输入
a.因变量:
b.已输入所请求的所有变量。
模型摘要
R
R方
调整后R方
标准估算的误差
.864a
.747
.728
23.344
a.预测变量:
(常量),综合竞争力得分
ANOVAa
平方和
自由度
均方
F
显著性
回归
20915.714
38.381
.000b
残差
7084.286
544.945
总计
28000.000
b.预测变量:
系数a
未标准化系数
标准化系数
t
B
标准误差
Beta
(常量)
10.857
12.684
.856
.408
.864
.140
6.195
.000
(5)
【结果分析】
拟合线性直线的方程为:
y=10.86+0.86x,相关系数r为0.864,当显著性水平α为0.01时拒绝原假设,表明两个变量(企业的客户满意度与综合竞争力)之前具有较强的线性关系,相关性显著。
第2题
学会用spss进行相关分析
【实验任务】
为研究香烟消耗量与肺癌死亡率的关系,收集到下表数据。
国家
1930年人均香烟消耗量
1950年每百万男子中死于肺癌的人数
澳大利亚
480
180
加拿大
500
丹麦
380
170
芬兰
1100
350
英国
460
荷兰
490
240
冰岛
230
挪威
250
瑞典
300
瑞士
510
美国
1300
200
绘制散点图,并计算相关系数,说明香烟消耗量与肺癌死亡率之间是否存在显著的相关关系。
1.输入数据→图形→散点图/点图→选择“简单散点图”→定义→将“1950年每百万男子中死于肺癌的人数”导入“Y轴”→将“1930年人均香烟消耗量”导入“X轴”→确定;
3.在数据编辑窗口,分析→相关→双变量→将“1930年人均香烟消耗量”、“1950年每百万男子中死于肺癌的人数”导入变量中→选项→选中“平均值和标准差”、“叉积偏差和协方差”→继续→确定。
描述统计
平均值
标准差
个案数
80.00
44.721
相关性
皮尔逊相关性
.864**
显著性(双尾)
平方和与叉积
24200.000
协方差
2000.000
1728.571
**.在0.01级别(双尾),相关性显著。
回归分析显著性为0.202,皮尔逊相关系数相差较大,可能是有最后几组差异较大的数据点所影响。
线性回归方程:
1950年每百万男子中死于肺癌人数=67.561+1930年人均香烟消耗量*0.228。
第3题
收集到某商品在不同地区的销售额,销售价格以及该地区平均家庭收入的数据,如下表所示:
销售额(万元)
销售价格(元)
家庭收入(元)
10000
75
6000
12000
5000
3000
65
4000
13000
11000
(1)绘制销售额,销售价格以及家庭收入两两变量间的散点图,如果所绘制的图形不能比较清晰地展示变量之间的关系,应对数据如何处理后再绘图?
(2)选择恰当的统计方法分析销售额与销售价格之间的相关关系。
步骤:
图形>
旧对话框>
散点图>
矩阵散点图>
定义>
添加销售额(万元),销售价格(元)家庭收入(元)>
确定
分析>
相关>
双变量>
销售价格,家庭收入,销售额添加到变量中>
选择皮尔逊相关系数>
选择双尾显著性检验>
确定>
>
-.857**
-.933**
.002
.880**
.001
1.从相关性分析表中得出:
销售价格与家庭收入与销售额三者两两相关,并且皮尔逊相关系数绝对值较大成很强的相关性。
2.结论分析:
如图所拟合的直线,销售额与销售价格由较强的负相关。
回归分析
第4题
学会用spss进行回归分析
1、数据学生成绩一.sav和学生成绩二.sav,任意选择两门成绩作为解释变量和被解释变量,利用SPSS提供的绘制散点图功能进行一元线性回归分析,请绘制全部样本以及不同性别下两门成绩的散点图,并在图上绘制三条回归直线,其中,第一条针对全体样本,第二条和第三条分别针对男生样本和女生样本,并对各回归直线的拟合效果进行评价。
打开“学生成绩一.sav”→图形→散点图/点图→简单散点图→定义→将数据导入“X轴”、“Y轴”→确定;
在查看器中→图形→激活;
→选择元素→总计拟合曲线和子组拟合曲线。
分析→回归→线性→将数据导入“因变量”、“自变量”→统计→选中“共线性诊断”→继续→确定。
461.871
7.934
.007b
3376.541
58
58.216
3838.413
59
chi
(常量),math
上表得出,不论是总体拟合效果还是男女分类拟合效果,都比较差,这说明,这两门成绩的相关性弱。
第5题
建立多元线性回归方程,分析影响的主要因素。
请先收集若干年粮食总产量以及播种面积,使用化肥量,农业劳动人数等数据,然后建立多元线性回归方程,分析影响粮食总产量的主要因素,数据文件“粮食总产量.sav”
分析—回归—线形
农业劳动者人数(百万人),粮食播种面积(万公顷),施用化肥量(kg/公顷)b
粮食总产量(y万吨)
.986a
.971
.968
1378.77302
(常量),农业劳动者人数(百万人),粮食播种面积(万公顷),施用化肥量(kg/公顷)
1989131592.747
663043864.249
348.784
58931465.939
31
1901015.030
2048063058.686
34
-20715.614
7459.573
-2.777
.009
粮食播种面积(万公顷)
2.136
.513
.154
4.167
施用化肥量(kg/公顷)
128.802
13.679
.690
9.416
农业劳动者人数(百万人)
62.461
9.836
.461
6.350
风灾面积比例(%)
-198.598
54.231
-.112
-3.662
结论分析:
从最后的系数的分析表中得出,其中施用化肥量与粮食总产量的相关性最大。
第6题
完成下列题目
一家产品销售公司在30个地区设有销售分公司。
为研究产品销售量(y)与销售价格(x1)各地区的人均收入(x2),广告费用(x3)之间的关系,搜集到30个地区的有关数据。
进行多元回归分析所得的结果如下:
表1
离差平方和
Df
均方离差
Sig
12026774.1
4008924.7
72.79
8.88341E-13
剩余
1431812.6
26
55069.7154
13458586.7
29
4063994.4154
表2
非标准化系数
常数
7589.1
2448
3.1
0.00457
X1
-117.9
31.95
-3.69
0.00103
X2
80.6
14.76
5.46
0.00001
X3
0.5012
0.126
3.98
0.00049
a)将表1中的数据补齐.
如图一
b)写出销售量与销售价格,年人均收入,广告费用的多元线性回方程,并解释各回归系数的意义。
Y=-117.9X1+80.6X2+0.5012X3+7589.1
c)检验回归方程的线性关系是否显著。
显著
d)检验各回归系数是否显著,
均小于0.05,显著
e)计算判定系数,并解释它的实际意义。
12026774.1/13458586.7=0.91
表明回归方程对样本数据点拟合优度高。
第7题
用spss预测数据,并估计误差
试根据“粮食总产量.sav”数据,利用SPSS曲线估计方法选择恰当的模型,对样本期外的粮食总产量进行外推预测,并对平均预测预测误差进行估计。
图形,旧对话框,线图,简单,个案组摘要,定义,类别轴选择“年份”,其他统计量变量选择“粮食总产量”。
分析,回归,曲线估计,将“粮食总产量”导入因变量。
选择时间,选择二次项和指数分布。
保存,确定。
二次
模型汇总
调整R方
估计值的标准误
.978
.957
.955
1651.679
ANOVA
df
Sig.
1.961E9
9.804E8
359.372
8.730E7
32
2728042.572
2.048E9
系数
标准误
个案顺序
-164.291
113.713
-.217
-1.445
.158
个案序列**2
24.234
3.064
1.187
7.909
(常数)
17269.480
887.803
19.452
指数
.939
.881
.878
.107
2.828
244.898
.381
33
.012
3.209
.028
15.649
14169.354
525.997
26.938
因变量为ln(粮食总产量(y万吨))。
分析1:
由线图可以看出,粮食总产量非线性增加,因此,可以通过曲线估计进行分析。
所以在用二次曲线和指数曲线拟合。
分析2:
指数曲线模型,明显优于二次曲线模型,
所以利用指数模型进行合理预测未来粮食总产量。