SPSS16实用教程习题答案.docx
《SPSS16实用教程习题答案.docx》由会员分享,可在线阅读,更多相关《SPSS16实用教程习题答案.docx(32页珍藏版)》请在冰豆网上搜索。
SPSS16实用教程习题答案
第一章
1-1答:
SPSS的运行方式有三种,分别是批处理方式、完全窗口菜单运行方式、程序运行方式。
1-2答:
与一般电子表格处理软件相比,SPSS的“DataView”窗口还有以下一些特性:
(1)一个列对应一个变量,即每一列代表一个变量(Variable)或一个被观测量的特征;
(2)行是观测,即每一行代表一个个体、一个观测、一个样品,在SPSS中称为事件(Case);(3)单元包含值,即每个单元包括一个观测中的单个变量值;(4)数据文件是一张长方形的二维表。
第二章
2-1答:
SPSS中输入数据一般有以下三种方式:
(1)通过手工录入数据;
(2)可以将其他电子表格软件中的数据整列(行)的复制,然后粘贴到SPSS中;(3)通过读入其他格式文件数据的方式输入数据。
2-2答:
选择“Transform”菜单的ReplaceMissingValues命令,弹出ReplaceMissingValues对话框。
先在变量名列中选择1个或多个存在缺失值的变量,使之添加到“NewVariable(s)”框中,这时系统自动产生用于替代缺失值的新变量。
最后选择合适的替代方式即可。
2-3答:
选择“Data”菜单中的WeightCases命令,出现如图2-22所示的WeightCases对话框。
其中,Donotweightcases项表示不做加权,这可用于取消加权;Weightcasesby项表示选择1个变量做加权。
2-4答:
变量的自动赋值可以将字符型、数字型数值转变成连续的整数,并将结果保存在一个新的变量中。
具体操作的过程如下:
选择“Transform”菜单中的AutomaticRecode命令,在出现的对话框中,从左边的变量列表中选择需要自动赋值的变量,将它添加到Variable->NewName框中,然后在下面NewName右边的文本框中输入新的变量名称,单击NewName按钮,将新的变量名添加到上面的框中。
从RecodeStartingfrom框中有两个选项中选择一个,然后单击OK按钮,即可完成自动赋值运算。
第三章
3-1答:
一组数据的分布特征可以从平均数、中位数、众数、方差、百分位、频数、峰度、偏度等方面描述。
3-2答:
均值是总体各单位某一数量标志的平均数。
平均数可应用于任何场合,比如在简单时序预测中可用一定观察期内预测目标的时间序列的均值作为下一期的预测值。
中位数是指将数据按大小顺序排列起来,形成一个数列,居于数列中间位置的那个数据。
中位数的作用与算术平均数相近,也是作为所研究数据的代表值。
在一个等差数列或一个正态分布数列中,中位数就等于算术平均数。
在数列中出现了极端变量值的情况下,用中位数作为代表值要比用算术平均数更好,因为中位数不受极端变量值的影响。
众数是指一组数据中出现次数最多的那个数据。
它主要用于定类(品质标志)数据的集中趋势,当然也适用于作为定序(品质标志)数据以及定距和定比(数量标志)数据集中趋势的测度值。
3-3
[数据集0]
统计量
销售额
N
有效
30
缺失
0
均值
277.4000
中值
277.0000
标准差
28.24596
百分位数
25
256.0000
50
277.0000
75
301.0000
销售额
频率
百分比
有效百分比
累积百分比
有效
210.00
1
3.3
3.3
3.3
234.00
1
3.3
3.3
6.7
239.00
1
3.3
3.3
10.0
249.00
2
6.7
6.7
16.7
252.00
1
3.3
3.3
20.0
256.00
2
6.7
6.7
26.7
257.00
1
3.3
3.3
30.0
258.00
1
3.3
3.3
33.3
265.00
1
3.3
3.3
36.7
267.00
1
3.3
3.3
40.0
268.00
1
3.3
3.3
43.3
273.00
1
3.3
3.3
46.7
276.00
1
3.3
3.3
50.0
278.00
2
6.7
6.7
56.7
286.00
1
3.3
3.3
60.0
290.00
1
3.3
3.3
63.3
297.00
1
3.3
3.3
66.7
298.00
2
6.7
6.7
73.3
301.00
2
6.7
6.7
80.0
309.00
1
3.3
3.3
83.3
310.00
1
3.3
3.3
86.7
311.00
1
3.3
3.3
90.0
316.00
1
3.3
3.3
93.3
318.00
1
3.3
3.3
96.7
322.00
1
3.3
3.3
100.0
合计
30
100.0
100.0
3-4⑴答:
应采用方差、标准差来比较成年组和幼儿组的身高差异,
分析结果如下
[数据集2]
描述统计量
N
极小值
极大值
均值
标准差
方差
成年
10
168.00
180.00
173.8000
4.15799
17.289
幼年
10
68.00
75.00
71.0000
2.40370
5.778
有效的N(列表状态)
10
⑵答:
通过分析,成年组的身高方差为17.29,标准差为4.16;幼儿组的身高方差为5.78,标准差为2.40。
第四章
4-1答:
通过单一样本T检验可以检验某个单一样本某变量的总体均值与指定值之间是否存在显著差异。
4-2答:
对两个独立样本进行均值差异检验需要通过两步来完成:
第一,利用F检验判断两总体的方差是否相同;第二,根据第一步的结果,决定T统计量和自由度计算公式,进而对T检验的结论作出判断。
4-3答:
两配对样本T检验的前提要求如下:
两个样本应是配对的;样本来自的两个总体应服从正态分布。
4-4
均值
[数据集1]
案例处理摘要
案例
已包含
已排除
总计
N
百分比
N
百分比
N
百分比
组别*血压
12
100.0%
0
.0%
12
100.0%
报告
组别
血压
均值
N
标准差
方差
102.00
2.00
1
.
.
107.00
1.50
2
.707
.500
108.00
2.00
1
.
.
115.00
1.00
1
.
.
120.00
1.50
2
.707
.500
123.00
2.00
1
.
.
127.00
1.00
1
.
.
138.00
1.00
1
.
.
141.00
1.00
1
.
.
152.00
2.00
1
.
.
总计
1.50
12
.522
.273
DATASETACTIVATE数据集0.GETFILE='C:
\TDDOWNLOAD\6.5.sav'.DATASETACTIVATE数据集0.DATASETCLOSE数据集2.DATASETACTIVATE数据集1.DATASETCLOSE数据集0.
4-5
NEWFILE.T-TESTGROUPS=组名(01)/MISSING=ANALYSIS/VARIABLES=成绩/CRITERIA=CI(.95).
T检验
附注
创建的输出
09-十一月-201013时24分20秒
注释
输入
活动的数据集
数据集3
过滤器
权重
拆分文件
工作数据文件中的N行
40
缺失值处理
缺失的定义
用户定义的缺失值将作为缺失对待。
使用的案例
每个分析的统计量是根据分析中的每个变量的值都不缺失或超出范围的案例计算的。
语法
T-TESTGROUPS=组名(01)
/MISSING=ANALYSIS
/VARIABLES=成绩
/CRITERIA=CI(.95).
资源
处理器时间
0:
00:
00.015
已用时间
0:
00:
00.046
[数据集3]
组统计量
组名
N
均值
标准差
均值的标准误
成绩
0
20
83.60
6.700
1.498
1
20
75.45
9.179
2.053
独立样本检验
方差方程的Levene检验
均值方程的t检验
F
Sig.
t
df
Sig.(双侧)
均值差值
成绩
假设方差相等
1.110
.299
3.207
38
.003
8.150
假设方差不相等
3.207
34.768
.003
8.150
独立样本检验
均值方程的t检验
差分的95%置信区间
标准误差值
下限
上限
成绩
假设方差相等
2.541
3.006
13.294
假设方差不相等
2.541
2.990
13.310
答:
用两独立样本T检验进行检验得出,甲乙两个班级学生的数学成绩方差无显著性差异,而这两个班级的学生数学成绩均值之间有差异,甲班成绩要高于乙班同学的数学成绩。
第五章
5-1答:
方差分析可以用来检验两个及两个以上样本均数之间是否存在显著差异。
5-2答:
因为多因素方差分析不仅需要分析多个控制变量独立作用对观察变量的影响,还要分析多个控制变量交互作用对观察变量的影响,及其他随机变量对结果的影响。
因此,它需要将观察变量总的离差平方和分解为3个部分。
5-3答:
协方差分析是将那些很难控制的因素作为协变量,在排除协变量影响的条件下,分析控制变量对观察变量的影响,从而更加准确地对控制因素进行评价。
当有一些很难控制的随机变量时,可以使用协方差分析将这些随机变量作为协变量。
5-4
ONEWAY用力肺活量BY组别/STATISTICSHOMOGENEITY/PLOTMEANS/MISSINGANALYSIS.
单向
附注
创建的输出
01-十一月-201016时11分49秒
注释
输入
活动的数据集
数据集2
过滤器
权重
拆分文件
工作数据文件中的N行
29
缺失值处理
缺失定义
用户定义的缺失值以缺失对待。
使用的案例
每个分析的统计量都基于对于该分析中的任意变量都没有缺失数据的案例。
语法
ONEWAY用力肺活量BY组别
/STATISTICSHOMOGENEITY
/PLOTMEANS
/MISSINGANALYSIS.
资源
处理器时间
0:
00:
01.406
已用时间
0:
00:
03.781
[数据集2]
方差齐性检验
用力肺活量
Levene统计量
df1
df2
显著性
.408
2
26
.669
ANOVA
用力肺活量
平方和
df
均方
F
显著性
组间
10.919
2
5.460
97.103
.000
组内
1.462
26
.056
总数
12.381
28
均值图
5-5
方差齐性检验
Levene统计量
df1
df2
显著性
治疗前
2.702
2
15
.100
治疗后
4.650
2
15
.027
成对样本检验
成对差分
差分的95%置信区间
均值
标准差
均值的标准误
下限
上限
对1
治疗前-治疗后
-39.444
24.064
5.672
-51.411
-27.478
成对样本检验
t
df
Sig.(双侧)
对1
治疗前-治疗后
-6.954
17
.000
答:
这三个组别的接受治疗的患者在接受治疗之前各组之间没有显著性差异,在接受治疗之后,三个组别之间仍然没有显著性差异。
第六章
6-1描述变量之间线性相关程度的强弱,并用适当的统计指标表示出来的过程为相关分析。
常用的方法有二元定距变量的相关分析、二元定序变量的相关分析、偏相关分析和距离相关分析。
6-2二元变量相关分析是指通过计算变量间两两相关的相关系数,对两个或两个以上变量之间两两相关的程度进行分析,而偏相关分析是指当两个变量同时与第三个变量相关时,将第三个变量的影响剔除,只分析另外两个变量之间的相关程度的过程。
两者的区别在于当存在两个以上的变量时,分析的角度发生了变化,二元变量相关分析只考虑任意两个间的相关程度,而不考虑可能同时影响比较的两个变量其他变量,而偏相关分析刚好解决了这个问题。
6-3距离相关分析是对观测量之间或变量之间相似或不相似的程度的一种测量。
它可以用于同一变量内部各个取值之间来考察基相互接近程度,也可用于变量间,以考察预测值对实际值的拟合优度。
根据统计量不同,距离相关分析可分为相似和不相似性测量,根据分析对象不同又可以分为样本间分析和变量间分析。
关于如何进行距离相关分析,主要用“分析“/“相关”/“距离”子菜单来实现。
6-4
相关系数
Jud1
Jud2
Jud3
Jud4
Jud5
Jud6
Kendall的tau_b
Jud1
相关系数
1.000
.889**
.835**
.784**
.844**
.688**
Sig.(双侧)
.
.000
.000
.001
.000
.002
N
12
12
12
12
12
12
Jud2
相关系数
.889**
1.000
.866**
.880**
.766**
.688**
Sig.(双侧)
.000
.
.000
.000
.001
.002
N
12
12
12
12
12
12
Jud3
相关系数
.835**
.866**
1.000
.794**
.729**
.636**
Sig.(双侧)
.000
.000
.
.000
.001
.005
N
12
12
12
12
12
12
Jud4
相关系数
.784**
.880**
.794**
1.000
.819**
.551*
Sig.(双侧)
.001
.000
.000
.
.000
.015
N
12
12
12
12
12
12
Jud5
相关系数
.844**
.766**
.729**
.819**
1.000
.615**
Sig.(双侧)
.000
.001
.001
.000
.
.006
N
12
12
12
12
12
12
Jud6
相关系数
.688**
.688**
.636**
.551*
.615**
1.000
Sig.(双侧)
.002
.002
.005
.015
.006
.
N
12
12
12
12
12
12
Jud7
相关系数
.719**
.844**
.729**
.709**
.615**
.677**
Sig.(双侧)
.001
.000
.001
.002
.006
.002
N
12
12
12
12
12
12
Jud8
相关系数
.375
.250
.326
.252
.308
.215
Sig.(双侧)
.097
.268
.147
.266
.168
.335
N
12
12
12
12
12
12
Spearman的rho
Jud1
相关系数
1.000
.963**
.933**
.899**
.942**
.817**
Sig.(双侧)
.
.000
.000
.000
.000
.001
N
12
12
12
12
12
12
Jud2
相关系数
.963**
1.000
.945**
.940**
.912**
.842**
Sig.(双侧)
.000
.
.000
.000
.000
.001
N
12
12
12
12
12
12
Jud3
相关系数
.933**
.945**
1.000
.892**
.847**
.803**
Sig.(双侧)
.000
.000
.
.000
.001
.002
N
12
12
12
12
12
12
Jud4
相关系数
.899**
.940**
.892**
1.000
.929**
.677*
Sig.(双侧)
.000
.000
.000
.
.000
.016
N
12
12
12
12
12
12
Jud5
相关系数
.942**
.912**
.847**
.929**
1.000
.746**
Sig.(双侧)
.000
.000
.001
.000
.
.005
N
12
12
12
12
12
12
Jud6
相关系数
.817**
.842**
.803**
.677*
.746**
1.000
Sig.(双侧)
.001
.001
.002
.016
.005
.
N
12
12
12
12
12
12
Jud7
相关系数
.875**
.944**
.889**
.845**
.800**
.847**
Sig.(双侧)
.000
.000
.000
.001
.002
.001
N
12
12
12
12
12
12
Jud8
相关系数
.576
.408
.457
.406
.484
.291
Sig.(双侧)
.050
.187
.135
.190
.111
.358
N
12
12
12
12
12
12
**.在置信度(双测)为0.01时,相关性是显著的。
*.在置信度(双测)为0.05时,相关性是显著的。
相关系数
Jud7
Jud8
Kendall的tau_b
Jud1
相关系数
.719**
.375
Sig.(双侧)
.001
.097
N
12
12
Jud2
相关系数
.844**
.250
Sig.(双侧)
.000
.268
N
12
12
Jud3
相关系数
.729**
.326
Sig.(双侧)
.001
.147
N
12
12
Jud4
相关系数
.709**
.252
Sig.(双侧)
.002
.266
N
12
12
Jud5
相关系数
.615**
.308
Sig.(双侧)
.006
.168
N
12
12
Jud6
相关系数
.677**
.215
Sig.(双侧)
.002
.335
N
12
12
Jud7
相关系数
1.000
.246
Sig.(双侧)
.
.270
N
12
12
Jud8
相关系数
.246
1.000
Sig.(双侧)
.270
.
N
12
12
Spearman的rho
Jud1
相关系数
.875**
.576
Sig.(双侧)
.000
.050
N
12
12
Jud2
相关系数
.944**
.408
Sig.(双侧)
.000
.187
N
12
12
Jud3
相关系数
.889**
.457
Sig.(双侧)
.000
.135
N
12
12
Jud4
相关系数
.845**
.406
Sig.(双侧)
.001
.190
N
12
12
Jud5
相关系数
.800**
.484
Sig.(双侧)
.002
.111
N
12
12
Jud6
相关系数
.847**
.291
Sig.(双侧)
.001
.358
N
12
12
Jud7
相关系数
1.000
.344
Sig.(双侧)
.
.274
N
12
12
Jud8
相关系数
.344
1.000
Sig.(双侧)
.274
.
N
12
12
**.在置信度(双测)为0.01时,相关性是显著的。
*.在置信度(双测)为0.05时,相关性是显著的。
有分析可知:
裁判1至裁判7的判决结果比较类似,裁判8与其他7名裁判在平分上有显著差异。
6-5
PARTIALCORR/VARIABLES=v1v2v3BYv4/SIGNIFICANCE=TWOTAIL/STATISTICS=CORR/MISSING=LISTWISE.
偏相关
[数据集1]C:
\DocumentsandSettings\user\桌面\6.5.sav
相关性
控制变量
v1
v2
v3
v4
-无-a
v1
相关性
1.000
.719
.602
.342
显著性(双侧)
.
.000
.001
.075
df
0
26
26
26
v2
相关性
.719
1.000
.958
.826
显著性(双侧)
.000
.
.000
.000
df
26
0
26
26
v3
相关性
.602
.958
1.000
.934
显著性(双侧)
.001
.000
.
.000
df
26
26
0
26
v4
相关性
.342
.826
.934
1.000
显著性(双侧)
.075
.000
.000
.
df
26
26
26
0
v4
v1
相关性
1.000
.824
.839
显著性(双侧)
.
.000
.000
df
0
25
25
v2
相关性
.824
1.000
.927
显著性(双侧)
.000
.
.