spss复习.docx - 冰豆网

资源描述

spss复习.docx

《spss复习.docx》由会员分享，可在线阅读，更多相关《spss复习.docx（22页珍藏版）》请在冰豆网上搜索。

spss复习.docx

spss复习

一、单项选择题：

（本大题小题,1分/每小题,共分）

1.SPSS的数据文件后缀名是:

（A）.sav

2.对数据的各种统计处理，SPSS是在下面哪一个选项中进行：

（A）数据编辑窗口；

3.在SPSS中，下面哪一个不是SPSS的运行方式

（A）输入运行方式；

4.下面哪一个选项不属于SPSS的数据分析步骤：

（D）数据扩展；

5.在SPSS中，下面哪一个选项不属于对变量（列）的描述：

（B）变量名称大小；

6.在SPSS的定义中，下面哪一个变量名的定义是错误的：

（D）A_BFG_；首字符应以英文字母开头，后面可以跟除了！

、、*之外的字母或数字。

下划线、圆点不能为变量名的

最后一个字符。

SPSS允许用汉字作为变量名。

7.在SPSS的定义中，下面哪一个变量名的定义是错误的：

（A）AND；SPSS有默认的变量名，以字母"VAR开头，后面补足5位数字，如VAR00001VAR00012等。

变量名不能与SPSS内部特有的具有特定含义的保留字同名，如ALL、BY、AND、NOT、OR等。

8.在SPSS数据文件中，下面那一项不属于数据的结构：

（D）数据值；

9.在SPSS数据文件中，下面那一项属于数据的内容：

（D）数据值；

10.通常来说，发放了900份问卷，可直接得到的有效问卷有800份，贝USPSS所建立的相

关数据文件中的行数为

（D）800；

11.下面那一项不属于SPSS的基本变量类型：

（D）整数型；

12.当在SPSS数据文件中输入变量为“职工姓名”，则应选择的变量类型是：

（B）字符串型；

13.当在SPSS数据文件中输入变量为“职工工资数”，则应选择的变量类型是：

（A）数值型；

13.当在SPSS数据文件中输入变量为“公司成立日期”，则应选择的变量类型是：

（C）日期型；

14.在SPSS的数据结构中，下面那一项不是“缺失数据”的定义：

（D）数据不是科学计数法；

15.统计学依据变量的计量尺度将变量分为三类，以下哪一类不属于这三类：

（D）科学计数类型；

16.在统计学中，变量“身高”属于计量尺度中的：

（A）数值型变量；身高（定距）、优良中差（定序）、性别（定类）

17.在统计学中，将变量“年龄”分为“老年”、“中年”、“青年”三个取值，分别用1、2、3

表示，则变量“年龄”属于计量尺度中的：

（B）定序型变量；

18.在统计学中，将变量“性别”分为“男”、“女”、两个取值，分别用1、2表示，则变量

“性别”属于计量尺度中的：

（C）定类型变量；

19.下面哪一个选项不能被SPSS系统正常打开：

（C）文本文件格式；

20.下面哪一个选项不能被SPSS系统正常打开：

（D）.exe；

21.在SPSS数据编辑窗口中，需要定义变量的数据结构，以下哪一项不属于变量的数据结构：

（D）变量值；

22.在SPSS数据结构中，下面哪一项不属于数据类型：

（D）数值标签型；

23.下面哪一个选项不是SPSS中定义的基本描述统计量：

（D）回归函数；

24.下面哪一个选项不是SPSS中定义的基本描述统计量：

D）因子；

25.下面那一项刻画了随机变量分布形态的对称性：

（D）偏度系数；

26.下面那一项刻画了随机变量分布形态陡缓程度：

（D）峰度系数；

27.对于SPSS来说，下面那一项不包括在变量的频数分布内容中：

（D）均值；（频数、百分比、有效百分比、累计百分比）

27.对于SPSS来说，下面那一项不包括在变量的频数分布内容中：

（C）标准差；

28.在SPSS中，下面那一项不是频数分析中常用的统计图形：

（D）分类图；

29.在SPSS中，当需要对变量进行频数分析时，需要选择下面那一项菜单：

（C）分析；

30.在进行数据的统计分析之前，一般需要完成数据的预处理，以下哪一项不属于数据的预处理内容：

（B）峰度和偏度处理；

31.在SPSS中，当我需要对原有某个变量的数据进行取对数运算时，应选取下面那一项进行

处理：

（A）变量计算；

32•在SPSS中，下面那一项不属于数据分组的目的：

（D）有利于进行因子分析；

33.对于SPSS中的组距分组，下面那一项是正确的说法：

（A）分组数与数据本身特点和数据个数有关；

34.对于SPSS来说，能够快捷找到变量数据的最大值和最小值的数据预处理方法是：

（A）排序；

35.对于SPSS来说，能够快捷找到变量数据的异常值的数据预处理方法是：

（A）排序；

36.在学生的一张数据表中，有平时分数、实验分数和卷面分数，如使用SPSS计算最终得分，则需要使用SPSS预处理中的：

（C）变量计算；

37.在SPSS中，以下哪个选项可以完成如下功能：

由收集的整体数据中抽取出年龄大于30

的数据：

（A）数据选取；

38.下面哪一个选项不是对数据的基本统计分析：

（D）实现变量的排序与合并；

39.在SPSS中，当变量是数值型时，则频数分析所用图形为：

（A）直方图；

40.在SPSS中，当需要选取出满足某一个条件的所有个案，则使用下面的那一项：

（A）个案选择；

41.在SPSS中，均值的计算适合下面那一项：

（A）定距型；

42.现有一批数据为（0,1,2,-2,3,-3,4），则这批数据的极差为：

（A）7；

43.以下图是某随机变量的概率密度，请问其峰度是：

（B）小于零；右偏大于0；左偏小于0；偏度为0表示对称。

44.以下图是某随机变量的概率密度，请问其峰度是：

（A）大于零；

45.以下图是某随机变量的概率密度，请问其峰度是：

（C）等于零；

46.单因素方差分析的第一步是明确观测变量和控制变量，例如，当分析不同施肥量是否对农产品产量带来显着影响、地域差别是否对妇女生育率有关系和学历对工资的作用关系时，控制变量分别是：

（A）施肥量、地域和学历；（B）施肥量、生育率和学历；

（C）施肥量、地域和工资；（D）农产品产量、地域和学历；

47.单因素方差分析的第一步是明确观测变量和控制变量，例如，当分析不同施肥量是否对

农产品产量带来显着影响、地域差别是否对妇女生育率有关系和学历对工资的作用关系时，

观测变量分别是：

（A）农产品产量、妇女生育率和工资；

48.当需要分析多个随机变量之间的相互影响和关系时，在SPSS中应使用下面哪一个选项:

（D）交叉分组下的频数分析；

49.下面那一种情况下，可以使用交叉列联表中来进行卡方分布检验：

（A）列联表单元格的全部期望频数都大于6；

50.当需要分析某一个变量的分布情况时，采用下面那一个选项较为合适：

（A）频数分析；

51.在统计分析中，描述变量的数据离散程度的基本统计量是：

（A）标准差；

52.在统计分析中，描述变量数据分布的中心位置的基本统计量是：

（D）均值；

53.在统计分析中，描述变量数据分布的对称程度的基本统计量是：

（B）偏度；

54.在统计分析中，描述变量的数据分布的陡峭程度的基本统计量是：

（C）峰度；

55.下面那一种说法是正确的：

（B）偏度大于零，则数据分布的长尾巴在左边；

56.下图中右下角的问号应选择：

（C）参数检验；

57.在得到一批未知其总体分布的数据后，可使用以下哪种方法验证其是否与某个已知理论分布相吻合：

（C）参数检验；

58.需要检验一批未知的连续数值型随机单样本是否是正态分布，则需要下面的那一项：

（C）标准差检验；

59.已知某一分布是正态分布的随机变量x的均值为，方差为2，则将其转换成标准正态

分布（即均值为0,标准差为1）的公式是：

（A）a）；但）aj；（C）-（^）；（D））；

60.下面那一项不是两独立样本t检验的前提条件：

（D）两个样本的方差必须相等；

61.设待检验两个总体的均值分别为1、2，则相关的两独立样本t检验的假设H。

是：

（A）H0:

20；

62.在交叉列联表检验中，行数为6,列数为7,则当变量间独立时所对应卡方分布的自由度是：

自由度=（列数-1）*（行数-1）

（A）30；

63.在交叉列联表检验中，当变量间独立时所对应检验统计量的分布是：

（A）卡方分布；

64.已知两批独立随机样本都服从正态分布，要检验这两批随机样本的方差是否相同，则需要采用：

（A）F检验；

65.•已知两批独立随机样本都服从正态分布，要检验这两批随机样本的均值是否相同，则需要采用：

（B）两独立样本t检验；

66.已知一批独立随机样本服从正态分布，要检验这批随机样本的均值是否与某总体分布的

均值相同，则需要采用：

（A）单样本t检验；

67.下面那一项不属于假设检验的基本步骤：

（B）画出随机样本的直方图；

68.当样本的分布未知，需要利用样本的数据推断出总体分布形态的方法是：

（A）非参数检验；（B）参数检验；（C）方差检验；（D）因子分解；

69.在总体分布未知的情况下，利用样本数据对所假定总体的分布进行显着性检验的方法是：

（B）非参数检验；

70.现有两段独立样本数据，欲判断它们之间的分布是否存在显着性差异，则可采用：

（B）非参数检验；

71.单样本的总体分布卡方检验属于：

（C）非参数检验，用于了解样本的分布是否与某一已知的理论分布吻合；

72.单样本K-S检验属于：

（C）非参数检验，用于了解连续数值型样本的分布是否与某一已知的理论分布吻合；

73.两配对样本t检验的目的是：

（C）推导出来自于两个总体的配对样本的分布是否存在显着性差异；

74.以下是使用SPSS所做的非参数检验的结果图，根据所给图选择正确的一项：

单样盂KoImaaorov-Smirnov龄赐

同庐」字的身

均值

71S571

最栩谕琴別

.204

正

.204

-11Q

Ko1m□aorov-5m

.34^1

a.椅验分布第正态分布0

（A）接受假设H0；

75.

（A）17；

75.样本值序列为男男女女女男女女男男男男，则整段样本值序列的游程数是：

（A）5；

76.样本值序列为男男男男男男男女女女女女，则整段样本值序列的游程数是：

（A）2；

77.样本值序列为男男男男男男男女女女女女，则整段样本值序列的游程数是:

（A）2；

78.样本值序列为男女男女男女男女男女男男，则整段样本值序列的游程数是:

（C）11；

79.样本值序列为，则整段样本值序列的游程数是：

（C）11；

80.样本性质下面的那一项可适用于两独立样本的曼-惠特尼U检验：

（A）样本秩；

81.样本性质下面的那一项可适用于两独立样本的K-S检验：

（B）样本数值；

82．下图是某两独立样本的游程检验示意图，请问图中数据的游程数是：

（A）6；

83.K-S检验可用于：

（B）非参数检验；

84.下面那一选项是独立样本：

（A）分别对两批不同年级的大学生调查他们的学习兴趣；

85.现有一批数据：

2.3,1.2,3.8,6,9，则6的秩是：

（C）4，

86.观察某新开发的饲料对猪的影响：

首先不用这个饲料，测量猪在一个月的体重；再在下一个月内使用新饲料喂养同一批猪，测量体重；实验者想知道前后两个月猪的体重的分布是否有差别，则可用以下哪一项进行检验：

（C）方差检验；

87.观察某新的营销手段对商品销售量的影响：

首先不用这个营销手段，测量10种商品在

一个月的销售量；再在下一个月内使用该新营销手段处理同样这10种商品，测量销售量；

实验者想知道这新的营销手段是否对商品的销售量有显着性区别，则可用以下哪一项进行检验（销售量的分布未知）：

（A）非参数检验中的两配对样本检验；

88.观察性别是否对书籍种类的购买意愿有差别：

随机选择20个男同学，随机选择30个女

同学，分别调查他们对书籍的购买意愿，调查者想知道性别对数据种类的购买是否有影响，则可使用（男和女同学购买数据的分布是正态分布）：

（B）非参数检验中的两独立样本检验；

89.在假设检验中，秩的概念主要用在下面那一项中：

（B）非参数检验；

90.现有一种饲料，使用不同的数量来喂养动物，测量出不同喂养量情况下动物的体重，现欲知道动物的体重是否与不同喂养量有关，则采用下面那一项：

（D）方差检验；

91.使用某种肥料对10块玉米田的产量进行实验，分别在每块田内使用0公斤、1公斤、2公斤、3公斤、4公斤、5公斤该肥料，再测量出每种肥料使用量和每块田的产量，当使用方差分析时，下面哪一个说法是正确的：

（A）肥料量是控制变量，每块田的产量是观测变量；

92.在制定某商品广告宣传策略时，广告效果可能会受到广告形式、地区规模、选择的栏目、播放的时间段、播放的频率等因素的影响。

人们需要研究在影响广告效果的众多因素中，那些因素是主要的，则最适合的分析方法是：

（C）多配对样本分析；

93•在方差分析中，共分为4组，每组有30个数据，则检验统计量F服从：

（A）自由度为（3,116）的F分布；F（k-1，n-k）

94.现有一批数据：

3.2，1.3，4.5，6，0.8，9.8，1.2，则1.2的秩是：

（A）2；

95．现有一

批数据：

3.2，

1.3，

4.5，

6，

0.8，

9.8，

1.2，

则

1.3

的秩是：

（B）3；

96．现有一

批数据：

3.2，

1.3，

4.5，

6，

0.8，

9.8，

1.2，

则

3.2

的秩是：

（D）4；

97．现有一

批数据：

3.2，

1.3，

4.5，

6，

0.8，

9.8，

1.2，

则

4.5

的秩是：

（B）5；

98．现有一

批数据：

3.2，

1.3，

4.5，

6，

0.8，

9.8，

1.2，

则

6的秩是：

（A）6；

99．现有一

批数据：

3.2，

1.3，

4.5，

6，

0.8，

9.8，

1.2，

则

9.8

的秩是：

（D）7；

100.现有

一批数据：

3.2，

1.3，

4.5，

6，

0.8，

9.8，

1.2，

则

0.8

的秩是

（C）1；

101.比较多种促销形式对同样10种商品销售的影响，则需要以下方法：

（C）多配对样本的非参数检验；

102.分析不同广告形式、不同地区对产品的销售额影响时，需要使用：

（B）多因素方差分析；

103.在多因素方差分析中，下面那一项不会影响观测变量的变动：

（A）各控制变量的独立作用；

104.变量x=（1,2,3），y=（2,4,6），则变量x和y的相关系数是：

（A）1；

105.对于变量x和y之间的相关系数，下面哪一个说法是错误的：

（D）当变量之间存在非线性关系时，还可以使用相关系数判断x和y之间的关系;

106.对于回归分析来说，下面那一项不属于回归分析的基本步骤：

（C）计算样本数据的峰度；

三、简答题：

（请将解答写在试卷上，本大题3小题,10分/每小题，共30分）

1.如下是一份问卷调查表：

1被调查者专业：

（A）理科；（B）文科；（C）工科；（D）社会科学；

2被调查者年级：

（A）1年级；（B）2年级；（C）3年级；（D）4年级；

3被调查者性别：

（A）男；（B）女

4被调查者年级的月花费量；

5被调查者入学日期；

6被调查者民族；

请按照SPSS中的要求，分别填写下表中的变量结构：

名称

类型

度量标准

专业

字符串型

r定类型变量

年级

字符串型

定序型变量

性别

字符串型

定类型变量

月花费量

数值型

数值型变量

入学日期

日期型

定序型变量

民族

字符串型

定类型变量

注：

类型有“数值型”、“字符串型”、“日期型”；度量标准有“数值型变量”、“定序型变量”、

“定类型变量”。

2.现有计数数据如下:

血压

低血压

（1）

正常

（2）

高血压（3）

年龄

30岁以下（用1表示）

30-49岁（用2表示）

50岁以上（用3表示）

请按照SPSS中的要求，分别填写下表中的变量结构:

名称

类型

度量标准

年龄

数值型

定序型变量

血压

数值型

数值型变量

3.现有计数数据如下:

血压

低血压

（1）

正常

（2）

高血压（3）

年龄

30岁以下（用1表示）

30-49岁（用2表示）

50岁以上（用3表示）

请按照SPSS中的要求，分别填写下表中的数据组织方式:

变量1

变量2

变量3

年龄

血压

合计

r27

；23

r91

r73

注：

需填写“变量1”、“变量2”、“变量3”的具体名字。

4.现在SPSS中某一变量的一批数据如下：

-1.16；1.43；-0.87；-0.45；-1.79；-1.52；1.01；0.74；0.58；0.01；-0.88；1.52；-0.27；-0.01；1.36；-0.21；

请计算这批数据的均值，方差，标准差：

全距，偏度系数，峰度系数

解：

均值=-0.03

方差=1.10

标准差=1.05

全距=1.52-（-1.79）=3.31

偏度系数=0.01

峰度系数=-1.19

5.年龄和血压列联表如下：

血压

低血压

正常

高血压

年龄

30岁以下计数

30-49计数

179

50岁以上计数

197

合计

计数

232

147

474

请根据交叉列联表的卡方检验步骤，判断年龄和血压之间是否是独立无关的。

答：

经过血压和年龄的交叉列联表的卡方检验，得出渐进Sig.（双侧）的值大于0.05，因

此年龄和血压之间不独立。

6.请简述单样本t检验的目的、前提和实现步骤。

答：

目的：

利用来自某总体的样本数据，推断该总体的均值是否与指定的检验值存在显着差

异，它是对总体均值的假设检验。

检验前提是样本来自的总体应服从或近似服从正态分布。

实现步骤：

提出原假设一选择检验统计量一计算检验统计量的观测值和概率P-值一给定显

着水平a，并作出决策。

7.请简述两独立样本t检验的目的、前提和实现步骤。

。

答：

目的：

利用来自两个总体的独立样本，推断两个总体的均值是否存在显着差异。

检验前提是：

样本来自的总体应服从或近似服从正态分布；两样本相互独立，即从一总体抽取一个

样本对另一总体中抽取一个样本没有任何影响，两个样本的量可以不相等。

实现步骤：

提出

原假设一选择检验统计量一计算检验统计量的观测值和概率P-值一给定显着水平a,并作出

决策。

8.请简述假设检验的步骤。

答：

提出原假设和备择假设一选择检验统计量一计算检验统计量观测值发生的概率一给定显着水平a，并作出决策。

9.下面是某一个参数检验的结果：

问题如下：

（1）这是单样本t检验还是两独立样本t检验两独立样本t检验

（2）请简述F检验的结果；经查看，该检验的F统计量的观测值为0.161，对应概率P-值为

0.688，由于概率P-值大于0.05，因此两总体的方差没有显着差异。

（3）请简述检验的结果。

两总体均值检验，其中t的观测值为-0.34，对应的双侧概率0.734，由于概率值大于0.05，因此两总体的均值没有显着差异

10.下面是一张有关两种工艺下产品寿命的SPSS表，其中sysm表示使用寿命值，gy表示两

组

请用两独立样本的曼-惠特尼方法对这批数据进行检验，判断两组数据的分布是否存在显着性差别（只需要给出曼-惠特尼U统计量的值即可）。

答：

U=W-k（k+1）/2=40-8*9/2=4

11.下图左边是SPSS中甲乙两种工艺下某产品寿命的一批数据，请在下图右表中计算出混合

排序后的样本数据，各组标记、甲乙工艺的累积频数、累积频率和累积频率的差。

（提示：

两独立样本的K-S检验）。

经过计算，混合排序后的样本数据分别为646、649、650、651、652、661、662、663、669、

672、675、679、682、692、693,各组标记分别为2、2、2、2、2、1、2、2、1、2、1、1、

1、1、1,甲工艺累计频数为0、0、0、0、0、1、1、1、2、2、3、4、5、6、7,乙工艺的

累计频数为1、2、3、4、5、5、6、7、7、8、&8、8、8、8，甲工艺累计频率为0、0、0、

0、0、0.143、0.143、0.143、0.286、0.286、0.429、0.571、0.714、0.857、1，乙工艺累计频率为0.125、0.25、0.375、0.5、0.625、0.625、0.75、0.875、0.875、1、1、1、1、1、1，累计频率差为0.125、0.25、0.375、0.5、0.625、0.625、0.482、0.607、0.732、0.589、0.714、0.571、0.429、0.286、0.143。

四、叙述和分析题：

（本大题小题，分/每小题，共分）

1.请简述利用SPSS进行数据分析的步骤。

SPSS数据的准备一SPSS数据的加工整理一SPSS数据的分析一SPSS分析结果的阅读和理解。

2.现有SPSS数据如下图：

请完成以下任务：

1画出该SPSS数据的交叉列联表；

2请进行所做交叉列联表的卡方检验；

3判断年龄和血压之间是否有关系。

（1）

血压

低血压

（1）

正常

（2）

高血压（3）

年龄

（2）假设行变量和列变量独立，计算卡方统计量值为9.352a，并得出统计量观测值得概率

为0.53，大于0.05，因此在原假设的前提下，卡方观测值出现时极有可能的，因此假设成

立。

（3）年龄和血压之间相互独立。

3.如下图为四个城市的儿童身高调查表:

使用非参数检验中的多独立样本的Kruskal-Wallis检验，检验多个总体的分布是否存在显

R）。

，

展开阅读全文