spss复习题资料.docx

资源描述

spss复习题资料.docx

《spss复习题资料.docx》由会员分享，可在线阅读，更多相关《spss复习题资料.docx（26页珍藏版）》请在冰豆网上搜索。

spss复习题资料.docx

spss复习题资料

SPSS复习资料

一、选择题

1、SPSS数据文件的扩展名是（）。

.sav

2、SPSS软件的三种运行管理方式：

（）、（）和（）。

完全窗口菜单运行管理方式程序运行管理方式混合运行管理方式

输出窗口的主要功能：

（）。

显示和管理SPSS统计分析结果、报表和图形。

3、统计学依据数据的度量尺度将数据划分为三大类，（）、（）和（）。

定距型数据定类型数据定序型数据

4、SPSS有两个基本窗口：

（）和（）。

数据编辑窗口和结果输出窗口。

5、SPSS数据的组织方式有两种：

（）和（）。

原始数据的组织方式和计数数据的组织方式

5、常见的基本描述统计量有三大类：

（）、（）和（）。

刻画集中趋势的统计量刻画离中趋势的统计量刻画分布形态的统计量

6、数据编辑窗口的主要功能：

（）、（）和（）。

定义SPSS数据的结构录入编辑管理待分析的数据。

7、填写下面的方差分析表ANOVA（）

Model

SumofSquares

MeanSquare

Sig

Regression

1252

41.856

0.000

Residual

---

Total

1774

---

12525221829

8、SPSS对不同类型的变量应采用不同的相关系数来度量，常用的相关系数主要有（）、（）和（）。

Pearson简单相关系数、Spearman等级相关系数和Kendallτ相关系数等。

9、利用样本相关系数r进行变量间线性关系的分析,一般（）表示两变量有较强的线性关系;（）表示两变量之间的线性关系较弱。

|r|>0.8表示两变量有较强的线性关系；|r|<0.3表示两变量之间的线性关系较弱

10、利用样本相关系数r进行变量间线性关系的分析，r＝（）表示两变量存在完全正相关；r＝（）表示两变量存在完全负相关；r＝（）表示两变量不相关。

r＝1表示两变量存在完全正相关；r＝-1表示两变量存在完全负相关；r＝0表示两变量不相关

11、样本相关系数r的取值范围是（）。

在-1～+1之间

12、对回归方程的检验主要包括（）、（）、（）和（）。

回归方程的拟合优度检验回归方程的显著性检验回归系数的显著性检验残差分析

13、层次聚类有两种类型，分别是（）和（）。

Q型聚类和R型聚类；层次聚类的聚类方式又有两种，分别是（）和（）。

凝聚方式聚类和分解方式聚类。

14、根据控制变量的个数可将方差分析分为（）和（）。

单因素方差分析、多因素方差分析；根据观测变量的个数可将方差分析分为（）和（）。

一元方差分析（单因变量方差分析）和多元方差分析（多因变量方差分析）。

5、方差分析的适用条件、和

。

6、spss进行数据的行列互换时，选择菜单下的命令。

二、简答题

1、简述SPSS数据文件的特点

答：

SPSS数据文件的特点：

SPSS是一个有别于其他文件的特殊格式的文件，SPSS数据文件是一种有结构的数据文件，它由数据结构和内容两部分组成，其中的数据结构记录数据变量的名称、类型、变量宽度、小数位数、变量名标签、变量值标签、缺失值、显示宽度、对齐方式和度量尺度等必要信息，数据的内容才是那些待分析的具体数据。

基于上述特点，建立SPSS数据文件时应完成两项任务，即描述数据的结构和录入编辑数据。

2、简述数据排序的作用

答：

数据排序便于数据的浏览，有助于了解数据的取值状况、缺失值数量的多少等；

通过数据排序能够快捷的找到数据的最大值和最小值，进而可以计算出数据的全距，初步把握和比较数据的离散程度；

通过数据排序能够快捷地发现数据的异常值，为进一步明确它们是否会对分析产生重要影响提供帮助。

3、简述频数分析的目的和基本任务

答：

目的：

基本统计分析往往从频数分析开始。

通过频数分析能够了解变量取值的状况，对把握数据的分布特征是非常有用的。

基本任务：

（1）频数分析的第一个基本任务是编制频数分布表。

（2）频数分析的第二个任务是绘制统计图

4、简述回归分析的一般步骤

答：

（1）确定回归方程中的解释变量（自变量）和被解释变量（因变量）

（2）确定回归方程；

（3）对回归方程进行各种检验；

（4）利用回归方程进行预测。

5、什么是回归分析？

答：

回归分析是一种应用极为广泛的数量分析方法。

它用于分析事物之间的统计关系，侧重考察变量之间的数量变化规律，并通过回归方程的形式描述和反映这种关系，帮助人们准确把握变量受其他一个或多个变量影响的程度，进而为预测提供科学依据。

6、什么是聚类分析？

答：

聚类分析是一种建立分类的多元统计分析方法，它能够将一批样本（或变量）数据根据其诸多特征，按照在性质上的亲疏程度（各变量取值上的总体差异程度）在没有先验知识（没有事先指定的分类标准）的情况下进行自动分类，产生多个分类结果。

类内部的个体在特征上具有相似性，不同类间个体特征的差异性较大。

7、简述聚类分析中凝聚方式聚类过程

答：

其过程是，首先，每个个体自成一类；然后，按照某种方法度量所有个体间的亲疏程度，并将其中最“亲密”的个体聚成一小类，形成n-1个类；接下来，再次度量剩余个体和小类间的亲疏程度，并将当前最亲密的个体或小类再聚到一类；重复上述过程，直到所有个体聚成一个大类为止。

可见，这种聚类方式对n个个体通过n-1步可凝聚成一大类。

8、简述聚类分析中分解方式聚类过程

答：

其过程是，首先，所有个体都属一大类；然后，按照某种方法度量所有个体间的亲疏程度，将大类中彼此间最“疏远”的个体分离出去，形成两类；接下来，再次度量类中剩余个体间的亲疏程度，并将最疏远的个体再分离出去；重复上述过程，不断进行类分解，直到所有个体自成一类为止。

可见，这种聚类方式对包含n个个体的大类通过n-1步可分解成n个个体。

9、假设检验的基本思想。

答：

假设检验的基本思路是首先对总体参数提出假设，然后再利用样本告知的信息去验证先前提出的假设是否成立。

如果样本数据不能够充分证明和支持假设，则在一定的概率条件下，应拒绝假设；相反，如果不能够充分证明和支持假设是不成立的，则不能推翻假设成立的合理性和真实性。

上述假设检验推断过程所依据的原理是小概率原理。

10、简述假设检验的步骤

答：

提出原假设（零假设）H0；

确定适当的检验统计量；

计算检验统计量的值发生的概率（P值）；

给定显著性水平α；

作出统计决策。

11、多选项分析有两种方法：

（1）多选项二分法；

（2）多选项分类法。

三、分析题（共50分）

1、根据保险公司人员构成情况数据，分析全国性保险公司与外资和合资保险公司中具有高等教育水平员工比例的均值有无显著差异？

为什么？

分析全国性保险公司与外资和合资保险公司中年轻人比例的均值有无显著差异？

为什么？

（显著性水平α=0.05）

GroupStatistics

公司类别

Mean

Std.Deviation

Std.ErrorMean

年轻人比例

全国性公司

.5923

.11386

.04026

外资和中外合资

.7940

.11018

.02755

受高等教育比例

全国性公司

.6657

.16957

.05995

外资和中外合资

.8257

.13178

.04167

IndependentSamplesTest

年轻人比例

受高等教育比例

Equalvariancesassumed

Equalvariancesnotassumed

Equalvariancesassumed

Equalvariancesnotassumed

Levene'sTestforEqualityofVariances

.181

.912

Sig.

.675

.354

t-testforEqualityofMeans

-4.183

-4.135

-2.256

-2.191

13.689

13.032

Sig.（2-tailed）

.000

.001

.038

.047

MeanDifference

-.20169

-.16000

Std.ErrorDifference

.04822

.04878

.07091

.07301

95%ConfidenceIntervaloftheDifference

Lower

-.30170

-.30653

-.31033

-.31770

Upper

-.10168

-.09685

-.00968

-.00231

答：

上述问题的两个原假设分别为：

两类公司中具有高等教育水平员工比例均值无显著差异。

H0:

μ1-μ2=0

两类公司中年轻人比例均值无显著差异。

H0:

μ1-μ2=0

由上表可知：

全国性公司、外资和中外合资公司中，外资和中外合资公司具有高等教育水平员工比例均值要高于全国性公司。

通过检验应推断这种差异是由于抽样误差造成的还是系统性的。

分析结论应通过两步完成：

第一步，两总体方差是否相等的F检验。

该检验的F统计量的观察值为0.912，对应的概率P-值为0.354.显著性水平α=0.05，由于概率P-值大于0.05，可以认为两总体方差无显著性差异。

第二步，两总体均值的检验。

在第一步中，由于两总体方差无显著性差异，因此应看第一列t检验结果。

T统计量的观测值为-2.256，对应的双尾概率P-值为0.038，显著性水平α=0.05，由于概率P-值小于0.05，可以认为两总体的均值存在显著性差异，即国性保险公司与外资和合资保险公司中具有高等教育水平员工比例的均值有显著差异。

同时两总体均值差的95%置信区间没有跨零，也从另一角度证实了这一结论。

由上表可知：

全国性公司、外资和中外合资公司中，外资和中外合资公司年轻人比例均值要高于全国性公司。

通过检验应推断这种差异是由于抽样误差造成的还是系统性的。

分析结论应通过两步完成：

第一步，两总体方差是否相等的F检验。

该检验的F统计量的观察值为0.181，对应的概率P-值为0.657.显著性水平α=0.05，由于概率P-值大于0.05，可以认为两总体方差无显著性差异。

第二步，两总体均值的检验。

在第一步中，由于两总体方差无显著性差异，因此应看第一列t检验结果。

T统计量的观测值为-4.183，对应的双尾概率P-值为0.000，显著性水平α=0.05，由于概率P-值小于0.05，可以认为两总体的均值存在显著性差异，即国性保险公司与外资和合资保险公司中年轻人比例的均值有显著差异。

同时两总体均值差的95%置信区间没有跨零，也从另一角度证实了这一结论。

1、根据保险公司人员构成情况数据，分析全国性保险公司与区域性公司中具有高等教育水平员工比例的均值有无显著差异？

为什么？

分析全国性保险公司与区域性公司中年轻人比例的均值有无显著差异？

为什么？

（显著性水平α=0.05）

GroupStatistics

公司类别

Mean

Std.Deviation

Std.ErrorMean

年轻人比例

全国性公司

.5923

.11386

.04026

区域性公司

.5593

.16133

.11408

受高等教育比例

全国性公司

.6657

.16957

.05995

区域性公司

.5689

展开阅读全文