SPSS概览之数据分析实例详解.docx

上传人:b****5 文档编号:6828995 上传时间:2023-01-10 格式:DOCX 页数:176 大小:1.09MB
下载 相关 举报
SPSS概览之数据分析实例详解.docx_第1页
第1页 / 共176页
SPSS概览之数据分析实例详解.docx_第2页
第2页 / 共176页
SPSS概览之数据分析实例详解.docx_第3页
第3页 / 共176页
SPSS概览之数据分析实例详解.docx_第4页
第4页 / 共176页
SPSS概览之数据分析实例详解.docx_第5页
第5页 / 共176页
点击查看更多>>
下载资源
资源描述

SPSS概览之数据分析实例详解.docx

《SPSS概览之数据分析实例详解.docx》由会员分享,可在线阅读,更多相关《SPSS概览之数据分析实例详解.docx(176页珍藏版)》请在冰豆网上搜索。

SPSS概览之数据分析实例详解.docx

SPSS概览之数据分析实例详解

第一章SPSS概览--数据分析实例详解

1.1数据的输入和保存

1.1.1SPSS的界面

1.1.2定义变量

1.1.3输入数据

1.1.4保存数据

1.2数据的预分析

1.2.1数据的简单描述

1.2.2绘制直方图

1.3按题目要求进行统计分析

1.4保存和导出分析结果

1.4.1保存文件

1.4.2导出分析结果

欢迎加入SPSS使用者的行列,首先祝贺你选择了权威统计软件中界面最为友好,使用最为方便的SPSS来完成自己的工作。

由于该软件极为易学易用(当然还至少要有不太高的英语水平),我们准备在课程安排上做一个新的尝试,即不急于介绍它的界面,而是先从一个数据分析实例入手:

当你将这个例题做完,SPSS的基本使用方法也就已经被你掌握了。

从下一章开始,我们再详细介绍SPSS各个模块的精确用法。

我们教学时是以SPSS10.0版为蓝本讲述的--什么?

你还在用7.0版!

那好,由于10.0版在数据管理的界面操作上和以前版本有较大区别,本章我们将特别照顾一下老版本,在数据管理界面操作上将按9.0及以前版本的情况讲述,但具体的统计分析功能则按10.0版本讲述。

没关系,基本操作是完全一样的。

好,说了这么多废话,等急了吧,就让我们开始吧!

希望了解SPSS10.0版具体情况的朋友请参见本网站的SPSS10.0版抢鲜报道。

例1.1某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如下,问该地急性克山病患者与健康人的血磷值是否不同(卫统第三版例4.8)?

患者:

0.841.051.201.201.391.531.671.801.872.072.11

健康人:

0.540.640.640.750.760.811.161.201.341.351.481.561.87

让我们把要做的事情理理顺:

首先要做的肯定是打开计算机(废话),然后进入瘟98或瘟2000(还是废话,以下省去废话2万字),在进入SPSS后,具体工作流程如下:

1.将数据输入SPSS,并存盘以防断电。

2.进行必要的预分析(分布图、均数标准差的描述等),以确定应采用的检验方法。

3.按题目要求进行统计分析。

4.保存和导出分析结果。

下面就按这几步依次讲解。

§1.1数据的输入和保存

1.1.1SPSS的界面

当打开SPSS后,展现在我们面前的界面如下:

请将鼠标在上图中的各处停留,很快就会弹出相应部位的名称。

请注意窗口顶部显示为“SPSSforWindowsDataEditor”,表明现在所看到的是SPSS的数据管理窗口。

这是一个典型的Windows软件界面,有菜单栏、工具栏。

特别的,工具栏下方的是数据栏,数据栏下方则是数据管理窗口的主界面。

该界面和EXCEL极为相似,由若干行和列组成,每行对应了一条记录,每列则对应了一个变量。

由于现在我们没有输入任何数据,所以行、列的标号都是灰色的。

请注意第一行第一列的单元格边框为深色,表明该数据单元格为当前单元格。

对Windows操作界面不熟悉的朋友可参见SAS入门第一课中的相关内容。

对数据表界面操作不熟悉的朋友可先学习一下EXCEL的操作(因为它的帮助是中文的)。

有的SPSS系统打开时会出现一个导航对话框,请单击右下方的Cancer按钮,即可进入上面的主界面。

1.1.2定义变量

该资料是定量资料,设计为成组设计,因此我们需要建立两个变量,一个变量代表血磷值,习惯上取名为X,另一个变量代表观察对象是健康人还是克山病人,习惯上取名为GROUP。

对数据的统计分析格式不太熟悉的朋友请先学习统计软件第一课。

选择菜单Data==>DefineVariable。

系统弹出定义变量对话框如下:

该变量定义对话框在SPSS10.0版中已被取消,这里的操作只适合9.0~7.0版的用户。

对话框最上方为变量名,现在显示为“VAR00001”,这是系统的默认变量名;往下是变量情况描述,可以看到系统默认该变量为数值型,长度为8,有两位小数位,尚无缺失值,显示对齐方式为右对齐;第三部分为四个设置更改按钮,分别可以设定变量类型、标签、缺失值和列显示格式;第四部分实际上是用来定义变量属于数值变量、有序分类变量还是无序分类变量,现在系统默认新变量为数值变量;最下方则依次是确定、取消和帮助按钮。

好,先来建立分组变量GROUP。

请将变量名改为GROUP,然后单击OK按钮。

有没有搞错?

折腾了半天就改个名字!

难道连变量格式、标签等都不改?

是这样的,在SPSS中所有的数据均以最大位数保存(好象是双精度),也就是说,上面虽然默认只有两位小数,但那指的是计算精度,实际保存的数据位数是非常长的(可以输入Pi值试一下)。

在绝大多数情况下,SPSS给出的默认数据类型和数据精度完全可以满足需要,只是不太好看而已。

至于标签等比较花哨的选项,反正我也很少用。

现在我们才刚刚入门,一切从简。

以后我会详细介绍各种设置的用法。

在第一列灰色的“var”上双击,同样会弹出定义变量对话框。

现在SPSS的数据管理窗口如下所示:

第一列的名称已经改为了“group”,这就是我们所定义的新变量“group”。

现在我们来建立变量X。

单击第一行第二列的单元格,然后选择菜单Data==>DefineVariable,同样,将变量名改为X,然后确认。

此时SPSS的数据管理窗口如下所示:

现在,第一、第二列的名称均为深色显示,表明这两列已经被定义为变量,其余各列的名称仍为灰色的“var”,表示尚未使用。

同样地,各行的标号也为灰色,表明现在还未输入过数据,即该数据集内没有记录。

1.1.3输入数据

我们先来输入变量X的值,请确认一行二列单元格为当前单元格,弃鼠标而用键盘,输入第一个数据0.84,此时界面显示如图A所示:

图A

图B

请注意:

在回车之前,你输入的数据在数据栏内显示,而不是在单元格内显示,现在回车,界面如图B所示:

首先,当前单元格下移,变成了二行二列单元格,而一行二列单元格的内容则被替换成了0.84;其次,第一行的标号变黑,表明该行已输入了数据;第三,一行一列单元格因为没有输入过数据,显示为“.”,这代表该数据为缺失值。

用类似的输入方式,我们将患者的血磷值输入完毕,并将相应的变量GROUP均取值为1,此时数据管理窗口如下所示:

从第12行开始输入健康人的数据,并将相应的GROUP变量取值为2。

最终该数据集应该有24条记录。

1.1.4保存数据

选择菜单File==>Save,由于该数据从来没有被保存过,所以弹出Saveas对话框如下:

单击保存类型列表框,可以看到SPSS所支持的各种数据类型,有DBF、FoxPro、EXCEL、ACCESS等,这里我们仍然将其存为SPSS自己的数据格式(*.sav文件)。

在文件名框内键入Li1_1并回车,可以看到数据管理窗口左上角由Untitled变为了现在的变量名Li1_1。

为什么这里的对话框会出现汉字?

是这样的,需要从编程的角度来解释:

SPSS在弹出该对话框时会调用Windows系统的公用函数,由于我们用的是中文Windows系统,所以调用出来的就是中文。

§1.2数据的预分析

1.2.1数据的简单描述

首先我们需要知道数据的基本情况,如均数、标准差等。

选择Analyze==>DescriptiveStatistics==>Descriptives菜单,系统弹出描述对话框如下:

如果按SPSS标准的叫法,这里应该是调用了Descriptives过程,为了避免太生硬,我们称为调用对话框,等大家熟悉SPSS了以后,在统计分析各章中可能两种称呼会混用。

该对话框可分为左右两大部分,左侧为所有可用的侯选变量列表,右侧为选入变量列表。

我们只需要描述X,用鼠标选中X,单击中间的

,变量X的标签就会移入右侧,注意这时OK按钮变黑,表明已经可以进行分析了,单击它,系统会弹出一个新的界面如下所示:

该窗口上方的名称为SPSSforWindowsViewer,即(结果)浏览窗口,整个的结构和资源管理器类似,左侧为导航栏,右侧为具体的输出结果。

结果表格给出了样本数、最小值、最大值、均数和标准差这几个常用的统计量。

从中可以看到,24个数据总的均数为1.2846,标准差为0.4687。

我们以上的做法对吗?

当然有问题!

光看总的描述是不够的,还应当看看分组的描述情况。

这里要用到文件分割功能,请切换回数据管理窗口,选择Data==>SplitFile菜单,系统弹出文件分割对话框如下:

选择单选按钮Organizeoutputbygroups,将变量GROUP选入右侧的选入变量框,单击OK钮,此时界面不会有任何改变,但请再做一次数据描述,你就可以看到现在数据是分Group=1和Group=2两种情况在描述了!

从描述可知两组的均数和标准差分别为1.5209、1.0846和0.4218、0.4221。

如果定义了文件分割,则它会在以后的所有统计分析中起作用,直到你重新定义文件分割方式为止。

1.2.2绘制直方图

统计指标只能给出数据的大致情况,没有直方图那样直观,我们就来画个直方图瞧瞧!

选择Graphs==>Histogram,系统会弹出绘制直方图对话框如下:

将变量X选入Variable选择框内,单击OK按钮。

此时结果浏览窗口内会绘制出如下两个直方图:

两组的数据没有特别偏的分布,也没有十分突出的离群值,因此无须变换,可以直接采用参数分析方法来分析。

综合设计类型,最终确定采用成组设计两样本均数比较的t检验来分析。

最后,我们还要取消变量分割,免得它影响以后的统计分析,再次调出变量分割对话框,选择单选按钮中的“Analyzeallcases,donotcreatgroup”,单击OK按钮就可以了。

§1.3按题目要求进行统计分析

下面我们要用SPSS来做成组设计两样本均数比较的t检验,选择Analyze==>CompareMeans==>Independent-SamplesTtest,系统弹出两样本t检验对话框如下:

  将变量X选入test框内,变量group选入grouping框内,注意这时下面的DefineGroups按钮变黑,表示该按钮可用,单击它,系统弹出比较组定义对话框如右图所示:

该对话框用于定义是哪两组相比,在两个group框内分别输入1和2,表明是变量group取值为1和2的两组相比。

然后单击Continue按钮,再单击OK按钮,系统经过计算后会弹出结果浏览窗口,首先给出的是两组的基本情况描述,如样本量、均数等(糟糕,刚才的半天工夫白费了),然后是t检验的结果如下:

IndependentSamplesTest

 

Levene'sTestforEqualityofVariances

t-testforEqualityofMeans

F

Sig.

t

df

Sig.(2-tailed)

MeanDifference

Std.ErrorDifference

95%ConfidenceIntervaloftheDifference

Lower

Upper

X

Equalvariancesassumed

.032

.860

2.524

22

.019

.4363

.1729

7.777E-02

.7948

Equalvariancesnotassumed

 

 

2.524

21.353

.020

.4363

.1729

7.716E-02

.7954

可见该结果分为两大部分:

第一部分为Levene's方差齐性检验,用于判断两总体方差是否齐,这里的戒严结果为F=0.032,p=0.860,可见在本例中方差是齐的;第二部分则分别给出两组所在总体方差齐和方差不齐时的t检验结果,由于前面的方差齐性检验结果为方差齐,第二部分就应选用方差齐时的t检验结果,即上面一行列出的t=2.524,ν=22,p=0.019。

从而最终的统计结论为按α=0.05水准,拒绝H0,认为克山病患者与健康人的血磷值不同,从样本均数来看,可认为克山病患者的血磷值较高。

§1.4保存和导出分析结果

1.4.1保存结果文件

前面我们已经做出了分析结果,但是,可是,可但是,但可是呢?

再好的结果只要一断电就会全部消失(废话),对于这一问题人们早已想出了三种解决办法,他们分别是:

∙需要结果的时候再运行一次分析程序。

∙用笔将结果抄在纸上。

∙直接保存结果文件。

显然,最方便快捷、最符合信息时代特征的就是第三种方法,在结果浏览窗口中(注意:

一定要在结果浏览窗口中)选择菜单File==>Save,由于该结果也从来没有被保存过,所以弹出和前面保存数据时极为相似的一个Saveas对话框,和前面相比,他唯一的区别就是文件的保存类型只有ViewFiles(*.spo)一种。

好,闲言少叙,在文件名框中键入“Li1_1”并回车,该结果文件就会按文件名Li1_1.spo被存储。

不是文件保存类型还有一种“ALLFiles(*.*)”吗?

别费劲了,这种类型是SPSS公司放在那里哄人的,在该对话框里无论怎么折腾,都只能按SPO文件的格式来保存。

1.4.2导出分析结果

文件倒是保存了,但问题还没有完全解决:

我们从来写文章什么的都用的是文字处理软件,尤其是WORD,可WORD不能直接读取SPO格式的文件,怎么办呢?

没关系,SPSS提供了将结果导出为纯文本格式或网页格式的功能,在结果浏览窗口中选择菜单File==>Export,系统会弹出ExprotOutput对话框如下:

最上方的Export下拉式列表可以选择输出的内容,可以为含图表的输出文档、无图表的输出文档和只有统计图表三种;中部的ExprotFile对话框则填入输出的目标文件名;左下方的ExportWhat单选框可以选择输出结果的哪些部分,可以是所有结果、所有可见结果或只输出选择的结果,一般选输出所有可见结果;右下方的输出文件类型下拉式列表已被我打开,可见里面有网页格式和纯文本格式两种,在一切按所需选择完毕后按OK钮,则结果文件就会输出为你想要的类型。

好,到这里,就象我们刚开始所说的一样,你实际上已经完全掌握了SPSS的基本使用方法。

我们以后将要做的工作就是“百尺竿头,更进一步”,将从下一章开始详细介绍SPSS各个模块的精确用法,使大家能尽快的从SPSS新手向SPSS高手过度。

 

第二章数据文件的管理(上)

2.1 建立与保存数据文件-File菜单

2.1.1 新建数据文件

2.1.2.1 直接打开

2.1.2.2 使用数据库查询打开

2.1.2.3 使用文本导入向导读入文本文件

2.1.2 打开其他格式的数据文件

2.1.3 保存数据文件

2.1.4 File菜单中的其他条目

2.2 编辑数据文件

2.2.1 定义新变量

2.2.1.1 直接定义新变量

2.2.1.2 从原有变量计算新变量-Transform菜单

2.2.2 数据的录入

2.2.2.1 直接录入

2.2.2.2 数据录入技巧

2.3 进一步整理数据文件-Data菜单

 

不言而喻,一切统计分析都是以数据为基础的,因此统计软件的数据管理能力非常重要。

SPSS以其豪华的界面为依托,为用户提供的便捷的数据管理功能,下面我们就来具体看一下。

§2.1 建立与保存数据文件

和大多数应用软件相同,SPSS中数据文件的管理功能基本上都集中在了File菜单上,该菜单的组织结构和WORD等也极为相似,因此这里我们只介绍比较有特色的几个菜单项。

SPSS10.0有三个主要窗口界面:

数据管理窗口、程序编辑窗口和结果浏览窗口;另有两个不常用的窗口:

结果草稿浏览窗口和VBs脚本语言编辑窗口。

他们共享许多菜单项,如File菜单就大部分相同,这里介绍的许多内容在五个窗口中都是通用的。

2.1.1 新建数据文件

如果你正从头开始进行一个新的课题,刚刚把数据收集上来,要做统计分析,自然需要新建一个数据库,然后将所有的数据从纸上请到计算机里。

在SPSS中,新建一个数据库容易的不得了--已经到了什么都不用做的地步!

是这样,当你进入SPSS系统时,系统就已经生成了一个空数据文件,即你看到的空白的数据管理界面。

你只要按自己的需要定义变量,输入数据然后存盘就是了(这些操作马上会讲到)。

2.1.2  打开其他格式的数据文件

凡是做过数据输入工作的人都知道:

这活又费眼睛又累人,出错太多了还要挨批评,非常影响个人的光辉形象。

算了,还是在有限的经费里划几百美元出来雇个打字小姐吧(怎么用美元?

因为我请了个老外!

)。

可是非常不幸,该同志只会用EXCEL2000(又是一个被微软成功洗脑的家伙),数据现已输好,怎么转成SPSS数据文件呢?

没关系,SPSS提供了以下几种方法来打开其他格式的数据文件。

2.1.2.1 直接打开

SPSS现在可以直接读入许多格式的数据文件,其中就包括EXCEL各个版本的数据文件。

选择菜单File==>Open==>Data或直接单击快捷工具栏上的“

”按钮,系统就会弹出OpenFile对话框,单击“文件类型”列表框,在里面能看到直接打开的数据文件格式,分别是:

SPSS(*.sav)

SPSS数据文件(6.0~10.0版)

SPSS/PC+(*.sys)

SPSS4.0版数据文件

Systat(*.syd)

*.syd格式的Systat数据文件

Systat(*.sys)

*.sys格式的Systat数据文件

SPSSportable(*.por)

SPSS便携格式的数据文件

EXCEL(*.xls)

EXCEL数据文件(从5.0版~2000版)

Lotus(*.w*)

Lotus数据文件

SYLK(*.slk)

SYLK数据文件

dBase(*.dbf)

dBase系列数据文件,(从dBaseII~IV)

Text(*.txt)

纯文本格式的数据文件

data(*.dat)

纯文本格式的数据文件

选择所需的文件类型,然后选中需要打开的文件,SPSS就会按你的要求打开你要使用的数据文件,并自动转换为数据SPSS格式。

也许有视力好的朋友会注意到右下方除了“打开”和“取消”两个按钮外,中间还有一个“Paste”按钮,该按钮在SPSS的大多数对话框中都存在,是用于自动生成SPSS程序的,我们以后会专门讲解该问题。

2.1.2.2 使用数据库查询打开

SPSS可以直接打开许多类型的数据文件,但这并不是说它可以打开所有类型的数据文件(废话),比如FoxPro3.0以上版本的*.dbf文件就不能直接打开(有兴趣的话你可以试试)。

为此,SPSS还提供了另一个适用范围更广、但使用上较为专业的数据接口--数据库查询。

实际上,SPSS在这里使用的是一种叫ODBC(OpenDatabaseCapture)的数据接口,该接口被大多数数据库软件和办公软件(如MSOffice)支持,通过它,应用程序可以直接访问以结构化查询语言(SQL)做为数据访问标准的数据库管理系统。

由于SPSS10.0可以直接打开EXCEL所有系列的数据文件,因此数据库查询接口的用处不是很大。

但是,在9.0及以前的版本中,该查询仍是直接打开EXCEL95、97及2000数据文件的唯一办法。

ODBC数据引擎是独立与各种应用软件,直接安装到Windows系统中的,因此你所用的系统中ODBC所支持的数据类型取决于所安装的ODBC引擎的情况。

还好,大多数支持该接口的软件都会在安装光盘上附送该引擎的安装文件(如MSOffice)。

不过有一点要提醒大家,许多机器的OBDC数据引擎安装有问题(尤其是D版),在SPSS中使用它往往要死机。

选择菜单File==>OpenDatabase==>NewQuery,系统会弹出数据库向导的第一个窗口,其中会列出你使用的机器上已安装的所有数据库驱动程序,选中所需的数据源,然后单击下一步,向导会一步一步的提示你如何做,直至将数据读入SPSS。

我原来准备举一个具体例子,但后来发现不同版本的ODBC引擎所弹出的对话框并不相同!

不仅如此,不同的数据驱动程序其对话框也各不相同!

比如说,有的需要你的LoginID和Password,有的又不需要,因此我这里就不再讲了。

由于它使用上太专业(尤其在10.0版中,9.0版还好些),如果确实要用,请找一个对数据库接口比较熟的人来帮你。

2.1.2.3 使用文本导入向导读入文本文件

选择菜单File==>ReadTextData,系统就会弹出OpenFile对话框,对!

和前面的情况完全一样,只是文件类型自动跳到了Text(*.txt)。

实际上,该功能在SPSS中已被整合到了OpenFile对话框中之所以在菜单上保留该条目有两个原因:

1.读入纯文本的情况非常普遍,放在这里更加醒目;2.为了和SPSS老版本的使用上保持兼容。

例2.1现有一数据文件以纯文本的形式存为“c:

\Li2_1.txt”,且第一行为变量名,请将其读入SPSS。

解:

在OpenFile对话框选中相应的文件名并单击“确定”,系统会自动启动文本导入向导对话框如下:

在SPSS10.0中,该向导并没有重新设计,因此仍然有问题被截断无法显示完的情况出现。

可以看到该向导共分6步,这是第一步。

中部为一对单选按钮,问题为“你的文本文件和预定义格式相一致吗?

”,下方为按预定义格式读入的数据文件的预览。

显然,SPSS的预定义格式并没有正确识别该文件。

因此选择“No”并单击“下一步”,系统弹出向导的下一个对话框如下:

最上方的问题是“你的变量是如何排列的?

”,下面的选项分别为Delimite(用某种字符区分)和FixedWidth(固定宽度),一般都是Delimite,第二个问题是“变量名包括在文件最前面了吗?

”,我们当然选“Yes”,单击“下一步”,系统弹出第三个对话框:

最上方的句子意为“第一条记录从第几行开始?

”,右侧可以输入行数。

由于我们所用的数据第一行为变量名,因此这里输入2。

下面的问题是“你的记录是怎样存储在文件中的?

”。

可以是“每一行代表一条记录”,或者“每**个变量代表一条记录”,数据一般都是第一种情况。

下一个问题是“你想导入多少条记录?

”,可以是“所有记录”、“前**条”或“随机导入**%的记录”。

一般也选前者。

单击“下一步”,第四个对话框如下:

我这里写的非常详细,但实际使用中你可以不管大多数问题,因为SPSS一般都能自动正确设置。

最上方的问题为“变量间用的是哪种分隔符?

”,可选的有Tab键、空格、逗号、分号或自行定义的其他符号。

本数据采用的是空格,可见系统已经自动识别并选择了空格,而下方的数据预览窗口显示出了正确的数据读入情况。

单击“下一步”,第五个对话框如下:

上方的提示为“定义在数据预览窗口中所选择的变量。

”。

顾名思义,在这个对话框中你可以在数据预览窗口中选择某一列变量,然后更改其变量名和类型。

当然,在这里我们不用这样做,直接单击“下一步”,系统弹出文本导入向导的最后一个对话框如下:

最上面的问题为“你愿意保存这次的文件(读入)格式设置以备下次使用吗?

”,第二个问题为“你是否愿意将以上操作粘贴为SPSS语句?

”,一般这两个问题我们都可以不管。

单击“完成”,系统最终成功的读入了Li2_1.txt。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 法律文书 > 调解书

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1