SpSS使用.docx
《SpSS使用.docx》由会员分享,可在线阅读,更多相关《SpSS使用.docx(19页珍藏版)》请在冰豆网上搜索。
SpSS使用
随着速度越来越快,计算机的功能越来越多,计算统计功能反而已经成为了计算机的一个次要部分.不过,对于我们这些从事社会学学习和研究的人来说,快速的计算和统计仍旧是我们使用计算机的主要功能,所以我们平日的工作总是离不开SPSS(StatisticalPackagefortheSocialScience社会科学统计软件).SPSS虽然好用,但是学起来并不容易,特别是在目前高校的教育体制下,教材的过时以及课程设置的不合理,使得SPSS的学习成为了社会学,统计学以及其他社会科学学科学生极为头痛的一件事情.更为棘手的是:
往往在学生还没有学会SPSS之前,一些调查研究任务却又强迫他们使用SPSS进行分析工作,使得他们十分苦恼.
本教程就是为那些已经学习过统计学,并且粗通计算机,但尚未学习过SPSS的社会科学学科的学生准备的,运用面向问题的教学方法,通过一个调查问卷的具体分析过程使学生们对SPSS有一个感性认识,并能够再没有完全掌握SPSS的前提下利用SPSS完成一些分析任务.因此,本文不强调面面俱到,只强调读者能够完成调查分析的任务,所以会故意忽略SPSS一些十分重要但未必会用到的功能,还请读者见谅.如果读者确实需要使用这些功能,建议参考一本好一点的辅导书.
相信大家知道:
依次完整的利用计算机辅助的问卷调查包括问卷设计,问卷访问,数据输入,数据分析,数据输出,调查报告的撰写六大部分.SPSS软件参与的主要是数据输入,数据分析和数据输出这三个部分.接着,本文就将分成这三块,分别介绍SPSS的使用以及一些技巧,经验.
数据输入
在完成了问卷访问这个部分之后,我们手中便拥有了数百至上万份调查问卷,这些问卷计算机是无法直接识别处理的,我们必须将它们进行适当的编码.由于采用计算机分析,问卷在设计阶段就应该考虑到今后的编码问题,所以应该将问卷设计地以客观题为主,被访问者填写的应该只是注入数字,选项这些计算机能够处理的信息.我们首先要为问卷的每一个填写项都起一个代号,并决定它的数据属性(主要是区分为字符串,逻辑串还是数字).笔者的习惯是首先用英文字母表示填写项的大题号,接着用阿拉伯数字表示填写项的小题号,然后再用英文字母表示填写项是本小题的第几项,最后再加上表示数据属性的后缀,比如说第二大题第三小题的第四个字符串填写项的代号便为B3D_S.在以后的所有分析过程中便利用这个代号来表示数据的具体内容.
接下来,便是具体的输入过程了.首先,我们要对SPSS的数据文件有一个大致的了解,这对以后的学习十分关键.打开SPSS之后,我们便会看到一个类似EXCEL电子表格的东西,但如果你因此便把SPSS的数据文件理解为是类似于EXCEL的东西那么就错了,虽然SPSS数据的表现形式酷似EXCEL,但就实质而言它更接近于一个数据库文件,每一个数据列都有它的列名称(也就是我们刚刚起的代号),列属性(也就是刚刚我们决定的数据属性),这些都类似于数据库中的字段名称,字段属性,如果读者以前学习过数据库的相关知识,那里理解起来就十分简单了.
由于数据繁多,所以我们的输入过程往往不是由本人进行,而是请专业的数据录入人员代劳,而那些人员往往是不会使用SPSS的,所以我们在实际使用过程中数据往往不是在SPSS中输入的,而是在其它软件输入完毕之后利用SPSS导入的.
在这里,导入用的文件格式是十分重要的.也许大家会习惯性的去选择使用EXCEL来录入数据,因为EXCEL与SPSS比较像.但是在笔者的实际使用过程中发现,最好的文件格式不是EXCEL的XLS文件,而是XBASE系列的DBF文件.之所以作这样的选择理由有两个:
第一,DBF文件的字段名,字段属性这些在SPSS导入过程中都会被直接利用,可以略去了SPSS之后的列名称,列属性设定工作.第二,EXCEL的XLS文件的具体格式并没有向公众公开,所以在实际使用中XLS文件中的中文信息时常会发生丢失的现象.
在利用XBASE输入完文件之后,我们只需要调用SPSS的菜单FILE下的OPEN功能,选择DBASE数据格式打开文件,然后再另存为SPSS的SAV格式便完成了数据输入过程.接下来我们便要进入最为重要的数据分析这个阶段了.
数据分析
对于外行人来说.SPSS最为难学的部分便是它Analyze菜单下十多项子菜单以及这之下四五十项孙菜单的统计功能,每一项统计功能的用法和功能对于外行人来说就像是天书一般.但是对于学习过统计学的读者来说,这应该不是问题.再加上SPSS在操作的简易性上还是十分优秀的,每一项统计功能一般只需要在窗口下选择统计用的变量,然后设置一下必要的选项,最后按下OK便可以了.所以在这里,具体的操作就不再介绍了.在这里,笔者觉得有必要先介绍一下SPSS的Viewer.在下面的数据分析和数据输出过程中,我们调用SPSS的数据分析和制图模块所得到的结果都会由SPSS自动输出到一个名为Viewer的程序中,并且可以以SPO为后缀名保存成为专门的文件.这样做的好处是如果你的分析和制图工作一次没有完成,那么利用保存的SPO文件,就不必下一次重新作过了.同时,将所有的分析和制图的结果都保存在一个SPO文件中,并随调查报告作为电子附件一起陈送给客户,一来有利于客户检验分析的可靠性,二来也适合于今后电子化,网络化的趋势.
根据笔者的经验,SPSS的学习者在这一阶段最主要的问题在于以往学习的统计指标总是中文的,而SPSS中的统计指标是英文的,指标的中文和英文往往无法一一对应,因此,在这一部分中,笔者主要是附上一张统计指标的中英文对照表,如下:
Summarize菜单项
数值分析过程
……Frequencies子菜单项
单变量的频数分布统计
……Descriptives子菜单项
单变量的描述统计
……Explore子菜单项
指定变量的综合描述统计
……Crosstabs子菜单项
双变量或多变量的各水平组合的频数分布统计
CompareMean菜单项
均值比较分析过程
……Means子菜单项
单变量的综合描述统计
……IndependentSampleTtest子菜单项
独立样本的T检验
……PairedSampleTtest子菜单项
配对样本的T检验
……One-WayANOVA子菜单项
一维方差分析(单变量方差分析)
ANOVAModels菜单项
多元方差分析过程
……SimpleFactorial子菜单项
因子设计的方差分析
……GeneralFactorial子菜单项
一般方差分析
……Multivariate子菜单项
双因变量或多因变量的方差分析
……RepeatedFactorial子菜单项
因变量均值校验
Correlate菜单项
相关分析
……Bivariate子菜单项
Pearson积矩相关矩阵和Kendall,Spearman非参数相关分析
……Partial子菜单项
双变量相关分析
……Distance子菜单项
相似性,非相似性分析
Regression菜单项
回归分析
……Liner子菜单项
线性回归分析
……Logistic子菜单项
二分变量回归分析(逻辑回归分析)
……Probit子菜单项
概率分析
……Nonlinear子菜单项
非线性回归分析
……WeightEstimation子菜单项
不同权数的线性回归分析
……2-stageLeastSquares子菜单项
二阶最小平方回归分析
Loglinear菜单项
对数线性回归分析
……General子菜单项
一般对数线性回归分析
……Hierarchical子菜单项
多维交叉变量对数回归分析
……Logit子菜单项
单因变量多自变量回归分析
Classify菜单项
聚类和判别分析
……K-meansCluster子菜单项
指定分类数聚类分析
……HierarchicalCluster子菜单项
未知分类数聚类分析
……Discriminent子菜单项
聚类判别函数分析
DataReduction菜单项
降维,简化数据过程
……Factor子菜单项
因子分析
……CorrespondenceAnalysis子菜单项
对应表(交叉表)分析
……HomogeneityAnalysis子菜单项
多重对应分析
……NonlinearComponents子菜单项
非线性成分分析
……OVERALS子菜单项
非线性典则相关分析
Scale菜单项
……ReliabilityAnanlysis子菜单项
加性等级的项目分析
……MultidimensionalScaling子菜单项
多维等级分析
NonparametricTests菜单项
……Chi-Square子菜单项
相对比例假设检验
……Binomial子菜单项
特定时间发生概率检验
……Run子菜单项
随即序列检验
……1-SampleKolmogorovSmirnov子菜单项
样本分布检验
……2-IndependentSamples子菜单项
双不相关组分布分析
……KIndependentSamples子菜单项
多不相关组分布分析
……2RelatedSamples子菜单项
双相关变量分布分析
……McNemar'test子菜单项
相关样本比例变化分析
……KRelatedSamples子菜单项
相关变量分布分析
……Cocharn'sQtest子菜单项
二分变量均数检验
……Kendall'sW子菜单项
一致性判定
TimeSeries菜单项
……ExponentialSmoothing子菜单项
平衡序列的随机分量
……CurveEstimation子菜单项
数据拟合
……Autoregression子菜单项
一阶自回归误差线性方差检验
……ARIMA子菜单项
综合自回归移动平均分析
……XIIARIMA子菜单项
增倍和加性季节因子分析
……SeasonalDecomposition子菜单项
对时间序列增倍和加性季节因子分析
Survival菜单项
……LifeTables
生命表分析
……Kaplan-Meier
双事件分布检验
……CoxRegression
事件与时间变量相互分析
……Coxw/TimeDeepCOV
时间函数Cox分析
有了这一张表,相信读者便可以很容易的利用SPSS进行各类分析了.实际上,数据分析这一阶段,就使用SPSS上没有什么难度,关键是在于究竟你能够怎样最好的利用SPSS提供的分析模块从数据中挖掘出更多的东西来,这可就要依靠你的不断摸索了.最后,还要介绍一个小技巧:
如果读者所在学校今后学习的SPSS软件为DOS版本的话,那么今后你就必须利用命令行来驾驭SPSS,所以你在利用SPSS的Windows版本进行数据分析的过程中,可以利用每一项统计功能窗口OK按钮下的Paster按钮将本统计功能的命令行复制到剪贴板,然后再仔细研究.
数据输出
经过数据分析,我们已经得到了很多有用的结果了.但是单单是这样是不够的,只有我们将结果撰写成调查报考,才能为人所接受.所以,就很有必要由SPSS输出必要的结果来.
首先便是制图,数字很简洁很精确,但是不够直观,不利于读者更好更迅速的理解调查报考,所以我们应该将数据转化成直观的图形.SPSS的制图能力是极其强大的,能够输出的图形包括条形图,面积图,圆图,高-低-收盘图,极差图,距限图,排列图,帕累托图,工序控制图,误差条图,散点图,直方图,时间序列图,相关图等几十种.
虽然SPSS能够绘制的图形很多,但并没有增加我们的学习难度.事实上,大多数图形绘制需要设置的东西是大同小异的,这里就以最简单的条形图为例进行介绍.
点击菜单中的Graph,然后选择Bar,便会弹出一个窗口让你选择条形图的图式,由简单条形图,分组条形图,分段条形图,根据你的需要,选择一个.然后按下"Define",接着我们选择需要制图的字段,在条形图中只能选择一个字段,其他的图形根据图形本身的特性会有所不同.选择完字段,我们需要设置坐标轴,是按照百分比还是数字或其他方式绘制坐标轴.最后可以利用"Title"按钮设置图形的标题,最后按下"OK",在SPSS的Viewer中便会得到我们需要的图形了.按照以上介绍的方法,将所有需要的图形全部制作完毕,我们便要开始将图形和分析结果正式输出到调查报考中去了.一般来说,我们会使用诸如WORD,WPS2000这类字处理软件来撰写调查报告,由于WINDOWS的剪贴板帮忙,我们只需要简单的利用"复制","粘贴"便可以完成输出了.
值的一提的是,SPSS在输出上为我们考虑的十分周到,可以选择以图片或RTF格式输出.如果你希望将分析结果和图形以图片格式输出,那么选择你需要输出的结果或图形,然后按下鼠标右键,在弹出的菜单中选择"CopyObjects".如果你希望将分析结果和图形以RTF格式输出以便于在字处理软件中进行进一步的编辑,那么在刚才弹出的菜单中选择"Copy"便可以了.
至于这两种方法孰优孰劣,就必须是具体情况而定了.以图片输出的方式虽然牺牲了进一步处理的便利性,但是由于SPSS软件本身便已经具有了一定的标准性,所以它输出的分析结果和图形自然具有一定的权威性;而以RTF格式输出的方式,我们可以将分析结果以及图形中的英文信息替换为中文,并进行必要的增删以增加可读性.如果调查报告的委托人并不熟悉英语或并不是社会学,统计学的专业人士,那么这样的操作就极其有必要了.
预备知识 SPSS使用基础
§1 SPSS入门
启动SPSS后,就进入SPSS数据编辑窗口(SPSSDataEditor)或称数据编辑器,见图1。
数据编辑器包括“DataView”和“VariableView”两个视区,分别定义变量的值(即数据)和变量(名称、类型等)。
图1显示的是“VariableView”视区。
1.一个简单的例子与说明
(1)例1 请将下面表格内容在SPSS数据编辑器中输入。
药品名
产地
生产时间
价格
规格
滴眼液A
中国
2003年4月14日
2.5元
8毫升
滴眼液A
日本
2002年12月2日
2.7元
8毫升
滴眼液A
美国
2002年8月29日
2.85元
8毫升
滴眼液B
美国
2003年2月18日
3.2元
5毫升
先在“VariableView”视区输入变量名称并定义其类型如下:
(不要忘了保存)
完成上述过程后,转到“DataView”视区,输入变量数据如下(数据的输入方式类似Excel):
单击工具栏上的按钮
,看看发生什么情况,由此也可理解“Values”(值标签)的含义。
(2)变量定义说明
● Name:
变量名,定义规则与其它软件中的雷同,如第一个字符必须为字母,后面可跟字母、数字、句点或@、#、_或$等符号,但不能以句点结尾并避免最后一个字符为下划线“_”等。
● Type:
变量类型,参见图2,可以看出变量类型有8种,分别为
① Numeric为数值型变量;
② Comma为逗号型变量:
用句号分割数据的整数和小数,整数部分从个位开始往前逢3位用逗号分隔。
如原始数据12313342.78表示成逗号型为12,313,342.78;
③ Dot为句号型变量:
用逗号分割数据的整数和小数,整数部分从个位开始往前逢3位用句号分隔。
如原始数据12313342.78表示成句点型为12.313.342,78;
④ Scientificnotation为科学计数型变量。
如原始数据1231.3表示成科学计数型为12.313E2;
⑤ Date为日期格式型变量;
⑥ Dollar为美元型变量;
⑦ Customcurrency定制货币型变量,定制方法为:
单击“Edit”菜单下的“Options”选项,显示“Options”对话框如下:
⑧String为字符串型变量。
● Width:
数据或字符串的宽度,默认值为8个字符。
● Decimal:
小数位数。
● Label:
变量标签,用来说明变量所代表的意义。
● Value:
意义见图2。
● Missing:
定义缺失值类型。
● Columns:
定义数据视区中该变量对应列的显示列宽,默认值为8个字符。
● Align:
定义数据在单元中的对齐方式。
● Measure:
定义度量变量类型。
可有Scale、Ordinal和Nominal,它们代表3种变量,在做教互图时经常用到。
Scale可以是数值型、日期型和货币型变量,但不能是字符串型变量;可以是数值型和字符串型变量,一般要求变量有较明显的次序,如年龄、身高等;Nominal与Ordinal一样,只是不要求变量有次序关系,但要有较明显的类别,如性别等。
2.数据的输入
(1)数据输入方法
SPSS有以下几种数据输入方法:
● 直接从数据编辑器中输入(前面已介绍)。
● 用“OpenFile”选择已存在的数据文件读入数据。
● 用“OpenDatabase”读入数据。
● 用“ReadTextData”选择已存在的数据文件读入数据。
下面重点介绍用“OpenFile”读入数据,其余两种读入数据方法的使用程序类似。
用“OpenFile”读入数据操作步骤如下:
①在SPSS数据编辑器中按照“File→Open→Data”可打开“OpenFile”对话框(图4);
图4
②在“OpenFile”对话框中打开“文件类型”下拉列表框(见图4),选中所要读入数据的类型,根据路径找到要读入的文件双击文件名即可。
(2)可读入文件格式说明
● SPSS(*.sav)——SPSS的Windows版本创建的数据文件格式;
● SPSS/PC+(*.sys)——SPSS的Dos版本建立的数据文件格式;
● Systat(*.syd,*.sys)——一种数据(Systatdata)文件;
● SPSSPortable(*.pro)——SPSS创建的一种ASCII码数据文件(portableformat),可用于其它应用软件;
Excel(*.xls)——Excel表格文件;
Lotus(*.w*)——Lotus1-2-3(Lotus3.0,2.0,或1A版本)格式数据文件;
● SYLK(*.slk)——SYLK(symboliclink)格式数据文件,一种电子表格数据文件;
dBASE(*.dbf)——dBASE或FoxBase创建的数据文件;
SASLongFileName(*.sas7dbat)——SAS7-8Windows版本长文件名数据文件;
SASShortFileName(*.sas7)——SAS7-8Windows版本短文件名数据文件;
SASv6forWindows(*.sd2)——SAS6.08Windows版本数据文件;
SASv6forUNIX(*.ssd01)——SAS6.0UNIXWindows版本数据文件;
SASTransport(*.xpt)——SAS转换文件;
Text(*.txt)——ASCII码文本数据文件;
● Data(*.dat)——ASCII码数据文件;
(3)打开Excel数据文件举例
运用SPSS11.xWindows版本可以在数据编辑器中直接打开Excel5.0及其以上版本的数据。
步骤如下:
例2 建立下列Excel数据文件,并用SPSS数据编辑器打开:
在简体中文Excel2000电子表各种建立上述表格文件,并保存为A:
\example2.xls,执行上述“用SPSS打开Excel数据文件步骤”后,可得:
说明:
这里是运用“简体中文Excel2000”建立数据文件的,由于版本和中英文版本之间的差异,运用SPSS11.5打开数据文件时,数据变量的格式会有所不同,在SPSS数据编辑器中需要对变量格式进行调整。
例如变量类型(Type)中的日期(Date)格式,一般情况下简体中文Excel2000中的日期格式在SPSS数据编辑器中都被转换为数值型(Numeric)格式,仅对一些特殊表达的日期格式可以互相转换(见图5a);一般情况下简体中文Excel2000中的货币型数据格式在SPSS数据编辑器中都被转换为数值型(Numeric)格式,仅对一些特殊表达的美元货币格式可以互相转换(见图5b);
在“OpeningExcelDataSource”对话框(见“用SPSS打开Excel数据文件步骤”图),尝试:
① 不再选中复选框“Readvariablenamesfromthefirstrowofdata”,看看结果;
② 在对话框“Range”中输入A2:
D5,看看结果。
通过查看上述结果,可以理解“OpeningExcelDataSource”对话框的运用。
(4)打开ASCII码文本(数据)文件
ASCII码数据文件是常用的一种格式,读取数据的先后顺序是先行后列,从左至右读取。
运用SPSS11.xWindows版本可以在数据编辑器中直接读取ASCII码文本数据。
下面举例来说明运用SPSS数据编辑器读取ASCII码文本数据的步骤如下。
例3在记事本中建立如下文件(保存为A:
\example3.txt):
aa bb cc dd ee 1 2 3 4 7 8 9 8 7 6 4 3 5 76 8 89
56 34 23 2 2 4 5 7
3 4 5 6
试用SPSS数据编辑器读取该文本文件。
步骤如下:
① 打开“OpenFile”对话框(见图4);
② 在文件下拉框中选中“*.txt”,并选中要打开的文件“A:
\example3.txt”可打开“TextImportWizard”对话框如下:
③ 在对话框“TextImportWizard–Step1of6”单击“下一步”:
④在对话框“TextImportWizard–St