1、SPSS应用软件试验指导手册SPSS工具简介统计要与大量的数据打交道,涉及繁杂的计算和图表绘制。现代的数据分析工作如果离开统计软件几乎是无法正常开展。在准确理解和掌握了各种统计方法原理之后,再来掌握一两种统计分析软件的实际操作,是十分必要的。常见的统计软件有SAS,SPSS,SPLUS,MINITAB,EXCEL等。这些统计软件的功能和作用大同小异,各自有所侧重。其中的SAS和SPSS是目前在大型企业、各类院校以及科研机构中较为流行的两种统计软件。特别是SPSS,其界面友好、功能强大、易学、易用,包含了几乎全部尖端的统计分析方法,具备完善的数据定义、操作管理和开放的数据接口以及灵活而美观的统计
2、图表制作。SPSS在各类院校以及科研机构中更为流行。在本试验课程中我们选择SPSS作为统计分析应用试验活动的工具。SPSS(StatisticalProductandServiceSolutions,意为统计产品与服务解决方案)。自20世纪60年代SPSS诞生以来,为适应各种操作系统平台的要求经历了多次版本更新,各种版本的SPSSforWindows大同小异,本次试验的试验工具选择了SPSSforWindows19.0中文版。1 SPSS的运行模式Spss主要有四种运行模式:(1) 批处理模式这种模式把已编写好的程序(语句程序)存为一个文件,提交给开始菜单上SPSSforWindowsProd
3、uctionModeFacility程序运行。(2) 完全窗口菜单运行模式这种模式通过选择窗口菜单和对话框完成各种操作。用户无须学会编程,简单易用。(3) 程序运行模式这种模式是在语句(Syntax)窗口中直接运行编写好的程序或者在脚本(script)窗口中运行脚本程序的一种运行方式。这种模式要求掌握SPSS的语句或脚本语言。(4) 混合运行模式以上各种方法的综合运行方式。本试验指导手册为初学者提供入门试验教程,采用“完全窗口菜单运行模式”。2 SPSS的启动(1) 在windows开始所有程序IBMSPSSStatisticsIBMSPSSStatistics19,即可启动SPSS软件,进入
4、IBMSPSSStatistics19对话框,如图1.1所示。图1.1IBMSPSSStatistics19对话框3 SPSS软件的退出SPSS软件的退出方法与其他Windows应用程序相同,有两种常用的退出方法: 按FileExist的顺序使用菜单命令退出程序。 直接单击SPSS窗口右上角的“关闭”按钮,回答系统提出的是否存盘的问题之后即可安全退出程序。4 SPSS的主要窗口介绍SPSS软件运行过程中会出现多个界面,各个界面用处不同。其中,最主要的界面有四个:数据编辑窗口、结果输出窗口、语法窗口和脚本窗口。(1) 数据编辑窗口启动SPSS后看到的第一个窗口便是数据编辑窗口,如图1.2所示。在
5、数据编辑窗口中可以进行数据的录入、编辑以及变量属性的定义和编辑,是SPSS的基本界面。主要由以下几部分构成:标题栏、菜单栏、工具栏、编辑栏、变量名栏、观测序号、窗口切换标签、状态栏。图1.2数据浏览界面 标题栏:显示数据编辑的数据文件名。 菜单栏:包括SPSS的10个主菜单。通过对这些菜单的选择,用户可以进行几乎所有的SPSS操作。下面分别对这些菜单的主要功能作一个简要介绍,如表1.1所示。关于菜单的详细的操作步骤将在后续实验内容中分别介绍。表1.1SPSS菜单功能简介菜单项功能简介File文件的存取以及打印,外部数据的读取Edit数据的复制、剪切、粘贴等基本的数据编辑功能View数据窗口外观
6、设置Data数据整理的部分功能,包括插入新观测和新变量、数据排序、选取、合并、拆分等Transform数据整理及数据转换功能,包括计算新变量、重新编码等AnalyzeSPSS统计分析程序汇总,包括所有的统计分析功能GraphsSPSS图表绘制程序汇总,包括所有的SPSS绘图功能Utilities包含变量信息、文件信息、定义和使用集合、菜单编辑器等WindowSPSS主窗口的呈现方式设定及窗口的转换Help提供各种类型的SPSS帮助为了方便用户操作,SPSS软件把菜单项中常用的命令放到了工具栏里。当鼠标停留在某个工具栏按钮上时,会自动跳出一个文本框,提示当前按钮的功能。另外,如果用户对系统预设的
7、工具栏设置不满意,也可以用视图工具栏菜单命令对工具栏按钮进行定义。 编辑栏:可以输入数据,以使它显示在内容区指定的方格里。 变量名栏:列出了数据文件中所包含变量的变量名 观测序号:列出了数据文件中的所有观测值。观测的个数通常与样本容量的大小一致。 窗口切换标签:用于“数据视图”和“变量视图”的切换。即数据浏览窗口与变量浏览窗口。数据浏览窗口用于样本数据的查看、录入和修改。变量浏览窗口用于变量属性定义的输入和修改。 状态栏:用于说明显示SPSS当前的运行状态。SPSS被打开时,将会显示“SPSSProcessorisready”的提示信息。(2) 结果输出窗口在SPSS中大多数统计分析结果都将以
8、表和图的形式在结果观察窗口中显示。结果输出窗口如图1.3所示。窗口右边部分显示统计分析结果,左边是导航窗口,用来显示输出结果的目录,可以通过单击目录来展开右边窗口中的统计分析结果。当用户对数据进行某项统计分析,结果输出窗口将被自动调出。当然,用户也可以通过双击后缀名为.spo的SPSS输出结果文件来打开该窗口。图1.2输出窗口界面(3) 语法窗口用户可以在语句窗口中直接编写SPSS命令程序,也可以使用Paste按钮把菜单运行方式下的各种命令和选项粘贴到命令窗口中,再进行进一步修改,然后通过运行主菜单的运行命令将编写好的程序一次性地提交给计算机执行。图1.3语法窗口界面(4) 脚本窗口图1.4脚
9、本窗口界面试验1、实验2参考一、实验目的通过本试验项目,使学生理解并掌握SPSS软件包有关数据文件创建和整理的基本操作,学习如何将收集到的数据输入计算机,建成一个正确的SPSS数据文件,并掌握如何对原始数据文件进行整理,包括数据查询,数据修改、删除,数据的排序等等。二、实验指导SPSS数据文件是一种结构性数据文件,由数据的结构和数据的内容两部分构成,也可以说由变量和观测两部分构成。一个典型的SPSS数据文件如表2.1所示。表2.1SPSS数据文件结构姓名性别年龄张三145李四223王五245SPSS变量的属性SPSS中的变量共有11个属性,分别是变量名(Name)、变量类型(Type)、长度(
10、Width)、小数点位置(Decimals)、变量名标签(Label)、变量名值标签(Value)、缺失值(Missing)、数据列的显示宽度(Columns)、对其方式(Align)、度量尺度(Measure)和角色。定义一个变量至少要定义它的两个属性,即变量名和变量类型,其他属性可以暂时采用系统默认值,待以后分析过程中如果有需要再对其进行设置。在spss数据编辑窗口中单击变量视图标签,进入变量视窗界面(如图2.1所示)即可对变量的各个属性进行设置。图2.1变量视窗1创建一个数据文件数据文件的创建分成三个步骤:(1)选择菜单FileNewdata新建一个数据文件,进入数据编辑窗口。窗口顶部标
11、题为“SPSSDataEditor”。(2)单击左下角VariableView标签进入变量视图界面,根据试验的设计定义每个变量类型。(3)变量定义完成以后,单击DataView标签进入数据视窗界面,将每个具体的变量值录入数据库单元格内。2读取外部数据当前版本的SPSS可以很容易地读取Excel数据,步骤如下:(1)按FileOpendata的顺序使用菜单命令调出OpenFile对话框,在文件类型下拉列表中选择“Excel(*.xls)”,如图2.2所示。图2.2OpenFile对话框(2)选择要打开的Excel文件,单击“打开”按钮,调出OpenExcelDataSource对话框,如图2.3
12、所示。OpenExcelDataSource对话框中各选项的意义如下: Readvariablenamesfromthefirstrowofdata复选框:选中此项,将Excel数据表中第一行的有效字符作为SPSS变量名。 Worksheet下拉列表:选择被读取数据所在的Excel工作表。 Range输入框:用于限制被读取数据在Excel工作表中的位置。图2.3OpenExcelDataSource对话框3数据编辑在SPSS中,对数据进行基本编辑操作的功能集中在Edit菜单中。Edit菜单中的数据编辑功能如下表所示。表2.2Edit菜单项功能说明Undo撤销上一步操作,快捷键为CtrlZRed
13、o恢复上一步被撤销的操作,快捷键为Ctrl+RCut剪切选定内容,快捷键为Ctrl+XCopy复制选定内容,快捷键为CtrlCPaste将剪切或复制内容粘贴到指定位置,快捷键为CtrlVClear删除选定的变量,观测,或清楚选定区域的内容,快捷键为Delete插入变量在指定位置的左侧插入一个变量。插入个案在指定位置的上方插入一个观测转至个案用于数据的定位。定位到设定序号所指定的观测中。转向变量用于变量的定位。4SPSS数据的保存SPSS数据录入并编辑整理完成以后应及时保存,以防数据丢失。保存数据文件可以通过FileSave或者FileSaveas菜单方式来执行。在数据保存对话框(如图2.5所示
14、)中根据不同要求进行SPSS数据保存。图2.5SPSS数据的保存 “文件名”输入框中输入适当的文件名 “保存类型”下拉列表用于选择将数据保存为不同的数据格式 “writevariablesnamestospreadsheet”和“Savevaluelabelswheredefinedinsteadofdatavalues”两个复选框:当保存类型为Excel文件格式时可用。前者用于选择是否将变量名写入Excel文件的第一行,后者用于选择是否用值标签代替变量值写入Excel文件。 Variables按钮用于选择需要保存的变量。单击后弹出如图2.6所示的对话框,在对话框中被选中的变量才会保存到文件中
15、,其余的则不被保存。图2.6选择保存的变量5.数据整理在SPSS中,数据整理的功能主要集中在Data和Transform两个主菜单下。(1)数据排序(SortCase)对数据按照某一个或多个变量的大小排序将有利于对数据的总体浏览,基本操作说明如下: 选择菜单DataSortCase,打开SortCases对话框,如图2.7所示图2.7SortCase对话框 Sortby:选择排序变量。数据将按该变量的大小进行排序。 SortOrder:指定排序方式。其中,Ascending是按排序变量的升序排列,Descending是按降序排列。 选择完毕,点击ok按钮,执行排序命令。(2)抽样(Select
16、Case)在统计分析中,有时不需要对所有的观测进行分析,而可能只对某些特定的对象有兴趣。利用SPSS的SelectCase命令可以实现这种样本筛选的功能。以SPSS安装配套数据文件Employeedata.sav为例,选择Salary大于30000的观测,基本操作说明如下: 打开数据文件Employeedata.sav,选择DataSelectCase命令,打开对话框,如图2.8图2.8SelectCases对话框 指定抽样的方式:Allcases不进行筛选;Ifconditionissatisfied按指定条件进行筛选。本例设置Salary=30000,如图2.9所示;Randomsampl
17、eofcases随机抽取观测;Basedontimeorcaserange按顺序筛选;Usefiltervariable用指定的过虑变量进行筛选。图2.9SelectCasesif对话框设置完成以后,点击continue,进入下一步。 确定未被选择的观测的处理方法,这里选择默认选项filtered。 单击ok进行筛选,结果如图2.10图2.10(3)增加样品的数据合并(MergeFileAddcases)将新数据文件中的观测合并到原数据文件中,在SPSS中实现数据文件纵向合并的方法如下: 选择菜单DataMergeFilesAddCases,打开将个案添加到对话框,如图2.11。 选择外部SP
18、SSStatistics数据文件复选框,点击浏览选择外部数据,并继续,弹出如下对话框。 通过选中IndicatecasesourceasVariable复选框,并在下面的输入框中输入想要的变量名,即可指定生成一个0-1变量来指明合并后的数据文件中观测的来源。这里选择默认设置,点击ok按钮,执行命令之后,可以发现当前数据文件的观测量比原来增加了。图2.11(4)增加变量的数据合并(MergeFileAddvariables)增加变量时指把两个或多个数据文件实现横向对接。例如将不同课程的成绩文件进行合并,收集来的数据被放置在一个新的数据文件中。在SPSS中实现数据文件横向合并的方法如下: 选择菜单
19、DataMergeFilesAddVariables,打开将变量添加到对话框,选择外部数据文件,单击“continue”,弹出AddVariables,如图2.12所示。图2.12 单击Ok执行合并命令。这样,两个数据文件将按观测的顺序一对一地横向合并。(5)数据拆分(SplitFile)在进行统计分析时,经常要对文件中的观测进行分组,然后按组分别进行分析。例如要求按性别不同分组。在SPSS中具体操作如下: 选择菜单DataSplitFile,打开对话框,如图2.13所示。图2.13Splitfile对话框 选择拆分数据后,输出结果的排列方式,该对话框提供了3种方式:Analyzeallcas
20、es,donotcreategroups对全部观测进行分析,不进行拆分;Comparegroups在输出结果种将各组的分析结果放在一起进行比较;Organizeoutputbygroups按组排列输出结果,即单独显示每一分组的分析结果。 选择分组变量 选择数据的排序方式 单击ok按钮,执行操作(6)计算新变量在对数据文件中的数据进行统计分析的过程中,为了更有效地处理数据和反映事务的本质,有时需要对数据文件中的变量加工产生新的变量。比如经常需要把几个变量加总或取加权平均数,SPSS中通过Compute命令来产生这样的新变量,其步骤如下: 选择菜单TransformCompute,打开Comput
21、eVariable对话框,如图2.14所示。图2.14ComputeVariable对话框 再TargetVariable输入框中输入生成的新变量的变量名。单击输入框下面的Type&label按钮,在跳出的对话框中可以对新变量的类型和标签进行设置。 在NumericExpression输入框中输入新变量的计算表达式。例如“age10”。 单击If按钮,弹出IfCases子对话框,如图2.15所示。Includeallcases:对所有的观测进行计算;Includeifcasesatisfiedcondition:仅对满足条件的观测进行计算。 单击Ok按钮,执行命令,则可以在数据文件中看到一个新
22、生成的变量。图2.15Ifcases子对话框实验3参考一、实验目的统计分析的目的在于研究总体特征。但是,由于各种各样的原因,我们能够得到的往往只能是从总体中随机抽取的一部分观察对象,他们构成了样本,只有通过对样本的研究,我们才能对总体的实际情况作出可能的推断。因此描述性统计分析是统计分析的第一步,做好这一步是进行正确统计推断的先决条件。通过描述性统计分析可以大致了解数据的分布类型和特点、数据分布的集中趋势和离散程度,或对数据进行初步的探索性分析(包括检查数据是否有错误,对数据分布特征和规律进行初步观察)。本本试验旨在于:引到学生利用正确的统计方法对数据进行适当的整理和显示,描述并探索出数据内在
23、的数量规律性,掌握统计思想,培养学生学习统计学的兴趣,为继续学习推断统计方法及应用各种统计方法解决实际问题打下必要而坚实的基础。二、实验指导描述统计是统计分析的基础,它包括数据的收集、整理、显示,对数据中有用信息的提取和分析,通常用一些描述统计量来进行分析。集中趋势的特征值:算术平均数、调和平均数、几何平均数、众数、中位数等。其中均数适用于正态分布和对称分布资料,中位数适用于所有分布类型的资料。离散趋势的特征值:全距、内距、平均差、方差、标准差、标准误、离散系数等。其中标准差、方差适用于正态分布资料,标准误实际上反映了样本均数的波动程度。分布特征值:偏态系数、峰度系数、他们反映了数据偏离正态分
24、布的程度。下面给出的一个例题是来自SPSS软件自带的数据文件“Employee.data”,该文件包含某公司员工的工资、工龄、职业等变量,我们将利用此例题给出相关的描述统计说明,本例中,我们将以员工的当前工资为例,计算该公司员工当前工资的一些描述统计量,如均值、频数、方差等描述统计量的计算。1频数分析(Frequencies)基本统计分析往往从频数分析开始。通过频数分析能够了解变量取值的状况,对把握数据的分布特征是非常有用的。比如,在某项调查中,想要知道被调查者的性别分布状况。频数分析的第一个基本任务是编制频数分布表。SPSS中的频数分布表包括的内容有:(1)频数(Frequency)即变量值
25、落在某个区间中的次数。(2)百分比(Percent)即各频数占总样本数的百分比。(3)有效百分比(ValidPercent)即各频数占有效样本数的百分比。这里有效样本数总样本缺失样本数。(4)累计百分比(CumulativePercent)即各百分比逐级累加起来的结果。最终取值为百分之百。频数分析的第二个基本任务是绘制统计图。统计图是一种最为直接的数据刻画方式,能够非常清晰直观地展示变量的取值状况。频数分析中常用的统计图包括:条形图,饼图,直方图等。频数分析的应用步骤在SPSS中的频数分析的实现步骤如下: 选择菜单“FileOpenData”在对话框中找到需要分析的数据文件“SPSS/Empl
26、oyeedata”,然后选择“打开”。 选择菜单“AnalyzeDescriptiveStatisticsFrequencies”。如图2.1所示询问是否输出频数分布表图2.1Frequencies对话框 确定所要分析的变量,例如Gender 在变量选择确定之后,在同一窗口上,点击“Statistics”按钮,打开统计量对话框,如下图2.2所示,选择统计输出选项。图2.2Statistics子对话框(1)PercentileValues栏表2.1PercentileValues栏选项说明选项说明Quartiles显示25%,50%,75%的四分位数值Cutpointsfor_equalgrou
27、ps输入整数k时,表示将所选变量的数值从小到大划分为k等分,并将输出各等分点处的变量数值Percentile(s)右边的小框内,键入0100间的1个数之后,单击Add按钮添加到下面的方框内,此操作过程可以重复。例如输入15,55,85时,输出结果将会显示15%,55%,85%百分位处的变量值。单击Change和Remove按钮可以修改或删除框内的数值。(2)Dispersion(离中趋势)栏各统计量符号表示如下:Stddeviation标准差;Minimum最小值;Variance方差;Maximum最大值;Range极差(3)CentralTendency(集中趋势)栏各统计量符号表示如下:
28、Mean均值(算术平均数);Mode众数;Median中位数;Sum总和(4)Distribution(分布特征)栏各统计量符号表示如下:Skewness偏度;Kurtosis峰度 单击charts按钮,弹出charts子对话框(如图2.3所示),设置生成的统计图,对话框有两个选项栏:图2.3Charts子对话框(1)ChartsType选项栏:设置生成统计图的类型。表2.2ChartsType选项栏选项说明选项说明None不生成任何统计图Barcharts生成条形图Piecharts生成饼图Histograms生成直方图,如果选中该选项,则下面的Withnormalcurve复选框被激活,用
29、户可以选择是否在直方图中加入正态曲线,这样可以直观地将变量的分布与正态分布进行比较。(2)ChartValues选项栏:选择按频数或百分比作图。只有当ChartType选择Barchart或Piecharts时这个选项栏才可用。 单击Format按钮,弹出Format子对话框,对输出的频数分布表的格式进行设置,如图2.4所示。表2.3Format子窗口选项设置说明选项栏设置说明Orderby用于选择频数分布表是按变量值还是按频数排列,是按升序还是降序排列MultipleVariables仅适用于对两个以上变量作频数分析。Comparevariable表示将几个变量的频数分析结果在同一张表中显示
30、,Organizeoutputbyvariables表示将不同变量的频数分析结果在不同的表中显示。Suppresstableswithmorethanncategories如果分类数多余n则不输出频数分布表,这通常使用于变量取值过多时。图2.4Format子对话框 结果输出与分析点击Frequencies对话框中的“OK”按钮,即得到下面的结果。表2.4描述性统计量 StatisticsGenderNValid474Missing0表2.4中给出了总样本量(N),其中变量Gender的有效个数(Valid)为474个、缺失值(missing)为0。 表2.5Gender频数分布表FrequencyPercentValidPercentCumulativePercentValidFemale21645.645.645.6Male25854.454.4100.0Total474100.0100.0表2.5中,Frequency是频数,Percent是按总样本量为分母计算的百分比,ValidPercent是以有效样本量为分母计算的百分比,CumulativePercent是累计百分比。图2.5变量Gender的条形图,图
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1