1、(3) 定义变量建立数据文件的第一步是定义变量。在数据编辑窗口左下角激活(Variable View)变量定义窗口,如下图在数据窗口中,用户定义数据变量的名称、数据类型、宽度、小数位和标记等信息。变量的数据类型 当鼠标指针移至单元格,单击后该单元格的右边就会显示一个“”按钮,单击该按钮就会显示一个数据类型设置窗口,如下图所示。可供选择的数据类型有:Numeric 标准数值型,系统默认。例如: 12345.67 Comma 逗号数值型。 12,345.67 千分位用逗号 Dot 圆点数值型。 12.345,67 千分位用圆点 Scientific notal 科学记数法。 例如: 1.2E+04
2、 Dat 日期型,有27种形式。 mm/dd/yyyy Dollar 美元型。$12345.67 Custom currency 自定义型。12345.67 String 字符型。width 指定数据字符占据的总个数(包括小数点和小数位)。Decimal 指定小数位。变量标签(Label):有的时候变量名不能正确反映变量含义,有必要给它贴上标签以便识别。这个时候,就在变量定义的标签栏里输入你的注释。变量值标签(Values):变量值标签是用来帮助解释某些变量,特别是分类变量的数值含义。例如,有一个数值变量,0表示女性,1表示男性。此时,为了便于识别这些数值,我们是用变量值标签。在下图的第一个V
3、alue栏输入数值,在第二个Value栏输入数值标签。当两个输入栏输入内容后,Add按钮激活,点击它就定义了变量值标签。如本例,定义了0=女 和1=男 。需要修改和删除,使用Change和Remove按钮。缺失值(Missing): 缺失值是统计分析时,对数据中缺少数据的一种统计识别值。缺失值定义窗口如下图。No missing values 没有定义缺失值,用系统默认值圆点“.”表示。Discrete missing values 可以定义3个缺失值,例如,第一格输入“0”,表示凡为0的数据是缺失值。Range plus one optional discrete missing value
4、 定义取值区间为缺失值。例如,Low:为1,High:为5,Discrete value:为10,表示1至5之间的数据及数值10视为缺失值。数据列的显示宽度(Columns): 显示数据的列宽,默认8个字符。对齐方式(Align): 有左中右3种数据显示方式。度量类型(Measure): 按度量精度将变量分为定量变量(Scale)、等级变量(Orsinal)和定性变量(Nominal)。该选项仅用于统计绘图时坐标轴变量的区分以及决策树模块的变量定义。定量变量,如虫口数、死亡率等;等级变量,如防治效果的好、不好等;定性变量,如害虫抗药性发生,低抗,中抗和高抗。本例中定义如下:(4) 输入数据变量
5、定义完成后,在编辑区选择栏里单击“Data View”卡片,编辑显示区显示为数据编辑。在编辑区中,把与变量名相对应的数据输入到单元格里区,如下图所示。二. 保存数据SPSS可以将数据保存为SPSS(*.sav)、Excel(*.xls)、dBASE(*.dbf)、ASCII(*.dat,*txt)等数据文件形式。保存文件,从菜单选择File-Save(或Save As)命令。在弹出的保存文件对话框里,指定保存路径,输入文件名,确定数据类型,最后单击“保存”按钮。三. 打开数据文件1.调用SPSS数据文件(*.sav)从菜单选择File-Open-Data命令,在弹出的打开文件对话中指定数据文件
6、的路径,文件名框内显示的是SPSS数据文件是系统默认的文件类型“*.sav”,点击所选文件,单击“打开”按钮,或双击所选文件。这样就把该数据文件调入数据编辑窗口中。2.调用ASCII数据文件(文本文件,*.dat, *.txt)文本文件(ASCII)格式是我们经常使用的一种文件格式,也是许多软件都具有的数据交换格式。文本文件分变量固定字符宽度与使用分隔符分开变量格式(,、;)和制表(Tab)两种形式,下面我们用例子来说明其操作。操作过程: (1). 在主菜单中点击“File-Open-Data”命令。(2). 出现打开文件操作窗口,在“查找范围”栏指定文本文件“spss test 1.1.TX
7、T”保存的文件夹;在“文件类型”栏里,单击该输入框或者右边的下拉按钮(三角形按钮),在下拉选项里选中“Text (*.txt)”,然后在文件列表框里选中“spss test 1.1.txt”文件,再单击“打开”按钮,如下图所示。(3). 出现数据引导对话窗口,一共有6个对话窗口。 第一个对话窗口的设置 Does your text file match a predefined format(该文本文件是否与以前定义过的格式匹配?)Yes 选择此项,则“Browse.”按钮被激活,可以将以前定义的文件调出。No 不使用保存过的匹配文件,系统默认。然后点击“下一步”按钮,出现文本输入向导的第二个
8、对话窗口。第二个对话窗的设置(设置变量的分隔方式)图 变量格式和变量名设置How are your variables arranged (变量间分隔方式?):Delimited: 变量间用特殊符号分隔,系统默认; Fixed width: 变量间为固定列宽度,本例选中该项。Are variable names included at top your file (文件顶端是否含变量名? Yes: 文件中第1行为变量; NO: 文件中没有变量名,系统自动给变量命名。本例选中该项。然后点击“下一步”按钮,出现文本输入向导的第三个对话窗口。第三个对话窗口的设置(设置纪录读取方式)The first
9、 case of data begins on which: 指定第一数据从那行开始,本例选1。How many lines represent a case 多少行为一个记录?本例选择1。How many cases do you want to import (读入多少记录?All of the cases: 全部记录。系统默认,本例选中该项;The first 1000 cases: 开始的1000个记录;A random percentage of the cases (approximately): 随机选择一定百分比。然后,点击“下一步”按钮。 在第四个对话窗口的设置(修改变量分割
10、)可以在窗口的数据显示(Data preview)栏里,用鼠标抓住变量分隔竖线,调整竖线位置来符合变量取值宽度。 有如下三种操作:(1)修改变量字符宽度,用鼠标抓住分割线拖移;(2)插入一条分割线,在插入位置点击鼠标左键;(3)删除一条分割线,用鼠标抓住分割线拖移数据窗口。调整完成后,点击“下一步”按钮。在第五个窗口定义变量属性Specifications for variable(s) selected the data preview(设置在数据显示栏选中变量的属性):Variable name: v1 重新定义变量名称。Data: Numeric 重新定义变量的数据类型。在窗口中,先在数
11、据显示栏(Data preview)指定需要定义的变量,然后才在“Variable name”和“Data ”栏输入变量名和数据类型。完成后,点击“下一步”按钮。 第六个对话窗口的设置Would you like to save this file format for future(是否将文件格式存盘) Yes 选此项,“Save as .”按钮激活,单击按钮后,将文件另存到指定的路径。在有相同格式文本文件时调用它来设置。 No 不保存Would you like to paste the syntax(是否存为程序语句文件? Yes 选中此项,则将上述过程保存为程序文件。 No 不保存为程
12、序语句文件,系统默认。设置完成后,在窗口的数据显示框里观察数据读取情况,如果读出的数据不对,可以点击“上一步”按钮,回到前面的对话窗口里进行修正设置。数据显示正确后,点击“下一步”按钮。最后单击“完成”按钮,文本数据就输入到数据编辑窗里,完成了数据的转换过程。3.打开EXCEL文件Microsoft Excel 是使用比较普遍的图表软件,用它保存的数据文件,在SPSS中也能很方便的使用,这里我们介绍其使用的操作过程。首先,我们已经保存有在Excel里显示如下的“EXCEL01.XLS”文件,如下图所示。(1) 在主菜单中选用“File-Open-Data”命令,出现打开文件操作窗口。(2) 在
13、“查找范围”栏指定文本文件“EXCEL01.XLS”保存的文件夹;在“文件类型”栏里,单击该输入框或者右边的下拉三角形按钮,在下拉选项里选中“Excel? (*.xls)”,然后在文件列表框里选中“EXCEL01.XLS”文件,再单击“打开”按钮,或者双击该文件。(3) 出现打开Excel数据文件对话窗Read variable names from the first row of data 变量名称是从数据的第一行读取吗,是点选此项。Worksheet:指定读出Excel文件中的工作表。单击该选框右边的下拉三角形按钮,在出现的工作表中指定,系统缺省指定第一个工作表。Range: ?指定读取
14、数据的范围。其范围按Excel格式书写,例如:A1:D8点击“OK”按钮, Excel数据就输入到数据编辑窗里,完成数据输入转换。总之,SPSS提供了多种数据格式的输入,我们在学习这两种方法后,能举一反三地学习其他的输入方式四.数据整理在主菜单中点击Data菜单命令,弹出数据文件子菜单,如下图。主要功能有:定义时间,插入变量或记录,到某一记录,观测值排序,数据转置,合并文件,数据分类汇总,正交设计方案,折分文件,选择观测值单位,变量加权等。4.1 定义时间变量(Define Dates.)在菜单中选中Data- Define Dates.命令,弹出日期格式设置对话框,在对话框中选中需要的格式。
15、例如,我们要定义一个以天数为单位的日期变量,就在“Cases Are:”栏里选中“Days”,在“First Case ls”的“Day”输入框输入“1”。然后单击 ?OK ?按钮。这样系统就在数据编辑窗口新添加了“DAY_”和“DATE_”两个变量,“DAY_”变量为数值型,“DATE_”变量为字符型。4.2 插入变量(Insert Variable)在数据编辑窗口选定要插入变量位置的后一个变量,可以从工具条直接点击插入变量按钮,或从菜单中选择Data-Insert Variable命令。数据编辑窗口产生一个新的变量列。4.3 插入记录(Insert Case)在数据编辑窗口选定要插入记录位
16、置的后一个记录,可以从工具条直接点击插入记录按钮,或从菜单中选择Data-Insert Case命令。数据编辑窗口产生一个新的记录行。4.4 观察值排序(Sort Cases)从菜单中选择Data- Sort Cases命令,弹出观测值排序对话框。Sort by: 选择排序变量。对所选变量的观测值排序。如果选择了两个以上的变量,其排序结果将按变量在本栏的选入顺序依次排序。Sort Order: 排序方式: Ascending: 升序排列。数值型变量由小到大排列,字符型变量按ABCD字母顺序排列。系统默认项。 Descending: 数值型变量由大到小排列,字符型变量按ZYX字母顺序由后向前排列
17、。4.5 数据转置(Transpose)将工作区数据的行和列互换,使新文件的行是原数据的列,新文件的列是原数据的行。调入文件spss test 1.5.sav,从菜单选择“Data-Transpose.”命令,弹出数据转置对话框如下图。Variable(S): 把需要转换的变量添加到本变量框里。Name Variable: 设置变量转置后的名称变量。如果该变量是字符型,则新变量为原字符;如果该变量为数值型,则新变量名以字母V开头,其后是原数值;若缺省,系统自动生成新变量名。此外,系统自动生成一变量名为“CASE_LBL”的新变量,存放原数据的变量名。完成设置后,单击OK按钮完成转置,系统把转置
18、的数据存放在数据工作区。用户可以在数据编辑窗口,编辑和保存。4.6 合并文件(Merge File)先打开spss test 1.6然后将spss test 1.7合并(1)添加记录将其他文件的记录添加到当前文件中,合并后新数据的记录应该为两文件之和。从菜单选择“Data- Merge File-Add Cases.”命令。选定添加文件后, 单击 打开按钮。弹出添加记录对话框如下图。Unpaired Variables: 显示两个数据文件中变量名及变量类型不完全相同的变量,即不能完全匹配的变量。标有“*”的变量是工作区的变量,标有“+”的变量是连接文件的变量。Variables in New
19、Working Data 连接后新变量显示框。需要连接的变量从左边“Unpaired Variables:”框里添加本框中。Indicate case source as variable 在新数据文件中显示变量记录来源。选中此项后,在新数据文件中建立一个以下框中命名的变量来标记记录来源于那一个文件,0表示原文件,1表示连接的文件。系统缺省的变量名为:source01。要将合并后的数据保存,只能从菜单选择“File- Save As.”命令。(2)添加变量(Add Variables)将其他文件的变量添加到当前文件中。从菜单选择“Data- Merge File-Add Variables.”
20、命令。New Working Data: 显示两个文件中变量名或变量类型不完全相同的变量,这些变量将在合并后的新文件中以独立的变量存在。若想在新文件中不包含某个变量,可选中将它移出,送入Excluded Variables框中。Excluded Variables:若两个文件中有变量名或变量类型相同的变量,则当前文件中的该变量显示在New Working Data框里,连接文件的该变量显示在本框里。若想把连接文件的该变量合并到新文件中并以独立的变量存在,需单击 Rename.按钮给该变量命名。若两个变量是一对关键变量,即每个观测单位的数值大小完全相同,合并到新文件中将成为一列变量,需要调用So
21、rt Cases过程,依该变量值的大小对当前文件中的观测单位排序,然后激活“Match cases on key variables in sort:”选项,说明按关键变量选择观测单位的方式。 Match cases on key variables in sort: 根据关键变量匹配观测单位。Both files provide cases:观测单位由两个数据文件提供。Extemal files is keyed table:保持工作区文件中变量值,并将连接文件与工作区文件关键变量值相等的,指定的变量的数值合并到新文件中。Working Data File is keyed table:保持
22、连接文件中变量值,并将工作区文件与连接文件关键变量值相等的, 指定的变量的数值合并到新文件中。Key Variables:关键变量栏。将“Excluded Variables”栏变量选入本框中4.7 折分文件(Split Files)我们在进行数据处理时,有时需要将某些分类变量进行分层分析,例如对品种感病性中的发病和不发病分别进行分析,此时就需要通过折分文件来实现。我们先在数据编辑窗口打开一个例子文件“spss test 1.5.SAV”,然后在从菜单选择“Data- Split Files”命令,弹出折分文件对话框如下图。 Analyze all cases, do not create g
23、roups: 分析所有观测对象,不进行折分。系统默认。 Compare Groups: 根据分类变量进行分折。选中此项后,“Groups Based on”被激活。若框内选入2个以上的分类变量(最多可选择8个),测分类顺序与选入的顺序相同。 Organize output by Groups: 根据分类变量进行分折(最多可选择8个分类变量)。选择此项后,输出的方式按每一种不同的类组合给出一个完整的结果。而“Compare Groups”选项则是在每一过程的输出时体现所有不同的分类组合。 Sort the file by grouping variables: 按分层变量值将记录由小到大升序排列
24、,然后再折分文件。 File is already sorted: 不排序,文件已经分类排序的选此项。4.8 选择记录(Select Cases)在数据分析时,有时可能只对某些记录感兴趣。例如,在判别分析时,可能用其中90%的记录数据建立判别函数,用其余10%的记录来考核判别函数。此时,可以通过选择记录的操作。我们先在数据编辑窗口打开一个例子文件“spss test 1.5.SAV”,现在只对暴雨前的数据感兴趣。然后,在从菜单选择“Data- Select Cases”命令,弹出选择记录对话框如下图。1)Select: 选择方式 All cases:选择全部记录,系统默认。 If condit
25、ion is satisfied: 选择满足条件的记录。选择此项后, If 按钮被激活,单击该按钮,探出条件设置对话框。本例设置“调查时候=1”如下图所示。 Random Sample of cases: 随机抽取一定比例的观测记录。选择此项后, Sample.按钮被激活,单击该按钮,弹出随机抽取设置对话框。如图所示。Sample Size 样本大小设置:Approximately 20 % of all cases: 按设置栏里输入的百分比抽取记录。本例抽取20%的记录。Exactly 10 Cases from the first 20 cases: 从开始的多少个记录中随机抽取多少个记录
26、。本例是从前20个记录中随机抽取10个记录。 Based on time on case range 按记录编号抽取记录。设置观测记录(Observation:)的起始记录号(First Case),缺省为第1个记录号开始;设置结束记录号(Last Case)。如下图 Use filter variable: 用过滤变量选取记录。过滤变量值大于0的记录将被选取。2) Unselected Cases Are 未被选取记录的处理方式:Filtered:未被选取的记录保留在文件中,出于未被选中状态,其编号内标有对角斜线,其过滤变量赋值为0。Deleted:未被选取的记录从文件中删除。4.9 常用编
27、辑操作 标记编辑数据单一单元:用鼠标对准该单元单击。选择单元块:在数据显示区点拖左键选中单元格区域。选则一个记录:在编号列里点击鼠标左键选则多个记录:在编号列里点击用鼠标左键向上或向下拖移。选则一个变量:在变量名显示行里点击鼠标左键选则多个变量:在变量名显示行里用鼠标左键向左或向右拖移。 数据的剪贴、拷贝或删除在标记的编辑块上,点击鼠标右键,在弹出的菜单里选择Cut/Copy/Clear命令。或者在菜单里选择Edit-Cut/Copy/Clear命令。 数据粘贴在所粘贴的数据单元格上,点击鼠标右键,在弹出的菜单里选择Paste命令。或者在所粘贴的数据单元格上点击鼠标左键,在在菜单里选择Edit
28、-Paste命令。在有些情况下,原始数据难以满足数据分析的要求,需要对原始数据进行适当的转换。SPSS具体强大的数据转换功能,它不仅可以进行简单的变量转换和重新建立分类变量,还可以进行复杂的统计函数运算以及逻辑函数运算。五.数据整理在主菜单中点击Transform命令,弹出数据转换子菜单,如图所示。计算产生变量 重新赋值 测量方位 计数统计 观测值单位排序 自动重新赋值 产生时间序列变量 缺失值代替 随机数 5.1 计算产生变量(Compute.)计算产生变量是根据已存在的变量,经函数计算后,建立新变量或替换原变量值。例如,我们在方差分析中常常要求对百分数和层数描叙的数据作反正弦函数的转换(sin-1SQRT(x)。ARSIN(SQRT(x)首先,打开数据文据文件(spss test 1.9.SAV),将数据调入工作区。然后,从菜单选择Transform- Compute.命令,弹出计算产生变量对话框,如下图:Target Variable: 目标变量名指定栏。可以输入新的变量,也可以输入已有的变量。输入变量后,下边的 Type & Label.按钮就会被激活,点击它出现变量定义的对话框,可以设置以下变量属性。Label
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1