最新SPSS教程第二章2数据编辑与整理.docx
《最新SPSS教程第二章2数据编辑与整理.docx》由会员分享,可在线阅读,更多相关《最新SPSS教程第二章2数据编辑与整理.docx(14页珍藏版)》请在冰豆网上搜索。
最新SPSS教程第二章2数据编辑与整理
二、数据编辑与整理
1数据整理
在主菜单中点击Data菜单命令,弹出数据文件子菜单,如下图。
主要功能有:
定义时间,插入变量或记录,到某一记录,观测值排序,数据转置,合并文件,数据分类汇总,正交设计方案,折分文件,选择观测值单位,变量加权等。
1.1定义时间变量(DefineDates..)
在菜单中选中Data-DefineDates..命令,弹出日期格式设置对话框,在对话框中选中需要的格式。
例如,我们要定义一个以天数为单位的日期变量,就在“CasesAre:
”栏里选中“Days”,在“FirstCasels”的“Day”输入框输入“1”。
然后单击?
OK?
按钮。
这样系统就在数据编辑窗口新添加了“DAY_”和“DATE_”两个变量,“DAY_”变量为数值型,“DATE_”变量为字符型。
1.2插入变量(InsertVariable)
在数据编辑窗口选定要插入变量位置的后一个变量,可以从工具条直接点击插入变量
按钮,或从菜单中选择Data-InsertVariable命令。
数据编辑窗口产生一个新的变量列。
1.3插入记录(InsertCase)
在数据编辑窗口选定要插入记录位置的后一个记录,可以从工具条直接点击插入记录
按钮,或从菜单中选择Data-InsertCase命令。
数据编辑窗口产生一个新的记录行。
1.4观察值排序(SortCases)
从菜单中选择Data-SortCases命令,弹出观测值排序对话框。
Sortby:
选择排序变量。
对所选变量的观测值排序。
如果选择了两个以上的变量,其排序结果将按变量在本栏的选入顺序依次排序。
SortOrder:
排序方式:
⊙Ascending:
升序排列。
数值型变量由小到大排列,字符型变量按ABCD字母顺序排列。
系统默认项。
○Descending:
数值型变量由大到小排列,字符型变量按ZYX字母顺序由后向前排列。
1.5数据转置(Transpose)
将工作区数据的行和列互换,使新文件的行是原数据的列,新文件的列是原数据的行。
从菜单选择“Data-Transpose..”命令,弹出数据转置对话框如下图。
Variable(S):
把需要转换的变量添加到本变量框里。
NameVariable:
设置变量转置后的名称变量。
如果该变量是字符型,则新变量为原字符;如果该变量为数值型,则新变量名以字母V开头,其后是原数值;若缺省,系统自动生成新变量名。
此外,系统自动生成一变量名为“CASE_LBL”的新变量,存放原数据的变量名。
完成设置后,单击OK按钮完成转置,系统把转置的数据存放在数据工作区。
用户可以在数据编辑窗口,编辑和保存。
1.6合并文件(MergeFile)
(1)添加记录
将其他文件的记录添加到当前文件中,合并后新数据的记录应该为两文件之和。
从菜单选择“Data-MergeFile-AddCases..”命令。
选定添加文件后,单击打开按钮。
弹出添加记录对话框如下图。
UnpairedVariables:
显示两个数据文件中变量名及变量类型不完全相同的变量,即不能完全匹配的变量。
标有“*”的变量是工作区的变量,标有“+”的变量是连接文件的变量。
VariablesinNewWorkingData连接后新变量显示框。
需要连接的变量从左边“UnpairedVariables:
”框里添加本框中。
Indicatecasesourceasvariable在新数据文件中显示变量记录来源。
选中此项后,在新数据文件中建立一个以下框中命名的变量来标记记录来源于那一个文件,0表示原文件,1表示连接的文件。
系统缺省的变量名为:
source01。
要将合并后的数据保存,只能从菜单选择“File-SaveAs..”命令。
(2)添加变量(AddVariables)
将其他文件的变量添加到当前文件中。
从菜单选择“Data-MergeFile-AddVariables..”命令。
选定添加文件后,单击打开按钮。
弹出添加记录对话框如下图。
NewWorkingData:
显示两个文件中变量名或变量类型不完全相同的变量,这些变量将在合并后的新文件中以独立的变量存在。
若想在新文件中不包含某个变量,可选中将它移出,送入ExcludedVariables框中。
ExcludedVariables:
若两个文件中有变量名或变量类型相同的变量,则当前文件中的该变量显示在NewWorkingData框里,连接文件的该变量显示在本框里。
若想把连接文件的该变量合并到新文件中并以独立的变量存在,需单击Rename..按钮给该变量命名。
若两个变量是一对关键变量,即每个观测单位的数值大小完全相同,合并到新文件中将成为一列变量,需要调用SortCases过程,依该变量值的大小对当前文件中的观测单位排序,然后激活“Matchcasesonkeyvariablesinsort:
”选项,说明按关键变量选择观测单位的方式。
□Matchcasesonkeyvariablesinsort:
根据关键变量匹配观测单位。
☉Bothfilesprovidecases:
观测单位由两个数据文件提供。
○Extemalfilesiskeyedtable:
保持工作区文件中变量值,并将连接文件与工作区文件关键变量值相等的,
指定的变量的数值合并到新文件中。
○WorkingDataFileiskeyedtable:
保持连接文件中变量值,并将工作区文件与连接文件关键变量值相等
的,指定的变量的数值合并到新文件中。
KeyVariables:
关键变量栏。
将“ExcludedVariables”栏变量选入本框中。
1.7折分文件(SplitFiles)
我们在进行数据处理时,有时需要将某些分类变量进行分层分析,例如对品种感病性中的发病和不发病分别进行分析,此时就需要通过折分文件来实现。
我们先在数据编辑窗口打开一个例子文件“DATA4-1.SAV”,然后在从菜单选择“Data-SplitFiles”命令,弹出折分文件对话框如下图。
⊙Analyzeallcases,donotcreategroups:
分析所有观测对象,不进行折分。
系统默认。
○CompareGroups:
根据分类变量进行分折。
选中此项后,“GroupsBasedon”被激活。
若框内选入2个以上的分类变量(最多可选择8个),测分类顺序与选入的顺序相同。
○OrganizeoutputbyGroups:
根据分类变量进行分折(最多可选择8个分类变量)。
选择此项后,输出的方式按每一种不同的类组合给出一个完整的结果。
而“CompareGroups”选项则是在每一过程的输出时体现所有不同的分类组合。
⊙Sortthefilebygroupingvariables:
按分层变量值将记录由小到大升序排列,然后再折分文件。
○Fileisalreadysorted:
不排序,文件已经分类排序的选此项。
1.8选择记录(SelectCases)
在数据分析时,有时可能只对某些记录感兴趣。
例如,在判别分析时,可能用其中90%的记录数据建立判别函数,用其余10%的记录来考核判别函数。
此时,可以通过选择记录的操作。
我们先在数据编辑窗口打开一个例子文件“DATA4-1.SAV”,现在只对暴雨前的数据感兴趣。
然后,在从菜单选择“Data-SelectCases”命令,弹出选择记录对话框如下图。
1)Select:
选择方式
①Allcases:
选择全部记录,系统默认。
②Ifconditionissatisfied:
选择满足条件的记录。
选择此项后,If…按钮被激活,单击该按钮,探出条件设置对话框。
本例设置“调查时候=1”如下图所示。
③RandomSampleofcases:
随机抽取一定比例的观测记录。
选择此项后,[Sample..]按钮被激活,单击该按钮,弹出随机抽取设置对话框。
如图所示。
SampleSize样本大小设置:
∙Approximately20%ofallcases:
按设置栏里输入的百分比抽取记录。
本例抽取20%的记录。
∙Exactly10Casesfromthefirst20cases:
从开始的多少个记录中随机抽取多少个记录。
本例是从前20个
记录中随机抽取10个记录。
④Basedontimeoncaserange按记录编号抽取记录。
设置观测记录(Observation:
)的起始记录号(FirstCase),缺省为第1个记录号开始;设置结束记录号(LastCase)。
如下图
⑤Usefiltervariable:
用过滤变量选取记录。
过滤变量值大于0的记录将被选取。
2)UnselectedCasesAre未被选取记录的处理方式:
⊙Filtered:
未被选取的记录保留在文件中,出于未被选中状态,其编号内标有对角斜线,其过滤变量赋值为0。
○Deleted:
未被选取的记录从文件中删除。
1.9常用编辑操作
①标记编辑数据
单一单元:
用鼠标对准该单元单击。
选择单元块:
在数据显示区点拖左键选中单元格区域。
选则一个记录:
在编号列里点击鼠标左键
选则多个记录:
在编号列里点击用鼠标左键向上或向下拖移。
选则一个变量:
在变量名显示行里点击鼠标左键
选则多个变量:
在变量名显示行里用鼠标左键向左或向右拖移。
②数据的剪贴、拷贝或删除
在标记的编辑块上,点击鼠标右键,在弹出的菜单里选择Cut/Copy/Clear命令。
或者在菜单里选择Edit-Cut/Copy/Clear命令。
③数据粘贴
在所粘贴的数据单元格上,点击鼠标右键,在弹出的菜单里选择Paste命令。
或者在所粘贴的数据单元格上点击鼠标左键,在在菜单里选择Edit-Paste命令。
2数据转换(Transform)
在有些情况下,原始数据难以满足数据分析的要求,需要对原始数据进行适当的转换。
SPSS具体强大的数据转换功能,它不仅可以进行简单的变量转换和重新建立分类变量,还可以进行复杂的统计函数运算以及逻辑函数运算。
在主菜单中点击Transform命令,弹出数据转换子菜单,如图所示。
计算产生变量
重新赋值
测量方位
计数统计
观测值单位排序
自动重新赋值
产生时间序列变量
缺失值代替
随机数
据统计,上海国民经济持续快速增长。
03全年就实现国内生产总值(GDP)6250.81亿元,按可比价格计算,比上年增长11.8%。
第三产业的增速受非典影响而有所减缓,全年实现增加值3027.11亿元,增长8%,增幅比上年下降2个百分点。
2.1计算产生变量(Compute..)
计算产生变量是根据已存在的变量,经函数计算后,建立新变量或替换原变量值。
调研提纲:
例如,我们在方差分析中常常要求对百分数和层数描叙的数据作反正弦函数的转换(sin-1SQRT(x))。
ARSIN(SQRT(x))
此次调查以女生为主,男生只占很少比例,调查发现58%的学生月生活费基本在400元左右,其具体分布如(图1-1)首先,打开数据文据文件(DATA1-1.SAV),将数据调入工作区。
然后,从菜单选择Transform-Compute..命令,弹出计算产生变量对话框,如下图:
8、你是如何得志DIY手工艺制品的?
TargetVariable:
目标变量名指定栏。
可以输入新的变量,也可以输入已有的变量。
输入变量后,下边的[Type&Label..]按钮就会被激活,点击它出现变量定义的对话框,可以设置以下变量属性。
十几年的学校教育让我们大学生掌握了足够的科学文化知识,深韵的文化底子为我们创业奠定了一定的基础。
特别是在大学期间,我们学到的不单单是书本知识,假期的打工经验也帮了大忙。
Label栏:
⊙Label输入标签名。
○Useexpressionaslabel:
以数学表达式作为标签。
Type栏:
⊙UseExpressionaslabel:
数字型变量
○String字符型变量,Width:
8字符宽度。
NumericExpression:
数学表达式输入
使用键盘或利用系统提供的计算面板输入数学表达式。
也可以将Functions(函数)框里的函数选入表达式中。
系统提供了70多种函数,它包括算术函数,统计函数,分布函数,日期函数,缺失值函数和字符函数。
(四)DIY手工艺品的“个性化”If…定义条件
⊙Includeallcases:
包括所有记录。
○Includeifcasessatisfiescondition:
符合条件的记录。
选中此项后,条件输入框激活,在此框中输入
变量的逻辑表达式。
SPSS算术函数
函数
(2)文化优势说明
我们认为:
创业是一个整合的过程,它需要合作、互助。
大学生创业“独木难支”。
在知识经济时代,事业的成功来自于合作,团队精神。
创业更能培养了我们的团队精神。
我们一个集体的智慧、力量一定能够展示我们当代大学生的耐心.勇气和坚强的毅力。
能够努力克服自身的弱点,取得创业的成功。
示例(x=3.6,y=2)
ABS(x)
(二)创业弱势分析绝对值函数
因此不难看出,自制饰品在校园里也大有市场所在。
对于那些走在流行前端的女生来说,〝捕捉〞新事物便〝捕捉〞到了时尚与个性。
ABS(y-x)→1.6
ARTAN(x)
反正切函数,得弧度值
ARTAN(y)→1.11
ARSIN(x)
反正弦函数,得弧度值
ARSIN(x/4)→1.12
COS(x)
余弦函数(弧度单位)
COS(y)→0.47
EXP(x)
以e为底的指数函数
EXP(y)→7.39
LG10(x)
以10为底的对数函数
LG10(y*100)→2.3
LN(x)
以e为底的对数函数
LN(y)→0.69
MOD(x)
取余函数
MOD(x,y)→1.6
RND(x)
四舍五入后去正
RND(x)→4
SIN(x)
正弦函数(弧度单位)
SIN(y)→0.909
SQRT(x)
平方根函数
SQRT(y)→1.41
TRUNC(x)
取整函数
TRUNC(x)→3
注:
x可以是变量、常量,也可以是函数。
2.2自动重新赋值(AutomaticRecode)
有的时候,我们需要重新把数值变量或字符变量按它本身的数值大小转换成为从1开始的顺序整数,并存放在新变量对应的记录中。
首先,打开数据文据文件(DATA3-1.SAV),将数据调入工作区。
然后,从菜单选择“Transform-AutomaticRecode”命令,弹出连续型变量转换为分类变量对话框,如下图:
操作步骤:
1)从左边数据变量栏里把变量选入到右边的“Variable->NewName”框中。
2)在“NewName:
”输入新变量名称后,点击[AddNewName]按钮加入到“Variable->NewName”框中。
3)在“RecodeStartingfrom”设置赋值顺序,有以下两种顺序:
⊙Lowestvalue:
按从小到大顺序,赋值为1开始的顺序整数。
○Highestvalus:
按从大到小顺序,赋值为1开始的顺序整数。
4)单击[OK]按钮,执行转换。