1、SPSS统计软件,主讲:刘文平,Dept.of StatisticsHubei University of Economics,Lecture 2 数据输入,第二章 数据管理,本章主要介绍了SPSS的数据输入、数据编辑整理以及数据保存。,数据输入,主要内容:数据文件建立、变量定义和数据录入;数据文件直接读入;数据库查询导入;文本向导导入。,方法一:进入SPSS系统后,单击Ok或Cancel;方法二:选择菜单”File New Data”.,数据文件建立、变量定义和数据录入,数据文件的建立,单击标签栏中的”Variable Viewer”,即切换到变量定义窗口。,定义变量,说明:Name:变量名
2、称,总长度不超过64个字符(32个汉字)。Type:变量类型,主要有以下几种类型:Numeric:数值型 Comma:加逗号的数值型 Dot:三位加点的数值型 Scientific Notation:科学记数型 Date:日期型 String:字符型 Dollar:货币型 Custom Currency:用户自定义型,1、Numeric:数值型,同时定义数值的宽度(Width),即整数部分+小数点+小数部分的位数,默认为8位;定义小数位数(Decimal Places),默认为2位。2、Comma:加显逗号的数值型,即整数部分每3位数加一逗号,其余定义方式同数值型。3、Dot:3位加点数值型,
3、无论数值大小,均以整数形式显示,每3位加一小点(但不是小数点),可定义小数位置,但都显示0,且小数点用逗号表示。如1.2345显示为12.345,00(实际是12345E-4).4、Scientific notation:科学记数型,同时定义数值宽度(Width)和小数位数(Decimal Places),在数据管理窗口中以指数形式显示。如 定义数值宽度为9,小数位数为2,则345.678 显示为3.46E+02。5、Date:日期型,用户可从系统提供的日期显示形式中选择自己需要的。如选择mm/dd/yy形式,则1995年6月25日显示为06/25/95。6、Dollar:货币型,用户可从系统
4、提供的日期显示形式中选择自己需要的,并定义数值宽度和小数位数,显示形式为数值前有。7、Custom currency:常用型,显示为整数部分每3位加一逗号,用户可定义数值宽度和小数位数。如12345.678显示为12,345.678。8、String:字符型,用户可定义字符长度(Characters)以便输入字符。,1、No missing values:没有缺失值;2、Discrete missing values:表示对不连续缺失值,可定义1-3个。如测量身高(厘米)的资料,可定义999为缺失值;性别的资料(男为1、女为2),可定义1为缺失值;3、Range of missing valu
5、es:可定义缺失值的范围。如脉搏资料,可定义09为缺失值;4、Range plus one discrete missing value:可定义缺失值的范围,同时定义另外1个不是这一范围的缺失值。如定义09为脉搏的缺失值,同时定义999也为脉搏的缺失值。,关于缺失值,作 业,建立如下的数据文件:某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如下,问该地急性克山病患者与健康人的血磷值是否不同?患者group1:0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11 健康人group2:0.54 0.64 0.64 0.7
6、5 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87,提示(Tips),在数据视窗的变量名栏双击即可回到变量视窗,且焦点在该变量上;在各种向导里面右击相应项,可显示相应的帮助。,数据输入,数据直接输入;数据直接拷贝;使用Copy和Paste命令。数据文件直接读入 直接读入;数据库查询导入;文本向导导入。,数据文件直接读入,数据库查询读入,数据库查询导入,1.选择菜单”File-Open Database-New Query”,则数据库查询向导弹出如下窗口:,2.单击“下一步”,弹出如下所示窗口,要求输入数据库文件,可直接输入,也可单击”Browse”按钮
7、选择。,3.单击”OK”按钮,数据库弹出如下窗口,要求从输入的数据库文件中选择数据表。从数据表中选择需要检索的字段。,4.单击“下一步”,向导弹出如下窗口,用于设置检索条件。,单击”Prompt for Value”弹出的对话框,5.单击“下一步”,向导弹出如下窗口,用于进行变量的重新定义。,6.单击“下一步”,向导弹出如下窗口,显示前述过程对应的查询SQL语句。可在下面的编辑框内输入该查询的保存地址。,7.单击“完成”,即完成了数据库的导入操作,其数据将显示在SPSS的表格内容区。,文本向导导入,SPSS12.0版本已经打开文本格式数据文件功能整合到菜单”File-Open-Data”中,但
8、为了和老版本的使用上保持兼容,设置了专门的文本格式文件打开菜单”File-Read Text Data”.但二者并没有任何使用上的不同。下面简要说明其操作过程。,1.选择菜单”File-Read Text Data”or“File-Open-Data”,弹出如下窗口。,设置文本文件和预定义格式,2.单击“下一步”,弹出如下窗口。,设置变量,3.单击“下一步”,弹出如下窗口。,导入和存储记录,4.单击“下一步”,弹出如下窗口。,选择分隔符,5.单击“下一步”,弹出如下窗口。,更改变量名和类型,6.单击“下一步”,弹出如下窗口。,保存文件,设置完成的最终结果,7.单击“完成”按钮完成设置,得到结果
9、如下。,连续多个相同值的输入如group变量有连续多个1,如果直接输入,可以在第一格内输入1并回车,然后回到刚才的单元格并单击右键,选择copy,最后用拖放方式选中所有应输入1的单元格,单击右键并选择paste,所有选中的单元格就会都被刚才拷贝的1填充。将EXCEL数据直接引入SPSSExcel已经打开原数据,并且数据量较少的时候,可以直接用拷贝粘贴的方法将数据引入SPSS:先在EXCEL中选中所有的数据(不包括变量名),然后选择拷贝命令;然后切换到SPSS,最好使行1列1单元格成为当前单元格,然后执行粘贴命令,数据就会全部转入SPSS,再定义相应的变量即可。,数据录入技巧,End of th
10、e Lecture 2,SPSS统计软件,主讲:刘文平,Dept.of StatisticsHubei University of Economics,Lecture 3 数据编辑整理,数据的增删,增加一个新变量(列);增加一行数据;增加新的单元格;删除一个变量(列);删除一行数据;删除一个单元格。,主要有:,增加一个新的变量(列)例如要在第2列前增加一个新的列,使原来的第2列右移变成第3列,则有如下的两种方法:方法一、先激活第2列的任一单元格,然后选Data菜单的Insert Variable命令项;方法二、右击第2栏的变量名,则会弹出一个菜单(见下页图),选择Insert Variable
11、即可。系统自动为用户在第2列前插入一个新的变量列,其名称是缺省的如Var00001,原第2列自动向右移一列成为第3列。,右击变量名栏弹出的菜单,增加一行 例如要在第6行前增加一行,使原来的第6行下移成为第7行,则有如下两种方法:方法一、先激活第6行的任一单元格,然后选Data菜单的Insert Cases命令项;方法二、在第6行行头右击(见下页图),在弹出的菜单中选择Insert Cases。系统自动为用户在第6行前插入一个新的行,原第6行列自动向下移一行成为第7行。,右击行头弹出的菜单,增加一个新的单元格(观察值),例如由于输入错误,造成第7个观察单位的第4个变量值漏输,结果第8个观察单位的
12、第4个变量值误为第7个观察单位的第4个变量值,这样的情形使得数据管理器中的第4个变量值从第7行起全部上移,而合计例数少一个。于是希望在第7行的第4列处插入1个单元格,原有数据依次下移恢复正常。可先将鼠标指向在第7行第4列交叉处的单元格,然后按住鼠标左键向下拖动鼠标直至第4列从第7行起的所有数据被选中(黑底白字),选Edit菜单的Cut命令项,选中的数据被剪切入剪贴板,再激活第8行第4列交叉处的单元格,选Edit菜单的Paste命令项,可将剪贴板中的原第7行起的所有数据下移自第8行开始,并空出第7行第4列的单元格以便补入漏输的数值。,删除一个行 例如要删除第9行,则可先点击第9行的行头,这时整个
13、第9行被选中(呈黑底白字状),然后按Delete键或选Edit菜单的Clear命令项,或者在右击行头后弹出的菜单中选择Clear,该行即被删除。,删除一个变量(列)例如要删除第4个变量列,则可先点击第4列的列头,这时整个第4列被选中,然后按Delete键或选Edit菜单的Clear命令项,或在右击变量名栏弹出的菜单中选择Clear,该列即被删除。,删除一个单元格(观察值)例如由于输入错误,造成第6个观察单位的第2个变量值重复输入,结果第7个观察单位的第2个变量值误为第6个观察单位的第2个变量值,第8个观察单位的第2个变量值误为第7个观察单位的第2个变量值,这样的情形使得数据管理器中的第2个变量
14、值从第7行起全部下移,而合计例数多一个。于是希望将第7行第2列的单元格删除,原有数据依次上移恢复正常。可先将鼠标指向在第8行第2列交叉处的单元格,然后按住鼠标左键向下拖动鼠标直至第2列从第8行起的所有数据被选中(黑底白字),选Edit菜单的Cut命令项,选中的数据被剪切入剪贴板,再激活第7行第2列交叉处的单元格,按Del键删除该单元格的数值,选Edit菜单的Paste命令项,可将剪贴板中的原第8行起的所有数据上移自第7行开始,既填补第7行第2列的单元格,又恢复原有下移的数值。,变量重新赋值,在数据编辑窗口中,用户可对各单元的数值重新赋值,但这种操作适用于数值型和字符型变量。同时,变量赋值需在同
15、类型变量之间进行,不能将字符型变量数据赋值给数值型变量。选择菜单”Transform-Recode”,此时有两种选择:1.对变量自身重新赋值(Into Same Variables);2.对其他变量或新生成的变量赋值(Into Different Variables);,对变量自身重新赋值,1.选择菜单”Transform-Recode-Into Same Variables”,则弹出如下的对话框。,2.在对话框变量名列表框中选一个或多个变量,单击按钮 使之进入”Numeric Variables”框;3.点击”Old and New Values.”按钮弹出“Recode into Same
16、 Variables:Old and New Value”对话框,用户根据实际情况确定旧值和新值,点击Continue钮返回,再点击OK钮即可。,4.在“Recode Into Same Variables”对话框中,单击“If”按钮,则弹出一个对变量自身赋值的条件对话框如图。单击“Continue”按钮返回。,5.单击“OK”按钮,即完成对变量自身赋值。,对其他变量或新生成的变量赋值,1.选择菜单”Transform-Recode-Into Different Variables”,则弹出如下的对话框。在左侧变量名列表框中选择一个或多个进入“Numeric Variable-Output Variable”框。,2.在“Output Variable”框确定一赋值变量(可以是数据编辑窗口已有的变量,也可以是新变量),单击“Change”按钮,本例将生成一个新变量“hello”.,3.点击”Old and New Values.”按钮弹出“Recode into Different Variables:Old and New Value”对话框,用户根据实际情况确定旧值和新值,点击Co
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1