1、SPSS软件基本操作与数据库清理1.SPSS软件介绍2.数据库基本知识3.SPSS基本操作 4.数据库清理主主要要内内容容SPSS软件介绍软件介绍l使用最为广泛的数据分析软件之一社会科学研究领域使用较广l功能强大集数据录入、数据处理、数据管理、统计分析、报表制作、图形绘制几大功能为一体SPSS主要界面主要界面又叫字段,表示一个观测对象的某个属性,如性别、年龄等。分为3类:1.1.数值型数值型2.2.字字符符型型:区分大小写字母,并且不能进行数学运算。3.日期型:用来表示日期或时间的。变量变量2又叫个案,指一个观测对象的全部信息。记录记录1数据库基本知识数据库基本知识数据库基本知识数据库基本知识
2、记录:变量:类型、长度、标签SPSS的基本运算符的基本运算符数学运算符数学运算符关系运算符关系运算符逻辑运算符逻辑运算符符号符号意义意义符号符号运算符运算符意义意义符号符号运算符运算符意义意义+加加 GTGT大于大于|OrOr逻辑或逻辑或*乘乘=GEGE大于等于大于等于*幂幂=EQEQ等于等于()()括号括号=NTNT不等于不等于数据转换分析常用菜单演示、练习演示、练习熟悉操作界面改变数据变量类型定义数值标签SPSS基本操作:基本操作:计算新变量计算新变量l作用:对变量进行计算,生成新变量。新变量类型默认为数值型。l步骤:1.查看数据类型;2.单击“转换”,选择“计算变量”;3.确定目标变量的
3、名称、类型和标签;4.输入年龄的计算公式;5.设置个案选择条件。SPSS基本操作:基本操作:计算新变量计算新变量举例:计算年龄,假设调查时间为2014年10月。步骤1:查看变量类型。SPSS基本操作:基本操作:计算新变量计算新变量步骤2:单击“转换”,选择“计算变量”SPSS基本操作:基本操作:计算新变量计算新变量步骤3:确定目标变量的名称、类型和标签可在“目标变量”中输入新的变量名,如“年龄”,点击“类型和标签”,确定新变量的类型和标签。SPSS基本操作:基本操作:计算新变量计算新变量步骤4:在“数字表达式”中输入年龄的计算公式,单击“确定”如果只给某一类人计算年龄,单击“如果”,选择条件S
4、PSS基本操作:基本操作:计算新变量计算新变量如:计算男性(f01=1),且体重正常(d02=2)的人的年龄。SPSS基本操作:基本操作:计算新变量计算新变量如:计算男性(f01=1),且体重正常(d02=2)的人的年龄。SPSS基本操作:基本操作:数据转换数据转换-RECODEl作用:对变量重新编码、赋值。l步骤:1.查看数据类型;2.单击“转换”,选择“重新编码为不同变量”;3.选择需要转换的变量,在“输出变量”中输入新的变 量名,单击“更改”,选择“旧值和新值”;4.选择旧值,确定新值,单击“添加”,全部赋值完成后单击“继续”,最终选择“确定”。SPSS基本操作:基本操作:数据转换数据转
5、换-RECODE举例:将年龄进行分组,小于18岁为少年,18-45岁青年,45-60岁中年,60以上为老年步骤1:查看数据类型SPSS基本操作:基本操作:数据转换数据转换-RECODE步骤2:单击“转换”,选择“重新编码为不同变量”SPSS基本操作:基本操作:数据转换数据转换-RECODE步骤3:选择需要转换的变量,在“输出变量”中输入新的变量名,单击“更改”,选择“旧值和新值”。SPSS基本操作:基本操作:数据转换数据转换-RECODE当旧值的赋值为某个特定的值当旧值的赋值为某个范围若新值为字符型变量,则选择该选项注意:所有的范围都包含的端点,前面设定的变换会优于后面的变换,为了得到正确的结
6、果,应将相应界值的计算放在最后面。SPSS基本操作:基本操作:数据转换数据转换-RECODE步骤4:选择旧值,确定新值,单击“添加”,全部赋值完成后单击“继续”,最终选择“确定”。SPSS基本操作:基本操作:数据转换数据转换-RECODESPSS基本操作:基本操作:数据转换数据转换-RECODESPSS基本操作:基本操作:数据转换数据转换-RECODESPSS基本操作:基本操作:排序排序l作用:对记录按升序或降序排序l步骤:1.单击“数据”,选择“排序个案”;2.选择变量作为“排序依据”,选择排列顺序,单击“确定”。SPSS基本操作:基本操作:排序排序步骤1:单击“数据”,选择“排序个案”SP
7、SS基本操作:基本操作:排序排序步骤2:选择变量作为“排序依据”,选择排列顺序,单击“确定”SPSS基本操作:基本操作:小贴士小贴士l80/20规则 SPSS操作中:80%的任务是被20%最常用的指令完成的 另外80%的复杂指令只能完成20%不常用的任务l在学习SPSS时,要养成一个好习惯:用语法文件(*.sps)保存每一步操作只需要在每个对话框中点击“粘贴”,就可以将操作粘贴到语法窗口,单击运行按钮。益处:1.避免重复地操作2.很清楚地记录了统计分析的过程SPSS基本操作:基本操作:小贴士小贴士请在此输入您的文本。请在此输入您的文本。请在此输入您的文本。请在此输入您的文本。请在此输入您的文本
8、。SPSS基本操作:基本操作:小贴士小贴士如果您偷懒,从不保存语法文件您花了一整天的时间进行了复杂的数据整理及统计分析几天后,同事告诉您:数据库需要删除一个记录,您要重新做统计分析!天啊!为了这一个记录,难道还要再花费一整天重头开始么?!演示、练习演示、练习计算新变量计算新变量数据转换数据转换排序排序数据库清理数据库清理在调查过程中,难以避免调查对象真实情况与统计分析数据库中信息之间不一致,即测量误差测量误差主要包括录入错误、信息缺失、回答偏差、记录和编码偏差等测量误差大多是非随机误差,不能用于推测总体水平进行估计数据清理与校验是进行数据分析的基础数据清理与校验是进行数据分析的基础数据库清理:
9、数据库清理:主要方法主要方法l录入方式:要求双录入,通过检验两次录入资料的差异,可以消除绝大部分录入错误l利用SPSS软件对缺失值、异常值、逻辑错误等进行检验、核查、补录、修正数据库清理:数据库清理:完整性完整性l要求关键指标:问卷编码、地址、性别、年龄4个变量不能有缺失问卷主题:健康素养题目完整率高于90%(非个人情况题目)l处理方式发现缺失值后,应对原始资料进行核查、补充录入,对于核查、补录后完整性仍不复核要求的样本,予以剔除数据库清理:数据库清理:异常值异常值异常值主要有3种情况:(1)取值超过了规定范围如性别取值出现了1(男性)、2(女性)以外的数值、年龄取值超过15-69岁的范围等情
10、况(2)取值远远超过总样本的平均水平如一份问卷数据家庭人口数取值为14人,而95%的样本家庭人口数不超过6人(3)逻辑错误单选题取值不符合“只有一个选项正确选项”的原则,出现了多选取值数据库清理:数据库清理:异常值异常值如何处理异常值?发现异常值后应对原始资料进行核查、判定并修正数据对录入错误和编码错误进行修正对核对后年龄确是超出15-69岁年龄范围的样本予以剔除对于核对后的确是调查对象根据自己的判断进行了多选的单选题,按照原始结果予以保留,但在数据分析时判定为该题错误数据库清理:数据库清理:异常值异常值数据升序或降序排列方法:选择某一列数据-数据-排列个案-选择需要排列的变量-确定素养素养数据数据处理处理数据处理步骤:1、修正、剔除错误数据2、对数据进行重新编辑(生成辅助变量)1.1生成辅助变量生成辅助变量两套问卷编码:字符串、数值根据研究需要对文化水平进行分组谢 谢!
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1