SPSS软件基本操作与数据库清理PPT课件下载推荐.pptx
《SPSS软件基本操作与数据库清理PPT课件下载推荐.pptx》由会员分享,可在线阅读,更多相关《SPSS软件基本操作与数据库清理PPT课件下载推荐.pptx(43页珍藏版)》请在冰豆网上搜索。
变量:
类型、长度、标签SPSS的基本运算符的基本运算符数学运算符数学运算符关系运算符关系运算符逻辑运算符逻辑运算符符号符号意义意义符号符号运算符运算符意义意义符号符号运算符运算符意义意义+加加GTGT大于大于|OrOr逻辑或逻辑或*乘乘=GEGE大于等于大于等于*幂幂=EQEQ等于等于()()括号括号=NTNT不等于不等于数据转换分析常用菜单演示、练习演示、练习熟悉操作界面改变数据变量类型定义数值标签SPSS基本操作:
基本操作:
计算新变量计算新变量l作用:
对变量进行计算,生成新变量。
新变量类型默认为数值型。
l步骤:
1.查看数据类型;
2.单击“转换”,选择“计算变量”;
3.确定目标变量的名称、类型和标签;
4.输入年龄的计算公式;
5.设置个案选择条件。
SPSS基本操作:
计算新变量计算新变量举例:
计算年龄,假设调查时间为2014年10月。
步骤1:
查看变量类型。
计算新变量计算新变量步骤2:
单击“转换”,选择“计算变量”SPSS基本操作:
计算新变量计算新变量步骤3:
确定目标变量的名称、类型和标签可在“目标变量”中输入新的变量名,如“年龄”,点击“类型和标签”,确定新变量的类型和标签。
计算新变量计算新变量步骤4:
在“数字表达式”中输入年龄的计算公式,单击“确定”如果只给某一类人计算年龄,单击“如果”,选择条件SPSS基本操作:
计算新变量计算新变量如:
计算男性(f01=1),且体重正常(d02=2)的人的年龄。
数据转换数据转换-RECODEl作用:
对变量重新编码、赋值。
2.单击“转换”,选择“重新编码为不同变量”;
3.选择需要转换的变量,在“输出变量”中输入新的变量名,单击“更改”,选择“旧值和新值”;
4.选择旧值,确定新值,单击“添加”,全部赋值完成后单击“继续”,最终选择“确定”。
数据转换数据转换-RECODE举例:
将年龄进行分组,小于18岁为少年,18-45岁青年,45-60岁中年,60以上为老年步骤1:
查看数据类型SPSS基本操作:
数据转换数据转换-RECODE步骤2:
单击“转换”,选择“重新编码为不同变量”SPSS基本操作:
数据转换数据转换-RECODE步骤3:
选择需要转换的变量,在“输出变量”中输入新的变量名,单击“更改”,选择“旧值和新值”。
数据转换数据转换-RECODE当旧值的赋值为某个特定的值当旧值的赋值为某个范围若新值为字符型变量,则选择该选项注意:
所有的范围都包含的端点,前面设定的变换会优于后面的变换,为了得到正确的结果,应将相应界值的计算放在最后面。
数据转换数据转换-RECODE步骤4:
选择旧值,确定新值,单击“添加”,全部赋值完成后单击“继续”,最终选择“确定”。
数据转换数据转换-RECODESPSS基本操作:
排序排序l作用:
对记录按升序或降序排序l步骤:
1.单击“数据”,选择“排序个案”;
2.选择变量作为“排序依据”,选择排列顺序,单击“确定”。
排序排序步骤1:
单击“数据”,选择“排序个案”SPSS基本操作:
排序排序步骤2:
选择变量作为“排序依据”,选择排列顺序,单击“确定”SPSS基本操作:
小贴士小贴士l80/20规则SPSS操作中:
80%的任务是被20%最常用的指令完成的另外80%的复杂指令只能完成20%不常用的任务l在学习SPSS时,要养成一个好习惯:
用语法文件(*.sps)保存每一步操作只需要在每个对话框中点击“粘贴”,就可以将操作粘贴到语法窗口,单击运行按钮。
益处:
1.避免重复地操作2.很清楚地记录了统计分析的过程SPSS基本操作:
小贴士小贴士请在此输入您的文本。
请在此输入您的文本。
小贴士小贴士如果您偷懒,从不保存语法文件您花了一整天的时间进行了复杂的数据整理及统计分析几天后,同事告诉您:
数据库需要删除一个记录,您要重新做统计分析!
天啊!
为了这一个记录,难道还要再花费一整天重头开始么?
!
演示、练习演示、练习计算新变量计算新变量数据转换数据转换排序排序数据库清理数据库清理在调查过程中,难以避免调查对象真实情况与统计分析数据库中信息之间不一致,即测量误差测量误差主要包括录入错误、信息缺失、回答偏差、记录和编码偏差等测量误差大多是非随机误差,不能用于推测总体水平进行估计数据清理与校验是进行数据分析的基础数据清理与校验是进行数据分析的基础数据库清理:
数据库清理:
主要方法主要方法l录入方式:
要求双录入,通过检验两次录入资料的差异,可以消除绝大部分录入错误l利用SPSS软件对缺失值、异常值、逻辑错误等进行检验、核查、补录、修正数据库清理:
完整性完整性l要求关键指标:
问卷编码、地址、性别、年龄4个变量不能有缺失问卷主题:
健康素养题目完整率高于90%(非个人情况题目)l处理方式发现缺失值后,应对原始资料进行核查、补充录入,对于核查、补录后完整性仍不复核要求的样本,予以剔除数据库清理:
异常值异常值异常值主要有3种情况:
(1)取值超过了规定范围如性别取值出现了1(男性)、2(女性)以外的数值、年龄取值超过15-69岁的范围等情况
(2)取值远远超过总样本的平均水平如一份问卷数据家庭人口数取值为14人,而95%的样本家庭人口数不超过6人(3)逻辑错误单选题取值不符合“只有一个选项正确选项”的原则,出现了多选取值数据库清理:
异常值异常值如何处理异常值?
发现异常值后应对原始资料进行核查、判定并修正数据对录入错误和编码错误进行修正对核对后年龄确是超出15-69岁年龄范围的样本予以剔除对于核对后的确是调查对象根据自己的判断进行了多选的单选题,按照原始结果予以保留,但在数据分析时判定为该题错误数据库清理:
异常值异常值数据升序或降序排列方法:
选择某一列数据-数据-排列个案-选择需要排列的变量-确定素养素养数据数据处理处理数据处理步骤:
1、修正、剔除错误数据2、对数据进行重新编辑(生成辅助变量)1.1生成辅助变量生成辅助变量两套问卷编码:
字符串、数值根据研究需要对文化水平进行分组谢谢!