张伟豪SPSS培训视频3笔记缺失值处理筛选个案.docx

上传人:b****5 文档编号:3433596 上传时间:2022-11-23 格式:DOCX 页数:27 大小:13.14MB
下载 相关 举报
张伟豪SPSS培训视频3笔记缺失值处理筛选个案.docx_第1页
第1页 / 共27页
张伟豪SPSS培训视频3笔记缺失值处理筛选个案.docx_第2页
第2页 / 共27页
张伟豪SPSS培训视频3笔记缺失值处理筛选个案.docx_第3页
第3页 / 共27页
张伟豪SPSS培训视频3笔记缺失值处理筛选个案.docx_第4页
第4页 / 共27页
张伟豪SPSS培训视频3笔记缺失值处理筛选个案.docx_第5页
第5页 / 共27页
点击查看更多>>
下载资源
资源描述

张伟豪SPSS培训视频3笔记缺失值处理筛选个案.docx

《张伟豪SPSS培训视频3笔记缺失值处理筛选个案.docx》由会员分享,可在线阅读,更多相关《张伟豪SPSS培训视频3笔记缺失值处理筛选个案.docx(27页珍藏版)》请在冰豆网上搜索。

张伟豪SPSS培训视频3笔记缺失值处理筛选个案.docx

张伟豪SPSS培训视频3笔记缺失值处理筛选个案

如果要把连续变量进行分组,比如将不同的年龄分为老中青三种,30岁以下,30到50,,5以上,如何处理呢?

如下

选择转换——重新编码为不同变量

将age选入,命名新名称为agenew,然后点旧值与新值。

现在旧值这边选范围,从最低到值,写上30,意思是从最低值到30的范围,新值命名为1,然后添加进去

然后选择范围,填30到50,意思是范围30到50,命名为新值2,添加进去,

然后在范围,从值到最高里填入50,意思是50岁以上,新值命名为3,添加后点击继续

在这里要注意的是,虽然旧值到新值数字有重叠,但是SPSS会认为上一行包含重叠数字,下一行不包含,例如上面,第一行包含30,第二行包含50.

最后一列生成新数据。

对于缺失值的处理,一般缺失值最好不要超过总数的5%,最多不能超过总数的10%。

如果要查看每个测量题目是否有缺失值,有多少个缺失值,只需要做频数统计就行了。

但是如果要查看每个问卷是否有缺失值,有多少个缺失值,就需要用计算变量,如下,

选择函数和特殊变量中的NMISS,在括号中选择所有变量,点击确定,

最后一列就会显示出都哪些问卷有缺失值,缺失值是几个。

那如何处理缺失值呢?

第一种方法,选择转换——替换缺失值

把有缺失值的变量选入新变量框中,在选入之前先要选择补缺失值的方法,一般使用序列平均值和线性差值,但是使用序列平均值的话,缺失值过多就不行了,不科学。

但是如果选用其他方法,万一缺失值是第一份问卷的值,那么就会空缺,补不上。

选择后确定,数据的最后几列就会出现补好的新值。

第二种方法:

每种分析方法都会有缺失值的处理方法,如下

比如T检验,点选项,缺失值有两种处理方法,按分析顺序排除个案指的是分析的变量有缺失值,就把这个缺失值排除,如果分析的变量没有缺失值,那就不排除。

(也就是说按列排除)而这种方法能最大限度的保留数据,但是分析出来的结果会显示个案数n不一样,因为有缺失值的变量排除了,而没有缺失值的变量没有排除,所以导致每个变量的n都不一样。

按列表删除个案指的是,只要遇到有一个个案(问卷)有缺失值,就会把这个个案删除(也就是说按行排除)。

回归分析排除缺失值有些特殊,多了一个使用平均值替换,而按对排除个案和按分析顺序排除个案是一样的。

如何从所有数据中筛选一部分进行分析,而不是分析全部呢?

选择数据——选择个案

选中如果条件满足,点击如果

假如要选出高于40岁的男性进行分析,就输入如上图计算公式,确定

那左边被划掉的就是去除的个案,剩余的是符合条件的个案,最后一列中的1代表符合条件的个案,0代表不符合条件的。

可以右击,选择降序排列,那么所有的1就是筛选出来所需要的个案。

如果要把筛选掉的个案恢复,只需要将变量视图中的最后filter删除就可以了。

如果是想随机挑样本,那就选择随机个案样本,弹出对话框,第一个大约,指的是从所有样本中随机选大约百分之多少的样本,百分之多少可以填在格子里。

第二个是精确,比如从所有的295个样本中选50个,那么就在第一个空填50,第二个空填295.

随机选样本的作用:

一般我们都需要预调研,但这样的话就需要调研两次,比较麻烦,我们可以偷个懒,直接收集一次所有的样本,然后通过随机筛选的方法,选出一部分样本作为我们的预调研样本进行分析,但是这是偷懒的做法,不能写在论文里的。

如果需要将选出来的样本单独建一个数据集,如下

选择将选定个案复制到新的数据集,起个名字,确定,就会新出现一个新的数据集。

还可以选择第三种,基于时间或个案全距,也就是可以选一个范围,比如选第50到80个,但是一定要注意,这50到80不是自己设定的ID编号,而是spss最左边列的编号。

最主要的筛选方法就是这几种,最后一种几乎用不到。

还有一种情况是需要把所有数据按照一定标准分成几组,然后同时分析这几组,那就需要拆分文件,如下

选择数据——拆分文件,

如果我们要按性别进行同时分析,就选择比较组,把gender选进去,然后确定。

这样的话随便做一个分析,比如做回归,

首先在右下角就会显示拆分条件gender

随便做几个变量的回归,输出表格里每个表格都会按男女分开展示分析结果。

也可以同时加入好几个变量进行拆分后的分析,比如性别、婚姻等都可以同时放进去,分析结果就会按照这些条件分开分析。

如下图

以上所有的统计方法,大多都是回归的特例。

次数分配和描述性统计不一定必须是做分类或连续变量,只不过是习惯这样分着做,有时可以互换。

先说频数统计

频数统计一般是针对分类变量,因此统计量选项不要勾选方差标准差等内容,因为分类变量没有这些东西。

频数统计报告的第一个作用是看看有没有缺失值,有的话补上。

还要看每个变量的频数是不是正常,比如上图中婚姻,只有1和2,但是出来3等异常数字,说明录入的有问题。

其次看下边的频数表,需要掌握的原则有两个,第一个,每个变量的选项中,最小数量频数的选项不能小于最大数量频数选项的4倍,比如上图中,小学频数是8,最大的大学频数是190,远小于4倍,这时候就需要将小学和高中合并,成为54,那190就不是它的4倍了,才可以。

第二个,每个变量的选项中,最小数量频数的选项不能低于总频数的5%,比如上图中小学频数是8,总频数是295,小于5%,就需要调整(合并)。

这样检查并调整后,才能做T检验或者ANOVA(方差检验)。

最后还有一条,任何一个变量,在做T检验和ANOVA时,选项数量不能超过4个,比如上图中,职业类型就有12种,这种是不能分析的。

所以一般是不拿职业类型做分析的。

如果想要在输出结果中出现上图红框中的数字,而不是只显示选项名称,那就需要操作下

选择编辑——选项——输出,在上图红框中选为值和标签,默认是只有标签。

如果变量的选项不符合条件需要合并,怎么操作呢?

如下

比如收入需要合并最下边两项,我们要合并的是前边的红框中的数字,而不是收入数字

使用重新编码为不同变量功能

选择income,新起个名字,点新值和旧值

然后旧值123都是新值123,然后把其他所有制编为新值4,当然也可以编为4是4,5是4.

这样最后一列就会出现合并后的新值。

最后记得将变量视图中新的income值加上新标签。

要注意的是,在论文中呈现的应该是最原始的分组,不要进行并组,只不过在表格说明中说一下哪个需要并组,原因是什么,在做后边方差分析时会先并组。

就可以了。

如果要做连续变量,就需要用描述性统计,方法如下

把所有需分析的变量选入框中,在选项框中,需要选中峰度和偏度,这两个值是检验是否符合正态分布的,因为我们的变量要符合正态分布才可以分析。

分析出来之后,需要对输出表格进行解释。

第一列代表都是295个样本,没有缺失值。

最小值和最大值可以检查是否有错误录入,因为是1到7,所以如果出现8等其他数字,就说明有录入错误。

平均值可以分析是否答案填的是否过于集中,比如平均值如果是6点多,说明填的都是6或者7,太集中了。

当然,如果平均值是5点多,那也有可能都填的是4或者5,当然也有可能填几的都有,这就看不出来了。

那就需要看后边的标准偏差,这个稍复杂,如下:

最大值减最小值叫做全距,上图中全距大多数为6或者5,(7-1,7-2),全距是个固定值。

要用全距除以标准偏差,因为全距是固定值,那么得数越高说明标准偏差越小,我们需要标准偏差不要过小(也就是得数不要过高),过小就说明答案过于集中,所以得数越高答案就越集中。

一般我们要求这个相除的得数要小于5,不能超过6。

上图中各个变量的全距除以标准偏差一般为4点多或5点多,符合标准,说明答案不是太集中。

偏度和峰度,一般标准为偏度绝对值在1以内,峰度绝对值在7以内,说明基本符合正态分布。

如果想显示问卷各个问题的名称,那就需要选择编辑——选项——输出,在红框中位置选择名称和标签,就能显示出问题名称了。

一般表格中小数点前边不能出现0,在excel中应该如下操作:

选中需要更改的数字,点击右键——设置单元格格式——数字自定义,选择0.000那个选项,改为.000,小数点保留几位就留几个0.就可以了。

有的时候表格比较长,会跨页,而文章要求跨页表格也得有表头,怎么操作呢?

选中表头,右击选择表格属性——行——在各页顶端以标题形式重复出现,就可以了。

预调研问卷一般20——50个就可以(有文献证明,文件夹里)

查找缺失值的方法

使用查找功能ctrl+f,输入.,就能找出来了

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 解决方案 > 营销活动策划

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1