ImageVerifierCode 换一换
格式:DOCX , 页数:21 ,大小:403.74KB ,
资源ID:13803567      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/13803567.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(SPSS学习系列09 缺失值处理Word文档下载推荐.docx)为本站会员(b****3)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

SPSS学习系列09 缺失值处理Word文档下载推荐.docx

1、提供了多种方法用于估计含缺失值数据的均值、相关矩阵或协方差矩阵,通过这些方法计算出的统计量更加可靠。(3)用估计值替换缺失值:使用EM或回归法,用户可以从未缺失数据的分布情况中推算出缺失数据的估计值,从而能有效地使用所有数据进行分析,来提高统计结果的可信度。【缺失值分析】实例操作,使用SPSS 20自带的实例文件:telco_missing.sav 1.【分析】【缺失值分析】,打开“缺失值分析”窗口,将变量“婚姻状况、教育程度、退休、性别”选入【分类变量】,将变量“服务月数、年龄、现在住址居住年数、家庭收入、现职位工作年数、家庭人数”选入【定量变量】最大类别(最大分类数)默认为25,超过该数目

2、的分类变量将不引入分析。2. 点【描述】,打开“描述统计”子窗口,用来设置要显示的缺失值描述统计量。勾选“单变量统计量”,勾选【指示变量统计量】框的“使用有指示变量形成的分组进行的t检验”和“为分类变量和指示变量生成交叉表”,点【继续】3. 点【模式】,打开“模式”子窗口,用来设置显示输出表格中的缺失数据模式和范围。勾选“按照缺失值模式分组的表格个案”;因为“教育程度”、“退休”和“性别”中的缺失模式似乎影响数据,“家庭收入”含有大量缺失值,将这些变量选入【附加信息】;其它保持默认,点【继续】4. 回到原窗口,勾选【估计】框中的“EM”和“回归”,其它默认设置。点击【EM】或【回归】按钮可以修

3、改其设置 注意:若要保存替换缺失值之后的数据,需要勾选“保存完成数据”:创建新数据集并命名,或写入新数据文件。另外,默认使用所有变量进行分析,若要选择部分变量,可点【变量】按钮修改。点【确定】,得到输出结果:单变量统计N均值标准差缺失极值数目a计数百分比低高tenure96835.5621.268323.2age97541.7512.573252.5address85011.479.96515015.09income82171.146283.1442417917.971employ90411.0010.113969.615reside9662.321.431343.433marital8851

4、1511.5ed965353.5retire916848.4gender958424.2a. 超出范围(Q1 - 1.5*IQR,Q3 + 1.5*IQR)的案例数。提供了数据的一般特征,给出了所有分析变量缺失数据的频数、百分比,定量变量的均值、标准差、极值数目。income(家庭收入)有最多具有缺失值(17.9%),也有最多的极值;而age(年龄)有最少缺失值(5%)。估计均值摘要所有值EM36.1241.9111.5877.394111.222.29回归35.7741.6811.5974.317410.99估计标准差摘要21.46812.69910.26587.5486010.1651.4

5、1621.18812.5349.93584.7143010.2421.423使用EM法和回归法进行缺失值的估计和替换后,总体数据的均值和标准差的变化情况,其中“所有值”为原始数据特征,另两行分别是采用EM法、回归法得到的统计参数。单个方差 t 检验at.4.3.1.41.0df202.2192.5313.6191.1199.5# 存在819832693766824# 缺失149143128138142均值(存在)35.6841.7974.077911.202.34均值(缺失)34.9141.4955.27349.862.21-5.0-8.3-3.9-5.93.6249.5222.8203.33

6、15.279380174179217517415716333.9340.0110.679.912.3942.9749.7314.9715.932.02-1.0-.4-.7.5-.3110.5110.297.6114.9110.98778818749194809235.3441.6911.3771.49532.3137.7042.2712.3267.91252.37.01.81.2-.8.9-2.2148.1149.5138.8121.2128.3134.2856862748728805857112113102939910942.0011.6170.388711.102.2835.5739.85

7、10.4377.075310.172.61-.6.295.494.484.093.299.08888937777518273708135.4441.7011.4271.335636.8942.2911.9669.11432.30对于每个定量变量,由指示变量(存在,缺失)组成成对的组。a. 不显示少于 5% 个缺失值的指示变量。通过单个方差t 检验有助于标识缺失值模式可能影响定量变量的变量。按照相应变量是否缺失将全部记录分为两组,再对所有定量变量在这两组间进行t检验。判断数据是否完全随机缺失(表示缺失和变量的取值无关)。例如,似乎年纪较长的响应者更不可能报告收入水平。当income 缺失时,平均

8、age 为49.73,与之相比,当income 未缺失时为40.01。实际上,income 的缺失似乎影响多个定量(刻度)变量的平均值。此指示数据可能并未完全随机缺失。类别变量相对于指示变量的交叉制表总计未婚已婚SysMis存在39035885.085.583.488.7% SysMis14.516.611.338034882.183.381.180.916.718.919.141838790.491.790.286.18.39.813.942339210191.692.891.487.87.28.612.2不显示少于 5% 个缺失值的指示变量。观察marital(婚姻状况)表,指示变量的缺失值数量在marital 类别之间似乎变化不大。一个人结婚与否似乎并不影响任何定量(刻度)变量的数据缺失情况。例如,85.5% 未婚者报告address(当前地址居住年限),83.4% 已婚者报告相同变量。差异很小

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1