ImageVerifierCode 换一换
格式:DOCX , 页数:23 ,大小:913.97KB ,
资源ID:3153642      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/3153642.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(SPSS学习系列24卡方检验.docx)为本站会员(b****6)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

SPSS学习系列24卡方检验.docx

1、SPSS学习系列24卡方检验24. 卡方检验 卡方检验,是针对无序分类变量的一种非参数检验,其理论依据是:实际观察频数f0与理论频数fe(又称期望频数)之差的平方再除以理论频数所得的统计量,近似服从分布,即卡方检验的一般是用来检验无序分类变量的实际观察频数和理论频数分布之间是否存在显著差异,二者差异越小,值越小。卡方检验要求:(1)分类相互排斥,互不包容;(2)观察值相互独立;(3) 样本容量不宜太小,理论频数5,否则需要进行校正(合并单元格、增加样本数、去除样本法、使用校正公式校正卡方值)。卡方校正公式为:卡方检验的原假设H0: = 0; 备择假设H1: 0;卡方检验的用途:(1)检验某连续

2、变量的数据是否服从某种分布(拟合优度检验);(2)检验某分类变量各类的出现概率是否等于指定概率;(3)检验两个分类变量是否相互独立(关联性检验);(4)检验控制某几个分类因素之后,其余两个分类变量是否相互独立;(5)检验两种方法的结果是否一致,例如两种方法对同一批人进行诊断,其结果是否一致。(一)检验单样本某水平概率是否等于某指定概率一、单样本案例例如,检验彩票中奖号码的分布是否服从均匀分布(概率=某常值);检验某产品市场份额是否比以前更大;检验某疾病的发病率是否比以前降低。有数据文件:检验“性别”的男女比例是否相同(各占1/2)。1. 【分析】【非参数检验】【单样本】,打开“单样本非参数检验

3、”窗口,【目标】界面勾选“自动比较观察数据和假设数据”2.【字段】界面,勾选“使用定制字段分配”,将变量“性别”选入【检验字段】框;注意:变量“性别”的度量标准必须改为“名义”类型。3. 【设置】界面,选择“自定义检验”,勾选“比较观察可能性和假设可能性(卡方检验)”; 4. 点【选项】,打开“卡方检验选项”子窗口,本例要检验男女概率都=0.5,勾选“所有类别概率相等”;注:若有类别概率不等,需要勾选“自定义期望概率”,在其表中设置各类别水平及相应概率。点【确定】回到原窗口,点【运行】得到双击上表,得到更多的描述:结果说明:(1)男生的观察频数为28,理论频数为25,残差=3;女生的观察频数为

4、22,理论频数为25,残差=-3;可以计算卡方值=32+(-3)2/25=0.72(2)卡方检验的P值=0.3960.05, 故接受原假设H0,即认为男女性别人数无差异。注:卡方检验的P值是近似P值,若用“二项分布检验”计算出精确P值=0.480. 另外,上述卡方检验也可以用:【分析】【非参数检验】【旧对话框】【卡方】得到的结果是一致的。二、两样本或多样本案例比较不同类的构成比或发生率的差异问题:两组收入不同的受访家庭其轿车拥有率的比较。使用【交叉表】的卡方检验来实现,需要注意:若交叉表中存在有序分类变量,则适合用秩和检验而不是卡方检验。有数据文件:变量O1表示是否拥有轿车:“1=有,2=没有

5、”;变量Ts9表示收入级别:“1=4.8万以上,2=4.8万以上”。 1. 【分析】【描述统计】【交叉表】,打开“交叉表”窗口,将变量“Ts9收入级别”选入【行】框,将变量“O1是否拥有轿车”选入【列】框,根据需要勾选“显示复式条形图”;2. 点【统计量】,打开“统计量”子窗口,勾选“卡方”表示进行卡方检验;3. 点【继续】回到原窗口,点【单元格】打开“单元显示”窗口,【计数】输出观察频数和理论频数,默认勾选“观察值”;【百分比】勾选“行”;【非整数权重】设置小数权重问题,保持默认;注:“残差”设置残差的输出方式;“z-检验”对多于两组的数据做两两组间比较;点【继续】回到原窗口,点【确定】得到

6、案例处理摘要案例有效的缺失合计N百分比N百分比N百分比家庭收入2级 * O1. 是否拥有家用轿车98986.2%15813.8%1147100.0%家庭收入2级* O1. 是否拥有家用轿车 交叉制表O1. 是否拥有家用轿车合计有没有家庭收入2级Below 48,000计数32303335家庭收入2级 中的 %9.6%90.4%100.0%Over 48,000计数225429654家庭收入2级 中的 %34.4%65.6%100.0%合计计数257732989家庭收入2级 中的 %26.0%74.0%100.0% 低收入家庭有9.6%拥有轿车;高收入家庭34.4%拥有轿车。卡方检验值df渐进

7、Sig. (双侧)精确 Sig.(双侧)精确 Sig.(单侧)Pearson 卡方71.134a1.000连续校正b69.8481.000似然比80.1461.000Fisher 的精确检验.000.000线性和线性组合71.0621.000有效案例中的 N989a. 0 单元格(0.0%) 的期望计数少于 5。最小期望计数为 87.05。b. 仅对 2x2 表计算脚注a说明没有单元格的期望频数5, 满足Pearson卡方检验要求,故看Pearson卡方检验结果即可:P值=040, 所有期望频数都1, 只有1/5以下的单元格期望频数5;(3)“Fisher精确检验”:不需要近似,结果最精确,但

8、耗时多;若样本量40,有单元格的期望频数1的4格表,需要用该检验;若有单元格的期望频数1, 或5的期望频数较多,也可采用该检验;(4)“似然比”:用似然比公式计算卡方,在处理多维表是有更大优势;(5)“线性卡方”:检验的原假设H0是行列变量间无线性相关,在列联表分类变量中很少用,更多用于连续变量。(三)检验两分类变量间的关联程度例如,进行客户满意度研究中,价格、质量、服务都与总体满意度相关,哪项与总体满意度关系更密切? 卡方值的大小可以粗略地反映两变量联系的强弱,更精确的描述可以用“相对危险度”和“优势比”。(1)相对危险度(RR) 实验组人群反应阳性概率与对照组人群反应阳性概率的比值,即用于

9、反应实验因素与反应阳性的关联程度,RR=1表明二者无关联;RR1, 则表明实验因素更容易导致结果为阳性,或者说“采用的实验因素”与“结果为阳性”有关联。注:当反应阳性概率0.1时,OR可作为RR的近似。优势比是两个比数之比,例如,女性购买与不购买某产品的比数是男性该比数的3倍。问题:描述家庭收入级别与拥有轿车的关联程度1. 【分析】【描述统计】【交叉表】,打开“交叉表”窗口,将变量“Ts9收入级别”选入【行】框,将变量“O1是否拥有轿车”选入【列】框; 2. 点【统计量】,打开“统计量”子窗口,勾选“风险”用来计算OR值和RR值;点【继续】回到原窗口,点【确定】得到家庭收入2级* O1. 是否

10、拥有家用轿车 交叉制表O1. 是否拥有家用轿车合计有没有家庭收入2级Below 48,000计数32303335家庭收入2级 中的 %9.6%90.4%100.0%Over 48,000计数225429654家庭收入2级 中的 %34.4%65.6%100.0%合计计数257732989家庭收入2级 中的 %26.0%74.0%100.0%风险估计值95% 置信区间下限上限家庭收入2级 (Below 48,000 / Over 48,000) 的几率比.201.135.300用于 cohort O1. 是否拥有家用轿车 = 有.278.196.392用于 cohort O1. 是否拥有家用轿车

11、 = 没有1.3791.2911.472有效案例中的 N989 (1)优势比OR是两个比数之比:低收入家庭拥有轿车的比例为9.6%,没有轿车的比例是90.4%,其比数为9.6% / 90.4% = 0.106; 高收入家庭的比数为:34.4% / 65.6% = 0.524; 故OR值=0.106/0.524=0.201该值的95%置信区间=0.135, 0.3, 不包含1(有统计学意义);(2)相对危险度RR1是两组人群拥有轿车的概率之比,其估计值为9.6% / 34.4% = 0.278, 说明高收入家庭拥有轿车的概率是低收入家庭的1 /0.278 = 3.597倍,RR1值的95%置信区

12、间=0.196, 0.392, 不包含1(有统计学意义);(3)相对危险度RR2是两组人群没有轿车的概率之比,估计值为90.4% / 65.6% = 1.379. 注:上述三个指标实际上是等价的;另外,OR值也等于有车与无车的相对危险度之比(0.278 / 1.379 = 0.201)。(四)分层卡方检验前文已经得到家庭收入级别会影响轿车拥有情况,那么进一步,不同城市是否存在差异?即“城市”因素是否也是影响轿车拥有的协变量?另外“学历”因素呢?分层卡方检验就是解决上述问题常用的一种方法。问题:在前文的基础上,进一步在控制“城市”的影响的前提下,更准确地描述家庭收入与轿车拥有的关联程度。1.【分

13、析】【描述统计】【交叉表】,打开“交叉表”窗口;将变量“Ts9收入级别”选入【行】框,将变量“O1是否拥有轿车”选入【列】框;将变量“s1城市”选入【层1的1】框;2. 点【统计量】,打开“统计量”子窗口,勾选“风险”、“Cochrans and Mantel-Haenszel统计量”,点【继续】;点【确定】,得到结果家庭收入2级* O1. 是否拥有家用轿车* S1. 城市 交叉制表计数S1. 城市O1. 是否拥有家用轿车合计有没有100北京家庭收入2级Below 48,000993102Over 48,00083134217合计92227319200上海家庭收入2级Below 48,0004103107Over 48,00070160230合计74263337300广州家庭收入2级Below 48,00019107126Over 48,00072135207合计91242333合计家庭收入2级Below 48,00032303335Over 48,000225429654合计25773

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1