ImageVerifierCode 换一换
格式:DOCX , 页数:11 ,大小:127.45KB ,
资源ID:24144713      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/24144713.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(卡方检验二.docx)为本站会员(b****2)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

卡方检验二.docx

1、卡方检验二6.4 RC表资料的2检验1. 问题的提出前面我们已经学过用2检验检验实际频数与理论频数的拟合优度,具体地说,用于两个率或两个二分类构成比差异的比较。在医学研究中,我们常常遇见多个率或二个以上多分类构成比间差异的比较。可不可以用同样的思路和方法去解决这类问题?例如表6.7的资料:表6.7 不同疾病病人的血型分布疾病分类血型合计ABO胃溃疡组6791349831796胃癌组41684383883对照组262557028926087合计372078842588766合计构成比(%)42.49.048.6100.0这是3个三类构成比的比较。表6.15 某病170例不同年龄患者的疗效统计患者

2、年龄(岁)无效有效合计有效率(%)18552578.818-30487838.550+15203542.9合计5012017029.4这是三个率的比较。2. RC表资料的2检验关于前面问题的答案是:可以。这类资料都可以整理成一个行(R)列(C)表,可以用RC表资料的2检验比较多个率或比的差异。以表6-7为例说明2检验的步骤。解 (1)建立假设 H0:三种疾病的血型分布比例一致H1:三种疾病的血型分布比例不一致分布比例一致即三个构成比相等,等于什么呢?在没有任何其它信息时,最可靠的估计值是合计的构成比每个格子的理论频数=各疾病的总人数乘以相应的构成比如胃溃疡组A型血的理论频数T11=17960.

3、424=761.5其余格子相同。余下的计算就与前面完全相同了,后式是用于RC表资料的专用公式。 (2)计算2统计量 (2) 确定概率与作出决策 自由度=(31)(31)=4查附表得对应于=0.05的界值9.49故P0.05,拒绝H0,即认为不同疾病具有不同的血型分布。3. RC表资料的2分割可能有人仍不满足,想知道到底是哪两组间的构成比不等,或者到底是哪种血型的比例有差异。有人可能这样做,将RC表分割成若干个四格表,再分别做2检验,有统计学意义的就是两者间有差异。对不对?不对,为什么?理由有三:1. 各四格表不独立; 2. 样本量人为减少; 3. 多次比较。正确的分割方法应该是怎样?2分割的思

4、路:找出差异最小的两组作比较,如差异有统计学意义,不需分割了。如无统计学意义,则合并。重复以上步骤,直至余下的组间差异都有统计学意义为止。表6.8 每种疾病病人的血型分布比例A型B型O型合计疾病例数%例数%例数%例数%胃溃疡组67937.801347.4698354.731796100.0胃癌组41647.11849.5138343.37883100.0对照组262543.125709.36289247.516087100.0胃癌与对照组的血型分布较接近。将这两组分割出来见表6.9。表6.9表6.8的分割表之一胃癌组与对照组的血型分布疾病分类血型合计ABO胃癌组41684383883对照组26

5、2557028926087合计3041654327569702=5.6360.05,不拒绝H0,这两组合并。表6.10 表6.8的分割表之二胃溃疡组与非胃溃疡组的血型分布疾病分类血型合计ABO胃溃疡组6791349831796非胃溃疡组262557028926087合计3041654327569702=34.9195.99,P0.05,拒绝H0。表6.11 疾病与血型资料的2检验结果表号2P2L表6.9(分割表一)5.6365.6392表6.10(分割表二)34.91935.0012合计40.55540.6404表6.8(总表)40.54340.6404. RC表资料的关联度测定对于交叉分类资

6、料,可以分析两有序分类特征变量间的关联度,用Pearson列联系数(rp)。表6.15 某病170例不同年龄患者的疗效统计患者年龄(岁)无效有效合计有效率(%)18552578.818-30487838.550+15203542.9合计5012017029.4,5. 注意事项同前面一样,2分布是建立在大样本的假定上的,即每个格子的理论数大于5。如果这假定不成立,即理论数小于5的格子占1/5以上或有理论数小于1,则不能做2检验。解决的办法有增大样本或合并独立组别。合并时要注意合并的合理性。6.5 频数分布拟合优度的2检验利用2检验的性质,我们可以用于检验任意实际分布与某个理论分布的符合程度。如:

7、新生儿性别的构成比,鼻咽癌在家族的分布,仪器测量误差的分布。例6.6:表6.16 细菌性痢疾暴发的家庭聚集性分析表每户发病人数家庭数二项分布概率理论家庭数2分量01670.4396126.5912.901510.4011115.5236.042500.137339.532.77317(20)0.02096.01(6.36)29.29430.00120.35合计2881.0000288.0081.001)建立检验假设H0:此次流行不存在家庭成员间的传染(服从=0.18576的二项分布)H1:家庭成员间存在传染性(不服从二项分布)2)估计二项分布的总体参数发病总人数调查总人数发病总人数016715

8、125031743=214人调查总人数为28841152人得=214/1152=0.18576相应的不发病率为1=0.81424。3)计算发病人数为x的概率PxP(x)及理论家庭数exnPx此处n=288为调查家庭总数。例如 P(x=0)(0.18576)0(0.81424)40.43955相应的理论家庭数为: e02880.43955126.59相应的2分量为:(167126.59)2126.5912.90所有计算结果均列于表6.16第3, 4及5列中。4)计算2值求各组2分量之和,得2=81.00。5)确定概率p本例k=4组由于利用样本资料估计了发病率自由度=411=2查表,得自由度2时=

9、5.99,故p0.05。6)作出决策拒绝H0,可认为:本次调查家内发病人数的分布不符合二项分布,此次流行可能存在家庭成员间的传播。6.6 四格表精确概率检验法前面讲过,2检验基于大样本假定。如果总例数小于40或任一格子理论数小于1,假定不成立,则不能用2检验。表6.17 栓塞性脉管炎两种治疗方法的结果组别治愈人数未愈人数合计新药组6(a)1(b)7对照组1(c)4(d)5合计7512这资料总例数少于40,是小样本资料。为表达方便,将四个格子分别命名为a、b、c、d。现在我们知道总的12个病人中有7人治愈,如果这治愈率与治疗方法无关,我们可以建立起以下条件概率:这里一般地,这个条件概率分布称为超几何分布。具体的计算步骤:H0:1=2,H1:12。计算概率253443504132P=0.02651515 P=0.22095959 P=0.44191919526170231405P=0.28515152 P=0.04419192 P=0.00126263如果是单侧检验,只需考虑比实际观察结果更极端的情况,a6时,实际频数与理论频数之差的绝对值为64.0831.917与4.083距离超过1.917的除了a6外,还有a7,即表5和表6。 P=0.04419192+0.00126263=0.04545450.05不拒绝零假设H0,即两组治愈率之差异无统计学意义。

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1