执业医师卫生统计学讲义0601Word格式文档下载.docx
《执业医师卫生统计学讲义0601Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《执业医师卫生统计学讲义0601Word格式文档下载.docx(17页珍藏版)》请在冰豆网上搜索。
脑肿瘤的发生部位和类型是否有关系
χ2检验从资料形式上可分为
一、四格表资料的χ2检验
(一)完全随机设计四格表资料χ2检验
例欲了解某市在校男、女中学生对艾滋病知识的掌握情况,随机抽取该市某中学243名学生进行问卷调查,其中对问题“与艾滋病患者握手是否会感染艾滋病?
”的回答情况见下表。
问该市男、女中学生对该问题的知晓率是否有差异?
某市男、女中学生对“与艾滋病患者握手是否会感染艾滋病”知晓率的比较
(1)建立检验假设,确定检验水准
H0:
π1=π2,即该市男、女中学生的知晓率相等
H1:
π1≠π2,即该市男、女中学生的知晓率不等
α=0.05
成组设计四格表的一般形式,包含a、b、c、d四个基本数据,其余数据均由这4个数据计算出来,这种两组二分类的资料,称为2×
2列联表资料,亦称四格表资料。
1.完全随机设计四格表
2.χ2检验的基本思想
χ2检验中,从样本观察到的频数为实际频数,用A表示
在无效假设H0成立的前提下,根据实际频数算得的各个格子的期望频数称为理论频数,用T表示。
理论频数(T)的计算方法:
根据无效假设推算出来的,本例中的无效假设为
都等于合计的知晓率65.84%(160/243)
则男中学生的理论知晓人数为(120×
160)/243=79.012
TRC为第R行第C列格子的理论频数
nR为该格相应的行合计数,
nC为该格相应的列合计数,
n为总例数
χ2检验的基本公式是
χ2值反映了实际频数和理论频数之间的吻合程度。
若H0成立,则A与T相差不应该很大,即χ2统计量不应该很大。
A与T相差越大,χ2值越大,相应的P值越小。
若P≤α,则A与T相差较大,有理由认为无效假设不成立,从而拒绝H0,接受H1。
每个格子的
>0,因此格子数越多,χ2值也会越大。
χ2值的大小除了和A与T的差别大小有关外,还与格子数有关。
因而在考虑χ2值大小的同时,应同时考虑格子数的多少(自由度v的大小),这样才能更准确地反应A与T的吻合度。
自由度v公式:
υ=(R-1)(C-1)→(行数-1)(列数-1)
当H0成立时,χ2值近似服从自由度为υ的χ2分布,故样本量较大时可借助χ2分布作出统计推断。
【习题】理论上,χ2的取值范围为
A.-∞<χ2<+∞
B.-∞<χ2≤+∞
C.0≤χ2<+∞
D.-1<χ2<+1
E.χ2≤1
『正确答案』C
『答案解析』χ2由于是平方,所以肯定是大于0的,所以答案选择C。
【习题】当四格表的行合计、列合计均保持不变时,如果某格子的实际频数有变化,则其理论频数
A.减小
B.不变
C.增大
D.不确定
E.随该格子实际频数的增减而增减
『正确答案』B
『答案解析』四格表中理论频数计算方法为TRC=nR·
nc/n。
nR表示R行合计数,当四格表的行合计、列合计均保持不变时,如果某格子的实际频数有变化时,则其理论频数是保持不变。
3.完全随机设计四格表资料χ2检验的步骤
(2)计算统计量
1)计算理论频数
本例若H0成立,则a、b、c、d各格的理论频数分别为:
2)计算χ2值
3)计算自由度V
V=(2-1)(2-1)=1
(3)确定P值,做出推断:
查χ2界值表得P<0.005,按α=0.05水准,拒绝H0,接受H1,差异有统计学意义,可以认为该市男、女中学生对该问题的知晓率不相同,男生知晓率较高。
4.完全随机设计四格表资料χ2检验的专用公式
为简化计算,对成组设计四格表资料,可直接用专用公式计算χ2值
将上题的数据代入专用公式,得
5.完全随机设计四格表资料χ2检验的应用条件
χ2值在所有格子的T≥5且n≥40时,近似服从自由度为1的χ2分布。
当有理论频数小于5时,这种近似程度降低。
因此,在分析成组设计四格表资料时,需根据具体情况作不同处理:
(1)当n≥40,且T≥5时,用χ2检验基本公式或成组设计四格表χ2检验的专用公式
基本公式:
四格表χ2检验的专用公式:
(2)当n≥40,且1≤T<5时,用成组设计四格表χ2检验的校正公式,或用四格表的确切概率法。
例随机抽查甲、乙两工种矽肺患病情况
问两工种的矽肺患病率有没有差别的假设检验,统计量公式用?
方法总结:
1.最小的实际频数并一定有最小的理论频数,因为根据公式得知,理论频数只与行合计、列合计和总数有关。
2.何快速定位最小理论频数?
最小的行合计与最小列合计的交叉点。
3.专用公式,依然要计算理论频数,来决定是否用卡方检验或卡方检验的哪个公式。
(3)当n<40或T<1时,不能用χ2检验,应当用四格表的确切概率法。
【习题】成组设计四格表资料的χ2检验,选用基本公式
的条件是
A.A≥5
B.T≥5
C.A≥5且T≥5
D.n≥40且T≥5
E.n≥40且A≥5
『正确答案』D
【习题】欲了解某药治疗工人荨麻疹的效果,将100名工人荨麻疹患者随机等分为两组,试验组用该药,对照组用已知的阳性药物。
治疗30天后,试验组30例有效,有效率为60.0%;
对照组37例有效,有效率为74.0%。
拟采用成组设计四格表设计资料χ2检验进行分析,则四格表的4个基本数据是
『答案解析』试验组有效人数a为30,无效人数b为20;
对照组有效人数c为37,无效人数为13。
【习题】某研究欲比较A、B两种抗生素治疗单纯性尿路感染的疗效,将84例患者随机等分成两组,一组采用A药治疗,一组采用B药治疗,7天后观察疗效,宜采用:
A、B两种抗生素治疗单纯性尿路感染的疗效
A.配对设计四格表资料χ2检验公式
B.配对设计四格表资料χ2检验的校正公式
C.成组设计四格表资料χ2检验的专用公式
D.成组设计四格表资料χ2检验的校正公式
E.四格表资料的确切概率法
『正确答案』C。
n=84>40,最小理论频数
,可用χ2检验基本公式
或成组设计四个表格资料χ2检验的专用公式
(二)配对设计四格表资料χ2检验的计算及应用条件
1.配对设计四格表资料的χ2检验:
配对设计且实验结果为二分类资料时,可整理为配对设计四格表资料。
例某研究者欲比较心电图和生化测定诊断低血钾的价值,分别采用两种方法对79名临床确诊的低血钾患者进行检查,问两种方法的检测结果是否不同?
两种方法诊断低血钾的结果
B=C,即两种方法的检测结果相同
B≠C,即两种方法的检测结果不同
解题思路:
1.是否为配对设计?
结论:
是配对设计(对同一研究对象采用两种处理方法)
2.资料类型是否为分类资料?
“+”、“-”为定性资料,分类资料
表配对设计四格表形式
分析:
a是两种检验方法共同阳性数,d是两种方法共同阴性数,显示不出差别。
b和c是两种检验方法结果的不同部分,两种方法的区别就反应在这两个数据上。
配对设计四格表资料的χ2计算公式为:
当b+c<
40时,需作连续性校正:
2.配对设计四格表χ2检验的步骤
本例b+c=29<40,故用以下公式
(3)确定P值,做出推断
查χ2界值表,得P<0.005,按α=0.05水准,拒绝H0,接受H1,差异有统计学意义,可以认为两种方法的检测结果不同,由于b>c,故心电图的阳性检出率高于生化测定方法。
【习题】对96例Ⅰ期煤工尘肺患者,分别用多排螺旋CT和高分辨率CT两种CT两种CT方法扫描检查肺气肿患病情况,结果如下表,欲比较两种CT的煤工尘肺肺气肿检出率是否有差异,宜采用:
『正确答案』B同一患者分别用两种CT方法进行扫描检查,为配对设计的四格表资料。
本例b+c<40,宜采用配对设计四格表资料χ2检验的校正公式。
二、行×
列表资料
(一)行×
列表资料的χ2检验
1.行×
列表资料当比较组数大于等于2,或变量的分类数大于等于2种时,数据可采用多行×
多列表形式来表达,称行×
列表。
行×
列表的χ2检验用于检验两个或多个样本率(构成比)的差别是否有统计学意义。
2.行×
列表资料χ2检验的计算公式
上式为行×
列表χ2检验的通用公式,与式
等价,nR、nC、n含义同式
3.行×
列表资料χ2检验的步骤
(1)多个样本率的比较
某研究者欲比较A、B、C三种方案治疗轻、中度高血压的疗效,将年龄在50~70岁的240例轻、中度高血压患者随机等分为3组,分别采用三种方案治疗。
一个疗程后观察疗效,结果见下表。
问三种方案治疗轻、中度高血压的有效率有无差别?
三种方案治疗轻、中度高血压的效果
1)建立