卡方检验sun.pptx
《卡方检验sun.pptx》由会员分享,可在线阅读,更多相关《卡方检验sun.pptx(103页珍藏版)》请在冰豆网上搜索。
,卡方检验chi-squaretest,孙秀彬山东大学公共卫生学院,第一节:
四格表资料的2检验第二节:
RC表资料2检验第三节:
趋势2检验第四节:
四格表Fisher确切概率法第五节:
两样本率的等效检验,2检验(chisquaretest)是以2分布为理论依据的假设检验方法。
一、2分布的概念与2检验的基本思想,2分布的概念2检验的基本思想P值的确定,2检验的检验步骤,第一节:
四格表资料的2检验,2分布的概念,1、2分布是一种连续型分布(Continuousdistribution)个相互独立的标准正态变量(standardnormalvariable)22ui(i1,2,)的平方和称为变量,其分布即为分布;自由度(degreeoffreedom)为。
1,22222,u,uu,,,i,i,X,u,卡方分布的概念,2,密度函数:
2,n,n,f(x),n1xx22,1,2()2,0,e当x0,当x0,卡方分布的概念,2、2分布的拓展与应用1875年,F.Helmet得出:
来自正态总体的样本方差的分布服从2分布;1900年K.Pearson又从检验分布的拟合优度(goodnessoffit)中也发现了这一相同的2分布,可用于检验资料的实际频数和按假设检验的理论频数是否相符等问题。
卡方分布的概念,实际应用时,k个实际频数(actualfrequency)Ai,i,i,k,与相应的理论频数(theoreticalfrequency)Ti之间差别2,T),(A,Ti,的大小可用式,i1,表示(式中,i1,2,k);当,i,i,k,2,T),(A,Ti,样本含量n40且各Ti均大于5时,式,i1,近似,于2分布;n愈大,近似程度愈好。
卡方分布的概念,3、2分布的特点2分布(=1,2,3,4,6),=1=2=3=4=6,卡方分布的概念,2分布(=10,20,30,50),=10,=20,=30,=50,卡方分布的概念,2分布的特点:
2分布的形状依赖于自由度的大小:
当自由度2时,2曲线呈L型:
随着的增加,2曲线逐渐趋于对称;当自由度时,2曲线逼近于正态曲线。
卡方分布的概念,4、2分布的分位数(Percentile),当自由度确定后,2分布曲线下右侧尾部的面积P为,2,时,横轴上相应的值,记为,2,,如下图。
此为2分布的,0,2,4,6,8,10,0.0,0.1,0.2,分位数,实际应用时,可根据自由度由2界值表(附表5)得出。
2分布的分位数0.3,2,(,),1,表61,两种药物术后疼痛控制有效率的比较,卡方检验的基本思想,2检验的基本思想以两样本率比较的2检验为例,介绍其基本思想。
例6.1在某项治疗牙科术后疼痛控制的双盲临床研究中,将178例患者随机分为两组,A药组90人,有效68人;B药组88人,有效58人,结果见表61。
问两种药物的总体有效率有无差别?
表61内只有4个数,是该表的基本数据,,其余数据都是由这4个基本数据推算出来的,称为四格表(fourfoldtable)资料。
2检验的检验统计量为2,其基本公式为:
2,(AT)2T,=(行数1)(列数1),n,T,RC,nR.nC,abcd,卡方检验的基本思想,卡方检验的基本思想,P值的确定,2检验时,要根据自由度查2界值表。
22,当当,2,2,时,P,拒绝H0,接受H1;时,P,尚无理由拒绝H0。
卡方检验的基本思想,2检验的步骤建立假设,确定检验水准H0:
12H1:
120.05计算统计量2值按式(6.8)计算TRCT1190126/17863.71,T129063.7126.29T2112663.7162.29,T228862.2925.71。
卡方检验的基本思想,按基本公式计算2值,2,(5862.29)262.29,25.71,2(2226.29)26.292.00,(6863.71)263.71(3025.71)2,(21)(21)13确定P值,做出统计推断以=1查2界值表得P0.05。
按0.05检验水准不拒绝H0,差别无统计学意义。
尚不能认为两种药物控制牙科术后疼痛的疗效不同。
卡方检验的基本思想,*该例为两样本率比较的资料,既可用u检验也可用2检验来推断两总体率,是否有差别,且两种检验方法是等价的;对同一份四格表资料,u22。
四格表资料的卡方检验,二、四格表资料的2检验,
(一)四格表资料2检验的专用公式,2,(adbc)2n,(ab)(cd)(ac)(bd),2,2.00,908812652,*适用条件:
用于两样本率的比较;当总例数n40且所有格子的T5时。
*例6.1资料,用上式计算2值(68302258)2178,结果相同。
四格表资料的卡方检验,
(二)四格表资料2检验的校正公式,计数资料中的实际频数A为分类资料,是不连续的,由公式2(AT)2T计算的2值是离散型分布。
2界值表的依据是2分布,而2分布是连续型分布。
因此,用上式计算的统计量2值所得的概率P偏小,特别是当自由度为1的四格表资料。
为此,英国统计学家F.Yates(1934年)提出了用(|AT|0.5)计算2的连续性校正法。
四格表资料的卡方检验,校正公式:
c,2,(AT0.5)2T,2,(|adbc|n/2)2n,=(a+b)(c+d)(a+c)(b+d),c,适用条件:
用于两样本率的比较;当总例数n40,但有1T5时。
最小理论频数TRC的判断:
R行与C列中,行合计数中的最小值与列合计数中的最小值所对应格子的理论频数最小。
四格表资料的卡方检验,例为观察甲、乙两药治疗胃溃疡的疗效,将70例患者随机分为两组,一组30人服甲药,另一组40人用乙药,结果见表62。
问2种药物治疗胃溃疡的有效率有无差别?
表62两种药物治疗胃溃疡有效率的比较,1建立假设,确定检验水准,H0:
12,0.05,H1:
122计算统计量2值,3.42,30405911,(22383770/2)270,2c,3确定P值,做出统计推断1,查2界值表得0.05P0.10。
按0.05检验水准不拒绝H0,尚不能认为2种药物治疗胃溃疡的有效率不等。
*本资料若不校正时,24.75,P0.05,结论与之相反。
四格表资料的卡方检验,四格表资料的卡方检验,例某医师欲比较胞磷胆碱与神经节苷酯治疗脑血管疾病的疗效,将78例脑血管疾病患者随机分为2组,结果见表63。
问2种药物治疗脑血管疾病的有效率是否相等?
表63两种药物治疗脑血管疾病有效率的比较,四格表资料的卡方检验,1建立假设,确定检验水准,H0:
12,0.05,H1:
122计算统计量2值,2,3.14,52266414,(46861878/2)278,c,3确定P值,做出统计推断1,查附表92界值表得0.05P0.10。
按0.05检验水准不拒绝H0,尚不能认为2种药物治疗脑血管疾病的有效率不等。
*本资料若不校正时,24.35,P0.05,结论与之相反。
四格表资料的卡方检验,四格表资料的2检验公式的选用:
(1)当n40且所有的T5时,,2,用,2,(AT)2T,检验的基本公式:
2,(adbc)2n,或专用公式:
;(ab)(cd)(ac)(bd),当P时,改用四格表资料的Fisher确切概率法。
四格表资料的卡方检验
(2)当n40,但有1T5时,,用校正公式:
2c,(AT0.5)2T,,,2,(|adbc|n/2)2n,或:
c,=,(a+b)(c+d)(a+c)(b+d),或改用四格表资料的Fisher确切概率法。
当n40,或T1时,用四格表资料Fisher确切概率法。
2连续性校正仅用于1的四格表资料,尤其是n小时。
配对四格表卡方检验,三、配对四格表资料的2检验,例某实验室分别用甲、乙两种血清学方法检查410例确诊的鼻咽癌患者,结果见表64。
问2种方法的检测结果有无差别?
表642种血清学方法的检测结果,甲法,乙法,合计,配对四格表卡方检验计数资料的配对设计常用于2种检验方法、培养方法、诊断方法等的比较。
其特点是对样本中各观察单位分别用2种方法处理,然后观察2种处理方法的计数结果。
观察结果有4种情况,可整理成表64的形式:
2种检测方法皆为阳性的观察单位数(a);2种检测方法皆为阴性的观察单位数(d);甲法为阳性,乙法为阴性的观察单位数(b);甲法为阳性,乙法为阴性的观察单位数(c)。
配对四格表卡方检验其中,a、d为两法观察结果一致的2种情况,b、c为两法观察结果不一致的2种情况。
当2种处理方法无差别时,其总体有BC。
由于在抽样研究中,抽样误差是不可避免的,样本中的b和c往往不相等(即bc)。
为此,需进行假设检验(McNemartest),其检验统计量为2:
2,(bc)2bc,,,1,,(bc)40,2c,(bc1)2bc,,1,,(bc)40,配对四格表卡方检验本例的检验步骤:
1建立假设,确定检验水准H0:
BC,两种方法总体检出率相同H1:
BC,两种方法总体检出率不相同0.052计算统计量2值:
b+c=11840,2,88.17,1108,(1108)2,c,3确定P值,做出统计推断查2界值表得P0.005。
按0.05检验水准拒绝H0,接受H1,差别有统计学意义,可认为,配对四格表卡方检验,例某实验室分别用乳胶凝集法和免疫荧光法对58名可疑系统红斑狼疮患者血清中抗核抗体进行测定,结果见表65。
问2种方法的检测结果有无差别?
表652种方法的检测结果,免疫荧光法,乳胶凝集法,合计,配对四格表卡方检验1建立假设,确定检验水准H0:
BC,两种方法总体检测结果相同H1:
BC,两种方法总体检测结果不相同0.052计算统计量2值:
b+c=1440,5.79,122,(1221)2,2c,3确定P值,做出统计推断查2界值表得0.01P0.025。
按0.05检验水准拒绝H0,接受H1,可认为,行列表卡方检验第二节行列表资料的2检验行列表资料的2检验用于多个样本率的比较、两个或多个构成比的比较、以及双向无序分类资料的关联性检验。
其基本数据有以下3种情况:
多个样本率比较时,R行2列:
R2表;两个样本的构成比比较时,2行C列:
2C表;多个样本的构成比比较,以及双向无序分类资料关联性检验时,R行C列:
RC表。
以上3种情况可统称为行列表资料。
行列表卡方检验,表6.6R2表(多个样本率的比较)样本样本1样本2样本R合计,阳性A11A21AR1m1,阴性A12A22AR2m2,合计n1n2nRN,表6.7,2C表(两个样本构成比的比较),构成1构成2A11A12,构成C合计A1Cn1,样本样本1样本2合计,行列表卡方检验,表6.8,RC表(多个样本构成比的比较),样本样本1,构成1构成2A11A12,构成C合计A1Cn1,样本R合计,AR1m1,AR2m2,ARCmC,nRN,行列表卡方检验,表6.9,RC表(双向无序分类资料关联性检验),ABO血MN血型,合计,行列表卡方检验,行列表资料的2检验可用