卡方检验正式PPT格式课件下载.ppt
《卡方检验正式PPT格式课件下载.ppt》由会员分享,可在线阅读,更多相关《卡方检验正式PPT格式课件下载.ppt(86页珍藏版)》请在冰豆网上搜索。
检验统计量:
2应用:
应用:
计数资料计数资料5基本概念基本概念例例1某院比较异梨醇(试验组)和氢氯塞嗪某院比较异梨醇(试验组)和氢氯塞嗪(对照组)降低颅内压的疗效,将(对照组)降低颅内压的疗效,将200名患者名患者随机分为两组,试验组随机分为两组,试验组104例中有效的例中有效的99例例,对对照组照组96例中有效的例中有效的78例例,问两种药物对降低颅问两种药物对降低颅内压疗效有无差别?
内压疗效有无差别?
6表表200名颅内高压患者治疗情况名颅内高压患者治疗情况编号编号年龄年龄性别性别治疗组治疗组舒张压舒张压体温体温疗效疗效137男A11.2737.5有效245女B12.5337.0有效343男A10.9336.5有效459女B14.6737.8无效20054男B16.8037.6无效如何整理此类资料?
如何整理此类资料?
如何分析此类资料?
7四格表(四格表(fourfoldtable)资料的基本形式)资料的基本形式实际频数实际频数(actualfrequency)是指各分类是指各分类实际发生或未发生计数值,记为实际发生或未发生计数值,记为A。
a=99b=5104c=75d=219617426200单元格单元格8理论频数理论频数(theoreticalfrequency)是指按是指按某某H0假设计算各分类理论上的发生或未假设计算各分类理论上的发生或未发生计数值,记为发生计数值,记为T。
式中,TRC为第R行C列的理论频数nR为相应的行合计nC为相应的列合计疗法疗法有效人数有效人数无效人数无效人数合计合计有效率有效率试验组试验组99(99(90.4890.48)5(5(13.5213.52)10410495.295.2对照组对照组75(75(83.5283.52)21(21(12.4812.48)969678.178.1合计合计174174262620020087.087.09p残差残差设设A代表某个类别的观察频数,代表某个类别的观察频数,T代表基于代表基于H0计算出的期望频数,计算出的期望频数,A与与T之差之差(A-T)被被称为残差称为残差p残差可以表示某一个类别观察值和理论值的残差可以表示某一个类别观察值和理论值的偏离程度,但残差有正有负,相加后会彼此偏离程度,但残差有正有负,相加后会彼此抵消,总和仍然为抵消,总和仍然为0。
为此可以将残差平方后。
为此可以将残差平方后求和,以表示样本总的偏离无效假设的程度求和,以表示样本总的偏离无效假设的程度p类似于方差的计算思想,类似于方差的计算思想,10Pearson2检验的基本公式检验的基本公式p残差大小是一个相对的概念,残差大小是一个相对的概念,相对于期望频数为相对于期望频数为10时,时,20的残差非常大;
可相对于期的残差非常大;
可相对于期望频数为望频数为1000时时20就很小了。
就很小了。
因此又将残差平方除以期望因此又将残差平方除以期望频数再求和,以标准化观察频数再求和,以标准化观察频数与期望频数的差别。
频数与期望频数的差别。
p卡方统计量,卡方统计量,1900年由英国年由英国统计学家统计学家K.Pearson首次提出。
首次提出。
KarlPearson(18571936)11p从卡方的计算公式可见,当观察频数与期从卡方的计算公式可见,当观察频数与期望频数望频数完全一致完全一致时,时,卡方值为卡方值为0;
p观察频数与期望频数越接近,两者之间的观察频数与期望频数越接近,两者之间的差异越小差异越小,卡方值越小卡方值越小;
p反之,观察频数与期望频数差别越大,两反之,观察频数与期望频数差别越大,两者之间的者之间的差异越大差异越大,卡方值越大卡方值越大。
p当然,卡方值的大小也当然,卡方值的大小也和自由度有关和自由度有关p检验的自由度取决于可以检验的自由度取决于可以自由取值的格子自由取值的格子数目数目,而不是样本含量,而不是样本含量n。
p理论上,在理论上,在n40时下式值与时下式值与2分布近似,分布近似,在理论数在理论数5,近似程度较好。
,近似程度较好。
12l连续型分布:
正态分布(连续型分布:
正态分布(Normaldistribution),学生氏),学生氏t分布分布(Studentst-distribution),F分布分布(Fdistribution)l另一个同样重要的分布另一个同样重要的分布2卡方分布卡方分布(Chi-squareddistribution)。
l此分布在此分布在1875年,首先由年,首先由F.Helmet所提出,所提出,而且是由正态分布演变而来的,即标准正态而且是由正态分布演变而来的,即标准正态分布分布Z值之平方而得值之平方而得2分布分布13设设Xi为来自正态总体的连续性变量。
为来自正态总体的连续性变量。
称为自由度称为自由度df=n的卡方值。
的卡方值。
显然,卡方分布具有可加性。
143.847.8112.59PP0.050.05的临界值的临界值2分布的概率密度函数曲线分布的概率密度函数曲线15当当=1时时,16第二节第二节2222表卡方检验表卡方检验17两组样本率比较的设计分类:
两组样本率比较的设计分类:
1.两组两组(独立独立)样本率的比较样本率的比较组间数据是相互独立组间数据是相互独立,非配对设计。
非配对设计。
22表卡方检验表卡方检验2.配对设计两组样本率的比较配对设计两组样本率的比较组间数据是相关的,配对设计。
组间数据是相关的,配对设计。
配对四格表卡方检验配对四格表卡方检验18两组(不配对)样本率的比较两组(不配对)样本率的比较1)四格表形式)四格表形式2)四格表不配对资料检验的专用公式)四格表不配对资料检验的专用公式二者结果等二者结果等价价各组样各组样本例数本例数是固定是固定的的组别组别阳性数阳性数阴性数阴性数合计合计率率%甲组甲组aabba+ba+b=n=n11a/na/n11乙组乙组ccddc+dc+d=n=n22c/nc/n22合计合计a+ca+cb+db+dNN(a+ca+c)/N)/N19例例1(续)(续)20H0:
1=2即即试试验验组组与与对对照照组组降降低低颅颅内内压压的的总体有效率相等总体有效率相等H1:
12=0.05。
以以=1查查附附表表8的的2界界值值表表得得P40,此时有,此时有1T5时,需计算时,需计算Yates连续性校正连续性校正2值值T1,或,或n40时,应改用时,应改用Fisher确切概率确切概率法直接计算概率法直接计算概率24
(1)校正公式的条件:
校正公式的条件:
1T5,同时同时N40,用校正公式计算用校正公式计算
(2)连续校正连续校正(continuitycorrection)公式:
公式:
(3)当当T1,或或N0.05。
按按=0.05检检验验水水准准,不不拒拒绝绝H0,无无统统计计学学意意义义,尚尚不不能能认认为为两两种种药药物物治治疗疗脑脑血血管管疾疾病病的的有效率不等。
有效率不等。
28卡方检验的连续性校正问题卡方检验的连续性校正问题正方观点正方观点:
卡方统计量抽样分布的连续性和平滑性得卡方统计量抽样分布的连续性和平滑性得到改善,可以降低到改善,可以降低II类错误的概率;
类错误的概率;
校正结果更接近于校正结果更接近于FisherFisher确切概率法;
确切概率法;
校正是有条件的。
反方观点反方观点:
经连续性校正后,经连续性校正后,PP值有过分保守之嫌;
值有过分保守之嫌;
连续性校正卡方检验的连续性校正卡方检验的PP值与值与FisherFisher确切确切概率法的概率法的PP值没有可比性,这是因为值没有可比性,这是因为FisherFisher确切概率法建立在四格表确切概率法建立在四格表双边固定双边固定的假定下,的假定下,而实际资料则是而实际资料则是单边固定单边固定的四格表。
的四格表。
29就应用而言,无论是否经过连续性校正,就应用而言,无论是否经过连续性校正,若两种检验的结果一致,无须在此问题若两种检验的结果一致,无须在此问题上纠缠。
但是,当两种检验结果相互矛上纠缠。
但是,当两种检验结果相互矛盾时,如例盾时,如例2,就需要谨慎解释结果了。
,就需要谨慎解释结果了。
为客观起见,建议将两种结论同时报告为客观起见,建议将两种结论同时报告出来,以便他人判断。
当然,如果两种出来,以便他人判断。
当然,如果两种结论一致,如均为结论一致,如均为有或无统计学意义有或无统计学意义,则只报道非连续性检验的结果即可。
则只报道非连续性检验的结果即可。
30第二节第二节配对设计两个样本率的配对设计两个样本率的2检验检验(McNemer检验检验)配对设计:
通常为配对设计:
通常为同源配对同源配对。
对同一观察。
对同一观察对象分别用两种方法处理,观察其阳性与对象分别用两种方法处理,观察其阳性与阴性结果。
阴性结果。
基本用途:
常用于比较基本用途:
常用于比较两种检验方法两种检验方法或或两两种培养基种培养基的阳性率是否有差别。
的阳性率是否有差别。
数据形式:
配对四格表形式配对四格表形式。
31例例33某实验室采用两种方法对某实验室采用两种方法对5858名可疑名可疑红斑狼疮患者的血清抗体进行测定,问:
红斑狼疮患者的血清抗体进行测定,问:
两方法测定结果阳性检出率是否有差别?
测定结果为:
阳性、阴性(共测定结果为:
阳性、阴性(共116116标本,标本,5858对)对)方法(方法(XX)乳胶凝集法乳胶凝集法免疫荧光法免疫荧光法对子例数对子例数11113333221212结结果果32上述配对设计实验中,就每个对子而言,上述配对设计实验中,就每个对子而言,两种处理的结果不外乎有两种处理的结果不外乎有四种可能四种可能:
两种检测方法皆为阳性数两种检测方法皆为阳性数(aa);
两种检测方法皆为阴性数两种检测方法皆为阴性数(dd);
免疫荧光法为阳性,乳胶凝集法为免疫荧光法为阳性,乳胶凝集法为阴性数阴性数(bb);
乳胶凝集法为阳性,免疫荧光法为乳胶凝集法为阳性,免疫荧光法为阴性数阴性数(cc)。
其中,其中,aa,dd为两法观察结果一致的两种情况,为两法观察结果一致的两种情况,bb,cc为两法观察结果不一致的两种情况。
为两法观察结果不一致的两种情况。
33表表两种方法的检测结果两种方法的检测结果34方法原理方法原理按照配对设计的思路进行分析,则首先应按照配对设计的思路进行分析,则首先应当求出当求出各对的差值各对的差值,然后考察样本中差值,然后考察样本中差值的分布是否按照的分布是否按照HH00假设的情况假设的情况对称