8无序分类资料的统计推断X2检验.docx

上传人:b****5 文档编号:7845318 上传时间:2023-01-26 格式:DOCX 页数:8 大小:24.14KB
下载 相关 举报
8无序分类资料的统计推断X2检验.docx_第1页
第1页 / 共8页
8无序分类资料的统计推断X2检验.docx_第2页
第2页 / 共8页
8无序分类资料的统计推断X2检验.docx_第3页
第3页 / 共8页
8无序分类资料的统计推断X2检验.docx_第4页
第4页 / 共8页
8无序分类资料的统计推断X2检验.docx_第5页
第5页 / 共8页
点击查看更多>>
下载资源
资源描述

8无序分类资料的统计推断X2检验.docx

《8无序分类资料的统计推断X2检验.docx》由会员分享,可在线阅读,更多相关《8无序分类资料的统计推断X2检验.docx(8页珍藏版)》请在冰豆网上搜索。

8无序分类资料的统计推断X2检验.docx

8无序分类资料的统计推断X2检验

8.无序分类资料的统计推断—X2检验

8无序分类资料的统计推断2检验2检验(chi-squaretest)是一种用途较广的假设检验方法,这里仅介绍它在分类变量资料中的应用,检验两个或两个以上的样本率或构成比之间的差异是否有统计意义。

8.1四格表资料的2检验四格表即22列联表,其自由度df=1,又分为一般与配对两种情形,本节介绍一般四格表的2检验,主要是用来推断两个总体率或构成比之间有无差别。

一般四格表,①在总频数n40且所有理论频数5时,用Pearson2统计量;②在总频数n40且有理论频数<5但1时,用校正2统计量;③在总频数n<40或有理论频数<1时,用Fisher精确概率法检验。

计数资料的数据格式有两种,一种是频数表格式,如表8-1;一种是原始记录格式,如前面第4章统计描述中的表4-3,这两种格式在SPSS操作时有所不同。

例例8-1欲研究内科治疗对某病急性期和慢性期的治疗效果有无不同,某医生收集了182例采用内科疗法的该病患者的资料,数据见表8-1。

请分析不同病期的总体有效率有无差别?

表8-1两种类型疾病的治疗效果组别有效无效合计有效率(%)急性期693710665.1慢性期30467639.5合计998318254.4解这是一般四格表,012:

H,即急性期和慢性期的总体有效率相同。

建立3列4行的数据文件,如图8-1,其中行变量r表示组别(值标签:

1=急性期、2=慢性期),列变量c表示疗效(值标签:

1=有效、2=无效),freq表示频数。

1.指定频数变量选择菜单DataWeightcases,弹出Weightcases对话框,见图8-2;选中Weightcasesby;在左边框中选中频数freq,并将其送入Frequency框中;单击OK。

图8-1例8.1数据文件图8-2Weightcases对话框2.进行2检验选择菜单AnalyzeDescriptiveStatisticsCrosstabs(交叉表),弹出Crosstabs主对话框;将组别r送入行变量Row(s)框,将疗效c送入列变量Column(s)框,如图8-3。

SPSS统计软件72单击Statistics(统计量)按钮,弹出Statistics对话框,选中左上角的Chi-square(2检验),如图8-4;单击Continue,返回如图8-3所示主对话框。

单击Cells(单元格)按钮,弹出CellDisplay对话框,再选中Expected(理论频数)和Row(行百分比),如图8-5;单击Continue,返回主对话框;单击OK,完成2检验,主要输出结果如图8-6、7所示。

图8-3Crosstabs主对话框图8-4Crosstabs:

Statistics对话框图8-6是本例频数分布表的输出结果,每个方格中的3个数据分别表示实际频数、理论频数和实际频数在该行合计中所占的百分比(即该组的样本有效率或无效率),例如急性期和有效所对应的方格中的3个数据分别表示急性期组有效的实际频数69、理论频数57.7和急性期组的有效率65.1%。

组别*疗效Crosstabulation693710657.748.3106.065.1%34.9%100.0%30467641.334.776.039.5%60.5%100.0%998318299.083.0182.054.4%45.6%100.0%CountExpectedCount%within组别CountExpectedCount%within组别CountExpectedCount%within组别急性期慢性期组别Total有效无效疗效Total图8-5Crosstabs:

CellDisplay对话框图8-6例8-1频数分布表图8-7是本例2检验的输出结果,该表的下方提示本例有0个单元格的理论频数小于5,最小理论频数34.66,这些可以帮助我们选择2统计量和概率值。

表中第一行PearsonChi-Square是Pearson2的计算结果,第二行ContinuityCorrection是校正2的计算结果,第四行Fisher’sExactTest是Fisher精确概率法检验的计算结果。

本例总频数n=182>40,且所有理论频数5,故选用第一行的Pearson2的计算结果,2=11.713,P=0.001,拒绝原假设H0,急性期和慢性期的总体有效率差异有统计学意义,再由图8-6可知,急性期样本有效率65.1%大于慢性期的39.5%,可以认为内科治疗对急性期的治疗效果优于慢性期的治疗效果。

Chi-SquareTests11.713b1.00110.7031.00111.7981.001.001.00111.6481.001182PearsonChi-SquareContinuityCorrectionaLikelihoodRatioFisher’sExactTestLinear-by-LinearAssociationNofValidCasesValuedfAsymp.Sig.(2-sided)ExactSig.(2-sided)ExactSig.(1-sided)Computedonlyfora2x2tablea.0cells(.0%)haveexpectedcountlessthan5.Theminimumexpectedcountis34.66.b.图8-7例8-1检验结果如果本例的数据格式不是表8-1所示的频数表格式,而是原始记录格式,SPSS数据文件将是2列182行,只有组别r和疗效c两列,没有频数freq列,182行中有69行1、1,37行1、2,30行2、1,46行2、2。

在操作中,没有

(1)指定频数变量这一步,其它操作和计算结果完全相同。

例例8-2表8-2中的资料是240例心肌梗塞患者接受甲、乙两种不同治疗方法后24小时内的死亡情况,问两种疗法病死率是否有差别?

表表8-224小时内死亡情况疗法生存例数死亡例数合计病死率(%)甲187111985.6乙3664214.3合计223172407.1解统计分析步骤同例8-1。

由输出结果知,本例最小理论值为2.985,故用第二行ContinuityCorrection(校正2检验)的计算结果,2=2.796,P=0.095>0.05,以05.0水准不能拒绝原假设,差异没有统计学意义,即据此资料尚不能认为两疗法的病死率有差别。

例例8-3某医师为研究乙肝免疫球蛋白预防胎儿宫内感染HBV的效果,将33例HBsAg阳性孕妇随机分为预防注射组和非预防组,结果见表8-3。

问两组新生儿的HBV总体感染率有无差别?

表8-3两组新生儿HBV感染率的比较组别阳性阴性合计感染率(%)预防注射组4182218.2非预防组561145.5合计9243327.3解解统计分析步骤同例8-1。

本例n=3340,故用第四行Fisher’sExactTest的计算结果,双侧P=0.121>0.05,不能拒绝原假设,差异没有统计学意义,尚不能认为两组新生儿的HBV感染率有差别。

8.2配对四格表的2检验与一致性检验SPSS统计软件74计数资料的配对设计常用于两种检验方法、诊断方法等的比较,如同一批病人以两种方法作检查或诊断,同一批样品用两种方法作检测等,其特点是对样本中各观察单位分别用两种方法处理。

配对设计的计数资料的数据形式往往表示为配对四格表。

例例8-4用甲、乙两法进行细菌检验,为比较两法的检验效果,将每份样品分成两份,分别用两种方法进行检验,得到260个样品的检验结果如表8-4,试问两种检验方法的检验结果有无差别?

解这是配对四格表。

数据文件建立同例题8-1。

1.指定频数变量操作同例8-1。

2.进行配对2检验选择菜单AnalyzeDescriptiveStatisticsCrosstabs,在弹出的Crosstabs主对话框中,将甲法r送入行变量Row(s)框,将乙法c送入列变量Column(s)框。

单击Statistics(统计量)按钮,弹出Statistics对话框,选中McNemar(配对计数资料的2检验),选中Kappa(Kappa一致性检验);单击Continue,返回Crosstabs主对话框;单击OK,完成配对四格表2检验,主要输出结果如图8-8、9所示。

图8-8给出的是McNemar法检验配对计数资料检验的结果,McNemar检验的假设是H0:

甲乙两法的检测结果相同。

本例P=0.503>0.05,不能拒绝H0,可以认为甲乙两法的检测结果相同。

图8-9给出的是Kappa一致性检验结果。

Kappa一致性检验的H0是:

Kappa=0,即甲乙两种方法检测结果不一致。

本例Kappa=0.817,P=0.000,拒绝H0,甲乙两种方法检测结果存在一致性。

根据经验,一般认为,Kappa0.75时表明两者一致性较好,0.75>Kappa0.4时表明两者一致性一般,Kappa<0.4时表明两者一致性较差。

SymmetricMeasures.817.03913.181.000260KappaMeasureofAgreementNofValidCasesValueAsymp.Std.ErroraApprox.TbApprox.Sig.Notassumingthenullhypothesis.a.Usingtheasymptoticstandarderrorassumingthenullhypothesis.b.图8-9Kappa一致性检验结果注意,McNemar检验只考虑了两法结果不一致的两种情况(b和c,本例的8和12),而没有考虑样本含量n和两法结果一致的两种情况(a和d,本例的172和68),所以,n很大而且a和d的数值很大(即两法的一致率较高),b和c的数值相对较小时,McNemar检验就失去了实用价值,此时如果使用McNemar检验,反而会得出两法有差异的结论来。

而Kappa检验是利用列联表中的全部信息的。

例如,表8-5中有两个配对四格表,McNemar检验结果完全相同,P均为0.013<0.05,均得到两法检测结果不相同的结论,这个结论对右边的表格就不表表8-4不同方法细菌检验结果甲法乙法合计+-+1728180-126880合计18476260Chi-SquareTests.503a260McNemarTestNofValidCasesValueExactSig.(2-sided)Binomialdistributionused.a.图8-8McNemar检验结果合适;对两个表用Kappa检验,左边表的Kappa=0.357,两法一致性较差;右边表的Kappa=0.986,两法一致性很好。

表8-5配对四格表比较计算甲法乙法甲法乙法+-+-+1112+101112-217-210178.3行列表资料的2检验当列联表的行数或列数大于2时,通常称为行列表,也称RC表。

行列表分双向无序、单向有序、双向有序且属性不同、双向有序且属性相同等四种类型,本章只介绍双向无序行列的2检验,采用Pearson2公式计算统计量,常用于多个样本率(或构成比)的比较。

一般认为,行列表资料中各格的理论频数不应<1,且1理论频数<5的格子数不应超过格子总数的1/5。

若出现上述情况,可用下面四种方法解决①增大样本含量,使理论频数变大;②删去理论频数太小的行或列;③把理论频数太小的行或列与性质相近的邻行或列合并;④使用Fisher确切概率方法计算。

例8-5某医师研究物理疗法、药物治疗和外用膏药三种疗法治疗周围性面神经麻痹的疗效,资料见表8-6。

问三种疗法的总体有效率有无差别?

表8-6三种疗法有效率的比较疗法有效无效合计有效率(%)物理疗法组199720696.6药物治疗组1641818290.1外用膏药组1182614481.9合计4815153290.4解这是32表,0123:

H,即三种疗法的总体有效率全相同。

立建立3列列6行的数据文件,如图8-10,变量的含义同例8-1。

指定频数变量、Statistics(统计量)对话框操作、(统计量)对话框操作、Cells(单元格)对话框操作都和例8-1相同,只是在Crosstabs主对话框操作中加一步主对话框操作中加一步:

单击Crosstabs主对话框左下角的Exact按钮,在弹出的ExactTests对话框中,选中Exact;单击Continue,返回Crosstabs主对话框。

这步操作的目的是让SPSS计算出本题的Fisher确切概率法的结果,因为默认情况下是不计算Fisher确切概率的。

图8-11是输出结果,本例最小理论频数13.80,所有理论频数均>5,故用第一行Pearson2的计算结果,2=21.038,P=0.000,拒绝H0,三种疗法的总体有效率不全相同。

如果有理论频数<1,或1理论频数<5的格子数超过格子总数的1/5,则应该读取第三行Fisher’sExactTest的计算结果。

SPSS统计软件76Chi-SquareTests21.038a2.000.00021.5592.000.00021.187.00020.903b1.000.000.000.000532PearsonChi-SquareLikelihoodRatioFisher’sExactTestLinear-by-LinearAssociationNofValidCasesValuedfAsymp.Sig.(2-sided)ExactSig.(2-sided)ExactSig.(1-sided)PointProbability0cells(.0%)haveexpectedcountlessthan5.Theminimumexpectedcountis13.80.a.Thestandardizedstatisticis4.572.b.图8-10例8-5数据文件图8-11例8-5检验结果本例结论是拒绝H0,三种疗法的总体有效率不全相同,但不能说明任两个总体率之间都有差异,若想推断哪两个总体率有差异,还要进行两两比较,即对每两个疗法的差异作统计检验,然后做出结论。

由于重复多次的假设检验会增大犯第一类错误的概率,因此必须重新规定检验水准,检验水准‘可以用公式2,kNCN=来计算,其中k为参加检验的组数。

本例k=3,检验水准为0.050.01673=,将三组进行两两四格表的2检验,结果是:

物理疗法和药物治疗:

2=6.756,P=0.009<0.0167;物理疗法和外用膏药:

2=21.323,P=0.000<0.0167;药物治疗和外用膏药:

2=4.591,P=0.032>0.0167,所以可以认为物理疗法与药物治疗、外用膏药的有效率均有差别,而不能认为药物治疗和外用膏药的有效率有差别。

8.4分层资料的2检验在统计设计中常需进行分层设计,例如,在进行临床试验时,同一个试验需要由多个中心来完成。

这样,在统计分析时也要进行分层分析以校正层的影响。

例例8-6欲研究某项手术改进后,其术后并发症的发生与原来相比有无变化。

在甲、乙两医院同时展开研究,试验组采用改进的手术方法,对照组采用原手术方法。

术后并发症的发生情况如表8-7所示。

分析两种手术方法的术后并发症有无差别。

表表8-7两家医院不同手术方法术后并发症的发生情况医院方法术后并发症发生未发生合计甲改进138153291原方法301545乙改进9099189原方法201131解本资料研究的是手术方法和术后并发症的关系,但医院在这里可能成为混杂因子,也对术后并发症有影响。

因此分析时需按医院分层,研究排除层因素的干扰后,行变量和列变量是否有联系。

建立4列8行的数据文件,如图8-12,其中分层变量h表示医院(值标签:

1=甲、2=乙),行变量r表示手术方法(值标签:

1=改进、2=原方法),列变量c表示并发症(值标签:

1=发生、2=未发生),freq表示频数。

1.指定频数变量同例8-1。

2.进行分层2检验选择菜单AnalyzeDescriptiveStatisticsCrosstabs,弹出Crosstabs主对话框;将手术r送入行变量Row(s)框,将并发症c送入列变量Column(s)框,将医院h送入分层变量layer1of1框。

单击Statistics按钮,在弹出的对话框中,选中CochransandMantel-Haenszelstatistics(CMH2检验),单击Continue,返回Crosstabs主对话框;单击Cells按钮,在弹出的对话框,选中Row,单击Continue,返回Crosstabs主对话框;单击OK,完成分层资料的2检验,主要输出结果如图8-13至图8-16所示。

手术*并发症*医院Crosstabulation13815329147.4%52.6%100.0%30154566.7%33.3%100.0%16816833650.0%50.0%100.0%909918947.6%52.4%100.0%20113164.5%35.5%100.0%11011022050.0%50.0%100.0%Count%within手术Count%within手术Count%within手术Count%within手术Count%within手术Count%within手术改进原方法手术Total改进原方法手术Total医院甲乙发生未发生并发症Total图8-12例8-6数据文件图8-13例8-6频数分布表图8-13是频数分布表,每层的并发症未发生率都是改进手术方法高于原手术方法,因此,使用分层2检验的效果很好。

图8-14是不同医院OR值一致性检验,概率P=0.844,表明不同医院间的OR值相同。

TestsofHomogeneityoftheOddsRatio.0391.844.0391.844Breslow-DayTarone’sChi-SquareddfAsymp.Sig.(2-sided)图8-14OR值的一致性检验图8-15分层2检验结果图8-15给出了分层2检验的结果,即去除了分层因素的影响后,对行变量和列变量关SPSS统计软件78联的检验结果,共给出了CMH2检验和MH2检验两种结果,前者是后者的改进,本例2CMN=8.780,P=0.003,表明去除医院混杂作用后,术后并发症是否发生与手术方法有关。

图8-16是MH公共OR值估计,调整医院混杂作用后的公共OR值为0.470,表明去除医院混杂效应后,改进手术方法产生术后并发症的危险度大约为原手术方法的0.470倍。

Mantel-HaenszelCommonOddsRatioEstimate.470-.754.259.004.283.781-1.261-.247Estimateln(Estimate)Std.Errorofln(Estimate)Asymp.Sig.(2-sided)LowerBoundUpperBoundCommonOddsRatioLowerBoundUpperBoundln(CommonOddsRatio)Asymp.95%ConfidenceIntervalTheMantel-Haenszelcommonoddsratioestimateisasymptoticallynormallydistributedunderthecommonoddsratioof1.000assumption.Soisthenaturallogoftheestimate.图8-16MH公共OR值估计本章小结本章内容介绍了四种无序分类资料的2检验,在实际应用中,我们应根据资料所满足的前提条件和分析目的等,选用相应的2检验方法。

四格表资料的2检验,用于研究两个总体率或构成比是否相等。

在总频数n40和各理论频数T5时,用Pearson2检验;当n40但有1T<5时,要用校正的2检验;当40n或有T<1时,用Fisher精确检验。

行列表资料的2检验,用于多个样本率或构成比的比较。

当行列表中有超过20%格子的理论频数T5或有理论频数T1时,应采用Fisher确切概率法直接计算概率。

配对2检验和一致性检验,用于对配对四格表资料进行相关与一致性检验。

分层2检验,用于分析排除层因素的干扰后,行变量和列变量是否有联系。

习题8习题8-1某医院内科治疗一般类型胃溃疡病患者82例,治愈64人;治疗特殊类型胃溃疡病患者98例,治愈30人。

问该医院内科对两种类型胃溃疡病人治愈率有无不同?

题习题8-2某医师用复合氨基酸胶囊治疗肝硬化病人,观察其对改善实验室指标的效果,数据见表8-8。

试对两组的改善及恢复正常率进行比较。

表表8-8改善实验室指标的效果表表8-9肿瘤转移病人全消率分析分组改善未改善合计用药分组全消人数未全消人数合计试验组23225试验组8210对照组11617对照组21012合计34842合计101222习题8-3肿瘤转移病人全量放疗后用两种药物配合治疗,观察肿瘤消除的情况,结果

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 成人教育 > 电大

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1