1、浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅卡方检验卡方检验卡方检验卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅卡方检验基础卡方检验基础四格表卡方检验四格表卡方检验配对卡方检验与一致性检验配对卡方检验与一致性检验两分类变量间关联程度的度量两分类变量间关联程度的度量分层卡方检验分层卡方检验小结小结?内容提要内容提要浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅卡方检验用途:卡方检验用途:1、方差同质性测验、方差同质性测验(又称又称Bartlett test):用于做正态性
2、检验的条件。无效假设:方差同质;(:用于做正态性检验的条件。无效假设:方差同质;(P0.05)2、适合性检验:、适合性检验:Test for goodness-of-fit无效假设:符合理论分布;(无效假设:符合理论分布;(P0.05)3、独立性检验:、独立性检验:Test for independence,用于检验两个变数是否相关无效假设:两个变数相互独立;不相关;(,用于检验两个变数是否相关无效假设:两个变数相互独立;不相关;(P0.05)其他的检验见下文。其他的检验见下文。浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅 2检验是以检验是以2分布为基础
3、的一种假设检验方法,主 要用于分类变量,根据样本数据推断总体的分布与 期望分布是否有显著差异,或推断两个分类变量是 否相关或相互独立。其原假设为:分布为基础的一种假设检验方法,主 要用于分类变量,根据样本数据推断总体的分布与 期望分布是否有显著差异,或推断两个分类变量是 否相关或相互独立。其原假设为:H0:观察频数与期望频数没有差别:观察频数与期望频数没有差别卡方检验基础卡方检验基础浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅首先假设H首先假设H0 0 成立,计算出成立,计算出2 2值,它表示观察值与理论值之间 的偏离程度。根据值,它表示观察值与理论值之
4、间 的偏离程度。根据2 2分布,分布,2 2统计量以及自由度可以确定 在H统计量以及自由度可以确定 在H0 0 成立的情况下获得当前统计量及更极端情况的概率成立的情况下获得当前统计量及更极端情况的概率P P。如果如果P P 很小,说明观察值和理论值偏离程度太大,应当拒 绝原假设,表示比较资料之间有显著性差异;否则就不能 拒绝原假设,尚不能认为样本所代表的实际情况与理论假 设有差别。很小,说明观察值和理论值偏离程度太大,应当拒 绝原假设,表示比较资料之间有显著性差异;否则就不能 拒绝原假设,尚不能认为样本所代表的实际情况与理论假 设有差别。卡方检验基础卡方检验基础?2 2检验的基本思想检验的基本
5、思想浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅 2值的计算:值的计算:22()AEE=由英国统计学家由英国统计学家Karl Pearson首次提出,故被 称为首次提出,故被 称为Pearson 2。卡方检验基础卡方检验基础浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅当n比较大时,当n比较大时,2 2 统计量近似服从统计量近似服从k k-1个自由度的-1个自由度的2 2分布。在自由度固定时,每个分布。在自由度固定时,每个2 2值与一个概率值(值与一个概率值(P P 值)相对 应,此概率值即为在H值)相对 应,此概率
6、值即为在H0 0 成立的前提下,出现这样一个样本 或偏离假设总体更远的样本的概率。如果成立的前提下,出现这样一个样本 或偏离假设总体更远的样本的概率。如果P P 值小于或等于 显著性水准,则拒绝H值小于或等于 显著性水准,则拒绝H0 0,接受H,接受H1 1,即观察频数与期望频数不 一致。如果,即观察频数与期望频数不 一致。如果P P 值大于显著性水准,则不拒绝H值大于显著性水准,则不拒绝H0 0,认为观察 频数与期望频数无显著性差异。,认为观察 频数与期望频数无显著性差异。P P 值越小,说明H值越小,说明H0 0 假设正 确的可能性越小;假设正 确的可能性越小;P P 值越大,说明H值越大
7、,说明H0 0 假设正确的可能性越 大。假设正确的可能性越 大。卡方检验基础卡方分布卡方检验基础卡方分布浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅检验某个连续变量的分布是否与某种理论分布一致,如是否符合正态 分布,检验某个连续变量的分布是否与某种理论分布一致,如是否符合正态 分布,Possion分布等分布等检验某个分类变量各类的出现概率是否等于指定概率检验某个分类变量各类的出现概率是否等于指定概率检验两个分类变量是否相互独立,如吸烟是否与呼吸道疾病有关检验两个分类变量是否相互独立,如吸烟是否与呼吸道疾病有关检验控制某种或某几种分类变量因素的作用之后,另
8、两个分类变量是 否独立,如上例控制年龄、性别之后,吸烟是否与呼吸道疾病有关检验控制某种或某几种分类变量因素的作用之后,另两个分类变量是 否独立,如上例控制年龄、性别之后,吸烟是否与呼吸道疾病有关检验两种方法的结果是否一致,如两种诊断方法对同一批人进行诊 断,其诊断结果是否一致检验两种方法的结果是否一致,如两种诊断方法对同一批人进行诊 断,其诊断结果是否一致卡方检验基础用途卡方检验基础用途浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅例1 例1 某种药物加化疗与单用某种药物治疗的两 种处理方法,观察对某种癌症的疗效,结果见下 表。(数据见某种药物加化疗与单用
9、某种药物治疗的两 种处理方法,观察对某种癌症的疗效,结果见下 表。(数据见cancer.sav)四格表卡方检验四格表卡方检验处理疗效合计有效无效药物加化疗421355单用药物48351合计9016106两种治疗方法的疗效比较两种治疗方法的疗效比较检验两个变量是否存在显著性差异检验两个变量是否存在显著性差异又如模拟值和实际值之间的检验又如模拟值和实际值之间的检验浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅首先建立数据文件,如下。首先建立数据文件,如下。四格表卡方检验四格表卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研
10、室沈毅注意:由于上表给出的不是原始数据,而是频数表数据,应 该进行预处理。注意:由于上表给出的不是原始数据,而是频数表数据,应 该进行预处理。四格表卡方检验四格表卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅四格表卡方检验四格表卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅四格表卡方检验四格表卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅四格表卡方检验四格表卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅四格表卡方
11、检验四格表卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅四格表卡方检验四格表卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅结果分析结果分析?表示药物加化疗与单用药物治疗某种癌症的疗效比较的行列表,除了观察值以外,还有期望值。表示药物加化疗与单用药物治疗某种癌症的疗效比较的行列表,除了观察值以外,还有期望值。四格表卡方检验四格表卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅结果分析结果分析?此为四格表此为四格表2 2检验的结果,检验的结果,2 26.508,P
12、 P0.011,差异有显著性意义,即药物加化疗与单用药物治疗癌症的疗效有显著性差异。,差异有显著性意义,即药物加化疗与单用药物治疗癌症的疗效有显著性差异。四格表卡方检验四格表卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅连续性校正连续性校正2检验:检验:仅适用于四格表资料,在仅适用于四格表资料,在n40,所有期望频数均大于,所有期望频数均大于1,只有,只有1/5单元 格的期望频数大于单元 格的期望频数大于1小于小于5时;时;Fisher精确概率法:精确概率法:在样本含量在样本含量40或有格子的期望频数或有格子的期望频数40,最小期望频数,最小期望频
13、数5时,结论与时,结论与Pearson 2基本一致;基本一致;?几种卡方检验的比较:几种卡方检验的比较:四格表卡方检验四格表卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅配对卡方检验配对卡方检验在在Pearson卡方检验中,对行列变量的相关性作了检 验,其中的行列变量是一个事物的两个不同属性。实际应用中,还有一种列联表,其中的行列变量反映的 是一个事物的同一属性。卡方检验中,对行列变量的相关性作了检 验,其中的行列变量是一个事物的两个不同属性。实际应用中,还有一种列联表,其中的行列变量反映的 是一个事物的同一属性。例如把每一份标本分为两份,分 别用
14、两种方法进行化验,比较两种化验方法的结果是否有 本质不同;或分别采用甲、乙两种方法对同一批病人进行 检查,比较此两种方法的结果是否有本质不同,此时要用 配对卡方检验。例如把每一份标本分为两份,分 别用两种方法进行化验,比较两种化验方法的结果是否有 本质不同;或分别采用甲、乙两种方法对同一批病人进行 检查,比较此两种方法的结果是否有本质不同,此时要用 配对卡方检验。浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅配对卡方检验配对卡方检验配对卡方检验公式:配对卡方检验公式:22()=bcbc+若b+c40,则用公式:若b+c若b+c40,则用公式:若b+c40,
15、则用公式:40,则用公式:22(1)=bcbc+浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅例2 例2 某实验室分别用乳胶凝集法和免疫荧光法对某实验室分别用乳胶凝集法和免疫荧光法对58名 可疑系统性红斑狼疮患者血清中抗核抗体进行测定,结 果见下表,名 可疑系统性红斑狼疮患者血清中抗核抗体进行测定,结 果见下表,问两种方法的检测结果有无差别?(问两种方法的检测结果有无差别?(数据见 数据见 McNemar.sav)免疫荧光法乳胶凝集法合计+11122323335合计134558两种方法的检测结果两种方法的检测结果配对卡方检验配对卡方检验浙江大学医学院流行病
16、与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅首先建立数据文件,如下。首先建立数据文件,如下。配对卡方检验配对卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅配对卡方检验配对卡方检验同理,由于是频数表数据,应该先用weight cases进行预 处理同理,由于是频数表数据,应该先用weight cases进行预 处理。不能忘记 哦!不能忘记 哦!浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅在此选入频数变量即可进 行下一步的分析。在此选入频数变量即可进 行下一步的分析。配对卡方检验配对卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅配对卡方检验配对卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅配对卡方检验配对卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅配对卡方检验配对卡方检验选中进行配对 卡方检验选中进行配对 卡方检验浙江大学医学院流行病与卫生统计学教
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1