1、卡方(卡方(2)检验检验n卡方检验是最基本的分类变量统计推卡方检验是最基本的分类变量统计推断方法断方法n常用于解决率(构成)的比较常用于解决率(构成)的比较nSPSS对分类变量的处理对分类变量的处理 Crosstabs分类变量的数据库分类变量的数据库Variable type 可以是可以是Numeric,也可以是,也可以是StringValue 用不同的数值表示不同的类别用不同的数值表示不同的类别 如,如,1表示男,表示男,2表示女表示女 0表示无效,表示无效,1表示有效表示有效未加权的数据库未加权的数据库加权的数据库加权的数据库分类变量数据库的两种形式:分类变量数据库的两种形式:加权数据库:
2、加权数据库:Weight Cases甲组乙组阳性aba+b阴性cdc+da+cb+dN组+/-cases甲甲+a乙乙+b甲甲-c乙乙-d组+/-WeightWeight11a21b12c22d一、一、四格表的四格表的2检验检验 (两个率比较的(两个率比较的2检验)检验)a.a.什么是四格表什么是四格表什么是四格表什么是四格表 (2(22 table)2 table)实验对象分成两组,实验结果只有阳性和阴实验对象分成两组,实验结果只有阳性和阴实验对象分成两组,实验结果只有阳性和阴实验对象分成两组,实验结果只有阳性和阴性两种可能,以这种形式整理的数据表格。性两种可能,以这种形式整理的数据表格。性两
3、种可能,以这种形式整理的数据表格。性两种可能,以这种形式整理的数据表格。发病发病发病发病未发病未发病未发病未发病合计合计合计合计实验组实验组实验组实验组1414 86 86100100对照组对照组对照组对照组3030 90 90120120合计合计合计合计4444176176220220实验组发病率:实验组发病率:对照组发病率:对照组发病率:疫苗免疫效果实验疫苗免疫效果实验疫苗免疫效果实验疫苗免疫效果实验b.b.四格表的自由度:四格表的自由度:四格表的自由度:四格表的自由度:(行数(行数(行数(行数-1)(-1)(列数列数列数列数-1-1)=(2-12-1)(2-12-1)=1=1c.c.四格
4、表的理论频数:四格表的理论频数:四格表的理论频数:四格表的理论频数:R R表示行,表示行,表示行,表示行,C C表示列表示列表示列表示列n nR R是行合计,是行合计,是行合计,是行合计,n nC C是列合计是列合计是列合计是列合计理论上的发病率理论上的发病率理论上的发病率理论上的发病率44/22044/220,乘以实验组的例数,乘以实验组的例数,乘以实验组的例数,乘以实验组的例数100100,得到实验组理论上的发病数。,得到实验组理论上的发病数。,得到实验组理论上的发病数。,得到实验组理论上的发病数。发病发病发病发病未发病未发病未发病未发病合计合计合计合计实验组实验组实验组实验组1414 8
5、6 86100100对照组对照组对照组对照组3030 90 90120120合计合计合计合计4444176176220220计算统计指标计算统计指标输出理论频数、输出理论频数、百分比等百分比等结果输出的格式结果输出的格式卡方检验卡方检验理论频数理论频数d.d.四格表四格表四格表四格表 2 2检验的计算方法:检验的计算方法:检验的计算方法:检验的计算方法:实际频数实际频数例:例:n 40 n 40,且所有格子的理论频数,且所有格子的理论频数,且所有格子的理论频数,且所有格子的理论频数E5E5 不校正。不校正。不校正。不校正。n 40 n 40,且任一格子的理论频数,且任一格子的理论频数,且任一格
6、子的理论频数,且任一格子的理论频数 5E15E1 需要校正。需要校正。需要校正。需要校正。n40 n5,不需校正。,不需校正。2 2=4.125,P=0.042P40,最小理论频数,最小理论频数4.18,用校正的结果。,用校正的结果。2 2=2.746,P=0.098P0.05,不拒,不拒绝H0,差,差别无无显著性,不著性,不认为两两总体率体率不相等,不不相等,不认为两种两种疗法效果不同。法效果不同。e.e.四格表资料的确切概率法四格表资料的确切概率法四格表资料的确切概率法四格表资料的确切概率法四格表资料当有理论数小于四格表资料当有理论数小于四格表资料当有理论数小于四格表资料当有理论数小于1
7、1或者总样本例数或者总样本例数或者总样本例数或者总样本例数不足不足不足不足4040时,不能用卡方检验,而要用时,不能用卡方检验,而要用时,不能用卡方检验,而要用时,不能用卡方检验,而要用FisherFisher确切概率法(确切概率法(确切概率法(确切概率法(Fisher exact probabilityFisher exact probability)例:在某牧区观察慢性布鲁氏病患者植物血凝素皮肤例:在某牧区观察慢性布鲁氏病患者植物血凝素皮肤例:在某牧区观察慢性布鲁氏病患者植物血凝素皮肤例:在某牧区观察慢性布鲁氏病患者植物血凝素皮肤试验反应,得结果如下。问活动型与稳定型布氏病试验反应,得结果
8、如下。问活动型与稳定型布氏病试验反应,得结果如下。问活动型与稳定型布氏病试验反应,得结果如下。问活动型与稳定型布氏病患者植物血凝素反应阳性率是否相同?患者植物血凝素反应阳性率是否相同?患者植物血凝素反应阳性率是否相同?患者植物血凝素反应阳性率是否相同?两型慢性布氏病患者得植物血凝素皮试反应两型慢性布氏病患者得植物血凝素皮试反应两型慢性布氏病患者得植物血凝素皮试反应两型慢性布氏病患者得植物血凝素皮试反应病人类型病人类型病人类型病人类型阳性数阳性数阳性数阳性数阴性数阴性数阴性数阴性数合计合计合计合计阳性率阳性率阳性率阳性率()活动型活动型活动型活动型1 1 1 11414141415151515
9、6.67 6.67 6.67 6.67稳定性稳定性稳定性稳定性3 3 3 3 7 7 7 71010101030.0030.0030.0030.00合计合计合计合计4 4 4 4212121212525252516.0016.0016.0016.00本例观察总例数只有本例观察总例数只有本例观察总例数只有本例观察总例数只有25252525例,不足例,不足例,不足例,不足40404040例,不能计算例,不能计算例,不能计算例,不能计算pearsonpearsonpearsonpearson卡方。用确切概率法。卡方。用确切概率法。卡方。用确切概率法。卡方。用确切概率法。二、二、行行列表的列表的2检验
10、检验a.a.什么是行什么是行什么是行什么是行 列表列表列表列表 整理表的行数多于整理表的行数多于整理表的行数多于整理表的行数多于2 2,或者列数多于,或者列数多于,或者列数多于,或者列数多于2 2。四格表是为了比较两个率(构成比)是四格表是为了比较两个率(构成比)是四格表是为了比较两个率(构成比)是四格表是为了比较两个率(构成比)是否相等;行否相等;行否相等;行否相等;行 列表是为了比较三组或者列表是为了比较三组或者列表是为了比较三组或者列表是为了比较三组或者三组以上的率(构成比)是否相等。三组以上的率(构成比)是否相等。三组以上的率(构成比)是否相等。三组以上的率(构成比)是否相等。b.b.
11、行行行行 列表列表列表列表 2 2检验的假设:检验的假设:检验的假设:检验的假设:HH0 0:各组构成相同:各组构成相同:各组构成相同:各组构成相同 HH1 1:各组构成不同或不全相同:各组构成不同或不全相同:各组构成不同或不全相同:各组构成不同或不全相同c.c.行行行行 列表的自由度:列表的自由度:列表的自由度:列表的自由度:(行数(行数(行数(行数-1)(-1)(列数列数列数列数-1-1)d.d.行行行行 列表列表列表列表 2 2检验的计算:检验的计算:检验的计算:检验的计算:当有一个格子的理论频数小于当有一个格子的理论频数小于当有一个格子的理论频数小于当有一个格子的理论频数小于1 1,或
12、有,或有,或有,或有1/51/5以以以以上格子的理论频数小于上格子的理论频数小于上格子的理论频数小于上格子的理论频数小于5 5,先把理论频数小,先把理论频数小,先把理论频数小,先把理论频数小于于于于1 1或或或或5 5的格子与相邻组合并,再计算。的格子与相邻组合并,再计算。的格子与相邻组合并,再计算。的格子与相邻组合并,再计算。合并数据:可以用合并数据:可以用合并数据:可以用合并数据:可以用recoderecodeAnalyze-Descriptive statistics-Crosstabs-chi square例:例:例:例:根据碘酊局部注射根据碘酊局部注射根据碘酊局部注射根据碘酊局部注射
13、126126例地方性甲状腺肿患者的资料,例地方性甲状腺肿患者的资料,例地方性甲状腺肿患者的资料,例地方性甲状腺肿患者的资料,问各年龄组的疗效构成是否不同?问各年龄组的疗效构成是否不同?问各年龄组的疗效构成是否不同?问各年龄组的疗效构成是否不同?年年年年龄龄(岁岁)治愈治愈治愈治愈有效有效有效有效无效无效无效无效 合合合合计计10103535 2 2 3 3 40 40202032321717 2 2 51 5130301515 2 21818 35 35合合合合计计828221212323126126H0:各年龄组疗效构成相同:各年龄组疗效构成相同 H1:各年龄组疗效构成不同或不全相同:各年龄
14、组疗效构成不同或不全相同=0.05 =49.45,P=0.000,P0.05,拒绝,拒绝H0,三个年龄组,三个年龄组疗效构成不同或不全相同。疗效构成不同或不全相同。三、三、配对资料的配对资料的2检验检验a.a.什么是配对资料什么是配对资料什么是配对资料什么是配对资料 所有的实验对象都接受两种处理方法,所有的实验对象都接受两种处理方法,所有的实验对象都接受两种处理方法,所有的实验对象都接受两种处理方法,每种方法的实验结果都分成阳性和阴性,每种方法的实验结果都分成阳性和阴性,每种方法的实验结果都分成阳性和阴性,每种方法的实验结果都分成阳性和阴性,这种形式的数据属于配对资料。这种形式的数据属于配对资
15、料。这种形式的数据属于配对资料。这种形式的数据属于配对资料。乙种乙种乙种乙种甲种甲种甲种甲种合计合计合计合计+-+a ab ba+ba+b-c cd dc+dc+d合计合计合计合计a+ca+cb+db+da+b+c+da+b+c+d目的是为了比较两种处理方法效果是否相同。目的是为了比较两种处理方法效果是否相同。目的是为了比较两种处理方法效果是否相同。目的是为了比较两种处理方法效果是否相同。a a和和和和d d是两种处理方法一致的观察对象个数。是两种处理方法一致的观察对象个数。是两种处理方法一致的观察对象个数。是两种处理方法一致的观察对象个数。b b和和和和c c是两种处理方法不一致的观察对象个
16、数。是两种处理方法不一致的观察对象个数。是两种处理方法不一致的观察对象个数。是两种处理方法不一致的观察对象个数。配对配对配对配对 2 2检验只检验检验只检验检验只检验检验只检验b b和和和和c c之间是否有差别。之间是否有差别。之间是否有差别。之间是否有差别。c.c.配对配对配对配对 2 2检验的理论频数:检验的理论频数:检验的理论频数:检验的理论频数:b.b.配对配对配对配对 2 2检验的假设:检验的假设:检验的假设:检验的假设:HH0 0:B=C HB=C H1 1:BCBCd.d.配对配对配对配对 2 2检验的计算:检验的计算:检验的计算:检验的计算:Analyze-Nonparametric tests-2related samples常常规新型新型+-合合计+261110371-8 31 39合合计 14 14410例:某研究室用常规和新型两种血清学方法检查例:某研究室用常规和新型两种血清学方法检查410例确诊的鼻咽癌患者,得结果如下表,问两种检验结例确诊的鼻咽癌患者,得结果如下表,问两种检验结果之间有无差别?果之间有无差别?计算过程:计算过程:H0:B=C H1:BC=0.
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1