x2检验.docx
《x2检验.docx》由会员分享,可在线阅读,更多相关《x2检验.docx(20页珍藏版)》请在冰豆网上搜索。
x2检验
第四章x2检验
一.本章教学简介
本章介绍第二个统计推断工具,非参数检验类的X2检验,内容包括X2检验的性质、原理、类型、方法和应用。
本章重点是X2检验两种类型的应用,难点是X2检验的原理。
本章要求学员学习后能了解X2检验的性质和原理,掌握X2检验的生物学应用,能熟练使用计算器解题,有条件的学员能用电脑SPSS操作,并将结果进行比较。
教材提示:
教材77-85页详细阅读。
二.本章教学内容
一.适用特征和功效
1.适用特征:
(1)样本资料为非连续性变量(离散量资料,或称计数性资料);
(2)总体分布未知;
(3)非参数性检验,而是分布性检验。
2.功效:
基于非连续性变量(即计数性资料)的非参数检验。
说明:
对质量性状的资料研究常用方法,比数量性状资料研究难。
x2检验,平均数对它无意义,属于非参数性的属性检验,适合对质量性状的检验,对原始数据的要求比t检验低,原始数据即观察数往往只是归类计数的频次,都是整数,无分数小数。
二.类型
1.适合性(符合性,拟合优度)检验:
判断Oi与Ei是否一致。
2.独立性检验:
通过Oi与Ei是否一致来判断因素之间是否独立。
三.原理和方法
㈠适合性检验
Oi:
观察数(实际数)
Ei:
期望数(理论数)
适合性检验就是检验Oi与Ei是否一致(即是否有显著差异),解决Oi与Ei是否在统计学意义上相等的问题。
适合性检验的方法也是典型的统计检验“五步法”。
1.H0(无效假设):
Oi=Ei(或Oi-Ei=0)
2.建立适当的分布(x2分布)并计算:
x2c=∑(Oi-Ei)2/Ei
df=n-1适合性检验中df等于相加项数-1
3.查表:
x20.05(df)=?
x20.01(df)=?
4.比较:
(1)当x2c〈x20.05,接受H0,Oi与Ei无显著差异,P>0.05
(2)当x20.05〈x2c〈x20.01,拒绝H0,Oi与Ei有显著差异,P<0.05
(3)当x2c〉x20.01,拒绝H0,Oi与Ei有极其显著差异,P<0.01
5.结论
例1.豌豆杂交试验得到80朵黄花,34朵白花,问此结果是否符合3∶1的分离规律?
解:
已知O1=80O2=34
根据3∶1规律求出:
E1=(80+34)*3/4=85.500,
E2=(80+34)*1/4=28.500
(Ei可以而且应当有小数,保留位数一般应比后面比较的临界值多1位)
1.H0(无效假设):
Oi=Ei(或Oi-Ei=0)
2.建立适当的分布(x2分布)并计算:
x2c=∑(Oi-Ei)2/Ei=(80-85.5)2/85.5+(34-28.5)2/28.5=1.43
(x2c即x2实际结果数小数位数应与比较的临界值一致)
df=2-1=1
(自由度等于相加项数-1)
3.查表:
x20.05(df)=?
x20.01(df)=?
经查表知:
x20.05
(1)=3.84,x20.01
(1)=6.63
4.比较:
∵x2c(1),∴接受H0,Oi与Ei无显著差异,P>0.05
(属于比较的第
(1)种情况)
5.结论:
试验结果符合3:
1的分离规律。
当堂练习1:
教材79页例6.2,请学员参照上述“五部法”独立完成本题,并将结果与教材上的例题解答进行比较核对。
回家作业:
教材85页第5题。
(二)独立性检验
独立性检验的功效就是通过Oi与Ei是否一致来判断因素之间是否独立。
例2.为试验某新药抗癌效果,进行动物荷瘤试验,结果如下:
康复
死亡
用药组
28
32
非用药组
16
40
问此药是否有效?
解:
独立性检验的步骤也是“五部法”。
1.H0:
Oi=Ei
现已知O11=28O12=32
O21=16O22=40
如何找到Ei?
一般的方法是用“混合比例法”,将已知Oij行列求和。
康复
死亡
用药组
O11=28
O12=32
t1=O11+O12=60
非用药组
O21=16
O22=40
t2=O21+O22=56
C1=O11+O21=44
C2=O12+O22=72
T=t1+t2=116
用比例公式求得:
E11=60*44/116=22.759,E12=60*72/116=37.241
E21=56*44/116=21.241,E22=56*72/116=34.759
2.建立适当的分布(x2分布)并计算:
计算x2
x2=∑(Ei-Oi)2/Ei=(28-22.759)2/22.759+(32-37.241)2/37.241+(16-21.241)2/21.241+(40-34.759)2/34.759=4.0279≈4.03
计算自由度:
df=(m-1)(n-1)=(2-1)(2-1)=1
3.查表知:
x20.05
(1)=3.84x20.01
(1)=6.63
4.比较:
∵x20.05
(1)(1),∴拒绝H0,Oi与Ei有显著差异,P<0.05,
即用药与康复两因素不独立(有关联作用)。
5.结论:
此药是有效的。
当堂练习2:
教材80页例6.3,请学员参照上述“五部法”独立完成本题,并将结果与教材上的例题解答进行比较核对。
回家作业:
教材84页第1,2,3,4题。
四.修正公式和简捷公式
(一)df=1的修正
x2检验中自由度=1时,若x2的值与3.84很接近,特别有必要进行修正,以减少范错误的风险。
x2修=∑(|Oi-Ei|-0.5)2/Eix2修所得的值比x2c的值小。
(二)2*2独立性检验简捷公式
x2简=(O11*O22-O12*O21)2T/t1t2C1C2
x2简修=(|O11*O22-O12*O21|-T/2)2T/t1t2C1C2
参阅教材83页。
如再对例2进行简捷计算:
用x2简公式计算x2c=4.03,与上面“五部法”的结果和结论相同。
用x2简修公式计算x2c=3.30,
此时∵x2c0.05,即用药与康复两因素独立(无关联作用)。
结论:
此药是无效的。
此结论与上面“五部法”的结论不同,应当说,经过修正的检验结论更可靠。
建议学员以后碰到df=1的x2检验尽量运用修正公式。
(三)m*n独立性检验的简捷运算
O11
O12
O13
…
O1n
t1
O21
O22
O23
…
O2n
t2
…
…
…
…
…
…
Om1
Om2
Om3
…
Om4
tm
C1
C2
C3
…
Cn
T
x2=T(∑∑Oij2/tiCj-1)
说明:
独立性检验随着行列数m、n的增大,计算Eij的工作量会随之增大,且易出错,此时可用上述简捷运算公式。
教学建议:
建议在用“五部法”完成84页作业1、3、4题后,再用此简捷公式计算,比较两者的结果是否一样。
(答案:
应该一样)
四.计算机SPSS的X2检验
(一)计算机SPSS的x2适合性检验
1.设定数据库变量(原始数据不能有小数点)
变量Oi,设为数字型。
2.输入数据
如上面例1:
Oi
34
80
3.加权处理Date---WeightCaseByOi
4.命令执行Analyze----NonparametricTests---Chi-square
具体操作可参阅教材176-177页内容。
演示例1。
(二)计算机SPSS的X2独立性检验
1.设定数据库变量(原始数据不能有小数点)
VA:
行变量,数字型,宽度一位
VB:
列变量,数字型,宽度一位
VC:
因变量(观察数),数字型,宽度由最大观察数位数决定。
2.输入数据,建立数据库
如上面例2:
VA
VB
VC
1
1
28
1
2
32
2
1
16
2
2
40
3.加权处理Date---WeightCaseByVc
4.统计命令执行
Analyze----DescriptiveStatistics---Crosstabs
具体操作可参阅教材178-180页内容。
演示例2。
第五章方差分析
一.本章教学简介
本章介绍第三个重要统计推断工具,参数检验类的方差分析,内容包括方差分析的功效、性质、原理、类型、方法和应用。
本章重点是单因素方差分析的应用,难点是方差分析的计算,尤其是双因素方差分析。
本章要求学员学习后能了解方差分析的性质和原理,掌握方差分析的生物学应用,能熟练使用计算器解题,有条件的学员能用电脑SPSS操作,并将结果进行比较。
教材提示:
教材86-105页详细阅读。
二.本章教学内容
一.意义义和功效
方差分析是参数检验,是对多个(三个和三个以上)平均数的比较检验。
1.意义:
有了t检验,为何还要引入方差分析?
方差分析是解决多个平均数的比较。
若10个平均数,用t检验两两检验,需次数C102=45次,若取α=0.05
则:
1次准确率0.95错误率1-0.95=0.05
2次准确率0.952错误率1-0.952
3次准确率0.953错误率1-0.953
………
45次准确率0.9545=0.09944错误率1-0.9545=0.90056
从以上可见,t检验随次数的增加,准确率下降,t检验达多次重复以后,可靠性无法保证,所以t检验只适合两个平均数的比较。
因此,为了解决多个平均数的比较,引入方差分析。
2.功效:
方差分析不仅能检验多个平均数是否存在差异,同时还能分析差异的来源和原因。
二.类型
⑴单因素方差分析a:
n相等b:
n不相等
⑵双因素方差分析a:
n=1b:
n>1(n相等和n不相等)
⑶多因素方差分析
三.原理和步骤
㈠单因素方差分析
⑴单因素方差分析(n相等)
例:
某学校有四个平行班进行生物统测,结果如下:
学生成绩
甲班
68
72
80
72
66
TA1(表甲组成绩之和)
乙班
55
70
66
62
63
TA2(表乙组成绩之和)
丙班
80
82
70
75
72
TA3(表丙组成绩之和)
丁班
70
72
80
68
69
TA4(表丁组成绩之和)
问四个班平均成绩是否有显著差异?
解:
①H0x1=x2=…xk
②平方和和自由度分析
总体平方和:
SST=∑∑(xij-x总)2=∑xi2-(∑xi)2/N=∑xi2-T2/N
T为所有数之和,令C=T2/N(C为校正系数)
SST=∑xi2-CdfT=N-1
组间平方和:
SSA=∑TAi2/n-CdfA=k-1
组内平方和:
SSe=SST-SSAdfe=dfT-dfA
③计算方差
SA2(组间方差)=SSA/dfASe2(组内方差)=SSe/dfe
1F检验
Fc=SA2/Se2
2查Fa
F0.05(dfA,dfe)=?
F0.01(dfA,dfe)=?
3比较:
a.当Fc≤F0.05(dfA,dfe),接受H0,各组均值无显著差异(P>0.05)
b.当F0.05(dfA,dfe)c.当Fc>F0.01(dfA,dfe),拒绝H0,各组均值有极其显著差异,(P<0.01)。
4多重比较
5结论
例子中:
TA1=358TA2=316TA3=379TA4=359
C=(358+316+379+359)2/20=99687.2
SST=∑xi2-C=100544-99687.2=856.8dfT=19
SSA=∑TAi2/n-C=425.2dfA=4-1=3
SSe=856.8-425.2=435.6dfe=19-3=16
SA2=SSA/dfA=425.2/3=140.4
Se2=SSe/dfe=435.6/16=27.225
Fc=SA2/Se2=140.4/27.225=5.16
查表知:
F0.05(3,16)=3.24F0.01(3,16)=5.29
所以F0.05(3,16)3.多重比较
⑴功效:
通过各组的比较,进一步分析变异的来源和原因。
⑵表示方法类型:
三角形法,连线法,符号法等。
⑶检验方法类型:
1.LSD法(最小显著差数表)
例:
书192页
A
74
82
70
76
A组Xi平均值75.5
B
88
80
85
83
B组Xi平均值84
C
71
73
74
70
C组Xi平均值72
LSD法:
C
A
Xi平均
Xi平均-72
Xi平均-75.5
XB平均=84
12
8.5
XA平均=75.5
3.5
0
XC平均=72
0
-3.5
LSD=ta(dfe)sqrt(2Se2/n)
LSD0.05=t0.05(9)sqrt(2*13.222/4)=2.262*2.571=5.816
LSD0.01=t0.01(9)sqrt(2*13.222/4)=3.250*2.571=8.356
若:
平方数差异〉LSD0.01则打“**”表有极其显著差异
LSD0.05〈平方数差异〈LSD0.01则打“*”表有显著差异
平方数差异〈LSD0.05,不做标记,表无显著差异
所以例题中:
除A.C组外,其他各组均有极其显著差异
⑵单因素方差分析(n不相等)
①H0x1=x2=…=xk
②C=T2/NN为总体个数
总体平方和:
SST=∑xi2-CdfT=N-1
组间平方和:
SSA=∑TAi2/ni-CdfA=k-1
组内平方和:
SSe=SST-SSAdfe=dfT-dfA
③计算方差
SA2(组间方差)=SSA/dfASe2(组内方差)=SSe/dfe
④检验
Fc=SA2/Se2
⑤查Fa
F0.05(dfA,dfe)=?
F0.01(dfA,dfe)=?
⑥比较:
a:
Fc≤F0.05(dfA,dfe),接受H0,各组均值无显著差异(P>0.05)
b:
F0.05(dfA,dfe)(P<0.05)
c:
Fc>F0.01(dfA,dfe),拒绝H0,各组均值有极其显著差异(P<0.01)
⑦多重比较(若有显著差异)
LSD=ta(dfe)sqrt(2Se2/n0)
n0=1/(k-1)(∑ni-∑ni2/∑ni)
⑶SPSS中的单因素方差分析操作
1数据库建立
a.变量设定:
VA行变量
VB列变量
VC因变量
b.输入
②主命令Analyze—CompareMeans---OneWayANOVA(Analyzeofvariance)
若要进行多重比较,主命令为Analyze—CompareMeans---OneWayANOVA—POST---LSDMultipleComparisions
㈡双因素方差分析
⑴n=1
例:
四种不同品系的小鼠注射三种不同计量性激素,两周各称重,结果如下:
(横向:
B因素)m组
计量0.2
计量0.4
计量0.8
品系1
106
116
145
品系2
42
68
115
品系3
70
111
133
品系4
42
63
87
纵向:
A因素k组
做题思路:
①H0:
A向k组B向m组
x1=x2=…xkx1=x2=…xm
②SS与df分析:
C=T2/N(C为校正系数)
SST=∑xi2-CdfT=N-1
SSA=∑TAi2/mn-CdfA=k-1
SSB=∑TBi2/kn-CdfB=m-1
SSe=SST-SSA-SSBdfe=dfT-dfA-dfB
③计算方差
SA2(组间方差)=SSA/dfASB2(组间方差)=SSB/dfBSe2(组内方差)=SSe/dfe
④检验:
FA=SA2/Se2FB=SB2/Se2
⑤查表
A向:
F0.05(dfA,dfe)=?
F0.01(dfA,dfe)=?
B向:
F0.05(dfB,dfe)=?
F0.01(dfB,dfe)=?
⑥比较:
A向:
a:
当Fc≤F0.05(dfA,dfe),接受H0,各组均值无显著差异(P>0.05)
b:
当F0.05(dfA,dfe)(P<0.05)
c:
当Fc>F0.01(dfA,dfe),拒绝H0,各组均值有极其显著差异(P<0.01)
B向:
a:
当Fc≤F0.05(dfB,dfe),接受H0,各组均值无显著差异(P>0.05)
b:
当F0.05(dfB,dfe)(P<0.05)
c:
当Fc>F0.01(dfB,dfe),拒绝H0,各组均值有极其显著差异(P<0.01)
⑦多重比较:
A向:
LSDa=ta(dfe)sqrt(2Se2/m)
B向:
LSDa=ta(dfe)sqrt(2Se2/k)
⑧结论:
第六章相关与回归
一.本章教学简介
本章是本学科第三部分教学内容,内容包括相关和回归的概念、原理、方法和应用。
本章重点是相关和回归的概念和应用,难点是相关和回归的检验原理。
本章要求学员学习后能理解相关和回归的性质和原理,掌握相关和回归的生物学应用,能熟练使用计算器解题,有条件的学员能用电脑SPSS操作,并将结果进行比较。
二.本章教学内容
一.相关
⑴概念:
研究变量之间联系程度的一种数学指标。
⑵类型:
1从性质分:
正相关:
变量随着另外变量增长而增长。
如考试成绩与复习时间
负相关:
变量随着另外变量增长而减小。
如老人健康状况与年龄
零相关:
两个变量独立变化,互不相关。
2从变量数分:
单相关:
两个相关数变量,为复相关基础。
复相关:
超过两个变量数,有主次之分。
3从数学规律或数量变化趋势分为:
线性相关
非线性相关(包括曲线相关,超线性相关)
⑶数学描述
①相关系数:
r-1≤r≤+1
r=1,表示绝对正相关r=-1,表示绝对负相关r=0,表示绝对0相关
2相关几何意义:
y随x增大而增大
y随x增大而减小
x,y独立变化
3计算公式
r=(∑xy-∑x∑y/n)/(n-1)SxSy
4检验:
a:
H0r=0
b:
Fc=(n-2)r2/1-r2
c:
查表:
Fa(1,n-2)
d:
比较:
若Fc若F0.05〈Fc0,正相关,r<0,负相关
若Fc〉F0.01拒绝H0,r≠0,r>0,强正相关,r<0,强负相关
5结论
⑷SPSS应用
1数据库
描述性统计的直接编码。
2主名令
Analyze---Correlate---Biovariate
二.回归
1、概念:
变量之间关系利用最小误差理论,求得最佳关系式的过程。
2、类型:
(1)从变量数分:
●单回归
●复回归
(2)从变化趋势分:
◆线性回归
◆非线性回归
3、数学方法:
(1)直线回归方程
=a+bx建立的必要条件
a.∑(y-
)=0居中无偏性
b.∑(y-
)2min平均数
适合回归方程
(2)建立
=a+bx最小二乘方原理,条件极值法求系数a,b
b=(∑xy-∑x∑y/n)/(∑x2-(∑x)2/n)
=(∑y-b∑x)/n
(3)作图(两端点法)
xmin=?
xmax=?
1=?
2=?
连线
写出方程和r
两端不准延伸
注意事项:
a.回归显著性检验包括回归关系、回归系数显著性检验,与r显著性检验完全等效。
B.先求r,并检验,如r达显著程度,再作相应回归,以避免无效回归。
C.回归直线两端不准延伸,因为回归只对这个区间内有效。
D.回归作图不要忘记标注原始点。
4、回归与相关的关系
在相关系数达到显著程度时为有意义回归,
在相关系数达不到显著程度(即为零相关)时为无意义回归。
r2=bx*by
5、回归的检验
与相关等效
6、回归的SPSS处理
数据库与相关一样处理
回归Analyze---Regression----linear/curve
作图:
Graph----Intergrative---Scaterplotfit中打开,选Regression