统计完全随机设计资料的方差分析多个样本均数间的两两比较.docx
《统计完全随机设计资料的方差分析多个样本均数间的两两比较.docx》由会员分享,可在线阅读,更多相关《统计完全随机设计资料的方差分析多个样本均数间的两两比较.docx(11页珍藏版)》请在冰豆网上搜索。
统计完全随机设计资料的方差分析多个样本均数间的两两比较
单因素多个均数比较的方差分析(完全随机设计资料的方差分析)
方差分析的基本思想是:
将全部观察值的总变异按影响实验结果的诸因素分解为若干部分变异,构造出反映各部分变异作用的统计量,之后构造假设检验统计量F,实现对总体均数的判断。
方差分析的应用条件:
各样本相互独立,且均来自总体方差具有齐性的正态分布。
完全随机设计是一种将研究对象随机地分配到处理因素各水平组的单因素设计方法。
其研究目的是推断处理因素不同水平下的试验结果的差异有否统计学意义,即该处理因素是否对试验结果有本质影响。
下面以一个实例来说明完全随机设计方差分析的基本思想和假设检验步骤。
例:
为研究烫伤后不同时期切痂对肝脏ATP(u/L)含量的影响,将30只大鼠随机分3组,每组10只,分别接受不同的处理,试根据下表资料说明大鼠烫伤后不同时期切痂对其肝脏的ATP(u/L)含量是否有影响
大鼠烫伤后不同时期切痂肝脏ATP含量(u/L)
烫伤对照组24h切痂组96h切痂组合计
合计(∑X)(∑∑Xij)
例数(n)10101030(N)
均数(
)
平方和(∑X2)(∑∑Xij2)
1.建立检验假设,确定检验水准:
H0:
u1=u2=u3,3个总体均数全相等,即3组大鼠肝脏的ATP含量值无差别;
H1:
u1,u2,u3,3个总体均数不相等.即3组大鼠肝脏的ATP含量值有差别;
a=
2.计算检验统计量并列出方差分析表:
①.计算离均数差平方和SS:
首先计算每一组的合计、均数、平方和,再计算综合计数(∑Xij2),由表得:
∑∑Xij=∑Xij2=N=30
总的离均数差平方和SS总=∑Xij2-
=-
=
SS组间=∑
-
=
+
+
-
=
SS组内=SS总-SS组间=-=
②.计算均方MS:
MS组间=
(k为组数)=
=
MS组内=
(N为总例数)=
=
③.求F值
F=
=
=
将上述计算结果列成方差分析表,如下:
变异来源平方和SS自由度v均方MSF值
总变异29
组间变异2
组内变异(误差)27
(注:
自由度:
v总=N-1=30-1=29;v组间=k-1=3-1=2;v组内=N-k=30-3=27)
利用SPSS作方差分析时,会得到类似于以下的方差分析表:
Descriptives
CON
N
Mean
Std.Deviation
Std.Error
95%ConfidenceIntervalforMean
Minimum
Maximum
LowerBound
UpperBound
1
10
.57176
2
10
.88229
3
10
.38715
Total
30
.51729
TestofHomogeneityofVariances
CON
LeveneStatistic
df1
df2
Sig.
2
27
.225
ANOVA
CON
SumofSquares
df
MeanSquare
F
Sig.
BetweenGroups
2
.000
WithinGroups
27
Total
29
3.查表确定P值,并作出统计推断:
V组间=2,v组内=27,得界限值Fα(2,27)为(2,27)=,则F=>(2,27),
则P<,按水准,拒绝H0,可以认为3个总体均数不全相同,即3组大鼠肝脏的ATP含量值有差别。
多个样本均数间的两两比较
均数间的两两比较根据研究设计的不同分为两种类型:
一种常见于探索性研究,在研究设计阶段并不明确哪些组别之间的对比是更为关注的,也不明确哪些组别问的关系已有定论、无需再探究,经方差分析结果提示“概括而言各组均数不相同”后,对每一对样本均数都进行比较,从中寻找有统计学意义的差异:
另一种是在设计阶段根据研究目的或专业知识所决定的某些均数问的比较.常见于证实性研究中多个处理组与对照组、施加处理后的不同时间点与处理前比较。
最初的设计方案不同.对应选择的检验方法也不同.下面分述两种不同设计均数两两比较的方法选择。
1、事先计划好的某对或某几对均数间的比较:
适用于证实性研究。
在设计时就设定了要比较的组别,其他组别间不必作比较。
常用的方法有:
Dunnett-t检验、LSD-t检验(Fisher’sleastsignificantdifferencettest)。
这两种方法不管方差分析的结果如何——即便对于P稍大于检验水准
,也可进行所关心组别间的比较。
即最小显著差法.是
1935年提出的,多用于检验某一对或某几对在专业上有特殊探索价值的均数间的两两比较,并且在多组均数的方差分析没有推翻无效假设
时也可以应用。
式中
和
为两个对比组第i组与第j组的样本均数和样本含量。
统计量将两独立样本t检验的均方部分(计算统计量时的分母
)进行适当的调整,
和自由度通过方差分析中的误差均方
和
来估计,而两独立样本的t检验中
用合并方差
,自由度
来计算,然后根据t界值来确定P值,作出统计推断。
该方法实质上就是t检验,检验水准无需作任何修正,只是在标准误的计算上充分利用了样本信息,为所有的均数统一估计出一个更为稳健的标准误,因此它一般用于事先就已经明确所要实施对比的具体组别的多重比较。
由于该方法本质思想与t检验相同,所以只适用于两个相互独立的样本均数的比较。
LSD法单次比较的检验水准仍为
,因此可以认为该方法是最为灵敏的两两比较方法.另一方面,由于LSD法侧重于减少第Ⅱ类错误,势必导致此法在突出组间差异的同时,有增大I类错误的倾向。
Duncan1955年在Newman及Keuls的复极差法(muhiplerangemethod)基础上提出,该方法与Tukey法相类似。
适用于
个试验组与一个对照组均数差别的多重比较,多用于证实性研究。
Dunnett-t统计量的计算公式与LSD-t检验完全相同。
实验组和对照组的样本均数和样本含量。
需特别指出的是Dunnett—t检验有专
门的界值表,不同于t检验的界值表。
一般认为,比较组数k≥3时,任何两个样本的平均数比较会牵连到其它平均数的对比关系,而使比较数再也不是两个相互独立的样本均数的比较.这是LSD-t无法克服的缺点。
Dunnett—t针对这一问题提出.在同一显著水平上两个均数的最小显著差数随着这二个平均数在多个平均数中所占的极差大小而不同,根据不同平均数间的对比关系来调整相应的显著差别(criticalrange)的大小。
2、多个均数的两两事后比较:
适用于探索性研究,即各处理组两两问的对比关系都要回答,一般要将各组均数进行两两组合,分进行检验。
常用的方法有:
SNK-q(Student-Newman-Keulsq)法、Duncan法、Tukey法和Scheffe法。
值得注意的是,这几种方法对数据有具体的要求和限制。
对于SNK-q检验,检验的统计量是q,所以又称为q检验。
该检验统计量的计算公式为:
个对比组第i组与第j组的样本均数和样本含量。
SNK-q检验的原理是根据所包含不同数目的平均数的极差调整各自的显著性水准,限制了实验的误差.保证在做所有比较时,不易犯第1类错误。
Tukey法(Tukey’SHonestlySignificantDiferenceTukey’sHSD)的原理与SNK-q检验基本相同,但是,该方法要求各比较组样本含量相同,它将所有对比组中I类错误最大者控制在
之内。
其检验统计量的计算公式如下:
是学生化极差统计量(可以通过查表获得),
是误差均方,n是每组的样本含量。
给出检验结果时,是基于比较组均数的差值与计算所得计量的对比。
研究显示:
这种方法有较高的检验效能(与LSD法比较),具有很好的稳定性,适用于大多数场合下的两两比较,计算简便。
但是,Tukey法是基于比较组全部参与比较这一假设下进行的,因此在只比较指定的某几组总体均数时并不适用,建议选择Dunnett法或者是Bonferroni方法,因为这两种方法会给出较高效能的检验结果。
与一般的多重比较不同,Scheffe法的实质是对多组均数间的线性组合是否为0进行假设检验,多用于对比组样本含量不等的资料。
在单因素的多重比较问题中,除了要逐对比较因素水平的平均效应之外,有时还有可能要比较因素水平平均效应的线性组合。
例如将有基本相同的因素水平平均效应的几个组,构成一个综合组。
因此可能检验这样的假设:
,
显然,前面讨论的参数的两两比较属于一类特殊的对比。
Scheffe法可以同时检验所有可能的对比,即同时检验任何一组对比。
Sch6ffe法的优点是可以检验
任意的线性对比。
在这方面,Tukey法不如Scheffe法。
但是在单纯作逐对因素效应均值的比较时,Schefe法的效率不如Tukey法高。
也就是说,Schefe法更易于将显著的差异判定为不显著(Tukey法认为)。
在实际场合,当单纯作逐对均值
比较时,建议用Tukey法;而当要做多个一般的线性对比检验时。
就要用Scheffe法。
Scheffe法检验实质上对F值进行了简单的校正,将比较的组数纳入考虑的范畴:
该方法的检验统计量代表了最大可能的累积I类错误的概率。
遗憾的是,由于控制I类错误时的“矫枉过正”.会最终导致较大的Ⅱ类错误的概率。
3、探索性研究和证实性研究均适用的检验方法:
Bonferronit检验的基本思想是:
如果三个样本均数经ANOVA检验差异有统计学意义(
=0.05),需对每两个均数进行比较,共需比较的次数为:
,由于每进行一次比较犯I类错误的概率是
=0.05,那么比较3次至少有一次犯I类错误的概率就是:
。
因此,要使多次比较犯I类错误的概率不大于原检验水准
,现有的检验水准应该进行调整,用
作为检验水准的调整值,两两比较得出的P值与其进行比较。
该方法的思想适用于所有的两两比较,并且该方法的适用范围很广,不仅仅限于方差分析,例如相关系数的检验和卡方检验也适用。
Bonferronit检验的方法和思想容易理解,操作简便,但是严格地控制了I类错误的同时增大了Ⅱ类错误的发生概率,在结论的给出方面是一种比较保守的方法。
该方法通过
校正降低每次两两比较的I类错误概率,以达到最终整个比较的I类错误发生率不超过
的目的。
Bonferronit检验与
检验相似,t检验是
检验的近似计算,但是由于Bonferronit检验在计算上容易实现,所以应用较广。
相比较而言,Bonferronit检验在给出推断结论时更为审慎。
不容易得到拒绝零假设的结果。
两种检验在对比组数增加、比较组不独立时,推断结论更趋保守。
以上方法都必须在满足方差齐性的前提条件时才可以应用,另外还有一些方法是在不满足方差齐性时多重比较的方法:
。
是一种基于t检验原理的两两比较方法。
该方法比较保守。
则是以最大的t值(studentizedmaximummodulus)为基础的。
Games-Howell检验方法是比较宽大的一种两两比较方法。
Games-Howell方法将方差不齐的组数作为一个影响因素纳入考虑范畴。
严重的方差不齐和样本含量过小都会使I类错误的概率增加。
Games-Howell检验基于Welch’s对t检验的自由度进行校正,并使用了学生化极差作为统计量。
该检验适用于样本含量小且方差不齐(轻度方差不齐例外)时的情况。
该方法是方差不齐时的一种较好的方法。
是一种基于学生化极差的适用于方差不齐情况时两两比较的方法。
多组均数间比较时的方法选择流程图