第一节方差分析的基本原理与步骤.docx
《第一节方差分析的基本原理与步骤.docx》由会员分享,可在线阅读,更多相关《第一节方差分析的基本原理与步骤.docx(30页珍藏版)》请在冰豆网上搜索。
第一节方差分析的基本原理与步骤
第一节-方差分析的基本原理与步骤
第一节方差分析的基本原理与步骤
方差分析有很多类型,无论简单与否,其基本原理与步骤是相同的。
本节结合单因素试验结果的方差分析介绍其原理与步骤。
一、线性模型与基本假定
假设某单因素试验有k个处理,每个处理有n次重复,共有nk个观测值。
这类试验资料的数据模式如表6-1所示。
表6-1k个处理每个处理有n个观测值的数据模式
处理
观测值
合计
平均
A1
x11
x12
…
x1j
…
x1n
A2
x21
x22
…
x2j
…
x2n
…
…
Ai
xi1
xi2
…
xij
…
xin
…
…
Ak
xk1
xk2
…
xkj
…
xkn
xk.
合计
表中
表示第i个处理的第j个观测值(i=1,2,…,k;j=1,2,…,n);
表示第i个处理n个观测值的和;
表示全部观测值的总和;
表示第i个处理的平均数;
表示全部观测值的总平均数;
可以分解为
(6-1)
表示第i个处理观测值总体的平均数。
为了看出各处理的影响大小,将
再进行分解,令
(6-2)
(6-3)
则
(6-4)
其中μ表示全试验观测值总体的平均数,
是第i个处理的效应(treatmenteffects)表示处理i对试验结果产生的影响。
显然有
(6-5)
εij是试验误差,相互独立,且服从正态分布N(0,σ2)。
(6-4)式叫做单因素试验的线性模型(linearmodel)亦称数学模型。
在这个模型中
表示为总平均数μ、处理效应αi、试验误差εij之和。
由εij相互独立且服从正态分布N(0,σ2),可知各处理Ai(i=1,2,…,k)所属总体亦应具正态性,即服从正态分布N(μi,σ2)。
尽管各总体的均数
可以不等或相等,σ2则必须是相等的。
所以,单因素试验的数学模型可归纳为:
效应的可加性(additivity)、分布的正态性(normality)、方差的同质性(homogeneity)。
这也是进行其它类型方差分析的前提或基本假定。
若将表(6-1)中的观测值xij(i=1,2,…,k;j=1,2,…,n)的数据结构(模型)用样本符号来表示,则
(6-6)
与(6-4)式比较可知,
、
、
分别是μ、(μi-μ)=
、(xij-
)=
的估计值。
(6-4)、(6-6)两式告诉我们:
每个观测值都包含处理效应(μi-μ或
),与误差(
或
),故kn个观测值的总变异可分解为处理间的变异和处理内的变异两部分。
二、平方和与自由度的剖分
我们知道,方差与标准差都可以用来度量样本的变异程度。
因为方差在统计分析上有许多优点,而且不用开方,所以在方差分析中是用样本方差即均方(meansquares)来度量资料的变异程度的。
表6-1中全部观测值的总变异可以
件基本相同的鱼20尾,随机分成四组,投喂不同饲料,经一个月试验以后,各组鱼的增重结果列于下表。
表6-2饲喂不同饲料的鱼的增重(单位:
10g)
饲料
鱼的增重(xij)
合计
平均
A1
31.9
27.9
31.8
28.4
35.9
155.9
31.18
A2
24.8
25.7
26.8
27.9
26.2
131.4
26.28
A3
22.1
23.6
27.3
24.9
25.8
123.7
24.74
A4
27.0
30.8
29.0
24.5
28.5
139.8
27.96
合计
=550.8
这是一个单因素试验,处理数k=4,重复数n=5。
各项平方和及自由度计算如下:
矫正数
总平方和
处理间平方和
处理内平方和
总自由度
处理间自由度
处理内自由度
用SSt、SSe分别除以dft和dfe便得到处理间均方MSt及处理内均方MSe。
因为方差分析中不涉及总均方的数值,所以不必计算之。
三、期望均方
如前所述,方差分析的一个基本假定是要求各处理观测值总体的方差相等,即
(i=1,2,…,k)表示第i个处理观测值总体的方差。
如果所分析的资料满足这个方差同质性的要求,那么各处理的样本方差S21,S22,…,S2k都是σ2的无偏估计(unbiasedestimate)量。
(i=1,2,…,k)是由试验资料中第i个处理的n个观测值算得的方差。
显然,各
的合并方差
(以各处理内的自由度n-1为权的加权平均数)也是σ2的无偏估计量,且估计的精确度更高。
很容易推证处理内均方MSe就是各
的合并。
其中SSi、dfi(i=1,2,…,k)分别表示由试验资料中第i个处理的n个观测值算得的平方和与自由度。
这就是说,处理内均方MSe是误差方差σ2的无偏估计量。
试验中各处理所属总体的本质差异体现在处理效应
的差异上。
我们把
称为效应方差,它也反映了各处理观测值总体平均数
的变异程度,记为
。
(6-13)
因为各
未知,所以无法求得
的确切值,只能通过试验结果中各处理均数的差异去估计。
然而,
并非
的无偏估计量。
这是因为处理观测值的均数间的差异实际上包含了两方面的内容:
一是各处理本质上的差异即αi(或μi)间的差异,二是本身的抽样误差。
统计学上已经证明,
是
+σ2/n的无偏估计量。
因而,我们前面所计算的处理间均方MSt实际上是n
+σ2的无偏估计量。
因为MSe是σ2的无偏估计量,MSt是n
+σ2的无偏估计量,所以σ2为MSe的数学期望(mathematicalexpectation),n
+σ2为MSt的数学期望。
又因为它们是均方的期望值(expectedvalue),故又称期望均方,简记为EMS(expectedmeansquares)。
当处理效应的方差
=0,亦即各处理观测值总体平均数
(i=1,2,…,k)相等时,处理间均方MSt与处理内均方一样,也是误差方差σ2的估计值,方差分析就是通过MSt与MSe的比较来推断
是否为零即
是否相等的。
四、F分布与F检验
(一)F分布设想我们作这样的抽样试验,即在一正态总体N(μ,σ2)中随机抽取样本含量为n的样本k个,将各样本观测值整理成表6-1的形式。
此时所谓的各处理没有真实差异,各处理只是随机分的组。
因此,由(6-12)式算出的
和
都是误差方差
的估计量。
以
为分母,
为分子,求其比值。
统计学上把两个均方之比值称为F值。
即
(6-14)
F具有两个自由度:
。
若在给定的k和n的条件下,继续从该总体进行一系列抽样,则可获得一系列的F值。
这些F值所具有的概率分布称为F分布(Fdistribution)。
F分布密度曲线是随自由度df1、df2的变化而变化的一簇偏态曲线,其形态随着df1、df2的增大逐渐趋于对称,如图6-1所示。
F分布的取值范围是(0,+∞),其平均值
=1。
用
表示F分布的概率密度函数,则其分布函数
为:
(6-15)
因而F分布右尾从
到+∞的概率为:
(6-16)
附表4列出的是不同df1和df2下,P(F≥
)=0.05和P(F≥
)=0.01时的F值,即右尾概率α=0.05和α=0.01时的临界F值,一般记作
,
。
如查附表4,当df1=3,df2=18时,F0.05(3,18)=3.16,F0.01(3,18)=5.09,表示如以df1=dft=3,df2=dfe=18在同一正态总体中连续抽样,则所得F值大于3.16的仅为5%,而大于5.09的仅为1%。
(二)F检验附表4是专门为检验
代表的总体方差是否比
代表的总体方差大而设计的。
若实际计算的F值大于
,则F值在α=0.05的水平上显著,我们以95%的可靠性(即冒5%的风险)推断
代表的总体方差大于
代表的总体方差。
这种用F值出现概率的大小推断两个总体方差是否相等的方法称为F检验(F-test)。
在方差分析中所进行的F检验目的在于推断处理间的差异是否存在,检验某项变异因素的效应方差是否为零。
因此,在计算F值时总是以被检验因素的均方作分子,以误差均方作分母。
应当注意,分母项的正确选择是由方差分析的模型和各项变异原因的期望均方决定的。
在单因素试验结果的方差分析中,无效假设为H0:
μ1=μ2=…=μk,备择假设为HA:
各
μi不全相等,或H0:
=0,HA:
≠0;F=MSt/MSe,也就是要判断处理间均方是否显著大于处理内(误差)均方。
如果结论是肯定的,我们将否定H0;反之,不否定H0。
反过来理解:
如果H0是正确的,那么MSt与MSe都是总体误差σ2的估计值,理论上讲F值等于1;如果H0是不正确的,那么MSt之期望均方中的
就不等于零,理论上讲F值就必大于1。
但是由于抽样的原因,即使H0正确,F值也会出现大于1的情况。
所以,只有F值大于1达到一定程度时,才有理由否定H0。
实际进行F检验时,是将由试验资料所算得的F值与根据df1=dft(大均方,即分子均方的自由度)、df2=dfe(小均方,即分母均方的自由度)查附表4所得的临界F值
,
相比较作出统计推断的。
若F<
,即P>0.05,不能否定H0,统计学上,把这一检验结果表述为:
各处理间差异不显著,在F值的右上方标记“ns”,或不标记符号;若
≤F<
,即0.01<P≤0.05,否定H0,接受HA,统计学上,把这一检验结果表述为:
各处理间差异显著,在F值的右上方标记“*”;若F≥
,即P≤0.01,否定H0,接受HA,统计学上,把这一检验结果表述为:
各处理间差异极显著,在F值的右上方标记“**”。
对于【例6.1】,因为F=MSt/MSe=38.09/5.34=7.13**;根据df1=dft=3,df2=dfe=16查附表4,得F>F0.01(3,16)=5.29,P<0.01,表明四种不同饲料对鱼的增重效果差异极显著,用不同的饲料饲喂,增重是不同的。
在方差分析中,通常将变异来源、平方和、自由度、均方和F值归纳成一张方差分析表,见表6-3。
表6-3表6-2资料方差分析表
变异来源
平方和
自由度
均方
F值
处理间
114.27
3
38.09
7.13**
处理内
85.40
16
5.34
总变异
199.67
19
表中的F值应与相应的被检验因素齐行。
因为经F检验差异极显著,故在F值7.13右上方标记“**”。
在实际进行方差分析时,只须计算出各项平方和与自由度,各项均方的计算及F值检验可在方差分析表上进行。
五、多重比较
F值显著或极显著,否定了无效假设HO,表明试验的总变异主要来源于处理间的变异,试验中各处理平均数间存在显著或极显著差异,但并不意味着每两个处理平均数间的差异都显著或极显著,也不能具体说明哪些处理平均数间有显著或极显著差异,哪些差异不显著。
因而,有必要进行两两处理平均数间的比较,以具体判断两两处理平均数间的差异显著性。
统计上把多个平均数两两间的相互比较称为多重比较(multiplecomparisons)。
多重比较的方法甚多,常用的有最小显著差数法(LSD法)和最小显著极差法(LSR法),现分别介绍如下。
(一)最小显著差数法(LSD法,leastsignificantdifference)此法的基本作法是:
在F检验显著的前提下,先计算出显著水平为α的最小显著差数
,然后将任意两个处理平均数的差数的绝对值
与其比较。
若
>LSDa时,则
与
在α水平上差异显著;反之,则在α水平上差异不显著。
最小显著差数由(6-17)式计算。
(6-17)
式中:
为在F检验中误差自由度下,显著水平为α的临界t值,
为均数差异标准误,由(6-18)式算得。
(6-18)其中
为F检验中的误差均方,n为各处理的重复数。
当显著水平α=0.05和0.01时,从t值表中查出
和
,代入(6-17)式得:
(6-19)
利用LSD法进行多重比较时,可按如下步骤进行:
(1)列出平均数的多重比较表,比较表中各处理按其平均数从大到小自上而下排列;
(2)计算最小显著差数
和
;
(3)将平均数多重比较表中两两平均数的差数与
、
比较,作出统计推断。
对于【例6.1】,各处理的多重比较如表6-4所示。
表6-4四种饲料平均增重的多重比较表(LSD法)
处理
平均数
-24.74
-26.28
-27.96
A1
31.18
6.44**
4.90**
3.22*
A4
27.96
3.22*
1.68ns
A2
26.28
1.54ns
A3
24.74
注:
表中A4与A3的差数3.22用q检验法与新复极差法时,在α=0.05的水平上不显著。
因为,
;查t值表得:
t0.05(dfe)=t0.05(16)=2.120,
t0.01(dfe)=t0.01(16)=2.921
所以,显著水平为0.05与0.01的最小显著差数为
将表6-4中的6个差数与
,
比较:
小于
者不显著,在差数的右上方标记“ns”,或不标记符号;介于
与
之间者显著,在差数的右上方标记“*”;大于
者极显著,在差数的右上方标记“**”。
检验结果除差数1.68、1.54不显著、3.22显著外,其余两个差数6.44、4.90极显著。
表明A1饲料对鱼的增重效果极显著高于A2和A3,显著高于A4;A4饲料对鱼的增重效果极显著高于A3饲料;A4与A2、A2与A3的增重效果差异不显著,以A1饲料对鱼的增重效果最佳。
关于
法的应用有以下几点说明:
1、
法实质上就是
检验法。
它是将
检验中由所求得的
之绝对值
与临界
值的比较转为将各对均数差值的绝对值
与最小显著差数
的比较而作出统计推断的。
但是,由于
法是利用F检验中的误差自由度
查临界
值,利用误差均方
计算均数差异标准误
,因而
法又不同于每次利用两组数据进行多个平均数两两比较的
检验法。
它解决了本章开头指出的
检验法检验过程烦琐,无统一的试验误差且估计误差的精确性和检验的灵敏性低这两个问题。
但
法并未解决推断的可靠性降低、犯I型错误的概率变大的问题。
2、有人提出,与检验任何两个均数间的差异相比较,
法适用于各处理组与对照组比较而处理组间不进行比较的比较形式。
实际上关于这种形式的比较更适用的方法有顿纳特(Dunnett)法(关于此法,读者可参阅其它有关统计书籍)。
3、因为
法实质上是
检验,故有人指出其最适宜的比较形式是:
在进行试验设计时就确定各处理只是固定的两个两个相比,每个处理平均数在比较中只比较一次。
例如,在一个试验中共有4个处理,设计时已确定只是处理1与处理2、处理3与处理4(或1与3、2与4;或1与4、2与3)比较,而其它的处理间不进行比较。
因为这种比较形式实际上不涉及多个均数的极差问题,所以不会增大犯I型错误的概率。
综上所述,对于多个处理平均数所有可能的两两比较,
法的优点在于方法比较简便,克服一般
检验法所具有的某些缺点,但是由于没有考虑相互比较的处理平均数依数值大小排列上的秩次,故仍有推断可靠性低、犯I型错误概率增大的问题。
为克服此弊病,统计学家提出了最小显著极差法。
(二)最小显著极差法(LSR法,Leastsignificantranges)
法的特点是把平均数的差数看成是平均数的极差,根据极差范围内所包含的处理数(称为秩次距)
的不同而采用不同的检验尺度,以克服
法的不足。
这些在显著水平α上依秩次距
的不同而采用的不同的检验尺度叫做最小显著极差
。
例如有10个
要相互比较,先将10个
依其数值大小顺次排列,两极端平均数的差数(极差)的显著性,由其差数是否大于秩次距
=10时的最小显著极差决定(≥为显著,<为不显著=;而后是秩次距
=9的平均数的极差的显著性,则由极差是否大于
=9时的最小显著极差决定;……直到任何两个相邻平均数的差数的显著性由这些差数是否大于秩次距k=2时的最小显著极差决定为止。
因此,有
个平均数相互比较,就有
-1种秩次距(
,
-1,
-2,…,2),因而需求得
-1个最小显著极差(
),分别作为判断具有相应秩次距的平均数的极差是否显著的标准。
因为
法是一种极差检验法,所以当一个平均数大集合的极差不显著时,其中所包含的各个较小集合极差也应一概作不显著处理。
法克服了
法的不足,但检验的工作量有所增加。
常用的
法有
检验法和新复极差法两种。
1、
检验法(qtest)此法是以统计量
的概率分布为基础的。
值由下式求得:
(6-20)
式中,ω为极差,
为标准误,
分布依赖于误差自由度dfe及秩次距k。
利用
检验法进行多重比较时,为了简便起见,不是将由(6-20)式算出的
值与临界
值
比较,而是将极差与
比较,从而作出统计推断。
即为α水平上的最小显著极差。
(6-21)
当显著水平α=0.05和0.01时,从附表5(
值表)中根据自由度
及秩次距
查出
和
代入(6-21)式得
(6-22)
实际利用
检验法进行多重比较时,可按如下步骤进行:
(1)列出平均数多重比较表;
(2)由自由度
、秩次距
查临界
值,计算最小显著极差
0.05,k,
0.01,k;
(3)将平均数多重比较表中的各极差与相应的最小显著极差
0.05,k,
0.01,k比较,作出统计推断。
对于【例6.1】,各处理平均数多重比较表同表6-4。
在表6-4中,极差1.54、1.68、3.22的秩次距为2;极差3.22、4.90的秩次距为3;极差6.44的秩次距为4。
因为,
=5.34,故标准误
为
根据
=16,
=2,3,4由附表5查出
0.05、0.01水平下临界
值,乘以标准误
求得各最小显著极差,所得结果列于表6-5。
表6-5q值及LSR值
dfe
秩次距k
q0.05
q0.01
LSR0.05
LSR0.01
16
2
3.00
4.13
3.099
4.266
3
3.65
4.79
3.770
4.948
4
4.05
5.19
4.184
5.361
将表6-4中的极差1.54、1.68、3.22与表6-5中的最小显著极差3.099、4.266比较;将极差3.22、4.90与3.770、4.948比较;将极差6.44与4.184、5.361比较。
检验结果,除A4与A3的差数3.22由LSD法比较时的差异显著变为差异不显著外,其余检验结果同
法。
2、新复极差法(newmultiplerangemethod)此法是由邓肯(Duncan)于1955年提出,故又称Duncan法,此法还称SSR法(shortestsignificantranges)。
新复极差法与
检验法的检验步骤相同,唯一不同的是计算最小显著极差时需查
表(附表6)而不是查
值表。
最小显著极差计算公式为
(6-23)
其中
是根据显著水平α、误差自由度
、秩次距
,由
表查得的临界
值,
。
α=0.05和α=0.01水平下的最小显著极差为:
(6-24)
对于【例6.1】,各处理均数多重比较表同表6-4。
已算出
=1.033,依
=16,
=2,3,4,由附表6查临界
0.05(16,k)和
0.01(16,k)值,乘以
=1.033,求得各最小显著极差,所得结果列于表6-6。
表6-6SSR值与LSR值
dfe
秩次距k
SSR0.05
SSR0.01
LSR0.05
LSR0.01
2
3.00
4.13
3.099
4.266
16
3
3.15
4.34
3.254
4.483
4
3.23
4.45
3.337
4.597
将表6-4中的平均数差数(极差)与表6-6中的最小显著极差比较,检验结果与
检验法相同。
当各处理重复数不等时,为简便起见,不论
法还是
法,可用(6-25)式计算出一个各处理平均的重复数n0,以代替计算
或
所需的n。
(6-25)
式中
为试验的处理数,
(i=1,2,…,k)为第
处理的重复数。
以上介绍的三种多重比较方法,其检验尺度有如下关系:
法≤新复极差法≤
检验法
当秩次距
=2时,取等号;秩次距
≥3时,取小于号。
在多重比较中,
法的尺度最小,
检验法尺度最大,新复极差法尺度居中。
用上述排列顺序前面方法检验显著的差数,用后面方法检验未必显著;用后面方法检验显著的差数,用前面方法检验必然显著。
一般地讲,一个试验资料,究竟采用哪一种多重比较方法,主要应根据否定一个正确的H0和接受一个不正确的H0的相对重要性来决定。
如果否定正确的H0是事关重大或后果严重的,或对试验要求严格时,用
检验法较为妥当;如果接受一个不正确的H0是事关重大或后果严重的,则宜用新复极差法。
生物试验中,由于试验误差较大,常采用新复极差法;F检验显著后,为了简便,也可采用
法。
(三)多重比较结果的表示法各平均数经多重比较后,应以简明的形式将结果表示出来,常用的表示方法有以下两种。
1、三角形法此法是将多重比较结果直接标记在平均数多重比较表上,如表6-4所示。
由于在多重比较表中各个平均数差数构成一个三角形阵列,故称为三角形法。
此法的优点是简便直观,缺点是占的篇幅较大。
2、标记字母法此法是先将各处理平均数由大到小自上而下排列;然后在最大平均数后标记字母
,并将该平均数与以下各平均数依次相比,凡差异不显著标记同一字母
,直到某一个与其差异显著的平均数标记字母
;再以标有字母
的平均数为标准,与上方比它大的各个平均数比较,凡差异不显著一律再加标
,直至显著为止;再以标记有字母
的最大平均数为标准,与下面各未标记字母的平均数相比,凡差异不显著,继续标记字母
,直至某一个与其差异显著的平均数标记
;……;如此重复下去,直至最小一个平均数被标记比较完毕为止。
这样,各平均数间凡有一个相同字母的即为差异不显著,凡无相同字母的即为差异显著。
用小写拉丁字母表示显著水平α=0.05,用大写拉丁字母表示显著水平α=0.01。
在利用字母标记法表示多重比较结果时,常在三角形法的基础上进行。
此法的优点是占篇幅小,在科技文献中常见。
对于【例6.1】,现根据表6-4所表示的多重比较结果用字母标记如表6-7所示(用新复极差法检验,表6-4中A4与A3的差数3.22在α=0.05的水平上不显著,其余的与LSD法同)。
表6-7表6-4多重比较结果的字母标记(SSR法)
处理
平均数
α=0.05
α=0.01
A1
31.18
a
A
A4
27.96
b
AB
A2
26.28
b
B
A3
24.74
b
B
在表6-7中,先将各处理平均数由大到小自上而下排列。
当显著水平α=0.05时,先在平均数31.18行上标记字母
;由于31.18与27.96之差为3.22,在α=0.05水平上显著,所以在