生物统计学教案8Word格式文档下载.docx
《生物统计学教案8Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《生物统计学教案8Word格式文档下载.docx(12页珍藏版)》请在冰豆网上搜索。
164.664.567.871.869.2
265.365.366.372.168.2
364.864.667.170.069.8
466.063.766.869.168.3
565.863.968.571.067.5
和326.5322.0336.5354.0343.0
平均数65.364.467.370.868.6
例2从每窝均有4只幼仔的初生动物中,随机选择4窝,称量每只动物的出生重,结果如下:
窝别
IIIIIIIV
134.733.227.132.9
233.326.023.331.4
326.228.627.825.7
431.632.326.728.0
和125.8120.1104.9118.0
平均数31.45030.02526.22529.500
这两个例子都只有一个因素,例1是“品系”,例2是“窝别”。
在每个因素下,又有a个水平(或称为处理),例1有5个品系,例2
有4个窝别。
a个水平可以认为是a个总体,表中的数据是从a个总体中抽出的a个样本。
方差分析的目的就是由这a个样本推断a个总体。
因为上述实验都只有一个因素,对这样的数据所进行的方差分析称为“单因素方差分析”。
单因素方差分析的典型数据见下表。
X1X2X3…Xi…Xa
1x11x21x31xi1xa1
2x12x22x32xi2xa2
3x13x23x33xi3xa3
┇
jx1jx2jx3jxijxaj
nx1nx2nx3nxinxan
平均数x1.x2.x3.xi.xa.
表中的xij表示第i次处理下的第j次观测值,下标中的“.”表示求和,具体说明如下:
8.1.2不同处理效应与不同模型
线性统计模型:
模型中的xij是在i水平下的第j次观测值。
μ是对所有观测值的一个参数,称为总平均数。
αi是仅对第i次处理的一个参数,称为第i次处理效应。
εij是随机误差成分,要求误差是服从N(0,σ2)的独立随机变量。
固定因素:
①因素的水平确定后,因素的效应即被确定。
②因素的a个水平是人为特意选择的。
③方差分析所得结论只适用于所
选定的a个水平。
固定效应模型:
处理固定因素所使用的模型。
随机因素:
①因素的水平确定之后,其效应并不固定。
②因素的a个水平是从水平总体中随机抽取的。
③从随机因素的a个水平所得到的结论,可推广到该因素的所有水平上。
随机效应模型:
处理随机因素所使用的模型。
8.2固定效应模型
8.2.1线性统计模型
其中αi是处理平均数与总平均数的离差,因这些离差的正负值相当,因此
如果不存在处理效应,各αi都应当等于0,否则至少有一个αi≠0。
因此,零假设为:
H0:
α1=α2=…=αa=0
备择假设为:
HA:
αi≠0(至少有一个i)
8.2.2平方和与自由度的分解
对于每个固定的xi.,
因此,
以SST表示总平方和,SSA表示处理平方和,SSe表示误差平方和,
三者关系为:
SST=SSA=SSe
自由度可做同样的分割:
dfT=dfA+dfe
dfT=an-1dfA=a-1dfe=an-a
为了得出检验统计量,以处理平方和与误差平方和除以相应的自由度,得出相应的均方。
MSe=SSe/dfeMSA=SSA/dfA。
8.2.3均方期望与统计量F
MSe是σ2的无偏估计量,证明如下:
用同样的方法可以得出MSA的均方期望。
因为E(εij)=0,故所有包含εij乘积项的数学期望都等于0
于是:
由以上结果可以看出,误差均方MSe是σ2的无偏估计量。
对处理项来说,只有当αi=0时,MSA才是σ2的无偏估计量。
用MSA和MSe比较,便可以反映出αi的大小。
为此,使用统计量F作为检验统计量,做上尾单侧检验。
F=MSA/MSe,具dfA,dfe自由度,当F<
Fα时,接受零假设,处理平均数间不显著;
当F>
Fα时拒绝零假设,处理平均数间差异显著。
在
中,令
则处理均方可表示为
这时的零假设可以记为H0:
ηα2=0。
备择假设记为HA:
ηα2>
0。
将上述结果列在方差分析表中
变差来源平方和自由度均方F均方期望
处理间SSAa-1MSAMSA/MSeσ2+nηα2
误差SSena-aMSeσ2
总和SSTna-1
8.2.4平方和的简易计算
令
C称为校正项。
误差平方和
SSe=SST-SSA
将例1中的每个数据都减去65,编码后列成下表。
1-0.4-0.52.86.84.2
20.30.31.37.13.2
3-0.2-0.42.15.04.8
41.0-1.31.84.13.3
50.8-1.13.56.02.5总和
xi.1.5-3.011.529.018.057.0
xi.22.259.00132.25841.00324.001308.50
Σxij21.933.4029.43174.4668.06277.28
将以上结果列成方差分析表:
变差来源平方和自由度均方F
品系间131.74432.9442.23**
误差15.58200.78
总和147.3224
**α=0.01
F4,20,0.05=2.87,F4,20,0.01=4.43。
F>
F0.01。
P<
0.01因此,上述5个不同小麦品系株高差异极显著。
习惯上以“*”表示在α=0.05水平上差异显著,以“**”表示在α=0.01水平上差异显著。
8.3随机效应模型
8.3.1线性统计模型
其中μ为总平均数,αi为服从N(0,σα2)的独立随机变量,εij为服从N(0,σ2)的独立随机变量。
在随机模型中,不是检验单个处理效应的有无,而是检验αi是否存在变异性。
因此
接受H0表示处理间没有差异,拒绝H0意味着处理间存在差异。
8.3.2均方期望及统计量F
在随机模型中,因为αi是独立随机变量,因此MSA的数学期望与固定模型不同。
MSA的数学期望:
同理可证
用检验统计量F做上尾单侧检验:
F=MSA/MSe。
Fa-1,an-a,α时拒绝H0。
MSA的期望组成除包含误差方差外,还包含处理项方差,表明不同处理间存在差异。
方差分析的程序与固定模型相同,但由于获得样本的方式不同,使之所得结果也不同。
随机模型适用于水平总体,而固定模型仅适用于所选定的a个水平。
以下是例2的计算结果,将每一数据均减去30。
4.73.2-2.92.9
3.3-4.0-6.71.4
-3.8-1.4-2.2-4.3
1.62.3-3.3-2.0总和
xi.5.80.1-15.1-2.0-11.2
xi.233.640.01228.014.00265.66
Σxij249.9833.4969.0332.86185.36
将上述结果列成方差分析表
变差来源平方和自由度均方F
窝间58.575319.5251.97
误差118.945129.912
总和177.62015
F3,12,0.05=3.49,F<
F0.05,P>
0.05,接受H0。
结论是不同窝别动物出生重没有显著差异。
8.4多重比较
8.4.1最小显著差数法(LSD)
平均数差数的显著性检验公式为:
当n1=n2时,
当差异显著时
后边式子,大于号的右侧称为最小显著差数,记为LSD。
8.4.2Duncan检验
检验程序:
①将需要比较的a个平均数依次排列好,使之:
并将每一对平均数的差列成下表:
②算出不同对平均数的差的临界值Rk。
其中
上式中的k是要比较的两个平均数之间所包含的平均数的个数。
当两个平均数相邻时k=2,中间隔一个时k=3等。
平均数共有a个,所以需从附表9中查出a-1个rα,得到a-1个临界值Rk。
③每两个平均数的差与相应的临界值比较,显著的打上一个星花“*”,极显著的打上两个星花“**”。
下面对5个小麦品系株高平均数做duncan多重比较.
首先将平均数按从高到低顺序排列好。
品系号IVVIIIIII
平均数70.868.667.365.364.4
顺序号12345
根据MSe=0.78,n=5,df=a(n-1)=20,k=2,3,4,5。
将临界值列成表。
k2345k2345
r0.052.953.103.183.25r0.014.024.224.334.40
Rk1.1651.2251.2561.284Rk1.5881.6671.7101.738
再以α=0.05和α=0.01水平上的临界值与下表中的平均数的差做比较,差异显著的打上“*”,差异极显著的打上“**”。
8.5.1方差分析应具备的条件
1、可加性:
各处理效应与误差效应是可加的。
2、正态性:
ε:
NID(0,σ2)
3、方差齐性:
各处理的误差方差应具备齐性。