生物统计学答案 第十二章 实验设计.docx
《生物统计学答案 第十二章 实验设计.docx》由会员分享,可在线阅读,更多相关《生物统计学答案 第十二章 实验设计.docx(45页珍藏版)》请在冰豆网上搜索。
生物统计学答案第十二章实验设计
第十二章实验设计
12.1一项关于在干旱地区生长的一种杨树(),在土壤中的水分逐渐丧失后,其基因表达、蛋白谱、生态生理学及生长性能等方面产生可逆性改变的研究。
作者在本实验的5个时间点上(H5为对照),用方法度量了该杨树叶子中的三个基因的转录丰度比[83],表中给出的为阵列数据:
基因
H1
H2
H3
H4
H5
780423
半胱氨酸蛋白酶
0.7
1.0
2.3
13.1
1.9
780698
环核苷酸和钙调节的离子通道
1.5
1.2
3.0
4.3
1.5
777362
核糖体蛋白
1.1
1.1
1.0
0.9
1.2
借用上述数据,以三个基因作为三个区组,计算在5个时间点上转录丰度比差异是否显著?
答:
随机化完全区组实验设计方差分析的程序,类似于两因素交叉分组实验设计。
以下是本题的程序和结果:
76;
;
13;
15;
;
;
;
;
;
0.71.02.313.11.9
1.51.23.04.31.5
1.11.11.00.91.2
;
;
;
;
;
3123
512345
15
:
F>F
672.556000012.09266671.530.2809
863.10133337.8876667
14135.6573333
0.534848117.67452.8084992.386667
F>F
218.825333339.412666671.190.3519
453.7306666713.432666671.700.2416
从上表中的结果可以看出,如果按随机化完全区组设计进行分析,不同时间点之间的差异不显著。
归纳成一般格式的方差分析表如下:
变差来源
平方和
自由度
均方
F
P
区组
18.82533333
2
9.41266667
1.19
0.3519
时间点
53.73066667
4
13.43266667
1.70
0.2416
误差
63.10133333
8
7.8876667
总和
135.6573333
14
12.2测定了新疆维吾尔、哈萨克、柯尔克孜族乡村不同年龄的男生(n=100),50米跑的平均成绩(s),结果如下[10]:
年龄
7
8
9
10
11
12
13
14
15
16
17
18
维吾尔
10.54
10.16
9.58
9.41
9.11
8.83
8.65
8.24
7.89
7.85
7.70
7.41
哈萨克
10.27
9.70
9.38
9.21
8.84
8.74
8.32
7.92
7.69
7.48
7.40
7.40
柯尔克孜
11.19
10.66
10.12
9.84
9.48
9.24
8.94
8.50
8.27
7.91
7.76
7.63
该试验的目的,是为了推断不同民族间,男生50米跑的平均成绩差异是否显著。
首先判断该试验属于一种什么设计,然后再计算。
答:
该试验为随机化完全区组设计,年龄为区组。
程序不再给出,下面只给出结果。
12123456789101112
3123
36
:
F>F
1338.513291672.96256090193.30<.0001
220.337183330.01532652
3538.85047500
0.9913211.4048260.1238008.812500
F>F
1136.340275003.30366136215.55<.0001
22.173016671.0865083370.89<.0001
从方差分析可知,不同民族间,男生50米跑的平均成绩差异极显著。
归纳成一般格式的方差分析表如下:
变差来源
平方和
自由度
均方
F
P
区组
36.34027500
11
3.30366136
215.55
<0.0001
民族间
2.17301667
2
1.08650833
70.89
<0.0001
误差
0.33718333
22
0.01532652
总和
38.85047500
35
12.3测试了新疆维吾尔、哈萨克、柯尔克孜族乡村不同年龄男生(n=100)立位体前屈的平均次数,结果如下[10]:
年龄
7
8
9
10
11
12
13
14
15
16
17
18
维吾尔
6.65
7.28
7.65
7.63
7.72
7.79
9.12
9.27
12.87
12.83
14.91
16.30
哈萨克
6.94
7.31
6.03
6.50
7.23
6.36
7.52
7.47
10.31
11.91
12.89
13.08
柯尔克孜
5.15
5.56
5.83
6.38
6.80
7.12
8.16
10.77
12.03
15.74
16.89
17.65
与上题类似,请推断三个不同民族间,男生立位体前屈平均次数差异是否显著?
答:
与上题类似,以下只给出结果。
12123456789101112
3123
36
:
F>F
13418.889736132.222287422.21<.0001
2231.92336111.4510619
35450.8130972
0.92918712.692991.2046009.490278
F>F
11405.385697236.853245225.40<.0001
213.50403896.75201944.650.0206
从上述计算结果可以看出,不同民族间,男生立位体前屈平均次数,在α=0.05水平上差异显著。
归纳成一般格式的方差分析表如下:
变差来源
平方和
自由度
均方
F
P
区组
405.3856972
11
36.8532452
25.40
<0.0001
民族间
13.5040389
2
6.7520194
4.65
0.0206
误差
31.9233611
22
1.4510619
总和
450.8130972
35
12.4一项促进刺五加苗木木质化试验[84],选择4种生长刺激剂各选择3种浓度,设计方案见下表:
刺激剂
多效唑(A)
比久(B)
矮壮素(C)
富尔655(D)
稀释倍数
500
600
700
100
200
300
500
700
1000
500
600
700
重复数
3
3
3
3
3
3
3
3
3
3
3
3
按上述方案,每重复调查30株,记录木质化的株数,试验结果如下:
刺激剂
多效唑(A)
比久(B)
矮壮素(C)
富尔655(D)
稀释倍数
500
600
700
100
200
300
500
700
1000
500
600
700
重复
23
29
20
28
20
9
11
10
11
8
16
19
22
26
12
26
19
26
18
16
20
15
21
13
16
22
19
15
18
26
18
9
21
14
20
17
先考虑这是哪一种试验设计?
根据实验设计的要求做方差分析并解释所得结果。
答:
这是一个套设计,所得结果是服从二项分布的随机变量,需做反正弦变换。
76;
;
14;
13;
13;
'e:
\\12-4';
;
((30))*180/3.14159265;
;
;
;
;
;
;
();
();
;
41234
3123
36
:
F>F
112535.035123230.4577382.200.0513
242511.056137104.627339
355046.091260
0.50237619.7850910.2287551.69928
F>F
31295.597384431.8657954.130.0171
()81239.437739154.9297171.480.2160
()
F>F
31295.597384431.8657952.790.1095
从方程分析结果可知,不同刺激剂()的显著水平P=0.1095,套在刺激剂下之稀释倍数()的显著水平P=0.2160。
两者都是不显著的。
套设计,归纳成一般格式的方差分析表如下:
变差来源
平方和
自由度
均方
F
P
刺激剂
1295.597384
3
431.865795
2.79
0.1095
倍数(刺激剂)
1239.437739
8
154.929717
1.48
0.2160
误差
2511.056137
24
104.627339
总和
5046.091260
35
12.5为了研究不同稀释剂对活菌数的影响,设计了下述实验[85]:
吸取制备好的菌液,分别加入8种稀释剂中,每种1,控制各稀释剂中含菌量约为50。
在0,1,2,3,4,5小时,从每一稀释剂中取1倾入一个平皿内,再取1倾入另一个平皿内。
加入45℃营养琼脂培养基20,于34℃培养48h,计数。
请同学们分析一下,这是哪一种实验设计?
有没有更好的设计方法?
答:
根据作者的初衷,本实验应当是一个裂区设计,目的是研究不同稀释剂对活菌数的影响。
根据裂区实验设计的特点,放在次区的因素检验效率更高,故主因素应当放在次区。
根据裂区设计的这个特点,更理想的设计是把时间放在主区,在每一时间下,配制8种稀释剂。
这样安排虽然增加了实验工作量,但得到的信息更可靠。
12.6试验采用六种密度(A,B,C,D,E,F)和四个年份(1996-1999)观察湿地松树高()生长情况[86]。
以下是引用的部分原文内容:
A市密度试验,采用随机区组排列,设6个密度处理,即1m×1.5m,1.5m×2m,2m×2m,2m×2.5m,2m×3m,2.5m×3m分别用A,B,C,D,E,F表示,4次重复,小区面积600m2。
A市B镇C村6个不同密度处理的试验林4年的树高调查观测资料见下表。
A市密度试验林树高生长情况表
区组
年度
小区
A
B
C
D
E
F
I
1996
39.03
43.54
41.96
45.96
43.27
41.75
1997
83.5
90.5
99.5
81.5
85.2
84.8
1998
1.34
1.29
1.93
1.42
1.25
1.16
1999
2.20
2.10
2.0
2.0
1.4
1.9
1996
43.64
40.90
40.25
49.33
41.87
45.80
1997
83.8
95.0
90.0
104.5
87.5
94.2
1998
1.51
1.37
1.51
1.56
1.25
1.35
1999
1.7
2.0
2.2
2.3
1.4
1.7
1996
42.84
42.13
46.31
43.41
41.44
47.83
1997
81.1
82.3
92.2
90.1
77.3
99.2
1998
1.66
1.42
1.25
1.32
1.45
1.26
1999
2.1
2.3
2.2
2.1
1.9
2.1
1996
39.24
38.22
43.28
38.36
37.39
39.55
1997
74.9
67.2
78.3
75.9
63.8
86.2
1998
1.31
1.41
1.34
1.30
1.05
1.44
1999
2.1
2.2
1.9
1.9
1.9
2.1
平均
1996
41.19
41.20
42.95
44.27
40.99
43.73
1997
80.83
83.75
90.0
88.0
78.45
91.1
1998
1.46
1.37
1.51
1.40
1.25
1.30
1999
2.03
2.15
2.08
2.08
1.05
1.95
注:
1996-1998年单位为,1999年单位为m。
“A市密度试验林树高方差分析表
年度
方差分析结果
离差来源
平方和
自由度
均方
均方比(F)
组间
41.79461
5
8.35892
0.8459
1996
组内
177.86267
18
9.88126
总的
219.65729
23
注:
另三个年度与1996年的分析方法完全一样,这里只引用了1996年一个年度的分析结果。
请读者考虑对于以上数据,是否有更好的处理方法。
答:
1.试验采用随机区组设计,但没有给出区组的排列,仅仅给出了4次重复。
2.在第1个表中将4个年度作为1个区组是不合适的。
根据区组的定义,区组内的条件应当是尽量一致的,不同年份间的条件差别是很大的,不能作为一个区组。
3.第1个表的“注”里1998年的单位也应当是“m”。
4.第2个方差分析表,并未采用随机区组方差分析方法处理数据,在方差分析表中未出现“区组”项。
5.表4是按完全随机化设计方法处理的数据,但不知在设计试验时是否在7个密度和4次重复间进行了完全随机化。
作为一个随机化完全区组设计,以年度作为区组会更合理一些。
因为在一个年度内的自然条件是一致的(前提是土壤条件一致),符合区组的要求。
虽然在年度间不能将密度进行随机化,但只要土壤条件一致,这点还是允许的。
每一个年度内有4次重复,由于增加了重复次数,即增加了误差自由度,使密度间的差异更容易检验出来。
下表是按年度整理出的结果,表中的数据为树的()。
年度
重复
密度/(株·600m-2)
A
B
C
D
E
F
1996
1
39.03
43.54
41.96
45.96
43.27
41.75
2
43.64
40.90
40.25
49.33
41.87
45.80
3
高度42.84
42.13
46.31
43.41
41.44
47.83
4
39.24
38.22
43.28
38.36
37.39
39.55
1997
1
83.5
90.5
99.5
81.5
85.2
84.8
2
83.8
95.0
90.0
104.5
87.5
94.2
3
81.1
82.3
92.2
90.1
77.3
99.2
4
74.9
67.2
78.3
75.9
63.8
86.2
1998
1
134
129
193
142
125
116
2
151
137
151
156
125
135
3
166
142
125
132
145
126
4
131
141
134
130
105
144
1999
1
220
210
200
200
140
190
2
170
200
220
230
140
170
3
210
230
220
210
190
210
4
210
220
190
190
190
210
以年度作为区组进行方差分析的程序和结果如下:
76;
;
14;
16;
14;
'e:
\\12-6';
;
;
;
;
;
;
;
;
;
41234
6123456
96
:
F>F
8332867.092841608.3866192.60<.0001
8718794.9323216.0337
95351662.0251
0.94655412.6539514.69809116.1542
F>F
3328678.8075109559.6025507.14<.0001
54188.2853837.65713.880.0032
从方差分析结果可以得知,密度间F值的显著性概率P=0.0032,P<0.01。
因此,不同密度的株高差异极显著。
归纳成一般格式的方差分析表如下:
变差来源
平方和
自由度
均方
F
P
区组
328678.8075
3
109559.6025
507.14
<0.0001
密度
4188.2853
5
837.6571
3.88
0.0032
误差
18794.9323
87
216.0337
总和
351662.0251
95
12.7为了研究喷洒生物有机肥“垦易”对人参地上部分生长的影响,设计了以下试验[87](摘录原文):
试验地点:
A研究所试验基地,六年生人参地块。
试验方法:
小区面积10m2,随机排列三次重复。
设喷洒生物有机肥“垦易”200倍(A),400倍(B),800倍(C),和喷清水对照(D)四个处理。
不同处理对人参茎粗()的影响
重复
处理
A
B
C
D
1
0.7132
0.8072
0.6946
0.6324
2
0.7050
0.7848
0.6819
0.6472
3
0.6860
0.7668
0.6562
0.6382
人参茎粗方差分析表
变异来源
F
F0.05
F0.01
重复
2
0.0014
0.0007
7
5.14
10.92
处理
3
0.0350
0.0117
117
4.96
9.78
误差
6
0.0006
0.0001
总变异
11
首先分析这是一个什么试验设计,重复可以作为区组吗?
区组可以作为重复吗?
为什么?
如果以重复作为一个因素与重复仅仅是一个简单的重复试验,对方差分析结果会有什么不同?
列出相应的两种方差分析表。
答:
从试验方法的叙述,“随机排列三次重复”,很明显这是一个完全随机化设计。
完全随机化设计方差分析的变差来源,只有“处理”(组间)和“误差”(组内)。
然而,在第2个表中,除上述两项外还有“重复”项。
在完全随机化设计中,误差就是由重复得到的,这两项应是同一个变差来源,不能分成两项。
如果“重复”是由区组引起的,还可以接受(严格来说应称为“区组”)。
但试验并未设置区组,使人茫然不知“重复”所云为何。
完全随机化设计要求全部试验材料(a×n个)都是同质的,如果同质性不能得到满足,至少每一组处理(a个)也必须是同质的,构成一个区组。
n个重复构成n个区组。
这样做的目的是为了在不具同质性的情况下,从总的平方和中分解出一部分可控的平方和(区组平方和),减少误差平方和,提高试验的有效性。
本例,试验设计中并未安排区组,武断地从从误差平方和中分出一个区组平方和是没有根据的,应将区组平方和归还给误差平方和,也就是将两个平方和合并,作为误差平方和。
下面将武断得出的“随机化完全区组”设计的方差分析表和完全随机化设计的方差分析表列出,比较两者的异同。
下表
(1)是按“随机化完全区组”设计计算的。
根据上面第1个表所给出的数据,以A1B1C1D1为一区组,A2B2C2D2为1区组,依此类推。
由于重复的三个水平是可以随机组合的,故下述结果不是唯一的。
(表1)按“随机化完全区组”设计计算:
:
F>F
50.036224650.0072449357.76<.0001
60.000752580.00012543
110.03697722
0.9796481.5973640.0112000.701125
F>F
20.001332760.000666385.310.0470
30.034891880.0116306392.73<.0001
显然,题干的方差分析表是按随机区组计算的,表中的“重复”即区组项。
在该表之前已经说过,由于试验并未设置区组,只是简单的三次重复。
因此,三次重复间是可以随机组合的,区组的排列不是唯一的,方差分析表也不是唯一的。
这