生物统计学答案第十二章实验设计.docx

资源描述

生物统计学答案第十二章实验设计.docx

《生物统计学答案第十二章实验设计.docx》由会员分享，可在线阅读，更多相关《生物统计学答案第十二章实验设计.docx（45页珍藏版）》请在冰豆网上搜索。

生物统计学答案第十二章实验设计.docx

生物统计学答案第十二章实验设计

第十二章实验设计

12.1一项关于在干旱地区生长的一种杨树（），在土壤中的水分逐渐丧失后，其基因表达、蛋白谱、生态生理学及生长性能等方面产生可逆性改变的研究。

作者在本实验的5个时间点上（H5为对照），用方法度量了该杨树叶子中的三个基因的转录丰度比[83]，表中给出的为阵列数据：

基因

780423

半胱氨酸蛋白酶

0.7

1.0

2.3

13.1

1.9

780698

环核苷酸和钙调节的离子通道

1.5

1.2

3.0

4.3

1.5

777362

核糖体蛋白

1.1

1.0

0.9

1.2

借用上述数据，以三个基因作为三个区组，计算在5个时间点上转录丰度比差异是否显著？

答：

随机化完全区组实验设计方差分析的程序，类似于两因素交叉分组实验设计。

以下是本题的程序和结果：

76;

;

13;

15;

;

0.71.02.313.11.9

1.51.23.04.31.5

1.11.11.00.91.2

;

3123

512345

F>F

672.556000012.09266671.530.2809

863.10133337.8876667

14135.6573333

0.534848117.67452.8084992.386667

F>F

218.825333339.412666671.190.3519

453.7306666713.432666671.700.2416

从上表中的结果可以看出，如果按随机化完全区组设计进行分析，不同时间点之间的差异不显著。

归纳成一般格式的方差分析表如下：

变差来源

平方和

自由度

均方

区组

18.82533333

9.41266667

1.19

0.3519

时间点

53.73066667

13.43266667

1.70

0.2416

误差

63.10133333

7.8876667

总和

135.6573333

12.2测定了新疆维吾尔、哈萨克、柯尔克孜族乡村不同年龄的男生（n=100），50米跑的平均成绩（s），结果如下[10]：

年龄

维吾尔

10.54

10.16

9.58

9.41

9.11

8.83

8.65

8.24

7.89

7.85

7.70

7.41

哈萨克

10.27

9.70

9.38

9.21

8.84

8.74

8.32

7.92

7.69

7.48

7.40

柯尔克孜

11.19

10.66

10.12

9.84

9.48

9.24

8.94

8.50

8.27

7.91

7.76

7.63

该试验的目的，是为了推断不同民族间，男生50米跑的平均成绩差异是否显著。

首先判断该试验属于一种什么设计，然后再计算。

答：

该试验为随机化完全区组设计，年龄为区组。

程序不再给出，下面只给出结果。

12123456789101112

3123

F>F

1338.513291672.96256090193.30<.0001

220.337183330.01532652

3538.85047500

0.9913211.4048260.1238008.812500

F>F

1136.340275003.30366136215.55<.0001

22.173016671.0865083370.89<.0001

从方差分析可知，不同民族间，男生50米跑的平均成绩差异极显著。

归纳成一般格式的方差分析表如下：

变差来源

平方和

自由度

均方

区组

36.34027500

3.30366136

215.55

<0.0001

民族间

2.17301667

1.08650833

70.89

<0.0001

误差

0.33718333

0.01532652

总和

38.85047500

12.3测试了新疆维吾尔、哈萨克、柯尔克孜族乡村不同年龄男生（n=100）立位体前屈的平均次数，结果如下[10]：

年龄

维吾尔

6.65

7.28

7.65

7.63

7.72

7.79

9.12

9.27

12.87

12.83

14.91

16.30

哈萨克

6.94

7.31

6.03

6.50

7.23

6.36

7.52

7.47

10.31

11.91

12.89

13.08

柯尔克孜

5.15

5.56

5.83

6.38

6.80

7.12

8.16

10.77

12.03

15.74

16.89

17.65

与上题类似，请推断三个不同民族间，男生立位体前屈平均次数差异是否显著？

答：

与上题类似，以下只给出结果。

12123456789101112

3123

F>F

13418.889736132.222287422.21<.0001

2231.92336111.4510619

35450.8130972

0.92918712.692991.2046009.490278

F>F

11405.385697236.853245225.40<.0001

213.50403896.75201944.650.0206

从上述计算结果可以看出，不同民族间，男生立位体前屈平均次数，在α＝0.05水平上差异显著。

归纳成一般格式的方差分析表如下：

变差来源

平方和

自由度

均方

区组

405.3856972

36.8532452

25.40

<0.0001

民族间

13.5040389

6.7520194

4.65

0.0206

误差

31.9233611

1.4510619

总和

450.8130972

12.4一项促进刺五加苗木木质化试验[84]，选择4种生长刺激剂各选择3种浓度，设计方案见下表：

刺激剂

多效唑（A）

比久（B）

矮壮素（C）

富尔655（D）

稀释倍数

500

600

700

100

200

300

500

700

1000

500

600

700

重复数

按上述方案，每重复调查30株，记录木质化的株数，试验结果如下：

刺激剂

多效唑（A）

比久（B）

矮壮素（C）

富尔655（D）

稀释倍数

500

600

700

100

200

300

500

700

1000

500

600

700

重复

先考虑这是哪一种试验设计？

根据实验设计的要求做方差分析并解释所得结果。

答：

这是一个套设计，所得结果是服从二项分布的随机变量，需做反正弦变换。

76;

;

14;

13;

'e:

\\12-4';

;

（（30））*180/3.14159265;

;

（）;

;

41234

3123

F>F

112535.035123230.4577382.200.0513

242511.056137104.627339

355046.091260

0.50237619.7850910.2287551.69928

F>F

31295.597384431.8657954.130.0171

（）81239.437739154.9297171.480.2160

（）

F>F

31295.597384431.8657952.790.1095

从方程分析结果可知，不同刺激剂（）的显著水平P＝0.1095，套在刺激剂下之稀释倍数（）的显著水平P＝0.2160。

两者都是不显著的。

套设计，归纳成一般格式的方差分析表如下：

变差来源

平方和

自由度

均方

刺激剂

1295.597384

431.865795

2.79

0.1095

倍数（刺激剂）

1239.437739

154.929717

1.48

0.2160

误差

2511.056137

104.627339

总和

5046.091260

12.5为了研究不同稀释剂对活菌数的影响，设计了下述实验[85]：

吸取制备好的菌液，分别加入8种稀释剂中，每种1，控制各稀释剂中含菌量约为50。

在0，1，2，3，4，5小时，从每一稀释剂中取1倾入一个平皿内，再取1倾入另一个平皿内。

加入45℃营养琼脂培养基20，于34℃培养48h，计数。

请同学们分析一下，这是哪一种实验设计？

有没有更好的设计方法？

答：

根据作者的初衷，本实验应当是一个裂区设计，目的是研究不同稀释剂对活菌数的影响。

根据裂区实验设计的特点，放在次区的因素检验效率更高，故主因素应当放在次区。

根据裂区设计的这个特点，更理想的设计是把时间放在主区，在每一时间下，配制8种稀释剂。

这样安排虽然增加了实验工作量，但得到的信息更可靠。

12.6试验采用六种密度（A，B，C，D，E，F）和四个年份（1996－1999）观察湿地松树高（）生长情况[86]。

以下是引用的部分原文内容：

A市密度试验,采用随机区组排列,设6个密度处理,即1m×1.5m，1.5m×2m，2m×2m，2m×2.5m，2m×3m，2.5m×3m分别用A，B，C，D，E，F表示,4次重复,小区面积600m2。

A市B镇C村6个不同密度处理的试验林4年的树高调查观测资料见下表。

A市密度试验林树高生长情况表

区组

年度

小区

1996

39.03

43.54

41.96

45.96

43.27

41.75

1997

83.5

90.5

99.5

81.5

85.2

84.8

1998

1.34

1.29

1.93

1.42

1.25

1.16

1999

2.20

2.10

2.0

1.4

1.9

1996

43.64

40.90

40.25

49.33

41.87

45.80

1997

83.8

95.0

90.0

104.5

87.5

94.2

1998

1.51

1.37

1.51

1.56

1.25

1.35

1999

1.7

2.0

2.2

2.3

1.4

1.7

1996

42.84

42.13

46.31

43.41

41.44

47.83

1997

81.1

82.3

92.2

90.1

77.3

99.2

1998

1.66

1.42

1.25

1.32

1.45

1.26

1999

2.1

2.3

2.2

2.1

1.9

2.1

1996

39.24

38.22

43.28

38.36

37.39

39.55

1997

74.9

67.2

78.3

75.9

63.8

86.2

1998

1.31

1.41

1.34

1.30

1.05

1.44

1999

2.1

2.2

1.9

2.1

平均

1996

41.19

41.20

42.95

44.27

40.99

43.73

1997

80.83

83.75

90.0

88.0

78.45

91.1

1998

1.46

1.37

1.51

1.40

1.25

1.30

1999

2.03

2.15

2.08

1.05

1.95

注:

1996－1998年单位为,1999年单位为m。

“A市密度试验林树高方差分析表

年度

方差分析结果

离差来源

平方和

自由度

均方

均方比（F）

组间

41.79461

8.35892

0.8459

1996

组内

177.86267

9.88126

总的

219.65729

注：

另三个年度与1996年的分析方法完全一样，这里只引用了1996年一个年度的分析结果。

请读者考虑对于以上数据，是否有更好的处理方法。

答：

1．试验采用随机区组设计，但没有给出区组的排列，仅仅给出了4次重复。

2．在第1个表中将4个年度作为1个区组是不合适的。

根据区组的定义，区组内的条件应当是尽量一致的，不同年份间的条件差别是很大的，不能作为一个区组。

3．第1个表的“注”里1998年的单位也应当是“m”。

4．第2个方差分析表，并未采用随机区组方差分析方法处理数据，在方差分析表中未出现“区组”项。

5．表4是按完全随机化设计方法处理的数据，但不知在设计试验时是否在7个密度和4次重复间进行了完全随机化。

作为一个随机化完全区组设计，以年度作为区组会更合理一些。

因为在一个年度内的自然条件是一致的（前提是土壤条件一致），符合区组的要求。

虽然在年度间不能将密度进行随机化，但只要土壤条件一致，这点还是允许的。

每一个年度内有4次重复，由于增加了重复次数，即增加了误差自由度，使密度间的差异更容易检验出来。

下表是按年度整理出的结果，表中的数据为树的（）。

年度

重复

密度/（株·600m-2）

1996

39.03

43.54

41.96

45.96

43.27

41.75

43.64

40.90

40.25

49.33

41.87

45.80

高度42.84

42.13

46.31

43.41

41.44

47.83

39.24

38.22

43.28

38.36

37.39

39.55

1997

83.5

90.5

99.5

81.5

85.2

84.8

83.8

95.0

90.0

104.5

87.5

94.2

81.1

82.3

92.2

90.1

77.3

99.2

74.9

67.2

78.3

75.9

63.8

86.2

1998

134

129

193

142

125

116

151

137

151

156

125

135

166

142

125

132

145

126

131

141

134

130

105

144

1999

220

210

200

140

190

170

200

220

230

140

170

210

230

220

210

190

210

220

190

210

以年度作为区组进行方差分析的程序和结果如下：

76;

;

14;

16;

14;

'e:

\\12-6';

;

41234

6123456

F>F

8332867.092841608.3866192.60<.0001

8718794.9323216.0337

95351662.0251

0.94655412.6539514.69809116.1542

F>F

3328678.8075109559.6025507.14<.0001

54188.2853837.65713.880.0032

从方差分析结果可以得知，密度间F值的显著性概率P＝0.0032，P<0.01。

因此，不同密度的株高差异极显著。

归纳成一般格式的方差分析表如下：

变差来源

平方和

自由度

均方

区组

328678.8075

109559.6025

507.14

<0.0001

密度

4188.2853

837.6571

3.88

0.0032

误差

18794.9323

216.0337

总和

351662.0251

12.7为了研究喷洒生物有机肥“垦易”对人参地上部分生长的影响，设计了以下试验[87]（摘录原文）：

试验地点：

A研究所试验基地，六年生人参地块。

试验方法：

小区面积10m2，随机排列三次重复。

设喷洒生物有机肥“垦易”200倍（A），400倍（B），800倍（C），和喷清水对照（D）四个处理。

不同处理对人参茎粗（）的影响

重复

处理

0.7132

0.8072

0.6946

0.6324

0.7050

0.7848

0.6819

0.6472

0.6860

0.7668

0.6562

0.6382

人参茎粗方差分析表

变异来源

F0.05

F0.01

重复

0.0014

0.0007

5.14

10.92

处理

0.0350

0.0117

117

4.96

9.78

误差

0.0006

0.0001

总变异

首先分析这是一个什么试验设计，重复可以作为区组吗？

区组可以作为重复吗？

为什么？

如果以重复作为一个因素与重复仅仅是一个简单的重复试验，对方差分析结果会有什么不同？

列出相应的两种方差分析表。

答：

从试验方法的叙述，“随机排列三次重复”，很明显这是一个完全随机化设计。

完全随机化设计方差分析的变差来源，只有“处理”（组间）和“误差”（组内）。

然而，在第2个表中，除上述两项外还有“重复”项。

在完全随机化设计中，误差就是由重复得到的，这两项应是同一个变差来源，不能分成两项。

如果“重复”是由区组引起的，还可以接受（严格来说应称为“区组”）。

但试验并未设置区组，使人茫然不知“重复”所云为何。

完全随机化设计要求全部试验材料（a×n个）都是同质的，如果同质性不能得到满足，至少每一组处理（a个）也必须是同质的，构成一个区组。

n个重复构成n个区组。

这样做的目的是为了在不具同质性的情况下，从总的平方和中分解出一部分可控的平方和（区组平方和），减少误差平方和，提高试验的有效性。

本例，试验设计中并未安排区组，武断地从从误差平方和中分出一个区组平方和是没有根据的，应将区组平方和归还给误差平方和，也就是将两个平方和合并，作为误差平方和。

下面将武断得出的“随机化完全区组”设计的方差分析表和完全随机化设计的方差分析表列出，比较两者的异同。

下表

（1）是按“随机化完全区组”设计计算的。

根据上面第1个表所给出的数据，以A1B1C1D1为一区组，A2B2C2D2为1区组，依此类推。

由于重复的三个水平是可以随机组合的，故下述结果不是唯一的。

（表1）按“随机化完全区组”设计计算：

F>F

50.036224650.0072449357.76<.0001

60.000752580.00012543

110.03697722

0.9796481.5973640.0112000.701125

F>F

20.001332760.000666385.310.0470

30.034891880.0116306392.73<.0001

显然，题干的方差分析表是按随机区组计算的，表中的“重复”即区组项。

在该表之前已经说过，由于试验并未设置区组，只是简单的三次重复。

因此，三次重复间是可以随机组合的，区组的排列不是唯一的，方差分析表也不是唯一的。

这

展开阅读全文

生物统计学答案 第十二章 实验设计.docx

生物统计学答案第十二章实验设计.docx