高级生物统计.docx
《高级生物统计.docx》由会员分享,可在线阅读,更多相关《高级生物统计.docx(24页珍藏版)》请在冰豆网上搜索。
高级生物统计
高级生物统计试题
1、论述试验数据为什么要进行统计分析?
(结合实际例子)20%
答:
(1)在试验研究中,通过观察、测量和记载,可获得大量的数据资料。
但这些资料往往是零乱的、无规律可循,只有通过对试验数据的整理,才能发现其内部联系和规律性。
(2)试验普遍存在试验误差,用生物统计方法来分析试验资料,降低试验误差,提高试验的精确性,以正确估计误差,得到可靠的试验结论。
(3)统计分析解决“试验结果怎么看”的问题。
能够对试验数据用统计分析方法正确地估计出试验误差和处理效应,达到试验的预期目的。
例如,达尔文应用统计学方法研究了生物的连续变异现象;孟德尔应用分组统计方法发现了遗传学中的分离定律和独立分配定律;KarlPearson用统计方法研究进化问题;Galton用回归分析方法研究了亲子身高的遗传规律。
到了20世纪初,R.A.Fisher提出了方差分析方法,建立了试验设计三大原理,并提出了随机区组和拉丁方等试验设计方案,出版了经典的“StatisticalMethodsforResearchWorkers”一书,奠定了生物统计学的基础。
A.Wall,Gosset(笔名student),J.Wishart,T.W.Anderson,Yates,J.Newman和E.Pearson等人都在样本分布和统计推断理论的建立上做出了重要贡献,推动了数理统计学的发展,同时也推动了生物统计学的发展。
2、试验有两种不同的饲料添加剂和对照三处理,重复9次,有27头猪参与试验,两个月增重资料如下。
各个处理供试猪初始体重见表,试对资料进行分析。
解释说明结果。
20%
饲料添加剂对猪增重试验结果表(单位:
kg)
处理
2号添加剂
1号添加剂
对照
观测指标
初重x
增重y
初重x
增重y
初重x
增重y
观
测
值
30.5
35.5
27.5
29.5
28.5
26.5
24.5
25.0
21.5
19.5
22.5
18.5
23.0
21.5
20.0
18.5
32.0
28.5
20.5
20.5
22.5
24.5
19.0
18.0
21.0
25.5
24.5
27.5
16.5
16.0
28.5
31.5
26.0
28.5
35.0
30.5
22.5
22.5
18.5
19.0
22.5
20.5
18.5
20.5
28.5
31.5
15.5
16.0
21.5
24.5
20.5
18.5
17.0
16.0
解答:
1、由上表数据可得,
(1)试验资料的数学模型
观测值不仅具有饲料效应和随机误差,而且还受到初重的影响。
故单因素完全随机设计试验资料观测值的数据结构式为:
(i=1,2,L,k;j=1,2,L,n)
(2)计算回归系数并进行显著性检验
回归系数由误差项的统计数计算:
由DPS软件计算回归方程系数B结果如下:
1总回归:
回归截距a=0.4703;回归系数b1=0.9893;R=0.88466;
2共同回归:
回归截距,y1,1=2.2260;y2,1=1.2241;y3,1=-1.6111;回归系数b1=0.9832;R=0.92710
be=0.9832表示供试猪只初始体重改变1kg,每只猪增重将平均改变0.9832kg。
(3)对矫正后的每只猪增重作方差分析
1、求矫正后的每只猪增重的各项平方和及自由度
正每只猪增重的总平方和与自由度,即总离回归平方和与自由度,记为SST’、dfT’:
SS`T=SSTY–SSRY=170.0957
dfY=dfTY-dfRY=22
矫正每只猪增重的误差平方和与自由度,即误差离回归平方和与自由度,记为SSe’、dfe’
SS`e=SSer=98.8238
Df`e=dfer=23
矫正每只猪增重处理间平方和与自由度,记为SSt’、dft’
SS`e=SST-SSe=170.0957-98.8238=71.2719
Df`e=dfT-dfe=k-1=3-1=2
2、对矫正每只猪增重进行方差分析
(1)矫正每只猪增重的方差分析表
变异来源
df
SS
MS
F值
共同回归系数
23
98.8238
4.2967
回归截距A间
2
71.2719
35.6360
8.2938**
总回归
25
170.0957
F=45.6354>F0.01(2,20),p<0.01,不同肥料的矫正单株产量间存在极显著的差异.
(2)变量x和y的各项自由度、平方和与乘积和
因子间协方差分析结果
方差来源
平方和
自由度
均方
F值
误差
39.9147
15
2.6610
13.3876**
处理A+误差
111.1626
17
处理A间
71.2480
2
35.6240
*SIG.5%**SIG.1%
(3)回归误差项方差分析
方差来源
平方和
自由度
均方
F值
回归
273.3631
1
273.3631
102.7303**
离回归
39.9147
15
2.6610
总的
313.2778
16
*SIG.5%,**SIG.1%
(4)求矫正后的每头猪增重的各项平方和及自由度
调整各个处理平均(因子)
处理
平均值
调整后均值
A1B1
25.2222
25.1130
A2B1
24.1111
24.1111
A3B1
21.1667
21.2758
T-测验
T-测验结果(因子)
T(y1-y2)=
1.3028
NOSIG.
SD=
0.7691
T(y1-y3)=
4.9880
T>T.01
SD=
0.7693
T(y2-y3)=
3.6867
T>T.01
SD=
0.7691
回归协方差分析结果
变异来源
平方和
自由度
均方
F值
总回归
170.0957
25
离回归
57.1552
21
2.7217
误差
112.9405
4
28.2351
10.3742**
回归系数B间
41.6685
2
20.8343
7.6549*
回归截距A间
71.2719
2
35.6360
8.2938**
共同回归系数
98.8238
23
4.2967
SIG.5%,SIG.1%
(5)调整处理平均(回归):
处理
平均值
调整后均值
A1B1
25.2222
25.1130
A2B1
24.1111
24.1111
A3B1
21.1667
21.2759
T-测验结果(回归):
T(y1-y2)=
1.0252
NOSIG.
SD=
0.9772
T(y1-y3)=
3.9255
T>T.01
SD=
0.9775
T(y2-y3)=
2.9013
T>T.05
SD=
0.9772
各个处理的调整值
处理
重复1
重复2
重复3
重复4
重复5
重复6
重复7
重复8
重复9
A1B1
28.4032
23.7990
21.7730
23.2295
27.7382
26.3685
23.2643
25.1948
26.2469
A2B1
25.3511
21.2469
21.7209
25.2643
26.2990
25.8251
23.6948
26.3685
21.2295
A3B1
21.3685
19.2643
19.9293
22.2035
22.6601
18.9814
21.2643
23.6427
22.1688
3、对下表数据进行通径分析,绘制通径分析图和通径分析表,解释说明结果20%
解答:
由DPS计算可得,
计算结果
当前日期2014/7/711:
11:
09
变量
平均值
标准差
膨胀系数VIF
x1
1.7475
0.587
5.2352
x2
40.16
9.3089
2.0721
x3
0.3041
0.1863
2.7686
x4
38.05
3.6451
3.1183
x5
2.1975
0.8446
4.2156
y
8.192
2.5519
相关系数(右上角为显著水平)
x1
x2
x3
x4
x5
y
x1
1
0.0292
0.0001
0.0001
0.0001
0.0001
x2
0.4877
1
0.0107
0.0026
0.004
0.0117
x3
0.7479
0.5573
1
0.0004
0.0025
0.0043
x4
-0.7501
-0.635
-0.717
1
0.0004
0.0001
x5
0.8376
0.6141
0.6369
-0.7124
1
0.0001
y
0.8077
0.5517
0.6099
-0.7739
0.8818
1
方差分析表
方差来源
平方和
df
均方
F值
p-值
回归
102.6044
5
20.5209
13.5954
0.0001
剩余
21.1317
14
1.5094
总的
123.7361
19
6.5124
相关系数R=0.910615
决定系数RR=0.829220
调整相关R'=0.876486
变量x
回归系数
标准系数
偏相关
标准误
t值
p-值
b0
12.8551
6.7921
1.8927
0.0779
b1
0.5364
0.1234
0.1294
1.0986
0.4883
0.6324
b2
-0.0160
-0.0583
-0.0976
0.0436
-0.3668
0.7189
b3
-1.2784
-0.0933
-0.1345
2.5174
-0.5079
0.6189
b4
-0.2315
-0.3306
-0.4127
0.1365
-1.6952
0.1107
b5
1.9284
0.6382
0.6011
0.6852
2.8143
0.0131
剩余标准差sse=
1.2286
Durbin-Watsond=
1.6899
序号
观察值
拟合值
残差
标准残差
学生残差
cook距离
1
7.67
8.4668
-0.7968
-0.6545
-0.7268
0.0205
2
11.75
12.1965
-0.4465
-0.3668
-0.4369
0.0133
3
6.85
8.2205
-1.3705
-1.1258
-1.2026
0.034
4
9.8
10.0759
-0.2759
-0.2266
-0.379
0.043
5
8.05
7.3838
0.6662
0.5472
0.6038
0.0132
6
10.25
10.5965
-0.3465
-0.2846
-0.3455
0.0094
7
13
11.7158
1.2842
1.0549
1.2023
0.072
8
9.34
10.0587
-0.7187
-0.5904
-0.7454
0.055
9
6.9
8.4483
-1.5483
-1.2718
-1.6992
0.3778
10
10.1
10.226
-0.126
-0.1035
-0.1147
0.0005
11
12.95
10.8248
2.1252
1.7457
1.9598
0.1666
12
6.4
5.7057
0.6943
0.5703
0.6722
0.0293
13
7.03
7.0563
-0.0263
-0.0216
-0.0239
0
14
6.92
6.863
0.057
0.0468
0.05
0.0001
15
5.17
4.7325
0.4375
0.3593
0.4358
0.0149
16
3.1
4.0103
-0.9103
-0.7477
-1.0119
0.1419
17
5.62
6.8816
-1.2616
-1.0363
-1.2182
0.0944
18
6.97
7.6945
-0.7245
-0.5951
-0.69
0.0273
19
8.4
6.2218
2.1782
1.7892
1.9582
0.1265
20
7.57
8.0797
-0.5097
-0.4186
-0.4867
0.0139
作用因子
直接作用
通过x1
通过x2
通过x3
通过x4
通过x5
x1
0.2633
0.0717
-0.3379
0.2567
0.5434
x2
0.1529
0.1235
-0.3306
0.2056
0.3651
x3
-0.4158
0.2139
0.1215
0.2689
0.5196
x4
-0.3381
-0.1999
-0.0929
0.3307
-0.4668
x5
0.6452
0.2218
0.0865
-0.3349
0.2446
剩余通径系数=0.435118
预测:
预报因子:
x1=1.7136,x2=40.2636,x3=0.2862,x4=38.2500,x5=2.1273
置信水平:
α=0.05
点Y估计:
8.139(7.586~8.692)
Y预测值:
8.139(5.486~10.792)
从通径系数分析表可以看出,x5即结果数的通径系数最大,表明结果数是影响产量的主要因子,在间接效应中,x3即主茎数通过x5即结果数的间接效应为最大,表明主茎数是一个重要的间接效应。
通径图:
4、对以下资料进行聚类分析,划出聚类图,并解释说明分析结果20%
解答:
由DPS计算可得,
计算结果
当前日期2014/7/710:
21:
52
数据标准化
-1.617
0.0674
-1.0255
0.8122
-1.463
-0.7542
-0.6972
-0.3697
-1.309
-0.0401
-0.2048
1.8506
-1.155
0.1441
-1.3127
0.3354
-1.001
-0.0785
0.479
1.0515
-0.847
-1.2686
-1.0596
0.7513
-0.693
1.3726
1.2175
-0.727
-0.539
-1.4221
-1.2443
0.391
-0.385
0.8965
0.9577
0.6098
-0.231
-0.5008
-0.4784
0.4232
-0.077
0.3207
0.308
0.6961
0.077
0.6048
1.2996
0.9724
0.231
-1.3684
-0.8203
-0.5035
0.385
1.6106
1.3817
-0.6402
0.539
1.1038
1.2654
-1.6988
0.693
0.9656
0.3901
-0.599
0.847
-0.9307
-1.1485
-0.6129
1.001
0.4743
0.9714
-0.6119
1.155
0.551
1.1286
-0.1289
1.309
0.3975
0.6294
-0.9433
1.463
0.1288
-0.875
-2.2912
1.617
-2.2743
-1.1622
1.2328
欧氏距离
距离矩阵(下三角)
6.3932
5.6942
2.8072
7.9821
7.5095
7.0868
聚类结果
T
I
J
距离
1
3
2
2.8072
2
2
1
5.6942
3
4
1
7.0868
系统聚类图中各样本次序
1234
划出聚类图
5、对以下资料进行主成分分析,并解释说明分析结果20%
1996~2006年粮食总产量及其影响因子数据
指标
X1
X2
X3
X4
X5
X6
X7
X8
X9
Y
1996
59.47
108.35
370.16
104.18
369.36
45.1
43.21
97.24
22.5
1246.30
1997
59.96
109.22
369.91
101.42
397.08
45.6
40.4
105.8
22.52
1271.90
1998
60.03
110.14
368.5
102.15
381.26
46.2
41.77
105.22
22.49
1319.50
1999
60.78
110.96
362.13
104.89
394.96
44.5
45.6
108.44
22.53
1399.25
2000
61.62
112.05
356.68
103.62
416.36
43.1
49.75
112.09
22.55
1467.80
2001
62.31
112.78
358.04
99.85
431.31
42.5
47.21
120.04
22.55
1486.30
2002
63.04
113.52
345.36
07.97
445.35
42.6
53.52
125.1
22.6
1424.74
2003
63.8
114.81
335.91
104.21
433.91
43.4
73.17
129.21
22.92
1471.01
2004
64.56
115.02
329.67
102.71
516.92
44.4
86.4
137.24
22.94
1509.50
2005
65.04
116.34
326.27
101.79
559.32
41.2
105.53
142.65
23.01
1514.93
2006
65.45
117.21
327.46
97.66
630.19
2.7
142.59
148.36
23.04
1542.20
X1:
Ⅰ等宜耕地面积(万公顷);X2:
Ⅱ等宜耕地面积(万公顷);X3:
Ⅲ等宜耕地面积(万公顷);X4:
不宜耕地面积(万公顷);X5:
农业产值(亿元);X6:
工业产值比例(%);X7:
林业产值(亿元);X8:
化肥施用量(万吨);X9:
农田水利化水平(万公顷)
解答:
(1)由DPS计算可得,
计算结果
当前日期2014-7-1110:
01:
43
一般线性回归分析:
变量
平均值
标准差
膨胀系数VIF
x1
1834.25
577.6476
801566.6511
x2
57.1717
18.1219
42705.3369
x3
103.3667
32.6707
62623.6486
x4
320.8408
102.4264
14095.8084
x5
85.8708
38.3392
17.7447
x6
414.6683
152.3265
1826.5917
x7
36.775
16.6174
70.3765
x8
60.7625
36.7719
1011.6773
x9
110.9492
38.4668
4431.9536
x10
20.8042
6.5552
387553.4421
y
1304.4525
422.1246
(2)相关系数如下表:
相关系数(右上角为显著水平)
x1
x2
x3
x4
x5
x6
x7
x8
x9
x10
y
x1
1
0.0001
0.0001
0.0001
0.0105
0.0003
0.0122
0.08
0.0001
0.0001
0.0001
x2
0.9941
1
0.0001
0.0001
0.013
0.0001
0.0227
0.0386
0.0001
0.0001
0.0001
x3
0.9968
0.9995
1
0.0001
0.012
0.0001
0.0198
0.0472
0.0001
0.0001
0.0001
x4
0.9856
0.9617
0.9693
1
0.0099
0.0033
0.0054
0.2082
0.0008
0.0001
0.0001
x5
0.7048
0.6899
0.6956
0.7087
1
0.0403
0.1093
0.1752
0.0369
0.01
0.0148
x6
0.8598
0.9045
0.8935
0.7713
0.5974
1
0.3205
0.0002
0.0001
0.0002
0.0001
x7
0.6947
0.6478
0.659
0.7456
0.4859
0.3138
1
0.6819
0.1405
0.0143
0.0389
x8
0.5244
0.6013
0.5818
0.3915
0.419
0.873
-0.132
1
0.002
0.06