田间试验统计学汇总要点.docx

资源描述

田间试验统计学汇总要点.docx

《田间试验统计学汇总要点.docx》由会员分享，可在线阅读，更多相关《田间试验统计学汇总要点.docx（16页珍藏版）》请在冰豆网上搜索。

田间试验统计学汇总要点.docx

田间试验统计学汇总要点

三、填空题

1.（统计数）是总体相应参数的估计值。

2.2临界值由（）和（）决定。

3.F分布的平均数F=

（1）。

4.F临界值的取值由（）、（）和（）决定。

5.SSR临界值的取值由（）、（）和（）决定。

6.t分布的平均数=（0），标准差＝（）。

7.t临界值的取值由（自由度）和（概率？

）决定。

8.标准化正态分布方程的参数是μ＝（0）和σ2＝

（1）。

9.泊松分布的参数是μ＝（m）和σ＝（√m）。

10.常用表示资料变异程度的方法有方差、标准差、（极差）和（变异系数）四种。

11.常用的多重比较结果的表示方法有（列梯形表法）、（划线法）和（标记字母法）。

12.常用的随机排列的田间试验设计有（完全随机）设计、随机区组设计、拉丁方设计、裂区设计、再裂区设计和（条区）设计等。

13.二项分布的两个参数=（np），=（根号npq）。

14.二项总体的样本平均数分布的两个参数=（），=（）。

P66

15.二项总体分布的两个参数=（p），=（pq）。

16.方差分析的三个基本假定是（可加性）、（正态性）和（误差同质性）。

17.方差分析的三个基本假定是：

（1）处理效应与环境效应应该是（可加的）；

（2）试验误差应该是（随机的）、彼此独立的，而且作正态分布，具有平均数为零；（3）所有试验处理必须具有（共同的误差方差），即误差同质性假定。

18.方差分析中，常用的变数转换方法有（平方根转换）、（对数转换）、（反正弦转换）和采用几个观察值的平均数作方差分析等四种。

19.根据处理排列方法，常用的田间试验设计可分为（顺序排列）和（随机排列）两类。

20.观察数据依研究形状、特性不同一般可分为（数量性状）资料和（质量性状）资料两大类。

21.回归估计标准误Sy/x与离回归平方和Q和数据对数n的关系是Sy/x=（

）。

P161

22.回归估计标准误Sy/x与回归平方和U以及数据对数n的关系是Sy/x＝（？

）。

23.回归关系的假设测验可由（t测验）或（F测验）给出；还可通过测定同一资料相关系数的显著性来明确回归关系的显著性。

24.回归平方和U与SP、SSX的关系是U＝（P164），其自由度＝

（1）。

25.回归系数b的标准误与回归估计标准误Sy/x、x变数平方和SSx的关系是Sb＝（P63）。

26.基本的抽样方法包括（顺序抽样）、（典型抽样）和（随机抽样）三类。

27.建立直线回归方程

=a+bx时，a称为（回归截距），b称为（回归系数）。

28.建立直线回归方程

=a+bx时，a与

、

和b的关系是a=（

-b

），b与

、x、

、y的关系是b=（

）。

29.具有共同性质的个体所组成的集团称为（总体）；从该集团中抽取若干个体来研究，这些个体的集合称为（样本）。

30.决定系数r²一般只用于表示相关程度，而不表示（相关性质）。

31.决定系数r2与SP、SSX、SSy的关系是r2＝（）。

P174

32.控制试验误差的三条途径是（选择同质一致的试验材料）、（改进操作和管理技术，使之标准化）和（控制引起差异的外界主要因素）。

33.离回归平方和Q与SSy、SSx、SP的关系是Q=（

（不要数字））。

34.两个变数间的关系若具有原因和结果的性质，则定义原因变数为（自变数），定义结果变数为（依变数）。

35.某样本的6个观察值分别为2，3，9，4，1，5；则其中数为（3），变异系数为（75.7%）。

36.某样本的样本容量为9，标准差为6，则样本平均数的标准误为

（2）。

37.潘松分布的两个参数=（np），=（√np）。

38.如X服从N（20，25），已知P（X<16）=0.21，则P（1624）＝（0.21）。

39.如X服从N（30，25），已知P（X<26）=0.2119，则P（26

40.如果由回归方程估计X为某一定值Y总体的平均数

，则

的95%置信限为（）；估计X为某一定值时Y总体某一观察值y0，则y0的95%置信限为（）。

41.设有A和B两个试验因素，各具有3和4个水平，随机区组设计，3次重复，则该试验有（12）个处理，（36）个小区，（36）个观察值。

42.设有K＝10个样本，采用t测验两两比较共需测验（45）次。

43.设有k=8个样本，采用t测验两两比较共需测验（28）次。

44.设有k组数据，每组均有n个观察值，则方差分析中总变异自由度为（nk-1），矫正项C与所有观察值总和T、n、k的关系是C＝（

）。

45.试验误差的三个主要来源是（实验材料固有的差异）、（实验室农事操作和管理技术的不一致所引起的差异）和（进行试验是外界条件的差异）。

46.室内试验只是（辅助性）性试验方法；田间试验是农业科学试验的（主要形式）形式，其（主要的）地位不可替代。

47.适用于间断性变数和属性变数资料的常用次数分布图有（条形图）和（饼图）。

48.随机变数的概率分布按其变异性质可分为（离散型）和（连续型）两类；按其数据来源又可分为（样本分布）、（理论分布）和（抽样分布）。

49.随机变数的概率分布按其数据来源可分为（样本分布）、（理论分布）和（抽样分布）。

50.随机变数分布的3种表示方法是（）（）（）。

51.田间实验根据实验因素的多少可分（单因素试验）、（多因素试验）和（综合性实验）为三类。

52.田间实验设计的目的是（降低实验误差）和（提高试验的精确度）。

？

53.田间试验的特点是既受（实验材料本身）的影响，又受（环境条件）的影响。

54.田间试验设计的三个基本原则是（重复）、（随机排列）和（局部控制）。

55.统计假设测验按其所考虑的概率可分为（两尾测验）和（一尾测验）两类。

56.统计假设的基本任务是由（）分布经过（）分布的测验来估计（）分布。

57.统计假设可分为（无效假设）和（备择假设）两种。

58.土壤肥力差异的两种主要表现形式是（肥力高低变化较有规则）和（斑块状差异）。

59.为了提高回归和相关分析的准确性，两个变数的成对观察值一般应有（5）对以上。

60.相关系数r的绝对值越接近1，表示相关越（密切）；越接近于0表示越可能（无相关）；至于r的正或负，则是表示（相关的性质）。

61.相关系数r与SP、SSx、SSy的关系是r=（

）。

62.样本平均数分布的方差

2与总体方差

2、样本容量n的关系是

2=（

2/n）。

63.样本中各观察值与其平均数的差数的平方的总和为（最小）。

64.样本中各观察值与其平均数的差数的总和为（0）；样本中各观察值与平均数的差数的平方的总和为（最小）。

65.一般而言，假设测验可能犯（两）类错误。

66.一般正态分布的正态离差U=（）；样本平均数分布的正态离差U=（）。

67.一个4因素3水平试验的所有可能处理组合数为（81）。

68.由回归方程估计x为某一定值时条件总体平均数的95％置信区间为（）；估计x为某一定值时条件总体预测值的95％置信区间为（）。

69.有12个处理，要进行随机区组设计，可查得随机数字表中任一页的任一行，去掉（00）、（97）、（98）和（99）四个数字后，凡大于12的数均被12除后得余数，将重复数字划去，即得12个处理的排列次序。

70.有6个处理，每处理3次重复，用对比法设计，至少要安排（18）个对照。

71.有8个处理，每处理3次重复，用对比法设计，至少要安排（24）个对照。

72.有一个总体共有4个个体，分别为2，4，6，8，从总体中进行复置随机抽样，每次抽2个观察值，抽出所有样本，则共有（6）个可能样本；所有样本平均数分布的平均数为（5），标准差为（√2）。

73.有一样本，其6个观察值分别为6，3，8，4，1，3；则其中数为（6），均方为（1429/180）。

74.有一样本，其6个观察值分别为7，3，8，4，2，3；则其中数为（6）。

75.有一样本，其6个观察值分别为7，4，8，5，2，3；则其中数为（6.5）。

76.有一样本的5个观察值为2，7，7，5，4；则其样本均方为（3.6）。

77.有一正态分布N（16,4）,已知U0.05＝1.96，则其分布中间有95％观察值的全距为（3.92）。

78.有一正态分布N（30，9），则落于24与36之间的观察值的百分数为（95.45%）。

79.有一正态分布N（36，9），已知U0.01＝2.58，则其分布中间有99％观察值的全距为（15.48）。

80.有一组观察值为11，26，15，24，9，22；则其极差为（15）。

81.在成组数据的平均数比较时，当两样本的总体方差已知时用（u）测验；当两样本的总体方差未知，但可假定二者相等且为小样本时用（t）测验。

82.在对比法和间比法试验结果的统计分析中，凡相对生产力超过（对照10%以上）的品种一般可以认为显著优于对照；相对生产力仅超过（对照5%左右）则宜继续观察。

83.在随机区组设计中，小区的随机可借助于随机数字表来进行。

如有12个处理，可查得表中任一页的任一行，去掉00、（97）、（98）和（99）四个数字后，凡大于12的数均被12除后得余数，将重复数字划去，即得12个处理的排列次序。

84.在一定的概率保证之下，估计出一个能够覆盖参数的区间称为（置信区间），区间的上下限称为（置信限），区间的长度称为（置信距），保证该区间能覆盖参数的概率（1-α）称为（置信系数或置信度）。

85.在正互作时，从各因素的最佳水平推论最优组合，估计值将偏（低）。

86.

值与观察次数O、理论次数E、分组数k的关系是

＝（

），

分布是（连续性）变数的理论分布。

四、简答

1.请写出两因素随机区组试验方差分析的自由度和平方和分解的公式。

答:

设有A和B两个试验因素，各具a和b个水平，随机区组设计，r次重复，则该试验有a×b个处理，abr个小区，abr个观察值。

其自由度和平方和分解如下：

自由度分解：

变异来源

自由度DF

Vr区组＝重复数

r-1

Vt处理

ab-1

VA：

A因素

a-1

VB：

B因素

b-1

VA×B：

A和B的互作

（a-1）（b-1）

Ve误差

（r-1）（ab-1）

VT总变异

Rab-1

注意Vt＝VA+VB+VA×B，VT＝Vr+Vt+Ve

同样处理平方和SSt＝SSA+SSB+SSA×B，总平方和SST＝SSr+SSt+SSe

2/如何确定试验小区的面积？

1．简述田间试验的基本要求。

一般小区面积60~600尺2，示范性试验小区面积大于3000尺2，确定小区面积时需考虑：

①试验种类：

如耕作方式试验、灌溉试验、农药试验，小区面积宜大些；品种试验小区面积可小些。

②作物种类：

种植密度大的作物如稻麦品比试验，小区面积一般5～15m2；种植密度小的作物如玉米品比试验，小区一般15～25m2。

③试验地面积：

地大小区大，地小小区小。

④土壤差异程度：

差异大，小区面积应大。

⑤新品种选育时，对精确度要求从低到高，因此各阶段所采用的小区面积从小到大。

⑥考虑试验中取样需要：

取样量大，且为无放回取样时，小区面积应大些。

⑦考虑作物边缘效应和生长竞争的影响，应适当增大小区面积。

边际效应（了解）：

小区两边或两端的植株占有较大空间而表现的差异。

生长竞争（了解）：

相邻小区种植不同品种或相邻小区施用不同肥料时，由于株高、分蘖力或生长期的不同，通常将有一行或多行受到影响。

1．试验目的明确。

解决生产上问题，预期目标心中有数。

2．试验结果可靠。

准确度、精确度、系统误差、偶然误差3．试验条件有代表性不能特殊照顾。

“一分试验田”4．试验结果能重复。

品比，多年多点，小试，中试，大面积示范推广

1.方差分析中多重比较的LSD法和SSR法有何区别？

3/标准差s可以表示资料变异的大小，为什么还需要计算变异系数？

它们之间有何关系？

若比较两个样本的变异度，则因单位不同或平均数不同，不能用标准差直接比较。

这时要构造一个不代单位，不受平均数大小影响的变异数，这就是变异系数（coefficientofvariation），用CV表示。

2.简述拉丁方设计的特点和主要优缺点。

1、特点：

将处理从纵横两个方向排列成区组，具有双向局部控制的能力，因而有较高的精确度。

2、优缺点：

精度高，但缺乏伸缩性，因为在设计中，重复数必须等于处理数，两者相互制约。

3.试述田间实验设计的三个基本原则及其作用。

1、重复：

试验中同一处理的小区数即为重复次数，与习惯不同。

作用：

①估计试验误差

②降低试验误差

③更准确地估计处理效应

2、随机：

一个重复中的某一处理，究竟安排到哪一个小区中，不要有主观成见，要通过抽签法或利用随机数字表来安排，使试验中每一处理均有同等机会设置在任何一个试验小区上。

作用：

与重复相结合，无偏地估计误差。

3、局部控制：

分范围分地段地控制非处理因素，使之对各试验处理小区的影响趋向于最大程度的一致，以降低试验误差。

作用：

有效降低试验误差，特别是土壤肥力不匀所造成的误差。

4.试述方差分析的3个基本假定。

1、可加性（additivity）处理效应与环境效应是可加的，如：

2、正态性（normality）试验误差应该是随机的、彼此独立的，具有平均数为0而且作正态分布。

3、同质性（homogeneity）所有试验处理必须具有共同的误差方差

5.有44标准方如下图，横行随机数字为3，1，4，2。

直行随机数字为4，1，2，3。

品种随机数字为1，2，4，3。

请分步骤写出所需拉丁方排列。

6.试验误差有哪些来源？

如何控制？

1）试验材料固有的差异：

包菜苗子大小、壮弱。

2）试验时农事操作和管理技术的不一致性所引起的差异：

追肥不匀、浇水不均。

3）进行试验的外界条件的差异：

如土壤肥力不均。

错误决不允许发生，误差不可避免，但可降低。

控制误差的途径：

针对误差来源

1）选择同质一致的试验材料。

挑壮苗或肥瘦搭配。

2）改进操作和管理技术，使之标准化。

追肥先称，再用小酒杯量；浇水1瓢4蔸。

3）控制引起差异的外界主要因素。

土壤差异是最主要又最难控制的。

①控制土壤差异的三种主要措施：

选择试验地：

种过多年，平整（灌水），肥力较匀（空白试验）；采用适当的小区技术：

小区大小，形状，安排（以后详论）；应用良好的试验设计和相应的统计分析。

②土壤差异的主要表现形式：

肥力梯度；斑块状差异。

③空白试验：

为精细地测定土壤差异程度，在整个试验地上种植单一品种的作物并规范化管理，收获时将整个试验地划分为面积相等的若干单位分开收获，从各单位产量估计整个田块肥力差异程度及其分布状况。

7.写出单因素随机区组试验方差分析的自由度和平方和分解的公式。

8.确定试验方案的要点是什么?

①据试验提出的问题多少而决定用简单的或复杂的方案。

不是越复杂越显得有水平！

②处理的水平应力求简明，水平间差异必须适当，使处理的效应容易表现。

N肥5个水平：

50、51、52、53、54kg/667m2。

③试验方案中应包括作为比较标准的处理，即对照。

④所比较的处理间要应用唯一差异的原则。

如根外喷施液体P肥（设三水平），空白对照是不喷，清水对照是只喷清水，往往容易漏掉（水也可能有作用）。

⑤在某种程度上对预期的试验结果要有一些概念，使方案的一组处理更具科学性和必要性。

N肥4个水平：

50、100、150、200kg/667m2。

9.在二项百分数资料的方差分析中，在何种情况下要进行反正弦转换？

为什么要进行这种转换？

如果资料系成数或百分数，则它将作二项分布，而已知这一分布的方差是决定于平均数p的。

所以，在理论上如果p<0.3和p>0.7则需要作反正弦转换，以获得一个比较一致的方差。

10.解释并举例说明单因素试验和多因素试验。

单因素试验（single-factorexperiment）：

整个试验中只变更、比较一个试验因素的不同水平，其它作为试验条件的因素均严格控制一致的试验。

例如：

为了明确某一品种的耐肥程度，施肥量就是试验因素，试验中的处理水平就是几种不同的施肥量，品种及其他栽培管理措施都相同。

多因素试验（multiple-factororfactorialexperiment）：

在同一试验方案中包含两个或两个以上的试验因素，各个因素都分为不同水平，其它试验条件严格控制一致的试验。

例如：

进行甲、乙、丙3个品种与高、低、中3种施肥量的二因素试验，共有甲高、甲中、甲低、乙高、乙中、乙低、丙高、丙中、丙低等3*3=9个处理组合。

这样的试验除了可以明确两个试验因素分别的作用外，还可以检测出3个品种对各种施肥量是否有不同反应并从中选出最优处理组合。

11.试解释成对数据和成组数据。

若试验设计是将性质相同的两个供试单位配成对，并设有多个配对，然后对每一配对的两个供试单位分别随机地给予不同处理，则所得观察值为成对数据。

如果两个处理为完全随机设计，各供试单位彼此独立，不论两个处理的样本容量是否相同，所得数据皆称为成组数据，以组平均数作为相互比较的标准。

12.试举例解释必然事件、不可能事件和随机事件。

必然事件：

在同一组条件的实现下必然要发生的一类事件。

如人总是要死的，水在标准大气压下加热到100℃必然化为蒸汽。

P（A）＝1。

不可能事件：

在同一组条件的实现下必然不发生的一类事件。

如水在标准大气压下温度低于0℃不可能呈气态。

P（A）＝0。

随机事件（偶然事件）：

在同一组条件的实现下可能发生，也可能不发生的一类事件。

如种子可能发芽，也可能不发芽；硬币抛上落下可能正面朝上，也可能反面朝上。

P（A）[0，1]。

13.何为两尾测验和一尾测验？

在假设测验中何时采用一尾测验，何时采用两尾测验？

两尾测验：

当处理可能优于对照也可能劣于对照时，假设测验中所考虑的概率为正态曲线左边一尾概率和右边一尾概率之和，具两个否定区域。

一尾测验：

当处理仅可能优于对照或仅可能劣于对照时，假设测验中所考虑的概率仅为正态曲线左边一尾概率或仅为右边一尾概率，仅具一个否定区域。

14.简述正态分布曲线的特性。

（1）以μ为原点,左右对称。

（2）在x=μ处,曲线有最大纵高,其算术平均数

中数（左右对称）,众数（最大纵高）均等于μ。

（3）双参数分布:

μ确定其在x轴上的位置,σ确定其变异度（纵高）。

因为曲线下面积是固定的,σ大,变异度大,大的数值愈大,小的数值愈小,两极分化,曲线趴下,纵高下降。

（4）多数次数集中在μ附近,离μ愈远,相应次数愈少,且在

相等处有相等次数（因为是对称分布）,在

≥3σ以外次数极少。

（5）在

=1σ处有拐点,x在μ-1σ处急转直上,在μ+1σ处下降减缓,并以x轴为渐近线。

（6）正态分布曲线与x轴之间的总面积=1（完全事件系概率之和为1）.

（7）正态曲线任何两个x定值之间面积或概率完全由μ和σ确定,

18.试述随机区组设计的特点和主要优缺点。

1、特点：

使用了田间试验设计三个原则，并根据“局部控制”的原则，将试验地按肥力程度划分为等于重复数的区组，一区组安排一重复，区组内各处理独立地随机排列。

是田间试验最常用的设计。

2、优缺点：

优点：

（1）设计简单，容易掌握；

（2）富于伸缩性，单因素、多因素以及综合性试验都能用；（3）能提供无偏的误差估计，并有效减小单向的肥力差异，降低误差；

（4）对试验地要求不严，必要时，不同的区组可以分散设置在不同地段上。

缺点：

（1）设计不允许处理数太多，一般不超过20个；

（2）只能在一个方向上控制土壤差异。

19.为什么建立直线回归方程后，必须对其回归关系进行假设测验？

有哪几种测验方法？

一、直线回归的假设测验

若x和y的总体并不存在直线回归关系，则由其中的一个样本亦可算得一个

，显然这样的回归方程是靠不住的。

因此对由样本算得的回归方程必须进行假设测验，以测定其来自无直线回归关系的总体的概率大小，只有当这种概率小于0.05或小于0.01时，才能冒较小风险或者说有较大把握确认其所代表的总体存在直线回归关系。

具体有3种方法，即t测验，F测验和将回归模型当成相关模型测验相关系数的显著性（在相关模型中讲）。

总体回归方程：

样本回归方程：

20.三个或三个以上的样本平均数的假设测验为什么必须采用方差分析而不用t测验？

k（k≥3）个样本平均数的假设测验方法，即方差分析（analysisofvariance）。

这种方法的基本特点是：

将所有k个样本的观察值和平均数作为一个整体加以考虑，把观察值总变异的自由度和平方和分解为不同变异来源的自由度和平方和，进而获得不同变异来源的总体方差估计值。

21.什么叫置信区间、置信限、置信距和置信度？

置信区间（置信距）：

在一定的概率保证之下，估计出参数可能在内的一个范围或区间即接受区域。

置信限：

置信区间的上下限称之。

一般以L1和L2表示其上下限。

置信系数（置信度）：

保证参数在该区间内的概率P＝（1－），为显著水平。

22.何谓简单效应、主效和互作？

举例说明。

处理效应是处理因素作用于受试对象的反应，是研究结果的最终体现。

简单效应（simpleeffect）：

同一因素内两种水平间试验指标的差数。

主要效应（maineffect）：

一个因素内各简单效应的平均数，又称平均效应，简称主效。

交互作用（interactioneffect）：

两个因素简单效应间的平均差异称为交互作用效应，简称互作

23.什么叫抽样分数？

抽样方案的3个基本内容是什么？

五、计算题

1.有一水稻品种作两因素（施氮肥N和磷肥P）两水平试验，测产结果如下（单位:

斤）：

问：

（1）P1水平下N1与N2的简单效应＝？

（2）N的主效＝？

（3）N和P有无互作？

如有互作是正互作还是负互作？

交互作用为多少？

答:

①P1水平下N1与N2的简单效应＝14-10=4；②（4+8）/2=6；③有，{（24-16）-（14-10）}/2=2,成正交互租用，交互作用为2.

展开阅读全文