试验统计与设计概念总结Word文档格式.docx

上传人:b****3 文档编号:16730205 上传时间:2022-11-25 格式:DOCX 页数:19 大小:178.70KB
下载 相关 举报
试验统计与设计概念总结Word文档格式.docx_第1页
第1页 / 共19页
试验统计与设计概念总结Word文档格式.docx_第2页
第2页 / 共19页
试验统计与设计概念总结Word文档格式.docx_第3页
第3页 / 共19页
试验统计与设计概念总结Word文档格式.docx_第4页
第4页 / 共19页
试验统计与设计概念总结Word文档格式.docx_第5页
第5页 / 共19页
点击查看更多>>
下载资源
资源描述

试验统计与设计概念总结Word文档格式.docx

《试验统计与设计概念总结Word文档格式.docx》由会员分享,可在线阅读,更多相关《试验统计与设计概念总结Word文档格式.docx(19页珍藏版)》请在冰豆网上搜索。

试验统计与设计概念总结Word文档格式.docx

19.试验方案:

根据试验目的和要求所拟定的进行比较的一组试验处理的总称。

11.试验效应:

试验因素对试验指标所起增加或减少的作用,包括简单效应、主效应和互作效应。

12.简单效应:

同一因素内两种水平间试验指标的相差属简单效应。

13.主效应:

一个因素内各简单效应的平均数

14.互作效应:

两个因素简单效应间的平均差异。

15.制订试验方案的要点:

1)目的明确,重点突出2)处理水平力求简明,差异适当3)应用唯一差异原则4)设置对照5))正确处理试验因素及试验条件间的关系

16.各因素水平间间距的确定方法:

1)等差法各相邻两个水平数量之差相等。

2)等比法各相邻两个水平的数量比值相同。

3)随机法用随机的方法确定因素内的数量水平。

4)选优法先选出因素水平的两个端点值,再以G=(最大值-最小值)×

0.618为水平间距,用(最小值+G)和(最大值-G)的方法确定因素水平。

17.总体与样本:

总体,有相同性质的个体所组成的集合,包括有限总体和无限总体。

样本,

从总体抽出若干个体构成的集合。

样本容量,样本中所包含个体的数目。

常记为n。

一般在生物学研究中,通常把n≤30的样本叫小样本,n>

30的样本叫大样本。

18.参数与统计量:

参数,由总体计算的特征数,常用希腊字母表示参数。

统计量,由样本计算的特征数,常用拉丁字母表示统计量。

19.观察值:

对样本或总体中各个个体的某种性状、特性加以考察,如称量、度量、计数或分析化验所得的结果。

某个性状的任一观察值常以xi表示。

同一样本的另一性状的观察值用yi表示。

20.误差和错误:

误差,观测值与处理真值间的差异。

错误:

指试验过程中人为因素所引起的差错。

错误是可以避免的。

试验误差:

非人为因素引起的、观察值与处理真值之间的差异。

21.试验误差的种类和特点:

1)试验误差包括:

系统误差和随机误差

2)系统误差:

试验过程中产生有一定的原因引起的偏差。

特点:

1.系统误差有一定的规律性。

2.系统误差可在一定程度上消除,应尽量避免。

3.影响试验的准确性。

3)随机误差:

由多种偶然的、人为无法控制的因素所引起的误差称为随机误差。

1.随机误差不可避免,但可以减小。

2.随机误差一般呈正态分布,其平均值为零。

3.估计随机误差是进行试验统计分析的基础。

4.随机误差影响试验的精确性。

22.准确性和精确性:

准确性,指在调查或试验中某一试验指标观测值与真值接近的程度,也称准确度。

精确性(precision):

指调查或试验中同一试验指标的重复观测值彼此接近的程度。

也称精确度。

准确性、精确性合称为正确性。

第三章田间试验概述

1.田间试验的意义与特点:

1)田间试验:

是处于接近大田生产,以人们一定控制条件下,以农作物本身为指示物进行有重复的小区对比试验。

2)田间试验主要特点:

①研究的对象和材料是生物体本身,以农作物为主,包括昆虫、土壤微生物或病原菌等,以农作物生长发育的反应作为试验指标研究其生长发育规律、各项栽培技术或条件的效果。

②田间试验在开放的自然条件下进行,环境多变。

因此,田间试验普遍存在试验误差。

2.田间试验的任务

解决农业生产中或农业科研中存在的问题。

田间试验的根本任务是在自然或田间条件下选育和鉴定新的作物品种和改进农业生产技术;

客观地评定优良品种及其适应区城;

研究各项增产技术措施及其应用范围,使科研成果能够合理地应用和推广,尽快转化为生产力,发挥其在农业生产上的作用。

农业试验是联系农业科研和生产的桥梁和纽带。

3.田间试验的要求

1)试验目的要明确;

目的性2)试验要有代表性和先进性;

代表性

3)试验结果要正确可靠;

可靠性4)试验结果要具有重演性。

重演性

4.田间试验的误差及其控制

1)误差来源

①试验材料本身所存在的差异(遗传和生长发育);

②试验操作和田间管理技术的不一致所引起的差异;

③外界环境条件的差异。

2)田间试验误差的控制途径

①选择同质一致的试验材料;

②改进操作管理技术,使之标准化;

③控制引起差异的主要外界因素;

5.田间试验引起误差的主要外界因素是土壤差异。

6.土壤差异、特点、表现形式、测定方法及控制土壤差异的主要措施

一、形成原因

1)土壤形成的基础即成土母质、或地形地势的不同,造成土壤的物理、化学性质方面的差异。

2)由于土地利用过程中产生的差异。

二、土壤差异特点:

差异持久性

三、表现形式:

1)呈梯度变化,即肥力高低有规则地从大田的一边到另一边逐渐变化;

2)呈斑块状变化,有的地点肥,有的地点瘦,变化无规则。

四、土壤差异测定方法:

目测法,空白试验或匀田种植试验。

五、控制土壤差异的主要措施:

1)选择土壤质地和肥力均匀的试验地;

2)采用适当的小区技术;

3)应用正确的试验设计和相应的统计分析。

7.试验地的选择培养

1)试验地的位置要适当。

2)试验地最好选用平地。

3)试验地的土壤结构和肥力要均匀一致。

4)选择的试验地应有土地利用的历史记录。

5)试验地选用二组以上采用轮换制。

8.田间试验设计定义及作用

1)定义:

按照试验的目的要求和试验地的具体情况,将各试验小区在试验地上作最合理的设置和排列,称为田间试验设计。

2)作用:

控制、降低试验误差,提高试验的精确性,获得试验误差的无偏估计,从而对试验处理进行正确而有效的比较。

9.田间试验设计的三原则:

(一)重复

重复是指试验中将同一试验处理设置在两个或两个以上的试验单位。

重复的作用:

1、估计试验误差。

2、降低试验误差,提高试验的精确性。

适当增大重复次数可以降低试验误差。

(二)随机排列

随机排列是指试验中的每一处理都有同等机会设置在一个重复中的任何一个试验小区上。

办法:

抽签、抓阄、随机数字表

作用:

提供无偏误差估计。

(三)局部控制

局部控制:

分地段、分范围地控制土壤差异等非处理因素,使之对试验小区的影响达到最大程度的一致。

实现试验条件的局部一致性

手段:

设置区组

有效降低误差。

10.确定试验的小区面积,应考虑以下因素:

原则:

在保证一定重复次数的基础上,适当增大小区面积。

1)试验种类

研究性试验小区面积一般在6-30m2,示范性试验的小区面积通常不小于300m2。

2)作物类别

稻麦品种比较试验的小区面积一般为5-15m2;

棉花、玉米品种比较试验的小区面积一般为15-25m2。

3)试验地面积、土壤差异程度及形式

4)育种工作的不同阶段

5)保证试验收获计产面积的需要

11.边际效应是指小区两边或两端植株的生长环境与小区中间植株的生长环境不一致而表现出差异;

(方形小区)

12.生长竞争是指当相邻小区因处理差异大而表现的差异。

13.区组:

将一个重复全部处理小区分配于具有相对同质的一小块土地上,称为一个区组。

14.设置区组是控制土壤差异和其它田间管理等最简单最有效的方法之一。

15.完全区组和不完全区组:

每一区组包括全部处理,称为完全区组。

当处理数较多时,每个区组只安排部分处理,称为不完全区组。

16.区组和重复区的概念及关系:

完全区组设计:

重复区数=区组数

不完全区组设计:

重复区数≠区组数(﹤)

小区在各区组内的排列有顺序式和随机式。

重复区的排列有密集式和分散式。

17.常用的田间试验设计方法

一、顺序排列设计

各试验处理按顺序分配到每个小区中

种类:

对比法设计、间比法设计

对比法中各处理与CK相邻;

间比法中隔4-9处理设一CK,每区组的第一和最末小区一定是CK。

设计原则:

重复、局部控制

优点:

设计简单、观察方便

缺点:

CK占地多,不经济

何时用:

处理材料少,土壤差异不宜控制;

鉴定圃。

二、随机排列设计

各试验处理随机分配到各个小区中

完全随机设计、随机区组设计、拉丁方设计、裂区设计、再裂区设计、条区设计

(一)完全随机设计

1、设计方法

完全随机设计是将各处理完全随机地分配给不同的试验单位(如试验小区),每一处理的重复次数可以相等也可以不相等。

2、设计特点

完全随机设计应用了试验设计的重复和随机两个原则,其优点是设计容易,处理数与重复次数都不受限制,统计分析也比较简单。

完全随机设计的主要缺点是没有应用局部控制的原则,试验环境条件差异较大时试验误差较大,试验的精确度较低。

(二)随机区组设计

先将试验地划分成若干个区组,区组数等于重复数;

再将每一个区组划分成若干个小区,小区数等于处理数;

然后将各个试验处理独立随机地安排在每一区组的各个小区上。

随机区组设计在完全随机设计的基础上增加了局部控制的原则,随机区组设计试验的精确度较高。

★随机区组设计的优点:

(1)设计简单,容易掌握;

(2)灵活性大,单因素、多因素以及综合性试验都可以采用;

(3)符合试验设计的三原则,能提供无偏的误差估计,能有效地减少单向的土壤肥力差异对试验的影响,降低试验误差,提高试验的精确度;

(4)对试验地的形状和大小要求不严,必要时不同区组可以分散设置在不同的田块或地段上;

(5)易于分析,当因某种偶然事故而损失某一处理或区组时,可以除去该处理或区组进行分析。

★随机区组设计的缺点:

(1)处理数不能太多,因为处理数太多,区组必然增大,区组内的环境变异增大,从而丧失区组局部控制的功能,增大试验误差。

在田间试验中,处理数一般不超过20个,最好为10个左右。

(2)只能控制一个方向的土壤差异,试验精确度低于拉丁方设计。

(三)拉丁方设计

拉丁方设计是从横行和直列两个方向对试验环境条件进行局部控制,使每个横行和直列都成为一个区组,在每一区组内随机安排全部处理的试验设计。

在拉丁方设计中,同一处理在每一横行区组和每一直列区组出现且只出现一次,所以拉丁方设计的处理数、重复数、横行区组数和直列区组数均相同。

(1)试验的重复数与处理数相等;

(2)每一横行和每一直列都包括全部处理,形成一个完全区组;

(3)所有处理在横行和直列中都进行随机排列。

★拉丁方设计的优点:

可以从两个方向消除试验环境条件的影响,具有较高的精确性。

★拉丁方设计的缺点:

(1)拉丁方设计缺乏伸缩性

(2)缺乏随机区组设计的灵活性

(四)裂区设计

裂区设计先将试验地划分为若干个区组,区组数等于试验的重复数;

再将每个区组划分为若干个主区,主区数等于主区因素的水平数;

然后将每一主区划分为若干个副区(或裂区),副区数(或裂区数)等于副区因素的水平数;

将重要因素各水平分配给副区,将次要因素各水平分配给主区

(1)裂区设计副区因素是主要研究的因素,主区因素是次要研究的因素,副区面积小、主区面积大。

(2)对副区来说主区就是一个完全区组,但对全试验所有处理(即水平组合)来说,主区仅是一个不完全区组。

副处理的重复数大于主处理的重复数。

(3)主区因素水平精确度较低,副区因素水平精确度较高

(4)主区误差大于副区误差,副区误差大于副副区误差。

第四章资料的整理和特征数的计算

1.试验资料的类型:

数量性状资料(包括连续性变异资料、不连续性变异资料)、质量性状资料

2.连续性变异资料和不连续性变异资料:

连续性变异资料指用量测方式获得的数量性状资料。

不连续性变异资料指用计数方式获得的数量性状资料,也称间断性资料。

3.数据分布的特征:

集中性、离散性、偏态和峰度

4.平均数:

表示一组数据中观测值的中心位置,是数据资料的代表值,反应某种资料的集中性;

做为资料的代表与另一组资料相比较。

5.平均数的种类:

中数、众数、几何平均数、算术平均数

6.平均数的基本性质:

1)样本各观测值与平均数之差的和为零,即离均差之和等于零。

2)样本各观测值与平均数之差的平方和为最小,即离均差平方和为最小。

7.无偏估计:

当一个统计量的数学期望等于所估计的总体参数时,则称此统计量为该总体参数的无偏估计量。

这个估计称为无偏估计。

8.变异数:

表示资料中观测值变异程度大小的统计量。

常用的变异程度指标有:

极差、方差、标准差和变异系数

9.自由度:

一组变量中具有独立而能自由变动的离均差个数。

10.变异系数:

标准差与平均数的比值称为变异系数。

用于对不同组别数据变异程度的比较。

第五章理论分布与抽样分布

1.几种常见的理论分布:

离散型随机变量的理论分布(0、1分布、二项分布、泊松分布)连续性随机变量的理论分布(正态分布)

2.事件:

在科学试验和生产实践中,人们会观察到各种各样的现象,每种现象出现的可能结果称为事件。

3.必然事件:

在一定条件下必然出现的现象。

用U表示。

不可能事件:

在一定条件下必然不出现的事件。

用V表示。

随机事件:

相同条件下重复进行试验,可能出现也可能不出现的事件。

用A表示。

4.随机事件的特点:

(1)相同条件下多次重复进行,每次试验之间相互独立;

(2)给定条件下,结果不止一个;

(3)每次试验不能准确预料出现的结果,但可以知道会出现哪些可能的结果。

5.频率及概率:

一个事件发生可能性大小的数量指标,称为概率。

在相同条件下进行n次重复试验,如果随机事件A发生的次数为m,那么m/n称为随机事件A的频率

★概率与频率的关系:

1)频率与概率都是一个居于0和1之间的数。

2)频率是相对于样本而言,而概率则是相对于总体而言。

因此可以说概率是频率的理论值,频率是概率的估计值。

3)频率分布是一种观察分布,而概率分布则是一种理论分布。

★概率的性质

1)对于任何事件A,有0≤P(A)≤1;

2)必然事件的概率为1,即P(U)=1;

3)不可能事件的概率为0,即P(V)=0。

6.“小概率的实际不可能性”原理

(1)若随机事件的概率很小,称之为小概率事件。

(2)小概率事件不是不可能事件;

(3)在一次试验中出现的可能性很小,不出现的可能性很大,以至于实际上可以看成是不可能发生的。

(4)在统计学上,把概率很小的事件,在一次试验中看成是实际不可能发生的事件,称为(5)小概率事件实际不可能性原理,亦称为小概率原理;

(6)小概率原理是统计学上进行假设检验(显著性检验)的基本依据。

7.事件之间的关系:

和事件、互斥事件、对立事件、完全事件系、独立事件

8.二项总体和二项式分布:

二项总体:

这种由“非此即彼”的事件构成的总体,叫做二项总体。

通常将二项总体中的“此”事件以变量“1”表示,记为概率p;

将“彼”事件以变量“0”表示,具概率q。

二项总体又称为“0、1”总体。

二项式分布:

如果从二项总体抽取n个个体,可能得到变量y可能为0、1、2、…n,则y共有n+1种取值,这n+1种取值各有其各自的概率,因而由变量及其概率就构成了一个分布,这个分布叫做二项式概率分布,简称二项式分布或二项分布。

9.泊松分布:

描述在一定空间或时间内,稀少点子散布状况且一种理论分布。

10.正态分布的定义及其特征:

(一)正态分布的定义若连续型随机变量y的概率分布密度函数为

其中μ为平均数,σ2为方差,则称随机变量y服从正态分布,记为y~N(μ,σ2)。

(二)正态分布的特征

1、正态分布密度曲线是单峰、对称的悬钟形曲线,对称轴为y=μ;

2、f(y)在y=μ处达到极大,极大值为

3、f(y)是非负函数,以x轴为渐近线,分布从-∞至+∞;

4、曲线在y=μ±

σ处各有一个拐点,即曲线在(-∞,μ-σ)和(μ+σ,+∞)区间上是下凸的,在[μ-σ,μ+σ]区间内是上凸的;

5、正态分布有两个参数,即平均数μ和标准差σ。

μ是位置参数。

σ是变异度参数。

6、分布密度曲线与横轴所夹的面积为1

11.标准正态分布:

我们称μ=0,σ2=1的正态分布为标准正态分布

标准正态分布的概率密度函数记作f(u):

随机变量u服从标准正态分布,记作u~N(0,1)

在连续性随机变数中,不能够计算某一定值的概率,只能计求某一区间或范围的概率。

12.抽样分布:

样本统计量的概率分布称为抽样分布

13.抽样的方法:

抽样的方法有复置抽样和不复置抽样两种。

复置抽样指每次抽出一个个体后,这个个体应返回原总体。

不复置抽样指每次抽出的个体不再返回原总体。

14.样本平均数分布的基本性质:

(1)样本平均数分布的平均数等于总体平均数。

(2)样本平均数分布的方差等于总体方差除以样本容量。

(3)如果从一个已知正态总体N(μ,σ2)进行抽样,其样本平均数形成的新变量也呈现正态分布。

(4)如果被抽样的总体不是正态总体(其平均数为μ,方差为σ2)。

随着样本容量n的不断增大,样本平均数的分布也越来越接近正态分布

15.中心极限定理

(1)无论变量X服从何种分布,随着样本容量n的增大,其样本平均数的抽样分布都服从或逼近正态分布。

(2)这个性质对连续性变量和离散性变量都适用。

(3)一般来说,当n≥30时,即可应用中心极限定理。

16.t分布由t形成的分布叫t分布。

★t分布具有以下特征

(1)t分布是对称的,围绕μt=0向两侧递降。

(2)t分布曲线与横轴所围成的面积等于1。

这与正态分布一致。

(3)t分布受自由度df=n-1的制约,每一个自由度都有一条t分布曲线。

(4)和正态分布相比,t分布的顶部偏低,尾部偏高。

(5)df>

30时,其曲线就接近正态分布曲线。

当df→∝时,其曲线与正态分布曲线完全重合。

17.两个样本平均数差数的抽样分布:

从两个不同总体分别抽取所有可能的样本,它们之间的差数构成一个新的总体,也会形成一个分布

★两个样本平均数差数分布的基本性质

(1)样本平均数差数的平均数等于两个总体平均数的差数。

(2)样本平均数差数的方差等于两个总体方差除以各自的样本容量。

(3)从两个独立的已知正态总体N1(μ1,σ12),N2(μ2,σ22)抽样时,抽出的样本平均数差数的分布也是正态分布。

其平均数差数的抽样分布可记为

18.F分布:

从一个正态总体N(μ,σ2)中,随机抽出容量为n1和n2两个样本,样本的方差为s12和s22。

随机变量F形成的分布称为F分布。

F分布是随df1=n1-1,和df2=n2-1的变化而变化的一簇偏态曲线。

19.χ2分布是由正态总体随机抽样得来的一种连续型随机变量的分布。

第六章统计假设测验

1.统计假设测验的意义在于判明,试验的表面差异主要是由试验的真实差异造成的,还是由试验误差造成的,从而得到可靠的结论。

2.统计假设测验的定义:

根据试验目的,对试验总体提出两种彼此对立的假设,由实际结果,经过一定的计算,做出概率意义上应该接受那种假设的推断。

包括假设测验和参数估计两大部分。

3.统计假设测验的步骤:

(一)提出假设

首先对样本所在的总体作一个假设。

H0:

μ=μ0称为无效假设或零假设,备择假设是在无效假设被否定时,准备接受的假设,记为HA:

μ≠μ0或μ-μ0≠0

(二)确定显著水平

用来否定无效假设H0的概率标准叫显著水平,记作ɑ。

常取ɑ=0.05显著水平,ɑ=0.01,极显著水平

(三)计算概率

(四)统计推断

根据小概率事件实际不可能性原理作出否定或接受无效假设的推断。

根据这一原理,当表面差异是抽样误差的概率小于0.05时,可以认为在一次抽样中表面差异是抽样误差实际上是不可能的,因而否定无效假设H0:

μ=μ0,接受备择假设HA:

μ≠μ0,即认为存在真实差异。

当表面差异是抽样误差的概率大于0.05时,说明无效假设H0:

μ=μ0成立,因此不能接受备择假设HA:

μ≠μ0。

★假设测验的基本步骤:

①对所研究的总体首先提出无效假设和备择假设;

②确定测验的显著水平α(一般α=0.05有时α=0.01);

③在承认上述无效假设正确的前提下,获得平均数的抽样分布,计算由误差造成产生差异的概率;

④根据“小概率事件实际上不可能发生”的原理接受或否定无效假设。

4.两类错误及如何避免:

(1)显著性检验可能出现两种类型的错误:

Ⅰ型错误与Ⅱ型错误。

Ⅰ型错误又称为α错误,否定正确的H0。

犯Ⅰ类型错误的可能性一般不会超过所选用的显著水平α;

Ⅱ型错误又称为β错误,即接受错误的H0。

犯Ⅱ类型错误的概率为β。

即抽样平均数落在已知总体接受区域的概率。

(2)为了降低犯两类错误的概率,一般从选取适当的显著水平α和增加试验重复次数n来考虑。

1、n固定时,α:

5%--1%,Ⅰ类错误降低但β将增大;

2、n、α固定时,总体μ和μ0相差越大,β将愈小;

3、降低两类错误的概率通过显著水平α较低和增大n或适当减少σ2

4、α固定时,可以通过改进试验技术、增大n,从而有效降低β。

5.两尾测验与一尾测验

利用两尾概率进行的检验叫两尾检验,利用一尾概率进行的检验叫一尾检验

6.单个平均数的假设测验

一、u测验适用于以下两种情况

(1)总体方差σ2已知

(2)总体方差σ2虽未知,但样本方差已知,样本容量又很大(n>

30),用样本方差代替总体方差。

二、t测验

如果总体σ2未知、且为小样本(n≤30),用样本方差估计总体方差,就会使其标准化离差的分布不呈正态,而是呈现t分布,具有自由度df或v=n-1。

则用t检验法。

7.两个样本均方比较的假设测验—F测验

测验两个抽自正态总体的独立样本的方差S12和S22所属的总体方差是否有显著差异

8.两个样本平均数差异的假设测验

一、成组数据的平均数比较

两个处理为完全随机设计,供试单位彼此独立,不论其样本容量是否相同,所得数据皆称为成组数据。

以组平均数作为比较的标准。

(1)如果两个样本所在总体为正态分布,且总体方差σ12和σ22已知时用u测验。

P83.【5.2】

(2)如果两个样本所在总体为正态分布,虽总体方差未知,但两个样本容量都很大时用u测验。

(3)如果两个样本所属总体为正态分布,总体方差未知而且样本容量又不大时用t测验.

二、成对资料

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 小学教育 > 数学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1