生物统计学名词解释Word格式.docx
《生物统计学名词解释Word格式.docx》由会员分享,可在线阅读,更多相关《生物统计学名词解释Word格式.docx(11页珍藏版)》请在冰豆网上搜索。
W(A)
概率
就越来越接近某一确定值
P,于是则定
P
为事件
发生的概率.
17.中心极限定律:
是概率论中讨论随机变量序列部分和的分布渐近于正态分布的一类定理。
这组定理是数理统计学和误差分析的理论基础,指出了大量随机变量近似服从正态分布的条件。
18.统计推断:
指从样本的统计数对总体参数做出的推断,包括参数估计和假设检验。
19.假设检验:
指根据总体理论分布和小概率原理,对未知或不完全知道的总体提出两种彼此对立的假设,然后有样本的实际结果,经过一定的计算,做出在一定概率意义上应该接受的那种假设的推断。
20.参数估计:
指由样本结果对总体参数在一定概率水平下所作出的估计。
点估计是用样本统计量直接给出总体相应参数的估计值,由于抽样误差存在,X拔不同的样本将会得到不同的点估计值,点估计缺乏明确的精度概念,而区间估计在一定程度上可以弥补这个不足
21.小概率原理:
指如果假设一些条件,并在假设的条件下能够准确地算出事件
出现的概率
a
为很小,则在假设条件下的
次独立重复试验中时按预定的概率发生,而在有一次试验中则几乎不可能独立。
22显著水平:
指在无效假设和备择假设后,要确定一个否定
H0
的概率标准,这个概率称为显著水平。
23.方差同质性:
就是指各个总体的方差是相同的。
24.Ⅰ类错误
:
是真实的,假设检验却否定了它,就犯了一个否定真实假设的错误,称为
α
错误。
25.Ⅱ类错误:
指如果H0
不是真实的,假设检验时却接受了
H0,否定了
HA
这样就犯了接受不真实假设的错误,称为
β
26.标准误:
描述样本平均数波动情况的统计量,就是X拔的方差或标准差,计均数抽样误差为西格玛X拔,=西格玛/根号n,西格玛X拔就是标准误(差)
27.适合性检验:
指比较观测值与理论值是否符合的假设检验交适合性检验。
28.独立性检验:
指研究两个或两个以上因子彼此之间是相互独立的还是相互影响的一类统计方法。
29.方差分析:
能同时判断多组数据平均数之间的差异显著性,能把随机变异从混杂状态中分离开来,从而为判断因素对实验结果有无确实的影响提供依据
30.因素:
试验中所研究的影响试验指标的因素叫试验因素。
当试验中考察的因素只有一个时,称为单因素试验;
若同时研究两个或两个以上因素对试验指标的影响时,则称为两因素或多因素试验。
33.水平:
试验因素所处的某种特定状态或数量等级称为因素水平,简称水平。
如研究3个品种奶牛产奶量的高低,这3个品种就是奶牛品种这个试验因素的3个水平。
32.处理:
事先设计好的实施在实验单位上的具体项目就叫试验处理。
33.试验单位:
在实验中能接受不同试验处理的独立的试验载体叫试验单位。
一只小白鼠,一条鱼,一定面积的小麦等都可以作为实验单位。
34.重复:
在实验中,将一个处理实施在两个或两个以上的试验单位上,称为处理有重复;
一处理实施的试验单位数称为处理的重复数。
35.多重比较:
多个平均数两两间的相互比较。
36.交互作用:
两因素之间交互作用产生新效应的现象为交互作用
37.数据转换:
在生物学研究中有时会遇到一些样本,其所来自的总体和方差分析基本假定相抵触,这些数据在进行方差分析前
必须经过适当处理即数据转换来变更测量标尺。
38.回归分析:
是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。
39.相关分析是对两个或两个以上随机变量之间相互关联程度进行分析的统计学方法。
40.回归系数:
y^=a+bx,自变量
x
改变一个单位,依变量
y
平均增加或减少的单位数,即回归直线的斜率
b。
41.回归截距:
y^=a+bx,a
是当
x=0
时的
Y^值,即直线在
轴上的截距,称为回归截距。
42.相关系数:
是指通过计算表示
和
相关程度和性质的统计数。
43.决定系数:
是变量
引起
变异的回归平方和与
变异总平方和的比率。
44.可直线化的非线性回归:
可以用来表示双变量间的非线性关系的曲线种类很多,有些曲线类型可以通过数据转换而变形成直线形式(直线化)。
这时可将转换后的数据配合成直线回归方程,然后再转换为曲线回归方程。
(P139)。
45.logistic生长曲线:
开始生长缓慢,而在以后的某一范围内迅速增长,达到某限度后,增长又缓慢下来,曲线略呈拉长“S”,因此,也叫S曲线。
(P151)
46.相关指数:
相关指数R^2表示一元多项式回归方程拟合度的高低,或者说表示一元多项式回归方程估测的可靠程度的高低。
R^2=1-(∑(y-y估测值)^2÷
∑(y-y平均值)^2)R^2越大,说明模型的拟合效果越好。
47.抽样调查:
是一种非全面调查,它是根据一定的原则对研究对象抽取一部分个体进行测量或度量,把得到抽样调查的数据资料作为样本进行统计处理,然后利用样本特征数对总体进行推断。
48.抽样误差:
由抽样引起的样本值与总体值之间的差异成为抽样误差,直接原因:
总体中各个体之间存在差异,或重复试验中一些服从某种分布的偶然误差的存在
49.随机抽样:
抽样过程中,总体内所有个体都具有相同的被抽取的概率。
50.顺序抽样:
按某种既定顺序从总体(有限总体)中抽取一定数量的个体构成样本。
51.典型抽样:
根据初步资料或经验判断,有意识、有目的地选取一个典型群体作为代表(即样本)进行调查记载,以估计整个总体。
52.简单随机抽样:
指从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。
53.分层随机抽样:
在抽样总体中按生物个体划分为若干个层(组),对每层分别抽取一组随机样本,然后通过加权对总体参数做出估计。
54.整体抽样:
将总体分成许多群,每个群由个体按一定方式结合而成,然后随机地抽取若干群,并由这些群中的所有个体组成样本。
这种抽样法的优点是,抽样实施方便,缺点是,由于样本只有自个别几个群体,而不能均匀地分布在总体中,因而代表性差,抽样误差大。
这种方法常用在工序控制中。
55.双重抽样:
当简单性状与复杂性状存在关系时可用抽取简单性状来间接估计复杂性状的抽样方法。
56.调查对象:
我们所要研究的总体,即根据调查目的确定的观察对象。
57.观察单位:
组成调查对象的各个单位或个体。
58.实验设计:
试验单位的选择、分组与排列方法。
59.实验结果重演:
在相同条件下,再进行试验或实践,应能重复获得与原实验结果相近的结果。
60.处理因素:
对受试对象给予的某种外部干预(或措施)。
61.主效应:
各试验因素的相对独立作用。
62.互作(interaction):
某一因素在另一因素的不同水平上所产生的效应不同。
63.受试对象:
是处理因素的客体,实际上就是根据研究目的而确立的观测总体。
64.处理效应:
是处理因素作用于受试对象的反应,是研究最终体现
65.误差:
在试验中受偶然影响或者说非处理因素影响使观测值偏离试验处理真值的差异。
68.重复:
在试验中,同一处理设置的试验单位数。
69.随机:
是指一个重复的某一处理或处理组合被安排在哪一个试验单位,不要有主观成见。
70.局部控制:
根据非处理因素的变化趋势将大的试验环境分解成若干个相对一致的小环境,称为区组、窝组或重复,再在小环境内分成若干个试验单位安排不同的试验处理,在局部对非处理因素进行控制。
71.对比设计:
设置一个试验组或几个试验组与许多标准区(即对照区)依次比较,在同一重复内各处理顺序排列,但不同重复排列成多排时,应注意不同重复间的相同处理不要排在一条直线上,可采用阶梯式或逆向式排列。
72.随机区组设计:
亦称完全随机区组设计,特点是根据“局部控制”的原则,将试验地按肥力程度划分为等于重复次数的区组,一区组安排一重复,区组内各处理都独立的随机排列。
这是随机排列设计中最常用而最基本的设计。
73.裂区设计:
又称为分割试验设计,把一个或多个完全随机设计、随机区组设计或拉丁方设计结合起来的试验方法。
其原理为先将受试对象作一级实验单位,再分为二级实验单位,分别施以不同的处理。
74.正交设计:
是研究多因素多水平的又一种设计方法,它是根据正交性从全面试验中挑选出部分有代表性的点进行试验,这些有代表性的点具备了“均匀分散,齐整可比”的特点,正交试验设计是分析因式设计的主要方法。
是一种高效率、快速、经济的实验设计方法。
75.均积:
是
与
的平均的离均差的乘积和,简称均积。
76.协方差:
与均积相应的总体参数。
77.协方差分析:
把回归分析与方差分析结合。
78.试验控制:
要提高试验的精确度和灵敏度,必须严格控制试验条件的均匀性,使各处里处于尽可能一致的条件下。
79.统计控制:
是试验控制的一种辅助手段,是用统计方法来矫正因自变量的不同而对依变量所产生的影响。
80.协变量:
是一个独立变量(解释变量),不为实验者所操纵,但仍影响实验结果。
1.样本:
样本从总体中抽出的若干个体所构成的集合称为样本。
2.总体:
总体指具有相同性质的个体所组成的集合称为总体。
3.连续变量:
表示在不变量范围内可抽出某一范围的所有值。
4.非连续变量:
也称为离散型变量,表示在变量数列中,仅能取得固定数值,并且通常是整数。
5.准确性:
指在调查或实验中某一试验指标或形状的观测值与真值接近的程度。
6.精确性:
指调查或实验中同一试验指标或形状的重复观测值彼此接近程度大小。
7.资料:
指在一定条件下,在生物学实验和调查中,能够获得大量原始数据,对某种具体事务或现象观察的结果。
8.数量性状资料:
指一般是由计数和测量或度量得到的。
9.质量性状资料:
是指对某种现象只能观察而不能测量的资料,也称属性资料。
10.计数资料;
指由计数得到的数据。
11.计量资料:
有测量或度量得到的数据。
12.普查:
指对研究对象的每一个个体都进行测量或度量的一种全面调查。
13.抽样调查:
14.全距(极差):
15.算数平均数:
16.几何平均数:
指资料中有几个观测值,其乘积开几次方所得的数值。
17.标准差:
18.变异系数:
19.概率:
指某事件A在n次重复试验中,发生了几次,当试验次数n不断增大时,事件A发生的频率W(A)概率就越来越接近某一确定值P,于是则定P为事件A发生的概率.
20.和事件:
指事件A和事件B至少有一件发生而构成的新事件称为事件A和事件B的事件。
21.积事件:
指事件A和事件B同时发生而构成的新事件,称为事件A和事件B的积事件。
22.互斥事件:
指事件A和事件B不能同时发生,称为事件A和事件B互斥。
23.对立事件:
指事件A和事件B必有一个事件发生,但两者不能同时发生。
24.独立事件:
指事件A的发生与事件B的发生毫无关系。
25.完全事件系:
指如果多个事件A1、A2、、、、、、An两两相斥,且每次试验结果必然发生其一,则称事件A1、完全事件系A2、、、、、、An为一个完全事件系。
26.概率加法定理:
指互斥事件A和B的和事件的概率等于事件A和事件B的概率之和,P(A+B)=P(A)+P(B)。
27.概率乘法定理:
指事件A和事件B为独立事件,则事件A与B同时发生的概率等于事件A和事件B各自概率乘法定理的乘积,即:
P(A*B)=P(A)*P(B)。
28.伯努利大数定律:
设M是n次独立试验中事件A出现的次数,而不是事件A在每次试验中出现的概率,则对于任意小的正数ε,有如下关系:
limp{m/n-p<
ε}=1
29.辛钦大数定律:
是用来说明为什么可以用算术平均数来推断总体平均数m的。
30.统计推断:
指从样本的统计数对总体参数做出的推断。
31.假设检验:
32.参数估计:
小概率原理:
指如果假设一些条件,并在假设的条件下能够准确地算出事件A出现的概率a为很小,则在假设条件下的n次独立重复试验中时按预定的概率发生,而在有一次试验中则几乎不可能独立。
33.显著水平:
指在无效假设和备择假设后,要确定一个否定H0的概率标准,这个概率称为显著水平。
34.方差同质性:
35.α错误:
H0是真实的,假设检验却否定了它,就烦了一个否定真实假设的错误,称为α错误。
36.β错误:
指如果H0不是真实的,假设检验时却接受了H0,否定了HA这样就犯了接受不真实假设的错误,称为β错误。
37.适合性检验:
38.独立性检验:
39.相关分析:
是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量间的相关关系的一种统计方法。
40.回归分析:
41.回归系数:
y^=a+bx,自变量x改变一个单位,依变量y平均增加或减少的单位数,即回归直线的斜率b。
42.回归截距:
y^=a+bx,a是当x=0时的Y^值,即直线在y轴上的截距,称为回归截距。
43.离回归平方和:
它反映除去x与y相关程度和性质的统计数。
44.回归平方和:
它反映在y的总体变异种由于x与y的直线关系而产生y变异减小的部分。
45.相关系数:
是指通过计算表示x和y相关程度和性质的统计数。
46.决定系数:
是变量x引起y变异的回归平方和与y变异总平方和的比率。
47.转换:
指估计总体相关系数p的置信区间时,需要将r转换成z。
48.试验设计:
广义的指整个研究课题的设计,包括实验方案的拟订,试验方案的拟订,试验单位的选择,分组的排列,实验过程中试验指标的现象记载,试验资料的整理,分析等内容。
49.试验结果重演:
是指在相同的条件下,在进行实验或实践,应能重复获得与原试验结果相近的结果。
50.处理因素:
一般指对受试对象给予的某种外部干预。
51.主效应:
多因素中试验中引起实验结果发生变化的主要。
52.互作:
因素之间的交互作用。
53.受试对象:
54.处理效应:
是处理因素作用于受试对象的反应,是研究最终体现
55.误差:
56.随机误差:
57.系统误差:
由于试验处理以外的其他条件明显不一致所产生的带有倾向性或定向性的偏差
58.重复:
59.随机:
60.均积:
是x与y的平均的离均差的乘积和,简称均积。
61.协方差:
62.协方差分析:
63.试验控制:
64.统计控制:
第一章绪论与第二章概率论基础
1总体:
指研究对象的全体,它是由研究对象中的所有单元组成的。
总体中包含单元的数目称作总体容量(或大小)用N表示。
2个体:
3样本:
是指按照抽样规则所抽中的那部分单元所组成的集合。
4样本含量:
样本所包含的单位数用n表示,称为样本含量。
5随机样本:
总体是唯一的、确定的,而样本是不确定的、可变的、随机的。
6参数:
反映总体数量特征的综合指标称为总体参数。
常见的总体参数主要有:
总体总和;
总体均值;
总体比率;
总体比例等。
7统计量:
反映样本数量特征的综合指标称之为统计量。
统计量是n元样本的一个实值函数,是一个随机变量,统计量的一个具体取值即为统计值。
主要样本统计量有:
样本总和、样本均值、样本比率、样本比例等。
11随机现象:
带有随机性、偶然性的现象.
12随机试验:
如果每次试验的可能结果不止一个,且事先不能肯定会出现哪一个结果,这样的试验称为随机试验.
13随机事件:
在一次试验中可能发生也可能不发生的事件称为随机事件,简称事件.
14概率的统计定义:
验后概率,在相同条件下随机试验n次,某事件A出现m次(m<
n),则比值称为事件A发生频率。
16随机变量:
在随机试验中所得到的取值具有随机性的量,称为随机变量。
17离散型随机变量:
所有取值可以逐个一一列举
18连续型随机变量:
全部可能取值不仅无穷多,而且还不能一一列举,而是充满一个区间.
19标准正态分布:
μ=0,σ=0的正态分布
20标准正态变量:
是一个随机变量,以概率取值,它的取值服从标准正态分布。
21双侧概率(两尾概率):
把随机变量X落在平均数μ加减不同倍数标准差σ区间之外的概率称为两尾概率,记做α。
22单侧概率(一尾概率):
随机变量X小于μ-kσ或者大于μ+kσ的概率,称为一尾概率,记做α/2.
23贝努利试验:
二项试验,满足下列条件:
一次试验只有两个可能结果,即“成功”和“失败”,“成功”是指我们感兴趣的某种特征;
试验是相互独立的,并可以重复进行n次,在n次试验中,“成功”的次数对应一个离散型随机变量X。
26标准误:
平均数抽样总体的标准差,标准误的大小反映样本平均数y的抽样误差的大小,即精确性的高低。
27样本平均数的抽样总体:
样本平均数的集合构成的一个新总体,
28中心极限定理:
把和的分布收敛于正态分布这一类定理都叫做中心极限定理。
第三章数据的收集与整理
1指标:
用于衡量实验效果的指示性状称为实验指标,或观察项目。
是一种判据。
2因素:
实验中,凡对实验指标可能产生影响的原因或要素都称为因素。
4试验处理:
事先设计好的实施在实验单元上的具体措施,简称处理。
5试验单位:
在实验中接受处理的实验载体
6重复:
在实验中,将一个处理实施在两个或两个以上的实验单位上
7处理效应:
是处理因素作用于实验单位的反应,是研究结果的最终体现。
8误差:
使观察值偏离处理的真实值的偶然影响。
9系统误差:
在相同的条件下多次测量同一量时,误差的绝对值和符号保持恒定;
当条件改变时,按照某一确定的规律变化的误差,是可消除的。
10随机误差:
在相同条件下多次测量同一值时,误差的绝对值和符号的变化没有确定的规律,是无法消除的。
11实验设计的三个原则:
重复、随机化、局部控制Fisher三原则。
12完全随机设计:
根据实验处理数将全部实验单元随机分成若干组,然后再按组实施不同的处理。
13随机化区组设计:
把实验材料按照“组内性质完全一致”的原则分成几个组,每个组包含的材料数等于处理数,每个这样的组就成为一个“区组”,区组的个数相当于实验要求的重复数,在每个区组内,各处理都独立随机排列。
14拉丁方设计:
为了消除两个方向上土壤差异给实验带来的干扰应当设计成两个方向上的区组。
15拉丁方:
由于最初构成上述方阵的各小区是用拉丁字母表示的,所以称为拉丁方。
16标准拉丁方:
第一行与第一列的拉丁字母按自然数排列的拉丁方。
17裂区设计:
先将某一实验因子各个处理随机置于不同的小区内,这些小区称为主区;
然后在每个主区内随机排列(划分)第二个因素的各个处理的小区(副区)
18全距:
总体中最大的标志值与最小的标志值之差。
19组中值:
上下限之间的中点数值
20算术平均数:
所有测量值之和除以变量值个数。
25离均差平方和(平方和)
26变异系数:
用于比较度量单位不同或均属相差悬殊的两组或多组资料的变异程度。
27偏态系数:
数据分布偏斜程度的测度:
峰态系数:
数据分布扁平测度的测度。
第四章统计推断
1假设检验(显著性检验)
2零假设,原假设,待检验的假设,可能被接受也可能被否定。
3备择假设:
原假设被否定时,准备接受的假设。
4显著水平:
一个概率值,是判断小概率事件的标准,用α表示。
8双侧检验:
双侧检验是指一组数据的方差可能大于,等于或小于另一组数据的方差的情况。
不能根据专业知识判断两种结果谁高谁低时,采用双侧检验。
9单侧检验:
当所设H0为总体参数等于某一定值,而H1为仅从一个方向上偏离此定值者,为单侧检验。
10参数估计:
参数估计是根据从总体中抽取的样本估计总体分布中包含的未知参数的方法。
11点估计:
将样本统计量直接作为总体相应参数的估计值叫点估计。
12区间估计:
在一定概率保证下给出总体参数的可能范围。
13置信区间:
区间估计中给出的可能范围。
14置信度:
区间估计中给出的概率保证。
15适合性检验:
比较观测数与理论数是否符合检验。
16独立性检验:
检验事件间的独立性或者说检验