生物统计学习题集参考答案.docx
《生物统计学习题集参考答案.docx》由会员分享,可在线阅读,更多相关《生物统计学习题集参考答案.docx(17页珍藏版)》请在冰豆网上搜索。
生物统计学习题集参考答案
生物统计学习题集参考答案
第一章概论
一、填空
1变量按其性质可以分为连续变量和非连续变量。
2样本统计数是总体参数的估计量。
3生物统计学是研究生命过程中以样本来推断总体的一门学科。
4生物统计学的基本内容包括_试验设置、统计分析_两大部分。
5统计学的发展过程经历了古典记录统计学、近代描述统计学现代推断统计学3个阶段。
6生物学研究中,一般将样本容量n大于等于30称为大样本。
7试验误差可以分为__随机误差、系统误差两类。
二、判断
(-)1对于有限总体不必用统计推断方法。
(-)2资料的精确性高,其准确性也一定高。
(+)3在试验设计中,随机误差只能减少,而不可能完全消除。
(+)4统计学上的试验误差,通常指随机误差。
三、名词解释
样本:
从总体中抽出的若干个体所构成的集合称为样本。
总体:
具有相同的个体所构成的集合称为总体。
连续变量:
是指在变量范围内可抽出某一范围的所有值。
非连续变量:
也称离散型变量,表示变量数列中仅能取得固定数值并且通常是整数。
准确性:
也称准确度指在调查或试验中某一试验指标或性状的观测值与真实值接近的程度。
精确性:
也称精确度指在调查或试验中同一试验指标或性状的重复观测值彼此接近程度的大小。
第二章试验资料的整理与特征数的计算
一、填空
1资料按生物的性状特征可分为___数量性状资料_变量和__变量性状资料_变量。
2直方图适合于表示__计量、连续变量_资料的次数分布。
3变量的分布具有两个明显基本特征,即_集中性_和__离散性_。
4反映变量集中性的特征数是__平均数__,反映变量离散性的特征数是__变异数(标准差)_。
5样本标准差的计算公式s=√∑(x-x横杆)平方/(n-1)。
二、判断
(-)1计数资料也称连续性变量资料,计量资料也称非连续性变量资料。
(-)2条形图和多边形图均适合于表示计数资料的次数分布。
(+)3离均差平方和为最小。
(+)4资料中出现最多的那个观测值或最多一组的中点值,称为众数。
(-)5变异系数是样本变量的绝对变异量。
三、名词解释
资料:
实验或调查获得的大量的原始数据。
数量性状资料:
由计数、度量、测量得到的资料。
质量性状资料:
只能观察不能测量的资料。
计数资料:
有计数法得到的数据。
计量资料:
有测量、度量得到的数据。
普查:
指对研究对象的每一个个体都进行测量或度量的一种全面调查
抽样调查:
是一种非全面调查它是根据一定的原则或研究对象抽取一部分个体进行测量和度量把得到的数据资料作为样本进行统计处理然后利用样本特征数对总体进行推断。
全距(极差):
最大观测值与最小观测值的差值。
组中值:
组中上限与下限的中间值。
算数平均数:
总体或样本资料中各个观测值的综合除以观测值个数所得的商。
中位数:
按顺序排列位置居中的观测数。
众数:
出现次数最多的一组数。
几何平均数:
观测数的乘积再开观测数的个数次方得到的值。
方差:
用样本容量n来除以离均差平方和得到的平均的平方和。
标准差:
方差的平方根。
变异系数:
标准差除以样本平均数。
四、单项选择
1下面变量中属于非连续性变量的是____C___。
A身高B体重C血型D血压
2对某鱼塘不同年龄鱼的尾数进行统计分析时,可做成___A_图来表示。
A条形图B直方图C多边形图D折线图
3关于平均数,下列说法正确的是__B___。
A正态分布的算术均数与几何平均数相等
B正态分布的算术平均数与中位数相等
C正态分布的中位数与几何平均数相等
D正态分布的算术平均数、中位数、几何平均数均相等
4如果对各观测值加上一个常数a,其标准差____D___。
A扩大
倍B扩大a倍C扩大a2倍D不变
5比较大学生和幼儿园孩子身高变异度,应采用的指标是__C___。
A标准差B方差C变异系数D平均数
第三章概率与概率分布
一、填空
1如果事件A和事件B为独立事件,则事件A与事件B同时发生地概率P(AB)=__P(A)P(B)__。
2二项分布的形状是由___n____和___p____两个参数决定的。
3正态分布曲线上,___u___确定曲线在x轴上的中心位置,_σ_确定曲线的展开程度。
4样本平均数的标准误
等于___√σ平方/n____。
5t分布曲线和正态分布曲线相比,顶部偏___低___,尾部偏___高____。
二、判断
(-)1事件A的发生与事件B的发生毫无关系,则事件A和事件B为互斥事件。
(-)2二项分布函数
恰好是二项式
展开式的第x项,故称二项分布。
(-)3样本标准差s是总体标准差的无偏估计值.
(+)4正态分布曲线形状与样本容量n值无关。
(+)5x2是随自由度变化的一组曲线。
三、名词解释
概率:
某事件在N次重复试验发生了M此,当次数n不断增大时,事件A发生的频率就越来越接近一确定值于是定义P为事件A发生的概率。
和事件:
两事件至少有一件发生构成的新事件。
积事件:
两事件同时发生构成的新事件。
互斥事件:
不能同时发生的两事件。
对立事件:
必有一个发生的两事件。
独立事件:
毫无关系的两事件。
完全事件系:
事件两两相斥,构成的整体称为完整事件系。
概率加法定理:
互斥事件的出现的概率等于他们各自概率之和。
概率乘法定理:
独立事件同时发生的概率等于他们各自概率的积。
伯努利大数定律:
实验条件不变的情况下,重复次数越多,频率越接近理论概率。
辛钦大数定律:
n无限大时,样本平均数和总体平均数相等。
无偏估计值:
如果所有可能样本的某一统计数的平均数等于总体相应参数,则称盖统计数为总体相应参数的无偏估计值。
中心极限定理:
如果被抽取的样本不是正态总体,但具有平均数和方差,当样本容量不断增大,样本平均数的分布也越来越接近正态分布切具有平均数和方差,着成为中心极限定理。
四、单项选择
1一批种蛋的孵化率为80%,同时用2枚种蛋进行孵化,则至少有一枚能孵化出小鸡的概率为____A___。
A0.96B0.64C0.80D0.90
2关于泊松分布参数λ错误的说法是____C___。
Aμ=λB
C
D
3设x服从N(225,25),现以n=100抽样,其标准误为___B____。
A1.5B0.5C0.25D2.25
4正态分布曲线由参数
和
决定,
值相同时,
取___D____时正态曲线展开程度最大,曲线最矮宽。
A0.5B1C2D3
5t分布、F分布的取值区间分别为__A_。
A(-∞,+∞);[0,+∞)B(-∞,+∞);(-∞,+∞)
C[0,+∞);[0,+∞)D[0,+∞);(-∞,+∞)
第四章统计推断
一、填空
1统计推断主要包括_假设检验_和__参数估计_两个方面。
2参数估计包括__区间__估计和_点__估计。
3假设检验首先要对总体提出假设,一般应作两个假设,一个是_无效假设(零假设、Ho)_,一个是_被择假设(HA)_。
4对一个大样本的平均数来说,一般将接受区和否定区的两个临界值写作u+-uoσx-_____。
5在频率的假设检验中,当
或
_<_30时,需进行连续性矫正。
二、判断
(-)1作假设检验时,如果∣u∣>ua,应接受H0,否定HA。
(+)2作单尾检验时,查u或t分布表(双尾)时,需将双尾概率乘以2再查表。
(-)3第一类错误和第二类错误的区别是:
第一类错误只有在接受H0时才会发生;第二类错误只有在否定H0时才会发生。
(-)4当总体方差
未知时需要用t检验法进行假设检验。
(-)5在假设检验中,对大样本(n≥30),用u检验法,对小样本(n<30)用t检验。
(-)6成对数据显着性检验的自由度等于2(n-1)。
(+)7在进行区间估计时,a越小,则相应的置信区间越大。
(-)8方差的同质性是指所有样本的方差都是相等的。
(+)9在小样本资料中,成组数据和成对数据的假设检验都是采用t检验的方法。
(+)10在同一显着水平下,双尾检验的临界正态离差大于单尾检验。
三、名词解释
统计推断:
根据带随机性的观测数据(样本)以及问题的条件和假定(模型),而对未知事物作出的,以概率形式表述的推断。
假设检验:
根据总体的的理论分布和小概率原理对未知或不完全知道的的总体提出两种彼此对立的假设,然后又样本的实际结果经过一定的计算,做出在一定概率意义上应该接受的那种假设推断。
参数估计:
至样品结果对总体参数在一定的概率水平下做出的估计。
小概率原理:
如果抽样结果使得小概率事件发生,则拒绝假设,如果没有使小概率事件发生则接受假设,一般认为等于或是小于0.01或是0.05得让概率为校概率。
显着水平:
在进行无效假设和被择假设后,要确定一个否定H0的概率标准,这个标准较显着水平。
方差同质性:
表明样本是否来自同一整体。
α错误:
如果h0是真实的假设检验、却否定了它,犯了一个否定真实假设检验的错误。
β错误:
如果H0不是真实的,假设检验的时候却接受了它否定了HA这样就犯了接受不真实假设的错误。
四、单项选择
1两样本平均数进行比较时,分别取以下检验水平,以___A_____所对应的犯第二类错误的概率最小。
A
=0.20B
=0.10C
=0.05D
=0.01
2当样本容量n<30且总体方差
未知时,平均数的检验方法是____A___。
At检验B检验CF检验D
检验
3两样本方差的同质性检验用__B___。
A
检验BF检验Ct检验D
检验
4进行平均数的区间估计时,___B__。
An越大,区间越小,估计的精确性越小
Bn越大,区间越小,估计的精确性越大
C
越大,区间越大,估计的精确性越大
D
越大,区间越小,估计的精确性越大
5已知某批25个小麦样本的平均蛋白质含量
和
,则其在95%置信度下的蛋白质含量的点估计L=__C___。
A
B
C
D
第五章
检验
一、填空
1
检验主要有3种用途:
一个样本方差的同质性检验、_适合性检验和___独立性检验_。
2
检验中,在自由度
=__1_时,需要进行连续性矫正,其矫正的
=_∑(|O-E|-0.5)?
2/E___。
3
分布是_连续型_资料的分布,其取值区间为_[0+∞﹚___。
4猪的毛色受一对等位基因控制,检验两个纯合亲本的F2代性状分离比是否符合孟德尔第一遗传规律应采用_适合性_检验法。
5独立性检验的形式有多种,常利用_列联表_进行检验。
二、判断
(-)1
检验只适用于离散型资料的假设试验。
(+)2
检验中进行2×c(c≥3)列联表的独立性检验时,不需要进行连续性矫正。
(+)3对同一资料,进行校正的
值要比未矫正的
值小。
(+)4
检验时,当
>
时,否定H0,接受HA,说明差异达显着水平。
(-)5比较观测值与理论值是否符合的假设检验称为独立性试验。
三、名词解释
适合性检验:
比较观测值和理论值是否符合的假设检验。
独立性检验:
研究两个或两个以上因子之间是相互独立的检验。
四、单项选择
1()
检验中检验统计量
值的计算公式为__A___。
A
B
C
D
2()
检验时,如果实得
>
,即表明___C__。
AP<
应接受H0,否定HABP>
应接受HA,否定H0
CP<
应否定H0,接受HADP>
应否定H0,接受HA
3()在遗传学上常用___B___来检验所得的结果是否符合性状分离规律。
A独立性检验B适合性检验C方差分析D同质性检验
4()对于总合计数n为500的5个样本资料作
检验,其自由度为_D_。
A499B496C1D4
5()r×c列联表的
检验的自由度为__B_。
A(r-1)+(c-1)B(r-1)(c-1)Crc-1Drc-2
第六章方差分析
一、填空
1根据对处理效应的不同假定,方差分析中的数学模型可以分为_固定模型_、_随机模型_和_混合模型__3类。
2在进行两因素或多因素试验时,通常应该设置_重复_,以正确估计试验误差,研究因素间的交互作用。
3在方差分析中,对缺失数据进行弥补时,应使补上来数据后,_误差平方和_最小。
4方差分析必须满足_正态性_、_可加性_、_方差同质性_3个基本假定。
5如果样本资料不符合方差分析的基本假定,则需要对其进行数据转换,常用的数据转换方法有_平方根转换_、_对数转换_、正反弦转换_等。
二、判断
(+)1LSD检验方法实质上就是t检验。
(+)2二因素有重复观测值的数据资料可以分析两个因素间的互作效应。
(-)3方差分析中的随机模型,在对某因素的主效进行检验时,其F值是以误差项方差为分母的。
(+)4在方差分析中,如果没有区分因素的类型,可能会导致错误的结论。
(-)5在方差分析中,对缺失数据进行弥补,所弥补的数据可以提供新的信息。
(+)6对转换后的数据进行方差分析,若经检验差异显着,在进行平均数的多重比较时需要用转换后的数据进行计算。
三、名词解释
因素:
试验中所研究的影响试验指标的原因
水平:
试验因素的不同状态
试验单位:
能接受不同试验处理的独立的试验载体
重复:
一个处理实施在两个或两个以上的试验单位上
多重比较:
平均数两两间的互相比较
交互作用:
一因子对另一因子的不同水准有不同的效果
数据转换:
在方差分析前进行适当的处理
四、单项选择
()1
表示_C_。
A组内平方和B组间平方和
C总平方和D总方差
()2在单因素方差分析中,
表示__A_。
A组内平方和B组间平方和
C总平方和D总方差
()3方差分析计算时,可使用_B__种方法对数据进行初步整理。
A全部疏忽均减去一个值
B每一处理减去一个值
C每一处理减去该处理的平均数
D全部数据均除以总平均数
第七章直线回归与相关分析
一、填空
1相关系数的取值范围是__[-11]___。
2用来说明回归方程代表性大小的统计分析指标是___F___。
3统计上常用__回归_分析来研究呈因果关系的两个变量间的关系,用__相关__分析来研究呈平行关系的两个变量间的关系。
4对于简单直线回归方程,其回归平方和的自由度为__1__。
5在直线回归方程中,自变量改变一个单位,依变量平均增加或减少的单位数可用__b__来进行表示。
二、判断
(-)1当直线相关系数r=0时,说明变量之间不存在任何相关关系。
(+)2如果两个变量的变动方向一致,同时呈上升或下降趋势,则二者是正相关关系。
(-)3相关系数r有正负、大小之分,因而它反映的是两现象之间具体的数量变动关系。
(-)4回归系数b的符号与相关系数r的符号,可以相同也可以不同。
(-)5回归分析和相关分析一样,所分析的两个变量都一定是随机变量。
(-)6在直线回归分析中,两个变量是对等的,不需要区分因变量和自变量。
(-)7正相关指的就是两个变量之间的变动方向都是上升的。
三、名词解释
相关分析:
描述两个或两个以上变量间关系密切程度的统计方法。
回归分析:
一种研究与测度变量之间关系的技术。
对具有相关关系的现象,择一适当的数学关系式,用以说明一个或一组变量变动时,另一变量或一组变量平均变动的情况,这种关系式称为回归方程。
回归系数:
回归方程式^Y=bX+a中之斜率b,称为回归系数。
回归截距:
回归方程式^Y=bX+a中之斜率a,称为回归截距。
离回归平方和:
为了明确解释变量和随机误差各产生的效应是多少,统计学上把数据点与它在回归直线上相应位置的差异称残差,把每个残差的平方后加起来,称为残差平方和,它表示随机误差的效应。
回归平方和:
反映自变量与因变量之间的相关程度的偏差平方和。
相关系数:
相关系数是变量之间相关程度的指标。
样本相关系数用r表示,总体相关系数用ρ表示。
决定系数:
相关系数的平方即为决定系数。
z转换:
要估计相关系数的置信区间,需要将r转换为z。
四、单项选择
1在回归直线中y=a+bx中,b<0,则x与y之间的相关系数___D__。
Ar=0Br=1C02由样本求得r=-0.09,同一资料作回归分析时,b值应为__A__。
Ab<0Bb>0Cb=0Db≥0
3简单线性回归系数t检验,其自由度为__A__。
An-2Bn-1CnD2n-1
4回归系数和相关系数的符号是一致的,其符号均可用来判断现象__B__。
A线性相关还是非线性相关B正相关还是负相关
C完全相关还是不完全相关D单相关还是负相关
5相关分析室研究__C__。
A变量之间的数量关系B变量之间的变动关系
C变量之间的相互关系的密切程度D变量之间的因果关系
6在回归直线y=a+bx中,b表示__C__。
A当x增加一个单位时,y增加a的数量
B当y增加一个单位时,x增加b的数量
C当x增加一个单位时,y的平均增加量
D当x增加一个单位时,x的平均增加量
7当相关系数r=0时,表明__D__。
A现象之间完全无关B相关程度较小
C现象之间完全相关D无直线相关关系
8若计算得以相关系数r=0.94,则__B__。
Ax与y之间一定存在因果关系
B同一资料作回归分析时,求得回归系数一定为正值
C同一资料作回归分析时,求得回归系数一定为负值
D求得回归截距a>0
9根据样本算得一相关系数r,经t检验,P<0.01,说明__D__。
A两变量有高度相关Br来自高度相关的相关总体
Cr来自总体相关系数
的总体Dr来自ρ≠0总体
10若rA不存在任何关系B有直线相关关系
C有确定的函数关系D不存在直线关系,但不排除存在某种曲线关系
11在X和Y的直线相关分析中,|r|越大,则___A___。
A各散点越靠近回归直线B散点越离开回归直线
C回归直线对X轴越倾斜D回归直线对X轴越平坦
12如果直线相关系数r=1,则一定有__C__。
A
B
C
D
>
13直线回归分析中,回归系数b的绝对值越大,则__C___。
A用回归直线估计的效果越好B用回归直线估计的效果越差
C回归直线的斜率越大D回归直线越远离坐标原点
14最小二乘估计方法的本质要求是___D___。
A各点到直线的垂直距离的和最小
B各点到x轴的纵向距离的平方和最小
C各点到直线的垂直距离的平方最小
D各点到直线的纵向距离的平方和最小
15在简单线性回归分析中,剩余平方和反映了__C__。
A应变量y的变异度B自变量x的变异度
C扣除x影响后y的变异度D扣除y影响后x的变异度
第八章可直线化的非线性回归分布
一、填空
1在确定两个变量曲线类型的常用方法有__图示法_和__直线化法_。
2在进行非线性回归曲线的直线化时,对数据进行转换的方法通常有__直接引入新变量__和__方程变换后再引入新变量_。
3___相交指数__可以反映回归曲线拟合程度高低。
二、判断
(+)1直线关系是两变量间最简单的一种关系,但这种关系通常仅在变量一定得取值范围内成立。
(-)2所有的曲线类型都可以通过变量转换成直线形式。
(+)3对曲线进行直线化,必须结合双变量资料本身的特性。
第九章抽样原理与方法
一、填空
1只要使用非全面调查的方法,即使遵守随机原则,_________也不可避免会发生。
2常用的抽样方法有_________、_________和_________。
3在抽样调查时,抽样误差越小,用样本估计总体的可靠性就越_________。
4在其他条件一定时,样本容量越大,抽样误差越_________。
5按照抽样方法的不同,随机抽样有可分为_________、_________、_________和_________。
二、判断
()1抽样误差是抽样调查中无法避免的误差。
()2抽样误差的产生是由于破坏了随机原则所造成的。
()3在其他条件不变的情况下,抽样平均误差要减少为原来的1/3,则样本容量必须增大到9倍。
()4在进行抽样调查时,样本容量越大,其抽样误差也越大。
()5顺序抽样可以计算其抽样误差。
()6整体抽样不能提供总体平均数的无偏估计值。
()7简单随机抽样适用于个体间差异较小,所需抽取的样本单位数较小的情况。
()8分层随机抽样通常比简单随机抽样得到的结果更准确。
()9通常样本容量与准确度有关,样本容量越大,准确度越高。
()10抽样调查方法的正确与否直接关系到由样本所得估计值的准确性。
四、单项选择
1用简单随机抽样方法抽取样本单位,如果要使抽样平均误差降低50%,则样本容量需扩大为原来的_________。
A2倍B3倍C4倍D5倍
2事先将全部总体各单位按某一标志排列,然后依固定顺序和间隔来抽选调查单位的抽样方式为_________。
A分层随机抽样B简单随机抽样C整体抽样D顺序抽样
3整群抽样是对被抽中的群体作全面调查,所以整群抽样时_________。
A全面调查B非全面调查C一次性调查D经常性调查
4事先确定总体范围,并对总体的每个单位编号,然后根据《随机数码表》或抽签的方式来抽取调查单位数的抽样组织形式,被称为_________。
A简单随机抽样B机械抽样C分层抽样D整体抽样
5先将总体各单位按主要标志分组,再从各组中随机抽取一定单位组成样本,这种抽样调查组织方式被称为_________。
A简单随机抽样B机械抽样C分层随机抽样D整体抽样
6在其他条件不变的情况下,样本容量和抽样误差的关系是_________。
A样本容量越大,抽样误差越大
B样本容量越大,抽样误差越小
C样本容量的变化与抽样误差的数值无关
D抽样误差变化程度是样本容量变动程度的1/2
第十章试验设计及其统计分析
一、填空
1试验设计包括3个基本要素,即_________,受试对象和________