贵州大学生物统计学总复习资料.docx
《贵州大学生物统计学总复习资料.docx》由会员分享,可在线阅读,更多相关《贵州大学生物统计学总复习资料.docx(14页珍藏版)》请在冰豆网上搜索。
贵州大学生物统计学总复习资料
贵州大学生物统计学总复习资料
第一章 概 论
名词1.样本:
从总体中抽出若干个个体的集合称为样本。
2.变量:
相同性质的事物间表现差异性或差异特征的数据称为变量。
3.参数:
参数也称参量,是对一个总体特征的度量。
4.准确性:
是指统计数接近真知的程度。
5.统计数:
从样本计算所得的数值称为统计数,它是总体参数的估计值。
6.生物统计学:
是统计学在生物学中的应用,是用数理统计的原理和方法来分析解释生命现象的一门科学,是研究生命过程中以样本推断总体的一门科学。
五、简答:
1.简述生统在生命科学中的作用:
(1) 提供整理和描述数据资料的科学方法,确定某些性状和特性的数量特征。
(2) 判断试验结果的可靠性。
(3) 提供由样本推断总体的方法。
(4) 提供试验设计的一些重要原则。
2. 简述变量的分类:
(1)变量按其性质可分为连续变量和非连续变量。
连续变量表示在变量范围内可抽出某一范围的所有值,这种变量是连续的;非连续变量表示在变量数列中仅能取得固定值。
(2)变量又可分为定量变量和定性变量。
第二章:
试验资料的整理和特征数的计算
四、解释
(1)中位数:
将资料中所有观测数依大小顺序排列,居于中间位置的观测数。
(2)变异数:
反映变量分布离散性的特征数。
包括极差、方差、标准差和变异系数等。
3.变异系数:
样本标准差除以样本平平均数得出的比值。
五、简答题计量资料在整理成次数分布表时,一般采用组距式分组法
(1)答:
1)求全距;2)确定组数和组距;3)确定组限和组中值4)分组、编制次数分布表。
(2)算术平均数的特点和作用:
答:
特性:
1)离均差的总和等于0。
2)离均差的平方和最小。
作用:
1)指出一数据资料内变量的中心位置,标志着资料所代表性状的质量水平和数量水平。
2)作为样本或资料的代表数与其他资料进行比较。
(3)标准差的特性:
答:
1)标准差的大小受各观测数的影响,如果观测数与观测数间差异较大,其离均差也大,因而标准差也大,反之则小。
2)在计算标准差时,对各观测数加上或减去一个常数,其标准差不变,各观测数乘以或除以一个常数a,则所的标准差扩大或缩小了a倍。
3)在正态分布情况下,一个样本变量的分布情况可作如下估计,在平均数加减一个标准差范围内的观测数的个数约占观测数总个数的68.27%;在平均数加减两个标准差范围内的观测数的个数约占观测数总个数的95.46%;在平均数加减三个标准差范围内的观测数的个数约占观测数总个数的99.73%。
第三章:
概率与概率分布
(1)中心极限定理:
如果被抽样总体不是正态总体,单具有平均数μ和方差σ2,当随样本容量n的不断增大,样本平均数的分布也越来越接近正态分布,且具有平均数μ和方差。
(2)概率:
事件A在n次重复试验中发生了m次,当试验次数n不断增大时,事件A发生的频率W(A)就越来越接近某一确定值p,于是定义p为事件A发生的概率。
(3)和事件:
事件A和事件B至少有一件发生而构成的新事件称为事件A和事件B的和事件。
五、简答题
(1)查表计算:
1)0.1935 2)0.3930 3)0.05 4)0.25 5)0.05
(2):
某植物出现自然突变的概率为:
0.0024,试计算:
1)调查300株,获得两株或两株以上变异植株的概率是多少:
答:
P(0)= =1×× =0.4863
P
(1)= =300××=0.3510
P(x≥2)=1-P(0)-P
(1)=1-0.4863-0.3510=0.1627
2)期望中有0.99的概率获得一株或一株以上变异植株,应至少调查多少株:
P(0)=1-0.99=0.01
P(0)= =0.01
=0.01
nlg0.9976=lg0.01
n= = ≈1917(株)
因此,或得两株或两株以上变异植株的概率为0.1627;期望有0.99的概率获得1株或1株以上变异植株至少应调查1917株.
第四章:
统计推断
解释
(1)成组数据:
指两个样本的各个变量是从各自总体中抽取的,两个样本之间的变量没有任何关联,即两个抽样样本彼此独立.不论两样本的容量是否相同,所的数据皆为成组数据.
(2)小概率原理:
如果假设一些条件,并在假设的条件下能够准确的算出事件A出现的概率α为很小,则在假设条件下的n次重复试验中事件A将按预定的概率发生,而在一次试验中则几乎不可能发生。
(3)方差的同质性;:
就是指各总体的方差是相同的.
五、简答题
(1)假设检验的概念
答:
根据总体的理论分布和小概率原理,对未知或不完全知道的总体提出两种彼此对立的假
设,然后由样本的实际结果,经过一定的计算作出在一定意概率义上应该接受的那种假设的
推断.
(2)假设检验的步骤
答:
1)对样本所属总体提出无效假设H0和备择假设HA;
2)确定检验的显著水平α;
3)在H0正确的前提下,根据抽样分布的统计数,进行假设检验的概率计算.
4)根据概率显著水平α的临界值,进行差异是否显著的推断。
六、计算题
(1)研究饲料中添加植物油对动物肌肉中DHA的影响时,将动物配成5对,。
。
。
解:
1)假设H0:
μd=0,即添加植物油对动物肌肉中DHA含量无作用.,对HA:
μd≠0;
2)确定显著水平α=0.05
3)检验计算
=-0.12
sd2==0.037
==0.086…
t==-1.40
当df=5-1=4时, =2.776,可见,|t|<,P>0.05.
4)推断,接受H0,认为添加植物油对动物肌肉中DHA含量的作用未达到显著水平.
(2)优质中华鳖卵的平均重为5克,标准重为0.8克,从某种鳖场随机抽取鳖卵100枚,平均重为4.9g,问该厂的鳖卵是否属于优质:
解:
1)假设H0:
μ=μ0=5g,即该场鳖卵属于优质鳖卵。
对HA:
μ≠μ0;…
2)确定显著水平α=0.05;…
3)检验计算
==0.08…
u==-1.25…(2分)
4)推断:
=1.96,实得|u|< ,即P>0.05,则接受H0,认为该场鳖卵属于优质鳖卵。
…
(3)品种蛋鸡的卵平均为75g,某养鸡厂使用一新型饲料后欲知该饲料对蛋鸡的卵重是否产生作用,随机。
...解:
1)假设H0:
μ=μ0=75g,即该饲料没有显著提高蛋重。
对HA:
μ≠μ0;…
2)确定显著水平α=0.05…
3)检验计算
=76.2…
s==1.75…
=0.553…
t==2.17
当df=10-1=9时,=2.262.|t|<,P>0.05.
4)推断:
接受H0,认为该饲料没有显著提高蛋重。
(4)甲、乙两个邻近的养鸡厂同时患上了一种疾病,抽查甲鸡厂的50只中有29只患病 解:
1)假设H0:
p1=p2,即甲、乙两养鸡场鸡的患病率无显著区别.
对HA:
:
p1≠p2;
2) 确定显著水平α=0.05
3)检验计算
==0.58 ==0.42
=0.5 =0.5
=0.1
=1.4
当df=50+50-2=98时, =1.989。
|tc|<,P>0.05.
4)推断:
接受H0,认为甲、乙两养鸡场鸡的患病率无显著区别 。
离程度来计算χ2第五章 χ2检验
1. χ2检验:
适用于属性资料和计数资料等离散性变量的假设性检验,分成两种类型, 即适合性检验和独立性检验。
其基本原理是利用理论推算值和实际观测值之间的偏的大小。
2. 独立性检验:
研究两个或两个以上的属性资料或计数资料间是否相互独立或相互联系的假设性检验。
3. 适合性检验:
比较观测数与理论数是否符合的假设性检验叫适合性检验,又叫吻合性检验。
简答
1.简述χ2检验的主要步骤
(1)提出无效假设Ho:
观测值=理论值,对HA:
观测值≠理论值。
(2)确定显著水平α。
(3)根据Ho计算样本的χ2值。
(4)进行统计推断,若,则否定Ho,接受HA,表明在α显著标准下观测值与理论值时有差异的;若,则接受Ho,否定HA,表明在α显著标准下观测值与理论值差异不显著。
2.简述2乘2列联表的χ2检验
(1)提出无效假设Ho:
即A事件和B事件互为独立事件。
对HA:
A事件和B事件无关。
(2)给出显著水平α。
(3)根据Ho计算样本χ2值。
(4)计算自由度df,根据χ2α进行统计推断。
六、计算题:
1.经研究发现在28度的条件下,孵化出的乌龟性比为雌:
雄=1.5:
1,现取2000只乌龟卵在28度的条件下孵化,孵化率为100%,.....问这一结果同以往的规律是否相悖:
(1)Ho:
认为该结果符合1.5:
1的规律,对HA:
认为该结果不符合1.5:
1的规律。
(2)选取显著水平α=0.05。
(3)根据Ho计算样本χ2值。
由于df=k-1=1,所以需要用矫正公式计算。
在Ho正确的前提下计算雌雄的理论值:
雌性:
雄性:
(4)推断:
df=1,,即p<0.05。
应否定Ho,接受HA。
说明可能有其他因素影响了龟卵的孵化,不符合原由的规律。
2.对某妇产医院2001年出生的婴儿性别进行调查,在全部5200个......出生的婴儿性比是否:
解:
(1)Ho:
认为该结果符合1:
1的规律,对HA:
认为该结果不符合1:
1的规律。
(2)选取显著水平α=0.05。
(3)根据Ho计算样本χ2值。
由于df=k-1=1,所以需要用矫正公式计算。
在Ho正确的前提下计算男孩和女孩数的理论值:
男孩:
女孩:
(4)推断:
df=1,,即p>0.05。
应接受Ho,说明该妇产医院2001年所生婴儿性别比例符合1:
1的规律。
3.用红眼果蝇(纯合显性)和白眼果蝇(隐性)杂交,.....结果是否符合孟德尔3:
1的规律:
解:
(1)Ho:
认为该结果符合3:
1的规律,对HA:
认为该结果不符合3:
1的规律。
(2)选取显著水平α=0.05。
(3)根据Ho计算样本χ2值。
由于df=k-1=1,所以需要用矫正公式计算。
在Ho正确的前提下计算红眼和白眼果蝇数的理论值:
红眼果蝇:
白眼果蝇:
(4)推断:
df=1,,即p>0.05。
应接受Ho,说明该试验结果符合3:
1的遗传规律。
第六章 方差分析
名词:
多重比较:
明确不同处理平均数两两间差异的显著性,每个处理的平均数都要与其他的处理相比较,这种差异显著性检验叫多重比较。
方差分析:
是对多个样本平均数差异显著性检验的引申。
(又叫变量分析。
)
互作:
某一因素在另一因素的不同水平上所产生的效应不同,则两因素间存在交互作用,简称互作。
五、简答:
1.简述方差分析的基本步骤:
(1)将样本数据的总平方和和总自由度分解为各变异因素的平方和和自由度。
(2)列方差分析表进行F检验,以明确各个变异因素的重要程度。
(3)对各处理平均数进行多重比较。
2.简述新复极差检验(SSR检验)的步骤
(1)按相比较的样本容量计算平均数的标准差:
(2)查所具有的自由度dfe和比较所含平均数个数k时的表,算出各个M下的最小显著极差值。
(3)将各个平均数按大小顺序排列,用各个M值的值检验各个平均数间极差的显著性。
3.简述对试验数据进行方差分析的基本假定:
(1)正态性:
即试验误差应当是服从正态分布的独立的随机变量。
(2)可加性:
即处理效应与误差效应应该是可加的,这样试验的总变异可分解为各种原则所引起的变异,以确定各种变异在总变异中所占的比例,。
(3)方差的同质性:
即所有试验误差方差应具备同质性,误差异质将使假设检验中某些处理效应的得出不正确的结果。
第七章 抽样原理与方法
名词1.抽样调查:
就是采用科学方法,从所研究的总体中抽取一定数量的个体构成样本,通过对样本的调查研究,进而对总体作出推断的方法。
2.典型调查(抽样):
根据初步资料或经验判断,有意识、有目的地选取一个典型群体作为代表(即样本)进行调查记载,以估计整个总体,这种方法叫典型调查。
3.总单位编号:
就是将总体的所有抽样单位依其所处的自然位置或某种特征编排号码。
五、简答:
1.简述抽样方案制定主要考虑因素:
(1)抽样调查的目的和指标要具体化
(2)确定抽样对象,即化定要调查总体的范围
(3)确定抽样调查方法
(4)样本容量、抽样分数与经济合算问题
(5)总体单位编号
(6)编制抽样调查所需的各种表格
(7)作好抽样调查的组织工作
2.简述分层随机抽样的具体步骤:
(1)将总体按变异原因或程度划分成若干区层(可以是地段、地带、生物的一个品种等等),使各区层内变异尽可能小或变异原因相同,而区层间变异比较大或变异原因不同。
(2)在每个区层按一定的抽样分段独立随机抽样。
配置各区层应抽选抽样单位数的方法:
(1) 相等配置:
各区层抽样单位数相等,可采用相等配置。
(2) 比例配置:
各区层抽样单位数不等,可按相同的抽样分数,把要抽取的抽样单位总数分配到各区层。
(3) 最优配置:
根据各单位的抽样单位数、抽样误差和抽样费用,确定各区层应抽取的抽样单位。
3.简述抽样调查的基本方法及适用对象:
(1) 简单随机抽样,适用于个体间差异较小,所抽样本单位数较小的情况。
(2)分层随机抽样,适用于各抽样单位间差异明显而且面积较大以及分布不均匀的资料。
(3)顺序抽样,取样个体在总体中分布较均匀。
(4)整体抽样,适用于主要变异来源明显来自于地段内各单位间,每段所占面积较小。
(5)典型抽样,多用于大规模的社会经济调查。
4.简述整体抽样的优缺点:
1.由于一个群只要一个编号,因而减少了抽样单位编号数,且因调查单位数减少,工作方便;
2.与简单随机抽样相比,它常提供较为准确的总体估计值,特别是病虫害作物这类不均匀分布的研究对象,采用整体抽样更有利;
3.只要各群抽选单位相等,整体抽样也可提供总体平均数的无偏估计。
第八章 常用试验设计及其统计分析
1. 随机:
是指一个重复中某一处理或处理组合究竟安排在哪一个试验单位,不要有主观成见。
2. 拉丁方设计:
将k个不同符号排列成k列,使每一个符号在每一行、每一列仅出现一次的方阵,这种试验设计叫KK拉丁方设计。
3. 随机误差:
由于实验中许多无法控制的偶然因素所造成的实验结果和正式结果之间产生的误差,叫随机误差(又称偶然误差)。
1.简述试验误差来源主要有四个方面:
(1)试验材料固有的差异,是指试验中各处理的供试材料在其遗传和生长发育方面或多或少存在着差异。
(2) 试验条件不一致,是指各试验单位构成不一致和各试验单位所处的外部环境不一致。
(3) 操作技术不一致,是指试验操作过程中对各处理或处理组合的播种、管理、接种、滴定、采样等在时间和质量上存在的差异。
(4) 偶然因素的影响,是指人力无法控制的自然因素如风雨影响或人畜的践踏、病虫害的侵袭等的影响。
试验误差的控制途径:
1、 选择纯合一致的试验材料
2、 改进操作管理制度,使之标准化
3、 精心选择试验单位
4、 采用合理的试验设计
2.简述生物学试验的基本要求:
(一) 试验目的要明确
对试验的及其在生产和科研中的作用做到心中有数,既要抓眼前的关键问题,又要兼顾未来。
(二) 试验条件要有代表性
试验条件一定要满足要将此试验结果推广到的地区的生产、经济和自然条件,同时还要放眼未来,使试验结果有较长的利用价值。
(三) 试验结果要可靠
在试验条件一致的前提下,严格按试验要求及操作规程来执行各项技术,避免错误的发生,提高试验的精确度和准确度。
(四) 试验结果要能重演
在相同条件下,再进行试验或实践,应能获得与原试验结果相类似的结果。
3.简述正交试验的设计的特点:
是在试验的全部处理组合中,仅挑选部分有代表性的处理组合进行试验。
通过部分实施,了解全面试验情况,从中找出最优的处理组合。
正交试验基本方法:
(1) 确定试验因素和水平数
根据试验目的确定试验要研究因素,因素选好后定水平,各因素水平可以相等也可以不等。
(2) 选用合适的正交表
根据试验因素和水平数以及是否需要估计互作来选择合适的正交表。
其原则是既要能安排全部试验因素,又要使部分试验的水平组合数尽可能的少。
(3) 进行表头设计,列出试验方案
把试验中挑选的各因素添到正交表的表头各列。
表头设计好后,把该正交表中各列水平号换成各因素的具体水平就成为试验方案。
(4) 试验
按试验方案进行试验。
4.简述随机区组设计的优点:
(1) 设计简单,容易掌握;
(2) 富于弹性,单因素、多因素以及综合性的试验都可应用;
(3) 能提供无偏的误差估计,精确度较高。
(4) 对试验地的要求不严,必要时,不同区组可分散设置在不同地段上。
但区组内的地力条件要求尽量一致,同区组小区要靠近。
缺点在于:
这种设计不允许处理数太多,最多不超过20个,最好在10个左右。
第九章 直线回归和相关分析
名词1.回归系数:
回归直线的斜率叫做回归系数,其含义是自变量x增加一个单位,y平均增加或减少的单位数。
2.决定系数:
决定系数是相关系数r的平方,其含义是变量x引起y变异的回归平方和占y变异总平方和的比率,用于表示两个变量间的相关程度。
3.相关分析:
当两个变量是平行关系时,只能用相关分析来研究。
相关分析只能研究两个变量间的相关程度和性质,不能用一个变量的变化来预测另一个变量的变化。
4.乘机和SP:
表示变量x的离均差和y的离均差的乘积之和,简称乘积和,记作SP。
五、简答题:
1.进行直线回归分析时应符合那些基本条件:
(1) x是没有误差的固定变量;而y是随机变量,具有随机误差。
(2分)
(2) x的任一值都对应着一个y的总体,且呈正态分布。
(1分)
(3) 随机误差是相互独立的,且呈正态分布。
(1分)
2.简要分析回归和相关分析的联系和区别:
(1)当两个变量呈因果关系时,应用回归分析研究;
(2)当两个变量呈平行关系时,只能用相关分析研究;
(3)回归分析可以用一个变量的变化来预测另一个变量的变化,而相关分析只能研究两个变量间的相关程度和性质;
(4)二者不能截然分开,可以相互提供一些重要信息。
3.为避免统计方法的误用,在回归和相关分析中应注意哪些问题:
⑴回归和相关只能作为一种统计手段,变量间是否存在相关及相关的条件是由事物本身的规律决定的。
⑵在研究两个变量之间的关系时,要求其余变量尽量保持在同一水平。
⑶两个变量成对观测值应多一些,变量x的取值范围要尽可能大一些。
⑷回归和相关分析只适用于变量的一定取值区间。
六、计算题:
1.小白鼠出生后第六天起,每隔3天.....并对回归进行显著性检验:
解:
(一)求回归方程:
(1)由观测值计算6个一级数据
(2)由一级数据推算5个二级数据:
(3)计算回归系数b和截距a的值:
(4)列出回归方程:
(二)假设检验:
(1)计算回归平方和U和离回归平方和Q:
(2)F检验:
因为,所以,说明小白鼠体重和日龄间的直线关系不显著。
2.研究了乌龟对某中饲料的摄食率与消化率之间的关系,......并进行显著性检验。
(一)求回归方程:
(1)由观测值计算6个一级数据
(2)由一级数据推算5个二级数据:
(3)计算回归系数b和截距a的值:
(4)列出回归方程:
(二)假设检验:
(1)计算回归平方和U和离回归平方和Q:
(2)F检验:
因为,所以,说明稚鳖的摄食率(x)同消化率(y)之间存在极显著的直线关系。
第十章 可直线化的非线性回归
1.可直线化的非线形回归分析:
许多曲线可以通过数据转换转化成直线形式,所以可先利用直线回归方法配合直线回归方程,然后再转换成曲线回归方程,这种曲线回归方法成为可直线化的非线形回归分析。
第六章方差分析
1. 研究6种氮肥使用方法对小麦的效应,每种施肥方法种5盆小麦,完全随机设计,最后测定它们的含氮量,试分析6种施氮法植株含氮量是否存在显著差异性。
方差分析表
变异来源 df ss s2 F F0.05 F0.01
组间
组内 5 44.463 8.8926 164.07** 2.62 3.90
24 1.300 0.0542
总变异 29 45.763
实得F(5,24)=164.07>F0.01(5,24),说明6种施氮法植株含氮量存在极显著性差异,实际应用时注意选择。
2. 用三种方法分别测定同一湖泊中溶氧量,........这三种方法之间是否存在显著差异方差分析表
变异来源 df ss s2 F F0.05 F0.01
组间
组内 2 10.667 5.3335 2.630 4.26 8.02
9 18.25 2.028
总变异 11 28.917
实得F(2,9)=2.6303. 将12头猪随机分成四个实验组,每组投喂一种饲料,.....猪的体重是否具有显著差异 :
方差分析表
变异来源 df ss s2 F F0.05 F0.01
组间
组内 3 3383.33 1127.778 67.67** 4.07 7.59
8 133.34 16.667
总变异 11 24.917
实得F(3,8)=67.67〉F0.01(3,8),说明这四个实验组猪的体重具有极显著差异。
4. 观察成年鹿在不同年份的月摄食量,得到如下资料。
。
。
。
。
在不同月份摄食量是否存在显著差异方差分析表
变异来源 df ss s2 F F0.05 F0.01
组间
组内