生物统计附实验设计明道绪第四版复习题及答案复习课程.docx
《生物统计附实验设计明道绪第四版复习题及答案复习课程.docx》由会员分享,可在线阅读,更多相关《生物统计附实验设计明道绪第四版复习题及答案复习课程.docx(12页珍藏版)》请在冰豆网上搜索。
生物统计附实验设计明道绪第四版复习题及答案复习课程
生物统计附实验设计(明道绪__第四版)复习题及答案
总体:
根据研究目的确定的研究对象的全体
个体:
总体中的一个研究单位
样本:
实际研究中的一类假象总体
样本含量:
样本中所包含的个体数目称为样本含量或大小
随机样本:
一类从总体中随机抽得到的具有代表性的样本
统计量:
由样本计算的特征数
参数:
由总体计算的特征数
精确性:
指在试验或调查中某一试验指标或性状的重复观察值彼此接近的程度
系统误差:
系统误差又叫做片面误差。
它是在一定的测量条件下,对同一个被测尺寸进行多次重复测量时,误差值的大小和符号(正值或负值)保持不变;或者在条件变化时,按一定规律变化的误差。
偶然误差:
一类由于偶然的或不确定的因素所造成的每一次测量值的无规则变化(涨落),叫做偶然误差,或随机误差。
连续性变数资料:
指用量测方式获得的数量性状资料
离散型变数资料:
指用计数方式获得的数量性状资料
算术平均数:
指资料中的各观测值的总和除以观测值个数所得的商,简称平均数或均数
平均数:
资料或代表数,主要包括算术平均数,中位数,众数,几何平均数及调和平均数
标准差:
是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。
方差:
度量总体(或样本)各变量间变异程度的参数(总体)或统计量(样本)。
离均差平方和:
样本各观测值变异程度大小的另一个统计数
试验:
在一定条件下对自然现象所进行的观察或试验统称为试验
随机事件:
随机试验的每一种可能结果
概率:
事件本身所固有的数量指标,不随人的主观意志而改变,人们称之为概率
小概率原理:
小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不可能原理
正态分布:
若连续性随机变量X的概率分布密度函数
,则X服从正态分布
标准正态分布:
我们把平均数u=0,σ2=1时,称为标准正态分布,记为N(0,1)
双侧概率:
我们把随机变量X在平均数u加减不同倍数标准差σ区间(u-kσ,u+kσ)之外,取值的概率称为双侧概率
单侧概率:
对应于两尾概率可以求得随机变量x小于小于u-kσ或大于u+kσ的概率
二项分布:
设随机变量x所有可能取得的值为0或正整数,且有P(ξ=K)=Cn(k)P(k)q(n-k),k=0,1,2….n,则称随机变量x服从n和p的二项分布
标准误:
反映样本平均数的抽样误差的大小的一种指标
t分布:
由于在实际工作中,往往σ是未知的,常用s作为σ的估计值,为了与u变换区别,称为t变换t=,统计量t值的分布称为t分布。
假设检验(显著性检验):
假设检验是数理统计学中根据一定假设条件由样本推断总体的一种方法。
t检验:
两总体方差未知但相同,用以两平均数之间差异显著性的检验。
无效假设:
被检验的假设,通过检验可能被否定,也可能未被否定。
备择假设:
是在无效假设被否定时准备接受的假设。
显著水平:
用来确定无效假设是否被否定的概率标准。
Ⅰ型错误:
把非真实差异错判为真实差异。
Ⅱ型错误:
把真实差异错判为非真实差异。
双侧检验(双尾检验):
利用两侧尾部的概率进行的检验。
单侧检验(单尾检验):
利用一侧尾部的概率进行的检验。
否定区:
接受区:
分位数:
又称百分位点。
若概率0
是指满足条件p(X>Za)=α的实数
配对设计:
是指先根据配对的要求将试验单位两两配对,然后将配对成子的两个实验单位随机分配到两个处理组中。
区间估计:
是指在一定概率保证下指出总体参数的可能范围。
置信区间:
是指在进行区间估计时所给出的可能范围。
置信度(置信概率):
是指在进行区间估计时所给出的概率保证。
方差分析:
实质上是关于观测值变异原因的数量分析。
试验指标:
用来衡量试验结果的好坏或处理效应的高低,在试验中具有测定的性状或观测的项目。
试验因素:
实验中所研究的影响试验指标的因素。
因素水平:
试验因素所处的某种特定状态或数量等级。
试验处理:
率先设计好的实施在试验单位上的具体项目。
试验单位:
在试验中能够接受不同试验处理的独立的试验载体。
多重比较:
统计学上指多个平均数两两之间的相互比较称为多重比较。
主效应:
由于因素水平的改变而引起试验指标观测值平均数的改变量称为主效应。
简单效应:
在某因素同一水平上,另一因素不同水平试验指标观测值之差称为简单效应。
交互作用:
在多因素试验中,一个因素的作用要受到另一个因素的影响,表现为某一因素在另一因素的不同水平上的简单效应不同。
适合性检验:
判断实际观察的属性类别分配是否符合已知属性类别分配理论或学说的假设检验。
独立性检验:
根据次数资料判断两类因子彼此相关或相互独立的假设检验。
相关变量:
存在相关关系的变量叫做相关变量。
回归分析:
是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。
相关分析:
研究随机变量之间相关性的统计分析方法。
直线回归分析:
如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为直线回归分析
直线相关分析:
对两个相关变量间的直线关系进行相关分析称为直线相关分析
决定系数:
在Y的总平方和中,由X引起的平方和所占的比例,记为r2(r的平方)
相关系数:
统计学上把决定系数r2的平方根称为x与y的相关系数
试验设计:
以概率论和数理统计为理论基础,经济地,科学地安排试验的一项技术。
试验方案:
叙述试验的背景、理论基础和目的,试验设计、方法和组织,包括统计学考虑、试验执行和完成的条件。
方案必须由参加试验的主要研究者、研究机构和申办者签章并注明日期。
唯一差异原则:
指除了试验处理不同外,其他所有条件应相同,以保证试验处理具有可比性
随机:
使用随机方法对试验动物分组,使参试动物分入各试验处理组的机会相等,以避免
试验动物分组事试验人员主观倾向的影响
重复:
试验的每一个处理都实施在两个或两个以上的试验单位上
局部条件一致原则:
在试验环境或试验差异较大的情况下,将试验环境或试验单位分成若干个小组,在小组内是非处理因素尽可能一致,实现试验条件的局部一致性
完全随机设计:
根据试验处理将全部试验动物随机分成若干组,然后再按组实施不同处理的设计
随机单位组设计:
同一单位组内各头试验动物的初始条件尽可能一致,不同单位组间试验动物的初始条件允许有差异
拉丁方设计:
从横行和直列两个方向进行局部控制,比随机单位组设计多一个单位租的设计
二、填空
1、生物统计分描述性统计和分析性统计。
描述性统计是指运用分类、制表、图形以及计算概括性数据(平均数、标准差等)来描述数据特征的各项活动。
分析性统计是进行数据观察、数据分析以及从中得出统计推断的各项活动。
2、统计分析的基本过程就是由样本推断总体的过程。
该样本是该总体的一部分。
3、由样本获取总体的过程叫抽样。
常用的抽样方法有随机抽样、顺序抽样、分等按比例抽样、整群抽样等。
4、样本平均数与总体平均数的差异叫抽样误差。
常用S/√N表示。
5、只有降低抽样误差才能提高试验结果的正确性。
试验结果的正确性包括准确性和精确性。
6、试验误差按来源分为系统误差(条件误差)和随机误差(偶然误差)。
系统误差(条件误差)影响试验结果的准确性,随机误差(偶然误差)影响试验结果的精确性。
7、系统误差(条件误差)可以控制,可通过合理的试验设计方法降低或消除。
随机误差(偶然误差)不可控制,可通过理论分布来研究其变异规律,或相对比较其出现的概率的大小。
8、样本推断总体分假设检验和区间估计两大内容。
常用的检验方法有t检验、F检验和卡方检验。
9、置信区间指在一定概率保证下总体平均数的可能范围。
10、t检验是通过样本平均数差值的大小来检验处理效应是否存在,两样本平均数的差值代表了试验的表观效应,它可能由处理效应(真实效应)和误差效应引起,要检验处理效应是否存在,常采用反证法。
此法先建立无效假设:
即假设处理效应不存在,样本平均数差值是由误差引起,根据差异在误差分布里出现的概率(即可能性大小的衡量)来判断无效假设是否成立。
11、判断无效假设是否成立的依据是小概率事件实际不可能原理,即假设检验的基本依据。
用来肯定和否定无效假设的小概率,我们称之为显著水平,通常记为α。
12、t检验通常适合两样本连续性(非间断性)随机变量资料的假设检验,当二项分布逼近正态分布时,百分数资料也可用t检验。
13、F检验也叫方差分析。
通常适合三个或三个以上样本连续性(非间断性)随机变量资料的假设检验。
顾名思义,F检验是用方差的变异规律(即F分布)来检验处理效应是否存在。
14、F检验是从总离均差平方和与自由度的剖分开始,将总变异剖分为组间变异和组内变异。
因为组间变异由处理效应和误差效应共同引起,组内变异由误差效应引起。
因而,将计算出的组间方差和组内方差进行比较,就可判断处理效应是否存在。
15、F检验显著或极显著说明组间处理效应存在,但并不能说明每两组间都存在差异,要知道每两组间是否有差异,必须进行多重比较,常采用的比较方法有最小显著差数法(LSD法)和最小显著极差法(LSR法),后一种方法又分为q法和新复极差法(SSR法)。
生物试验中常采用新复极差法(SSR法)。
16、两因素无重复观测值方差分析只能分析试验因素的简单效应和主效应,不能分析出互作效应,因此时计算的误差自由度为0。
当两因素有互作效应时,试验设计一定要在处理组(水平组合)内设立重复。
17、两因素有重复观察值方差分析,既可分析出两因素的主效应,还可分析出互作效应。
当互作效应显著存在时,可通过多重比较找出最佳水平组合。
18、35、多重比较的结果通常用字母表示,平均数右上角具有相同英文字母表示差异不显著,具有不同英文字母表示差异显著。
用小写英文字母表示差异显著,用大写英文字母表示差异极显著。
19、当二项分布接近于正态分布时,两次数资料样本的差异,可通过计算百分数,用t检验。
20、次数资料也可用
检验法进行假设检验,
检验可分为适合性检验和独立性检验。
21、独立性检验要先设计出联列表,然后用
检验,检验两因子是相互独立还是相互依赖,即两因子有无相关性。
22、
分布是随自由度变化的一簇曲线,任一曲线皆是连续的。
在次数资料的显著性检验中,当检验资料的自由度等于1时,算得的
值将有所偏大,因此应予以矫正,统计上称为连续性矫正。
23、独立性检验中,当某一单元格所计算的理论次数在5以下时,要进行相近单元格合并处理。
24、三种统计分析能得出两试验因素有无相关性的结论,它们是:
两因素有重复观测值方差分析,通过互作效应检验说明、独立性检验和相关回归分析。
25、假设检验差异显著或极显著,通常用“*”或“**”表示,说明:
有95%或99%的把握说明处理效应存在,但要犯5%或1%的Ⅰ型错误,即有5%或1%的可能将处理效应不存在判定为存在,或将非真实效应判定为真实效应。
26、假设检验差异不显著说明试验结果有两种可能:
一是真实效应的确不存在,二是由于犯Ⅱ型错误将真实性差异判定为非真实性差异,其可能性大小受显著水平α、样本平均数之间的差异、试验误差的大小有关。
27、假设检验的两个类型错误相互制约,处理好它们之间的矛盾的措施是加大样本含量、降低试验误差。
28、试验误差既影响样本观测值的准确性,又影响假设检验的可靠性,因而试验之前应采用合理的方法设计试验尽量减少或降低试验误差。
试验设计的基本原理是随机、重复、局部条件一致。
29、常采用的试验设计方法有:
完全随机试验设计、配对或随机单位组设计、拉丁方设计、交叉设计和正交试验设计。
30、完全随机试验设计只用随机和重复两个原理,适合样本变异不大时应用。
配对或随机单位组设计应用了试验设计的随机、重复和局部条件一致三个原理,可以降低试验误差,当样本变异较大时应用。
但组对和组单位组要求严格,不能勉强组对和组单位组。
31、正交试验设计适合多因子多水平试验设计。
32、试验计划的核心内容是试验方案、试验方法、样本含量的确定。
33、试验方案中各因素水平的设置常采用等差、等比和随机法确定。
34、多个处理(处理数为三或三以上时)比较试验中,各处理的重复数按误差自由度为12以上的原则来估计,因这以后临界F值减小的幅度已很小。
35、随机单位组单因素试验设计,试验结果的统计分析时,应将单位组看作一试验因子,采用两因素无重复观察值的方差分析。
36、两因素试验设计中,为了估计互作效应,降低误差效应,各处理组必须设立重复。
三、单项选择题
1、反映抽样误差的统计量是()A、标准差B、变异系数C、标准误D、均方
2、算术平均数的重要特性之一是离均差平方和()。
A、最小B、最大C、等于零D、接近零
3、在一个平均数和方差均为10的正态总体N(10,10)中,以样本容量10进行抽样,其样本平均数服从()分布。
A.N(10,1)B.N(0,10)C.N(0,1)D.N(10,10)
4、F检验后的最小显著差数多重比较检验法又可记为()。
A、
法B、
法C、
法D、
5、正态分布不具有下列()之特征。
A、左右对称B、单峰分布C、中间高、两头低D、概率处处相等
6、两个样本方差的差异显著性一般用()测验。
A、
B、
C、
D、
测验
7、一批种子的发芽率为75%,每穴播5粒,出苗数为4的概率()。
A、0.3955B、0.0146C、0.3087D、0.1681
8、方差分析基本假定中除可加性、正态性外,尚有()假定。
否则要对数据资料进行数据转换。
A、无偏性B、无互作C、同质性D、重演性
9、若否定
,则()。
A、犯
错误B、犯
错误
C、犯
错误或不犯错误D、犯
错误或不犯错误
10、系统误差与随机误差的区别在于。
()
A、系统误差主要是由测量仪器或方法偏差所造成的;而随机误差则是由偶然不可控的因素造成的
B、系统误差是不可以控制的,随机误差是可以避免的
C、在相同条件下,重复测量一动物体高的结果不尽一致的原因是由系统误差造成的
D、系统误差是不定向的,随机误差是定向的
11、科技论文中,如果同行两个平均数右上角有相同的大写字母,有不同的小写字母,表示两个平均数()。
A、差异不显著B、差异极显著C、差异显著D、不清楚
五、简答题:
1、假设检验的基本原理?
可从试验的表面差异与实验误差与试验误差(或抽样误差)的权衡比较中间接地推断试验的真实差异是否存在,这就是假设检验的基本思想
2、对于
个样本平均数,能否利用
或
测验进行两两独立比较?
为什么?
不能
一,检验工作量大二,无统一的试验误差,误差估计的精确性和检验的灵敏性低
三,推断的可靠性低,检验的I型错误率大
3、推导离均差之和等于0,离均差平方和最小?
4、如何提高试验的准确性与精确性?
5、如何控制、降低随机误差,避免系统误差?
答:
进行多次平行试验能控制和降低随机误差,虽然单次测量的随机误差没有规律,但多次测量的总体却服从统计规律,通过对测量数据的统计处理,能在理论上估计起对测量结果的影响。
只要试验工作做得精细,系统误差容易克服。
6、统计表与统计图有何用途?
常用统计图、统计表有哪些?
三线表的意义?
答:
统计表使用表格形式来表示数量关系,统计图是用几何图形来表示数量关系,可以把研究对象的特征、内部构成、相互关系等简明、形象的表达出来,便于比较分析
统计表:
简单表、复合表
统计图:
长条图、圆图、线图、直方图、折线图
7、为什么变异系数要与平均数、标准差配合使用?
答:
因为变异系数的大小,同时受到平均数和标准差两个统计数的影响,因而在利用变异系数表示资料的变异程度时,最好将平均数和标准差也列出
8、标准误与标准差有何联系与区别?
答:
标准差和标准误都是变异指标,但它们之间有区别,也有联系。
区别:
①概念不同;标准差是描述观察值(个体值)之间的变异程度;标准误是描述样本均数的抽样误差;②用途不同;标准差与均数结合估计参考值范围,计算变异系数,计算标准误等。
标准误用于估计参数的可信区间,进行假设检验等。
③它们与样本含量的关系不同:
当样本含量n足够大时,标准差趋向稳定;而标准误随n的增大而减小,甚至趋于0。
联系:
标准差,标准误均为变异指标,当样本含量不变时,标准误与标准差成正比。
9、样本平均数抽样总体与原始总体的两个参数间有何联系?
10、显著性检验的基本步骤是什么?
根据什么确定显著水平?
答:
基本步骤:
1,首先对试验样本所在作假设
2,在无效假设成立的前提下,构造合适的统计数,并研究试验所得统计数的抽样分布,计算无效假设正确的概率
3,根据“小概率事件实际不可能原理”否定或接受无效假设
在假设检验中,无效假设是否被否定的依据是“小概率事件不可能原理”。
11、均数差异显著性检验中,肯定和否定无效假设的依据是什么?
12、什么是统计推断?
为什么统计推断的结论有可能发生错误?
有哪两类错误?
如何降低犯两类错误的概率?
一:
统计推断是指根据样本和假定模型对总体作出的以概率形式表述的推断
二:
由试验的真实差异跟抽样误差引起的
三:
第一类错误:
把非真实差异错判为真实差异
第二类差异:
把真实差异错判为非真实差异
四:
适当样本含量
13、进行显著性检验应注意什么问题?
如何理解显著性检验结论中的“差异不显著”、“差异显著”、“差异极显著”?
答:
注意:
1,要有合理的试验或抽样设计,保证试验结果的可靠、正确、且处理间要有可比性。
2,选用的假设检验方法应符合其应用条件
3,要正确理解差异显著或极显著的统计意义
4,合理建立统计假设,正确计算检验统计数
“差异不显著”:
有两种可能:
一:
它们所在的总体平均数不相同,但被试验误差所掩盖,表现不出差异的显著性二:
它们所在的总体平均数的确无差异
“差异显著”或:
“差异极显著”:
表面上如此差异的不同样本来自同一总体的可能性小于0.05或0.01,已到达了可以认为它们所在的总体平均数不相同的显著水平。
但有些试验结果虽然差异大,但误差大,也许得不出“差异显著”的结论,而有些试验结果虽然差异小,但由于试验误差小,反而可能推断为“差异显著“
14、配对试验设计与非配对试验设计有何区别?
区别:
非配对试验设计是指当进行有两个处理的试验时,将试验单位随机分成两个组,然后对两组随机实施一个处理。
配对试验设计是先根据配对的要求将试验单位两两配对,然后将配对成子的两个试验单位随机分配到两个处理组中。
要求配对成子的两个试验单位的初始条件尽量一致,不同对子间试验单位的初始条件允许有差异
15、多个处理平均数间的相互比较为什么不宜用t检验法?
第一:
检验工作量大
第二:
无统一的试验误差
第三:
推断的可能性低检验的I型错误率大
16、推导总离均差平方和=组间离均差平方和+组内离均差平方和
17、为何要进行多重比较?
如何选用多重比较的方法?
答:
F值显著或极显著,否定了无效假设H0,表明实验的总差异主要来源于处理间的变异,实验中各处理平均数之间存在显著或极显著差异,但并不意味着每两个处理平均数间的差异都显著或极显著,也不能具体说明哪些处理平均数间有显著或极显著差异,哪些处理平均数间差异不显著。
因而,有必要进行两两平均数间的比较,以具体判断两两处理平均数间的差异显著性。
一般的讲,一个实验资料,究竟采用哪一种多重比较方法,主要应根据否定一个正确的H0和接受一个不正确的H0的相对重要性来决定。
如果否定正确的H0事关重大或后果严重的,或对实验要求严格时,用q法较稳妥;如果接受一个不正确的H0是事关重大或后果严重的,则宜用SSR法。
生物实验中,由于实验误差较大,常采用SSR法;F检验显著后,为了简便,也可采用LSD法。
18、在什么条件下方差分析之前要作数据转换?
常用的数据转换方法有哪几种?
各在什么条件下应用?
答:
分布的非正态性和方差的不同质经常相伴出现,对这类资料不能直接进行方差分析,而因考虑采用非参数方法分析或进行适当数据转换后再作方差分析。
常用的数据转换方法有三种:
平方根转换此法适用于各组均方与其平均数之间有某种比例关系的资料,尤其适用于总体呈泊松分布的资料。
对数转换如果各组数据的标准差或全距与其平均数大体成比例,或者效应为相乘性或非相加性。
反正弦转换反正弦转换也称角度转换。
此法适用于如发病率、感染率、病死率、受胎率等服从二项分布的资料
19、χ2检验与t检验、F检验在应用上有什么区别?
答:
t检验、F检验通常适用于数量性状资料的分析。
在畜牧、水产等科学研究中,除了
分析计量资料以外,还常常需要对次数资料、等级资料进行分析。
等级资料实际上也是一种次数资料,次数资料服从二项分布或多项分布,其统计分析方法不同于服从正态分布的计量资料,而是要用到次数资料分析-χ2检验。
20、适合性检验和独立性检验有何区别?
答:
独立性检验与适合性检验是两种不同的检验方法,主要区别如下:
1、研究目的不同:
适合性检验是判断实际观察的属性类别分配是否符合已知属性类别分配理论或学说,独立性检验是分析两类因子是相互独立还是彼此相关;
2、独立性检验的次数资料是按两因子属性类别进行归组。
根据两因子属性类别数的不同而构成2×2、2×c、r×c列联表(r为行因子的属性类别数,c为列因子的属性类别数)。
而适合性检验只按某一因子的属性类别将如性别、表现型等次数资料归组。
3、适合性检验按已知的属性分类理论或学说计算理论次数。
独立性检验在计算理论次数时没有现成的理论或学说可资利用,理论次数是在两因子相互独立的假设下进行计算。
4、在适合性检验中确定自由度时,只有一个约束条件:
各理论次数之和等于各实际次数之和,自由度为属性类别数减1。
而在r×c列联表的独立性检验中,共有rc个理论次数,但受到以下条件的约束:
a、rc个理论次数的总和等于个实际次数的总和;b、r个横行中的每一个横行理论次数总和等于该行实际次数的总和。
但由于r个横行实际次数之和的总和应等于rc个实际次数之和,因而独立的行约束条件只有r-1个;c、类似地,独立的列约束条件有c-1个。
因而在进行独立性检验时,自由度为rc-1-(r-1)-(c-1)=(r-1)(c-1),即等于(横行属性类别数-1)×(直列属性类别数-1)。
21.什么情况下χ2检验需作矫正?
如何矫正?
在对次数资料进行χ2检验利用连续型随机变量χ2分布计算概率时,常常偏低,特别是当自由度为1时偏差较大。
Yates(1934)提出了一个矫正公式,矫正后的值记为:
计算公式为:
当自由度大于1时,(7-1)式的χ2分布与连续型随机变量χ2分布相近似,这时,可不作连续性矫正,
但要求各组内的理论次数不小于5。
若某组的理论次数小于5,则应把它与其相邻的一组或几组合并,直到理论次数大于5为止。
7-1式为:
22、直线相关系数与回归系数的关系如何?
直线相关系数与配合回归直线有何关系?
相关变量x与y的相关系数r是y对x的回归系数与x对y的
相关系数xy的几何平均数: