生物统计学复习0625Word文档格式.docx
《生物统计学复习0625Word文档格式.docx》由会员分享,可在线阅读,更多相关《生物统计学复习0625Word文档格式.docx(18页珍藏版)》请在冰豆网上搜索。
9.方差分析的主要目的是比较(A)。
A、总体均数之间的差异性
B、样本均数之间的差异性
C、总体方差之间的差异性
D、总体变异系数之间的差异性
10.对于同一组资料,哪个指标没有考虑到每个观察值的变异(D)。
A、方差B、总体标准差C、变异系数D、四分位差
11.在统计分析中,最常用的反映变量集中趋势的统计数是(A)。
A、算术平均数B、几何平均数C、调和平均数D、众数
12.试验误差主要是由(D)的差异引起。
A、水平B、处理C、供试因素D、非试验因素
13.当Y~N(100,100)时,以样本容量
4抽得样本平均数大于110的概率(C)。
A、≈0.05B、≈0.10C、≈0.025D、≈0.01
14.若否定
,则(C)。
A、必犯
错误B、必犯
错误
C、犯
错误或不犯错误D、犯
错误或不犯错误
15.已知
,则
在区间[
]的概率为(A)。
A、0.95B、0.05C、0.01D、0.99
16.最小显著差数测验法又称为(a)。
A、LSD法B、SSR法C、q法D、T检验法
17.两个方差之间的差异显著性测验一般用(B)。
测验。
A、
B、
C、
D、
或
18.测验线性回归的显著性时,
遵循自由度为(B)。
的分布。
A、n-1B、n-2C、n-m-1D、n
19.成对比较的特点不包括(D)。
A、加强了试验控制B、可减小误差
C、不必考虑总体方差是否相等D、误差自由度大
20.由样本推断总体不可避免产生的误差称(B)。
A.系统误差B.随机误差C.主观误差D.操作误差
21.对一批棉花种子做发芽试验,抽样1000粒,得发芽种子880粒,若规定发芽率达90%为合格,这批种子是否合格的测验为(A)。
A、不显著B、显著C、极显著D、不好确定
22.两个方差比例的假设测验用(b)测验。
23.算术平均数的重要特性之一是离均差平方和(A)。
A、最小B、最大C、等于零D、接近零
24.正态分布曲线与横轴之间的总面积等于(D)。
25.累积频率分布指的是()的频率。
A、f(Y≤Y0)B、f(Y=Y0)C、f(Y≥Y0)D、f(Y<
Y0)
26.方差分析的主要目的是比较(A)。
27.在统计分析中,最常用的反映变数离散特征的统计数是(C)。
A、算术平均数B、几何平均数C、标准差D、变异系数
28.在统计学中,计算平均增长率用(B)。
A、算术平均数B、几何平均数C、调和平均数D、众数
29.完全随机设计、随机区组设计、拉丁方设计的总变异分别可分解成几(D)。
A、2,2,4B、2,3,3
C、2,2,2D、2,3,4
30连续性变数次数分布的组区间是(A)区间。
A、半闭半开B、半开半闭C、左右均开D、左右均闭
31.一个单因素试验不可用(D)试验设计方法。
A、完全随机B、随机区组C、拉丁方D、裂区
32.累积频率分布指的是()的频率。
33.可估计和减少试验误差的手段是(C)。
A、局部控制B、随机C、重复D、唯一差异原则
34.在一个平均数和方差均为100的正态总体中以样本容量10进行抽样,其样本平均数服从(D)分布。
A.N(100,1)B.N(10,10)C.N(0,10)D.N(100,10)
35.试验的误差主要由(D)引起。
A、水平B、处理C、唯一差异原则D、环境变异
36.假定我国大陆居民和台湾居民年龄方差相同。
现各自用随即抽样的方法抽取本国人口的0.5%计算平均年龄,则平均年龄的标准误(C)。
A、两者相等B、前者比后者大
C、前者比后者小D、不能确定
二、判断题(正确的打“√”,错误的打“×
”。
每小题1.5分,共计15分)
1.连续性变数在分组时的组距必须为整数。
(×
)
2.接受无效假设
不一定犯
错误。
(√)
3.事件A和事件B和事件的概率,等于事件A的概率与事件B的概率之和。
(√)
4.
分布的图形是左右对称的。
5.一个显著的相关或回归说明
和
的关系必为线性。
6.描述总体的特征数叫统计数。
(×
)
7.关于方差的假设测验均可用
8.成组比较分析时需要考虑两者的总体方差是否相等。
9.正态(
)分布的累积频率分布图是左右对称的。
(×
10.一元回归分析时,
。
11.二项分布的平均数为
,标准差为
(√)
12.关于方差的假设测验均可以用F测验。
13.一个显著的相关系数或回归系数说明
变数的关系必为线性关系。
14.在一组变量中,出现频率最多的观察值,称为中位数。
15.只要样本容量n>
30,我们通常就可以用正态分布计算一定区间概率的方法计算样本平均数或样本平均数差数在任何区间的概率。
(√)
16.一个显著的相关或回归都具有实践上的预测意义。
17.当否定一个真实假设时,我们就犯了第一类错误。
18.当正态分布u=1.96时,统计假设测验的右尾概率为0.01。
19.
分布的累积频率分布图是左右对称的。
20.χ2分布是一组随自由度变化的曲线系统,间断性的,用于间断性资料的假设测验。
21.精确性是指观测值与真值的接近成度。
22.一个试验是固定模型还是随机模型在进行方差分析时是有区别的。
(√)
23.在二因素完全随机化设计试验结果的方差分析中,误差项自由度为
(√)
24.二因素完全随机化试验设计下结果的方差分析可以按两向分组资料的方法进行处理。
25.随机区组试验只应用了随机和局部控制两个原则。
二、填空题(每小题1.5分,共计15分)
1.已知
]]的概率为
0.95
。
2.直线回归方差主要应用三个方面:
、和。
3.以7月10日为0,某昆虫日发生量遵循N(10,36),则该螟蛾发生的始盛日期为7月14日,盛末日期为7月26日。
4.水稻亚优二号的单株产量(克)为一正态分布,其总体方差为36,若以n=9抽样,要在
=0.05水平上否定
,则其接受区分别为[96.08,103.92]和>
=96.71。
5.根据遗传学原理,豌豆的红花纯合基因型和白花纯合基因型杂交后,在F2代白花植株出现的概率为0.25。
若一次试验中观测2株F2植株,则至少有一株为白花的概率为0.4375;
若希望有99%的把握获得1株和1株以上的白花植株,则F2需种植16株。
6.μ=0,σ2=1的正态分布,在区间[0,+∞]上的概率为0.5。
7.为了通过测定碘含量来预测地方性甲状腺肿的患病率,应选用回归分析。
8.一批玉米种子的发芽率为80%,若每穴播两粒种子,则每穴至少出一棵苗的概率为0.96;
若希望有0.99的概率保证每穴至少出一苗,每穴至少应播粒。
9.对于t分布来说,固定显著性水平的值,随着自由度的增大,t的临界值将会怎样减少。
10.为了测验两个样本所属的总体平均数有无显著差异,一般会因设计的不同分为成组比较
和成对比较两种。
11.常用的变量转换有反正弦转换、平方根转换和对数转换三种方式。
12.事件A、B互相独立,P(A)=0.3,P(B)=0.5,则P(AB)=0.15。
13.以黄色子叶、圆粒种子的豌豆与绿色子叶、皱粒种子的豌豆杂交,在F2代观察得“黄圆”315粒,“黄皱”101粒,“绿圆”108粒,“绿皱”32粒。
假设H0:
此结果符合9:
3:
1的理论比例,测验H0的χ2值为 0.47。
14.以7月31日为0,某水稻品种抽穗日发生量遵循N(15,36),则该水稻品种抽穗的始盛日期为:
8月9日,盛期为:
8月15日。
15.一个二因素试验,裂区设计,主区因素A具2个水平,副区因素B具5个水平,重复4次,则df(AB)=4。
16.记号为L8(27)的正交表,,其中“L”代表正交表;
括号内的底数“2”表示因素的水平数,括号内2的指数“7”表示有7列,用这张正交表最多可以安排7个2水平因素,合计试验。
17.试验设计的三大原则为重复、随机化和局部控制。
三、名词解释题(本大题共5小题,每小题3分,共计15分)
1.独立性检验:
是研究两个或两个以上因子彼此之间是相互独立的还是相互影响的一类统计方法。
2.样本平均数的标准误
3.中心极限定理:
假设被研究的随机变量Y,可以表示为许多相互(独立)的随机变量Yi的和。
那么,如果的Yi数量很
(大)
,而且每一个别的Yi对于Y所起的作用很(小),则可以被认为Y服从或近似地服从(正态)分布。
4.两尾测验:
假设检验的两个否定去分别位于分布的尾部,具有两个否定区的检验称~。
5.相关系数与决定系数相关系数:
通过计算来表示两个变量相关程度和性质的统计数。
决定系数:
相关系数r的平方称为~。
6.小概率原理:
一个事件如果发生的概率很小的话,那么它在一次试验中是几乎不可能发生的,但在多次重复试验中几乎是必然发生的,数学上称之小概率原理。
7.精确性和准确性精确性:
是对同一物体的重复观察值或估计值彼此之间的接近程度。
准确性:
是指观测值或估计值与真值的接近程度。
8.吻合度检验
9.样本与样本容量样本:
在实际工作中,研究总体时抽出的若干个体组成的单元称为样本。
样本容量:
样本中个体的数目称为样本容量。
10.F分布:
在正态总体中随机抽取两个样本,它们的均方比称F值,如果抽取许多样本可得到若干个F值,这些F值的分布称F分布。
11.χ2分布
12.t分:
T分布又称学生分布,是在正态总体中随机抽取一系列小样本,其标准化离差t值的分布称t
分布。
13.方差和标准差方差:
用样本容量n来除离均差平方和,得到平均的平方和,简称~。
标准差:
是一组数值自平均值分散开来的程度的一种测量观念。
14.总体和样本总体:
具有相同性质的个体所组成的集合。
样本:
研究中实际观测或调查的一部分个体称为样本.
15.参数和统计量参数:
从总体中计算所得的用以描述总体特征的数值,称为参数。
统计量:
是由样本计算所得是数值,它是描述样本特征的数量。
16.随机误差和系统误差随机误差:
试验过程中,由于各种无法控制的随机因素所引起统计量与参数之间的偏差,称之为随机误差。
系统误差:
是由于试验处理以外的其他条件明显不一致所产生的带有倾向性的或定向性的偏差。
17.概率和频率概率:
某事件A在n次重复试验中,发生了m次,当试验次数n不断增大时,事件A发生的频率W(A)越来越接近某一确定值p,于是定义p为事件A发生的概率。
频率:
单位时间内发生的次数,是描述发生频繁程度的量.
18.分布函数和概率密度函数分布函数:
设X是随机变量,对任意实数x,函数F(x)=P{X<
=x},-∞<
x<
+∞,称为X的分布函数。
概率密度函数:
对于随机变量X,如果存在一个定义(-∞,+∞)的非负函数f(x),对任一实数x,总有F(x)=P(X<
=x)=∫x-∞f(x)dx,X称连续型变量,f(x)为随机变量X的概率密度函数。
19.正态分布和标准正态分布正态分布:
是一种连续型随机变量的概率分布。
标准正态分布:
又称为u分布,是以0为均数、以1为标准差的正态分布,记为N(0,1)。
20.拉丁方设计:
是在行和列两个方向上都进行局部控制,使行、列两向皆完全区组或重复,是比随机区组设计多一个区组的设计。
21.实验设计:
为使获得的数据能准确可靠地反映事物的真实规律,在进行试验或调查之前,对整个试验或调查应做一个全面安排,这就是~。
四、简答题(每小题5分,共计25分)
1.简述参数和统计量的概念及两者的区别和联系。
答:
参数和统计量参数:
2.样本平均数、样本平均数差数的分布各有哪些特征?
P48P49
3.正态分布有什么基本特征?
P42有哪几个参数?
正态分布是具有两个参数μ和σ2的连续型随机变量的分布,第一参数μ是遵从正态分布的随机变量的均值,第二个参数σ2是此随机变量的方差,所以正态分布记作N(μ,σ2)。
检验的主要步骤是什么?
需要注意哪两个方面的问题?
x2检验的步骤为:
(1)提出无效假设H0:
观测值与理论值的差异由抽样误差引起即观测值=理论值
备择假设HA:
观测值与理论值的差值不等于0,即观测值≠理论值
(2)确定显著水平a.一般可确定为0.05或0.01
(3)计算样本的x2,求得各个理论次数Ei,并根据各实际次数Oi,代入公式,计算出样本的x2。
(4)进行统计推断
5.统计假设测验的几何意义是将统计数的分布分为两个区间,这两个区间分别指什么?
请加以图示。
6.简述方差分析的基本原理和主要步骤。
原理:
是将测量数据的总变异按照变异原因的不同分解为处理效应和误差效应,并作出其数量估计,从而确定试验处理对研究结果影响力的大小。
步骤:
(1)将样本数据的总平方和与自由度分解为各变异因素的平方和与自由度。
(2)列方差分析表进行F检验,分析各变异因素在总变异中的重要程度。
(3)若F检验显著,对各处理平均数进行多重比较。
7.根据所学内容简述统计方法的主要功用。
⑴提供了整理和描述数据的科学的方法;
⑵提供了由样本推论总体的科学的方法;
⑶提供了通过误差分析鉴定处理效应的科学的方法;
⑷提供了进行科学试验设计的一些重要的原则;
⑸提供了分析多个变数间相关密切程度的科学的方法。
8.一个变量的分布一般具有哪两大基本特征?
反映这两大特征的特征数有哪些?
9.什么t分布?
其主要特征是什么?
特征:
⑴t分布曲线是左右对称的,围绕平均数μ=0向两侧递降。
⑵t分布受自由度df=n-1的制约,每个自由度都有一天t分布曲线。
⑶和正态分布相比,t分布的顶部偏低,尾部偏高,自由度df>
=30时,其曲线就比较接近正态分布曲线,当df趋近无穷大时和正态分布曲线重合。
10.简述直线回归分析的基本假设。
P137
11.测验玉色和红色金鱼草杂交F2代的玉色株(O1)与粉色株(O2)及红色株(O3)的比例与期望比率1:
2:
1是否相符用什么方法?
如何进行?
12.什么叫假设检验?
简述统计假设测验的主要步骤。
假设检验是在总体理论分布和小概率原理基础上,通过提出假设、确定显著水平、计算统计数、作出推断等步骤来完成的在一定概率意义上的推断。
⑴提出假设
⑵确定显著水平
⑶计算统计数
(4)作出推断
13.什么是假设检验?
假设有哪两种?
其含义分别是什么?
14.简述次数分布的功用和制作次数分布表的基本步骤。
15.什么叫随机区组设计,简述其优缺点。
P175P176
16.简述实验设计的基本原则和主要作用。
试验设计有3项基本原则:
重复,随机和局部控制。
重复原则的主要作用是估计试验误差,降低试验误差;
随机原则的主要作用是提供无偏的试验误差估计。
局部控制原则的主要作用是降低试验误差。
总之,只有遵循重复,随机,局部控制3项基本原则的试验设计,才能由试验获得真实的处理效应和无偏的,最小的试验误差估计,从而对各处理间的比较得出可靠的结论来。
17.什么叫拉丁方设计?
简述其优缺点。
拉丁方设计:
(1)优点:
①拉丁方的行与列皆为配伍组,可用较少的重复次数获得较多的信息;
②双向误差控制,使观察单位更加区组化和均衡化,进一步减少实验误差,比配伍组设计优越。
(2)缺点:
①要求三因素的水平数相等且无交互作用。
虽然当三因素的水平数不等时,可以通过调整次要因素的水平数以满足设计的要求,但有时无法达到;
况且因素间可能存在交互作用,故在实际工作中有一定的局限性;
②当因素的水平数(γ)较少时,医.学教育网搜集整理易受偶然因素的影响。
18.常用的实验设计有哪几种?
这些方法适宜在什么情况下使用?
五、应用题(第1小题10分,第2小题15分,共计25分)
1.研究土壤中的NaCl含量(
,
)对植物单位叶面积干物重的影响,得到了相应的干物质重(
),并得到了以下的统计数:
试求:
(1)
(2)Q和U。
(3))r和
(4)测验该线性方程的显著性。
2.为了研究粒肥的增重效果,随机取5个样点喷施粒肥,得喷施后各样点小麦千粒重(克)为:
47,47,50,49,49;
另随机取同样条件下种植但未喷施粒肥的4个样点,得各样点小麦千粒重为:
35,40,38,39。
试测验喷施粒肥是否可以显著提高产量。
3.有一品种(分A1和A2两个水平)和施肥量(分B1和B2两个水平)的二因素试验,随机区组设计。
重复2次。
(1)已知
,试作方差分析,并解释所得结果。
(2)已知四个处理
、
的平均数依次为30、28、24、18,试用LSD法对不同处理平均数进行多重比较。
4.研究温度(X,C)与某一昆虫幼虫生长速率(Y)的关系,得有关统计数分别为:
(2)Q和U。
(3)
(4)r和
(5)测验该线性方程的显著性。
5.在甲、乙两地进行水牛体型调查,将体型按优、良、中、劣四个等级分类,其结果见下表,问两地水牛体型构成比是否相同。
优
良
中
劣
甲
10
60
乙
5
20
6.四个品系的家兔,每一种用兔7只,测定其不同室温下的血糖值,以每100mg血中含葡萄糖的毫克数表示,问各种家兔正常血糖值有无差异?
室温对家兔的血糖有无影响(多重比较不做要求)?
试验资料见下表:
品种
室温
35
30
25
15
Ⅰ
140
120
110
82
130
Ⅱ
160
100
83
Ⅲ
150
Ⅳ
74
7.为了考查菌种和温度对发酵产物的影响,从三种不同菌种和三种不同温度中选出最适宜的条件,设计了一个二因素试验,并得到发酵产物量(国际单位)结果如下表,请对该资料进行方差分析(可不进行多重比较)。
菌种A
温度B(℃)
B1(20)
B2(30)
B3(40)
A1
4.64.33.8
6.16.56.3
6.86.46.5
A2
6.36.76.4
3.43.63.8
4.03.93.8
A3
4.74.34.5
3.93.53.7
6.57.06.7