生物统计学讲稿统计推断方差分析Word文件下载.docx

资源描述

生物统计学讲稿统计推断方差分析Word文件下载.docx

《生物统计学讲稿统计推断方差分析Word文件下载.docx》由会员分享，可在线阅读，更多相关《生物统计学讲稿统计推断方差分析Word文件下载.docx（15页珍藏版）》请在冰豆网上搜索。

生物统计学讲稿统计推断方差分析Word文件下载.docx

H0以外的可能的值，担心实验会出现的值，θ>

θ0希望实验出现的值，有某种特殊意义的值。

θ<

θ0

2、显著水平α：

α=0.05，α=0.01

3、两种类型的错误：

α，β

4、确定应使用的统计量：

u，t，χ2

5、建立在α水平上H0的拒绝域

6、对推断的解释

通过实例讲解下面两个问题：

二、对单个样本平均数的测验

1、在σ已知时，样本平均数的显著性测验-u检验

2、在σ未知时，样本平均数的显著性测验-t检验

通过实例详细讲解

三、单个样本变异性的检验----χ2检验

（一）、检验的程序

H0：

σ=σ0

σ≠σ0

σ>

σ0

（已知σ不可能小于σ0）

σ<

（已知σ不可能大于σ0）

2、显著水平

α=0.05，α=0.01

3、统计量χ2

4、H0的拒绝域：

5、作出结论，并给予生物学解释。

（二）、应用实例

复习思考题

1．在拒绝了零假设后，如何正确理解备择假设的可能性？

2．如何正确选择单位检验和双尾检验？

3．在确定显著水平时，应主要注意什么因素和事项？

第三节两个样本的差异显著性的检验

在进行单个样本的显著性测验时，我们必须提出有意义的H0：

θ=θ0。

这使得这种方法的应用受到了限制。

在实际应用时，人们常常选择两个样本，一个做为处理，一个作为对照，在这两个样本间进行比较。

例如比较两种分析方法，两种处理，两种药物，两种不同的物质，两种实验方法，两条公式等的差异，判断这种差异是否可以用偶然性来解释。

在进行两个样本的比较时，我们只要检验

θ1=θ2或H0：

θ1-θ2=0，而不必了解θ1与θ2究竟为何值。

一、两个样本方差比的检验----F检验（方差的齐性检验）

21、从两个正态总体N1（µ

1，σ1）

2和N2（µ

2，σ2）中分别以n1和

2n2为样本容量进行抽样，计算s1，

2和s2。

1与µ

2可以相等，也可

以不相等。

2、假设：

σ1=σ2

①σ1≠σ2

②σ1>

σ2（若已知σ1不可能小于σ2），

③σ1<

σ2（若已知σ1不可能大于σ2）

3、显著水平：

α=0.05或α=0.01

4、检验的统计量：

s12Fdf1,df2=2s2

5、建立H0的拒绝域：

6、作出生物学的解释。

（二）应用实例分析

二、两个样本平均数的差异显著性测验

（一）总体标准差（σi）已知时的平均数差异显著性测验----u检验

1、方法和程序

着重理解抽样分布的特点和检验的统计量：

u=（1-2）-（μ1-μ2）σ12n1+2σ2n2

2、应用实例

1．对单个样本的变异性和两个样本的变异性进行差异显著性测验时，使用的统计量是相同的吗？

为什么？

2．当总体标准差未知但为大样本，对两个样本的平均数进行差异显著性测验时，可以用什么方法进行检验？

（二）、总体标准差（σi）未知但相等时的平均数差异显著性测验

----成组数据的t检验（t-testforpooleddata）

1、方法和程序

I：

做方差的齐性检验，确定σ1与σ2是否相等。

（F检验）

II：

平均数的显著性测验（t检验）

检验的抽样分布规律及使用的统计量。

统计量为：

t=（1-2）-（μ1-μ2）

（n1-1）s12+（n2-1）s22⎛11⎫+⎪n1+n2-2⎝n1n2⎪⎭

为加深理解，多讲应用题。

四、总体方差未知且不相等时，两个样本平均数差异显著性的检

验——矫正自由度的t检验

1、抽样分布规律及检验的统计量：

统计量：

-t=12

2s12s2+n1n2检验的自由度：

s121n1dfc=2k=222k1-kss12++2、应用实例和说明df1df2n1n2课后习题及作业辅导。

1．为什么进行成组数据的t检验时，首先要进行方差的齐性检验？

2．当两个样本的方差不相等，进行平均数的t检验时，t分位数的自由度应该如何计算？

（四）、配对数据的显著性检验----配对数据的t检验

1、配对数据及配对实验设计：

将性质相同的供试个体配成一对，一共设置若干个配对的（两个试验处理相比较的）试验设计方式。

2、配对数据的来源：

若干同窝的两只动物，②田间试验相邻的两个小区，③植株相同部位的两片叶子，④同一个体施以某种处理前后的一对数值，等等，均可以配成一个对子。

3、配对数据检验的原理及程序

统计量的计算公式：

-μdt==ds4、配对数据试验设计的优点①可以控制试验误差，具有较高的精确性②不必假设两样本的总体方差σ1和σ2相同。

5、例题：

6、成组数据和配对数据的差别

非常重要，通过简单易懂的事例详细解释和说明。

小结：

单个样本、两个样本的平均数进行显著性测验时，测验的

基本程序和统计量得比较。

1．配对比较法与成组比较法有何不同？

在什么情况下使用配对法，什么情况下使用成组法？

如果按成组设计的试验，能不能把数字随机配成对，按成对法计算，为什么？

第六章参数的区间估计

第一节参数区间估计的概念

利用样本统计量，以一定的概率做保证，估计出参数可能在内的一个区间或范围，这个区间，就称为参数的置信区间；

区间的下限和上限称为参数的置信下限（L1）和置信上限（L2）；

保证参数在该区间的概率，一般以P=1-α表示，称为置信水平或置信度；

以上这种估计，就称为参数的区间估计。

第二节区间估计的原理

利用中心极限定理和抽样分布的规律进行推导。

第三节几种情况下参数的置信区间

一、µ

的区间估计

1、在σ为已知时，µ

的1-α置信区间：

2、在σ为未知时，µ

sL1,2=±

tα/2,n-1⋅n

二、平均数差（µ

1-µ

2）的置信区间

1、在σi为已知时，（µ

2）的1-α置信区间：

2σ12σ2L1,2=（1-2）±

uα/2⋅+n1n2

2、σi为未知但相等时，（µ

2⎛11⎫n1-1s12+n2-1s2L1,2=（1-2）±

tα/2⋅n+n⎪⎪n+n-2122⎭⎝1

3、σi为未知且不相等时，（µ

三、配对数据µ

d的1-α置信区间：

四、二项分布参数p的1-α置信区间：

1、利用正态分布进行近似的估计

2、利用二项分布p的置信区间表进行估计

五、σ的1-α置信区间：

六、标准差比σ1/σ2的1-α的置信区间：

第四节显著性测验和区间估计的关系

一、应用实例

二、显著性测验与区间估计的关系：

（1）对于假设“H0：

θ=θ0”：

若（L1，L2）包含θ0，则接受H0：

若（L1，L2）不包含θ0，且L1和L2均大于θ0，则拒绝H0：

θ=θ0，接受HA：

θ＞θ0。

若（L1，L2）不包含θ0，且L1和L2均小于θ0，则拒绝H0：

L1,2=±

uα/2⋅σn

θ＜θ0。

（2）对于假设：

2=0，

若（L1，L2）异号，则接受H0：

2=0。

若（L1，L2）同号，且L1＞0，L2＞0，则拒绝H0：

2=0，接受HA：

1-µ

2＞0。

若（L1，L2）同号，且L1＜0，L2＜0，则拒绝H0：

2＜0。

三、关于置信区间的长度

①与α有关，②与样本容量n有关。

加大样本容量，可以缩短置信区间的长度，使区间估计更可靠。

显著性测验与参数区间估计的关系？

第七章拟合优度检验

第一节拟合优度检验的一般原理

一、拟合优度检验的概念

（goodnessoffittest）是用来检验实际观测数与依照某种假设或模型计算出来的理论数之间的一致性，以便判断该假设或模型是否与观测数相配合。

拟合优度检验也有两种类型的错误。

二、检验的类型

第一种类型是检验观测数与理论数之间的一致性。

第二种类型是通过检验观测值与理论数之间的一致性来判断事件之间的独立性。

这两种类型的问题都使用了近似的χ2检验。

三、拟合优度检验的统计量----离散型数据的χ2

2k（Oi-Ti）2χ=∑Tii=1

但这种近似的检验是有条件的，即观察值总数不得少于30，

每种属性（或分组）的理论值不得少于5，否则，离散型数据的卡平方χ2与连续型数据的χ2的偏差就很大，这种检验的精度就不准了。

四、拟合优度检验的程序

1、根据属性性状对调查数据进行分组；

2、根据某种理论、模型或假定，以n为基础计算理论数Ti；

假设：

O=T，实测值与理论值相符，即试验结果符合某种理论、模型、假定；

HA：

O≠T，实测值与理论值不相符，即试验结果不符合某种理

论、模型或假定。

4、显著水平：

α=0.05，α=0.01

5、统计量的计算：

6、确定H0的拒绝域：

7、结论，生物学的解释。

第二节拟合优度检验

（适合性测验，吻合度检验）

一、适宜的对象：

按属性分组，每一分组的理论数Ti可以按照总体分布或某种理论、模型或假说等事先计算出来。

二、测验的目的：

通过实测值判断试验结果是否与某总体分布、某理论、模型或假说等相吻合。

三、自由度的确定：

df=k-1，其中k为属性性状的分组数，在例1中，按花色将大豆分成两组，则k=2，df=1。

四、应用实例：

1．拟合优度检验的统计量是如何确定的？

2．拟合优度检验的种类？

第三节独立性检验

一、适宜的对象

当实际观测值对应的理论数不能用某种理论、模型等进行计算，而需要从样本资料去推算时，所进行的χ2检验。

二、检验的目的

这种类型的检验是要通过检验观测值与理论数之间的一致性来判断事件之间的独立性，也就是要研究两个或两个以上的因子彼此之间是相互独立的还是相互影响的，研究不同试验处理的差异显著性。

三、理论数和自由度的确定

按照独立事件的概率乘法计算

四、应用实例

（一）、2×

2列联表的检验

（二）r×

c列联表的检验

（i行总数⨯j列总数）,df=（r-1）（c-1）Tij=总数

第四节2⨯2列联表的精确检验

一、精确的概率计算：

N！

（a+b）！

（c+d）！

（a+c）！

（b+d）！

！

P=！

=a+ba+cCN∙CNN！

a！

b！

c！

d！

二、应用实例

1．拟合优度检验的观察数据应该符合怎样的规定？

2．拟合优度检验的自由度应该如何计算？

3．R⨯C列连表独立性测验的理论数据应该如何确定？

4．精确的2⨯2列联表差异显著性测验时，为什么要将一个最小的非零数据在其它总和不变的条件下，依次降为零，然后再计算其发生的概率进行测验？

第八章方差（变量）分析

（Analysisofvariance，ANOVA）

方差分析是一类特定条件下的统计推断，或者说是平均数差异显著性测验的一种引申。

第一节方差分析的基本原理

方差或称均方，它是一个表示变异的量。

在一项实验或调查中，往往存在许多造成生物性状变异的因素。

这些因素中有主要的，有次要的，方差分析就是要将总变异分裂为各个变异因素引起的变异，并对其作出数量估计，从而发现各个因素在变异中所占的重要程度。

而且，在实验中，除了可以控制的实验因素造成的变异以外，剩余的变异可以提供实验误差准确无偏的估计，作为统计假设测验的依据。

通过具体实例讲解方差分析的原理及步骤。

一、平方和与自由度的分解

目的：

将总的自由度与总的平方和分解为各个变异因素引起的自由度与平方和，从而求出各个变异因素引起的方差。

推导公式。

二、F检验

在方差分析的体系中，F测验是用于测验某项变异因素的效应是否真实存在，所以在计算F值时，总是将要测验的那一项变异因素的方差做分子，而以另一项变异因素的方差做分母，在测验时，若分子的方差小于做分母的方差，则F<

1,此时，不必查表就可以确定P>

0.05，接受H0。

三、进行平均数的多重比较

1、最小显著差数法（LSD法）

在实验设计中有标准或对照的时候使用。

详细推导公式和讲解测验的程序。

得出方差分析的结论。

总结简化平方和与自由度分解、F检验的各条公式。

2、最小显著极差法（LSR法）

这种方法的特点是不同的平均数间的比较采用不同的显著差数标准，因而克服了LSD法的局限性。

可以用于平均数间的所有相互比较。

着重介绍秩次距和不同秩次距下LSR的计算方法。

①LSR法的使用前提。

②LSR法多重比较的程序。

se2LSRk=SSRα（k,df）⋅n

③应用实例

四、方差分析的基本假定

1、可加性

每个处理的效应与误差的效应是可加的，即

xij=μ+αi+εijα→处理效应，εij→误差效应，2、正态性i

试验误差εij是服从正态分布N（0，σ2）的独立随机变量。

若实验误差之间可能存在某种关联时，可以采用随机化的方法去破坏，例如取对数或取反正弦值等。

3、方差的齐性

各处理的误差方差应具备齐性，它们具有一个公共的总体方差σ2，一般以实验的误差方差Se2来作为σ2的点估计值。

五、两种不同的处理效应

（一）有关试验设计的几个概念

1、试验指标：

衡量试验结果的标准

2、试验因素：

就是影响试验指标的人为条件或措施

3、（因素）水平：

是对试验因素在质的方面或量的方面进行的分级

4、处理（组合）

（二）两种不同的处理效应

1、固定因素及固定效应模型

2、随机因素及随机效应模型

不同模型对结论的解释不同，随机模型的结论可以外延和扩展，固定模型的结论，不可以扩展，只在选定的水平内有效

1．为什么对多个样本平均数进行显著性测验时，方差分析的方法不会加大犯I性错误的概率？

2．进行多重比较时，最小显著差数法的统计学实质是什么？

在什么情况下可以使用？

3．LSR法多重比较的使用方法是什么？

有什么优点？

4．是否所有的数据都可以直接进行方差分析？

方差分析数据的基本假定是什么？

5．什么是实验指标？

什么是实验因素？

什么是因素的水平？

什么是实验处理（组合）？

6．如何判断实验因素的统计模型？

第二节单向分组资料的方差分析

一、单向分组资料的特点

二、组内重复观察值数相等的方差分析

实例分析，注意区分LSD法和LSR法的使用规则。

三、处理间重复数不等的方差分析

1．公式推导

dfT=∑ni-1

dft=k-1

dfe=∑（ni-1）

（∑x）2

SST=∑x-,∑ni2

Ti2SSt=∑-C,ni

2．实例分析，注意区分LSD法和LSR法的使用规则。

3．小结，课后习题提示，留作业

1．在单向分组资料里，组内重复观察值相等和不相等时的数据，进行方差分析时程序和公式有无差别？

2．可否舍弃一些实验数据，将组内重复观察值不等的实验数据化为重复观察值相等的数据，再按重复观察值相等的数据进行方差分析？

第九章两向分组资料的方差分析

（用于单因素试验和两因素试验）

第一节两因素方差分析中的一些基本概念

一、两项分组资料

二、模型的类型及交互作用的概念

（一）、模型的类型

1、固定模型

2、随机模型

3、混合模型

（二）交互作用

由于因素水平的改变而造成的因素效应值的改变，称因素的主效应。

在有交互作用的试验中，分析因素的交互作用比分析因素的主效应更重要。

交互作用简称互作。

第二节固定模型的方差分析

一、有重复试验时

（A、B间可能存在互作，事先不能确定）

1、数据处理（抽象数据）

2、方差分析（公式推导）

SST=∑x2-（∑x）/abn,C=（∑x）/abn22

2∑TABSSt=-C,n

SS=SS-SSeTt

2∑TASS=-C,Abn

∑TB2SSB=-C,an

AB=SSt-SSA+SSB

1．两因素实验的统计模型有几种？

如何判断？

2．在两向分组资料的实验数据中，处于任意位置的原始数据，是否可以与其他位置的原始数据互换位置？

3．什么是实验因素的主效应？

什么是实验因素的互作？

在两向分组资料数据进行方差分析时，为什么对互作的分析有时比对主效应的分析更显重要？

二、无重复试验时

应用前提：

A、B间无交互作用

1、平方和与自由度的分解

仔细讲解下列公式的推导过程：

SST=∑x2-（∑x）/ab,C=（∑x）/ab22

∑TA2SSA=-C,b∑TB2SSB=-C,a

SSe=SST-SSA-SSB

2、F检验

3sA

4、应用实例的详细解析。

2se,b=sB=2se,a

在什么情况下，进行两向分组资料的方差分析可以不用设置重复？

第三节缺失数据的估计

一、缺失估计的基本原理

采用最小平方和法，即取误差项平方和为最小值的方法

二、缺失一个数据的估计

a⋅TA+b⋅TB'

-T'

x=a-1b-1三、缺失两个数据的估计

缺失的两个数据最好不在同一因素的同一水平中

x=a⋅T'

A+b⋅T'

B-（T'

+y）a-1b-1y=a⋅T'

+x）

a-1b-1四、缺失数据资料的方差分析

缺失数据是按平方和最小的原则计算出来的，不是独立取值的随机变量，不占自由度。

缺失几个数据，总的自由度就减几，误差的自由度也应该减去几，其它项的自由度不变。

当把缺失的数据补齐后，按照一般方法进行方差分析。

第四节数据转换

一、平方根转换

1、数据的类型

数据为正整数，属于泊松分布的数据，μ=σ2

2、描述的现象（稀有现象）

单位面积的菌落数

一定区域内某种昆虫或某种植物数

放射性物质在单位时间内的放射次数

单位数量的种子中混有的杂草种子数，等等

3、转换的方法

xi→xi或xi→xi+1

二、对数转换

1、数据类型

若试验处理的效应值不是线性可加的，而是倍乘式的，则需要作数据转换。

数据表现为样本的方差与平均数的平方成正比时，需作对数转化

2、转化方法；

xi→logxi或xi→log（xi+1）

三、反正弦转换

符合二项分布的数据（百分数），μ=p，σ2=pq

平均数和方差有比例关系

2、转化的方法p→sin-1p

3、转化的范围

数据分布在0~30或70~100间需作反正弦转换

数据分布在30~70间不须转换

四、转换之后的方差分析

1．缺失数据估计的统计学原理和数学原理是什么？

2．单向分组资料的数据缺失时，为什么不进行缺失估计？

3．当实验数据缺失过多时，是否可以用缺失估计补足数据后继续进行方差分析？

缺失数据的自由度应如何计算？

4．说明方差分析的三个基本假定是什么？

若实验数据为百分数，且分布在0.7-1.0间，应对原始数据作何种处理，方可进行方差分析？

展开阅读全文