i第八章 单因素方差分析共28页.docx

上传人:b****6 文档编号:5683845 上传时间:2022-12-31 格式:DOCX 页数:26 大小:25.70KB
下载 相关 举报
i第八章 单因素方差分析共28页.docx_第1页
第1页 / 共26页
i第八章 单因素方差分析共28页.docx_第2页
第2页 / 共26页
i第八章 单因素方差分析共28页.docx_第3页
第3页 / 共26页
i第八章 单因素方差分析共28页.docx_第4页
第4页 / 共26页
i第八章 单因素方差分析共28页.docx_第5页
第5页 / 共26页
点击查看更多>>
下载资源
资源描述

i第八章 单因素方差分析共28页.docx

《i第八章 单因素方差分析共28页.docx》由会员分享,可在线阅读,更多相关《i第八章 单因素方差分析共28页.docx(26页珍藏版)》请在冰豆网上搜索。

i第八章 单因素方差分析共28页.docx

i第八章单因素方差分析共28页

幻灯片1

【例】调查了5个不同小麦品系的株高,结果如下。

试判断这5个品系的株高是否存在显著性差异。

5个小麦品系株高(cm)调查结果

株号

品系

1

2

3

4

5

平均数

64.6

65.3

64.8

66.0

65.8

326.5

65.3

64.5

65.3

64.6

63.7

63.9

322.0

64.4

67.8

66.3

67.1

66.8

68.5

336.5

67.3

71.8

72.1

70.0

69.1

71.0

354.0

70.8

69.2

68.2

69.8

68.3

67.5

343.0

68.6

幻灯片2

第八章单因素方差分析

One-factoranalysisofvariance

幻灯片3

本章内容

第一节方差分析简述

第二节固定效应模型

第三节随机效应模型

第四节多重比较

第五节方差分析应具备的条件

幻灯片4

第一节方差分析简述

一、方差分析的一般概念

1、概念

方差分析(analysisofvariance,ANOVA):

是同时判断多组数据平均数之间差异显著性的统计假设检验,是两组数据平均数差异显著性t检验的延伸。

ANOVA由英国统计学家R.A.Fisher首创,用于推断多个总体均数有无差异。

幻灯片5

单因素方差分析(一种方式分组的方差分析):

研究对象只包含一个因素(factor)的方差分析。

单因素实验:

实验只涉及一个因素,该因素有a个水平(处理),每个水平有n次实验重复,这样的实验称为单因素实验。

水平(level):

每个因素不同的处理(treatment)。

幻灯片6

方差分析

AnalysisofVariance(ANOVA)

因素也称为处理因素(factor)(名义分类变量),每一处理因素至少有两个水平(level)(也称“处理组”)。

一个因素(水平间独立)——单向方差分析

(第八章)

两个因素(水平间独立或相关)——双向方差分析

(第九章)

一个个体多个测量值——重复测量资料的方差分析

ANOVA与回归分析相结合——协方差分析

目的:

用这类资料的样本信息来推断各处理组间多个总体均数的差别有无统计学意义。

幻灯片7

【例】随机选取4窝动物,每窝中均有4只幼仔,称量每只幼仔的出生重,结果如下。

判断不同窝的动物出生重是否存在显著性差异。

4窝动物的出生重单位:

g

32.9

31.4

25.7

28.0

118.0

29.500

27.1

23.3

27.8

26.7

104.9

26.225

33.2

26.0

28.6

32.3

120.1

30.025

34.7

33.3

26.2

31.6

125.8

31.450

1

2

3

4

平均数

窝别

动物号

幻灯片8

2、单因素方差分析的数据格式:

yi1

yi2

yi3

yij

yin

Yi

ya1

ya2

ya3

yaj

yan

y31

y32

y33

y3j

y3n

y21

y22

y23

y2j

y2n

y11

y12

y13

y1j

y1n

1

2

3

j

n

平均数

Ya

Y3

Y2

Y1

幻灯片9

二、不同处理效应与不同模型

1、方差分析中每一观测值的描述

——线性统计模型

yij:

在第i水平下的第j次观测值;

μ:

总平均数,是对所有观测值的一个参数;

αi:

处理效应,是仅限于对第i次处理的一个参数;

εij:

随机误差成分。

幻灯片10

2、①固定效应:

由固定因素所引起的效应。

②固定因素:

所研究因素各个水平是经过特意选择的,这样的因素称为固定因素。

固定因素的水平可以严格地人为控制,在水平固定之后,它的效应值也是固定的。

③固定模型:

处理固定因素所用的模型。

在固定模型中,方差分析所得到的结论只适合于选定的那几个水平,不能将结论扩展到未加考虑的其它水平上。

幻灯片11

3、①随机效应:

由随机因素所引起的效应。

②随机因素:

所研究因素各个水平是从该因素水平总体中随机抽出的,这样的因素称为随机因素。

随机因素的水平是不能严格人为控制的,在水平确定之后,它的效应值并不固定。

③随机模型:

处理随机因素所用的模型。

在随机模型中,方差分析所得到的结论,可以推广到这个因素的所有水平上,是对水平总体的推断。

幻灯片12

第二节固定效应模型

一、线性统计模型

要检验a个处理效应的相等性,就要判断各αi是否为0。

H0:

α1=α2=……=αa=0

HA:

αi≠0(至少有1个i)

若接受H0,则不存在处理效应,每个观测值是由总平均数加上随机误差构成;

若拒绝H0,则存在处理效应,每个观测值是由总平均数、处理效应及误差三部分构成。

幻灯片13

处理间

(组间)变异

总变异

误差或处理内

(组内)变异

●总变异是测量值yij与总的均数间的差异。

●处理间变异是由处理效应引起的变异。

●处理内变异是由随机误差引起的变异。

用离均差平方和的平均(均方、方差)反映变异的大小

幻灯片14

二、平方和与自由度的分解

1.总平方和(totalsumofsquares,SST):

每个测量值与总平均数离差的平方和的总和,反应了一组数据总的变异程度。

计算公式为:

dfT=N-1=an-1

校正项(校正系数,correction):

幻灯片15

2.处理间平方和(sumofsquaresamongtreatments,SSA):

各个处理组的平均数与总平均数离差的平方和,SSA反映了各处理组均数的变异程度。

计算公式为:

dfA=a-1

(含有误差成分)

处理均方(treatmentmeansquare,MSA):

处理间平方和除以自由度。

幻灯片16

3.在同一处理组内虽然每个受试对象接受的处理相同,但观测值仍各不相同,这是由随机因素(误差)引起的。

误差平方和(errorsumofsquares,SSe)或称处理内平方和(sumofsquareswithintreatment):

各处理内部观测值与相应处理平均数离差的平方和,SSe反映了各处理组内观测值的变异程度。

计算公式为:

dfe=dfT-dfA=an-a

误差均方(errormeansquare,MSe):

误差平方和除以误差自由度。

MSe反映了随机因素所造成的

方差的大小。

幻灯片17

三种变异之间的关系

SST=SSA+SSe

dfT=dfA+dfe

处理内变异:

随机误差

处理间变异:

处理因素+随机误差

幻灯片18

One-FactorANOVA

PartitionsofTotalVariation

TotalVariationSST

VariationDuetoTreatmentSSB

VariationDuetoRandomSamplingSSW

●Commonlyreferredtoas:

●SumofSquaresWithin,or

●SumofSquaresError,or

●WithinGroupsVariation

●Commonlyreferredtoas:

●SumofSquaresAmong,or

●SumofSquaresBetween,or

●SumofSquaresModel,or

●AmongGroupsVariation

幻灯片19

均方差,均方(meansquare,MS)

幻灯片20

三、检验统计量F

做F单侧上尾检验

当F

α1=α2=……=αa=0,各处理平均数之间差异不显著,认为MSA与MSe差异不大,产生的变异是由随机误差造成的;

当F>Fα时,拒绝零假设,处理平均数间差异显著,MSA显著高于MSe,产生的变异是由处理因素造成的。

幻灯片21

F值与F分布

幻灯片22

四、方差分析表

单因素固定效应模型方差分析表

F

均方

自由度

平方和

变差来源

处理间

MSA/MSe

MSA

a-1

SSA

a(n-1)

MSe

误差或处理内

SSe

na-1

SST

总和

幻灯片23

五、方差分析的指导思想与基本原理

方差分析的指导思想:

是将所有测量值间的总变异按照其变异的来源分解为多个部分,然后进行比较,评价由某种因素所引起的变异是否具有统计学意义。

幻灯片24

方差分析的基本原理:

将总平方和分解为处理平方和和误差平方和,根据相应的自由度,得到相应的均方;

处理均方反映处理因素所造成的方差的大小,误差均方反映随机因素(误差)所造成的方差的大小;

处理均方除以误差均方反映处理效应的显著性。

幻灯片25

六、单因素方差分析与成组数据t检验的异同

单因素方差分析

成组数据t检验

相同

平均数差异显著性检验

平均数差异显著性检验

两个平均数差异的检验

多个平均数差异的分析

不同

利用平均数的差

利用平均数的方差

计算统计量t

计算统计量F

幻灯片26

七、实例

【例8.1】调查了5个不同小麦品系的株高,结果如下。

试判断这5个品系的株高是否存在显著性差异。

5个小麦品系株高(cm)调查结果

株号

品系

1

2

3

4

5

平均数

64.6

65.3

64.8

66.0

65.8

326.5

65.3

64.5

65.3

64.6

63.7

63.9

322.0

64.4

67.8

66.3

67.1

66.8

68.5

336.5

67.3

71.8

72.1

70.0

69.1

71.0

354.0

70.8

69.2

68.2

69.8

68.3

67.5

343.0

68.6

幻灯片27

解:

①列出方差分析计算表:

(编码法-65)

序号

品系

1

2

3

4

5

 

-0.4

0.3

-0.2

1.0

0.8

1.5

2.25

1.93

-0.5

0.3

-0.4

-1.3

-1.1

-3.0

9.00

3.4

2.8

1.3

2.1

1.8

3.5

11.5

132.25

29.43

6.8

7.1

5.0

4.1

6.0

29.0

841.00

174.46

4.2

3.2

4.8

3.3

2.5

18.0

324.00

68.06

 

总和

57.0

1308.50

277.28

②利用公式计算各项平方和:

幻灯片28

③列出方差分析表:

不同小麦品系株高方差分析表

F

均方

自由度

平方和

变差来源

42.23

32.94

0.78

4

20

131.74

15.58

品系间

误差

24

147.32

总和

﹡α=0.05

﹡﹡α=0.01

F4,20,0.05=2.866

F4,20,0.01=4.431

F>F0.01

④结论:

选定的5个不同小麦品系的株高差异极显著。

幻灯片29

下结论

注意:

当组数为2时,完全随机设计的方差分析结果与两样本均数比较的t检验结果等价,对同一资料,有:

幻灯片30

第三节随机效应模型

一、随机效应模型的方差分析

1、方差分析的程序与固定效应模型方差分析的程序一样。

2、随机效应模型方差分析所得结论适用于水平的总体,固定效应模型方差分析所得结论只适用于所选定的a个水平。

幻灯片31

二、实例

【例8.2】随机选取4窝动物,每窝中均有4只幼仔,称量每只幼仔的出生重,结果如下。

判断不同窝的动物出生重是否存在显著性差异。

4窝动物的出生重单位:

g

32.9

31.4

25.7

28.0

118.0

29.500

27.1

23.3

27.8

26.7

104.9

26.225

33.2

26.0

28.6

32.3

120.1

30.025

34.7

33.3

26.2

31.6

125.8

31.450

1

2

3

4

平均数

窝别

动物号

幻灯片32

解:

①列出方差分析计算表(-30):

总和

-11.2

265.66

185.36

2.9

1.4

-4.3

-2.0

-2.0

4.00

32.86

-2.9

-6.7

-2.2

-3.3

-15.1

228.01

69.03

3.2

-4.0

-1.4

2.3

0.1

0.01

33.49

4.7

3.3

-3.8

1.6

5.8

33.64

49.98

1

2

3

4

窝别

序号

②计算各项平方和:

幻灯片33

③列出方差分析表:

动物出生重方差分析表

15

147.32

总和

1.97

19.525

9.912

3

12

58.575

118.945

窝间

误差

F

均方

自由度

平方和

变差来源

﹡α=0.05

﹡﹡α=0.01

F3,12,0.05=3.49

F

④结论:

不同窝别动物的出生重没有显著差异。

幻灯片34

三、不等重复时平方和和自由度的计算

dfA=a-1

dfe=N-a

dfT=N-1

幻灯片35

第四节平均值之间的多重比较

接受H0(F

等,差异没有统计学意义。

——方差分析终止

拒绝H0,接受HA(F>Fα),表示各处理组均数

不全相等,差异有统计学意义。

哪两均数之间差异显著?

哪两均数之间差异不显著?

——需要进一步做多重比较

幻灯片36

多重比较(multiplecomparison):

经过方差分析,若结论是各处理均数差异显著(F>Fα,拒绝H0),则必须在各处理均数之间一对一对地做比较,以判断究竟在哪些对均数之间存在显著差异,哪些对之间没有显著差异,这种比较称为多重比较。

幻灯片37

累积Ⅰ类错误的概率为α’

当有k个均数需作两两比较时,比较的次数共有c==k!

/(2!

(k-2)!

)=k(k-1)/2

设每次检验所用Ⅰ类错误的概率水准为α,累积Ⅰ类错误的概率为α’,则在对同一实验资料进行c次检验时,在样本彼此独立的条件下,根据概率乘法原理,其累积Ⅰ类错误概率α’与c有下列关系:

α’=1-(1-α)c(8.6)

例如,设α=0.05,c=3(即k=3),其累积Ⅰ类错误的概率为α’=1-(1-0.05)3=1-(0.95)3=0.143

幻灯片38

一、最小显著差数(LeastSignificantDifference,LSD)法

1、最小显著差数法:

把任意两组数据平均数差的绝对值与LSD

比较,以判断不同组数据平均数差异显著性的多重比较方法。

2、LSD的公式推导:

成组数据t检验

当n1=n2

称为最小显著差数,记为LSD。

幻灯片39

3、LSD检验程序:

①计算LSD

②列表计算每一对平均数差的绝对值|dx|;

③|dy|>与LSD比较,得出结论。

当|dy|>LSD时,

该对平均数差异显著;否则差异不显著。

幻灯片40

二、Duncan多范围检验

Duncanmultiplerangetest

1、Duncan多范围检验程序:

①将需要比较的a个平均数依照从大到小的次序重新排列。

原始处理组号

平均数

重新排序号

12…a-1a

y1y2…ya-1ya

②计算每一对平均数间的差(大值-小值),列成表。

幻灯片41

③计算临界值Rk,列表。

不同对平均数的差有不同的临界值Rk。

rα(k,df)的值由附表9(多重比较中的Duncan表)查出。

df=a(n-1),是误差项自由度。

df

k

a(n-1)

2

3

a-1

a

r0.05Rk

r0.01Rk

k=2,3,…,a

k是相比较的两个平均数间包含的平均数的个数(包括这两个平均数),计算公式是两平均数下标的差加上1。

有a个平均数,有a-1个k值,需查出a-1个rα,分别乘以Sy,得到a-1个Rk值。

幻灯片42

④比较每一对平均数差与相应的Rk,

得出结论。

若平均数差大于相应的Rk,说明这一对平均数之间差异显著或者极显著,以符号“﹡”或“﹡﹡”表示;

若平均数差小于相应的Rk,说明这一对平均数之间差异不显著。

幻灯片43

2、实例

【例8.1】调查了5个小麦品系的株高,结果如下。

经方差分析判断这5个品系的株高存在显著性差异,试做多重比较分析。

5个小麦品系株高(cm)调查结果

株号

品系

1

2

3

4

5

平均数

64.6

65.3

64.8

66.0

65.8

326.5

65.3

64.5

65.3

64.6

63.7

63.9

322.0

64.4

67.8

66.3

67.1

66.8

68.5

336.5

67.3

71.8

72.1

70.0

69.1

71.0

354.0

70.8

69.2

68.2

69.8

68.3

67.5

343.0

68.6

幻灯片44

解:

①排序:

品系号

平均数

排序号

70.8

1

68.6

2

67.3

3

65.3

4

64.4

5

②求差:

5

4

3

2

1

2

3

4

6.4

4.2

2.9

0.9

5.5

3.3

2.0

3.5

1.3

2.2

③列表计算Rk:

2

3

4

5

20

Rk

r0.01

Rk

r0.05

k

df

1.588

1.667

1.710

1.738

4.02

4.22

4.33

4.40

1.165

1.225

1.256

1.284

2.95

3.10

3.18

3.25

④结论:

品系Ⅰ和Ⅱ间株高差异不显著,品系Ⅲ和Ⅴ间株高差异显著,其余各品系间株高差异极显著。

幻灯片45

二、SNK法

SNK(student-Newman-Keuls)法又称q检验,是根据q值的抽样分布作出统计推论(例8-1)。

1.将各组的平均值按由大到小的顺序排列:

顺序

(1)

(2)(3)(4)

平均值28.018.718.514.8

原组号BCAD

2.计算两个平均值之间的差值及组间跨度k,见表8-3第

(2)、(3)两列。

3.计算统计量q值

4.根据计算的q值及查附表6得到的q界值(p286),作出统计推断。

幻灯片46

附表6

幻灯片47

Bonferroni法的适用性

当比较次数不多时,Bonferroni法的效果较好。

但当比较次数较多(例如在10次以上)时,则由于其检验水准选择得过低,结论偏于保守。

幻灯片48

三、Tukey法

幻灯片49

第五节方差分析应具备的条件

一、方差分析应满足的三个条件

1、可加性:

每个处理效应和误差效应

是可加的;

2、正态性:

实验误差应当是服从正态

分布的独立随机变量;

3、方差齐性:

各处理的误差方差应具

备齐性。

幻灯片50

二、多个方差齐性检验

——Bartlett检验

1、Bartlett检验基本原理:

当a个随机样本是从独立正态总体中抽取时,可以计算出统计量K2。

当n=minni充分大时(n>3),K2的抽样分布非常接近于a-1自由度的x2分布。

幻灯片51

2、Bartlett检验程序:

①假设:

H0:

σ12=σ22=……=σa2

HA:

至少有两个σi2不相等

②计算检验统计量K2

当各处理样本含量相同时

③结论:

当K2>x2a-1,α时拒绝零假设,方差不齐,应做数据变换;否则,接受零假设,方差具有齐性。

幻灯片52

3、变换

①平方根变换

将每个观测值取其平方根,做方差齐性检验,若方差整齐,然后对平方根进行方差分析。

属于泊松分布的数据,常常需要采取平方根变换;当观测数值很小时,如有几个数小于10时,为了矫正,可以使用观测值加上1再取平方根的变换。

幻灯片53

②平方根反正弦变换

取每个观测值平方根的反正弦值,然后做方差分析。

适用于以百分数表示的二项分布数据。

⑴百分数的变化范围很大时,要使用反正弦变换,变换后的数据可以从附表10中查出;⑵百分数的变化范围在0%~20%,用平方根变换;⑶百分数的变化范围在80%~100%,先用100减去各百分数,然后做平方根变换;⑷百分数的变化范围在30%~70%,可以不做变换。

幻灯片54

③对数变换

取每个观测值对数值,然后做方差分析。

⑴大范围的正整数适用于对数变换;⑵对于一些小的数值,如小于10时,每一观测值都加上1再变换。

幻灯片55

三、方差分析总程序:

1、多个方差齐性检验——Bartlett检验

当K2>x2a-1,α时,方差不齐,应做数据变换;否则,方差具有齐性,可以进入方差分析程序。

2、方差分析

①列出方差分析计算表(编码法)

②利用公式计算各项平方和

FFα时表示各处理组均数差异显著需要进一步做多重比较。

③列出方差分析表

④结论

3、Duncan多范围检验

①排序

②求差

③计算Rk

④结论

4、得出结论,给予生物学解释

幻灯片56

第四节方差分析的假定条件和数据转换

一、方差分析的假定条件(上述条件与两均数比较的t检验的应用条件相同。

1.各处理组样本来自随机、独立的正态总体(D法、W法、卡方检验);

2.各处理组样本的总体方差相等(不等会增加I型错误的概率,影响方差分析结果的判断)

二、方差齐性检验

1.Bartlett检验法

2.Levene等

3.最大方差与最小方差之比<3,初步认为方差齐同。

幻灯片57

1.Bartlett检验法

幻灯片58

2.Levene检验法

将原样本观察值作离均差变换,或离均差平方变换,然后执行完全随机设计的方差分析,其检验结果用于判断方差是否齐性。

因为levene检验对原数据是否为正态不灵敏,所以比较稳健。

目前均推荐采用LEV

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 经管营销

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1