方差分析.docx

上传人:b****6 文档编号:5636476 上传时间:2022-12-29 格式:DOCX 页数:12 大小:27.11KB
下载 相关 举报
方差分析.docx_第1页
第1页 / 共12页
方差分析.docx_第2页
第2页 / 共12页
方差分析.docx_第3页
第3页 / 共12页
方差分析.docx_第4页
第4页 / 共12页
方差分析.docx_第5页
第5页 / 共12页
点击查看更多>>
下载资源
资源描述

方差分析.docx

《方差分析.docx》由会员分享,可在线阅读,更多相关《方差分析.docx(12页珍藏版)》请在冰豆网上搜索。

方差分析.docx

方差分析

方差分析(AnalysisofVariance)

考虑以下情境:

一位研究者感兴趣影响儿童阅读能力的因素.研究者认为儿童的年龄和每次阅读时间可能是重要的影响因素。

研究者设计了以下实验:

选取三个年龄组的儿童:

3岁,8岁,和14岁.将每个年龄组的儿童随机分配到三个阅读条件.组1阅读时间为5分钟;组2为15分钟;对于组3为30分钟.两个星期之后测试了这些儿童的阅读能力。

阅读时间

5分钟

15分钟

30分钟

年龄

3岁

8岁

14岁

这个研究有3X3样本(即9个).如何分析数据?

t-检验和z-检验不能用于多于2组的数据.处理这类数据需要用一种新的推论统计程序:

方差分析(ANOVA).

ANOVA能够处理数据的类型:

在上例中有两个自变量(称为因素):

年龄和阅读时间.两个都是组间(独立样本)变量.ANOVA亦可用于分析包含组内(重复测量)因素的研究设计,同时包含组间和组内因素的混合设计(e.g.假设上例中我们用同一些儿童作纵向研究。

年龄是组内变量,阅读时间是组间变量).

在方差分析中,因素就是自变量.包含一个自变量的研究称为单因素设计(single-factordesign).具有多于一个自变量研究称为因素设计(factorialdesign).

构成因素的个别处理条件称为因素的水平.

上述研究称为因素设计,两个组间因素,每一个因素有3个水平(称为3X3组间设计).

最基本的ANOVA.集中讨论单因素,独立测量的研究设计.

1.ANOVA的逻辑

2.ANOVA的符号.

3.ANOVA的过程和例题

4.事后检验

1.ANOVA的逻辑

与假设检验的逻辑是同样的,只是具体内容有变化

step1:

陈述H0(和H1?

?

),确定标准:

α=?

step2:

ANOVA检验总是单尾

step3:

指出检验的df(有两个df)

step4:

查表找出临界F统计量

step5:

对于样本,计算F统计量

step6:

比较F统计量和临界F统计量

step7:

对于H0作出结论

单因素,独立测量研究设计的例子:

检验三个不同的学习方法的效应。

将学生随机分配到3个处理组

方法A:

让学生只读课本,不去上课.

方法B:

上课,记笔记,不读课本.

方法C:

不读课本,不去上课,只看别人的笔记

Step1:

陈述假设和设定标准(选择α)

H0:

μ1=μ2=μ3

H1:

其中一个组与另一个(或更多)的组均值不同。

备择假设可能的形式很多:

μ1不等于μ2=μ3

μ1=μ3不等于μ2

μ1=μ2不等于μ3

μ1不等于μ2不等于μ3

因此,只需给出虚无假设就够了

step2:

ANOVA检验总是单尾.因为不存在负的方差.F分布表也只有单侧的Alpha.(F分布图)

step3:

找出检验的df.注意要考虑几个df(

step4:

从表找出临界F统计量

分子的df

分母的df

1

2

3

4

5

1

161

4052

200

4999

216

5403

225

5625

230

5764

2

18.51

98.49

19.00

99.00

19.16

99.17

19.25

99.25

19.30

99.30

3

10.13

34.12

9.55

30.92

9.28

29.46

9.12

28.71

9.01

28.24

:

:

:

:

:

:

:

:

:

:

:

:

与t分布表类似,F分布表也是描述一族F分布.

需要用到两个df,用一个找出正确的行另一个找出正确的列.上面一行对应于α=0.05,下面一行对应于α=0.01.

step5:

计算样本的F统计量观测值

概念的水平的讨论:

ANOVA非常类似两个独立样本的t检验

tobs=得到的样本均值间差异

期望的机会差异

对于ANOVA检验统计量(称为F比率)类似

F=样本均值间方差(差异)

期望的机会(误差)方差(差异)

为什么用方差?

因为有多于两个组.

如何计算一个分数来描述差异间分布?

差异不能够分割,但是方差能够分割。

这就是ANOVA-方差分析名字的由来.

首先考虑方差的来源.

什么造成样本的不同(处理间变异)?

处理/组效应-处理造成的差异

个体差异效应-个体差异变异

随机误差

每一个样本内部的变异(处理内变异)

个体差异效应

随机误差

F比率可以表达为:

F比率=样本均值间的方差(差异)

期望的机会(误差)方差(差异)

F比率=处理间方差

处理内方差

F比率=处理效应+个体差异+随机误差

个体差异+随机误差

注意:

有时分母叫做误差部分,其量度了由于机会造成的方差

如果H0为真,处理效应的值应该如何?

H0:

μ1=μ2=μ3

如果没有差异,效应方差=0

如果效应方差=0,F比率值?

F比率=0+个体差异+随机误差=1=1.0

个体差异+随机误差1

如果H0为假,F比率应该大于1.

step6:

比较F统计量的观测值与临界F统计量

如果F统计量的观测值(Fobs)在统计上显著地大于1.0则拒绝H0

2.ANOVA的专用符号

K=处理条件(或组)的数目

n=每一个组的数目(如果它们相等)

ni=第i组的数目(如果它们不等)

N=∑ni=总的样本容量

Ti=∑Xij

G=∑Xij=总的和

G-bar=G/N=总的均值

SSi=每一个组的和方=∑(Xij-

i)2

在上例中:

研究方法

方法A

只读课本

方法B

只作笔记

方法C

借别人笔记

0

4

1

1

3

2

3

6

2

1

3

0

0

4

0

T1=5

T2=20

T3=5

SS1=6

SS2=6

SS3=4

n1=5

n2=5

n3=5

1=1

2=4

3=1

∑X2=106

G=30=总的和

N=15=总的样本容量

G-bar=30/15=2=总的均值

K=3=处理条件(或组)的数目

3.ANOVA的过程和例题

F比率=处理间方差

处理内方差

需要找出两个方差.

最基本公式s2=SS/df.

SS和=∑X2-(G2/N)

SS和=106-(302/15)=106-60=46

需要将其分解为组间变异和组内变异.

SS和=SS组间+SS组内

如何得到SS组内?

将每一个组SS相加

SSwithin=∑SS每一个处理内部=∑SSi

=6+6+4=16

如何得到SS组间?

快捷的方法是:

SS和-SS组内

⏹若数据足够,不推荐用这种方法,因为:

◆无法检查计算错误

◆未涉及SS组间是如何组成.

直接计算SS组间的两个公式:

定义公式和计算公式

定义公式

计算公式

SS间=∑[ni(

-G-bar)2]

SS间=∑(T2/ni)-G2/N

=5(1-2)2+5(4-2)2+5(1-2)2

=5+20+5

=30

=52/5+202/5+52/5-302/15

=5+80+5-60

=30

SS和=SS组间+SS组内=16+30=46

s2=SS/df.

已计算出SS,找出df:

共有两个(或三个)自由度,一个组间方差df,一个组内方差df(以及一个总的df).

df和=N-1

df组内==N-K

df组间=K-1

df和=df组内+df组间

在例子中:

df组内=15-3=12

df组间=3-1=2

df和=15-1=14,=12+2

现在计算方差.这里称为均方.

方差=均方=MS=SS/df

MS组间=SS组间/df组内

-->上例中=30/2=15

注意:

有时MS组间称为误差的均方.

MS组内=MS误差=误差的均方=SS组内/df组内

-->上例中=16/12=1.33

F比率=处理间方差=MS组间

处理内方差MSw组间

上例中的F比率是:

15/1.33=11.28

将结果总结到方差分析表中:

来源

SS

df

MS

处理间

30

2

15.0

F=11.28

处理内

16

12

1.33

总的

46

14

查F表确定Fcrit对假设作出结论

df组间=分子的df

df组内=分母的df(误差)

-->上例中:

df组内=12;df组间=2

分子的df

分母的df

1

2

3

4

5

1

161

4052

200

4999

216

5403

225

5625

230

5764

2

18.51

98.49

19.00

99.00

19.16

99.17

19.25

99.25

19.30

99.30

3

10.13

34.12

9.55

30.92

9.28

29.46

9.12

28.71

9.01

28.24

:

:

:

:

:

:

:

:

:

:

:

:

12

4.75

9.33

3.88

6.93

3.49

5.95

3.26

5.41

3.11

5.06

13

4.67

9.07

3.80

6.70

3.41

5.74

3.18

5.20

3.02

4.86

:

:

:

:

:

:

:

:

:

:

:

:

如果选择α=.05,Fcrit=3.88

如果选择α=.01,Fcrit=6.93

F比率的观测值11.28大于Fcrit.,所以拒绝H0(μ1=μ2=μ3).

报告结果

F(df组间,df组内)=Fobs,p

"单因素方差分析发现学习方法有显著的效应,F(2,12)=11.28,p<0.01."

注意:

电脑的结果输出会给出实际p-值.假设检验的逻辑是必须事前预设Alpha水平.如果选择了.01,就必须将其用于所有的检验.所以,如果有两个实验,电脑程序得到实验1的p值=.001,实验2的p-值=.01.它们都在统计上显著.假设检验是yes/no决策.上例中,结论都是YES.实验1的结果并不比实验2"更显著".

4.事后检验(Posthoctests)

ANOVA的结果是检验H0:

μ1=μ2=μ3,这是一个两点(拒绝/不拒绝)决策.并未提供哪个备择假设得到支持.也就是说,只知道一些组与其它组不同,但并知道差别在哪些组之间.

所以从ANOVA得到显著差异的结果(拒绝H0)后,一定要做作some事后检验.事后检验使我们能够比较各组,发现差异产生在什么地方.

事后检验就是比较每一个处理组与另一个处理组,一次比较两个.这称为成对比较.

在上例中,可以比较μ1与μ2,μ1与μ3,以及μ2与μ3.

这样的做法有没有问题?

每一个比较都是一个单独的假设检验,每一个都有犯I类错误的风险.所以,比较对数越多,作结论的风险越大。

即容易发现实际不存在的差异。

这称为实验导致的(experimentwise)alpha水平(或族系(familywise)误差)

αEW=1-(1-a)cc=比较对数

对于上述例子,如果选择α=0.05作3对比较

αEW=1-(1-a)c=1-(.95)3=1-.857=.143

I类错误的机会增加到14.7%而不再是5%,多数事后检验设计中都控制了实验导致误差.

这里介绍两个事后检验:

Tukey'sHSD检验(honestly差异显著性)检验和Scheff检验.

a)Tukey'sHSD检验

可以计算出单一的值确定处理均值间的最小差异,考查此差异在统计上是否显著.

此检验要求各组有相等的样本容量.

HSD=q*sqrt(MS组内/n)

q值可以从表中查出(附表6).需要用到K和df组内,以及αEW

在上例中(用αEW=.05):

HSD=q*sqrt(MS组内/n)=(3.77)sqrt(1.33/5)=(3.77)(.516)=1.94

比较1:

H0:

μ1=μ2

2-1=4.0-1.0=3.0

HSD=1.94<3.0,拒绝H0

比较2:

H0:

μ1=μ3

3-1=1.0-1.0=0.0

HSD=1.94>0.0,不能拒绝H0

比较3:

H0:

μ2=μ3

2-3=4.0-1.0=3.0

HSD=1.94<3.0,拒绝H0

所以B与A和C不同,而A与C没有差异

b)ScheffŽ检验

用F比率检验差异.这是最保守的检验(降低I类错误的风险,但增加II类错误的风险).特别适用于n不等的情况

重新计算MS组间,每次只检验一个比较.注意:

用整体的df组间和整体的MS组内.

研究方法

方法A

只读课本

方法B

只作笔记

方法C

借别人笔记

0

4

1

1

3

2

3

6

2

1

3

0

0

4

0

T1=5

T2=20

T3=5

SS1=6

SS2=6

SS3=4

n1=5

n2=5

n3=5

1=1

2=4

3=1

来源

SS

df

MS

处理间

30

2

15.0

F=11.28

处理内

16

12

1.33

总的

46

14

比较1:

H0:

μ1=μ2

SS组间==52/5+202/5-252/10=22.5

MS组间==22.5/2=11.25

MS组内==16/12=1.33

F比率=MS间=11.25/1.33=8.46MS组内

查F表.α=.05,Fcrit(2,12)=3.88

8.46>3.88,拒绝H0

比较2:

H0:

μ1=μ3

SS组间==+-=0

MS组间==0/2=0

MS组内==16/12=1.33

F比率=MS间=0/1.33=0MS组内

查F表.α=.05,Fcrit(2,12)=3.88

0<3.88,不能拒绝H0

比较3:

H0:

μ2=μ3

SS组间==52/5+202/5-252/10=22.5

MS组间==22.5/2=11.25

MS组内==16/12=1.33

F比率=MS间/MS组内=11.25/1.33=8.46

查F表.α=.05,Fcrit(2,12)=3.88

8.46>3.88,拒绝H0

注意:

与t-检验的关系

差异间独立样本t-检验与两个水平的单因素组间ANOVA有和区别?

没有.F比率=t2

差异间t-检验和ANOVA,t-检验是考察两个均值间的差异ANOVA是考察方差.如果只有两个组,t统计量的平方就是F统计量.

例:

一位研究者研究三种键盘设计。

记录了三组被试的错误次数:

键盘A:

04010

键盘B:

68542

键盘C:

65946

键盘类型对打字错误有无显著的影响?

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > PPT模板 > 商务科技

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1