概率统计第九章 方差分析.docx

上传人:b****7 文档编号:25011258 上传时间:2023-06-03 格式:DOCX 页数:27 大小:176.17KB
下载 相关 举报
概率统计第九章 方差分析.docx_第1页
第1页 / 共27页
概率统计第九章 方差分析.docx_第2页
第2页 / 共27页
概率统计第九章 方差分析.docx_第3页
第3页 / 共27页
概率统计第九章 方差分析.docx_第4页
第4页 / 共27页
概率统计第九章 方差分析.docx_第5页
第5页 / 共27页
点击查看更多>>
下载资源
资源描述

概率统计第九章 方差分析.docx

《概率统计第九章 方差分析.docx》由会员分享,可在线阅读,更多相关《概率统计第九章 方差分析.docx(27页珍藏版)》请在冰豆网上搜索。

概率统计第九章 方差分析.docx

概率统计第九章方差分析

第九章方差分析

     本章要点

(1)   方差分析的概念;

(2)   单因素试验的方差分析原理和方法;

(3)   双因素无重复试验的方差分析原理和方法;

(4)   双因素等重复试验的方差分析原理和方法。

 基本要求

(1)   理解方差分析的概念;了解方差分析的原理

(2)   掌握单因素试验的方差分析原理和方法;

(3)   了解双因素无重复试验的方差分析方法;

(4)   了解双因素等重复试验的方差分析方法。

主要学习内容

9.1单因素试验的方差分析

9.2双因素无重复试验的方差分析

9.3双因素等重复试验的方差分析

9.1单因素试验的方差分析

     方差分析

在科学实验或生产实践中,任何事物总是受很多因素影响的.例如,工业产品的质量受原料、机器、人工等因素的影响。

农作物的产量受种子、肥料、土壤、水分、天气等因素的影响.利用试验数据,分析各个因素对该事物的影响是否显著,数理统计中所采用的一种有效方法就是方差分析.

     单因素试验的概念

为了分析某一个因素A对所考察的随机变量ξ的影响,我们可以在试验时让其它因素保持不变,而只让因素A改变,这样的试验叫做单因素试验,因素A所处的状态叫做水平.

     单因素试验的方差分析原理

设因素A有不同水平

各水平

对应的总体

服从正态分布

1,2;这里,我们假定各

有相同的标准差σ,但各总体均值

可能不同.例如,

可以是用l种不同工艺生产的电灯泡的使用寿命,或者是l个不同品种的小麦的单位面积产量,等等.

在水平

进行次试验1,2;我们假定所有的试验都是独立的.设得到样本观测值如下表:

水平

A1

A2

因为在水平

下的样本观测值

和总体服从相同的分布,所以有

(1,2)  (9.1)

我们的任务就是根据这l组观测值来检验因素A对试验结果的影响是否显著.如果因素A的影响不显著,则所有样本观测值

就可以看作是来自同一总体

因此要检验的原假设是

;(9.2)

.

当(9.2)成立时,各

则原假设(9.2)等价于

.

方差分析问题实质上是一个假设检验问题,下面探讨如何构造合适的统计量.

     方差分析统计量的构造

(1)定义

组内平均值总平均值

总离差平方和,组间平方和

误差平方和

反映各组样本之间的差异程度,即由于因素A的不同水平所引起的系统差异;反映各种随机因素引起的试验误差.

(2)几个重要结论

我们可以导出如下结论:

1)      

;         证明

2)      和是相互独立的;

3)      ;

4)      若H0成立,则,.

总离差平方和分解式的证明

即定义了 

  

现要证明:

证明因为   

 又因为   

 所以   

(3)构造F统计量

利用以上结论,定义:

组间平均平方和;误差平均平方和

考察统计量,它服从什么分布?

因为

,利用上面的结论及F分布的定义可知

       F~F

(1)

     方差分析的方法

如果因素A的各个水平对总体的影响差不多,则组间平方和较小,因而F也较小;反之,如果因素A的各个水平对总体的影响显著不同,则组间平方和较大,因而F也较大.由此可见,我们可以根据F值的大小来检验上述原假设H0.

对于给定的显著性水平α,由F分布表5查得相应的分位数

.如果由样本观测值计算得到的F的值大于

,则在水平α下拒绝原假设H0,即认为因素A的不同水平对总体有显著影响;如果F的值不大于

则接受H0,即认为因素A的不同水平对总体无显著影响.

通常分别取α=0.05和α=0.01,按F所满足的不同条件作出不同的判断:

条 件

显著性

F≤F0.05

不显著

F0.05

显著(可用“*”表示)

F>F0.01

高度显著(可用“**”表示)

通常还根据计算结果,列出如下方差分析表:

方差来源

平方和

自由度

均方和

F值

临界值

显著性

组间

误差

 

1

F0.05

F0.01

 

 总和

S

1

 

 

 

 

                             例1      例2

注:

有时为了简化计算,可把全部观察值减去或加上一个常数C,并不影响离差平方和的计算结果.

     例1

用四种不同的工艺生产电灯泡.从各种工艺生产的电灯泡中分别抽取样品,并测得样品的寿命(小时)如下:

工艺

A1

A2

A3

A4

1620

1670

1700

1750

1800

1580

1600

1640

1720

1460

1540

1620

1500

1550

1610

1680

试检验这四种工艺生产的电灯泡寿命是否有显著差异.

解为了化简计算,把全部观察值减去常数1500,再计算各离差平方和后可得方差分析表:

方差来源

平方和

自由度

均方和

F值

临界值

显著性

组间

误差

62820

61880

3

12

20940

5157

4.06

F0.05=3.49

F0.01=5.95

*

 总和

124700

15

 

 

 

 

其中n1=5,n2=4,n3=3,n4=4,4,16.因为4.06介于F0.05(3,12)和F0.01(3,12)之间,故可认为不同工艺生产的电灯泡寿命是有显著差异的.第一种工艺生产的电灯泡平均寿命为1708小时,明显比其它工艺生产的电灯泡平均寿命大,故应采纳此工艺.

     例2

对于高压电的电路网络,需要使用抗张强度较大而且均匀性较好的电缆.每一条电缆是由同样长度的导线12根合并而成.现在为了检验一批电缆所用导线的抗张强度是否来自同一正态总体,抽查了9条电缆的每一根导线的抗张强度,测试值()如下表所示(为了化简计算,全部测试值都减去了340)

 

电缆

A1

A2

A3

A4

A5

A6

A7

A8

A9

5

-13

-5

-2

-10

-6

-5

0

-3

2

-7

-5

-11

-13

-8

8

-3

-12

-12

-10

5

-6

-12

-10

0

-10

-15

-12

-2

-8

-5

0

-4

-1

-5

-11

-12

4

2

10

-5

-8

-12

0

-5

-3

-3

0

7

1

5

0

10

6

5

2

0

-1

-10

-2

1

0

-5

-4

-1

0

2

5

1

-2

6

7

-1

0

2

1

-4

2

7

5

1

0

-4

2

-1

0

7

5

10

8

1

2

-3

6

0

5

2

6

7

8

15

11

-7

7

10

7

8

1

试检验这9条电缆的抗张强度是否有显著差异.

解把9条电缆看作9个不同水平,同一条电缆中的12条导线的测试值可认为是在同一水平下作12次测试.此时,9,12(1,2,…),108.计算得

1924.3,2626.9

再列出方差分析表:

方差来源

平方和

自由度

均方和

F值

临界值

显著性

组间

误差

1924.3

2626.9

8

99

240.54

26.53

9.07

F0.05=2.03

F0.01=2.70

**

 总和

4551.2

107

 

 

 

 

因为9.07>2.700.01(8,99),故可认为这9条电缆的抗张强度有显著差异.

9.2双因素无重复试验的方差分析

     双因素试验的方差分析原理

如果我们要同时考虑两个因素A和B对所考察的随机变量ξ是否有影响的问题,则应讨论双因素试验的方差分析.

设因素A有不同水平

因素B有不同水平

,在它们的每一种搭配(,)下的总体

服从正态分布

1,21,2,….这里,我们假定各

有相同的标准差σ,但各总体均值

可能不同.所谓无重复试验就是因素A和B的每一种水平搭配(,)下仅取一个观察值.我们假定所有的试验都是独立的.全部样本观测值可用下表表示:

因素B

因素A

B1

B2

A1

A2

因为观测值

和总体

服从相同的分布,所以

   有

(1,21,2,…)  (9.24)

我们的任务就是根据这些观测值来检验因素A和B对试验结果的影响是否显著.令

显然有,,因此

可表示为   

     

若因素A或B的影响不显著,则其各水平的效应为零.要检验的原假设可分别设为

   

,      (9.33)

   

,     (9.34)

     方差分析统计量的构造

(1)定义

第i行平均值第j列平均值

总平均值,总离差平方和,

因素A的离差平方和,

因素B的离差平方和,

误差平方和

.

和分别反映因素A和B的不同水平所引起的系统差异;而则反映各种随机因素引起的试验误差.

(2)几个重要结论

我们可以导出如下结论:

1)      

;         

2)      、、是相互独立的;

3)      

4)      若H01成立,则,

5)      若H02成立,则.

(3)构造F统计量

利用以上结论,定义:

因素A的平均平方和;因素B的平均平方和;

误差平均平方和.

考察统计量,利用上面的结论及F分布的定义可知

    当H01成立时,(1,

(1)

(1)),

    当H02成立时,(1,

(1)

(1)).

 

     方差分析的方法

和单因素试验方差分析方法相仿,我们可以根据和的值的大小来检验上述原假设H01和H02。

对于给定的显著性水平α,由F分布表查得相应的分位数

.如果由样本观测值计算得到的F的值大于

则在水平α下拒绝原假设,即认为该因素的不同水平对总体有显著影响;如果F的值不大于

则接受原假设,即认为该因素的不同水平对总体无显著影响.

通常分别取α=0.05和α=0.01,按F所满足的不同条件作出不同的判断:

条 件

显著性

F≤F0.05

不显著

F0.05

显著(可用“*”表示)

F>F0.01

高度显著(可用“**”表示)

通常还根据计算结果,列出如下方差分析表:

方差来源

平方和

自由度

均方和

F值

临界值

显著性

因素A

1

0.05

0.01

 

因素B

1

0.05

0.01

 

误差

(1)

(1)

 

总和

S

1

 

 

例3         例4

注:

有时为了简化计算,可把全部观察值减去或加上一个常数C,并不影响离差平方和的计算结果.

 

     例3

四个工人分别操作三台机器各一天,日产量如下表:

机器

工人

B1

B2

B3

A1

A2

A3

A4

50

47

48

53

60

55

52

57

55

42

44

49

试检验工人和机器对产品的产量是否有显著影响.

解先计算出

再计算出各离差平方和314, 114,158, 42.

然后可得方差分析表:

方差来源

平方和

自由度

均方和

F值

临界值

显著性

因素A

(工人)

114

3

38

5.43

0.05=4.76

0.01=9.78

*

因素B

(机器)

158

2

79

11.29

0.05=5.14

0.01=10.9

**

误差

42

6

7

 

总和

314

11

 

从上表可见,工人的操作技术对产量有显著影响,而机器的不同对产量有特别显著的影响.再从第1行均值

大于其它行的均值,可认为工人A1操作技术显著地好.从第2行均值

大于其它列的均值,可认为机器B2的产量特别显著地高.

     例4

为了解3种不同配比的饲料对仔猪生长影响的差异,对3种不同品种的猪各选3头进行试验,分别测得其3个月体重增加量如下表所示.假定其体重增长量服从正态分布,且各种配比的方差相等.试分析不同饲料和不同品种对猪的长有无显著影响.

品种

饲料

B1

B2

B3

A1

A2

A3

51

53

52

56

57

58

45

49

47

解先将全部数据减去50,再计算出各离差平方和

162, 26/3, 150, 10/3.

然后可得方差分析表:

方差来源

平方和

自由度

均方和

F值

临界值

显著性

因素A

(饲料)

26/3

2

13/3

5.2

0.05=6.94

0.01=18

 

因素B

(品种)

150

2

75

90

0.05=6.94

0.01=18

**

误差

10/3

4

5/6

 

总和

162

8

 

从上表可见,5.2<0.05=6.94,说明几种不同的饲料对猪体重的增加无显著影响,而90>0.01=18,说明品种的差异对的猪的体重的增加的影响特别显著.

9.3双因素等重复试验的方差分析

     交互作用的概念

交互作用两个因素A和B的各个水平之间的不同搭配对试验结果的影响.

例5某化工厂为了掌握不同的催化剂量(毫升)、不同的聚合时间(小时)和不同的聚合温度()对合成橡胶生产中转化率(%)的影响规律,做了两批试验,结果如下:

聚合时间

催化剂量

0.5

1

 

聚合温度

催化剂量

30

50

2

4

84.20

89.34

88.83

94.25

2

4

87.6

84.8

75.5

96.2

从左上表可见,催化剂量对转化率的影响和聚合时间长短无关,聚合时间对转化率的影响也和催化剂量大小无关,从而催化剂量和聚合时间之间不存在交互作用.

从右上表可见,当催化剂量为2毫升时,聚合温度低则转化率就高;而当催化剂量为4毫升时,聚合温度高就转化率高。

这说明催化剂量对转化率的影响和聚合温度有关,同理,聚合温度对转化率的影响也和催化剂量有关,从而催化剂量和聚合温度之间存在交互作用.

     考虑交互作用时的双因素等重复试验的方差分析原理

因素A和因素B的交互作用记为

或简记为I.为了分析这种交互作用,对于它们的每一种搭配(,)(1,2,…1,2,…)需要分别进行r≥2次重复试验,即共需进行次试验.

设搭配(,)下的总体

服从正态分布

1,21,2,….这里,我们假定各

有相同的标准差σ,但各总体均值

可能不同.我们假定所有的试验都是独立的.全部样本观测值(1,2,…l;1,2,…1,2,…)可用下表表示:

因素B

因素A

B1

B2

A1

因为观测值和总体

服从相同的分布,

所以有

(1,21,2,…1,2,…)  (9.56)

我们的任务就是根据这些观测值来检验因素A、B及其交互作用

对试验结果的影响是否显著.

我们仍沿用第二节的符号,再定义和对试验结果的交互效应为

    

,(1,21,2,…)

则  

,(1,21,2,…)

且易证 .

我们要检验因素A、B及其交互作用

对试验结果的影响是否显著.

相当于检验原假设:

,(1,21,2,…)

     方差分析统计量的构造

(1)定义

      

 总平均值,总离差平方和

 因素A的离差平方和

 因素B的离差平方和,

 交互作用的离差平方和

.

 误差平方和

.

和分别反映因素A和B的不同水平所引起的系统差异;反映因素A和B的不同水平搭配所引起的系统差异;而则反映各种随机因素引起的试验误差.

(2)几个重要结论

我们可以导出如下结论:

1)      

;         

2)      、、、是相互独立的;

3)      ;

4)      若H01成立,则,

5)      若H02成立,则.

6)      若H03成立,则

.

(3)构造F统计量

利用以上结论,定义:

  因素A的均方和;因素B的均方和;

  交互作用均方和;误差均方和.

考察统计量

,利用上面的结论及F分布的定义可知

  当H01成立时,(1

(1)),  

  当H02成立时,(1

(1)).

  当H03成立时,(

(1)

(1)

(1)).

     方差分析的方法

我们可以根据、和的值的大小来检验上述原假设H01、H02和H03。

对于给定的显著性水平α,由F分布表查得相应的分位数

. 通过比较F的值和

的大小,判断该因素的不同水平对总体有没有显著影响.

通常分别取α=0.05和α=0.01,按F所满足的不同条件作出不同的判断:

条 件

显著性

F≤F0.05

不显著

F0.05

显著(可用“*”表示)

F>F0.01

高度显著(可用“**”表示)

通常还根据计算结果,列出如下方差分析表:

方差来源

平方和

自由度

均方和

F值

临界值

显著性

因素A

1

0.05

0.01

 

因素B

1

0.05

0.01

 

交互作用I

(1)

(1)

0.05

0.01

 

误差

(1)

 

总和

S

1

 

                      例6         例7

注:

有时为了简化计算,可把全部观察值减去或加上一个常数C,并不影响离差平方和的计算结果.

     例6

四个工人分别操作三台机器各两天,日产量如下表:

机器

工人

B1

B2

B3

A1

A2

A3

A4

42,45

46,51

48,53

42,45

43,49

46,52

44,49

53,56

43,48

52,56

41,44

45,47

试检验工人、机器和交互作用对产品的产量是否有显著影响.

解先计算出平均值

如下表

机器

工人

B1

B2

B3

A1

A2

A3

A4

43.5

48.5

50.5

43.5

46.0

49.0

46.5

54.5

45.5

54.0

42.5

46.0

45.0

50.5

46.5

48.0

46.5

49.0

47.0

 

再计算出各离差平方和

S=454, =99,  =28, =213,  =114.

然后可得方差分析表:

方差来源

平方和

自由度

均方和

F值

临界值

显著性

工人

99

3

33

3.47

0.05=3.49

 

机器

28

2

14

1.47

0.05=3.89

 

交互作用

213

6

35.5

3.74

0.05=3.0

0.01=4.82

*

误差

114

12

9.5

 

总和

454

23

 

从上表可见,工人的操作技术和机器各自对产量无显著影响,而两者的交互作用却对产量有显著的影响.由于

明显大于其它

的值,故可认为工人A4操作机器B2和工人A2操作机器B3都十分得心应手,产量显著地高.

     例7

一种火箭使用4种燃料和3种推进器作射程试验,每种燃料和每种推进器作了2次试验,得射程()如下表:

推进器

燃料

B1

B2

B3

A1

A2

A3

A4

58.2,52.6

49.1,42.8

60.1,58.3

75.8,71.5

56.2,41.2

54.1,50.5

70.9,73.2

58.2,51.0

65.3,60.8

51.6,48.4

39.2,40.7

48.7,41.4

试检验燃料、推进器及其交互作用对火箭的射程是否有显著影响.

解计算出方差分析表:

方差来源

平方和

自由度

均方和

F值

临界值

显著性

燃料

261.68

3

87.23

4.42

0.05=3.49

0.01=5.95

*

推进器

370.98

2

185.49

9.39

0.05=3.89

0.01=6.93

**

交互作用

1768.66

6

294.78

14.93

0.05=3.0

0.01=4.82

**

误差

236.98

12

19.75

 

总和

2638.30

23

 

结论:

燃料对火箭射程的影响是显著的;推进器对火箭射程的影响是高度显著的;燃料和推进器的搭配对火箭射程的影响是高度显著的. 最好的搭配是A4和B1.

     方差分析的软件介绍 

方差分析的计算量相当大,人工计算太烦了.不过,请您不要灰心,只要能掌握一个计算机软件,必将事半功倍.麻烦的计算,让计算机搞定.

         方差分析功能介绍

 是一个十分通用的计算机软件,它含有方差分析的功能.方差分析(,简称)方法能判断各因素对试验指标的影响是否显著,并找出较好的水平组合.

1.单因素方差分析

若要考虑一个因素对某项试验指标的影响是否显著,则可通过对此因素的多个水平进行比较,找到最优水平,这时可采用单因素方差分析方法.

例8为提高合成纤维的抗拉强度,考虑合成纤维中棉花百分比这一因素A对其抗拉强度y的影响.选定因素A的5个水平1=152=203=254=305=35%.各水平重复试验5次.希望通过试验分析找出最优工艺条件(引自刘朝荣《试验的设计和分析》第26页).

用软件解决此题的步骤如下:

(1)在某工作簿的电子表格中输入试验数据如右图;

(2)用鼠标单击主菜单的“工具”,然后单击下拉菜单的“数据分析”,再在弹出的窗口中选择“单因素方差分析”并单击“确定”按钮.这时弹出“方差分析:

单因素方差分析”对话框,选择各选项如右图后,单击“确定”按钮.

这时得到单因素方差分析的结果如下图所示,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 教学研究 > 教学反思汇报

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1