Excel中的单因素方差分析.docx
《Excel中的单因素方差分析.docx》由会员分享,可在线阅读,更多相关《Excel中的单因素方差分析.docx(22页珍藏版)》请在冰豆网上搜索。
Excel中的单因素方差分析
Excel中的单因素方差分析
一、目的要求
为了解决多个样本平均数差异显著性的测验问题,需要应用方差分析。
方差分析是把试验看成一个整体,分解各种变异的原因。
从总的方差中,将可能的变异原因逐个分出,并用误差的方法作为判断其他方差是否显著的标准,如果已知变异原因的方差比误差方差大得多,那么,该方差就不是随机产生的,试验的处理间的差异不会是由于误差原因造成的,这时处理的效应是应该肯定的。
通过学习Excel中方差分析,掌握基本的分析操作,能够处理实验的数据。
二、实验工具
MicrosoftExcel
三、试验方法
1、基本模型:
变异来源
平方和
自由度
均方
F值
Fα(dft,dfe)
总变异
SST
dfT=nk-1
ST2=SST/dfT
F=St2/Se2
处理间
SSt
dft=k-1
St2=SSt/dft
误差
SSe
dfe=k(n-1)
Se2=SSe/dfe
2、例:
在五个硼肥试验处理中测得苹果叶内硼含量(ppm),试比较各处理苹果叶内平均含硼量的差异显著性。
5个硼肥试验处理中苹果叶内硼含量(ppm)
处理
叶内硼含量
A
8
7
6
9
10
12
B
41
44
46
40
38
36
C
17
16
14
12
22
15
D
28
33
36
29
21
22
E
40
43
42
39
44
41
3、操作步骤:
在Excel统计中,完全随机试验设计的方差分析,只须经过单因素方差分析即可得出结果,具体步骤如下:
1打开Excel,向单元格中输入文字与数字,建立表格;
2单击“工具”,在出现的对话框中,选择“数据分析”,选取“方差分析:
单因素方差分析”;
3单击“确定”,单击“输入区域:
”框右边的按钮,用鼠标选中数据,再次单击按钮;其他设置选择α为0.05。
分组方式:
行。
点选标志位于第一列。
4单击“确定”,即可输出单因素方差分析结果。
4、方差分析输出结果:
SUMMARY
组
观测数
求和
平均
方差
A
6
52
8.666667
4.666667
B
6
245
40.83333
13.76667
C
6
96
16
11.6
D
6
169
28.16667
34.96667
E
6
249
41.5
3.5
差异源
SS
df
MS
F
P-value
Fcrit
组间
5160.467
4
1290.117
94.1691
1.07E-14
2.75871
组内
342.5
25
13.7
总计
5502.967
29
5、多重比较:
由方差分析的结果,采用新复极差测验法,再稍加计算比较处理,即可得出:
新复极差测验的LSR值
秩次距K
2
3
4
5
6
SSR0.05
2.92
3.07
3.15
3.22
3.28
SSR0.01
3.96
4.14
4.24
4.33
4.39
LSR0.05
4.41
4.64
4.76
4.86
4.95
LSR0.01
5.98
6.25
6.40
6.54
6.63
喷硼处理均数间的比较
处理
平均数
差异显著性
5%
1%
E
B
D
C
A
41.5
40.8
28.2
16.0
8.7
a
a
b
c
d
A
A
B
C
D
6、结论:
由方差分析结果F=94.17>F0.05=Fcrit=2.76,可知5种喷硼处理间差异显著,并可知除E与B二处理间无极显著差异外,其他均有极显著差异。
SPSS中的单因素方差分析
一、基本原理
单因素方差分析也即一维方差分析,是检验由单一因素影响的多组样本某因变量的均值是否有显著差异的问题,如各组之间有显著差异,说明这个因素(分类变量)对因变量是有显著影响的,因素的不同水平会影响到因变量的取值。
二、实验工具
SPSSforWindows
三、试验方法
例一某灯泡厂用四种不同配料方案制成的灯丝,生产了四批灯泡。
在每批灯泡中随机地抽取若干个灯泡测其使用寿命(单位:
小时),数据列于下表,现在想知道,对于这四种灯丝生产的灯泡,其使用寿命有无显著差异。
灯泡
灯丝
1
2
3
4
5
6
7
8
甲
1600
1610
1650
1680
1700
1700
1780
乙
1500
1640
1400
1700
1750
丙
1640
1550
1600
1620
1640
1600
1740
1800
丁
1510
1520
1530
1570
1640
1680
1.不使用选择项操作步骤
(1)在数据窗建立数据文件,定义两个变量并输入数据,这两个变量是:
filament变量,数值型,取值1、2、3、4分别代表甲、乙、丙、丁,格式为F1.0,标签为“灯丝”。
Hours变量,数值型,其值为灯泡的使用寿命,单位是小时,格式为F4.0,标签为“灯泡使用寿命”。
(2)按Analyze,然后ComparedMeans,然后One-WayAnova的顺序单击,打开“单因素方差分析”主对话框。
(3)从左边源变量框中选取变量hours,然后按向右箭头,所选去的变量hours即进入DependentList框中。
(4)从左边源变量框中选取变量filament,然后按向右箭头,所选取的变量folament即进入Factor框中。
(5)在主对话框中,单击“OK”提交进行。
2.输出结果及分析
灯泡使用寿命的单因素方差分析结果
ANQVA
SunofSquares
df
MeanSquare
F
Sig
BetweenGroups
39776.46
3
13258.819
1.638
.209
WithinGroups
178088.9
22
8094.951
Total
217865.4
25
该表各部分说明如下:
第一列:
方差来源,BetweenGroups是组间变差,WithinGroups是组内变差,Total是总变差。
第二列:
离差平方和,组间离差平方和为39776.46,组内离差平方和为178088.9,总离差平方和为217865.4,是组间离差平方和与组内离差平方和相加而得。
第三列:
自由度,组间自由度为3,组内自由度为22,总自由度为25,是组间自由度和组内自由度之和。
第四列:
均方,即平方和除以自由度,组间均方是13258.819,组内均方是8094.951.
第五列:
F值,这是F统计量的值,其计算公式为模型均方除以误差均方,用来检验模型的显著性,如果不显著说明模型对指标的变化没有解释能力,F值为1.683.
第六列:
显著值,是F统计量的p值,这里为0.209.
由于显著值0.209大于0.05,所以在置信水平0.95下不能否定零假设,也就是说四种灯丝生产的灯泡,其平均使用寿命美誉显著差异。
四、作业
表4-3不同品种授粉对砀山酥梨坐果率影响
Table4-3theeffectofpollinatorsonfruitsetinChinesepear‘Dangshansuli’
授粉品种
坐果率(%)
平均坐果率(%)
差异显著性
5%
1%
紫酥
28.57
14.29
50.00
10.00
七月酥
40.00
28.57
55.56
41.33
新世纪
56.52
29.03
40.54
26.67
马蹄黄
66.67
42.57
18.18
42.86
茌梨
39.02
50.00
52.54
42.22
满天红
52.94
42.86
46.67
56.25
鸭梨
66.67
42.86
40.00
72.73
黄冠
59.57
50.00
73.58
48.28
幸水
52.63
71.43
50.00
66.67
圆黄
80.00
40.00
100.0
56.25
爱甘水
75.86
75.00
72.73
47.06
红酥脆
100.0
75.00
42.11
75.00
Excel中的直线回归分析
一、基本原理
回归是研究某种变量受另一种或一种以上变量的影响程度。
自变量X是事先设计的,没有误差或者误差很小,依变量Y随X变化而变化,并具有其自身的随机误差。
二者之间的依存关系或因果关系,称为回归关系,如果用直线回归方程来表示,一般通式为:
y=a+bx。
其中:
a叫做回归截距;b叫做回归系数或斜率。
二、实验工具
MicrosoftExcel
三、试验方法
在Excel统计中,任何回归分析都可以用“回归分析工具”来分析,具体方法如下。
例:
经调查,华农本地早柑橘10个果实的横径和单果重资料,现测验果实横径与单果重是否有显著的相关性。
华农本地早柑橘10个果实的横径和单果重
果实横径
单果重
x(cm)
y(cm)
7
115
6.5
96
5.8
79
4.1
44
5.5
62
6.7
106
6.3
88
4.3
48
6.1
85
5.1
55
1.选取“工具”菜单中“数据分析”,选定“回归”;
2.单击“确定”,在“Y值输入区域:
”单击右边按钮,用鼠标选取数据,再次单击按钮结束,同理,在“X值输入区域:
”选取X列数据,点选标志,置信度为95%,点选残差、标准残差、残差图、线性拟合图、正态概率图。
3.单击“确定”。
即可得出回归分析结果。
4.回归输出结果:
SUMMARYOUTPUT
回归统计
MultipleR
0.97249
RSquare
0.945738
AdjustedRSquare
0.938955
标准误差
6.089802
观测值
10
PROBABILITYOUTPUT
百分比排位
y(cm)
5
44
15
48
25
55
35
62
45
79
55
85
65
88
75
96
85
106
95
115
方差分析
df
SS
MS
F
SignificanceF
回归分析
1
5170.914
5170.914
139.4315
2.42E-06
残差
8
296.6855
37.08569
总计
9
5467.6
RESIDUALOUTPUT
观测值
预测y(cm)
残差
标准残差
1
108.4058
6.594249
1.14852
2
96.26061
-0.26061
-0.04539
3
79.25742
-0.25742
-0.04483
4
37.96394
6.036057
1.051299
5
71.97033
-9.97033
-1.73653
6
101.1187
4.881333
0.850181
7
91.40256
-3.40256
-0.59262
8
42.822
5.178001
0.901852
9
86.5445
-1.5445
-0.26901
10
62.25422
-7.25422
-1.26347
Coefficients
标准误差
tStat
P-value
Intercept
-61.6262
11.96367
-5.15111
0.000873
x(cm)
24.29028
2.057084
11.80811
2.42E-06
Lower95%
Upper95%
下限95.0%
上限95.0%
-89.2145
-34.0379
-89.2145
-34.0379
19.54663
29.03392
19.54663
29.03392
回归输出正态概率图
回归输出最佳适配曲线图
回归输出残差分析图
5.结论:
由输出结果可知:
a=-61.63,b=24.29。
所以其回归方程为:
y=24.29x-61.63。
再由输出结果中的方差分析可知,SignificanceF=2.42E-06<α=0.05,说明果实横径与果重之间的回归关系显著。
而由结果中回归系数的tStat检验可知,截距a:
P-value=0.000873132<α=0.05;斜率b:
P-value=2.42386E-06<α=0.05,说明回归系数均达到显著水平。
因此回归方程是可靠有效的。
Excel中的成对数据测验(t-检测)
一、基本原理
农业试验各处理结果之间总会出现一定的差异,这差异的来源需要进行判断,才能获得可靠结论,这判断称为显著性测验。
二、实验工具
MicrosoftExcel
三、试验方法
成对数据测验时农业统计中较常见的一种,下面就这一类型的Excel统计介绍如下。
1.例:
如下表数据,现计算短枝型与普通型枝皮率有无明显差异。
元帅苹果短枝型与普通型枝皮率(%)
地点序号
短枝型
普通型
1
54.35
37.5
2
43.62
31.78
3
40.79
20.83
4
32.35
20.83
5
39.58
32.35
6
41.34
35.34
7
37.53
27.67
8
38.46
34.82
9
35.55
23.83
2.操作步骤:
在单元格中输入原始数据和文字;单击菜单栏的“工具”,再单击“数据分析”,选择“t-检验:
平均值的成对二样本分析”,单击“确定”。
在变量1的区域选择短枝型的数据,在变量2的区域选择普通型的数据,单击确定,即可得出结果。
t-检验:
成对双样本均值分析
短枝型
普通型
平均
40.39667
29.43889
方差
38.37555
40.69136
观测值
9
9
泊松相关系数
0.667238
假设平均差
0
df
8
tStat
6.406089
P(T<=t)单尾
0.000104
t单尾临界
1.859548
P(T<=t)双尾
0.000208
t双尾临界
2.306004
3.结果简介:
我们确定的显著水平为0.05,可得tStat=6.41>t双尾临界=2.31,因此两均值差异显著。
同理,可以设置显著水平为0.01时,进行测验。
SPSS中的多因素方差分析
一、基本原理
在多因素的试验中,使用方差分析而不用t检验的一个重要原因在于前者效率更高,本实验所讲的单因变量多因素方差分析是对于一个独立变量是否受一个或多个因素或变量影响而进行的回归分析和方差分析。
这个过程可以检验不同组之间均数由于受不同因素影响是否有差异的问题,即可以分析每一个因素的作用,也可以分析各因素之间的交互作用,还可以分析协方差和协方差交互作用。
二、实验工具
SPSSforWindows
三、试验方法
多因素方差分析.pdf
四、作业:
某生产队在12块面积相同的大豆试验田上,用不同方式施肥,大豆亩产(斤)的数据如下表
编号
氮肥(斤)
磷肥(斤)
亩产(斤)
1
0
0
400
2
0
0
390
3
0
0
420
4
0
4
450
5
0
4
460
6
0
4
455
7
6
0
430
8
6
0
420
9
6
0
440
10
6
4
560
11
6
4
570
12
6
4
575
氮肥用N表示,磷肥用P表示,两个因子各取两水平。
为了探明氮肥作用大,还是磷肥作用大,进行方差分析,写出主要结果。
1.操作步骤
(1)输入数据集,因素变量有两个,即N和P,均有两水平,0表示不用该肥料,1表示用该肥料;因变量:
output(大豆亩产),单位为斤。
(2)在“Analyze”菜单中打开“GeneralLinearModels”子菜单,从中选择“Univariae”命令,打开“多因素方差分析”主窗口。
(3)指令分析变量。
选择因变量output进入Dependent框。
选择因素变量N和P进入FixedFactors框。
(4)在主对话框中单击“Cintrasts”按钮,打开对比方法对话框,在该对话框下如下操作:
在Factor框中选择N。
在ChangeContrast栏内,单击Contrast参数框内向下箭头,打开比较方法表,选择Simple项,再选择First项作为比较参考类,然后单击“change”,在factors框中显示N。
用相同方法指定P。
单击“continue”按钮回到主对话框。
(5)在主对话框中单击“option”按钮,打开选项对话框,作如下操作:
在Factors框中选择因素变量N、P、N×P,单击向右箭头将因素变量送入DisplayMeansFor框中。
在display栏内选中Spreadvs.levelplot和residualplot复选框
单击OK按钮回到主对话框。
SPSS中的多因变量方差分析(Multivariate)
比较5个品种大麦产量,连续二年观测的单产量作为指标,用三个不同地区的产量作为三次重复。
品种
第一年产量
第二年产量
1
81
81
1
147
100
1
120
99
2
105
82
2
142
116
2
121
62
3
120
80
3
151
112
3
124
96
4
110
87
4
192
148
4
141
126
5
98
84
5
146
108
5
125
76
SPSS中正交设计的方差分析
一、实验工具
SPSSforWindows
二、试验方法
操作步骤
(1)输入数据集,五个因素分别用A、B、C、D、E表示,每因素均有两水平,试验结果用result表示。
(2)在“Analyze”菜单中打开“generallinearmodels”子菜单,从中选择“univariate”命令,打开“多因素方差分析”主窗口。
(3)指定分析变量:
选择因变量results进入dependen框。
选择因变量A、B、C、D、E进入fixedfactors框。
(4)在主对话框中单击“model”按钮,打开模型对话框,在对话框中如下操作:
选中custom单选项。
指定要求分析的五个主效应。
单击“continue”按钮,返回主对话框。
(5)在主对话框中单击“options”按钮,打开选项对话框,在该对话框中如下操作:
在factorsandfactor框中选择因素变量A、B、C、D、E,单击向右箭头将因素变量送入displayMeansfor框。
单击“continue”按钮,返回主对话框。
(6)单击“OK”按钮完成。
表4–7九种不同培养基对鬼怒甘叶片愈伤组织诱导效果
Tab.4–7theeffectofdifferentculturemediaonthecallusinductionfromleafofKunouwase
试验编号
BA(mg/L)
2,4–D(mg/L)
IBA(mg/L)
接种数(个)
死亡数(个)
愈伤组织(个)
愈伤率(%)
Y–1
3.0
(1)
0.2
(1)
0.5
(1)
18
2
16
100.00
Y–2
3.0
(1)
0.1
(2)
0.3
(2)
18
2
13
81.25
Y–3
3.0
(1)
0.0(3)
0.0(3)
18
0
11
61.11
Y–4
2.0
(2)
0.2
(1)
0.0(3)
18
2
15
93.75
Y–5
2.0
(2)
0.1
(2)
0.5
(1)
20
3
10
58.82
Y–6
2.0
(2)
0.0(3)
0.3
(2)
19
2
9
52.94
Y–7
1.0(3)
0.2
(1)
0.3
(2)
20
1
19
100.00
Y–8
1.0(3)
0.1
(2)
0.0(3)
18
3
10
66.67
Y–9
1.0(3)
0.0(3)
0.5
(1)
18
2
8
50.00
表4–8方差分析表
Tab.4–8listofvarianceanalysis
DependentVariable:
愈伤率
Source
TypeIIISumofSquares
df
MeanSquare
F
Sig.
PartialEtaSquared
Noncent.Parameter
ObservedPower(a)
CorrectedModel
3257.996(b)
6
542.999
178.228
.006
.998
1069.365
1.000
Intercept
49068.525
1
49068.525
16105.659
.000
1.000
16105.659
1.000
BA
238.025
2
119.013
39.063
.025
.975
78.127
.865
2,4–D
2912.718
2
1456.359
478.018
.002
.998
956.035
1.000
IBA
107.253
2
53.627
17.602
.054
.946
35.203
.606
Error
6.093
2
3.047
Total
52332.614
9
CorrectedTotal
3264.089
8
aComputedusingalpha=.05,bRSquared