spss方差分析.docx
《spss方差分析.docx》由会员分享,可在线阅读,更多相关《spss方差分析.docx(25页珍藏版)》请在冰豆网上搜索。
spss方差分析
方差分析是用于两个及两个以上样本均数差别的显著性检验。
由于各种因素的影响,研究所得的数据呈现波动状,造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。
方差分析的基本思想是:
通过分析研究不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。
方差分析主要用途:
①均数差别的显著性检验,②分离各有关因素并估计其对总变异的作用,③分析因素间的交互作用,④方差齐性检验。
在科学实验中常常要探讨不同实验条件或处理方法对实验结果的影响。
通常是比较不同实验条件下样本均值间的差异。
例如医学界研究几种药物对某种疾病的疗效;农业研究土壤、肥料、日照时间等因素对某种农作物产量的影响;不同化学药剂对作物害虫的杀虫效果等,都可以使用方差分析方法去解决。
方差分析原理
方差分析的基本原理是认为不同处理组的均数间的差别基本来源有两个:
(1)随机误差,如测量误差造成的差异或个体间的差异,称为组内差异,用变量在各组的均值与该组内变量值之偏差平方和的总和表示,记作SSw,组内自由度dfw。
(2)实验条件,实验条件,即不同的处理造成的差异,称为组间差异。
用变量在各组的均值与总均值之偏差平方和表示,记作SSb,组间自由度dfb。
总偏差平方和SSt=SSb+SSw。
组内SSt、组间SSw除以各自的自由度(组内dfw=n-m,组间dfb=m-1,其中n为样本总数,m为组数),得到其均方MSw和MSb,一种情况是处理没有作用,即各组样本均来自同一总体,MSb/MSw≈1。
另一种情况是处理确实有作用,组间均方是由于误差与不同处理共同导致的结果,即各样本来自不同总体。
那么,MSb>>MSw(远远大于)。
MSb/MSw比值构成F分布。
用F值与其临界值比较,推断各样本是否来自相同的总体。
方差分析的假设检验
假设有m个样本,如果原假设H0:
样本均数都相同即μ1=μ2=μ3=…=μm=μ,m个样本有共同的方差
。
则m个样本来自具有共同的方差
和相同的均数u的总体。
零假设H0:
m组样本均值都相同,即μ1=μ2=....=μm
如果,计算结果的组间均方远远大于组内均方(MSb>>MSw),F>F0.05(dfb,dfw),p<0.05,拒绝零假设,说明样本来自不同的正态总体,说明处理造成均值的差异有统计意义;否则,F0.05不能拒绝零假设,说明样本来自相同的正态总体,处理间无差异。
SPSS中方差分析过程
1)One-WayANOVA过程
One-Way过程是单因素简单方差分析过程。
它在Analyze菜单中的CompareMeans过程组中。
用0ne-WayANOVA菜单项调用,可以进行单因素方差分析、均值多重比较和相对比较。
2)GeneralLinearModel过程组
在SPSS主菜单“Analyze”项调用。
这些过程可以完成简单的多因素方差分析和协方差分析,不但可以分析各因素的主效应,还可以分析各因素间的交互效应。
该过程允许指定最高阶次的交互效应,建立包括所有效应的模型。
如果想建立包括某些特定的交互效应的模型也可以通过过程中的“Method”对话框中的选择项实现。
在GeneralLinearModel菜单项的下一级菜单中有四项过程,每个菜单项分别完成不同类型的方差分析任务。
这些过程的主要功能分别是:
①Univariate过程
Univariate过程完成一般的单因变量、多因素方差分析。
可以指定协变量,即进行协方差分析。
在指定模型方面有较大的灵活性并可以提供大量的统计输出。
②Multivariate过程
Multivariate过程进行多因变量的多因素分析。
当研究的问题具有两个或两个以上相关的因变量时,要研究一个或几个因素变量与因变量集之间的关系时,才可以选用Multivariate过程。
例如,当你研究数学、物理的考试成绩是否与教学方法、学生性别、以及方法与性别的交互作用有关时,使用此菜单项。
如果只有几个不相关的因变量或只有一个因变量,应该使用Univariate过程。
③RepeatedMeasure过程
RepeatedMeasure过程进行重复测量方差分析。
当一个因变量在不只一种条件下进行测度,要检验有关因变量均值的假设应该使用该过程。
④VarianceComponent过程
VarianceComponent过程进行方差估计分析。
通过计算方差估计值,可以帮助我们分析如何减小方差。
单因素方差分析
单因素方差分析也称作一维方差分析。
它检验由单一因素影响的一个(或几个相互独立的)因变量由因素各水平分组的均值之间的差异是否具有统计意义。
还可以对该因素的若干水平分组中哪一组与其他各组均值间具有显著性差异进行分析,即进行均值的多重比较。
One-WayANOVA过程要求因变量属于正态分布总体。
如果因变量的分布明显的是非正态,不能使用该过程,而应该使用非参数分析过程。
如果几个因变量之间彼此不独立,应该用RepeatedMeasure过程。
[例子]
调查不同水稻品种百丛中稻纵卷叶螟幼虫的数量,数据如表5-1所示。
表5-1不同水稻品种百丛中稻纵卷叶螟幼虫数
从复
水稻品种
1
2
3
4
5
1
41
33
38
37
31
2
39
37
35
39
34
3
40
35
35
38
34
数据保存在“DATA5-1.SAV”文件中,变量格式如图5-1。
图5-1
分析水稻品种对稻纵卷叶螟幼虫抗虫性是否存在显著性差异。
1)准备分析数据
在数据编辑窗口中输入数据。
建立因变量“幼虫”和因素水平变量“品种”,然后输入对应的数值,如图5-1所示。
或者打开已存在的数据文件“DATA5-1.SAV”。
2)启动分析过程
点击主菜单“Analyze”项,在下拉菜单中点击“CompareMeans”项,在右拉式菜单中点击“0ne-WayANOVA”项,系统
打开单因素方差分析设置窗口如图5-2。
图5-2单因素方差分析窗口
3)设置分析变量
因变量:
选择一个或多个因子变量进入“DependentList”框中。
本例选择“幼虫”。
因素变量:
选择一个因素变量进入“Factor”框中。
本例选择“品种”。
4)设置多项式比较
单击“Contrasts”按钮,将打开如图5-3所示的对话框。
该对话框用于设置均值的多项式比较。
图5-3“Contrasts”对话框
定义多项式的步骤为:
均值的多项式比较是包括两个或更多个均值的比较。
例如图5-3中显示的是要求计算“1.1×mean1-1×mean2”的值,检验的假设H0:
第一组均值的1.1倍与第二组的均值相等。
单因素方差分析的“0ne-WayANOVA”过程允许进行高达5次的均值多项式比较。
多项式的系数需要由读者自己根据研究的需要输入。
具体的操作步骤如下:
①选中“Polynomial”复选项,该操作激活其右面的“Degree”参数框。
②单击Degree参数框右面的向下箭头展开阶次菜单,可以选择“Linear”线性、“Quadratic”二次、“Cubic”三次、“4th”四次、“5th”五次多项式。
③为多项式指定各组均值的系数。
方法是在“Coefficients”框中输入一个系数,单击Add按钮,“Coefficients”框中的系数进入下面的方框中。
依次输入各组均值的系数,在方形显示框中形成—列数值。
因素变量分为几组,输入几个系数,多出的无意义。
如果多项式中只包括第一组与第四组的均值的系数,必须把第二个、第三个系数输入为0值。
如果只包括第一组与第二组的均值,则只需要输入前两个系数,第三、四个系数可以不输入。
可以同时建立多个多项式。
一个多项式的一组系数输入结束,激话“Next”按钮,单击该按钮后“Coefficients”框中清空,准备接受下一组系数数据。
如果认为输入的几组系数中有错误,可以分别单击“Previous”或“Next”按钮前后翻找出错的一组数据。
单击出错的系数,该系数显示在编辑框中,可以在此进行修改,修改后单击“Change”按钮在系数显示框中出现正确的系数值。
当在系数显示框中选中一个系数时,同时激话“Remove”按钮,单击该按钮将选中的系数清除。
④单击“Previous”或“Next”按钮显示输入的各组系数检查无误后,按“Continue”按钮确认输入的系数并返回到主对话框。
要取消刚刚的输入,单击“Cancel”按钮;需要查看系统的帮助信息,单击“Help”按钮。
本例子不做多项式比较的选择,选择缺省值。
5)设置多重比较
在主对话框里单击“PostHoc”按钮,将打开如图5-4所示的多重比较对话框。
该对话框用于设置多重比较和配对比较。
方差分析一旦确定各组均值间存在差异显著,多重比较检测可以求出均值相等的组;配对比较可找出和其它组均值有差异的组,并输出显著性水平为0.95的均值比较矩阵,在矩阵中用星号表示有差异的组。
图5-4“PostHocMultipleComparisons”对话框
(1)多重比较的选择项:
①方差具有齐次性时(EqualVariancesAssumed),该矩形框中有如下方法供选择:
LSD(Least-significantdifference)最小显著差数法,用t检验完成各组均值间的配对比较。
对多重比较误差率不进行调整。
Bonferroni(LSDMOD)用t检验完成各组间均值的配对比较,但通过设置每个检验的误差率来控制整个误差率。
Sidak计算t统计量进行多重配对比较。
可以调整显著性水平,比Bofferroni方法的界限要小。
Scheffe对所有可能的组合进行同步进入的配对比较。
这些选择项可以同时选择若干个。
以便比较各种均值比较方法的结果。
R-E-G-WF(Ryan-Einot-Gabriel-WelschF)用F检验进行多重比较检验。
R-E-G-WQ(Ryan-Einot-Gabriel-Welschrangetest)正态分布范围进行多重配对比较。
S-N-K(Student-Newmnan-Keuls)用StudentRange分布进行所有各组均值间的配对比较。
如果各组样本含量相等或者选择了
“Harmonicaverageofallgroups”即用所有各组样本含量的调和平均数进行样本量估计时还用逐步过程进行齐次子集(差异较
小的子集)的均值配对比较。
在该比较过程中,各组均值从大到小按顺序排列,最先比较最末端的差异。
Tukey(Tukey's,honestlysignicantdifference)用Student-Range统计量进行所有组间均值的配对比较,用所有配对比较误
差率作为实验误差率。
Tukey's-b用“stndentRange”分布进行组间均值的配对比较。
其精确值为前两种检验相应值的平均值。
Duncan(Duncan'smultiplerangetest)新复极差法(SSR),指定一系列的“Range”值,逐步进行计算比较得出结论。
Hochberg'sGT2用正态最大系数进行多重比较。
Gabriel用正态标准系数进行配对比较,在单元数较大时,这种方法较自由。
Waller-D