重复测量方差分析报告.docx
《重复测量方差分析报告.docx》由会员分享,可在线阅读,更多相关《重复测量方差分析报告.docx(12页珍藏版)》请在冰豆网上搜索。
重复测量方差分析报告
1、利用SASPROCGLM程序进行重复测量的方差分析
本手册描述了如何利用SASPROCGLM程序进行重复测量的方差分析,包括对象间变量(abetween-subjectsvariable)的分析。
首先解释了何时该使用改方法;描述了本手册中用到的术语;给出了研究问题;最后,用一个详细的例子阐述了如何使用改程序。
假定你知道如何书写SAS的程序和导入数据文件以及运行SAS命令。
此外,我们还假定你熟悉方差分析(ANOVA)的基本方法和假定。
2、何时使用重复测量的方差分析
任何方差分析都一样,重复测量的方差分析也是用来检验平均值的差别的。
当在许多不同的条件下测量随机取样的所有成员时,使用重复测量的方差分析。
由于样本是依次曝光于各个条件的,所以对因变量的测量是重复的。
对此使用标准的ANOVA分析是不合适的,因为它不符合标准方差分析的前提假定:
数据之间的独立性。
需要注意的是,有些ANOVA设计综合了重复测量因子和非重复测量因子。
只要有一个重复测量因子存在,就应该考虑使用重复测量的方差分析。
使用该方法有以下几个原因:
1)、一些研究的假说要求重复测量。
比如,经度研究测量几个年龄的样本成员。
在这个例子中,年龄应该是重复的因子。
2)、当取样成员之间存在很大的变异时,按标准方法得到的误差变异很大。
对每个取样成员的重复测量可以减小改误差变异。
3)、当取样成员不宜获取时,重复测量的设计显得经济实惠,因为每个成员都可以用来曝光于所有的条件。
4)、注意的是重复测量的方差分析不能检验随机效应!
5)、当取样成员根据一些重要的特征配对后,也可使用重复测量方差分析。
这里,每个配对的组具有相同的成员,组内每个成员都曝光于某个因子的不同的随机水平。
当取样成员配对了,不同条件下的测量可以当作重复测量来看待。
比如,假定你选择了一组低气压对象,测量他们的气压水平,然后将那些具有相似气压水平的进行配对。
然后给予每对中的一个成员低压处理,再次测量所有成员的低压水平。
对此种情况,重复测量的方差分析是最有效的。
当然,这里一个配对应当当作一个单一的取样成员。
应该认清重复测量设计和单纯的多变量设计之间的区别。
对二者来说,都是多次测量取样成员,但是,在重复测量设计中,每次实验测量的是同一特征在不同条件下的数值。
比如,你可以用重复测量方差分析来比较橘子树在不同年份所结的橘子的数目。
测量的指标是橘子的数目,,这里的条件就是不同的年份。
相反,对于多变量的设计,每次实验测量的是不同的特征。
你不能够用重复测量的方差分析来比较橘子的数目、重量和价格。
三个指标是数目、重量和价格,这些并不是代表不同的条件,只是不同的指标而已。
3、术语解释
对象:
取样成员。
对象内因子:
因变量多次测量,覆盖了所有的取样成员和一系列条件时,这一系列的条件就是对象内因子。
对象间因子:
因变量多次测量,但是是基于所有成员的不同的独立的组,即成员已经分组了,这里每个组曝光于一个不同的条件,这里的条件就是对象间因子。
当分析里包含了双方时(对象内因子和对象间因子),就称为有对象间因子的重复测量方差分析。
4、实例研究
下面主要是举个例子来详细的说明如何使用重复测量的方差分析。
假如你是一个健康问题专家,你期望弄清楚饮食习惯和锻炼对于脉搏速率的影响。
为了达到这个目的,你收集了一组人的资料,并且根据他们的饮食偏好进行分组:
肉食者和素食者。
然后,在每个组内,又分成三个小组,每个小组随机配以下面三种锻炼中的一种:
爬楼梯、短网拍墙球和重力训练。
现在,你就设计了有2个对象间因子的实验:
饮食偏好和锻炼类型。
5、确实数据的处理和非平衡设计
1)、对象内因子的主效应
运动的强度影响脉搏的速率(平均脉搏率在不同的实验水平上是否改变)。
这就是对象内因子运动强度的主效应检验。
2)、对象间因子的主效应
饮食结构是否影响脉搏率(素食者与肉食者的平均脉搏率是否相等)?
这就是对象间因子饮食偏好的主效应检验。
锻炼类型是否影响脉搏速率(爬楼梯的、打网球的与重力训练的平均脉搏率是否有差别)?
这是对象间因子锻炼类型的主效应检验。
3)、对象间因子的交互效应
锻炼类型对脉搏速率的影响是否依赖于饮食结构。
这是对象间因子锻炼类型与对象间因子饮食结构间的交互效应。
也可以表示成饮食结构对脉搏速率的影响是否依赖于锻炼类型,结果是一样的。
4)、对象内与对象间因子的交互作用
饮食(对象间因子)对脉搏速率的影响是否依赖于运动的强度(对象内因子)?
锻炼类型(对象间因子)对脉搏速率的影响是否依赖于运动的强度(对象内因子)?
饮食(对象间因子)对脉搏速率的影响是否依赖于运动的强度(对象内因子)和锻炼类型?
6、零假说,Alpha,和P值
记住的是,检验的无效假说都是假定所比较的平均值之间没有差别。
较大的F值对应着一个较小的P值。
1)、输出类型
当对象内影子超过两个水平时,PROCGLM输出两个不同的结果:
一个是使用多变量分析的结果;另一个是用单变量方法分析的结果。
通常,这两种方法产生相似的结论。
单变量分析来检验对象内因子的效应时要求球形假定。
当至少有一个对象间因子有2个以上水平时,必须满足球形检验的条件。
当你的对象内因子不满足球形假定,你要么用多变量分析方法,要么就校正单变量分析的结果(校正系数GG或HF)。
2)、转换变量
球形假定是通过转换因变量来实现的。
代表每次实验的原始变量根据正交比较进行转换。
转换的形式通常不影响检验的结果,只要转换矩阵是正交的。
3)、Mauchly球形检验和Epsilon校正系数
球形检验的结果只是决定你将要用哪种输出结果,单变量的还是多变量的。
这里特别要注意:
球形检验的结果不是决定你是否使用重复测量的方差分析(这是在实验设计时的事情),而是决定在重复测量方差分析之后你选择哪种输出结果。
如果选择单变量的,要么它满足球形检验,要么你就必须对结果进行校正。
通常,如果不满足,最好还是选择多变量的结果!
上面已经提到,另种方法就是校正你的单变量检验的自由度。
通常有两种不同的校正因子,Greenhouse-GeisserEpsilon(G-G)和Huynh-FeldtEpsilon(H-F)。
一般使用HF校正系数,因为GG校正系数被证实太保守了从而不能够观察到组间的差别。
默认状况下,系统会自动对每个单变量F检验(涉及到对象内因子的效应)输出经GG和HF校正后的P值的。
正如上面提到的,即便球形假定不成立,多变量方法检验仍然是有效的。
这就是说,当球形假定成立时,单、多变量的结果都可以用,差别不大;当球形假定成立时,要么用多变量的结果,要么就用校正后的单变量的结果!
在重复测量分析中,通常有四种多变量分析的方法,分别是:
Wilks’Lambda,Pillai’sTrace,Hotelling-LawleyTrace和Roy’sGreatestRoot。
通常用第一种方法(Wilk)。
对于对象内因子的检验,上面说了可以有很多种检验的方法,单变量的多变量的,以及校正后单变量的。
而对于对象间因子的检验,只有一种方法,也就是一般的线性模型。
原文参考:
http:
//www.ats.ucla.edu/STAT/sas/library/repeated_ut.htm 。
http:
//www.ats.ucla.edu/stat/Spss/code/rep_anova_sig.htm
http:
//www.lifesci.sussex.ac.uk/home/Zoltan_Dienes/SPSS%202-way%20rm.html
http:
//wwwstage.valpo.edu/other/dabook/ch12/c12-2.htm (推荐,使用SPSS进行数据分析!
演示加结果解释~)
请教各位:
我如何用SPSS将这样一组数据转换成进行重复测量方差分析所需要的表格形式?
根据其中文版教程,设置变量应为时间和浓度两个变量,但如何将各时间点和各浓度点的区分在表格中体现?
是应将时间和浓度皆设为数值型变量而非字符型,好像哪个环节没设好。
我的分析目的是将不同时间点归为组内,不同浓度为组间,考察组内和组间显著性差异。
多谢指点!
3h 6h 12h24h
C0 0.7690 0.6548 0.8829 0.8480
C0 0.7730 0.6956 0.8689 0.8462
C0 0.8240 0.7088 0.9406 0.8774
C1 1.2498 0.8451 0.9808 1.0069
C1 1.3229 0.7756 0.9622 0.9869
C1 1.3665 0.8546 0.8963 0.9183
C2 0.7986 0.7022 0.9591 0.8950
C2 0.8936 0.7946 0.9478 0.8929
C2 0.9013 0.7436 0.9272 0.9660
C4 0.8679 0.8109 0.9665 0.9892
C4 0.8801 0.8359 0.9883 0.9416
C4 0.9036 0.8350 0.9690 0.9453
含有一个重复测量因素,一个组间因素的重复测量方差分析
数据结构如下:
grouptime1time2time3time4
........................................
........................................
........................................
........................................
另外楼主需注意你的重复测量是非等距的。
§8.5 重复测量的方差分析
§8.5 重复测量的方差分析
重复测量的方差分析指的是一个应变量被重复测量好几次,从而同一个个体的几次观察结果间存在相关,这样就不满足普通分析的要求,需要用重复测量的方差分析模型来解决。
8.5.1 Repeatedmeasures对话框界面说明
实际上,如果对普通方差分析模型作出正确的设置,两者的分析结果是完全相同的,即都正确,那么,重复测量的方差分析过程有何优势呢?
我们通过下面的例子来看看:
例8.3 在数据集anxity2.sav中判断:
anxiety和tension对实验结果(即trial1~trial4)有无影响;四次试验间有无差异;试验次数和两个变量有无交互作用。
anxity2.sav和anxity.sav实际上是同一个数据,但根据不同的分析目的采用了不同的数据排列方式。
如果采用anxity.sav进行分析,我们可以分析四次试验间有无差异的问题,但对另两个问题就无能为力了,因为用普通的方差分析模型,anxity和tension的影响被合并到了subject中,根本就无法分解出来进行分析,这时,我们就只能求助于重复测量的方差分析模型。
在菜单中选择Analyze==>GeneralLinealmodel==>Repeatedmeasures,系统首先会弹出一个重复测量因子定义对话框如下:
因为是重复测量的模型,应变量被重复测量了几次,分别存放在几个变量中,所以我们这里要自行定义应变量。
默认的名称为factor1,我们将其改为trail,下面的因素等级数填入4(因一共测量了四次)。
单击Add钮,则该变量被加入,我们就完成了模型设置的第一步:
应变量名称和测量次数定义。
单击define,我们开始进行下一个步骤:
具体重复测量变量定义及模型设置,对话框如下:
这个对话框和我们以前看到的方差分析对话框不太一样:
它没有应变量框,而是改为了组内效应框,实际上是一回事,上面我们定义了trial有四次测量,此处就给出了四个空让你填入相应代表四次测量的变量,选中trial1~trial4,将其选入;然后要选择自变量了(这里又将其称为了betweensubjectsfactor),将剩下的三个都选入即可。
最后,根据题意,不需要检验anxity与tension的交互作用对试验次数有无交互作用,所以要在model中作相应设置,把那个东东拉出来。
详细的操作步骤如下:
1.Analyze==>GeneralLinealmodel==>Repeatedmeasures
2.Within-subjectfactorname框:
键选入trial
3.numberoflevels框:
键入4
4.单击ADD钮
5.单击DEFINE钮
6.Within-subjectvariables(trial)框:
选入trial1~trial4
7.betweensubjectsfactor框:
选入subject、anxity和tension
8.单击MODEL钮
9. Custom单选钮:
选中
10. Within-subjectModel框:
选入trial
11. betweensubjectsModel框:
选入anxity和tension
12. 单击CONTINUE
13.单击OK
请注意,这里没有选入变量subject,因为它实际上在这里成为了一个记录ID,要是将它选入,则什么都检验不了了。
8.5.2 结果解释
本题的分析结果如下:
GeneralLinearModel
上表给出了所定义的4次测量的变量名,在模型中它们都代表一个应变量trial,只是测量的次数不同而已。
这是引入模型的其它自变量的情况列表。
上表是针对所检验的结果变量trial,以及他和另两个引入模型的自变量间的交互作用是否存在统计学意义,采用的是四种多元检验方法。
一般他们的结果都是相同的,如果不同,我一般以Hotelling'sTrace方法的结果为准。
可见在所用的模型中,trial的四次测量间的确是存在着统计学差异的,但它和另两个变量间的交互作用无统计学意义。
上表是球形检验,因为重复测量的方差分析模型要求所检验的应变量服从一种叫做球形分布的东东。
上面可能有些内容不好懂,不过没关系,只要看到近似卡方为9.383,自由度为5,P值为0.097就可以了。
因此trial是勉强服从球形分布的,可以进行重复测量的方差分析。
上面又用方差分析的方法对组内因素进行了检验,注意第一种为球形分布假设成立时的结果,就是我们所要看的。
如果该假设不成立,则根据不同的情况可能看下面三种检验结果之一,或放弃该检验方法。
上表是非常重要的一部分:
各次重复测量间变化趋势的模型分析,这里要求检验没有统计学意义,否则说明变化趋势不服从该曲线。
以trial为例,对Linear的检验P值小于千分之一,Quadratic的P值略大于0.05。
只有Cubic的P值在0.5附近,因此最佳的拟合曲线应为Cubic(三次方曲线);但由于一共才四次测量,三次方曲线显然太奢侈了,因此如果没有任何其它提示或专业上的知识,最终的拟和曲线应为Quadratic(二次方曲线)。
上表为最后一张,为组间效应的方差分析结果,可见anxiety和tension均无统计学意义。
最后,为了再确认一下几次测量间的变化趋势,我们另外用plots子菜单作出模型估计的四次测量均数值如下图:
可见四次测量均数实际上还是近似于直线趋势的,因此前面的模型应为线性最佳。