方差齐性检验.docx
《方差齐性检验.docx》由会员分享,可在线阅读,更多相关《方差齐性检验.docx(15页珍藏版)》请在冰豆网上搜索。
方差齐性检验
关于为单因素方差分析为何要做方差齐性检验
LXK的结论:
齐性检验时F越小(p越大),就证明没有差异,就说明齐,比如F=1.27,p>0.05则齐,这与方差分析均数时F越大约好相反。
LXK注:
方差(MS或s2)=离均差平方和/自由度(即离均差平方和的均数)
标准差=方差的平方根(s)
F=MS组间/MS误差=(处理因素的影响+个体差异带来的误差)/个体差异带来的误差
=================
F检验为什么要求各比较组的方差齐性?
之所以需要这些前提条件,是因为必须在这样的前提下所计算出的t统计量才服从t分布,而t检验正是以t分布作为其理论依据的检验方法。
在方差分析的F检验中,是以各个实验组内总体方差齐性为前提的,因此,按理应该在方差分析之前,要对各个实验组内的总体方差先进行齐性检验。
如果各个实验组内总体方差为齐性,而且经过F检验所得多个样本所属总体平均数差异显著,这时才可以将多个样本所属总体平均数的差异归因于各种实验处理的不同所致;如果各个总体方差不齐,那么经过F检验所得多个样本所属总体平均数差异显著的结果,可能有一部分归因于各个实验组内总体方差不同所致。
简单地说就是在进行两组或多组数据进行比较时,先要使各组数据符合正态分布,另外就是要使各组数据的方差相等(齐性)。
=================
在SPSS中,如果进行方差齐性检验呢?
命令是什么?
方差分析(AnaylsisofVariance,ANOVA)要求各组方差整齐,不过一般认为,如果各组人数相若,就算未能通过方差整齐检验,问题也不大。
One-WayANOVA对话方块中,点击Options…(选项…)按扭,勾Homogeneity-of-variance即可。
它会产生Levene、CochranC、Bartlett-BoxF等检验值及其显著性水平P值,若P值<于0.05,便拒绝方差整齐的假设。
顺带一提,Cochran和Bartlett检定对非正态性相当敏感,若出现「拒绝方差整齐」的检测结果,或因这原因而做成。
=================
用spss处理完数据的显示结果中,F值,t值及其显著性(sig)都分别是解释什么的?
一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检定。
通过把所得到的统计检定值,与统计学家建立了一些随机变量的概率分布(probabilitydistribution)进行比较,我们可以知道在多少%的机会下会得到目前的结果。
倘若经比较后发现,出现这结果的机率很少,亦即是说,是在机会很少、很罕有的情况下才出现;那我们便可以有信心的说,这不是巧合,是具有统计学上的意义的(用统计学的话讲,就是能够拒绝虚无假设nullhypothesis,Ho)。
相反,若比较后发现,出现的机率很高,并不罕见;那我们便不能很有信心的直指这不是巧合,也许是巧合,也许不是,但我们没能确定。
F值和t值就是这些统计检定值,与它们相对应的概率分布,就是F分布和t分布。
统计显著性(sig)就是出现目前样本这结果的机率。
至於具体要检定的内容,须看你是在做哪一个统计程序。
【举一个例子】
比如,你要检验两独立样本均数差异是否能推论至总体,而行的t检验。
两样本(如某班男生和女生)某变量(如身高)的均数并不相同,但这差别是否能推论至总体,代表总体的情况也是存在著差异呢?
会不会总体中男女生根本没有差别,只不过是你那麼巧抽到这2样本的数值不同?
为此,我们进行t检定,算出一个t检定值,与统计学家建立的以「总体中没差别」作基础的随机变量t分布进行比较,看看在多少%的机会(亦即显著性sig值)下会得到目前的结果。
若显著性sig值很少,比如<0.05(少於5%机率),亦即是说,「如果」总体「真的」没有差别,那麼就只有在机会很少(5%)、很罕有的情况下,才会出现目前这样本的情况。
虽然还是有5%机会出错,但我们还是可以「比较有信心」的说:
目前样本中这情况(男女生出现差异的情况)不是巧合,是具统计学意义的,「总体中男女生不存差异」的虚无假设应予拒绝,简言之,总体应该存在著差异。
每一种统计方法的检定的内容都不相同,同样是t-检定,可能是上述的检定总体中是否存在差异,也同能是检定总体中的单一值是否等於0或者等於某一个数值。
至於F-检定,方差分析(或译变异数分析,AnalysisofVariance),它的原理大致也是上面说的,但它是透过检视变量的方差而进行的。
它主要用于:
均数差别的显著性检验、分离各有关因素并估计其对总变异的作用、分析因素间的交互作用、方差齐性(EqualityofVariances)检验等情况。
=================
方差齐性检验在什么情况下进行?
为什么要进行方差齐性检验?
如果需要进行方差分析,就要进行方差齐性检验,即若组间方差不齐则不适用方差分析。
但可通过对数变换、平方根变换、倒数变换、平方根反正弦变换等方法变换后再进行方差齐性检验,若还不行只能进行非参数检验.
除了对两个研究总体的总体平均数的差异进行显著性检验以外,我们还需要对两个独立样本所属总体的总体方差的差异进行显著性检验,统计学上称为方差齐性(相等)检验。
方差齐性实际上是指要比较的两组数据的分布是否一致,通俗的来说就是两者是否适合比较。
=================
为什么要做方差齐性和正态检验?
主要是确认数据的合理性(不具备相关性)而已。
正态分布以及近似正态分布是应用该分析的基本条件……
构造的统计量需要样本有正态等方差的条件,或者说是这样的条件情况下的一种判断,失去了这个前提,后期的判断分析都是空中楼阁。
就像讨论如何成为一个好男人,那么前提他必须是一个男人而且方差齐性检验的Bartlett方法也是以正太分布为前提的,其所构造的卡方统计量必须满足样本为正态分布。
=================
F检验与方差齐性检验
在方差分析的F检验中,是以各个实验组内总体方差齐性为前提的,因此,按理应该在方差分析之前,要对各个实验组内的总体方差先进行齐性检验。
如果各个实验组内总体方差为齐性,而且经过F检验所得多个样本所属总体平均数差异显著,这时才可以将多个样本所属总体平均数的差异归因于各种实验处理的不同所致;如果各个总体方差不齐,那么经过F检验所得多个样本所属总体平均数差异显著的结果,可能有一部分归因于各个实验组内总体方差不同所致。
但是,方差齐性检验也可以在F检验结果为多个样本所属总体平均数差异显著的情况下进行,因为F检验之后,如果多个样本所属总体平均数差异不显著,就不必再进行方差齐性检验。
=================
Levene方差齐性检验也称为Levene检验(Levene'sTest).
由H.Levene在1960年提出[1].M.B.Brown和A.B.Forsythe在1974年对Levene检验进行了扩展[2],使对原始数据的数据转换不但可以使用数据与算术平均数的绝对差,也可以使用数据与中位数和调整均数(trimmedmean)的绝对差.这就使得Levene检验的用途更加广泛.Levene检验主要用于检验两个或两个以上样本间的方差是否齐性.要求样本为随机样本且相互独立.国内常见的Bartlett多样本方差齐性检验主要用于正态分布的资料,对于非正态分布的数据,检验效果不理想.Levene检验既可以用于正态分布的资料,也可以用于非正态分布的资料或分布不明的资料,其检验效果比较理想.
=================
方差分析的条件之一为方差齐,即各总体方差相等。
因此在方差分析之前,应首先检验各样本的方差是否具有齐性。
常用方差齐性检验(testforhomogeneityofvariance)推断各总体方差是否相等。
本节将介绍多个样本的方差齐性检验,本法由Bartlett于1937年提出,称Bartlett法。
该检验方法所计算的统计量服从分布。
用自由度查界值表,若值大于等于界值,则P值小于等于相应的概率,反之,P值大于相应的概率。
如果未经校正的值小于界值,则校正后的值更小,可不必再计算校正值。
……
例5.7对照组、A降脂药组、B降脂药组和C降脂药组家兔的血清胆固醇含量(mmol/L)的均数分别为5.845、2.853、2.972和1.768,方差分别为5.941、2.370、0.517和0.581,样本含量分别为6、6、6和7,问四样本的方差是否齐同?
……
本例自由度为,查界值表,得0.025>P>0.01,按=0.05水准拒绝H0,接受H1,可以认为四总体方差不同或不全相同。
两个独立样本的方差齐性检验
例:
某市初中毕业班进行了一次数学考试,为了比较该市毕业班男女生成绩的离散程度,从男生中抽出一个样本,容量为31,从女考生中也抽出一个样本,容量为21.男女生成绩的方差分别为49和36,请问男女生成绩的离散程度是否一致
解:
1.提出假设
2.选择检验统计量并计算其值
3.统计决断查附表3,
得F(19,19)0.05=2.04
F=1.340.05,即男女生成绩的差异没有达到显著性差异.
两个相关样本的方差齐性检验
例子:
教科书164页.
综合应用
例1:
某省在高考后,为了分析男,女考生对语文学习上的差异,随机抽取了各20名男,女考生的语文成绩,并且计算得到男生平均成绩=54.6,标准差=16.9,女生的平均成绩=59.7,标准差=10.4,试分析男,女考生语文高考成绩是否有显著差异
解:
先进行方差齐性检验:
1.提出假设
2.计算检验的统计量
3.统计决断查附表3,
得F(19,19)0.05=2.16
F=2.64>F(19,19)0.05=2.16,p<0.05,即方差不齐性.
然后,进行平均数差异的显著性检验:
1.提出假设
2.计算检验的统计量
3.确定检验形式
双侧检验
4.统计决断
1.120.05
所以,要保留零假设,即男,女考生语文高考成绩无显著差异.
例2:
为了对某门课的教学方法进行改革,某大学对各方面情况相似的两个班进行教改实验,甲班32人,采用教师面授的教学方法,乙班25人,采用教师讲授要点,学生讨论的方法.一学期后,用统一试卷对两个班学生进行测验,得到以下结果:
甲班平均成绩=80.3,标准差=11.9,乙班平均成绩=86.7,标准差=10.2,试问两种教学方法的效果是否有显著性差异
解:
先进行方差齐性检验:
1.提出假设
2.计算检验的统计量
3.统计决断查附表3,
得F(31,24)0.05=1.94
F=1.350.05,即方差齐性.
然后,进行平均数差异的显著性检验:
1.提出假设
2.计算检验的统计量
3.确定检验形式
双侧检验
4.统计决断
当df=55时,
t=2.105>2.009,P<0.05
所以,要在0.05的显著性水平上零假设,即两种教学方法的效果有显著性差异.
=================
哪位高手能帮我解释一下方差和SPSS?
问题补充:
先对数据进行方差齐次性检验,必要时,对数据进行反正弦平方根转换。
根据实验的要求分别进行单因素、双因素和三因素方差分析(ANOVA)。
在满足方差齐性的情况下,采用Tukey检验进行多重比较;方差非齐的情况下,采用Dunnett’sT3检验进行多重比较,确定哪些处理间的差异达到显著水平。
方差是用来比较两组数据的整齐程度,例如,两人打靶,各有一组成绩,且平均分相同,那么谁的成绩好呢?
用方差比较一下,数值小的成绩稳定。
其实在excel中的分析工具里,也可以进行方差和t校验的分析。
=================
问题:
我用spss做出的结果如下:
1.在Levene'sTestforEqualityofVariances一栏中F值为2.36,Sig.为.128是不是就应该看第一排的数据?
是不是说明没有显著差异呢?
2.在t-testforEqualityofMeans中的Sig.(2-tailed)里,两排都是.000第一排的其它数据为:
t=8.892,df=84,MeanDifference=22.99
3.到底看哪个Levene'sTestforEqualityofVariances一栏中sig,还是看t-testforEqualityofMeans中那个Sig.(2-tailed)啊?
我得出的这个结果倒底是显著不显著呢?
4.还有最后一个问题,我做的是T检验为什么会有F值呢?
最佳答案
t检验过程,是对两样本均数(mean)差别的显著性进行检验。
惟t检验须知道两个总体的方差(Variances)是否相等;t检验值的计算会因方差是否相等而有所不同。
也就是说,t检验须视乎方差齐性(EqualityofVariances)结果。
所以,SPSS在进行t-testforEqualityofMeans的同时,也要做Levene'sTestforEqualityofVariances。
1.在Levene'sTestforEqualityofVariances一栏中F值为2.36,Sig.为.128,表示方差齐性检验「没有显著差异」,即两方差齐(EqualVariances),故下面t检验的结果表中要看第一排的数据,亦即方差齐的情况下的t检验的结果。
2.在t-testforEqualityofMeans中,第一排(Variances=Equal)的情况:
t=8.892,df=84,2-TailSig=.000,MeanDifference=22.99
既然Sig=.000,亦即,两样本均数差别有显著性意义!
3.到底看哪个Levene'sTestforEqualityofVariances一栏中sig,还是看t-testforEqualityofMeans中那个Sig.(2-tailed)啊?
答案是:
两个都要看。
先看Levene'sTestforEqualityofVariances,如果方差齐性检验「没有显著差异」,即两方差齐(EqualVariances),故接著的t检验的结果表中要看第一排的数据,亦即方差齐的情况下的t检验的结果。
反之,如果方差齐性检验「有显著差异」,即两方差不齐(UnequalVariances),故接著的t检验的结果表中要看第二排的数据,亦即方差不齐的情况下的t检验的结果。
4.你做的是T检验,为什么会有F值呢?
就是因为要评估两个总体的方差(Variances)是否相等,要做Levene'sTestforEqualityofVariances,要检验方差,故所以就有F值。
=================
1.方差分析的概念
方差分析(ANOVA)又称变异数分析或F检验,其目的是推断两组或多组资料的总体均数是否相同,检验两个或多个样本均数的差异是否有统计学意义。
我们要学习的主要内容包括单因素方差分析即完全随机设计或成组设计的方差分析和两因素方差分析即配伍组设计的方差分析。
2.方差分析的基本思想
下面我们用一个简单的例子来说明方差分析的基本思想:
如某克山病区测得11例克山病患者和13名健康人的血磷值(mmol/L)如下,
患者:
0.841.051.201.201.391.531.671.801.872.072.11
健康人:
0.540.640.640.750.760.811.161.201.341.351.481.561.87
问该地克山病患者与健康人的血磷值是否不同?
从以上资料可以看出,24个患者与健康人的血磷值各不相同,如果用离均差平方和(SS)描述其围绕总均数的变异情况,则总变异有以下两个来源:
(1)组内变异,即由于随机误差的原因使得各组内部的血磷值各不相等;
(2)组间变异,即由于克山病的影响使得患者与健康人组的血磷值均数大小不等。
而且:
SS总=SS组间+SS组内v总=v组间+v组内
如果用均方MS(离均差平方和SS/自由度v,)代替离均差平方和以消除各组样本数不同的影响,则方差分析就是用组内均方去除组间均方的商(即F值)与1相比较,若F值接近1,则说明各组均数间的差异没有统计学意义,若F值远大于1,则说明各组均数间的差异有统计学意义。
实际应用中检验假设成立条件下F值大于特定值的概率可通过查阅F界值表(方差分析用)获得。
3.方差分析的应用条件
应用方差分析对资料进行统计推断之前应注意其使用条件,包括:
(1)可比性,若资料中各组均数本身不具可比性则不适用方差分析。
(2)正态性,即偏态分布资料不适用方差分析。
对偏态分布的资料应考虑用对数变换、平方根变换、倒数变换、平方根反正弦变换等变量变换方法变为正态或接近正态后再进行方差分析。
(3)方差齐性,即若组间方差不齐则不适用方差分析。
多个方差的齐性检验可用Bartlett法,它用卡方值作为检验统计量,结果判断需查阅卡方界值表。
二、方差分析的主要内容
根据资料设计类型的不同,有以下两种方差分析的方法:
1.对成组设计的多个样本均数比较,应采用完全随机设计的方差分析,即单因素方差分析。
2.对随机区组设计的多个样本均数比较,应采用配伍组设计的方差分析,即两因素方差分析。
两类方差分析的基本步骤相同,只是变异的分解方式不同,对成组设计的资料,总变异分解为组内变异和组间变异(随机误差),即:
SS总=SS组间+SS组内,而对配伍组设计的资料,总变异除了分解为处理组变异和随机误差外还包括配伍组变异,即:
SS总=SS处理+SS配伍+SS误差。
整个方差分析的基本步骤如下:
(1)建立检验假设;
H0:
多个样本总体均数相等。
H1:
多个样本总体均数不相等或不全等。
检验水准为0.05。
(2)计算检验统计量F值;
(3)确定P值并作出推断结果。
三、多个样本均数的两两比较
经过方差分析若拒绝了检验假设,只能说明多个样本总体均数不相等或不全相等。
若要得到各组均数间更详细的信息,应在方差分析的基础上进行多个样本均数的两两比较。
1.多个样本均数间两两比较
多个样本均数间两两比较常用q检验的方法,即Newman-kueuls法,其基本步骤为:
建立检验假设-->样本均数排序-->计算q值-->查q界值表判断结果。
2.多个实验组与一个对照组均数间两两比较
多个实验组与一个对照组均数间两两比较,若目的是减小第II类错误,最好选用最小显著差法(LSD法);若目的是减小第I类错误,最好选用新复极差法,前者查t界值表,后者查q’界值表
=================
egg1022请问老师,我们做作业时可以用计算机做方差齐性的检验,那考试中呢?
默认为齐性吗?
还需再说明吗?
medista
一般根据样本方差来判断,如果样本方差相差不大,一般不用做方差齐性检验。
而如果样本方差相差比较大(比如相差3倍以上)时,则要怀疑方差不齐,需要进行总体方差齐性检验。
用SPSS做时,自动给出方差齐性检验;考试的时候,可以根据实际资料判断。
egg1022请问老师,
(1)假如S1=1 S2=3.5,我是否可以这样说:
因为S2〉3S1,所以认为两样本方差不齐,故应用近似t检验。
(2)两方差相差3倍是否就是通常所用的判断标准?
谢谢老师:
)
medista
不是这样的。
(1)我们比较的样本方差,而不是标准差。
你举的例子,样本方差已经相差12倍以上了。
(2)3倍只是个例子,说明样本方差相差比较大而已(就象我们教材上所说的样本量n>60为大样本一样),只起提示作用。
并没有定理说明样本方差相差3倍以上总体方差就不齐。
总体方差是否齐性,还需要进行检验。
切记切记
比如你举的例子,样本方差相差很大,提示总体方差不齐,要进行检验。
严格来说,方差齐不齐,都需要进行检验。
egg1022老师,
(1)那假如说考试中两样本方差相差很大,提示总体方差不齐,没有计算机,怎么行检验呢?
(2)假设检验中要求样本服从正态分布的,可为何例题(哪怕是小样本)不作正态分析呢?
(3)在我看的一篇文献中,作者把受试对象分为4组,分别进行配对检验,为何他a取值不一致呢?
有的组用0.05,有的用0.01,这样可以吗?
呵呵,问题有点多,谢谢老师!
Medista
(1)不要总盯着考试,老师们知道那时候没有计算机,也不能查表,不会让你为难。
(2)“假设检验中要求样本服从正态分布”?
要严谨,同学!
本章只讲t检验,只说t检验的条件。
注意,是要求“总体”服从正态分布,这里还要注意是哪种t检验,要求哪个总体是正态的。
比如配对t检验要求差值的总体服从正态分布,两样本t检验要求相应的两总体服从正态分布。
至于书上为什么不进行正态性检验,我想应该是为了编教材方便,默认总体是正态的吧,汗一个~~~~~~
(3)没见到文献不便发表意见,呵呵。
至于为什么检验水准不一,如果是同一类数据,同一个指标,采用不同的检验水平,估计作者是根据P值然后才确定的alhpa,你别学他就好了。
杂志中存在的统计问题太多,注意别被误导。
=================
方差齐性检验的原理:
除了对两个研究总体的总体平均数的差异进行显著性检验以外,我们还需要对两个独立样本所属总体的总体方差的差异进行显著性检验,统计学上称为方差齐性(相等)检验。
对两个研究总体进行总体方差齐性的显著性检验,同两个总体平均数差异的显著性检验的步骤一样。
首先提出两个总体方差没有差异的零假设,即,和备择假设。
然后从两个研究总体中各抽取容量分别为两个样本,通过比较两个样本方差之间的差异,来推断两个总体方差之间的差异。
对于两个样本方差的比较,采用的是比商的方法,因为统计学家已经证明的比值的抽样分布服从F分布,记为:
……
F分布有两个自由度,称为分子的自由度,称为分母的自由度,把称为F统计量。
图5.2为F分布的曲线图。
F分布的形态随F比值分子和分母中自由度的变化而形成一簇正偏态分布的曲线。
……
各种自由度组合所形成的理论F值,可以查F值表,见附表4。
表的最上端横行表示F比值中分子的自由度,最左端纵列表示分母的自由度,附表3
(1)、3
(2)表示α=0.05的显著性水平的F临界值,附表3(3)、3(4)表示α=0.01的显著性水平的F临界值。
F值表只列有右侧临界值,所以在计算F统计量的值时,必须将样本方差较大的一个作分子,较小的一个作分母,使得F≧1,(LXK查书后注:
表上有:
分子v1是较大均方的自由度,分母v2是较小均方的自由度)以便可以同F值表中的临界值进行比较并作出决断:
如果通过计算得到的F值大于临界值,就拒绝零假设;如果通过计算得到的F值小于临界值,就接受零假设。
在进行OneWayANOVA时若出现方差齐性不满足时,一般来说可以进行数据变换后再进行方差分析。
在SPSS中进行方差分析时,Tamhane'sT2等方法不用假定方差相等(EqualVariancesNotAssumed),可以用。
其实这种情况下选非参数方法可能更好一些。
至于删除一些数据,在统计学中有一些剔除异常值的方法可用,但正如楚鱼所说“那些零值显然不是异常值——明显偏离变量范围的值,是没有理由删除的”。
可行的选择也许是仔细分析你的数据,找到引起不齐的原因(这一点你已找到了)及其生态学的意义。
分析之后也许会发现,可能有更好的方法可以解决问题。
统计分析的目的是为了解决问题或发现问题,而不是一定要用某个方法分析数据
=================
单因素方差分析中,方差不齐,是不是就得用