方差分析几个案例.docx
《方差分析几个案例.docx》由会员分享,可在线阅读,更多相关《方差分析几个案例.docx(41页珍藏版)》请在冰豆网上搜索。
方差分析几个案例
方差分析几个案例
方差分析方法
方差分析是统计分析方法中,最重要、最常用的方法之一。
本文应用多个实例来阐明方差分析的应用。
在实际操作中,可采用相应的统计分析软件来进行计算。
1.方差分析的意义、用途及适用条件
1.1方差分析的意义
方差分析又称为变异数分析或F检验,其基本思想是把全部观察值之间的变异(总变异),按设计和需要分为二个或多个组成部分,再作分析。
即把全部资料的总的离均差平方和(SS)分为二个或多个组成部分,其自由度也分为相应的部分,每部分表示一定的意义,其中至少有一个部分表示各组均数之间的变异情况,称为组间变异(MS组间);另一部分表示同一组内个体之间的变异,称为组内变异(MS组内),也叫误差。
SS除以相应的自由度(υ),得均方(MS)。
如MS组间>MS组内若干倍(此倍数即F值)以上,则表示各组的均数之间有显著性差异。
方差分析在环境科学研究中,常用于分析试验数据和监测数据。
在环境科学研究中,各种因素的改变都可能对试验和监测结果产生不同程度的影响,因此,可以通过方差分析来弄清与研究对象有关的各个因素对该对象是否存在影响及影响的程度和性质。
1.2方差分析的用途
1.2.1两个或多个样本均数的比较。
1.2.2分离各有关因素,分别估计其对变异的影响。
1.2.3分析两因素或多因素的交叉作用。
1.2.4方差齐性检验。
1.3方差分析的适用条件
1.3.1各组数据均应服从正态分布,即均为来自正态总体的随机样本(小样本)。
1.3.2各抽样总体的方差齐。
1.3.3影响数据的各个因素的效应是可以相加的。
1.3.4对不符合上述条件的资料,可用秩和检验法、近似F值检验法,也可以经过变量变换,使之基本符合后再按其变换值进行方差分析。
一般属Poisson分布的计数资料常用平方根变换法;属于二项分布的百分数可用反正弦函数变换法;当标准差与均数之间呈正比关系,用平方根变换法又不易校正时,也可用对数变换法。
2.单因素方差分析(单因素多个样本均数的比较)
根据某一试验因素,将试验对象按完全随机设计分为若干个处理组(各组的样本含量可相等或不等),分别求出各组试验结果的均数,即为单因素多个样本均数。
用方差分析比较多个样本均数的目的是推断各种处理的效果有无显著性差异,如各组方差齐,则用F检验;如方差不齐,用近似F值检验,或经变量变换后达到方差齐,再用变换值作F检验。
如经F检验或近似F值检验,结论为各总体均数不等,则只能认为各总体均数之间总的来说有差异,但不能认为任何两总体均数之间都有差异,或某两总体均数之间有差异。
必要时应作均数之间的两两比较,以判断究竟是哪几对总体均数之间存在差异。
在环境科学研究中,常常要分析比较不同季节对江、河、湖水中某种污染物的含量有无显著性影响;各种气象条件如风向、风速、温度对大气中某种污染物含量的影响等问题。
我们把季节、风向、风速、温度等称为因素。
仅按不同季节,或不同的风向,或不同的温度来分组,称为单因素。
例1某年度某湖不同季节湖水中氯化物含量(mg/L)测定结果如表—6.1所示。
试比较不同季节湖水中氯化物含量有无显著性差异。
从表—1的测定结果可见有三种变异:
1.组内变异:
每个季节内部的各次测定结果不尽相同,但显然不是季节的影响,而只是由于误差(如个体差异、随机测量误差等)所致。
2.组间变异:
各个季节的均数也不相同,说明季节对湖水中氯化物的含量可能有一定的影响,也包括误差的作用。
3.总变异:
32次测定结果都不尽相同,既可能受季节的影响,也包括误差的作用。
不同季节湖水中氯化物含量的均数之间的变异究竟是由于误差所致,还是由于不同季节的影响,可以用方差分析来解决此问题。
方差分析可表示:
⑴从总变异中分出组间变异和组内变异,并用数量表示变异的程度。
⑵将组间变异和组内变异进行比较,如二者相差甚微,说明季节影响不大;如二者相差较大,组间变异比组内变异大得多,说明季节影响不容忽视。
以下是三种变异的计算方法:
3.1多个方差的齐性检验
已知多个样本(理论上均来自正态总体)方差,可以据此推断它们所分别代表的总体方差是否相等,即多个方差的齐性检验。
其常用于:
⑴说明多组变量值的变异度有无差异。
⑵方差齐性检验。
以例1为例(各组样本含量相等),如表—4所示。
3.确定P值:
根据υ=4—1=3,查附表—12得P<0.005。
4.判断结果:
由于P<0.005,因此,四组方差不齐。
3.2近似F值检验(F'检验)
以例2为例,如表—6所示。
公式26最常用,公式27适用于原数据中有小值和零时。
K为常数,可以根据需要选用合适的数值。
⑵对数变换的用途:
①当几个样本均数作比较时,如样本方差不齐,尤其是当标准差与均数之比的比值接近时,必须经对数变换以缩小各方差之间的差别,达到方差齐后才能进行t检验或方差分析。
②适用于呈对数正态分布的资料。
③在曲线拟合中,对数变换常常是直线化的重要手段,如指数曲线、双曲线、logistic曲线的直线化等。
例3欲用t检验比较某河丰水期和枯水期的河水BOD5(mg/L)含量均数,资料如表—7所示。
此数据能否直接用t检验方法?
如不能,试作变量变换。
二者比较接近,可以试用对数变换。
⑶将X作“lgX+1”变换后,再作方差齐性检验,得F=1.72,P>0.05,两组方差齐,可以用变换值作两样本均数比较的t检验。
2.平方根变换
以原数据的平方根作为统计分析的变量值,称为平方根变换。
⑴平方根变换的形式:
⑶百分数的概率单位变换:
主要用于S形或反S形曲线的直线化、正态性检验,尤其适用于剂量反应曲线的直线化。
⑷百分数的logit变换:
主要用于S形或反S形曲线的直线化。
⑸反双曲正切变换:
用于两直线相关系数的比较与合并。
4.两因素方差分析(双因素多个样本均数的比较)
将试验对象按性质相同或相近者组成配伍组,每个配伍组有三个或三个以上试验对象,然后随机分配到各个处理组。
这样,分析数据时将同时考虑两个因素的影响,试验效率较高。
例5某市为了研究一日中不同时点以及不同区域大气中氮氧化物含量的变化情况,该市环保所于某年1月15~19日,在市区选择了7个采样点,对大气中氮氧化物的含量进行测定。
表—9为各个采样点每个时点五天的平均含量,试分析不同时点、不同区域氮氧化物含量之间有无显著性差异。
5.多因素方差分析(多因素多个样本均数的比较)
在环境科学研究中,所研究的事物或现象往往是比较复杂的多因素问题,而各种因素本身尚有程度的差别,其间往往又存在交互作用。
当研究的因素在三个或三个以上时,可以用正交试验法。
正交试验是一种高效、快速的多因素试验方法。
正交试验的设计与分析见另外章节。
“多因素多个样本均数的比较”不仅可以用于正交试验,也可以用于拉丁方试验分析与析因试验分析等。
6.多个样本均数间的两两比较(多重比较)
经方差分析后,如果各总体均数有显著性差异时,常需进一步确定哪两个总体均数间有显著性差异,哪两个之间无显著性差异。
因此,可以利用方差分析提供的信息作样本均数间的两两比较。
以例5为例:
(每组样本含量相等)经方差分析后,认为不同时点以及不同区域的氮氧化物含量之间均有高度显著性差异。
现在需要进一步检验不同时点的氮氧化物含量均数两两之间有无显著性差异。
检验步骤如下:
1.检验假设:
各时点的氮氧化物含量均数之间两两相等。
⑷q值的计算方法与上例相同。
3.确定P值与判断结果如表—13所示。