方差分析几个案例.docx
《方差分析几个案例.docx》由会员分享,可在线阅读,更多相关《方差分析几个案例.docx(41页珍藏版)》请在冰豆网上搜索。
方差分析几个案例
方差分析方式
方差分析是统计分析方式中,最重要、最常常利用的方式之一。
本文应用多个实例来阐明方差分析的应用。
在实际操作中,可采用相应的统计分析软件来进行计算。
1.方差分析的意义、用途及适用条件
方差分析的意义
方差分析又称为变异数分析或F查验,其大体思想是把全数观察值之间的变异(总变异),按设计和需要分为二个或多个组成部份,再作分析。
即把全数资料的总的离均差平方和(SS)分为二个或多个组成部份,其自由度也分为相应的部份,每部份表示必然的意义,其中至少有一个部份表示各组均数之间的变异情形,称为组间变异(MS组间);另一部份表示同一组内个体之间的变异,称为组内变异(MS组内),也叫误差。
SS除以相应的自由度(υ),得均方(MS)。
如MS组间>MS组内若干倍(此倍数即F值)以上,则表示各组的均数之间有显著性不同。
方差分析在环境科学研究中,常常利用于分析实验数据和监测数据。
在环境科学研究中,各类因素的改变都可能对实验和监测结果产生不同程度的影响,因此,能够通过方差分析来弄清与研究对象有关的各个因素对该对象是不是存在影响及影响的程度和性质。
方差分析的用途
两个或多个样本均数的比较。
分离各有关因素,别离估量其对变异的影响。
分析两因素或多因素的交叉作用。
方差齐性查验。
方差分析的适用条件
各组数据均应服从正态散布,即均为来自正态整体的随机样本(小样本)。
各抽样整体的方差齐。
影响数据的各个因素的效应是能够相加的。
对不符合上述条件的资料,可用秩和查验法、近似F值查验法,也能够通过变量变换,使之大体符合后再按其变换值进行方差分析。
一般属Poisson散布的计数资料常常利用平方根变换法;属于二项散布的百分数可用终归弦函数变换法;当标准差与均数之间呈正比关系,用平方根变换法又不易校正时,也可用对数变换法。
2.单因素方差分析(单因素多个样本均数的比较)
按照某一实验因素,将实验对象按完全随机设计分为若干个处置组(各组的样本含量可相等或不等),别离求出各组实验结果的均数,即为单因素多个样本均数。
用方差分析比较多个样本均数的目的是推断各类处置的效果有无显著性不同,如各组方差齐,则用F查验;如方差不齐,用近似F值查验,或经变量变换后达到方差齐,再用变换值作F查验。
如经F查验或近似F值查验,结论为各整体均数不等,则只能以为各整体均数之间总的来讲有不同,但不能以为任何两整体均数之间都有不同,或某两整体均数之间有不同。
必要时应作均数之间的两两比较,以判断究竟是哪几对整体均数之间存在不同。
在环境科学研究中,常常要分析比较不同季节对江、河、湖水中某种污染物的含量有无显著性影响;各类气象条件如风向、风速、温度对大气中某种污染物含量的影响等问题。
咱们把季节、风向、风速、温度等称为因素。
仅按不同季节,或不同的风向,或不同的温度来分组,称为单因素。
例1某年度某湖不同季节湖水中氯化物含量(mg/L)测定结果如表—所示。
试比较不同季节湖水中氯化物含量有无显著性不同。
从表—1的测定结果可见有三种变异:
1.组内变异:
每一个季节内部的各次测定结果不尽相同,但显然不是季节的影响,而只是由于误差(如个体不同、随机测量误差等)所致。
2.组间变异:
各个季节的均数也不相同,说明季节对湖水中氯化物的含量可能有必然的影响,也包括误差的作用。
3.总变异:
32次测定结果都不尽相同,既可能受季节的影响,也包括误差的作用。
不同季节湖水中氯化物含量的均数之间的变异究竟是由于误差所致,仍是由于不同季节的影响,能够用方差分析来解决此问题。
方差分析可表示:
⑴从总变异中分出组间变异和组内变异,并用数量表示变异的程度。
⑵将组间变异和组内变异进行比较,如二者相差甚微,说明季节影响不大;如二者相差较大,组间变异比组内变异大得多,说明季节影响不容轻忽。
以下是三种变异的计算方式:
多个方差的齐性查验
已知多个样本(理论上均来自正态整体)方差,能够据此推断它们所别离代表的整体方差是不是相等,即多个方差的齐性查验。
其常常利用于:
⑴说明多组变量值的变异度有无不同。
⑵方差齐性查验。
以例1为例(各组样本含量相等),如表—4所示。
3.肯定P值:
按照υ=4—1=3,查附表—12得P<。
4.判断结果:
由于P<,因此,四组方差不齐。
近似F值查验(F'查验)
以例2为例,如表—6所示。
公式26最常常利用,公式27适用于原数据中有小值和零时。
K为常数,能够按照需要选用适合的数值。
⑵对数变换的用途:
①当几个样本均数作比较时,如样本方差不齐,尤其是当标准差与均数之比的比值接近时,必需经对数变换以缩小各方差之间的不同,达到方差齐后才能进行t查验或方差分析。
②适用于呈对数正态散布的资料。
③在曲线拟合中,对数变换常常是直线化的重要手腕,如指数曲线、双曲线、logistic曲线的直线化等。
例3欲用t查验比较某河丰水期和枯水期的河水BOD5(mg/L)含量均数,资料如表—7所示。
此数据可否直接用t查验方式?
如不能,试作变量变换。
二者比较接近,能够试用对数变换。
⑶将X作“lgX+1”变换后,再作方差齐性查验,得F=,P>,两组方差齐,能够用变换值作两样本均数比较的t查验。
2.平方根变换
以原数据的平方根作为统计分析的变量值,称为平方根变换。
⑴平方根变换的形式:
⑶百分数的概率单位变换:
主要用于S形或反S形曲线的直线化、正态性查验,尤其适用于剂量反映曲线的直线化。
⑷百分数的logit变换:
主要用于S形或反S形曲线的直线化。
⑸反双曲正切变换:
用于两直线相关系数的比较与归并。
4.两因素方差分析(双因素多个样本均数的比较)
将实验对象按性质相同或相近者组成配伍组,每一个配伍组有三个或三个以上实验对象,然后随机分派到各个处置组。
如此,分析数据时将同时考虑两个因素的影响,实验效率较高。
例5某市为了研究一日中不同时点和不同区域大气中氮氧化物含量的转变情形,该市环保所于某年1月15~19日,在市区选择了7个采样点,对大气中氮氧化物的含量进行测定。
表—9为各个采样点每一个时点五天的平均含量,试分析不同时点、不同区域氮氧化物含量之间有无显著性不同。
5.多因素方差分析(多因素多个样本均数的比较)
在环境科学研究中,所研究的事物或现象往往是比较复杂的多因素问题,而各类因素本身尚有程度的不同,其间往往又存在交互作用。
当研究的因素在三个或三个以上时,能够用正交实验法。
正交实验是一种高效、快速的多因素实验方式。
正交实验的设计与分析见另外章节。
“多因素多个样本均数的比较”不仅能够用于正交实验,也能够用于拉丁方实验分析与析因实验分析等。
6.多个样本均数间的两两比较(多重比较)
经方差分析后,若是各整体均数有显著性不同时,常需进一步肯定哪两个整体均数间有显著性不同,哪两个之间无显著性不同。
因此,能够利用方差分析提供的信息作样本均数间的两两比较。
以例5为例:
(每组样本含量相等)经方差分析后,以为不同时点和不同区域的氮氧化物含量之间均有高度显著性不同。
此刻需要进一步查验不同时点的氮氧化物含量均数两两之间有无显著性不同。
查验步骤如下:
1.查验假设:
各时点的氮氧化物含量均数之间两两相等。
⑷q值的计算方式与上例相同。
3.肯定P值与判断结果如表—13所示。