数据、模型与决策-教学课件作者-李连友-第6章-方差分析.ppt
《数据、模型与决策-教学课件作者-李连友-第6章-方差分析.ppt》由会员分享,可在线阅读,更多相关《数据、模型与决策-教学课件作者-李连友-第6章-方差分析.ppt(43页珍藏版)》请在冰豆网上搜索。
第第6章章方差分析方差分析学习目标学习目标1、掌握方差分析中的基本概念;2、掌握方差分析的基本思想和原理;3、掌握单因子方差分析的方法及应用;4、初步了解多重比较方法的应用;5、掌握双因子方差分析的方法及应用。
方差分析方差分析6.16.1方差分析的基本问题方差分析的基本问题6.26.2单因子方差分析单因子方差分析6.36.3双因子方差分析双因子方差分析6.1.1方差分析的基本概念方差分析的基本概念方差分析方差分析就是分析推断各种因素状态对所观测变量的影响效应的一种统计分析方法。
其主要目的是通过对方差的比较来检验多个均值之间差异的显著性。
方差分析方法是20世纪20年代由英国统计学家费希尔(R.A.Fisher)最早提出的,开始应用于生物和农业田间试验,以后在许多学科领域得到了广泛应用。
在方差分析中,实际测量的、作为结果的变量称为响应变量响应变量或因变因变量量,而作为原因的、把观测结果分成几个组以进行比较的变量称为因子因子或自变量自变量方差分析可以研究一个定量响应变量与一个或多个定性因子的关系,复杂的方差分析模型甚至可以分析多个定量响应变量与多个定性和定量因子之间的关系。
方差分析可以用于对观察数据或者实验数据的分析,但用于实验数据的情况更多一些.在方差分析中,因子的不同表现,也就是每个因子的不同取值称为因子水平因子水平(简称水平)。
只有一个因子的方差分析称为单因子方差分析单因子方差分析;如果要同时研究多个因子对响应变量的影响,则称为多多因子方差分析因子方差分析。
其中最简单的情况是双因子方差分析。
6.1.2方差分析中的基本假方差分析中的基本假设方差分析是方差分析是对多个多个总体均体均值是否相等的比是否相等的比较。
比。
比较中需中需要以下三个假要以下三个假设条件:
条件:
(1)对于每个于每个总体,响体,响应变量都服从正量都服从正态分布分布
(2)所有)所有总体响体响应变量的方差都相等量的方差都相等(3)各个)各个观测值之之间都相互独立都相互独立6.1.3方差分析的基本原理方差分析的基本原理方差分析就是通过不同方差的比较,做出拒绝或者不能拒绝零假设(不同水平的均值相等)的判断.6.26.2单因子方差分析单因子方差分析6.2.1单因子方差分析的数据因子方差分析的数据结构和模型构和模型单因子方差分析就是在假设其他条件不变的情况下,对某个特定因子的各个不同水平对响应变量的作用进行考察分析。
在单因子方差分析模型中,任何一个样本数据都包含了三部分因素的影响:
总体平均水平的影响;因子水平的影响;以及随机因素的影响。
单因子方差分析模型可以写成公式:
6.2.26.2.2单单因子方差分析的基本方法因子方差分析的基本方法为了计算组内方差和组间方差,需要讨论有关总离差平总离差平方和方和(SST)的分解问题。
总离差平方和也称为总变差总变差,它是所有数据中每个数据与总平均数离差平方之和。
总离差平方和可以分解成组间离差平方和与组内离差平方和两个组成部分。
组间离差平方和组间离差平方和(SSA)也称为解释的变差解释的变差,它是各组(不同水平)均值与所有样本总均值离差平方之和。
组内离差平方和组内离差平方和(SSE),是由不可控因素(例如不可控制的个体差异,随机因素,测量误差等)引起的与自变量无关的变差,还需要分别对组间离差平方和与组内离差平方和进行平均,即分别用两种平方和除以它们的自由度.6.2.3单因子方差分析的程序因子方差分析的程序一个完整的方差分析过程需要经过以下程序:
1.建立零假设和备择假设;单因子方差分析表单因子方差分析表4.确定决策规则并得出检验结论。
1.1.各个水平下样本容量都相同时的方差分析各个水平下样本容量都相同时的方差分析例:
不同最低生活保证金政策对就业人数影响(3)列方差分析表*利用利用ExcelExcel进行最低生活保证金案例的方差分析进行最低生活保证金案例的方差分析2.2.各个水平下样本容量不都相同时的方差分析各个水平下样本容量不都相同时的方差分析方差分析的程序如下:
(1)对方差分析的基本假设进行检验正态性假设、等方差的检验
(2)零假设:
雨林采伐对林木数量没有显著影响;备择假设:
雨林采伐对林木数量有显著影响。
6.2.5方差分析中的多重比方差分析中的多重比较探明哪些均值之间有显著差异还需要采用多重比较的方法进行分析。
这在方差分析中称为事后检验事后检验。
多重比较多重比较是对各个总体均值进行的两两比较。
统计中有很多种方法可以用来进行多重比较,如Fisher最小显著差异(LSD)方法、Tukey的诚实显著差异(HSD)方法或Bonferroni的方法等。
Fisher的最小显著差异方法:
SPSS对雨林采伐研究的输出结果6.36.3双因子方差分析双因子方差分析方差分析可以同时分析多个因子对响应变量的影响。
如果同时考察的因子有两个,那么就称为双因子方差分析,也称为两向分类的方差分析或两种方式分组的方差分析。
如果同时考察的因素有三个,那么就称为三因子方差分析,等等。
两个和两个以上因子的方差分析,可统称为多因子方差分析。
在多因子方差分析中,不仅要考察各个因子单独对响应变量的影响,而且还要考察几个因子的不同搭配对响应变量是否有综合影响,这种几个因子的不同水平搭配所产生的影响称为交互作用交互作用。
分析两因子间的交互作用,就必须至少对各因子的不同水平组合实验观测两次以上。
6.3.1无交互作用的双因子方差分析模型无交互作用的双因子方差分析模型总离差平方和可以分解为3个来源:
因子A、因子B和误差因素导致的变差。
用方差分析表表示:
6.3.2有交互作用的双因子方差分析模型有交互作用的双因子方差分析模型有交互作用的双因子方差分析表6.3.3双因子方差分析的程序双因子方差分析的程序6.3.4双因子方差分析双因子方差分析应用用举例例华润塑胶厂在生塑胶厂在生产一种塑胶跑道一种塑胶跑道产品的品的过程中,需要使用两种添加程中,需要使用两种添加剂以提高以提高产品的品的强强度,度,记这两种添加两种添加剂分分别为A和和B。
为了了寻找到两种添加找到两种添加剂使用数量的最佳使用数量的最佳组合,合,该厂生厂生产技技术部部门的人的人员选取了取了A种添加种添加剂的的3个数量水平,并个数量水平,并选取了取了B种添加种添加剂的的4个数量水平,共个数量水平,共形成了形成了34=12种种组合,合,对每一每一组合合进行了行了2次次实验观测,总共得到了共得到了342=24个数据个数据2.计算F检验值:
3.将上述计算结果列为方差分析表:
*利用利用ExcelExcel进行双因子方差分析进行双因子方差分析第1步,进入Excel表格界面,将数据输入第3步:
得到分析结果如表6.3.5双因子方差分析的各种效双因子方差分析的各种效应多重比多重比较同单因子方差分析一样,还需要对两因子的各种不同组合的效应进行相互比较,找出对我们所关心的对响应变量影响效果最好的因子水平和水平组合,由于两因子的各种不同水平及其相互组合可能很多,通常的做法是,只估计两个因子不同水平的每一组合的总效应,然后通过对各个因子水平组合的总效应的比较,找出最佳的两因子水平组合。
以借助于平面直角坐标系上的图形来显示各个不同水平组合的总效应。
也就是在平面直角坐标系内,用横轴表示两因子中的某一个因子的各个水平,用纵轴表示一个因子的各个水平在各个水平组合下实验观测变量的平均值,标出各个水平组合点,并将另一个因子的同一水平的点依次用线段相连,形成多条折线图,通过对各条折线图上各个组合点纵轴数值的比较就可以明确地显示出哪些组合对于观测变量具有较好的效应。
本章小结本章小结方差分析,一般用来分析一个定量响应变量与一个或几个定性自变量(因子)之间的关系,它可以对多个总体的均值是否相等进行整体检验。
根据研究所涉及因素的多少,方差分析可分为单因子方差分析和多因子方差分析。
基本思想,将观察值之间的总变异分解为由所研究的因素引起的变差和由随机误差项引起的变差,通过对这两类变差的比较(F检验),做出拒绝或不能拒绝零假设的判断。
主要步骤:
建立假设;计算F检验值;列方差分析表;根据实际值与临界值的比较做出决策。
实际的计算过程可通过计算机完成。
在方差分析中,当拒绝H0时,表明在所有的总体中至少有两个总体的均值存在显著差异。
但要知道哪些均值之间有显著差异还需要进行多重比较。