协方差分析.docx
《协方差分析.docx》由会员分享,可在线阅读,更多相关《协方差分析.docx(13页珍藏版)》请在冰豆网上搜索。
![协方差分析.docx](https://file1.bdocx.com/fileroot1/2022-12/11/a96acb34-c6e9-42ac-bb42-ab183a93f056/a96acb34-c6e9-42ac-bb42-ab183a93f0561.gif)
协方差分析
协方差
协方差分析:
(一)协方差分析基本思想
通过上述的分析可以看到,不论是单因素方差分析还是多因素方差分析,控制因素都是可控的,其各个水平可以通过人为的努力得到控制和确定。
但在许多实际问题中,有些控制因素很难人为控制,但它们的不同水平确实对观测变量产生了较为显著的影响。
协方差分析
例如,在研究农作物产量问题时,如果仅考察不同施肥量、品种对农作物产量的影响,不考虑不同地块等因素而进行方差分析,显然是不全面的。
因为事实上有些地块可能有利于农作物的生长,而另一些却不利于农作物的生长。
不考虑这些因素进行分析可能会导致:
即使不同的施肥量、不同品种农作物产量没有产生显著影响,但分析的结论却可能相反。
再例如,分析不同的饲料对生猪增重是否产生显著差异。
如果单纯分析饲料的作用,而不考虑生猪各自不同的身体条件(如初始体重不同),那么得出的结论很可能是不准确的。
因为体重增重的幅度在一定程度上是包含诸如初始体重等其他因素的影响的。
(二)协方差分析的原理
协方差分析将那些人为很难控制的控制因素作为协变量,并在排除协变量对观测变量影响的条件下,分析控制变量(可控)对观测变量的作用,从而更加准确地对控制因素进行评价。
协方差分析仍然沿承方差分析的基本思想,并在分析观测变量变差时,考虑了协变量的影响,人为观测变量的变动受四个方面的影响:
即控制变量的独立作用、控制变量的交互作用、协变量的作用和随机因素的作用,并在扣除协变量的影响后,再分析控制变量的影响。
方差分析中的原假设是:
协变量对观测变量的线性影响是不显著的;在协变量影响扣除的条件下,控制变量各水平下观测变量的总体均值无显著差异,控制变量各水平对观测变量的效应同时为零。
检验统计量仍采用F统计量,它们是各均方与随机因素引起的均方比。
(三)协方差分析的应用举例
为研究三种不同饲料对生猪体重增加的影响,将生猪随机分成三组各喂养不同的饲料,得到体重增加的数据。
由于生猪体重的增加理论上会受到猪自身身体条件的影响,于是收集生猪喂养前体重的数据,作为自身身体条件的测量指标。
协方差的实现方法:
1、分析原理
协方差分析是回归分析与方差分析的结合。
在作两组和多组均数之间的比较前,用直线回归的方法找出各组因变量Y与协变量X之间的数量关系,求得在假定X相等时的修正均数,然后用方差分析比较修正均数之间的差别。
要求X与Y的线性关系在各组均成立,且在各组间回归系数近似相等,即回归直线平行;X的取值范围不宜过大,否则修正均数的差值在回归直线的延长线上,不能确定是否仍然满足平行性和线性关系的条件,协方差分析的结论可能不正确。
对于协变量的概念,可以简单的理解为连续变量,多数情况下,连续变量都要作为协变量处理。
2、问题
欲了解成年人体重正常者与超重者的血清胆固醇是否不同。
而胆固醇含量与年龄有关,资料见下表。
3、统计分析
(1)建立数据文件
变量视图:
建立3个变量
3、统计分析
(1)建立数据文件
变量视图:
建立3个变量
数据视图:
先要分析两组中年龄与胆固醇是否有线性关系,且比较回归洗漱是否相等,比较粗略的做法是画散点图,选择菜单:
图形-》旧对话框-》散点图,如图:
进入图形对话框:
将胆固醇、年龄、组分别选入Y轴、X轴、设置标记
点击确定开始画图
可以看出,大致呈直线关系。
更为精确的作法是检验年龄与分组之间是否存在交互作用,即年龄的作用是否受分组的影响。
接下来开始协方差分析,首先进入菜单:
进入对话框
将胆固醇选入“因变量”,组选入“固定因子”,年龄选入“协变量”,见图:
点击右边“模型”按钮,在“构建项”下拉菜单中选择“主效应”,将“组”和“年龄”选入右边框中,然后在“构建项”下拉菜单中选择“交互”,同时选中“组”和“年龄”,一并选入右边的框中,见图:
点击“继续”按钮回到“单变量”主界面:
单击“选项”按钮,进入如下对话框:
选中“描述性分析”:
点击“继续”按钮回到主界面,单击“确定”即可
这是主要的统计分析结果,一个典型的方差分析表,解释一下:
1、表格的第一行“校正模型”是对模型的检验,零假设是“模型中所有的因素对因变量均无影响”(这里包括分组、年龄及他们的交互作用),其P<0.001,拒绝零假设,说明存在对因变量有影响的因素。
2、表格的第二行是回归分析的常数项,通常无实际意义。
3、表格的第三行、第四行是对组和年龄的检验,P均<0.05,有统计学意义,说明分组和年龄对胆固醇的影响均有统计学意义。
4、表格的第五行是对分组和年龄的交互作用的检验,其P=0.935>0.05,说明分组和年龄无交互作用,也就是说,年龄对胆固醇的影响不随分组的不同而不同,这也是协方差分析的基本条件之一。
这里是满足的。