1、第 1 章,统计学Python 实现,贾俊平2022-10-29,人生苦短,我要P y t h o nStatistics with Python,1-,统计学Python实现贾俊平,2022-10-29,第 8 章,方差分析的原理单因子方差分析双因子方差分析方差分析的假定及其检验贾俊平2022-10-29,8-,统计学Python实现贾俊平,2022-10-29,第 8 章方差分析,第 8 章,提出假设,:(i=1i,=2,0,I)(处理效应不显著):有一i 至个少不等于0(处理效应显著),构建检验统计量,用P值做出决策,未子拒对绝观,测因值影响不显著,分析结束 拒用绝效,应可量以,多重比较
2、,效应量分析,用效应量 双分因析子可方以差及计算:总效应量、主效应量、偏效应量,多重比较,F小ish显er著的性最差异法LSD,Tukey的实,际显著性差异法HSD,假定条件检验,正态性检验Q-Q图验S;haKr-pSio检检验方验差齐性检检验Levene独立性判断,8-,统计学Python实现贾俊平,2022-10-29,方差分析的步骤,思维导图,第 8 章,8.1方差分析的原理,方差分析的原理什么是方差分析(ANOVA),方差分析是在20世纪20年代由英国统计学家Ronald A.Fisher在进行实验设计时为解释实验数据而首先引入的分析类别自变量对数值因变量影响的一种统计方法研究分类型自
3、变量对数值型因变量的影响一个或多个分类自变量;两个或多个(k 个)处理水平或分类一个数值型因变量有单因子方差分析和双因子方差分析单因子方差分析:涉及一个分类的自变量双因子方差分析:涉及两个分类的自变量,【例8-1】(数据:example8_1.RData)为分,8-,统计学Python实现贾俊平,2022-10-29,析小麦品种对产量的影响。3个小麦品种实验获得的产量数据,第 8 章,8.1,方差分析的原理,方差分析的原理误差分解,总误差(total error)反映全部观测数据的误差所抽取的全部30个地块的产量之间差异处理误差(treatment error)组间误差(between-gro
4、up error)由于不同处理造成的误差,它反映了处理(品种)对观测数据(产量)的影响,因此称为处理效应(treatment effect)随机误差(random error)组内误差(within-group error)由于随机因子造成的误差,也简称为误差(error),数据的误差用平方和(sum of squares)表示,记为SS总平方和(sum of squares for total),记为SST反映全部数据总误差大小的平方和处理平方和(treatment sum of squares),记为SSA反映处理误差大小的平方和也称为组间平方和(between-group sum of
5、squares)误差平方和(sum of squares of error),记为SSE反映随机误差大小的平方和称为误差平方和也称为组内平方和(within-group sum of squares),8-,统计学Python实现贾俊平,2022-10-29,第 8 章,8.1,方差分析的原理,方差分析的原理数学模型,数据的误差用平方和(sum of squares)表示,记为SS总平方和(sum of squares for total),记为SST反映全部数据总误差大小的平方和设因子A有I种处理(比如品种有“品种1”、“品种2”、“品种3”3种处理),单因子方差分析可用下面的线性模型来表示
6、,8-,统计学Python实现贾俊平,2022-10-29,第 8 章,8.2,单因子方差分析,单因子方差分析提出假设,8-,统计学Python实现贾俊平,2022-10-29,第 8 章,8.2单因子方差分析,8-,统计学Python实现贾俊平,2022-10-29,单因子方差分析方差分析表,第 8 章,8.2单因子方差分析,单因子方差分析效应检验例题分析,8-,统计学Python实现贾俊平,2022-10-29,第 8 章,8.2单因子方差分析,单因子方差分析效应检验例题分析,8-,统计学Python实现贾俊平,2022-10-29,第 8 章,8.2单因子方差分析,单因子方差分析效应检验
7、例题分析均值图,8-,统计学Python实现贾俊平,2022-10-29,第 8 章,8.2单因子方差分析,单因子方差分析效应量分析例题分析,8-,统计学Python实现贾俊平,2022-10-29,第 8 章,8.2单因子方差分析,单因子方差分析多重比较Tukey-Kramer 的 HSD方法,HSD是真实显著差异(honestly significant difference)的缩写,因此也被称为真显著差异方法该检验方法是由Jone W.Tukey于1953年提出的,因此也被称为Tukey的HSD方法。由于Tukey的HSD方法要求各处理的样本量相同,当各处理的样本量不相同时,该方法就不再
8、适用。20世纪50年代中期,C.Y.Kramer对Tukey的HSD方法做了一些修正,从而使其适用于样本量不同的情形。修正后的HSD检验称为Tukey-Kramer方法,简称为Tukey-Kramer的HSD方法该方法的适用场合是:研究者事先并未计划进行多重比较,只是在方差分析决绝原假设后,才需要对任意两个处理的 均值进行比较,这时采用HSD方法比较合适,8-,统计学Python实现贾俊平,2022-10-29,第 8 章,8.2单因子方差分析,单因子方差分析多重比较Tukey-Kramer 的 HSD方法,8-,统计学Python实现贾俊平,2022-10-29,第 8 章,8.3,双因子方
9、差分析,双因子方差分析数学模型,分析两个因子(因子A和因子B)对实验结果的影响如果两个因子对实验结果的影响是相互独立的,分别判断因子A和因子B对实验数据的单独影响,这时的双因子方差分析称为只考虑主效应的双 因子方差分析或无重复双因子方差分析(Two-factor without replication),如果除了因子A和因子B对实验数据的单独影响外,两个因子的搭配还会对结果产生一种新的影响,这时的双因子方差分析称为考虑交互效应的双因子方差分析或可重复双因子方差分析(Two-factor with replication),设因子A有I种处理因子B有J种处理双因子方差分析可用下面的线性模型来表示
10、,8-,统计学Python实现贾俊平,2022-10-29,第 8 章,8.3双因子方差分析,双因子方差分析主效应分析误差分解,8-,统计学Python实现贾俊平,2022-10-29,第 8 章,8.3双因子方差分析,8-,统计学Python实现贾俊平,2022-10-29,双因子方差分析主效应分析方差分析表,第 8 章,8.3双因子方差分析,双因子方差分析主效应分析效应量,8-,统计学Python实现贾俊平,2022-10-29,第 8 章,8.3双因子方差分析,双因子方差分析主效应分析例题分析,【例8-4】(数据:example8_5.Rdata)假定在例8-,1中,除了考虑品种对产量的
11、影响外,还考虑施肥方式对产量的影响。假定有甲、乙两种施肥方式,这样3个小麦品种和两种施肥方式的搭配共有32=6种组合。如果选择30个地块进行实验,每一种搭配可以做5次实验,也就是每个品种(处理)的样本量为5,即相当于每个品种(处理)重复做了5次实验。实验取得的数据如表8-4所示。检验小麦品种和施肥方式对产量的影响是否显著(,方差分析表,8-,统计学Python实现贾俊平,2022-10-29,第 8 章,8.3双因子方差分析,双因子方差分析主效应分析例题分析【例8-4】效应量分析,8-,统计学Python实现贾俊平,2022-10-29,第 8 章,8.3双因子方差分析,双因子方差分析交互效应
12、分析误差分解,8-,统计学Python实现贾俊平,2022-10-29,第 8 章,8.3双因子方差分析,双因子方差分析交互效应分析例题分析,8-,统计学Python实现贾俊平,2022-10-29,第 8 章,8.3双因子方差分析,双因子方差分析交互效应分析例题分析,8-,统计学Python实现贾俊平,2022-10-29,第 8 章,8.3双因子方差分析,8-,统计学Python实现贾俊平,2022-10-29,双因子方差分析交互效应分析例题分析,第 8 章,8.4方差分析的假定及其检验,方差分析假定及其检验正态性(normality)。每个总体都应服从正态分布,即对于因子的每一个水平,其
13、观测值是来自正态分布总体的简单随机样本在例81中,要求每个品种的产量必须服从正态分布检验总体是否服从正态分布的方法有很多,包括对样本数据作直方图、茎叶图、箱线图、正态概率图做描述性判断,也可以进行非参数检验等方差齐性(homogeneity variance)。各个总体的方差必须相同,对于分类变量的个水平,有 12=22=k2在例81中,要求不同品种的产量的方差都相同独立性(independence)。每个样本数据是来自因子各水平的独立样本(该假定不满足对结果影响较大)在例81中,3个样本数据是来自不同品种的3个独立样本,8-,统计学Python实现贾俊平,2022-10-29,第 8 章,8
14、.4方差分析的假定及其检验,方差分析的假定正态性检验图示法当每个处理的样本量足够大时,可以对每个样本绘制正态概率图来检查每个处理对应的总体是否服从正态分布当每个处理的样本量比较小时,正态概率图中的点很少,提供的正态性信息很有限。这时,可以将每个处理的样本数据合并绘制一个正态概率图来检验正态性,8-,统计学Python实现贾俊平,2022-10-29,第 8 章,8.4方差分析的假定及其检验,方差分析的假定正态性检验检验法,当样本量较小时,正态概率图的应用就会受到很大限制,这时可以使用标准的统计检验如SW检验、K-S检验等,均可以做正态性检验。这些检验的原假设是因变量服从正态分布如果检验获得的P
15、值小于指定的显著性水平,则拒绝原假设,表明总体不服从正态分布,如果P值较大不能拒绝原假设时,可以认为总体满足正态分布这些检验对正态性的轻微偏离是敏感的,检验往往导致拒绝原假设。而方差分析对正态性的要求则相对比较宽松,当正态性略微不满足时,对分析结果的影响不是很大。因此,实际中应谨慎使用这些检验,#S-W检验统计量W=0.97299,p值=0.6237,8-,统计学Python实现贾俊平,2022-10-29,#K S检验统计量D=0.09771,p值=0.9369,第 8 章,8.4方差分析的假定及其检验,方差分析的假定方差齐性检验图示法,方差齐性(homogeneity variance)。假定各个总体的方差必须相同,即:12=22=I2检验方差齐性方法:图示法和检验法检验方差齐性的图形有箱线图和残差图等Bartlett方差齐性检验和Levene方差齐性检验,8-,统计学Python实现贾俊平,2022-10-29,第 8 章,8.4方差分析的假定及其检验,方差分析的假定方差齐性检验Levene检验,8-,统计学Python实现贾俊平,2022-10-29,THE END,T H A N K S2022-10-29,
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1