单因素多水平设计定量资料的统计分析及SAS实现_精品文档.ppt

上传人:b****2 文档编号:2573391 上传时间:2022-11-02 格式:PPT 页数:65 大小:662KB
下载 相关 举报
单因素多水平设计定量资料的统计分析及SAS实现_精品文档.ppt_第1页
第1页 / 共65页
单因素多水平设计定量资料的统计分析及SAS实现_精品文档.ppt_第2页
第2页 / 共65页
单因素多水平设计定量资料的统计分析及SAS实现_精品文档.ppt_第3页
第3页 / 共65页
单因素多水平设计定量资料的统计分析及SAS实现_精品文档.ppt_第4页
第4页 / 共65页
单因素多水平设计定量资料的统计分析及SAS实现_精品文档.ppt_第5页
第5页 / 共65页
点击查看更多>>
下载资源
资源描述

单因素多水平设计定量资料的统计分析及SAS实现_精品文档.ppt

《单因素多水平设计定量资料的统计分析及SAS实现_精品文档.ppt》由会员分享,可在线阅读,更多相关《单因素多水平设计定量资料的统计分析及SAS实现_精品文档.ppt(65页珍藏版)》请在冰豆网上搜索。

单因素多水平设计定量资料的统计分析及SAS实现_精品文档.ppt

单因素多水平设计定量资料的统计分析及SAS实现,医学统计学教研室柳伟伟讲师,实例,研究轻度和重度再障贫血患者血清中可溶性CD8抗原水平(/ml)与正常人之间的差别有无统计学意义,以反映患者免疫状态紊乱而导致造血功能障碍的程度。

从3种人群中分别随机地抽取了10人,测得CD8抗原水平如下,试对该资料进行分析,正常组:

234,318,402,382,621,408,243,141,42,98轻度组:

509,518,555,758,845,712,585,448,753,896重度组:

851,562,918,631,653,843,659,849,762,901,单因素多水平设计的定义,试验中仅涉及一个具有k(k3)水平的试验因素,该因素的每个水平对应于一组受试对象,观测k组受试对象某个或某些观测指标的值,这样安排试验的方法叫单因素多水平设计,单因素多水平设计的形式,单因素k(k3)水平完全随机设计,即当实验因素的水平与受试对象的分组无关时,可将全部同质的受试对象完全随机地分成k组,分别接受不同的处理单因素k(k3)水平组内随机设计,即当实验因素的水平与受试对象的分组有关时,只能在特定的受试对象所在的子总体中随机抽取样本,单因素多水平设计的特点,试验中仅涉及一个具有k(k3)水平的实验因素,未对其他任何重要非实验因素进行有计划的安排,仅仅希望通过随机化来平衡所有的非实验因素在k组间对观测结果的干扰和影响,单因素多水平设计定量资料的统计分析,参数检验:

方差分析、Welch方差分析非参数检验:

Kruskal-Wallis秩和检验,参数检验的前提条件,独立性:

多次试验的结果之间不存在相互影响,一般可从专业和实验安排上判断正态性:

多组数据均服从正态分布方差齐性:

多组数据的总体方差相等,单因素多水平设计定量资料的分析思路,方差分析的基本思想,方差分析由英国统计学家R.A.Fisher于1928年首先提出。

它的理论依据是F分布,故又称F检验其基本思想是:

在各个总体为相互独立的正态总体且具有等方差的假设条件下,将各总体随机样本中的所有观测值之间的变异(称总变异)分解成几部分,每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释,然后通过F检验,分析影响总变异的各因素的主效应及因素间的交互效应,方差分析的基本思想,具体而言,就是将总离均差平方和进行适当分解,即将全部数据关于总均值的离均差平方和分解成拟考察项数加一个误差项的离差平方和,自由度也有类似的分解方法,各部分离均差平方和除以各自的自由度,就是各项的方差(或称均方),以误差的均方为分母,以拟考察的各项均方为分子,就可以构造出相应的检验统计量F,单因素多水平设计定量资料的方差分析,设试验因素水平数为k,i=1,2,k;第i组样本例数为ni,j=1,2,ni;总样本例数为N;以Xij表示第i组第j个受试对象观测指标的取值试验数据有三个不同的变异:

总变异、组间变异、组内变异,总变异,全部测量值大小不同,这种变异称为总变异。

总变异的大小可以用离均差平方和表示,即各测量值与总均数差值的平方和,记为SS总。

它反映了所有测量值之间总的变异程度,其计算公式为,组间变异,各处理组由于接受处理的水平不同,各组的样本均数大小不等,该变异称为组间变异。

其大小可用各组均数与总均数的离均差平方和表示,记为SS组间。

它反映了各样本均数间的变异程度,其计算公式为存在组间变异的原因包括:

随机误差(包括个体变异和测量误差);处理的不同水平可能对试验结果的影响,组内变异,在同一处理组中,虽然每个受试对象接受的处理相同,但测量值仍各不相同,这种变异称为组内变异(误差)。

组内变异可用组内各测量值与其所在组均数的差值的平方和表示,记为SS组内。

它反映了随机误差的大小,其计算公式为,总变异的分解,总变异可以分解为组间变异与组内变异,也就是总离均差平方和分解为组间离均差平方和与组内离均差平方和相应的,总自由度分解为组间自由度与组内自由度,均方,变异程度除与离均差平方和有关外,还与自由度有关,为减小自由度的影响,将各部分的离均差平方和除以各自的自由度,得到相应的均方差,简称均方。

组间及组内均方计算公式为:

F统计量,将组间均方除以组内均方,即可得到方差分析的检验统计量FF统计量服从F分布,得到F值后,根据F界值表就可获得P值,从而做出统计学和专业结论,单因素多水平设计定量资料的方差分析,某研究者随机选取34例住院患者,采血测定血糖及血总胆固醇。

根据血糖水平将患者分为:

2型糖尿病组(10例)、糖代谢异常组(12例)和正常对照组(12例)。

三组受试对象的血总胆固醇结果如下,试比较他们之间血总胆固醇含量的差异是否有统计学意义?

2型糖尿病组:

1.641.712.132.281.581.783.240.753.252.05糖代谢异常组:

1.121.851.160.672.122.101.051.841.970.840.931.72正常对照组:

1.550.801.361.061.240.861.191.240.800.722.000.80,单因素多水平设计定量资料的方差分析,建立假设,确定检验水准H0:

m1=m2=m3(三组患者血总胆固醇含量的总体均数相等);H1:

三组患者血总胆固醇含量的总体均数不全相等;a=0.05。

单因素多水平设计定量资料的方差分析,计算检验统计量,单因素多水平设计定量资料的方差分析,单因素多水平设计定量资料的方差分析,26,方差分析表,单因素多水平设计定量资料的方差分析,确定P值,下结论检验界值F0.05(2,30)3.32,因FF0.05(2,30),故P0.05。

按a0.05水准,拒绝H0,接受H1,差别有统计学意义故可以认为三组患者血总胆固醇含量有差别,其中2型糖尿病组最高,糖代谢异常组次之,正常对照组最低,多个总体均数的两两比较,在对单因素多水平设计定量资料进行方差分析,得到各组间均数不等或不全相等时,研究者往往希望进一步了解是哪两个组均数之间存在差异,这就需要进行多个均数间的两两比较(又称均数间的多重比较)如果对任意两个组的数据使用成组设计定量资料的t检验来分析,就会增加犯类错误的概率,两两比较方法的分类,两两比较的方法包括LSD法、Bonferroni法、Sidak法、Scheff法、Tukey法、Duncan法、SNK法、Dunnettst法等从功能上讲主要分为两类,第一类即任何两个均数之间都要进行比较;第二类为多个试验组均数之间不比较,但需要将各试验组分别与同一个对照组均数比较从形式上可以分为四类,第一类为临界值相对固定的两两比较;第二类为临界值不固定的多级检验;第三类为Bayes方法;第四类为多个试验组均数分别与同一个对照组均数的比较,SNK法,SNK法即Student-Newman-Keuls法,又称q检验属于多级检验方法,适用于任意组均数间的两两比较,SNK法的具体步骤,SNK法的具体步骤,SNK法的检验统计量为、ni为第i组的样本均数及例数,、nj为第j组的样本均数及例数。

MS误差、v误差分别为单因素多水平设计定量资料方差分析表中的误差均方、误差自由度,SNK法,LSD法,LSD法也称最小显著差异法,适用于一对或几对在专业上有特殊意义的总体均数间的比较检验统计量的计算公式为:

Dunnettst检验法,在试验因素的k个水平中,有k1个处理组和一个对照组,此时只需要进行k1次检验即可常用的方法为Dunnettst检验法,它是成组设计定量资料的t检验法的一种修正,36,Dunnettst检验法的统计量为,Dunnettst检验法,两两比较方法的选择,LSD法:

此法非常简单,而且,极易得出差别有统计学意义的结果Tukey法:

此法要求高,对结论持慎重态度的科研人员可能倾向于选用它SNK法:

相对来说,此法对误差控制比较严格,使多次比较所导致的整体误差相对较小。

较多的医学或卫生统计学教科书介绍了此法,两两比较方法的选择,Bonferroni法:

此法对误差控制得非常严,相对来说,结论比较保守REGWQ法和REGWF法:

SAS推荐的两个方法,均优于SNK法,但宣传得不够,使用的人目前还不够多,多个总体均数的两两比较,某研究者随机选取34例住院患者,采血测定血糖及血总胆固醇。

根据血糖水平将患者分为:

2型糖尿病组(10例)、糖代谢异常组(12例)和正常对照组(12例)。

观察三组受试对象的血总胆固醇。

现通过方差分析得知三组患者血总胆固醇的总体均数不全相同,试对其进行两两比较,多个总体均数的两两比较,将三个样本均数由小到大排列均数1.141.452.04组别正常对照组糖代谢异常组2型糖尿病组组次123,多个总体均数的两两比较,列出对比组,计算两对比组的均数之差,写出两对比组包含的组数a,多个总体均数的两两比较,已知,计算检验统计量q,查界值表,确定P值,单因素多水平设计定量资料的秩和检验,称为Kruskal-WallisH检验,由Kruskal和Wallis(1952)在Wilcoxon秩和检验的基础上扩展而来两独立样本比较时,若样本例数较大也可以利用该检验,Kruskal-WallisH检验,第一步建立检验假设,确定检验水准H0:

多组资料的总体分布位置相同;H1:

多组资料的总体分布位置不同;a=0.05。

Kruskal-WallisH检验,第二步编秩。

将多组原始数据混合由小到大编秩,编秩时如遇相同数据则取平均秩次,Kruskal-WallisH检验,第三步求秩和并计算检验统计量。

检验统计量H的计算公式如下当出现同秩数据时,需对上式进行校正,公式如下,tp为第p个同秩数据的个数,校正系数C,Kruskal-WallisH检验,第四步确定P值并作出统计推断若组数k=3,每组例数5,可查H界值表得出P值若组数k4,或最小样本例数不小于5,则H近似服从=k-1的分布,可查界值表获得P值,Kruskal-WallisH检验,用三种药物杀灭钉螺,每批用200只活钉螺,用药后清点每批钉螺的死亡数,再计算死亡率,结果如下。

问三种药物杀灭钉螺的效果有无差别?

甲药:

32.535.540.546.049.0乙药:

16.020.522.529.036.0丙药:

6.59.012.518.024.0,Kruskal-WallisH检验,本例资料为百分率资料,不符合正态分布,采用Kruskal-WallisH检验H0:

三种药物杀灭钉螺的死亡率总体分布位置相同;H1:

三种药物杀灭钉螺的死亡率总体分布位置不同;a=0.05。

Kruskal-WallisH检验,把三个样本数据混合由小到大编秩,遇数据相等者取平均秩;计算各组秩和,见下表,Kruskal-WallisH检验,计算统计量H值本例组数k=3,n1=n2=n3=5,查H界值表,HH0.01=7.98,P0.01,按=0.01水准拒绝H0,接受H1,差别有统计学意义。

认为三种药物杀灭钉螺的死亡率不同,Kruskal-WallisH检验,比较小白鼠接种三种不同菌型伤寒杆菌9D、11C和DSC1后存活日数,结果如下。

问小白鼠接种三种不同菌型伤寒杆菌的存活日数有无差别?

9D:

222344457711C:

55666781012DSC1:

35666779101111,Kruskal-WallisH检验,本例为时间资料,不符合正态分布,采用Kruskal-WallisH检验H0:

接种三种不同菌型伤寒杆菌的存活日数总体分布位置相同;H1:

接种三种不同菌型伤寒杆菌的存活日数总体分布位置不同;a=0.05。

Kruskal-WallisH检验,把三个样本数据混合由小到大编秩,遇数据相等者取平均秩计算各组秩和,详见下表,Kruskal-WallisH检验,计算统计量H值,Kruskal-WallisH检验,本例各组样本数均大于5,查界值表,可得P0.01,按=0

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 求职职场 > 笔试

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1