1、医学统计学方差分析Analysis of VarianceDepartment of Epidemiology and Biostatistics,NJMU流行病与生物统计系 南京医科大学主要内容o问题的提出o方差分析的原理o完全随机设计的方差分析 o completely random designo配伍组设计的方差分析o random block designo两两比较o方差分析的正确应用复习假设检验o提出一个假设o如果假设成立,得到现有样本的可能性n可能性很小(小概率事件),在一次试验中本不该得到,居然得到了,说明我们的假设有问题,拒绝之。n有可能得到手头的结果,故根据现有的样本无法拒绝
2、事先的假设(没理由)因素和水平o因素(factors):将试验对象随机分为若干个组,加以不同的干预,称为处理因素。o在相同的因素下的不同干预,称为不同的水平(level)。o 昆明癫痫病医院http:/ 昆明癫痫病http:/ 昆明癫痫病医院http:/ 昆明脑科医院http:/ =2.72mmol/l用药组2 =2.70mmol/l安慰剂组 =3.43mmol/l用药组3 =1.97mmol/l问题的提出o假如每次t检验犯第一类错误的概率是0.05,那么要完全地进行比较,犯第一类错误的概率是1(1)k。o多组间的两两比较为什么不能用多组间的两两比较为什么不能用 t 检验?检验?进行一次假设检
3、验,犯第一类错误的概率:进行多次(k)假设检验,犯第一类错误的概率:1(1)k组数为组数为3,k=3,1(10.05)k=0.1426组数为组数为4,k=6,1(10.05)k=0.2649组数为组数为5,k=10,1(10.05)k=0.4013 组数为组数为6,k=15,1(10.05)k=0.5400问题的提出方差分析o方差分析,又称变异数分析。oAnalysis of Variance,简写为ANOVA。o由英国统计学家R.A.Fisher提出。o方差分析的起源。oF检验。Sir Ronald Aylmer Fisher18901962Rothamste Agricultural St
4、ationFisher于Rothamste研究作物产量时,完善了方差分析的思想方差分析的原理o单因素方差分析:研究的是一个处理因素的不同水平间效应的差别;处理因素水平1水平2方差分析的原理o单因素方差分析:研究的是一个处理因素的不同水平间效应的差别;处理因素水平1水平2水平k方差分析的原理以抽样误差作为尺度t检验的检验统计量差别方差分析的原理例例1 某某地地用用A、B和和C三三种种方方案案治治疗疗血血红红蛋蛋白白含含量量不不满满10g的的婴婴幼儿贫血患者,幼儿贫血患者,A方案为每公斤体重每天口服方案为每公斤体重每天口服2.5硫酸亚铁硫酸亚铁1ml,B方案为每公斤体重每天口服方案为每公斤体重每天
5、口服2.5硫酸亚铁硫酸亚铁0.5ml,C方案为每公斤体重每天口服方案为每公斤体重每天口服3g鸡肝粉,鸡肝粉,治治疗疗一一月月后后,记记录录下下每每名名受受试试者者血血红红蛋蛋白白的的上上升升克克数数,资资料料见表见表1,问三种治疗方案对婴幼儿贫血的疗效是否相同?,问三种治疗方案对婴幼儿贫血的疗效是否相同?因素:治疗方案因素:治疗方案水平:水平:A,B,C例1 三组血红蛋白增加量(g)A(i=1)B(i=2)C(i=3)1.81.45.02.02.1-0.7Xij0.51.20.20.01.91.32.32.30.51.61.71.13.70.70.33.00.20.22.40.51.91.62
6、.00.72.01.41.00.01.50.91.51.72.43.00.90.82.73.0-0.40.71.1-0.31.13.22.01.2-0.20.70.92.51.60.71.31.4方差分析的原理o所有个体的血红蛋白上升值几乎都不同总变异o不同组间的血红蛋白上升值不同,原因:处理因素的效应(如果存在的话);随机误差组间变异o同组内的血红蛋白上升值不一致,原因是不同个体的个体差异、随机误差组内变异o总变异=组间变异+组内变异X总变异总变异示意图示意图所有个体的血红蛋白上升值几乎都不同所有个体的血红蛋白上升值几乎都不同X组间变异组间变异示意图示意图不同组间的血红蛋白上升值不同不同组间
7、的血红蛋白上升值不同X组内变异组内变异示意图示意图同组内的血红蛋白上升值不一致同组内的血红蛋白上升值不一致例1 三组血红蛋白增加量(g)A(i=1)B(i=2)C(i=3)1.81.45.02.02.1-0.7Xij0.51.20.20.01.91.32.32.30.51.61.71.13.70.70.33.00.20.22.40.51.91.62.00.72.01.41.00.01.50.91.51.72.43.00.90.82.73.0-0.40.71.1-0.31.13.22.01.2-0.20.70.92.51.60.71.31.4ni20202060Meansd1.8400.9131
8、.4151.2970.9300.7801.3951.071总变异 SS总oSum of squares about the mean of all N values.组内变异 SS组内oSum of squares within groups组间变异 SS组间oSum of squares between groupsn1 n2 n3 总变异的分解SS总SS组间SS组内 67.66858.2930+59.3755方差分析的基本思想o组内变异(SS组内):抽样误差o组间变异(SS组间):组间本质差别抽样误差o如果组间无本质差别,则组间变异组内变异o或:方差分析的基本思想方差分析的基本思想总变异总
9、的离均差平方和包括处理因素不同水平的效应所导致的变异,也包括随机误差无法用处理因素所解释的部分变异(随机误差)方差分析的原理尺度总变异总的离均差平方和包括处理因素不同水平的效应所导致的变异,也包括随机误差无法用处理因素所解释的部分变异(随机误差)方差分析的原理尺度方差分析表变异来源SSvMSF组间 SS组间k-1SS组间/v组间MS组间MS组内组内 SS组内N-kSS组内/v组内总SS总N-1方差分析表变异来源SSvMSF 总 67.668559 组间8.293024.14653.98 组内(误差)59.3755571.0417方差分析的原理o方差比的分布!方差分析的最终统计推断和假设检验均依
10、靠F分布,所以适当了解一下F分布的特点十分有益。F F分布分布 F分布是英国统计学家Fisher和Snedecor(斯内德克)提出的。为了表示对Fisher的尊重,Snedecor将其命名为F分布。方差分析也主要是由Fisher推导出来的,也叫F检验。F 分布0123450.00.20.40.60.81.01=1,2=101=5,2=10F 分布0123450.00.20.40.60.81.01=10,2=1=10,2=1构造检验的统计量(F 分布)如果均值相等如果均值相等,F F=MSMSt t/MSMSe e1 1a a F 分布F(k-1,n-k)0 0拒绝拒绝H H0 0不能拒绝不能拒
11、绝H H0 0F F方差分析表变异来源SSvMSF组间 SS组间k-1SS组间/v组间MS组间MS组内组内 SS组内N-kSS组内/v组内总SS总N-1方差分析表变异来源SSvMSF 总 67.668559 组间8.293024.14653.98 组内(误差)59.3755571.0417F(2,57)的的F分布及界值分布及界值0123450.2.4.6.813.15880.05完全随机设计资料的方差分析1.H0:1=2=3,即三总体均数相等;H1:1,2,3 不等或不全相等。1.0.05。n计算检验统计量:F=3.98 3.1588(界值)1.对应的概率:P=0.0241(p0.05)2.结
12、论:在0.05水准,拒绝H0,接受H1,差别有统计学意义。认为三种治疗方案治疗婴儿贫血的效果不等或不全相等。完全随机设计资料的方差分析 例题2 已知动物烧伤后内脏ATP含量迅速下降,严重影响生物体各器官能量的正常代谢,为了解烫伤后不同时期切痂对肝脏ATP含量影响,将30只雄性大鼠随机分3组,每组10只:oA组为烫伤对照组,oB组为烫伤后24小时(休克期)切痂组,oC组为烫伤后96小时(非休克期)切痂组,并在烫伤后168小时活杀,测量其肝脏的ATP含量,探讨烫伤后不同时间ATP含量是否有变化?因素:烫伤后不同时期因素:烫伤后不同时期水平:水平:A,B,C完全随机设计资料的方差分析烫伤对照组24小
13、时切痂组96小时切痂组 7.76 11.14 10.85 7.71 11.60 8.58 8.43 11.42 7.19 8.47 13.85 9.36 10.30 13.53 9.59 6.67 14.16 8.81 11.73 6.94 8.22 5.78 13.01 9.95 6.61 14.18 11.26 6.97 17.72 8.68完全随机设计资料的方差分析变异来源离均差平方和MSF组间 119.8314组内112.9712总变异完全随机设计资料的方差分析o建立假设 nH0:三组大鼠肝脏的ATP含量值无差别,1=2=3nH1:三组大鼠肝脏的ATP含量值有差别;o选择检验水准=0.
14、05;完全随机设计资料的方差分析o列方差分析表,计算F值;o查自由度为2,27的F界值表,得P0.05;o按=0.05的水准拒绝H0,接受H1,差别有统计学意义。认为烫伤后168 h时,三组大鼠肝脏的ATP含量有差别。变异来源离均差平方和MSF组间 119.8314259.916 14.32 组内112.9712274.184总变异232.8026 29主要内容o问题的提出o方差分析的原理o完全随机设计的方差分析o配伍组设计的方差分析o两两比较o方差分析的正确应用配伍组设计的方差分析o为什么要配伍?n配对的目的:排除干扰因素的影响;n配伍的目的:使同一区组内除了研究因素外的其他特征尽可能相似,
15、排除干扰因素的影响;o按窝配伍;o田间试验按区块配伍;n当研究因素只有两水平时,配伍设计方差分析=配对t检验 Rothamste Agricultural Station Fisher 用方差分析的思想耕种的一块田配伍组设计的方差分析配伍组设计的方差分析种子种子A种子种子B种子种子C配伍组设计的方差分析肥肥中中瘦瘦ABC肥肥中中瘦瘦BLOCK1配伍组设计的方差分析处理因素处理因素配伍因素配伍因素BLOCK2BLOCK3配伍组设计的方差分析o实质:两因素方差分析o变异分解,N为总样本含量,k为水平数,n为区组数;总变异总的离均差平方和处理因素不同水平的效应所致的变异,及随机误差无法用处理、配伍所
16、解释的部分变异(随机误差)配伍组方差分析的原理尺度配伍因素不同水平的效应所致变异,及随机误差尺度配伍组设计的SS的分解SS总 SS区组间 SS处理间 SS误差 v总 v区组间 v处理间 v误差 kb-1 (b-1)(k-1)(k-1)(b-1)o实质:两因素方差分析o变异分解,N为总样本含量,k为水平数,b为区组数;配伍组设计的方差分析o例3 在抗癌药筛选试验中,拟用20只小白鼠按不同窝别分为5组,分别观察三种药物对小白鼠肉瘤(S180)的抑瘤效果,资料见表6.7,问三种药物有无抑瘤作用?配伍组设计的方差分析配伍组设计的方差分析配伍组设计的方差分析o建立假设n实验因素:实验因素:H0:三种药物的抑瘤效果与对照组相同:三种药物的抑瘤效果与对照组相同;H1:三种药物的效果与对照组不同或者不全相同;:三种药物的效果与对照组不同或者不全相同;n干扰因素:干扰因素:H0:5个窝别小白鼠对肉瘤生长的反应相同个窝别小白鼠对肉瘤生长的反应相同;H1:5个窝别小白鼠对肉瘤生长的反应不全相同或全不相个窝别小白鼠对肉瘤生长的反应不全相同或全不相同同;o确立检验水准;=0.05;o列方差分析表;配伍组设计的方
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1