方差分析思考与练习带答案.docx
《方差分析思考与练习带答案.docx》由会员分享,可在线阅读,更多相关《方差分析思考与练习带答案.docx(23页珍藏版)》请在冰豆网上搜索。
方差分析思考与练习带答案
第九章方差分析
思考与练习】
、思考题
1.方差分析的基本思想及其应用条件是什么?
2.在完全随机设计方差分析中SS、、SS且间、SS且内各表示什么含义?
3.什么是交互效应?
请举例说明。
4.重复测量资料具有何种特点?
5.为什么总的方差分析的结果为拒绝原假设时,若想进一步了解两两之间的差别需要进行多重比较?
二、最佳选择题
1.方差分析的基本思想为
A.组间均方大于组内均方
B.误差均方必然小于组间均方
C.总变异及其自由度按设计可以分解成几种不同来源
D.组内方差显着大于组间方差时,该因素对所考察指标的影响显着
E.组间方差显着大于组内方差时,该因素对所考察指标的影响显着
3.完全随机设计的方差分析中,下列式子正确的是
4.总的方差分析结果有P<,则结论应为
A.各样本均数全相等
B.各总体均数全相等
C.各样本均数不全相等
D.各总体均数全不相等
E.至少有两个总体均数不等
5.对有k个处理组,b个随机区组的资料进行双因素方差分析,其误差的自由度为
A.kb
B.kb
C.kb
D.kb
E.kb
6.
2X2析因设计资料的方差分析中,总变异可分解为
7.
8.观察6只狗服药后不同时间点(2小时、4小时、8小时和24小时)血药浓度
的变化,本试验应选用的统计分析方法是
A.析因设计的方差分析
B.随机区组设计的方差分析
C.完全随机设计的方差分析
D.重复测量设计的方差分析
E.两阶段交叉设计的方差分析
9.某研究者在4种不同温度下分别独立地重复10次试验,共测得某定量指标的
10.
数据40个,若采用完全随机设计方差分析进行统计处理,其组间自由度是
D.
E.3
11.采用单因素方差分析比较五个总体均数得P0.05,若需进一步了解其中一
个对照组和其它四个试验组总体均数有无差异,可选用的检验方法是
A.Z检验
B.t检验
C.Dunnett-t检验
D.SNK-q检验
E.Levene检验
三、综合分析题
1.某医生研究不同方案治疗缺铁性贫血的效果,将36名缺铁性贫血患者随机等分为3组,分别给予一般疗法、一般疗法+药物A低剂量,一般疗法+药物A高剂量三种处理,测量一个月后患者红细胞的升高数(1O2/L),结果如表9-1所示。
问三种治疗方案有无差异?
2
表9-1三种方案治疗一个月后缺铁性贫血患者红细胞的升高数(10/L)
1
2
3
4
7
8
9
10
11
12
2.在药物敏感试验中,欲比较三种弥散法的抑菌效果,每种方法均采用三种药
物,观察其抑菌效果,以抑菌环的直径为观察指标,结果如表9-2所示,试比较
三种方法的抑菌效果。
表9-2三种药物在不同弥散法下的抑菌效果(mm)
药物
弥散法
黄芪
大黄
青霉素
3.某试验研究饮食疗法和药物疗法降低高胆固醇血症患者胆固醇的效果有无差
别,随机选取14名高胆固醇血症患者,随机等分为两组,分别采用饮食疗法和
药物疗法治疗一个疗程,测量试验前后患者血胆固醇含量,结果如表9-3所示,
请问两种疗法降胆固醇效果有无差异。
表9-3不同治疗方法下胆固醇变化情况(mmol/L)
药物治疗
4
5
6
7
4.为研究某中学初一年级、初二年级和初三年级学生周日锻炼时间情况,从这
三个年级中各随机抽取20名学生,调查得到学生周日锻炼时间如下表9-4所示。
问这三个年级学生周日锻炼时间是否不同?
表9-4初中不同年级学生的锻炼时间(分)
经数据分析结果见下表:
表9-5三个年级之间的t检验结果
组别
t
P
一年级和二年级
一年级和三年级
二年级和三年级
所使用的统计分析方法是否正确?
为什么?
若不正确,可以采用何种正确的统计分析方法。
请作分析?
【习题解析】
、思考题
1.方差分析的基本思想是把全部观察值的总变异按设计和需要分解成两个或多
个组成部分,然后将各部分的变异与随机误差进行比较,来判断总体均数间的差
别是否具有统计学意义。
应用条件:
各样本是相互独立的随机样本,且服从正态分布,各样本方差齐性。
2.SS、是各观测值与总均值之差的平方和,即总离均差平方和,表示总变异的
大小;SS组间表示组间变异,指各处理组均值大小的不同,是由处理因素和随机误差造成的;SS组内表示组内变异,指同一处理组内部各观察值之间的变异,是由随机误差造成的。
3.交互效应是指某一因素的效应随另一因素不同水平的变化而变化,称这两个
因素之间存在交互效应。
例如:
某实验研究AB两种药物在不同剂量情况下对
某病的治疗效果,药物A在不同剂量时,B药的效应不同,或者药物B在不同剂量时,A药的效应不同,则A、B两药间存在交互效应。
4.重复测量资料中的处理因素在受试者间是随机分配的,受试者内的因素即时
间因素是固定的,不能随机分配;重复测量资料各受试者内的数据彼此不独立,具有相关性,后一个时间点的数据可能受到前面数据的影响,而且时间点离得越近的数据相关性越高。
5.方差分析中备择假设是多个总体均数不等或不全相等,拒绝原假设只说明多
个总体均数总的来说差别有统计学意义,并不能说明任意两总体均数之间均有差别。
因此,若希望进一步了解两两间的差别,需进行多重比较。
、最佳选择题
1.C2.C3.A4.E5.D6.E7.D8.E9.C
三、综合分析题
1.解:
本题采用完全随机设计的方差分析。
表9-6三种方案治疗一个月后缺铁性贫血患者红细胞的升高数(102/L)
ni
12
12
12
36(n)
Xi
(X)
Xi
2
2
Xi
(X)
(1)
方差分析
3,即三种方案治疗后缺铁性贫血患者红细胞升高数相同
数不全相同
36135
方差分析结果见表9-7。
表9-7完全随机资料的方差分析表
变异来源
SS
MS
F
P
总变异
35
组间变异
2
<
组内变异
33
3)确定P值,作出统计推断
查F界值表(附表4)得Pv,按二水准,拒绝H。
,接受H1,差别有统计学
意义,可以认为三种不同方案治疗后患者红细胞升高数的总体均数不全相同。
用Dunnett-t法进行多重比较。
Ho:
任一实验组与对照组的总体均数相同
Hi:
任一实验组与对照组的总体均数不同
0.05
3)
MSe0.0033n,门2Og12
nTnC
f1厂I1
SxtXcJMSe()J0.0033(--)0.02
TCYOtOcV1212
表9-8
多个样本均数的Dunnett-t检验计算表
对比组
(1)
均数差值
(2)
标准误
(3)
tD
/八Dunnett-t界值
(4)
P
一般疗法与一般疗法
+A1
30
<
一般疗法与一般疗法
+A2
81
<
确定P值,作出统计推断
e33和实验组数
将表9-8中tD取绝对值,并以计算MSe时的自由度
a=k?
1=2(不含对照组)查Dunnett-t界值表得P值,列于表中。
按二水准,一般
疗法+A1与一般疗法相比,疗效差别有统计学意义,可以认为一般疗法+A1与一
般疗法治疗缺铁性贫血疗效不同。
同理,可以认为一般疗法+A2与一般疗法治疗
缺铁性贫血疗效不同
SPSS操作
数据录入:
打开SPSSDataEditor窗口,点击VariableView标签,定义要输入的变
量,group表示组别(1为一般疗法,2为一般疗法+药物A低剂量,3为一般疗
法+药物A高剂量),X表示患者红细胞的升高数(1O2/L);再点击DataView标签,
录入数据(见图9-1,图9-2)。
图9-1VariableView窗口内定义要输入的变量group和x
图9-2DataView窗口内录入数据
分析:
AnalyzetCompareMeanstone-WayANOVA
DependentList框:
x
Factor框:
group
Option...
Continue
TStatistics:
HomogeneityofVariancestest
Continue
OK
输出结果
TestofHomogeneityofVariances
红细胞升高数(102/l)
Levene
Statisti
c
df1
df2
Sig.
.774
2
33
.469
ANOVA
红细胞升高数(102/L)
SumofSquares
df
MeanSquare
F
Sig.
BetweenGroups
WithinGroups
Total
.108
2
33
35
.003
.000
MultipleComparisons
DependentVariable:
红细胞升高数(102/L)
(I)
G
(J)
G
MeanDifferenee(I-J)
Std.
Error
Sig.
95%Confidenee
Interval
Lower
Bound
UpperBound
2
1
.59750(*)
.02332
.000
.5436
.6514
3
1
(*)
.02332
.000
a
Dunnettt(2-sided)
*Themeandiffereneeissignificantatthe.05level.
aDunnettt-teststreatonegroupasacontrol,andcompareallothergroupsagainst
it.
2.解:
本题采用析因设计的方差分析。
表9-9九种不同处理情况下抑菌环的直径(mm)
纸片弥散法a1
挖洞弥散法a2
钢圈弥散法a3
合计
黄芪
b1
大黄
b2
青霉素
b3
黄芪
d
大黄
b2
青霉素
b3
黄芪
d
大黄
b2
青霉素
b3
X
4
4
4
4
4
4
4
4
4
36
Xi
nA
12
12
12
血
12
12
12
Xa
Xb
(1)建立检验假设,确定检验水准
因素A
Ho:
三种弥散方法抑菌环直径的总体均数相等
:
三种弥散方法抑菌环直径的总体均数不全相等
因素B
Ho:
三种药物抑菌环直径的总体均数相等:
三种药物抑菌环直径的总体均数不全相等
AB交互作用
Ho:
不同药物对三种弥散方法的抑菌效果无影响:
不同药物对三种弥散方法的抑菌效果有影响
(2)计算检验统计量
X)2/N(866.9)2/36
20875.4336
ss处理
处理
SSa
MSa
SSb
MSb
x2
C21322.83
36135
Xi)2/niC=(
Xa)2/nAC
的水平数1
SSa
24.507
Xb)2/nBC
20875.4336447.3964
22
109.3283.92
+
4
(301.82
(12
2
287.4
12
12.2536
293.32
257.52
12
的水平数-1=2
SSb
145.4289
72.7145
SSabss处理
SSa
SSb
266.6978
AB处理
MSab
SSAB空鑿66.6745
AB
ss吴差
SS、SS^理
10.7625
误差
Nk36
927
MS误差
SS吴差垃型0.3986
误差
MSa
Fams误差
12.253630.7416
0.3986
FbMSb
MS误差
謐182.4247
2
11972
+L+—)-20875.4336=436.6339
2
277.7)
12)
316.12
20875.433624.5072
20875.4336145.4289
MSaB
Fab二^666745167.27仃ms吴差0.3986
方差分析结果见表9-10
表9-10析因设计资料的方差分析表
变异来源
ss
ms
F
P
总变异
35
处理
8
A
2
<
B
2
<
AB
4
<
误差
27
(3)确定P值,作出统计推断
根据,查F界值表(附表4)得相应P值。
交互作用的F=,Pv,按=水准,拒绝Ho,接受Hi,差别有统计学意义,可以认为弥散方法和药物抑菌效果两者之间存在交互作用。
这时,如要分析A因素或B因素的单独效应,应固定在A因素
的基线水平来分析B因素的作用,或者固定在B因素的基线水平来分析A因素的作用。
SPss操作
数据录入:
打开SPSSDataEditor窗口,点击VariableView标签,定义要输入的变
量,g1表示三种弥散方法(1为纸片,2为挖洞,3为钢圈),g2表示三种药物(1为黄芪,2为大黄,3为青霉素),x表示抑菌效果(mm);点击DataView标签,
录入数据(见图9-3,图9-4)。
g1、g2和x
图9-3VariableView窗口内定义要输入的变量
图9-4DataView窗口内录入数据
分析:
Analyze宀GeneralLinearModelUnivariate
FixedFactor框:
g1、g2
OK
输出结果
3.解:
本题可采用t检验分析,但最好采用重复测量资料的方差分析。
因重复
测量资料的方差分析计算量较大,故本题不给出笔算结果,仅提供SPSS软件分
析结果。
(1)建立检验假设,确定检验水准
处理因素K
Ho:
饮食疗法和药物疗法降低胆固醇值的总体均数相同
:
饮食疗法和药物疗法降低胆固醇值的总体均数不相同时间因素I
Ho:
试验前后患者胆固醇值的总体均数相同
:
试验前后患者胆固醇值的总体均数不相同交互作用KI
Ho:
时间对两种方法降低胆固醇的效果无影响
:
时间对两种方法降低胆固醇的效果有影响
(2)计算检验统计量
本例是最简单的重复测量设计,时间因素只有两个水平,可以用重复测量的方差分析进行计算,由于时间点只有两个水平,可以不考虑球形对称问题。
列出方差分析表见表9-11:
表9-11重复测量资料的方差分析表
变异来源
SS
MS
FP
总变异
27
处理
1
个体间误差
12
时间
1
处理X时间
1
个体内误差
12
⑶确定P值,作出统计推断
时间因素和治疗方法之间的交互作用,F值为,P值为,按二水准,不拒
绝Ho,差异无统计学意义,尚不能认为时间和疗法之间存在交互作用;对于时间因素,F值为,P值为,Pv,按二水准,拒绝Ho,接受Hi,差别有统计学意
义,可以认为试验前后患者胆固醇的值不同;两种治疗方法的F值为,P值为,
P>,按二水准,不拒绝H。
,差异无统计学意义,尚不能认为饮食疗法和药物疗
法之间具有差别。
SPSS操作
数据录入:
打开SPSSDataEditor窗口,点击VariableView标签,定义要输入的变量,no表示编号,g表示分组(1为饮食疗法,2为药物疗法),t1表示实验前患者胆固醇的值(mmol/L),t2表示实验后患者胆固醇的值(mmol/L);击DataView
标签,录入数据(见图9-5,图9-6)。
图9-5VariableView窗口内定义要输入的变量no、g、t1和t2
图9-6DataView窗口内录入数据
分析:
Analyze7GeneralLinearModel7RepeatedMeasures
Within-SubjectFactorname:
改为
NumberofLevels:
键入27Add
:
t1〜t2
Define:
Within-SubjectsVariables[t]
Between-SubjectsFactor[s]
Model:
TCustom
7Within-SubjectsModel:
t
Between-SubjectsModel:
g
Continue
OK
输出结果
Mauchly'sTestofSphericity(b)
Measure:
MEASURE1
WithinSubjectsEffect
Mauchly'sW
Approx.
Chi-Square
df
Sig.
Greenhouse-Geisser
Epsilon(a)
Huynh-Feldt
Lower-bound
time
.000
0
4.
(1)该资料采用的是两独立样本t检验作两两比较。
(2)所使用的统计分析方法错误。
欲比较三组均数是否两两不同,用两独立样
本t检验作多次比较,会增大犯I型错误的概率。
(3)应当先采用完全随机设计方差分析,若分析结果拒绝H,则进一步采用
SNK法作三组间的两两比较。
完全随机设计方差分析
1)建立检验假设,确定检验水准
H。
:
三个年级锻炼时间的总体均数相等
:
三个年级锻炼时间的总体均数不全相等,即至少有两个总体均数不等
2)计算检验统计量
X)2/N(2887.142)2/60=138926.4821
—22
(XX)XC148914.9985-138926.4821=9988.5164
SS且间/V组间
FMS组间……=9.1711MS组内SS组内/V组内
方差分析结果见表9-12。
表9-12方差分析表
变异来源
SS
V
MS
F
P
总变异
59
组间
2
<
组内
57
多个样本均数间比较见表9-13。
表9-13SNK检验计算表
对比组
两均数之差
两均数之差
对比组内
q界值
A与B
XaXb
标准误
q
包含组数
P
Sxx
AB
a
(1)
(2)
(3)
(4)=
(2)(3)
(5)
(6)(7)
(8)
1与3
3
v
1与2
2
v
2与3
2
>
3)确定P值,作出统计推断
方差分析结果Pv,按=水准,拒绝H。
,接受H1,差别有统计学意义,可
以认为三个年级锻炼时间的总体均数不全相等;多个均数间的两两比较的SNK检
验结果提示:
可以认为一年级和二年级、一年级和三年级的锻炼时间不同;尚不
能认为二年级和三年级的锻炼时间不同。
SPSS操作
数据录入:
打开SPSSDataEditor窗口,点击VariableView标签,定义要输入的变
量,group表示组别(1为一年级,2为二年级,3为三年级),x表示锻炼时间(分);
再点击DataView标签,录入数据(见图9-7,图9-8)。
图9-7VariableView窗口内定义要输入的变量
分析:
AnalyzeCompareMeansONEWAY-ANOVA
DependentList框:
锻炼时间(x)
postHoc二
Factor框:
g
EqualVariancesAssumed:
S-N-K
Continue
Option...
fStatistics:
HomogeneityofVariancestest
Continue
OK
输出结果