第四讲 两组计量资料平均水平的统计检验文档格式.docx
《第四讲 两组计量资料平均水平的统计检验文档格式.docx》由会员分享,可在线阅读,更多相关《第四讲 两组计量资料平均水平的统计检验文档格式.docx(17页珍藏版)》请在冰豆网上搜索。
治疗后
14.0
13.8
14.7
11.4
问:
治疗前后的血红蛋白的平均水平有没有改变
这是一个典型的前后配对设计的研究(但不提倡,因为对结果的解释可能会有问题)
Stata数据输入结构
X1
X2
14
15
12
11
13
操作如下:
gend=x1-x2产生配对差值的变量d
sktestd正态性检验
正态性检验结果如下:
.sktestd
Skewness/KurtosistestsforNormality
-------joint------
Variable|Pr(Skewness)Pr(Kurtosis)adjchi2
(2)Prob>
chi2
-------------+-------------------------------------------------------
d|0.2790.7741.430.4885
正态性检验的无效假设为:
资料正态分布
相应的备选假设为:
资料非正态分布
=0.05,由于正态性检验的P值=0.4885>
>
,故可以认为资料近似服从正态分布。
ttestd=0配对t检验:
H0:
d=0vsH1:
d0,=0.05
结果如下:
One-samplettest
------------------------------------------------------------------------------
Variable|ObsMeanStd.Err.Std.Dev.[95%Conf.Interval]
---------+--------------------------------------------------------------------
d|10-.6799999.52042721.645735-1.857288.4972881
Degreesoffreedom:
9
Ho:
mean(d)=0
Ha:
mean<
0Ha:
mean~=0Ha:
mean>
0
t=-1.3066t=-1.3066t=-1.3066
P<
t=0.1119P>
|t|=0.2237P>
t=0.8881
P值=0.2237>
,故认为治疗前后的血红蛋白的平均数差异没有统计学意义。
即:
没有足够的证据可以认为治疗前后的血红蛋白的总体平均数不同。
如果已知差值的样本量,样本均数和样本标准差,可以用立即命令如下。
设:
已知样本量为10,差值的样本均数为-0.66,差值的标准差为1.65,则输入命令如下:
ttesti样本量样本均数样本标准差0
本例为:
ttesti10-0.661.650
得到下列结果如下:
.ttesti10.661.650
|ObsMeanStd.Err.Std.Dev.[95%Conf.Interval]
x|10.66.52177581.65-.52033891.840339
mean(x)=0
t=1.2649t=1.2649t=1.2649
t=0.8812P>
|t|=0.2377P>
t=0.1188
结果解释与结论同上述相同。
如果对于小样本的情况下,差值不满足正态分布,则用Match-Sign-ranktest,操作如下:
signrank差值变量名=0
假如本例不满足正态分布(为了借用上例资料,而假定的,实际上本例满足正态分布)则
H0:
差值的中位数=0
(其意义是治疗前的血红蛋白配大于治疗后的血红蛋白的概率=治疗前的血红蛋白小于治疗后的血红蛋白的概率)
H1:
差值的中位数0
=0.05
本例为signrankd=0
Wilcoxonsigned-ranktest
sign|obssumranksexpected
-------------+---------------------------------
positive|41827
negative|53627
zero|111
all|105555
unadjustedvariance96.25
adjustmentforties0.00
adjustmentforzeros-0.25
----------
adjustedvariance96.00
Ho:
d=0
z=-0.919
Prob>
|z|=0.3583
P值=0.3583>
,故没有足够的证据说明两个总体不同。
二、平行对照设计的两组资料平均水平统计检验
如果两组资料的方差齐性和相互独立的,并且每组资料服从正态分布(大样本资料可以忽略正态性问题),则用成组t检验,否则可以用成组Wilcoxon秩和检验。
例2为研究噪声对纺织女工子代智能是否有影响,一研究人员在某纺织厂随机抽取接触噪声95dB(A)、接触工龄5年以上的纺织女工及同一单位、条件与接触组相近但不接触噪声的女职工,其子女(学前幼儿)作为研究对象,按韦氏学前儿童智力量表(中国修订版)测定两组幼儿智商,结果如下。
问噪声对纺织女工子代智能有无影响?
(接触组group=0,不接触组group=1)
资料及其结果如下:
group
x
79
93
91
92
94
77
74
101
83
73
88
102
90
100
81
106
84
78
87
95
114
86
107
89
104
98
110
103
121
109
120
方差齐性检验
1=2vsH1:
=0.1
两组方差齐性的检验命令(仅适合两组方差齐性检验)
sdtestx,by(group)
Varianceratiotest
Group|ObsMeanStd.Err.Std.Dev.[95%Conf.Interval]
0|2589.081.8229289.1146485.3176692.84234
1|25101.521.9009829.50491197.59657105.4434
combined|5095.31.57745611.154392.1299898.47002
sd(0)=sd
(1)
F(24,24)observed=F_obs=0.920
F(24,24)lowertail=F_L=F_obs=0.920
F(24,24)uppertail=F_U=1/F_obs=1.087
sd(0)<
sd
(1)Ha:
sd(0)~=sd
(1)Ha:
sd(0)>
sd
(1)
F_obs=0.4195P<
F_L+P>
F_U=0.8389P>
F_obs=0.5805
P值=0.8389>
,因此可以认为两组方差齐性的。
正态性检验:
资料服从正态分布vsH1:
资料偏态分布
每一组资料正态性检验
sktestxifgroup==0
x|0.9270.3261.050.5926
.sktestxifgroup==1
x|0.4740.6750.730.6948
P值均大于,因此可以认为两组资料都服从正态分布
1=2vsH1:
ttestx,by(group)
Two-samplettestwithequalvariances
diff|-12.442.633781-17.73557-7.144429
48
mean(0)-mean
(1)=diff=0
diff<
diff~=0Ha:
diff>
t=-4.7232t=-4.7232t=-4.7232
t=0.0000P>
|t|=0.0000P>
t=1.0000
P值(<
0.0001)<
并且由0-1的95%可信区间为(-17.73557,-7.144429)可以知道,不接触组幼儿的平均智商高于接触组的幼儿平均智商,并且差别有统计学意义。
如果已知两组的样本量、样本均数和样本标准差,也可以用立即命令进行统计检验
ttesti样本量1样本均数1样本标准差1样本量2样本均数2样本标准差2
例如:
本例第1组n1=25均数1=89.08标准差1=9.115
第2组n2=25均数2=101.52标准差2=9.505
则ttesti2589.089.11525101.529.505
x|2589.081.8239.11585.3175192.84249
y|25101.521.9019.50597.59653105.4435
combined|5095.31.57748211.1544892.1299398.47007
diff|-12.442.633843-17.7357-7.144303
mean(x)-mean(y)=diff=0
t=-4.7231t=-4.7231t=-4.7231
t=0.0000P>
|t|=0.0000P>
结果解释同上。
对方差不齐的情况,(小样本时,资料正态分布)还可以用t’检验
命令:
ttest观察变量名,by(分组变量名)unequal
立即命令为ttesti样本量1均数1标准差1样本量2均数2标准差2,unequal
假定本例的资料方差不齐(实际为方差不齐的),则要用t’检验如下
ttestx,by(group)unequal
Two-samplettestwithunequalvariances
diff|-12.442.633781-17.73581-7.144189
Satterthwaite'
sdegreesoffreedom:
47.9159
t’检验有许多方法,这里介绍的Satterthwaite方法,主要根据两个样本方差差异的程度校正相应的自由度,由于本例的两个样本方差比较接近,故自由度几乎没有减少(t检验的自由度为48,而本例t’自由度为47.9159)。
由于t检验要求的两组总体方差相同(称为方差齐性),以及由于抽样误差的原因,样本方差一般不会相等,但是方差齐性的情况下,样本方差表现为两个样本方差之比1。
(注意:
两个样本方差之差很小,仍可能方差不齐。
如:
第一个样本标准差为0.1,样本量为100,第2个样本标准差为0.01,样本量为100,两个样本标准差仅差0.09,但是两个样本方差之比为100。
故用方差齐性检验的结果如下:
方差齐性的立即命令为sdtesti样本量1.标准差1样本量2.标准差2
sdtesti100.0.1100.0.01
-----------------------------------------------------------------------------
---------+-------------------------------------------------------------------
x|100..01.1..
y|100..001.01..
combined|200.....
sd(x)=sd(y)
F(99,99)observed=F_obs=100.000
F(99,99)lowertail=F_L=1/F_obs=0.010
F(99,99)uppertail=F_U=F_obs=100.000
sd(x)<
sd(y)Ha:
sd(x)~=sd(y)Ha:
sd(x)>
sd(y)
F_obs=1.0000P<
F_U=0.0000P>
F_obs=0.0000
P值<
0.0001,因此认为两组的方差不齐。
故方差齐性是考察两个样本方差之比是否接近1。
如果本例的资料不满足t检验要求(注:
实际是满足的,只是想用本例介绍成组秩和检验),则用秩和检验(WilcoxonRanksumtest)。
H0:
两组资料所在总体相同
两组资料所在总体不同
=0.05
ranksum观察变量名,by(分组变量)
本例为ranksumx,by(group)
.ranksumx,by(group)
Two-sampleWilcoxonrank-sum(Mann-Whitney)test
group|obsranksumexpected
0|25437637.5
1|25838637.5
combined|5012751275