第四讲两组计量资料平均水平的统计检验文档格式.docx

资源描述

第四讲两组计量资料平均水平的统计检验文档格式.docx

《第四讲两组计量资料平均水平的统计检验文档格式.docx》由会员分享，可在线阅读，更多相关《第四讲两组计量资料平均水平的统计检验文档格式.docx（17页珍藏版）》请在冰豆网上搜索。

第四讲两组计量资料平均水平的统计检验文档格式.docx

治疗后

14.0

13.8

14.7

11.4

问：

治疗前后的血红蛋白的平均水平有没有改变

这是一个典型的前后配对设计的研究（但不提倡，因为对结果的解释可能会有问题）

Stata数据输入结构

操作如下：

gend=x1-x2产生配对差值的变量d

sktestd正态性检验

正态性检验结果如下：

.sktestd

Skewness/KurtosistestsforNormality

-------joint------

Variable|Pr（Skewness）Pr（Kurtosis）adjchi2

（2）Prob>

chi2

-------------+-------------------------------------------------------

d|0.2790.7741.430.4885

正态性检验的无效假设为：

资料正态分布

相应的备选假设为：

资料非正态分布

=0.05，由于正态性检验的P值=0.4885>

，故可以认为资料近似服从正态分布。

ttestd=0配对t检验:

H0:

d=0vsH1:

d0，=0.05

结果如下：

One-samplettest

------------------------------------------------------------------------------

Variable|ObsMeanStd.Err.Std.Dev.[95%Conf.Interval]

---------+--------------------------------------------------------------------

d|10-.6799999.52042721.645735-1.857288.4972881

Degreesoffreedom:

Ho:

mean（d）=0

Ha:

mean<

0Ha:

mean~=0Ha:

mean>

t=-1.3066t=-1.3066t=-1.3066

t=0.1119P>

|t|=0.2237P>

t=0.8881

P值=0.2237>

，故认为治疗前后的血红蛋白的平均数差异没有统计学意义。

即：

没有足够的证据可以认为治疗前后的血红蛋白的总体平均数不同。

如果已知差值的样本量，样本均数和样本标准差，可以用立即命令如下。

设：

已知样本量为10，差值的样本均数为-0.66，差值的标准差为1.65，则输入命令如下：

ttesti样本量样本均数样本标准差0

本例为：

ttesti10-0.661.650

得到下列结果如下：

.ttesti10.661.650

|ObsMeanStd.Err.Std.Dev.[95%Conf.Interval]

x|10.66.52177581.65-.52033891.840339

mean（x）=0

t=1.2649t=1.2649t=1.2649

t=0.8812P>

|t|=0.2377P>

t=0.1188

结果解释与结论同上述相同。

如果对于小样本的情况下，差值不满足正态分布，则用Match-Sign-ranktest，操作如下：

signrank差值变量名=0

假如本例不满足正态分布（为了借用上例资料，而假定的，实际上本例满足正态分布）则

H0：

差值的中位数＝0

（其意义是治疗前的血红蛋白配大于治疗后的血红蛋白的概率＝治疗前的血红蛋白小于治疗后的血红蛋白的概率）

H1：

差值的中位数0

=0.05

本例为signrankd=0

Wilcoxonsigned-ranktest

sign|obssumranksexpected

-------------+---------------------------------

positive|41827

negative|53627

zero|111

all|105555

unadjustedvariance96.25

adjustmentforties0.00

adjustmentforzeros-0.25

----------

adjustedvariance96.00

Ho:

d=0

z=-0.919

Prob>

|z|=0.3583

P值=0.3583>

，故没有足够的证据说明两个总体不同。

二、平行对照设计的两组资料平均水平统计检验

如果两组资料的方差齐性和相互独立的，并且每组资料服从正态分布（大样本资料可以忽略正态性问题），则用成组t检验，否则可以用成组Wilcoxon秩和检验。

例2为研究噪声对纺织女工子代智能是否有影响，一研究人员在某纺织厂随机抽取接触噪声95dB（A）、接触工龄5年以上的纺织女工及同一单位、条件与接触组相近但不接触噪声的女职工，其子女（学前幼儿）作为研究对象，按韦氏学前儿童智力量表（中国修订版）测定两组幼儿智商，结果如下。

问噪声对纺织女工子代智能有无影响？

（接触组group=0，不接触组group=1）

资料及其结果如下：

group

101

102

100

106

114

107

104

110

103

121

109

120

方差齐性检验

1＝2vsH1:

=0.1

两组方差齐性的检验命令（仅适合两组方差齐性检验）

sdtestx,by（group）

Varianceratiotest

Group|ObsMeanStd.Err.Std.Dev.[95%Conf.Interval]

0|2589.081.8229289.1146485.3176692.84234

1|25101.521.9009829.50491197.59657105.4434

combined|5095.31.57745611.154392.1299898.47002

sd（0）=sd

（1）

F（24,24）observed=F_obs=0.920

F（24,24）lowertail=F_L=F_obs=0.920

F（24,24）uppertail=F_U=1/F_obs=1.087

sd（0）<

（1）Ha:

sd（0）~=sd

（1）Ha:

sd（0）>

（1）

F_obs=0.4195P<

F_L+P>

F_U=0.8389P>

F_obs=0.5805

P值=0.8389>

，因此可以认为两组方差齐性的。

正态性检验：

资料服从正态分布vsH1：

资料偏态分布

每一组资料正态性检验

sktestxifgroup==0

x|0.9270.3261.050.5926

.sktestxifgroup==1

x|0.4740.6750.730.6948

P值均大于，因此可以认为两组资料都服从正态分布

1＝2vsH1：

ttestx,by（group）

Two-samplettestwithequalvariances

diff|-12.442.633781-17.73557-7.144429

mean（0）-mean

（1）=diff=0

diff<

diff~=0Ha:

diff>

t=-4.7232t=-4.7232t=-4.7232

t=0.0000P>

|t|=0.0000P>

t=1.0000

P值（<

0.0001）<

并且由0－1的95%可信区间为（-17.73557,-7.144429）可以知道，不接触组幼儿的平均智商高于接触组的幼儿平均智商，并且差别有统计学意义。

如果已知两组的样本量、样本均数和样本标准差，也可以用立即命令进行统计检验

ttesti样本量1样本均数1样本标准差1样本量2样本均数2样本标准差2

例如：

本例第1组n1=25均数1=89.08标准差1=9.115

第2组n2=25均数2=101.52标准差2=9.505

则ttesti2589.089.11525101.529.505

x|2589.081.8239.11585.3175192.84249

y|25101.521.9019.50597.59653105.4435

combined|5095.31.57748211.1544892.1299398.47007

diff|-12.442.633843-17.7357-7.144303

mean（x）-mean（y）=diff=0

t=-4.7231t=-4.7231t=-4.7231

t=0.0000P>

|t|=0.0000P>

结果解释同上。

对方差不齐的情况，（小样本时，资料正态分布）还可以用t’检验

命令：

ttest观察变量名，by（分组变量名）unequal

立即命令为ttesti样本量1均数1标准差1样本量2均数2标准差2,unequal

假定本例的资料方差不齐（实际为方差不齐的），则要用t’检验如下

ttestx,by（group）unequal

Two-samplettestwithunequalvariances

diff|-12.442.633781-17.73581-7.144189

Satterthwaite'

sdegreesoffreedom:

47.9159

t’检验有许多方法，这里介绍的Satterthwaite方法，主要根据两个样本方差差异的程度校正相应的自由度，由于本例的两个样本方差比较接近，故自由度几乎没有减少（t检验的自由度为48,而本例t’自由度为47.9159）。

由于t检验要求的两组总体方差相同（称为方差齐性），以及由于抽样误差的原因，样本方差一般不会相等，但是方差齐性的情况下，样本方差表现为两个样本方差之比1。

（注意：

两个样本方差之差很小，仍可能方差不齐。

如：

第一个样本标准差为0.1，样本量为100,第2个样本标准差为0.01，样本量为100，两个样本标准差仅差0.09，但是两个样本方差之比为100。

故用方差齐性检验的结果如下：

方差齐性的立即命令为sdtesti样本量1.标准差1样本量2.标准差2

sdtesti100.0.1100.0.01

-----------------------------------------------------------------------------

---------+-------------------------------------------------------------------

x|100..01.1..

y|100..001.01..

combined|200.....

sd（x）=sd（y）

F（99,99）observed=F_obs=100.000

F（99,99）lowertail=F_L=1/F_obs=0.010

F（99,99）uppertail=F_U=F_obs=100.000

sd（x）<

sd（y）Ha:

sd（x）~=sd（y）Ha:

sd（x）>

sd（y）

F_obs=1.0000P<

F_U=0.0000P>

F_obs=0.0000

P值<

0.0001，因此认为两组的方差不齐。

故方差齐性是考察两个样本方差之比是否接近1。

如果本例的资料不满足t检验要求（注：

实际是满足的，只是想用本例介绍成组秩和检验），则用秩和检验（WilcoxonRanksumtest）。

H0:

两组资料所在总体相同

两组资料所在总体不同

＝0.05

ranksum观察变量名,by（分组变量）

本例为ranksumx,by（group）

.ranksumx,by（group）

Two-sampleWilcoxonrank-sum（Mann-Whitney）test

group|obsranksumexpected

0|25437637.5

1|25838637.5

combined|5012751275

展开阅读全文

第四讲 两组计量资料平均水平的统计检验文档格式.docx

第四讲两组计量资料平均水平的统计检验文档格式.docx