第四讲 两组计量资料平均水平的统计检验.docx

上传人:b****6 文档编号:4269601 上传时间:2022-11-28 格式:DOCX 页数:17 大小:26.90KB
下载 相关 举报
第四讲 两组计量资料平均水平的统计检验.docx_第1页
第1页 / 共17页
第四讲 两组计量资料平均水平的统计检验.docx_第2页
第2页 / 共17页
第四讲 两组计量资料平均水平的统计检验.docx_第3页
第3页 / 共17页
第四讲 两组计量资料平均水平的统计检验.docx_第4页
第4页 / 共17页
第四讲 两组计量资料平均水平的统计检验.docx_第5页
第5页 / 共17页
点击查看更多>>
下载资源
资源描述

第四讲 两组计量资料平均水平的统计检验.docx

《第四讲 两组计量资料平均水平的统计检验.docx》由会员分享,可在线阅读,更多相关《第四讲 两组计量资料平均水平的统计检验.docx(17页珍藏版)》请在冰豆网上搜索。

第四讲 两组计量资料平均水平的统计检验.docx

第四讲两组计量资料平均水平的统计检验

Stata软件基本操作和数据分析入门

第四讲两组计量资料平均水平的统计检验

一、配对设计的平均水平检验

统计方法选择原则:

如果配对的差值服从近似正态分布(小样本)或大样本,则用配对t检验

小样本的情况下,配对差值呈明显偏态分布,则用配对秩符号检验(matched-pairssigned-rankstest)。

例110例男性矽肺患者经克矽平治疗,其血红蛋白(g/dL)如下:

表10例男性矽肺患者血红蛋白值(g/dL)

病例号

1

2

3

4

5

6

7

8

9

10

治疗前

11.3

15.0

15.0

13.5

12.8

10.0

11.0

12.0

13.0

12.3

治疗后

14.0

13.8

14.0

13.5

13.5

12.0

14.7

11.4

13.8

12.0

问:

治疗前后的血红蛋白的平均水平有没有改变

这是一个典型的前后配对设计的研究(但不提倡,因为对结果的解释可能会有问题)

Stata数据输入结构

X1

X2

11.3

14

15

13.8

15

14

13.5

13.5

12.8

13.5

10

12

11

14.7

12

11.4

13

13.8

12.3

12

操作如下:

gend=x1-x2产生配对差值的变量d

sktestd正态性检验

正态性检验结果如下:

.sktestd

Skewness/KurtosistestsforNormality

-------joint------

Variable|Pr(Skewness)Pr(Kurtosis)adjchi2

(2)Prob>chi2

-------------+-------------------------------------------------------

d|0.2790.7741.430.4885

正态性检验的无效假设为:

资料正态分布

相应的备选假设为:

资料非正态分布

=0.05,由于正态性检验的P值=0.4885>>,故可以认为资料近似服从正态分布。

ttestd=0配对t检验:

H0:

d=0vsH1:

d0,=0.05

结果如下:

One-samplettest

------------------------------------------------------------------------------

Variable|ObsMeanStd.Err.Std.Dev.[95%Conf.Interval]

---------+--------------------------------------------------------------------

d|10-.6799999.52042721.645735-1.857288.4972881

------------------------------------------------------------------------------

Degreesoffreedom:

9

Ho:

mean(d)=0

Ha:

mean<0Ha:

mean~=0Ha:

mean>0

t=-1.3066t=-1.3066t=-1.3066

P|t|=0.2237P>t=0.8881

P值=0.2237>,故认为治疗前后的血红蛋白的平均数差异没有统计学意义。

即:

没有足够的证据可以认为治疗前后的血红蛋白的总体平均数不同。

如果已知差值的样本量,样本均数和样本标准差,可以用立即命令如下。

设:

已知样本量为10,差值的样本均数为-0.66,差值的标准差为1.65,则输入命令如下:

ttesti样本量样本均数样本标准差0

本例为:

ttesti10-0.661.650

得到下列结果如下:

.ttesti10.661.650

One-samplettest

------------------------------------------------------------------------------

|ObsMeanStd.Err.Std.Dev.[95%Conf.Interval]

---------+--------------------------------------------------------------------

x|10.66.52177581.65-.52033891.840339

------------------------------------------------------------------------------

Degreesoffreedom:

9

Ho:

mean(x)=0

Ha:

mean<0Ha:

mean~=0Ha:

mean>0

t=1.2649t=1.2649t=1.2649

P|t|=0.2377P>t=0.1188

结果解释与结论同上述相同。

如果对于小样本的情况下,差值不满足正态分布,则用Match-Sign-ranktest,操作如下:

signrank差值变量名=0

假如本例不满足正态分布(为了借用上例资料,而假定的,实际上本例满足正态分布)则

H0:

差值的中位数=0

(其意义是治疗前的血红蛋白配大于治疗后的血红蛋白的概率=治疗前的血红蛋白小于治疗后的血红蛋白的概率)

H1:

差值的中位数0

=0.05

本例为signrankd=0

Wilcoxonsigned-ranktest

sign|obssumranksexpected

-------------+---------------------------------

positive|41827

negative|53627

zero|111

-------------+---------------------------------

all|105555

unadjustedvariance96.25

adjustmentforties0.00

adjustmentforzeros-0.25

----------

adjustedvariance96.00

Ho:

d=0

z=-0.919

Prob>|z|=0.3583

P值=0.3583>>,故没有足够的证据说明两个总体不同。

二、平行对照设计的两组资料平均水平统计检验

统计方法选择原则:

如果两组资料的方差齐性和相互独立的,并且每组资料服从正态分布(大样本资料可以忽略正态性问题),则用成组t检验,否则可以用成组Wilcoxon秩和检验。

例2为研究噪声对纺织女工子代智能是否有影响,一研究人员在某纺织厂随机抽取接触噪声95dB(A)、接触工龄5年以上的纺织女工及同一单位、条件与接触组相近但不接触噪声的女职工,其子女(学前幼儿)作为研究对象,按韦氏学前儿童智力量表(中国修订版)测定两组幼儿智商,结果如下。

问噪声对纺织女工子代智能有无影响?

(接触组group=0,不接触组group=1)

资料及其结果如下:

group

x

0

79

0

93

0

91

0

92

0

94

0

77

0

93

0

74

0

91

0

101

0

83

0

73

0

88

0

102

0

90

0

100

0

81

0

91

0

83

0

106

0

84

0

78

0

87

0

95

0

101

1

101

1

100

1

114

1

86

1

106

1

107

1

107

1

94

1

89

1

104

1

98

1

110

1

89

1

103

1

89

1

121

1

94

1

95

1

92

1

109

1

98

1

98

1

120

1

104

1

110

方差齐性检验

H0:

1=2vsH1:

12

=0.1

两组方差齐性的检验命令(仅适合两组方差齐性检验)

sdtestx,by(group)

Varianceratiotest

------------------------------------------------------------------------------

Group|ObsMeanStd.Err.Std.Dev.[95%Conf.Interval]

---------+--------------------------------------------------------------------

0|2589.081.8229289.1146485.3176692.84234

1|25101.521.9009829.50491197.59657105.4434

---------+--------------------------------------------------------------------

combined|5095.31.57745611.154392.1299898.47002

------------------------------------------------------------------------------

Ho:

sd(0)=sd

(1)

F(24,24)observed=F_obs=0.920

F(24,24)lowertail=F_L=F_obs=0.920

F(24,24)uppertail=F_U=1/F_obs=1.087

Ha:

sd(0)

(1)Ha:

sd(0)~=sd

(1)Ha:

sd(0)>sd

(1)

PF_U=0.8389P>F_obs=0.5805

P值=0.8389>>,因此可以认为两组方差齐性的。

正态性检验:

H0:

资料服从正态分布vsH1:

资料偏态分布

=0.05

每一组资料正态性检验

sktestxifgroup==0

Skewness/KurtosistestsforNormality

-------joint------

Variable|Pr(Skewness)Pr(Kurtosis)adjchi2

(2)Prob>chi2

-------------+-------------------------------------------------------

x|0.9270.3261.050.5926

.sktestxifgroup==1

Skewness/KurtosistestsforNormality

-------joint------

Variable|Pr(Skewness)Pr(Kurtosis)adjchi2

(2)Prob>chi2

-------------+-------------------------------------------------------

x|0.4740.6750.730.6948

P值均大于,因此可以认为两组资料都服从正态分布

H0:

1=2vsH1:

12

=0.05

ttestx,by(group)

Two-samplettestwithequalvariances

------------------------------------------------------------------------------

Group|ObsMeanStd.Err.Std.Dev.[95%Conf.Interval]

---------+--------------------------------------------------------------------

0|2589.081.8229289.1146485.3176692.84234

1|25101.521.9009829.50491197.59657105.4434

---------+--------------------------------------------------------------------

combined|5095.31.57745611.154392.1299898.47002

---------+--------------------------------------------------------------------

diff|-12.442.633781-17.73557-7.144429

------------------------------------------------------------------------------

Degreesoffreedom:

48

Ho:

mean(0)-mean

(1)=diff=0

Ha:

diff<0Ha:

diff~=0Ha:

diff>0

t=-4.7232t=-4.7232t=-4.7232

P|t|=0.0000P>t=1.0000

P值(<0.0001)<,并且由0-1的95%可信区间为(-17.73557,-7.144429)可以知道,不接触组幼儿的平均智商高于接触组的幼儿平均智商,并且差别有统计学意义。

如果已知两组的样本量、样本均数和样本标准差,也可以用立即命令进行统计检验

ttesti样本量1样本均数1样本标准差1样本量2样本均数2样本标准差2

例如:

本例第1组n1=25均数1=89.08标准差1=9.115

第2组n2=25均数2=101.52标准差2=9.505

则ttesti2589.089.11525101.529.505

Two-samplettestwithequalvariances

------------------------------------------------------------------------------

|ObsMeanStd.Err.Std.Dev.[95%Conf.Interval]

---------+--------------------------------------------------------------------

x|2589.081.8239.11585.3175192.84249

y|25101.521.9019.50597.59653105.4435

---------+--------------------------------------------------------------------

combined|5095.31.57748211.1544892.1299398.47007

---------+--------------------------------------------------------------------

diff|-12.442.633843-17.7357-7.144303

------------------------------------------------------------------------------

Degreesoffreedom:

48

Ho:

mean(x)-mean(y)=diff=0

Ha:

diff<0Ha:

diff~=0Ha:

diff>0

t=-4.7231t=-4.7231t=-4.7231

P|t|=0.0000P>t=1.0000

结果解释同上。

对方差不齐的情况,(小样本时,资料正态分布)还可以用t’检验

命令:

ttest观察变量名,by(分组变量名)unequal

立即命令为ttesti样本量1均数1标准差1样本量2均数2标准差2,unequal

假定本例的资料方差不齐(实际为方差不齐的),则要用t’检验如下

ttestx,by(group)unequal

 

Two-samplettestwithunequalvariances

------------------------------------------------------------------------------

Group|ObsMeanStd.Err.Std.Dev.[95%Conf.Interval]

---------+--------------------------------------------------------------------

0|2589.081.8229289.1146485.3176692.84234

1|25101.521.9009829.50491197.59657105.4434

---------+--------------------------------------------------------------------

combined|5095.31.57745611.154392.1299898.47002

---------+--------------------------------------------------------------------

diff|-12.442.633781-17.73581-7.144189

------------------------------------------------------------------------------

Satterthwaite'sdegreesoffreedom:

47.9159

Ho:

mean(0)-mean

(1)=diff=0

Ha:

diff<0Ha:

diff~=0Ha:

diff>0

t=-4.7232t=-4.7232t=-4.7232

P|t|=0.0000P>t=1.0000

结果解释同上。

t’检验有许多方法,这里介绍的Satterthwaite方法,主要根据两个样本方差差异的程度校正相应的自由度,由于本例的两个样本方差比较接近,故自由度几乎没有减少(t检验的自由度为48,而本例t’自由度为47.9159)。

由于t检验要求的两组总体方差相同(称为方差齐性),以及由于抽样误差的原因,样本方差一般不会相等,但是方差齐性的情况下,样本方差表现为两个样本方差之比1。

(注意:

两个样本方差之差很小,仍可能方差不齐。

如:

第一个样本标准差为0.1,样本量为100,第2个样本标准差为0.01,样本量为100,两个样本标准差仅差0.09,但是两个样本方差之比为100。

故用方差齐性检验的结果如下:

方差齐性的立即命令为sdtesti样本量1.标准差1样本量2.标准差2

 

sdtesti100.0.1100.0.01

Varianceratiotest

-----------------------------------------------------------------------------

|ObsMeanStd.Err.Std.Dev.[95%Conf.Interval]

---------+-------------------------------------------------------------------

x|100..01.1..

y|100..001.01..

---------+-------------------------------------------------------------------

combined|200.....

-----------------------------------------------------------------------------

Ho:

sd(x)=sd(y)

F(99,99)observed=F_obs=100.000

F(99,99)lowertail=F_L=1/F_obs=0.010

F(99,99)uppertail=F_U=F_obs=100.000

Ha:

sd(x)

sd(x)~=sd(y)Ha:

sd(x)>sd(y)

PF_U=0.0000P>F_obs=0.0000

P值<0.0001,因此认为两组的方差不齐。

故方差齐性是考察两个样本方差之比是否接近1。

如果本例的资料不满足t检验要求(注:

实际是满足的,只是想用本例介绍成组秩和检验),则用秩和检验(WilcoxonRanksumtest)。

H0:

两组资料所在总体相同

H1:

两组资料所在总体不同

=0.05

命令:

ranksum观察变量名,by(分组变量)

 

本例为ranksumx,by(group)

.ranksumx,by(group)

Two-sampleWilcoxonrank-sum(Mann-Whitney)test

group|obsranksumexpected

-------------+---------------------------------

0|25437637.5

1|25838637.5

-------------+---------------------------------

combined|5012751275

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 初中教育 > 理化生

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1