04t检验和u检验.docx

资源描述

04t检验和u检验.docx

《04t检验和u检验.docx》由会员分享，可在线阅读，更多相关《04t检验和u检验.docx（12页珍藏版）》请在冰豆网上搜索。

04t检验和u检验.docx

04t检验和u检验

第四章数值资料的统计推断

（一）——t检验和u检验

数值资料的参数统计推断，按推断目的不同分为两大类：

总体参数的区间估计及总体参数的假设检验。

其中应用最广泛的是总体均数的区间估计及总体均数的假设检验。

PROCMEANS过程可以进行总体均数的区间估计，而总体均数的假设检验，依据研究设计类型的不同分别由PROCMEANS过程和PROCTTEST过程完成。

4.1总体均数的区间估计

4.1.1总体均数区间估计的涵义

总体均数的可信区间是以100（1-α）%的可信度给出包含未知总体均数所在的数值范围。

其中α称显著性水平或检验水平，常取α＝0.05或0.01。

可信度作为区间估计的准确性度量，区间宽度作为区间估计的精密性度量。

4.1.2总体均数μ区间估计的计算

若样本来自正态总体，且已知样本含量n,样本均数

及样本标准差s，则估计总体均数μ的100（1-α）%可信区间的计算式为：

双侧区间：

下限为:

-tα,ν（双）·s/

上限:

+tα,ν（双）·s/

单侧区间：

-tα,ν（单）·s/

或<

+tα,ν（单）·s/

其中ν为自由度，ν＝n-1。

4.1.3实例

例4.1对某人群随机抽取20人，用某批号的结核菌素作皮试，平均浸润直径为10.9mm,标准差为3.86mm,问这批结核菌在该人群中使用时，皮试的平均浸润直径的95%可信区间？

SAS程序为:

/*THEFOLLOWINGEXAMPLEIS95%CONFIDENCEINTERVALLCLM-UCLM*/;

DATAP25;

MEAN=10.9;S=3.86;N=20;

T=TINV（0.975,N-1）;自由度为N-1时双侧0.05的T界值

IN=T*S/SQRT（N）;

LCLM=MEAN-IN;

UCLM=MEAN+IN;

RUN;

结果为：

confidenceintervalLCLM-UMLM1

OBSMEANSNTINLCLMUCLM

110.93.86202.0931.80659.09312.706

皮试的平均浸润直径95%的可信区间为9.093～12.706。

4.2总体均数的假设检验—t检验与u检验

4.2.1总体均数的假设检验的涵义

总体均数的假设检验是根据资料的性质和所需要解决的问题，对总体均数建立检验假设，然后选定适当的检验方法计算相应的检验统计量，依据检验统计量相应的抽样分布，确定由样本所提供的信息是否支持所建立的假设，以决定该假设能否成立的统计分析过程。

下面介绍两组总体均数比较的假设检验方法——t检验与u检验。

4.2.2样本均数与已知总体均数比较的t检验及其SAS过程

1.推断目的：

由

与μ0比较推断μ是否等于μ0。

2.适用条件：

随机样本来自总体均数为μ的正态总体。

3.已知条件：

样本例数n,样本均数

标准差s与已知总体均数μ0。

4.检验统计量t值计算：

5.使用的SAS过程：

采用MEANS过程或UNIVARIATE过程，计算观测值与已知总体均数的差值，再对该差值的均数进行t检验。

用UNIVARIATE过程可同时实现对观测值是否服从正态分布作检验（下同）。

6.实例

例4.2某药厂制剂车间用自动装瓶机封装药液，在装瓶机工作正常时，每瓶药液净重500克。

某日随机抽取10瓶成品，称重分别为504,498,496,487,509,476,482,510,469,472。

问这时的装瓶机工作是否正常。

SAS程序：

/*THEFOLLOWINGEXAMPLEIST-TESTOFTYPEⅠ*/;

DATAD1;

INPUTX@@;

Y=X-500;

CARDS;

504498496487509476482510469472

;

PROCUNIVARIATENORMAL;

VARY;

RUN;

运行结果为：

UnivariateProcedure

Variable=Y

Moments

N10SumWgts10

Mean-9.7Sum-97

StdDev15.2392Variance232.2333

Skewness-0.0756Kurtosis-1.59813

USS3031CSS2090.1

CV-157.105StdMean4.819059

Mean=0-2.01284Pr>|T|0.0750

Num^=010Num>03

M（Sign）-2Pr>=|M|0.3438

SgnRank-16Pr>=|S|0.1113

Normal0.932285Pr

Quantiles（Def=5）

略

Extremes

略

从上面的结果来看：

正态性检验：

W=0.932285,p

t检验：

T（Mean=0）=-2.01284,Pr>|T|＝0.0750>0.05，按α＝0.05水平，尚不能

拒绝总体均数为零的假设，即可认为装瓶机工作正常。

例4.3若上例仅已知n=10,

=490.3,s=15.2392,及μ0=500,则SAS程序为：

DATAA;

N=10;MEAN=490.3;SD=15.2392;MU=500;赋初值

T=（MEAN-MU）/（SD/SQRT（N））;DF=N-1;计算t统计量及其自由度

P=（1-PROBT（ABS（T）,DF））＊2;计算此t值对应的概率

PUTTP;结果在LOG窗口输出

RUN;

在LOG窗口输出的结果如下：

11dataa;

12n=10;mean=490.3;sd=15.2392;mu=500;

13t=（mean-mu）/（sd/sqrt（n））;df=n-1;

14p=（1-probt（abs（t）,df））*2;

15puttp;

16run;

-2.0128414420.0749834588

结果同上。

4.2.3配对设计资料的t检验及其SAS过程

1.推断目的：

由对子观测值之差的均数

与μd比较，推断μd是否为零。

2.适用条件：

对子的观测值之差服从正态分布，即d～N（μd,σ2d）。

3.已知条件：

对子数n,差值的均数

及标准差sd。

4.检验统计量t值计算：

ν＝n—1

5.使用的SAS过程：

采用MEANS过程或UNIVARIATE过程，计算对子观测值之差值，再对该差值的总体均数是否为零进行t检验。

6.实例

例4.4用克矽平雾化吸入治疗矽肺患者7人，测得治疗前后的血清粘蛋白（mg/L）7对观测值如表4.1，据此能否认为治疗会引起患者血清粘蛋白的变化？

表4.1克矽平治疗前后的血清粘蛋白（mg/L）

患者号

治疗前

治疗后

SAS程序：

/*THEFOLLOWINGEXAMPLEIST-TESTOFTYPEⅡ*/;

DATAP31;

INPUTX1X2@@;

D=X1-X2;

CARDS;

6534733673373026734356377350

;

PROCUNIVARIATENORMAL;

VARD;

RUN;

运行结果为：

UnivariateProcedure

Variable=D

Moments

N7SumWgts7

Mean25.71429Sum180

StdDev11.57172Variance133.9048

Skewness-1.17595Kurtosis1.18317

USS5432CSS803.4286

CV45.00114StdMean4.3737

Mean=05.879298Pr>|T|0.0011

Num^=07Num>07

M（Sign）3.5Pr>=|M|0.0156

SgnRank14Pr>=|S|0.0156

Normal0.896401Pr

Quantiles（Def=5）

略

Extremes

略

从上面的结果来看：

正态性检验：

W=0.896401,p

T检验：

T（Mean=0）=5.879298,Pr>|T|＝0.0011<0.05，按α＝0.05水平，拒绝H0接受H1,可认为治疗使矽肺患者的血清粘蛋白含量下降。

4.2.4成组设计两样本均数比较的t检验及其SAS过程

1.推断目的：

由

与

比较，推断两样本来自的总体均数μ1与μ2是否相等。

2.适用条件：

两样本来自正态总体。

3.已知条件：

两组的样本含量、样本均数和标准差。

即n1,

s1与n2,

s2。

4.检验统计量t值计算。

（与两总体方差σ12与σ22是否相同有关）

a.方差齐（σ12＝σ22）时：

ν＝（n1-1）+（n2-1）

其中，

，称两样本的合并方差。

b.方差不齐（σ12≠σ22）时：

c.两样本方差齐性的F检验

F=max（s12,s22）/min（s12,s22）

5.使用的SAS过程：

采用TTEST过程可实现两样本均数比较的t检验。

下面具体介绍TTEST过程。

4.2.5TTEST过程

TTEST过程执行成组设计的来自正态总体的两个样本均数比较的t检验。

它具有对两样本方差齐性比较的的F检验功能，计算t值与t’值，并给出相应的p值。

1.TTEST过程的语句组成。

*PROCTTESToptions;

*CLASSvariable;

VARvariable;

BYvariable;

RUN;

2.TTEST过程的语句说明。

（1）PROCTTEST语句。

格式：

PROCTTESToptions;

options选择项有：

·Cochran要求在方差不齐条件下用Cochran和Cox法计算t’分布的检验概率水平p值。

·DATA=SASdataset;指明调用的数据集。

（2）CLASS语句

格式：

CLASSvariable;

用以指明一个两水平的分组变量名，它可以是数值型也可以是字符型。

PROCTTEST过程把数据集中的观测按这个变量的两个水平分成对立的两组。

（3）BY语句。

格式与功能同前。

（4）VAR语句。

格式：

VARvariable;

指定一组要分析的变量名，其中每一个变量包括两个样本的观测值。

如果缺省，输入数据集中的所有数值变量都包含在分析中。

3．实例

例4.5某克山病区测得11例克山病患者与13名健康人的血磷值（mmol/L）如表4.2，据此判断该地急性克山病患者与健康人的血磷值是否相同。

表4.2克山病患者与健康人血磷值（mmol/L）表

患者组

0.84

1.05

1.20

1.39

1.53

1.37

1.80

1.87

2.07

2.11

健康组

0.54

1.56

0.64

1.87

0.64

0.75

0.76

0.81

1.16

1.20

1.34

1.35

1.48

SAS程序：

/*THEFOLLOWINGEXAMPLEIST-TESTOFTYPEⅢ*/

DATAP35;

INPUTGROUPN;

DOI=1TON;

INPUTX@@;OUTPUT;

END;

CARDS;

111

0.841.051.201.201.391.531.671.801.872.072.11

213

0.540.640.640.750.760.811.161.201.341.351.481.581.87

;

PROCUNIVARIATENORMAL;

VARX;

BYGROUP;

PROCTTEST;

VARX;

CLASSGROUP;

RUN;

运行结果：

-------------------------GROUP=1-----------------------------

UnivariateProcedure

Variable=X

Moments

N11SumWgts11

Mean1.520909Sum16.73

StdDev0.421793Variance0.177909

Skewness-0.08288Kurtosis-1.16408

USS27.2239CSS1.779091

CV27.73293StdMean0.127175

Mean=011.95916Pr>|T|0.0001

Num^=011Num>011

M（Sign）5.5Pr>=|M|0.0010

SgnRank33Pr>=|S|0.0010

Normal0.962669Pr

-----------------------------GROUP=2---------------------------

UnivariateProcedure

Variable=X

N13SumWgts13

Mean1.084615Sum14.1

StdDev0.42215Variance0.17821

Skewness0.342064Kurtosis-1.05815

USS17.4316CSS2.138523

CV38.92159StdMean0.117083

Mean=09.263628Pr>|T|0.0001

Num^=013Num>013

M（Sign）6.5Pr>=|M|0.0002

SgnRank45.5Pr>=|S|0.0002

Normal0.930363Pr

TTESTPROCEDURE

Variable:

GROUPNMeanStdDevStdErrorMinimumMaximum

-----------------------------------------------------------------

1111.52090.42180.12720.8402.110

2131.08460.42210.11710.5401.870

VariancesTDFProb>|T|

---------------------------------------

Unequal2.523921.40.0196

Equal2.523722.00.0193

ForH0:

Variancesareequal,F'=1.00DF=（12,10）Prob>F'=1.0000

从上面结果可以看出：

正态性检验：

患者组（group=1）:

w=0.962669,p

健康组（group=2）:

w=0.930393,p

T检验：

两组方差齐性检验：

F’=1.00,prob>F’=1.00。

两总体方差齐。

T检验：

t=2.5237,p=0.0193（<0.05）。

结论：

按α＝0.05水平，拒绝H0接受H1,可认为克山病患者的血磷值较健康人的要高。

4.3.6大样本的两个样本比较的u检验

1.适用条件：

两个样本含量大于50。

2.已知条件：

两组的样本含量、样本均数和标准差。

即n1,

s1与n2,

s2。

3.检验统计量计算：

4.实例

例4.6某地抽查25-29岁正常人群的红细胞数，其中男性156人，得均数4.65×1012/L,标准差为0.55×1012/L；女性74人，得均数4.22×1012/L,标准差0.44×1012/L。

问该人群男、女红细胞数有无差异。

SAS程序:

DATAP33;

N1=156;MEAN1=4.65;SD1=0.55;

N2=74;MEAN2=4.22;SD2=0.44;

U=（MEAN1-MEAN2）/SQRT（SD1**2/N1+SD2**2/N2）;计算u值

P=（1-PROBNORM（ABS（U）））*2;计算概率p

PUTUP;在LOG窗口输出

RUN;

在LOG窗口输出的结果为：

22Datap33;

23N1=156;mean1=4.65;sd1=0.55;

24N2=74;mean2=4.22;sd2=0.44;

25U=（mean1-mean2）/sqrt（sd1**2/n1+sd2**2/n2）;

26P=（1-probnorm（abs（u）））*2;

27Putup;

28Run;

6.37102146761.877734E-10

NOTE:

ThedatasetWORK.P33has1observationsand8variables.

NOTE:

TheDATAstatementused0.05seconds.

结果为：

u=6.371,p=1.878×10-10。

按α＝0.05水平,拒绝H0接受H1,可认为该地男、女红细胞数不同，男性高于女性。

展开阅读全文