04t检验和u检验.docx
《04t检验和u检验.docx》由会员分享,可在线阅读,更多相关《04t检验和u检验.docx(12页珍藏版)》请在冰豆网上搜索。
![04t检验和u检验.docx](https://file1.bdocx.com/fileroot1/2022-11/26/3347e2f0-613d-498e-b9f6-325ce6418799/3347e2f0-613d-498e-b9f6-325ce64187991.gif)
04t检验和u检验
第四章数值资料的统计推断
(一)——t检验和u检验
数值资料的参数统计推断,按推断目的不同分为两大类:
总体参数的区间估计及总体参数的假设检验。
其中应用最广泛的是总体均数的区间估计及总体均数的假设检验。
PROCMEANS过程可以进行总体均数的区间估计,而总体均数的假设检验,依据研究设计类型的不同分别由PROCMEANS过程和PROCTTEST过程完成。
4.1总体均数的区间估计
4.1.1总体均数区间估计的涵义
总体均数的可信区间是以100(1-α)%的可信度给出包含未知总体均数所在的数值范围。
其中α称显著性水平或检验水平,常取α=0.05或0.01。
可信度作为区间估计的准确性度量,区间宽度作为区间估计的精密性度量。
4.1.2总体均数μ区间估计的计算
若样本来自正态总体,且已知样本含量n,样本均数
及样本标准差s,则估计总体均数μ的100(1-α)%可信区间的计算式为:
双侧区间:
下限为:
-tα,ν(双)·s/
上限:
+tα,ν(双)·s/
单侧区间:
>
-tα,ν(单)·s/
或<
+tα,ν(单)·s/
其中ν为自由度,ν=n-1。
4.1.3实例
例4.1对某人群随机抽取20人,用某批号的结核菌素作皮试,平均浸润直径为10.9mm,标准差为3.86mm,问这批结核菌在该人群中使用时,皮试的平均浸润直径的95%可信区间?
SAS程序为:
/*THEFOLLOWINGEXAMPLEIS95%CONFIDENCEINTERVALLCLM-UCLM*/;
DATAP25;
MEAN=10.9;S=3.86;N=20;
T=TINV(0.975,N-1);自由度为N-1时双侧0.05的T界值
IN=T*S/SQRT(N);
LCLM=MEAN-IN;
UCLM=MEAN+IN;
RUN;
结果为:
confidenceintervalLCLM-UMLM1
OBSMEANSNTINLCLMUCLM
110.93.86202.0931.80659.09312.706
皮试的平均浸润直径95%的可信区间为9.093~12.706。
4.2总体均数的假设检验—t检验与u检验
4.2.1总体均数的假设检验的涵义
总体均数的假设检验是根据资料的性质和所需要解决的问题,对总体均数建立检验假设,然后选定适当的检验方法计算相应的检验统计量,依据检验统计量相应的抽样分布,确定由样本所提供的信息是否支持所建立的假设,以决定该假设能否成立的统计分析过程。
下面介绍两组总体均数比较的假设检验方法——t检验与u检验。
4.2.2样本均数与已知总体均数比较的t检验及其SAS过程
1.推断目的:
由
与μ0比较推断μ是否等于μ0。
2.适用条件:
随机样本来自总体均数为μ的正态总体。
3.已知条件:
样本例数n,样本均数
标准差s与已知总体均数μ0。
4.检验统计量t值计算:
5.使用的SAS过程:
采用MEANS过程或UNIVARIATE过程,计算观测值与已知总体均数的差值,再对该差值的均数进行t检验。
用UNIVARIATE过程可同时实现对观测值是否服从正态分布作检验(下同)。
6.实例
例4.2某药厂制剂车间用自动装瓶机封装药液,在装瓶机工作正常时,每瓶药液净重500克。
某日随机抽取10瓶成品,称重分别为504,498,496,487,509,476,482,510,469,472。
问这时的装瓶机工作是否正常。
SAS程序:
/*THEFOLLOWINGEXAMPLEIST-TESTOFTYPEⅠ*/;
DATAD1;
INPUTX@@;
Y=X-500;
CARDS;
504498496487509476482510469472
;
PROCUNIVARIATENORMAL;
VARY;
RUN;
运行结果为:
UnivariateProcedure
Variable=Y
Moments
N10SumWgts10
Mean-9.7Sum-97
StdDev15.2392Variance232.2333
Skewness-0.0756Kurtosis-1.59813
USS3031CSS2090.1
CV-157.105StdMean4.819059
T:
Mean=0-2.01284Pr>|T|0.0750
Num^=010Num>03
M(Sign)-2Pr>=|M|0.3438
SgnRank-16Pr>=|S|0.1113
W:
Normal0.932285PrQuantiles(Def=5)
略
Extremes
略
从上面的结果来看:
正态性检验:
W=0.932285,pt检验:
T(Mean=0)=-2.01284,Pr>|T|=0.0750>0.05,按α=0.05水平,尚不能
拒绝总体均数为零的假设,即可认为装瓶机工作正常。
例4.3若上例仅已知n=10,
=490.3,s=15.2392,及μ0=500,则SAS程序为:
DATAA;
N=10;MEAN=490.3;SD=15.2392;MU=500;赋初值
T=(MEAN-MU)/(SD/SQRT(N));DF=N-1;计算t统计量及其自由度
P=(1-PROBT(ABS(T),DF))*2;计算此t值对应的概率
PUTTP;结果在LOG窗口输出
RUN;
在LOG窗口输出的结果如下:
11dataa;
12n=10;mean=490.3;sd=15.2392;mu=500;
13t=(mean-mu)/(sd/sqrt(n));df=n-1;
14p=(1-probt(abs(t),df))*2;
15puttp;
16run;
-2.0128414420.0749834588
结果同上。
4.2.3配对设计资料的t检验及其SAS过程
1.推断目的:
由对子观测值之差的均数
与μd比较,推断μd是否为零。
2.适用条件:
对子的观测值之差服从正态分布,即d~N(μd,σ2d)。
3.已知条件:
对子数n,差值的均数
及标准差sd。
4.检验统计量t值计算:
ν=n—1
5.使用的SAS过程:
采用MEANS过程或UNIVARIATE过程,计算对子观测值之差值,再对该差值的总体均数是否为零进行t检验。
6.实例
例4.4用克矽平雾化吸入治疗矽肺患者7人,测得治疗前后的血清粘蛋白(mg/L)7对观测值如表4.1,据此能否认为治疗会引起患者血清粘蛋白的变化?
表4.1克矽平治疗前后的血清粘蛋白(mg/L)
患者号
1
2
3
4
5
6
7
治疗前
65
73
73
30
73
56
73
治疗后
34
36
37
26
43
37
50
SAS程序:
/*THEFOLLOWINGEXAMPLEIST-TESTOFTYPEⅡ*/;
DATAP31;
INPUTX1X2@@;
D=X1-X2;
CARDS;
6534733673373026734356377350
;
PROCUNIVARIATENORMAL;
VARD;
RUN;
运行结果为:
UnivariateProcedure
Variable=D
Moments
N7SumWgts7
Mean25.71429Sum180
StdDev11.57172Variance133.9048
Skewness-1.17595Kurtosis1.18317
USS5432CSS803.4286
CV45.00114StdMean4.3737
T:
Mean=05.879298Pr>|T|0.0011
Num^=07Num>07
M(Sign)3.5Pr>=|M|0.0156
SgnRank14Pr>=|S|0.0156
W:
Normal0.896401PrQuantiles(Def=5)
略
Extremes
略
从上面的结果来看:
正态性检验:
W=0.896401,pT检验:
T(Mean=0)=5.879298,Pr>|T|=0.0011<0.05,按α=0.05水平,拒绝H0接受H1,可认为治疗使矽肺患者的血清粘蛋白含量下降。
4.2.4成组设计两样本均数比较的t检验及其SAS过程
1.推断目的:
由
与
比较,推断两样本来自的总体均数μ1与μ2是否相等。
2.适用条件:
两样本来自正态总体。
3.已知条件:
两组的样本含量、样本均数和标准差。
即n1,
s1与n2,
s2。
4.检验统计量t值计算。
(与两总体方差σ12与σ22是否相同有关)
a.方差齐(σ12=σ22)时:
ν=(n1-1)+(n2-1)
其中,
,称两样本的合并方差。
b.方差不齐(σ12≠σ22)时:
c.两样本方差齐性的F检验
F=max(s12,s22)/min(s12,s22)
5.使用的SAS过程:
采用TTEST过程可实现两样本均数比较的t检验。
下面具体介绍TTEST过程。
4.2.5TTEST过程
TTEST过程执行成组设计的来自正态总体的两个样本均数比较的t检验。
它具有对两样本方差齐性比较的的F检验功能,计算t值与t’值,并给出相应的p值。
1.TTEST过程的语句组成。
*PROCTTESToptions;
*CLASSvariable;
VARvariable;
BYvariable;
RUN;
2.TTEST过程的语句说明。
(1)PROCTTEST语句。
格式:
PROCTTESToptions;
options选择项有:
·Cochran要求在方差不齐条件下用Cochran和Cox法计算t’分布的检验概率水平p值。
·DATA=SASdataset;指明调用的数据集。
(2)CLASS语句
格式:
CLASSvariable;
用以指明一个两水平的分组变量名,它可以是数值型也可以是字符型。
PROCTTEST过程把数据集中的观测按这个变量的两个水平分成对立的两组。
(3)BY语句。
格式与功能同前。
(4)VAR语句。
格式:
VARvariable;
指定一组要分析的变量名,其中每一个变量包括两个样本的观测值。
如果缺省,输入数据集中的所有数值变量都包含在分析中。
3.实例
例4.5某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如表4.2,据此判断该地急性克山病患者与健康人的血磷值是否相同。
表4.2克山病患者与健康人血磷值(mmol/L)表
患者组
0.84
1.05
1.20
1.20
1.39
1.53
1.37
1.80
1.87
2.07
2.11
健康组
0.54
1.56
0.64
1.87
0.64
0.75
0.76
0.81
1.16
1.20
1.34
1.35
1.48
SAS程序:
/*THEFOLLOWINGEXAMPLEIST-TESTOFTYPEⅢ*/
DATAP35;
INPUTGROUPN;
DOI=1TON;
INPUTX@@;OUTPUT;
END;
CARDS;
111
0.841.051.201.201.391.531.671.801.872.072.11
213
0.540.640.640.750.760.811.161.201.341.351.481.581.87
;
PROCUNIVARIATENORMAL;
VARX;
BYGROUP;
PROCTTEST;
VARX;
CLASSGROUP;
RUN;
运行结果:
-------------------------GROUP=1-----------------------------
UnivariateProcedure
Variable=X
Moments
N11SumWgts11
Mean1.520909Sum16.73
StdDev0.421793Variance0.177909
Skewness-0.08288Kurtosis-1.16408
USS27.2239CSS1.779091
CV27.73293StdMean0.127175
T:
Mean=011.95916Pr>|T|0.0001
Num^=011Num>011
M(Sign)5.5Pr>=|M|0.0010
SgnRank33Pr>=|S|0.0010
W:
Normal0.962669Pr-----------------------------GROUP=2---------------------------
UnivariateProcedure
Variable=X
N13SumWgts13
Mean1.084615Sum14.1
StdDev0.42215Variance0.17821
Skewness0.342064Kurtosis-1.05815
USS17.4316CSS2.138523
CV38.92159StdMean0.117083
T:
Mean=09.263628Pr>|T|0.0001
Num^=013Num>013
M(Sign)6.5Pr>=|M|0.0002
SgnRank45.5Pr>=|S|0.0002
W:
Normal0.930363PrTTESTPROCEDURE
Variable:
X
GROUPNMeanStdDevStdErrorMinimumMaximum
-----------------------------------------------------------------
1111.52090.42180.12720.8402.110
2131.08460.42210.11710.5401.870
VariancesTDFProb>|T|
---------------------------------------
Unequal2.523921.40.0196
Equal2.523722.00.0193
ForH0:
Variancesareequal,F'=1.00DF=(12,10)Prob>F'=1.0000
从上面结果可以看出:
正态性检验:
患者组(group=1):
w=0.962669,p健康组(group=2):
w=0.930393,pT检验:
两组方差齐性检验:
F’=1.00,prob>F’=1.00。
两总体方差齐。
T检验:
t=2.5237,p=0.0193(<0.05)。
结论:
按α=0.05水平,拒绝H0接受H1,可认为克山病患者的血磷值较健康人的要高。
4.3.6大样本的两个样本比较的u检验
1.适用条件:
两个样本含量大于50。
2.已知条件:
两组的样本含量、样本均数和标准差。
即n1,
s1与n2,
s2。
3.检验统计量计算:
4.实例
例4.6某地抽查25-29岁正常人群的红细胞数,其中男性156人,得均数4.65×1012/L,标准差为0.55×1012/L;女性74人,得均数4.22×1012/L,标准差0.44×1012/L。
问该人群男、女红细胞数有无差异。
SAS程序:
DATAP33;
N1=156;MEAN1=4.65;SD1=0.55;
N2=74;MEAN2=4.22;SD2=0.44;
U=(MEAN1-MEAN2)/SQRT(SD1**2/N1+SD2**2/N2);计算u值
P=(1-PROBNORM(ABS(U)))*2;计算概率p
PUTUP;在LOG窗口输出
RUN;
在LOG窗口输出的结果为:
22Datap33;
23N1=156;mean1=4.65;sd1=0.55;
24N2=74;mean2=4.22;sd2=0.44;
25U=(mean1-mean2)/sqrt(sd1**2/n1+sd2**2/n2);
26P=(1-probnorm(abs(u)))*2;
27Putup;
28Run;
6.37102146761.877734E-10
NOTE:
ThedatasetWORK.P33has1observationsand8variables.
NOTE:
TheDATAstatementused0.05seconds.
结果为:
u=6.371,p=1.878×10-10。
按α=0.05水平,拒绝H0接受H1,可认为该地男、女红细胞数不同,男性高于女性。