(2)D检验,Kolmogorov-Smirnov检验的统计量为D,所以也称D检验,在样本量50WnW1000时使用。
假设检验数据总体服从正态分布,H:
数据总体不服从正态分布。
当PWa时,拒绝认为样本所来自的总体不服从正态分布;当P>a时,不拒绝H>,认为样本所来自的总体服从正态分布。
F检验
要求两样本数据的总体均服从正态分布,统计量F为为较大的方
差与较小的方差的比值:
s2
f厂1m1,2I1
S2
假设检验H:
两总体方差相等;H:
两总体方差不相等。
取a=(a较大以减少II类错误),当PWa时,拒绝H),认为两总体方差不相等;当P>a时,不拒绝H>,认为两总体方差相等。
(4)均值的T检验
T检验“单样本均数与已知均数、两独立样本均数、配对设计资料的均数”是否存在差异。
例如,检查学生成绩平均分是否在某个分值之上;比较同一老师教的两个班的学生平均分是否存在差异;正常饲料组和维E缺乏组大
白鼠肝中维生素A含量的均值是否存在差异
T检验在SAS中用PROCTTES过程步实现。
一、单样本与指定均值
基本语法:
PROCTTESTdata=数据集H0=mu0options;
VARvariable;
说明:
“H0=mu0,对变量的均值与指定均值mu(默认是HO=0,做T检验。
原假设是口二口o.
二、两独立样本的均值
基本语法:
PROCTTESTdata=数据集options;
CLASSvariable;
VARvariable;
说明:
CLASS语句指定分组变量,进行组间均值的比较。
三、配对设计资料的均值
基本语法:
PROCTTESToptions;
PAIREDvariable1*variable2;
说明:
配对均值T检验,是检验两个变量各数据的差的均值是否等于o.
四、Options可选项
(1)ALPHA=n
指定显著水平a;
(2)CI=type
指定标准差的置信区间的类型,EQUA(默认)为equal-tailed的置信区间,UMPI为基于一致最优无偏检验
的
置信区间,NON不输出置信区间;
(3)SIDES=type
指定单侧、双侧检验,默认type=2为双侧检验,L为左侧检验,U右侧检验;
五、绘制T检验的图形
在TTEST语句中使用参数PLOTS=(绘图类型)即可。
基本语法:
PROCTTESTdata=数据集PLOTS=(绘图类型);
可选的绘图类型:
ALL或NON——绘制全部图形或不绘制任何图形;
BOXPLOT――盒形图;
HISTOGRAM――直方图(包括正态分布、核密度线);INTERVALPLOT——均值的置信区间的图形;
SUMMARYPLOT——在一张图中绘制直方图和盒形图;
AGREEMENTPLOT——AGREEMEI图T;
PROFILESPLOT——PROFILESPLC图;
注意:
TTEST过程步都默认绘制QC图和SUMMARYPLOT配对T检验还默认绘制AGREEMENTPL图和PROFILESPLCffl。
另外,指定绘制图形类型之后,那些默认图仍然会绘制,除非加上(ONLY):
PROCTTESTdata=数据集PLOTS(ONLY)二(绘图类型);
例250米女子自由泳的数据(),变量包括姓名、决
赛用时、半决赛用时:
读入数据,用配对T检验考察决赛和半决赛用时有无明显差异代码:
dataSwim;
infile'c:
\MyRawData\';
inputSwimmer$FinalTimeSemiFinalTime@@;
run;
procttestdata=Swim;
pairedSemiFinalTime*FinalTime;
title'50mFreestyleSemifinalvs.FinalResults';
run;
运行结果:
程序说明:
(1)总决赛用时与半决赛用时之差的均值为,其95%置信区间为[,];标准差为,其95%置信区间为[,];
(2)自由度为7的t值=,P值二小于显著性水平a=(P值在双尾部分“拒绝域”),故拒绝原假设H0.结论:
两个均值不相同,其结果有统计学意义。