假设检验H0:
数据总体服从正态分布,Hi:
数据总体不服从正态分布。
当Pa时,不拒绝也,认为样本所来白的总体服从正态分布。
F检验
要求两样本数据的总体均服从正态分布,统计量F为为较大的方差与较小的方差的比值:
假设检验H。
:
两总体方差相等;Hi:
两总体方差不相等。
取a
=0.10(a较大以减少II类错误),当P0C时,不拒绝H0,认为两总体方差相等。
(四)均值的T检验
T检验“单样本均数与已知均数、两独立样本均数、配对设计资料的均数”是否存在差异。
例如,检查学生成绩平均分是否在某个分值之上;比较同一老师教的两个班的学生平均分是否存在差异;正常饲料组和维E缺乏组大白鼠肝中维生素A含量的均值是否存在差异。
T检验在SAS中用PROCTTEST过程步实现。
一、单样本与指定均值
基本语法:
PROCTTESTdata=数据集H0=mu0options;
VARvariable;
说明:
“H0=mu0”,对变量的均值与指定均值mu0(默认是H0=0),做T检验。
原假设是头=v0.
二、两独立样本的均值
基本语法:
PROCTTESTdata=数据集options;
CLASSvariable;
VARvariable;
说明:
CLASS语句指定分组变量,进行组间均值的比较。
三、配对设计资料的均值
基本语法:
PROCTTESToptions;
PAIREDvariablel*variable2;
说明:
配对均值T检验,是检验两个变量各数据的差的均值是否等于0.
四、Options可选项
(1)ALPHA=n
指定显著水平0C;
(2)CI=type
指定标准差的置信区间的类型,EQUAL(默认)为
equal-tailed的置信区间,UMPU为基于一致最优无偏检验的
置信区间,NONE不输出置信区间;
(3)SIDES=type
指定单侧、双侧检验,默认type=2为双侧检验,L为左侧
检验,U右侧检验;
五、绘制T检验的图形
在TTEST语句中使用参数PLOTS=(绘图类型)即可。
基本语法:
PROCTTESTdata=数据集PLOTS=(绘图类型);可选的绘图类型:
ALL或NONE——绘制全部图形或不绘制任何图形;
BOXPLOT——盒形图;
HISTOGRAM——直方图(包括正态分布、核密度线);
INTERVALPLOT——均值的置信区间的图形;
QQPLOT——QQ图;
SUMMARYPLOT——在一张图中绘制直方图和盒形图;
AGREEMENTPLOT——AGREEMENT图;
PROFILESPLOT——PROFILESPLOT图;
注意:
TTEST过程步都默认绘制QQ图和SUMMARYPLOT图,配对T检验还默认绘制AGREEMENTPLOT图和PROFILESPLOT图另外,指定绘制图形类型之后,那些默认图仍然会绘制,除非加上(ONLY):
PROCTTESTdata=数据集PLOTS(ONLY)=(绘图类型);
例250米女子白由泳的数据(C:
\MyRawData\Olympic50mSwim.dat),变量包括姓名、决赛用时、半决赛用时:
读入数据,用配对T检验考察决赛和半决赛用时有无明显差异。
代码:
dataSwim;
infile'c:
\MyRawData\Olympic50mSwim.dat';
inputSwimmer$FinalTimeSemiFinalTime@@;
run;
procttestdata=Swim;
pairedSemiFinalTime*FinalTime;
title'50mFreestyleSemifinalvs.FinalResults';
run;
运行结果:
程序说明:
(1)总决赛用时与半决赛用时之差的均值为0.0850,其95%置信区间为[0.239,0.1461];标准差为0.0731,其95%置信区间为[0.0483,0.1488];
(2)白由度为7的t值=3.29,P值=0.0133小于显著性水平也=0.05
(P值在双尾部分“拒绝域”),故拒绝原假设H0.结论:
两个均值不相同,其结果有统计学