,否则接受。
(3)列联表的独立性检验
Ho:
方法的处理效果无显著性差异
二jk:
表示格子概率,mjk=njk表示三维列联表中事件发生的理论频数。
将概率用相
应的频率频率去估计。
”q2J(乐一%)2V2(f)
令Q~(f)
i=1jk=innijk
其中:
f二(rst-1)-(为检验特定独立性所需要独立估计的概率数目)
将样本数据代入统计量进行检验。
然后将P与显著水平:
•作比较,若p:
:
:
:
•,拒绝H0,否
则接受H0。
4.实验相关SAS知识
(1)独立样本的秩检验procnpar1way过程
procnpar1way过程的基本语句形式为
procnpar1way[options];
classvariables;(procnpar1way过程不可缺少的语句)
exact;(求出检验的精确p值)
varvariables;
其中"options”可包含以下选项的部分或全部:
1DATA数据集名:
指定要分析的数据集。
2ANOVA对原始数据执行标准的单因素方差分析。
3WILCOXON进行wilcoxon型秩和检验。
当有两种处理方法时,进行的是wilcoxon秩和检
验;当有多种处理方法时,进行Kruskall-Wallis检验。
4EDF:
进行基于样本经验分布函数的非参数检验,包括Smirnov检验。
若省略这些选项,SAS系统将给出所有基于秩以及经验分布函数的非参数检验方法的分析结果。
(2)列联表的独立性检验
procfreq过程的基本语句形式为
procfreq[options];
/options;
tablesvariable1*variable2*
weightvariable;
其中"options”可包含以下选项的部分或全部:
1DATA数据集名:
指定要分析的数据集。
2chisq:
要求对生成的每个二维列联表的独立性作2检验,并计算依赖于2统计量的关联
度。
3cellchi2:
要求输出每个格子对总2统计量的贡献。
4expected:
在独立性假定下输出各格子的期望频数。
5deviation:
要求输出每个格子上的频数与期望频数之差。
6nocol:
不输出二维列联表各格子的列百分数。
7norow:
不输出二维列联表各格子的行百分数。
8nofreq:
不输出格子频数。
9nopercent:
不输出各格子的百分数。
10noprint:
不输出列联表,但允许输出各分析结果。
5.实验举例
5.1Wilcoxon秩和检验(单边和双边假设检验)
例1为了解一种新的术后护理方法和原护理方法相比是否可以显著缩短病人手术后的恢
复时间,随机的将做完某种手术的18位病人分为两组,每组9人,按不同方法护理,观测到他们
的恢复时间(单位:
天)如下:
原方法:
20,21,24,30,32,36,40,48,54
新方法:
19,22,25,26,28,29,34,37,38
在〉=0.05下检验新方法是否显著的缩短了病人手术后的恢复时间。
Wilcoxon秩和单边假设检验SAS程序如下:
dataa1;
inputmethod$time@@;
cards;
a20a21a24a30a32a36a40a48a54
b19b22b25b26b28b29b34b37b38
5
procnpar1waydata=a1wilcoxon;
classmethod;
exact;
复时间无显著差异。
52Smirnov检验
例2(数据见教材)SAS程序如下:
dataa1;
inputgroup$time@@;
cards;
a6.8a3.1a5.8a4.5a3.3a4.7a4.2a4.9
b4.4b2.5b2.8b2.1b6.6b0.0b4.8b2.3procnpar1waydata=a1edf;
classgroup;
exact;
vartime;|
run;
运行结果显示p=0.0879>0.05,即认为两种止痛药效果无显著差异;但在0.1水平上可认为两者有显著差异。
5.3.Wilcoxon符号秩检验
例3(见教材例题2.8)SAS程序如下:
dataa;
inputidproduct1product2;
cards;
1459414
2367306
3303321
4392443
5310281
6342301
7421353
8446391
9430405
10412390datab;
seta;
diff=product1-product2;
procunivariatedata=b;
vardiff;|
run;
运行结果显示:
符号秩和检验的p值为0.1094>0.05,故认为两复合肥无显著差异;而
Wilcoxon秩和检验的p值为0.0488<0.05,故认为新复合肥能显著提高小麦的产量。
5.4多种处理方法比较的Kruskal-Wallis检验
例4(见教材例题2.10)SAS程序如下:
dataa;
inputgroup$weight@@;
cards;
a164a190a203a205a206a214a228a257
b185b197b201b231
c187c212c215c220c248c265c281
d202d204d207d227d230d276
5
procnpar1waydata=awilcoxon;
classgroup;(不要加入exact语句,运行非常耗时!
)
varweight;
run;
运行结果显示Pr>Chi-Square=0.2394>0.05,故认为四种食谱的营养效果无显著差异。
5.5Friedman检验
例5(见教材例题2.12)SAS程序如下:
dataa;
inputperson$emotion$v@@;
cards;
p1e123.1p1e222.7p1e322.5p1e422.6
p2e157.6p2e253.2p2e353.7p2e453.1
p3e110.5p3e29.7p3e310.8p3e48.3
p4e123.6p4e219.6p4e321.1p4e421.6
p5e111.9p5e213.8p5e313.7p5e413.3
p6e154.6p6e247.4p6e339.2p6e437.0
p7e121.0p7e213.6p7e313.7p7e414.8
p8el20.3p8e223.6p8e316.3p8e414.8
procfreq;
tablesperson*emotion*v/scores=rankcmhnoprint;
run;
运行结果显示p值为0.0917>0.05,故认为在催眠状态下,受试者对4种情绪状态的反应无
显著差异。
5.6列联表的独立性检验
例6(数据见教材例题)SAS程序如下:
datapenalty;
inputp$d$count@@;
cards;
yw19yb17nw141nb149
J
procfreqdata=penalty;
tablesp*d/chisqexpectednocolnorownopercent;
weightcount;
run;
6.[本次实验]
为了研究两种化学添加剂对电池寿命的影响,对13个同类型的电池,随机的抽取6个加
入甲种添加剂,其余7个加入乙种添加剂,各组电池寿命如下(单位:
小时):
甲组:
182425273035
乙组:
20212832343840
对a=0.10,检验两种添加剂下电池的寿命是否有显著差异。
7・课后练习
数据分析教材习题二中的2.3、2.7、2.12、2.14。
8.参考文献
[1]范金城,梅长林.数据分析[M].北京:
科学出版社.2005P45-93.
参考答案:
[本次实验]
为了研究两种化学添加剂对电池寿命的影响,对13个同类型的电池,随机的抽取6个加
入甲种添加剂,其余7个加入乙种添加剂,各组电池寿命如下(单位:
小时):
甲组:
182425273035
乙组:
20212832343840
对a=0.10,检验两种添加剂下电池的寿命是否有显著差异。
解:
Wilcoxon秩和双边假设检验SAS程序如下:
dataa2;
inputgroup$lifetime@@;
cards;
a18a24a25a27a30a35|
b20b21b28b32b34b38b40
5
procnpar1waydata=a2wilcoxon;
classgroup;
exact;
run;
结果显示p=0.366•〉,故接受原假设H0,即认为两种添加剂下电池的寿命无显著差异。