SAS备课笔记非参数检验Word下载.docx

资源描述

SAS备课笔记非参数检验Word下载.docx

《SAS备课笔记非参数检验Word下载.docx》由会员分享，可在线阅读，更多相关《SAS备课笔记非参数检验Word下载.docx（21页珍藏版）》请在冰豆网上搜索。

SAS备课笔记非参数检验Word下载.docx

VＷ

运用VａｎderWaerｄeｎ评分进行分析计算

CORＲEＣＴ＝NO

在两样本时,禁止Wｉlcoxoｎ和Sｉegel-Tukｅy检验的连续性校正过程

KＬOＴZ

运用Klotｚ评分进行分析

MOOD

运用Mｏoｄ评分进行分析

ＳCORES=DAＴA

以原始数据为评分值进行分析

WILＣＯXＯN

对两样本进行Wｉlｃoxon秩和检验，对多样本进行Kruskal-Wallｉs检验

１.exact语句

ｅxacｔ语句要求SAS对指定的统计量（选项）进行精确概率的计算。

其后的统计量选项可为以下项目,分别对应相应的统计计算方式（可参见上表）。

AＢ，KLOTZ,ＫS，MEDIAN，ＭOOD,SAＶAGE,SCORＥS=DAＴA，ST,WILCOXON，VW等。

运算选项为精确概率的计算过程指定一些控制项目,如选项“mｃ”要求以MｏnteＣａｒlo方法计算精确概率。

2.output语句

ouｔpｕt语句与其它过程中相应的语句大同小异，不同之处在于语句最后的选项。

此处的选项绝大多数包括在上表中，指定在输出数据集中包含所指定项目所对应的统计量。

3.var语句

var语句用以指定要进行分析的变量，变量必须为数值型。

若省略此语句，SAS将对除bｙ语句、cｌａss语句以及freq语句中指定的变量之外的所有数值型变量进行分析。

二、不同类型资料的非参数检验方法

1.　两独立样本差别的秩和检验

两独立样本的非参数检验是在对总体分布不了解的情况下,通过分析样本数据,推断样本来自的两个独立总体的分布是否存在显著差异,一般来说是推断两个独立总体的均值或中位数是否存在显著差异。

关于样本是否为独立的，主要看在一个总体中抽取样本对在另一个总体中抽取样本有无影响。

如果没有影响,则可以认为这两个总体是独立的。

零假设

：

样本来自的两独立总体的分布没有显著差异

检验方法有多种：

（1）两独立样本的威克逊等级和检验（Wilcoxｏn秩和检验），也被称为Maｎn-WhｉｔｎeyＵ检验。

曼-惠特尼Ｕ检验（Mann-Whｉｔｎｅy　U），该检验主要是通过对平均秩的研究来实现推断的。

其基本思路是：

首先，将两组样本数据

和

混合并按升序排序（ｍ和n分别为两组样本的样本容量，求出每个数据各自的秩

;

然后,分别对

的秩求平均,得到两个平均秩

如果这两个平均秩相差甚远,则倾向于拒绝零假设。

（2）两独立样本的K－S检验（Koｌｍogorov—Smirnｏv　Z）,该检验首先将两组样本混合并按升序排序；

然后，分别计算两组样本秩的累计频数和每个点上的累计频率；

最后，将两个累计频率相减，得到差值序列数据。

（3）沃尔德—沃尔福威茨游程检验（Wｌad-Ｗolfwｉｔzruns），该检验将两组样本混合并按升序排序，在数据排序的同时，两组样本的每个观察值对应的样本组标志值序列也随之重新排列；

然后,对这个标志值序列求游程。

如果样本所属的两总体的分布形态存在较大差距,那么计算出的游程数会相对比较小。

如果游程数比较大，则应该是由于两样本数据充分混合的结果，那么它们的分布应该不存在显著差异。

【例1】下表为来自两个样本A、B的测量数据，经检验知两样本方差不齐,试做非参数检验比较两组数据的差别。

两独立样本A、B测量数据

A组

1４

2２

３６

4０

4８

６3

9８

B组

1８

２0

【程序】对该资料，应选用Wilcoｘｏｎ秩和检验（ｒankｓumtesｔ）方法，编制SAS程序如下:

datａｓasuseｒ.data10_01;

　ｄoｇ=1to2；

ｉnｐｕtx@@;

ｏｕtput;

end;

　datａｌinｅs;

7　３14　5２26　３610

４01７　４818　６３　20　９83９

proｃ　ｎpar１ｗａy　wilcoxon;

　claｓsg;

varx;

run;

程序中因素“ｇ”分组因素,“１”代表A组，“2”代表B组,“x”为待分析的变量。

Pｒocnpar1wａｙ语句后的选项“Ｗiｌｃoｘon”指定SAS进行Wilcoxoｎ秩和检验。

【结果】

SＡS给出两组数据的基本信息（样本量、秩和等）;

给出在零假设下各组统计量（Sumｏfscores项）的期望值（ExpecｔｅdUnderH0项）及标准差（StdDeｖUndｅｒＨ0项），最后还给出以近似z检验以及近似t检验所得的统计量和所对应的单、双侧概率值。

另外,默认状态下,SAＳ同时给出Kruｓｋal－Ｗalｌis检验的结果。

所不同的是,在两样本量相同时,ＳＡS以秩和较大者作为对象统计量进行概率值的计算，而非医学统计学教材上所说的以较小秩和为对象统计量。

在两样本量不同时，ＳAS以样本量较小组的秩和为对象统计量，这一点则与教材上的相同。

如果去掉“wｉlcoｘon”：

data　sasｕser．data１０＿01;

　do　g=1　tｏ２;

ｉnputx＠@;

　output;

　datａlineｓ；

7　３1４5　2２63610

　40174８１８　6320９８3９

procnpar1wａy;

claｓsｇ；

　varx;

run；

则SAS给出所以方法的执行结果:

ﻬ【例2】为了鉴别新旧两种生产方法对生产效率的影响,随机抽取了２２人用旧生产方法生产,２５人用新生产方法生产,每人平均日产量（件）资料如下:

旧方法:

203１　271８10２63９　45４1　24　22231４１13237　４0４6495554　19

新方法:

３6393125　26　28　２0　2124２1５８555６４１３7　49４４4０1216　1５24２3　28　11

问两种方法对日产量影响有无显著差异（

）?

【数据摆放】

【程序】

ｐroc　ｎpaｒ1waydaｔa=ｓasuｓer.data1０_02　ｗilcoxｏm;

class　g;

var　x;

ｒｕn;

【运行结果】

【例３】用某药治疗不同病情的老年慢性支气管炎病人,　疗效见下表,比较该药对两种病情的疗效。

某药对两种不同病情的支气管炎疗效

疗效

单纯型

单纯型合并肺气肿

控制

显效

６

有效

近控

1３

１１

【程序】对于此例，将疗效看成待分析的变量x,从“控制”到“近控”分别对其赋值1、2、３、4,病情则作为分组因素，同时需引入一个频度因素ｆ,以代表不同取值状态下ｘ的频数。

编制程序如下:

ｄatasaｓuser.ｄata10＿03;

ｄｏx=1ｔo　4;

ｄｏｇ=1　tｏ2;

iｎput　f＠@;

ouｔｐｕt;

eｎd;

　ｄatalineｓ;

6542　１863０23１３11

;

proｃnpar1wａywiｌｃoxoｎ；

clａssg;

ｖarx；

ｆｒeqｆ;

ｒuｎ;

【结果】程序和前例的基本相同，只根据资料特点增加了freq语句。

提交程序，运行结果如下。

2．配对设计资料的秩检验

配对设计资料一般采用配对t检验方法进行分析，但若配对数据差数的分布非正态分布,但其总体分布基本对称,则可采用Ｗilｃoxon符号秩检验（ｓｉgned　rａnktｅｓｔ）作为配对t检验的替代方法。

Wｉｌcoｘon符号秩检验功效很高,在数据满足配对t检验的要求时，符号秩检验的功效可达配对t检验功效的95%。

SAS中符号检验（sｉgntesｔ）和符号秩检验的功能不是在npar１way过程中实现，而是通过uniｖaｒiaｔｅ过程来实现的。

可能因为这两项功能涉及的是关于单变量分析的缘故。

【例4】采用配对设计，用某种放射线的A，B两种方式分别局部照射家兔的两个部位，观察放射性急性皮肤损伤程度,结果见下表。

试用符号秩检验比较A，B的损伤程度是否不同。

家兔皮肤损伤程度

编号

方式A

方式B

１

５5

４

4７

5３

４8

1０

４5

１1

3２

dａtａ　sasｕseｒ.dａta１0＿4;

inputx1x２;

　d=ｘ1-x２;

datalines;

3９　55

　4254

　5155

　４３47

　５5　53

４563

22５2

4844

40　48

45　5５

４0３2

4957

pｒｏc　ｕnivａrｉateloｃcount;

ｖar　ｄ;

ruｎ；

此例中，我们须对两次测得数据的差值进行单变量分析,所以数据步中用到赋值语句“d=ｘ1-x2;

”。

Uniｖarｉate过程在默认状态下即给出关于待分析变量的符号检验以及符号秩检验结果，“proｃunivariate”语句后的“loccoｕnｔ”选项指定ＳAS给出样本数据在系统指定位置参数（默认值为0）两侧的分布情况,即相当于对符号检验结果的进一步描述。

提交执行以上程序，结果如下。

此结果大家应当比较熟悉（删去了其余关于参数检验的部分）,注意标有“ＴestsfｏrＬocation:

Ｍu0=0”的部分，即为我们所要的结果,其中第一行为参数检验的ｔ检验结果，后两行则分别为符号检验以及符号秩检验的分析结果。

标有“LocatiｏｎCounｔｓ:

Mu0=0.00”的部分是关于样本分布情况的描述,本例为3个受试对象的差值大于零,9个小于零。

大家需要注意,这里的符号秩检验计算所得的秩和与我们在教科书上看到的结果不同（教科书上计算的统计量即秩和T=10）,应是所依据的算法不同所致，但所得的P值是相同的，不会影响分析的结果。

【例5】有两家公司设计了他们自已的智商测验方法，一位心理学家随机地选取1３个人同时接受这两种测验方法,结果如下表所示。

试在0．０5的显著水平下，检验是否可宣称这两种方法无显著差异。

序号

３

９

１0

1２

方法一

111

10２

108

1０５

100

125

117

方法二

105

1０3

１13

11２

10９

107

103

104

１06

检验方法简介:

1．符号检验（Sｉgn）,该方法利用正、负符号的个数多少来进行检验。

首先,将第二组样本的各个观察值减去第一组样本对应的观察值，如果得到差值是一个正数,则记为正号；

差值为负数，则记为负号;

然后计算正号的个数和负号的个数,通过比较正号的个数和负号的个数来判断两组样本的分布。

如果正号的个数和负号的个数大致相当，则可以认为两相关样本数据分布差距较小;

正号的个数和负号的个数相差较多，可以分为两相关样本数据分布差距较大。

符号检验得名于其资料是用加减号而不是用定量度量。

它对于那些不能或不适宜用定量测量而能将每一对的两个成员分出等级的问题研究特别有用。

2.符号平均秩检验（Ｗilｃoｘon），该检验首先按照符号检验的方法,将第二组样本的各个观察值减去第一组样本对应的观察值，如果得到差值是一个正数，则记为正号；

差值为负数，则记为负号，同时保存差值的绝对值数据;

然后将绝对差值数据按升序排序，并求出相应秩;

最后分别计算正号秩总和、负号秩总和以及正号平均秩和负号平均秩。

如果正号平均秩和负号平均秩大致相当,则可以认为两相关样本数据正负变化程度基本相当，分布差距较小。

Ｗiｌｃｏｘｏn检验在行为科学的研究中应用极为广泛。

３．　完全随机设计多组数据分布位置差别的秩和检验

这一部分的内容相当于参数检验中的方差分析，依据的方法是Ｋrｕskal-Wallis秩和检验，此方法的基本思想与Wiｌｃoxｏn秩和检验基本相同，都是基于各组混合编秩后，各组秩和应相等的假设。

两者的不同点就在于Kruskaｌ-Wallｉs秩和检验是针对多组（大于２）数据的分析,而Wilｃoxｏn秩和检验则只用于对两组数据的比较。

【例6】　为研究精氨酸对小鼠截肢后淋巴细胞转化功能的影响，将21只小鼠分等分成3组:

A组为对照，Ｂ组为截肢组，C组为截肢加精氨酸治疗组。

观测脾淋巴细胞对HＰＡ刺激的增值反应,测量指标是3H吸收量（cpm），数据如下表所示，试分析各组测量值是否不同。

脾淋巴细胞对ＨPA刺激的增值反应（测量指标3H吸收量ｃpm）

Ｃ组

301２

2532

８13８

945８

4６8２

２0７3

8419

2025

１8６7

95８０

2268

88５

13５90

２７7５

6490

127８7

２884

9003

660０

1717

医学统计学教科书上对于此类资料分析方法的介绍虽与两组数据比较的方法有所区别,统计量的计算方法和结果也各不相同,但在SAS中,对这两类资料进行分析的操作过程却是基本相同的,大家可以从相应的SAS程序中看到这一点。

【SＡS程序】

datasaｓuser.ｄａｔａ１0_06;

　ｄo　ｎ=１to7;

dog=1to　3;

ｉnpuｔx@@;

　ｏutput;

ｅnｄ;

dataliｎｅs;

　３0１225３28１3８

９４５8468２2０73

8４192025１8６７

958０２268885

135902７75　6490

１２78７2８84　9003

66００17１7　0

prｏcnｐar１way　wｉlcｏxon;

classg；

　varx；

ruｎ;

第一部分是“Wiｌcoxon　Scoｒes（RaｎkSｕms）forVariablex”,第二部分是“Kruskａl-ＷalｌisＴest”秩和检验分析结果，而P值的计算这里所依据的是卡方分布。

【例7】假设有个地区的领导想要比较该地区四个村的各户的人均年收入水平,于是在这四个村中随机抽取样本,计算各户的人均收入,得到下表中的24个数据。

分析这四个村的年收入是否存在显著差异。

（α=0.05）

四个村六户人家的年收入水平

村１

7６８

952

870

940

1００3

500

村2

９96

8９6

78５

8７5

936

1２００

村3

789

75９

75２

６58

635

800

村4

892

698

6５1

6７8

8９5

925

ｐｒoｃｎpar１waｙdａta＝sａsusｅr.data１0_0７ｗｉlcoxon;

　ｃlａssg;

varｉｎｃome；

rｕn;

三、几条重要提示

1.Nｐaｒ１wａy过程对于缺失值（missingvaluｅ）的处理

如果缺失值出现在反应变量（var语句指定的变量），npａｒ1wａy过程会将该条记录排除在分析之外。

默认情况下,ｎpar1ｗａy过程也会将分类变量中出现缺失值的记录排除出分析过程。

如果指定选项“miｓsing”，npar1way过程则将分类变量中出现的缺失值当作一个单独的水平进行处理。

对于by语句中指定的变量,缺失值将被默认地当作一个独立水平进行处理。

对于freｑ语句中指定的变量，出现缺失值的记录一定会被排除出分析过程。

2.npar１way过程对于同秩（ｔｉeｓ）问题的处理方式

Ｎpａr１way过程处理同秩问题的方式在任何一种非参数检验方法中均相同,即无论相同秩次的记录出现在同一组或不同的组中，均给它们分配相应的平均秩次,再根据这些平均秩次进行各种计算,跟教科书上介绍的方法一样。

ｎpar1ｗay过程对于此问题的处理到此为止，不像教科书上介绍的那样对计算所得的统计量再进行某种校正。

对于相同秩次出现较少的数据,这一点对分析的结果影响不大，但对于同秩现象较多的数据,分析结果的偏差就不容忽视，尤其是对于那些近似检验来说更是如此。

处理这一问题的理想办法就是计算精确概率,ｎpａｒ1ｗay过程提供了实现这一功能的途径，即exact语句。

均值比较的方法与程序

检验法

独立组

配对组

参数检验

独立样本ｔ检验

对应程序:

Proc　ttest（ｄatａ＝数据集）；

Clａss分组变量名;

Vaｒ因变量名;

Run；

配对差值ｔ检验

对应程序：

Dif=m-ｆ

Pｒoｃunｉvaｒiate（data=数据集）;

Ｖar因变量名（Dｉf）；

Rｕn;

Wiｌｘoｎxon秩和检验

Prｏc　ｎｐar１wａy（data=数据集）Wilcoｘoｎ;

Class分组变量名；

Ｖar　因变量名；

Run;

Ｗｉlｘｏｎｘon秩和检验

Ｄif=ｍ-f

Prｏｃ　ｕｎivａriate（datａ=数据集）;

Var因变量名（Ｄiｆ）;

ﻬ

某瓶装纯净水厂商生产的产品标称净含量为600ｍｌ,现质量监督管理部门对该产品是否合格进行抽检,得到表5-1所示的抽检数据（详见Ｗater.sａｓ7ｂdat）。

试根据抽检结果对该产品质量进行评价。

ｐrｏcunｉｖａriateｄａta=sasuser.ｗａｔer　mu０＝600;

　varNet;

某调查公司在某项调查中收集到７6个观测值的样本数据（详见KS.ｓａs7bdat）。

试分析该数据的总体分布是何种分布。

proｃunivａriaｔeｄata=ｓａsuｓｅｒ．KＳnoprint;

　varＯbservｅd;

　　ｈisｔograｍ/nｏplｏt

　nornal（ｍｕ=esｔsｉgｍa=ｅst）

lognormal（zeta=estｓigmａ=esttheta＝est）

ｅxpoｎenｔial（sigmａ＝est　ｔheｔａ=est）

ﻩweｉbull（ｓｉgｍa＝esｔc=esｔｔｈeta=eｓt）；

【练习１】某个厂家在生产过程中需要使用某种原材料,有两个供货商所报价格有差异，但都称其提供的原材料能够达到生产厂家的技术指标。

随机抽取这两个供货商的产品，实验得到其技术参数,数据如下表所示。

问这两个供货商提供的产品是否有显著差异（α=0.05）？

两个供应商提供原料的技术指标

供应商1

５9

６９

７5

６７

７0

供应商2

6９

６5

６８

7８

７５

5６

（两独立样本的非参数检验）

ｐroｃnｐar1wａｙ　daｔa=sasuｓeｒ.data１0_0８　wilcoｘon;

ｃｌaｓsg;

　　ｖarｘ;

【练习2】某省的跳高队采用一种新的训练方法训练运动员，训练前后的成绩如下表,问这种新的训练方法能否显著提高运动员的跳高水平（α=0.05）?

运动员训练前后的成绩

训练前

1.78

1．9２

1.89

1.9６

１.85

1.７9

１.8５

１.89

１．9０

训练后

１.80

1.92

1.9５

1．99

１.97

1.９5

1.90

2.00

（两配对样本的非参数检验）

prｏcunivariatｅ　dａta=ｓaｓuser.dａta10_０９lｏccouｎt;

vard;

【练习３】问三个不同厂家生产的灯泡使用寿命是否存在显著差异（α=　０.05）。

随机抽取三个厂家生产的灯泡若干，实验得到使用寿命,数据如下表所示。

灯泡寿命

厂家

675

649

68９

６82

６80

２

682

６9１

６30

63４

670

650

６55

6５0

６4６

66６

69３

展开阅读全文