非参数统计十道题.docx

资源描述

非参数统计十道题.docx

《非参数统计十道题.docx》由会员分享，可在线阅读，更多相关《非参数统计十道题.docx（28页珍藏版）》请在冰豆网上搜索。

非参数统计十道题.docx

非参数统计十道题

非参数统计----十道题

09统计学

王若曦

114

一、Wilcoxon符号秩检验

下面是10个欧洲城镇每人每年平均消费的酒类相当于纯酒精数，数据已经按升序排列：

人们普遍认为欧洲各国人均年消费酒量的中位数相当于纯酒精8升，试用上述数据检验这种看法。

数据来源：

《非参数统计（第二版）》吴喜之

手算：

建立假设组：

编号

纯酒精数x

D=x-8

|D|

|D|的秩

D的符号

，

《

…

查表得P=<

=，因此拒绝原假设，即认为欧洲各国人均年消费酒量的中位数多于8升。

》

SPSS：

操作：

Analyze——NonparametricTests——2-RelatedSampleTest

Ranks

MeanRank

SumofRanks

c-x

NegativeRanks

PositiveRanks

、

Ties

Total

a.c

]

b.c>x

c.c=x

TestStatisticsb

c-x

-1.886a

Asymp.Sig.（2-tailed）

.059

ExactSig.（2-tailed）

.064

ExactSig.（1-tailed）

.032

PointProbability

.008

a.Basedonpositiveranks.

b.WilcoxonSignedRanksTest

由输出结果可知，单侧精确显著性概率P=<

=，因此拒绝原假设，即认为欧洲各国人均年消费酒量的中位数多于8升。

与手算结果相同。

R语言：

…

>x=c,,,,,,,,,

>（x-8,alt="greater"）

Wilcoxonsignedranktest

data:

x-8

V=46,p-value=

alternativehypothesis:

truelocationisgreaterthan0

由输出结果可知，P=<

=，因此拒绝原假设，即认为欧洲各国人均年消费酒量的中位数多于8升。

与以上结果一致。

二、Mann-Whitney-Wilcoxon检验

下表为8个亚洲国家和8个欧美国家2005年的人均国民收入数据。

检验亚洲国家和欧美国家的人均国民收入是否有显著差异（

=）。

亚洲国家

人均国民收入（美元）

欧美国家

人均国民收入（美元）

中国

1740

美国

（

43740

日本

38980

加拿大

32600

印度尼西亚

1280

德国

34580

马来西亚

4960

英国

37600

泰国

2750

法国

34810

新加坡

27490

意大利

{

30010

韩国

15830

墨西哥

7310

印度

720

巴西

3460

数据来源：

《统计学（第三版）》贾俊平

手算：

设亚洲国家为X，欧美国家为Y

建立假设组：

数值

秩

组别

数值

秩

组别

—

720

27490

1280

30010

1740

32600

2750

34580

3460

34810

；

4960

37600

7310

38980

、

15830

43740

查表得，Tx=48的右尾概率的2倍为*2=<

=，因此拒绝原假设，即认为亚洲国家和欧美国家的人均国民收入有显著差异。

（

SPSS：

操作：

Data——SortCases

Analyze——NonparametricTests——2-IndependentSamples

Ranks

分组

MeanRank

SumofRanks

…

收入

亚洲国家

欧美国家

Total

TestStatisticsb

收入

Mann-WhitneyU

￥

WilcoxonW

Asymp.Sig.（2-tailed）

.036

ExactSig.[2*（1-tailedSig.）]

.038a

ExactSig.（2-tailed）

？

.038

ExactSig.（1-tailed）

.019

PointProbability

.005

a.Notcorrectedforties.

b.GroupingVariable:

分组

由输出结果可知，精确双尾概率P=<

=，因此拒绝原假设，即认为亚洲国家和欧美国家的人均国民收入有显著差异。

与手算结果一致。

R语言：

，

>x<-c（1740,38980,1280,4960,2750,27490,15830,720）

>y<-c（43740,32600,34580,37600,34810,30010,7310,3460）

>（x,y,exact=F,cor=F）

Wilcoxonranksumtest

data:

xandy

W=12,p-value=

alternativehypothesis:

truelocationshiftisnotequalto0

。

由输出结果可知，P=<

=，因此拒绝原假设，即认为亚洲国家和欧美国家的人均国民收入有显著差异。

与以上结果一致。

三、两样本的Kolmogorov-Smirnov检验

下面是13个非洲地区和13个欧洲地区的人均酒精年消费量，试分析这两个地区的酒精人均年消费量是否分布相同。

非洲

欧洲

数据来源：

《非参数统计（第二版）》吴喜之

手算：

建立假设组：

《

—

￥

、

）

￥

、

—

查表得，当mnD=130时，双侧检验的概率P<，所以P<

=，因此拒绝原假设，即认为这两个地区的酒精人均年消费量分布有显著差异。

SPSS：

操作：

Analyze——NonparametricTests——2-IndependentSamples

Frequencies

分组

）

消费量

非洲地区

欧洲地区

Total

。

TestStatisticsa

消费量

MostExtremeDifferences

Absolute

.769

Positive

.769

Negative

.000

Kolmogorov-SmirnovZ

Asymp.Sig.（2-tailed）

.001

ExactSig.（2-tailed）

.000

PointProbability

.000

a.GroupingVariable:

分组

由输出结果可知，双侧精确显著性概率P

=，因此拒绝原假设，即认为这两个地区的酒精人均年消费量分布有显著差异。

与手算结果一致。

四、CochranQ检验

下面是某村村民对四个候选人（A，B，C，D）的赞同与否的调查（“1”代表同意，“0”代表不同意）；最后一列为行总和，最后一行为列总和，全部“1”的总和为42。

试分析4位候选人在村民眼中有没有区别（

=）。

20个村民对A、B、C、D四个候选人的评价

；

《

、

）

（

—

…

：

…

数据来源：

《非参数统计（第二版）》吴喜之

手算：

建立假设组：

查表得

，因此在5%的显著性水平上拒绝原假设，即认为4位候选人在村民眼中有显著差异。

SPSS：

操作：

Analyze——NonparametricTests——KRelatedSamples

Frequencies

Value

TestStatistics

。

Cochran'sQ

Asymp.Sig.

.025

ExactSig.

.025

…

PointProbability

.006

a.0istreatedasasuccess.

由输出结果可知，Q=，精确的显著性概率P=<

=，因此拒绝原假设，即认为4位候选人在村民眼中有显著差异。

与手算结果一致。

R语言：

>x=（"f:

/"）

>n=apply（x,2,sum）

>N=sum（n）

>L=apply（x,1,sum）

）

>k=dim（x）[2]

>Q=（k*（k-1）*sum（（n-mean（n））^2））/（k*N-sum（L^2））

[1]

>pvalue=pchisq（Q,k-1,low=F）

>pvalue

[1]

由输出结果可知，Q=，P=<

=，因此拒绝原假设，即认为4位候选人在村民眼中有显著差异。

与以上结果一致。

五、\

六、Friedman检验

一项关于销售茶叶的研究报告说明销售方式可能和售出率有关。

三种方式为：

在商店内等待，在门口销售和当面表演炒制茶叶。

对一组商店在一段时间的调查结果列再下表中（单位为购买者人数）。

试问三种不同的销售方式是否有显著差异（

=）。

销售方式

购买率（%）

商店内等待

门口销售

{

表演炒制

—

数据来源：

《非参数统计（第二版）》吴喜之

手算：

建立假设组：

三种方式购买率等级

销售方式

购买率

合计

商店内等待

《

门口销售

表演炒制

查表得

，因此在5%的显著性水平上拒绝原假设，即认为三种销售方式有显著差异。

SPSS：

操作：

Analyze——NonparametricTests——KRelatedSamples

Ranks

MeanRank

商店内等待

门口销售

表演炒制

TestStatisticsa

Chi-Square

Asymp.Sig.

.002

ExactSig.

.000

PointProbability

.000

a.FriedmanTest

由输出结果可知，

，精确的显著性概率P<，因此在5%的显著性水平上拒绝原假设，即认为三种销售方式有显著差异。

与手算结果一致。

；

R语言：

>d=（"f:

/"）

>（d））

Friedmanranksumtest

data:

（d）

Friedmanchi-squared=13,df=2,p-value=

由输出结果可知，

，P=<

=，因此拒绝原假设，即认为三种销售方式有显著差异。

与以上结果一致。

七、K个样本的卡方检验

在一个有三个主要百货商场的商贸中心，调查者问479个不同年龄段的人首先去三个商场中的哪个，结果如下表，检验人们去这三个商场的概率是否一样。

年龄段

商场1

商场2

商场3

总和

<30

（

198

30—50

192

>50

）

总和

215

194

479

数据来源：

《非参数统计》王星

手算：

建立假设组：

分组

<30

198

（

30—50

192

>50

】

合计

215

194

479

查表得

，因为Q=>

，因此拒绝原假设，即认为人们去三个商场的概率不同。

SPSS：

操作：

Data——WeightCases

Analyze——DescriptiveStatistics——Crosstabs

Chi-SquareTests

Value

Asymp.Sig.（2-sided）

ExactSig.（2-sided）

ExactSig.（1-sided）

PointProbability

PearsonChi-Square

18.651a

.001

LikelihoodRatio

.001

Fisher'sExactTest

.001

Linear-by-LinearAssociation

5.110c

.024

.026

.013

.003

NofValidCases

479

a.0cells（.0%）haveexpectedcountlessthan5.Theminimumexpectedcountis.

b.Cannotbecomputedbecausethereisinsufficientmemory.

￥

c.Thestandardizedstatisticis.

由输出结果可知，卡方统计量为，精确双尾检验概率P=<

=，因此拒绝原假设，即认为人们去三个商场的概率不同。

与手算结果一致。

八、Kruskal-Wallis检验

》

某制造商雇用了来自三个本地大学的雇员作为管理人员。

最近，公司的人事部门已经收集信息并考核了年度工作成绩。

从三个大学来的雇员中随机地抽取了三个独立样本。

制造商想知道是否来自这三个不同的大学的雇员在管理岗位上的表现有所不同。

雇员

大学A

大学B

大学C

;

）

数据来源：

XX文库SAS讲义

手算：

建立假设组：

各雇员的成绩等级

雇员

大学A

—

大学B

大学C

：

秩和

因为出现同分的情况，应对H进行校正，校正系数

查表得，在

的显著性水平上，

=，由于H=>

=，因此拒绝原假设，即三个总体的考核成绩分布不同。

SPSS：

操作：

Analyze——NonparametricTests——KIndependentSamples

Ranks

分组

MeanRank

成绩

大学A

大学B

—

大学C

Total

（

TestStatisticsa,b

成绩

Chi-Square

Asymp.Sig.

.011

！

ExactSig.

.006

PointProbability

.000

a.KruskalWallisTest

b.GroupingVariable:

分组

由输出结果可知，KW统计量为，精确概率为，远远小于显著性水平，因此拒绝原假设，即三个总体的考核成绩分布不同。

与手算结果一致。

九、列联表卡方检验

一种原料来自三个不同的地区，原料质量被分成三个不同等级。

从这批原料中随机抽取500件进行检验，得样本数据如下表所示，要求检验地区与原料质量之间有无依赖关系。

￥

一级

二级

三级

合计

地区1

140

[

地区2

171

地区3

189

合计

162

188

150

500

数据来源：

XX文库统计学教程PPT

手算：

建立假设组：

地区

等级

]

…

;

【

合计

—

查表得，

，由于Q=>

，因此拒绝原假设，即认为地区与原料质量相关。

SPSS：

操作：

Data——WeightCases

Analyze——DescriptiveStatistics——Crosstabs

！

地区*等级Crosstabulation

等级

Total

一级

{

二级

三级

地区

地区1

Count

140

ExpectedCount

地区2

Count

171

ExpectedCount

—

地区3

Count

189

《

ExpectedCount

Total

Count

162

188

150

}

500

ExpectedCount

Chi-SquareTests

Value

Asymp.Sig.（2-sided）

ExactSig.（2-sided）

ExactSig.（1-sided）

PointProbability

PearsonChi-Square

19.822a

.001

LikelihoodRatio

.000

：

Fisher'sExactTest

.000

Linear-by-LinearAssociation

13.963c

（

.000

NofValidCases

500

…

a.0cells（.0%）haveexpectedcountlessthan5.Theminimumexpectedcountis.

b.Cannotbecomputedbecausethereisinsufficientmemory.

c.Thestandardizedstatisticis.

，

由输出结果可知，检验统计量为，精确双尾显著性概率P远远小于显著性水平，因此拒绝原假设，即认为地区与原料质量相关。

与手算结果一致

展开阅读全文