b.c>x
c.c=x
TestStatisticsb
c-x
Z
-1.886a
Asymp.Sig.(2-tailed)
.059
ExactSig.(2-tailed)
.064
ExactSig.(1-tailed)
.032
PointProbability
.008
a.Basedonpositiveranks.
b.WilcoxonSignedRanksTest
由输出结果可知,单侧精确显著性概率P=0.032<
=0.05,因此拒绝原假设,即认为欧洲各国人均年消费酒量的中位数多于8升。
与手算结果相同。
R语言:
>x=c(4.12,5.81,7.63,9.74,10.39,11.92,12.32,12.89,13.54,14.45)
>wilcox.test(x-8,alt="greater")
Wilcoxonsignedranktest
data:
x-8
V=46,p-value=0.03223
alternativehypothesis:
truelocationisgreaterthan0
由输出结果可知,P=0.03223<
=0.05,因此拒绝原假设,即认为欧洲各国人均年消费酒量的中位数多于8升。
与以上结果一致。
二、Mann-Whitney-Wilcoxon检验
下表为8个亚洲国家和8个欧美国家2005年的人均国民收入数据。
检验亚洲国家和欧美国家的人均国民收入是否有显著差异(
=0.05)。
亚洲国家
人均国民收入(美元)
欧美国家
人均国民收入(美元)
中国
1740
美国
43740
日本
38980
加拿大
32600
印度尼西亚
1280
德国
34580
马来西亚
4960
英国
37600
泰国
2750
法国
34810
新加坡
27490
意大利
30010
韩国
15830
墨西哥
7310
印度
720
巴西
3460
数据来源:
《统计学(第三版)》贾俊平
手算:
设亚洲国家为X,欧美国家为Y
建立假设组:
数值
秩
组别
数值
秩
组别
720
1
X
27490
9
X
1280
2
X
30010
10
Y
1740
3
X
32600
11
Y
2750
4
X
34580
12
Y
3460
5
Y
34810
13
Y
4960
6
X
37600
14
Y
7310
7
Y
38980
15
X
15830
8
X
43740
16
Y
查表得,Tx=48的右尾概率的2倍为0.019*2=0.038<
=0.05,因此拒绝原假设,即认为亚洲国家和欧美国家的人均国民收入有显著差异。
SPSS:
操作:
Data——SortCases
Analyze——NonparametricTests——2-IndependentSamples
Ranks
分组
N
MeanRank
SumofRanks
收入
亚洲国家
8
6.00
48.00
欧美国家
8
11.00
88.00
Total
16
TestStatisticsb
收入
Mann-WhitneyU
12.000
WilcoxonW
48.000
Z
-2.100
Asymp.Sig.(2-tailed)
.036
ExactSig.[2*(1-tailedSig.)]
.038a
ExactSig.(2-tailed)
.038
ExactSig.(1-tailed)
.019
PointProbability
.005
a.Notcorrectedforties.
b.GroupingVariable:
分组
由输出结果可知,精确双尾概率P=0.038<
=0.05,因此拒绝原假设,即认为亚洲国家和欧美国家的人均国民收入有显著差异。
与手算结果一致。
R语言:
>x<-c(1740,38980,1280,4960,2750,27490,15830,720)
>y<-c(43740,32600,34580,37600,34810,30010,7310,3460)
>wilcox.test(x,y,exact=F,cor=F)
Wilcoxonranksumtest
data:
xandy
W=12,p-value=0.03569
alternativehypothesis:
truelocationshiftisnotequalto0
由输出结果可知,P=0.03569<
=0.05,因此拒绝原假设,即认为亚洲国家和欧美国家的人均国民收入有显著差异。
与以上结果一致。
三、两样本的Kolmogorov-Smirnov检验
下面是13个非洲地区和13个欧洲地区的人均酒精年消费量,试分析这两个地区的酒精人均年消费量是否分布相同。
非洲
欧洲
5.38
6.67
4.38
16.21
9.33
11.93
3.66
9.85
3.72
10.43
1.66
13.54
0.23
2.4
0.08
12.89
2.36
9.3
1.71
11.92
2.01
5.74
0.9
14.45
1.54
1.99
数据来源:
《非参数统计(第二版)》吴喜之
手算:
建立假设组:
0.08
1
0
1
0
0.076923
0
0.076923
0.23
1
0
2
0
0.153846
0
0.153846
0.9
1
0
3
0
0.230769
0
0.230769
1.54
1
0
4
0
0.307692
0
0.307692
1.66
1
0
5
0
0.384615
0
0.384615
1.71
1
0
6
0
0.461538
0
0.461538
1.99
0
1
6
1
0.461538
0.076923
0.384615
2.01
1
0
7
1
0.538462
0.076923
0.461538
2.36
1
0
8
1
0.615385
0.076923
0.538462
2.4
0
1
8
2
0.615385
0.153846
0.461538
3.66
1
0
9
2
0.692308
0.153846
0.538462
3.72
1
0
10
2
0.769231
0.153846
0.615385
4.38
1
0
11
2
0.846154
0.153846
0.692308
5.38
1
0
12
2
0.923077
0.153846
0.769231
5.74
0
1
12
3
0.923077
0.230769
0.692308
6.67
0
1
12
4
0.923077
0.307692
0.615385
9.3
0
1
12
5
0.923077
0.384615
0.538462
9.33
1
0
13
5
1
0.384615
0.615385
9.85
0
1
13
6
1
0.461538
0.538462
10.43
0
1
13
7
1
0.538462
0.461538
11.92
0
1
13
8
1
0.615385
0.384615
11.93
0
1
13
9
1
0.692308
0.307692
12.89
0
1
13
10
1
0.769231
0.230769
13.54
0
1
13
11
1
0.846154
0.153846
14.45
0
1
13
12
1
0.923077
0.076923
16.21
0
1
13
13
1
1
0
查表得,当mnD=130时,双侧检验的概率P<0.01,所以P<
=0.05,因此拒绝原假设,即认为这两个地区的酒精人均年消费量分布有显著差异。
SPSS:
操作:
Analyze——NonparametricTests——2-IndependentSamples
Frequencies
分组
N
消费量
非洲地区
13
欧洲地区
13
Total
26
TestStatisticsa
消费量
MostExtremeDifferences
Absolute
.769
Positive
.769
Negative
.000
Kolmogorov-SmirnovZ
1.961
Asymp.Sig.(2-tailed)
.001
ExactSig.(2-tailed)
.000
PointProbability
.000
a.GroupingVariable:
分组
由输出结果可知,双侧精确显著性概率P
=0.05,因此拒绝原假设,即认为这两个地区的酒精人均年消费量分布有显著差异。
与手算结果一致。
四、CochranQ检验
下面是某村村民对四个候选人(A,B,C,D)的赞同与否的调查(“1”代表同意,“0”代表不同意);最后一列为行总和,最后一行为列总和,全部“1”的总和为42。
试分析4位候选人在村民眼中有没有区别(
=0.05)。
20个村民对A、B、C、D四个候选人的评价
N
A
0
1
1
0
0
1
1
1
1
1
1
1
1
1
1
1
0
1
1
1
16
B
1
1
0
0
0
1
1
1
1
1
0
1
1
0
1
1
0
0
0
0
11
C
0
1
1
1
1
0
0
0
0
1
0
0
0
1
1
0
1
0
1
0
9
D
0
0
0
0
1
1
0
0
1
0
0
0
0
1
0
1
1
0
0
0
6
L
1
3
2
1
2
3
2
2
3
3
1
2
2
3
3
3
2
1
2
1
42
数据来源:
《非参数统计(第二版)》吴喜之
手算:
建立假设组:
查表得
,因此在5%的显著性水平上拒绝原假设,即认为4位候选人在村民眼中有显著差异。
SPSS:
操作:
Analyze——NonparametricTests——KRelatedSamples
Frequencies
Value
0
1
A
4
16
B
9
11
C
11
9
D
14
6
TestStatistics
N
20
Cochran'sQ
9.353a
df
3
Asymp.Sig.
.025
ExactSig.
.025
PointProbability
.006
a.0istreatedasasuccess.
由输出结果可知,Q=9.353,精确的显著性概率P=0.025<
=0.05,因此拒绝原假设,即认为4位候选人在村民眼中有显著差异。
与手算结果一致。
R语言:
>x=read.table("f:
/CochranQ.txt")
>n=apply(x,2,sum)
>N=sum(n)
>L=apply(x,1,sum)
>k=dim(x)[2]
>Q=(k*(k-1)*sum((n-mean(n))^2))/(k*N-sum(L^2))
>Q
[1]9.352941
>pvalue=pchisq(Q,k-1,low=F)
>pvalue
[1]0.02494840
由输出结果可知,Q=9.352941,P=0.02494840<
=0.05,因此拒绝原假设,即认为4位候选人在村民眼中有显著差异。
与以上结果一致。
五、Friedman检验
一项关于销售茶叶的研究报告说明销售方式可能和售出率有关。
三种方式为:
在商店内等待,在门口销售和当面表演炒制茶叶。
对一组商店在一段时间的调查结果列再下表中(单位为购买者人数)。
试问三种不同的销售方式是否有显著差异(
=0.05)。
销售方式
购买率(%)
商店内等待
20
25
29
18
17
22
18
20
门口销售
26
23
15
30
26
32
28
27
表演炒制
53
47
48
43
52
57
49
56
数据来源:
《非参数统计(第二版)》吴喜之
手算:
建立假设组:
三种方式购买率等级
销售方式
购买率
合计
商店内等待
1
2
2
1
1
1
1
1
10
门口销售
2
1
1
2
2
2
2
2
14
表演炒制
3
3
3
3
3
3
3
3
24
查表得
,因此在5%的显著性水平上拒绝原假设,即认为三种销售方式有显著差异。
SPSS:
操作:
Analyze——NonparametricTests——KRelatedSamples
Ranks
MeanRank
商店内等待
1.25
门口销售
1.75
表演炒制
3.00
TestStatisticsa
N
8
Chi-Square
13.000
df
2
Asymp.Sig.
.002
ExactSig.
.000
PointProbability
.000
a.FriedmanTest
由输出结果可知,
,精确的显著性概率P<0.001,因此在5%的显著性水平上拒绝原假设,即认为三种销售方式有显著差异。
与手算结果一致。
R语言:
>d=read.table("f:
/Friedman.txt")
>friedman.test(as.matrix(d))
Friedmanranksumtest
data:
as.matrix(d)
Friedmanchi-squared=13,df=2,p-value=0.001503
由输出结果可知,
,P=0.001503<
=0.05,因此拒绝原假设,即认为三种销售方式有显著差异。
与以上结果一致。
六、K个样本的卡方检验
在一个有三个主要百货商场的商贸中心,调查者问479个不同年龄段的人首先去三个商场中的哪个,结果如下表,检验人们去这三个商场的概率是否一样。
年龄段
商场1
商场2
商场3
总和
<30
83
70
45
198
30—50
91
86
15
192
>50
41
38
10
89
总和
215
194
70
479
数据来源:
《非参数统计》王星
手算:
建立假设组:
分组
<30
83
70
45
198
88.873
80.192
28.935
0.388
1.295
8.919
30—50
91
86
15
192
86.180
77.762
28.058
0.270
0.873
6.077
>50
41
38
10
89
39.948
36.046
13.006
0.028
0.106
0.695
合计
215
194
70
479
215.000
194.000
70.000
0.685
2.274
15.691
查表得
,因为Q=18.651>
,因此拒绝原假设,即认为人们去三个商场的概率不同。
SPSS:
操作:
Data——WeightCases
Analyze——DescriptiveStatistics——Crosstabs
Chi-SquareTests
Value
df
Asymp.Sig.(2-sided)
ExactSig.(2-sided)
ExactSig.(1-sided)
PointProbability
PearsonChi-Square
18.651a
4
.001
.b
LikelihoodRatio
18.691
4
.001
.001
Fisher'sExactTest
18.314
.001
Linear-by-LinearAssociation
5.110c
1
.024
.026
.013
.003
NofValidCases
479
a.0cells(.0%)haveexpectedcountlessthan5.Theminimumexpectedcountis13.01.
b.Cannotbecomputedbecausethereisinsufficientmemory.
c.Thestandardizedstatisticis-2.260.
由输出结果可知,卡方统计量为18.651,精确双尾检验概率P=0.01<
=0.05,因此拒绝原假设,即认为人们去三个商场的概率不同。
与手算结果一致。
七、Kruskal-Wallis检验
某制造商雇用了来自三个本地大学的雇员作为管理人员。
最近,公司的人事部门已经收集信息并考核了年度工作成绩。
从三个大学来的雇员中随机地抽取了三个独立样本。
制造商想知道是否来自这三个不同的大学的雇员在管理岗位上的表现有所不同。
雇员
大学A
大学B
大学C
1
25
60
50
2
70
20
70
3
60
30
60
4
85
15
80
5
95
40
90
6
90
35
70
7
80
75
数据来源:
XX文库SAS讲义
手算:
建立假设组:
各雇员的成绩等级
雇员
大学A
大学B
大学C
1
3
9
7
2
12
2
12
3
9
4
9
4
17
1
15.5
5
20
6
18.5
6
18.5
5
12
7
15.5
14
秩和
95
27
88
因为出现同分的情况,应对H进行校正,校正系数
查表得,在
的显著性水平上,
=5.99,由于H=8.9839>
=5.99,因此拒绝原假设,即三个总体的考核成绩分布不同。
SPSS:
操作:
Analyze——NonparametricTests——KIndependentSamples
Ranks
分组
N
MeanRank
成绩
大学A
7
13.57
大学B
6
4.50
大学C
7
12.57
Total
20
TestStatisticsa,b
成绩
Chi-Square
8.984
df
2
Asymp.Sig.
.011
ExactSig.
.006
PointProbability
.000
a.KruskalWallisTest
b.GroupingVariable:
分组
由输出结果可知,KW统计量为8.984,精确概率为0.006,远远小于显著性水平0.05,因此拒绝原假设,即三个总体的考核成绩分布不同。
与手算结果一致。
八、列联表卡方检验
一种原料来自三个不同的地区,原料质量被分成三个不同等级。
从这批原料中随机抽取500件进行检验,得样本数据如下表所示,要求检验地区与原料质量之间有无依赖关系。
一级
二级
三级
合计
地区1
52
64
24
140
地区2
60
59
52
171
地区3
50
65
74
189
合计
162
188
150
500
数据来源:
XX文库统计学教程PPT
手算: