假设检验非参数检验.docx

资源描述

假设检验非参数检验.docx

《假设检验非参数检验.docx》由会员分享，可在线阅读，更多相关《假设检验非参数检验.docx（19页珍藏版）》请在冰豆网上搜索。

假设检验非参数检验.docx

假设检验非参数检验

假设检验

（二）——非参数检验

假设检验的统计方法，从其统计假设的角度可分为两类：

参数检验与非参数检验。

上一节我们所介绍的Z检验、t检验，都是参数检验。

它们的共同特点是总体分布正态，并满足某些总体参数的假定条件。

参数检验就是要通过样本统计量去推断或估计总体参数。

然而，在实践中我们常常会遇到一些问题的总体分布并不明确，或者总体参数的假设条件不成立，不能使用参数检验。

这一类问题的检验应该采用统计学中的另一类方法，即非参数检验。

非参数检验是通过检验总体分布情况来实现对总体参数的推断。

非参数检验法与参数检验法相比，特点可以归纳如下：

（1）非参数检验一般不需要严格的前提假设；

（2）非参数检验特别适用于顺序资料；

（3）非参数检验很适用于小样本，并且计算简单；

（4）非参数检验法最大的不足是没能充分利用数据资料的全部信息；

（5）非参数检验法目前还不能用于处理因素间的交互作用。

非参数检验的方法很多，分别适用于各种特点的资料。

本节将介绍几种常用的非参数检验方法。

一．2检验

2检验主要用于对按属性分类的计数资料的分析，对于数据资料本身的分布形态不作任何假设，所以从一定的意义上来讲，它是一种检验计数数据分布状态的最常用的非参数检验方法。

2检验的方法主要包括适合性检验和独立性检验。

（一）2检验概述

2是实得数据与理论数据偏离程度的指标。

其基本公式为：

2（f0fe）（公式11—9）

式中，f0为实际观察次数，fe为理论次数。

分析公式可知，把实际观测次数和依据某种假设所期望的次数（或理论次数）的差数平方，除以理论次数，求出比值，再将n个比值相加，其和就是2。

观察公式可发现，如果实际观察

次数与理论次数的差异越小，2值也就越小。

当f0与fe完全相同时，2值为零。

际次数与理论次数之差的大小而变化

2检验

利用2值去检验实际观察次数与理论次数的差异是否显著的方法称为

检验有两个主要的作用：

第一，可以用来检验各种实际次数与理论次数是否吻合的问题，

这类问题统称为适合性检验；第二，判断计数的两组或多组资料是否相互关联还是相互独立的问题，这类问题统称为独立性检验。

检验的具体步骤与t检验基本相同。

第一，建立虚无假设。

例如假定实测次数与理论次数无显著差异，差异仅由机会造成。

第二，计算理论次数，并求出2值。

第三，统计推断。

根据df数目和选定的显著性水平，查2值表得出超过实得2值的概率。

把概率的大小，作为接受或拒绝假设的依据。

表11—92检验统计决断规则

2值与临界值的比较

P值

显著性

2<2（df,0.05）

（df,0.05）≤<

P>0

不显著

2（df,0.01）

0.01

显著（＊）

≥（df,0.01）

P≤0.01

极其显著（＊＊）

（二）适合性检验

适合性检验是应用2检验方法的一种。

它主要适用于检验实际观测次数与理论次数之检查

以是否显著，它所面对的研究对象主要是一个因素多项分类的计数资料，所以又称为单因素分类

2检验或单项表的2检验。

适合性检验的种类主要有无差假设的适合性检验和实际次数分布是否属于正态分布的适合性检验，下面逐一进行简要介绍

1．无差假设的适合性检验

所谓无差假设是指各项分类的次数没有差异，理论次数完全按概率相等的条件计算，即理论次数=总数／分类项数

例1，随机抽取70名学生，调查他们对高中分文理科的意见，回答赞成的有42人，反对的有28人。

问对分科的意见有无显著差异？

解：

此例只有两种分类。

因此应有理论次数fe=70×0.5=35（人）

检验步骤：

（1）建立假设：

H0：

f0fe30，H1：

f0fe

（2）计算2值：

平上保留虚无假设，拒绝备择假设。

其结论为：

学生对高中文理分科的态度的差异不显著。

例2，某大学某系的46位老年教师中，健康状况属于良好的有15人，中等的有20人，比

较差的有11人，问该系老教师中三种健康状况的人数是否一样？

解：

此例有三种分类。

因此应有理论次数fe=46=18（人）

检验步骤：

1）建立假设：

H0：

健康状况好、中、差三种人数相同

H1：

健康状况好、中、差三种人数不相同

2）计算2值：

22（f0fe）（1518）

（2018）2（1118）23.44

1818

3）统计推断

首先确定自由度df，本例df=3—1=2。

查df=2的2表，

2（2,0.05）=5.99，故有2<2（2,0.05），因此应在0.05显著性水平上保留虚无假设，拒绝备择假设。

其结论为：

该系老教师中，健康状况好、中、差三种人数无显著差异

2．实际次数分布是否属于正态分布的适合性检验

2检验还可以通过将正态分布的概率转换为理论次数的数值，来检验某些实际次数分布是否属于正态分布。

例3，今对某校100名学生进行操行评定，分优、良、中、差四等，评定结果为：

优19人、良39人、中35人、差7人。

试检验其分布的形式是否属于正态分布？

解：

检验步骤：

（1）建立假设：

H0：

评定结果服从正态分布

H1：

评定结果不服从正态分布

（2）计算2值：

首先需求出理论次数。

正态分布的各部分理论次数，是通过正态分布图中面积比率乘以总次数得出的。

在正态分布情况下，正态曲线底边上±3之内几乎包含了全部量数，因此我们可将正态分布底线长度从－3至＋3分为四个等分，每等分为1.5，其面积比率为：

第一等分（优）的面积：

上限3，下限为1.5。

1.5～3之间的面积比率为：

0.4987－0.4332=0.0655，即7%。

第二等分（良）的面积：

位于0～1.5之间，其面积比率为0.4332，即43%。

第三等分（中）的面积：

位于0～－1.5之间，其面积比率为0.4332，即43%。

第四等分（差）的面积：

位于－1.5～－3之间的面积比率为：

0.4987－0.4332=0.0655，即7%。

根据各等分的面积比率，乘以总人数，即可得出理论次数。

如：

优的人数为7%×100=7，良

的人数为43%×100=43。

同理可求出中的人数为43，差的人数为7。

即优的fe=7，良的fe=43，中的fe=43，差的fe=7。

代入（公式11—9）有：

2222

2（197）2（3943）2（3543）2（77）222.43

74343722.43

（3）统计推断。

首先确定自由度df，本例df=4—1=3。

查df=2的2表，

2（3,0.05）=7.81，2（3,0.01）=11.345，故有2>2（3,0.01），因此应在0.01显著性水平上拒绝虚无假设，接受备择假设。

其结论为：

此评定结果不服从正态分布

三）独立性检验

独立性检验也是2检验的一个重要应用。

如果想研究两个或两个以上因素之间是否具有独立性，就可利用2独立性检验。

独立性检验一般都采用表格的形式来显示观察结果，所以独立性检验也称为列联表分析。

当检验对象只有两个因素而且每个因素只有两项分类的列联表就称为2×2列联表或四格表；而一个因素有R类，另一个因素有C类，这种表称之为R×C表。

本节

只讨论二维列联表的情况。

关于二维列联表的独立性检验，需注意几个问题：

第一，独立性检验的虚无假设是二因素（或多元素）之间是独立的或无关联，被择假设是二因素（或多因素）自荐有关联或者说差异显著。

一般多用文字叙述而很少用符号代替。

第二，独立性检验的理论次数是直接由列联表所提供的数据推算出来的。

如果用fRi表示第

i行的和，fCj表示第j列的和，N为所有数据值和，则第i行第j列的方格内的理论次数为：

fRifCj

feij（公式11—10）

eijN

第三，二维列联表自由度与二因素各自的分类项数有关。

设R为行分类项数（行数），C为

列分类项数（列数），则自由度为：

df（R1）（C1）。

1．2×2列联表的独立性检验

2×2列联表就是把样本按两种性质分组，并排成两行两列的表，它是最简单的列联表，简称为四格表。

2×2列联表用以进行两个组彼此独立互无关联的检验。

独立性检验下面我们从样本的不同情况出发，分别介绍相应的检验方法。

独立样本的2×2列联表的独立性检验

独立样本4格表的独立性检验，既可以用计算2的基本公式（公式11—9）计算，也可用

面的简捷公式计算：

2=N（adbc）2（公式11—11）

（ab）（cd）（ac）（bd）

式中：

a,b,c,d分别是四格表内的实计数

表11—102×2列联表的2值计算示意表

分类1

分类2

合计

分类1

a+b

分类2

c+d

合

计

a+c

b+d

Nabc

例4，设有甲乙两区，欲测验两区中学教学水平，各区随机抽取500名初三学生，进行统一

试题的数学测验，其结果是：

甲区及格学生为475人，不及格为25人；乙区及格学生460人，不及格为40人，问甲区中学与乙区中学的数学测验成绩的差异是否显著？

解：

检验步骤：

（1）建立假设：

H0：

甲区中学与乙区中学数学测验成绩无显著差异

H1：

甲区中学与乙区中学数学测验成绩差异显著

2）计算2值：

表11—11甲区中学与乙区中学的数学测验成绩表

及格人数

不及格人数

合计

甲

475（a）

25（b）

500（a+b）

区

乙

460（c）

40（d）

500（c+d）

区

合计

935（a+c）

1000

（b+d）

（abcd）

根据简捷公式：

3.68

21000（4754046025）2

=50065935500

3）统计推断。

首先确定自由度df，本例df=（2-1）（2-1）=1，查df=1的2表，

222

2（1,0.05）=3.84，故有2<2（1,0.05），因此应在0.05显著性水平上保留虚无假设，拒绝备择

假设。

其结论为：

甲区中学与乙区中学数学测验成绩无显著差异。

例5，随机抽取某校男生250名，女生240，进行体育达标考核，结果如下表问体育达标水平是否与性别有关？

表11—12体育达标考核情况表

达标

未达标

合计

男

女

合计

解：

检验步骤：

1）建立假设：

H0：

体育达标水平与性别无关

H1：

体育达标水平与性别有关

222

（1514.85）2（2020.15）2（1313.15）2

14.8520.1513.15

3）统计决断：

首先确定自由度df，本例df=1，查df=1的2表，2（1,0.05）=3.84，

故有2<2（1,0.05），因此应在0.05显著性水平上保留虚无假设，拒绝备择假设。

其结论为：

体育达标水平与性别无关。

相关样本的2×2列联表的独立性检验

相关样本2×2列联表的独立性检验的简捷

公式为：

例6，110名教师培训普通话，培训2天前后两次测验通过情况如下表，问2天的训练是否有显著效果？

表11—1340天前后两次测验通过情况表

第二次测验

通过

未通过

第一次测

验

通过

41（a）

26（b）

未通过

24（c）

19（d）

解：

检验步骤：

1）建立假设：

H0：

2天训练无显著效果

H1：

2天训练有显著效果

2）计算2值：

将上表中的数据代入（公式11—12），有：

2=（bc）2=（2624）20.08

bc2624

本例也可以用求理论次数的方法计算2值。

同一组教师两次测验结果只涉及到b（第一次

b和c的理

通过而第二次未通过者）和c（第一次未通过二第二次通过者）。

根据虚无假设，

bc2624

论次数均为feb2c2622425，所以

用简捷公式和用理论次数计算出的2值相同。

使用时可任选一种

（3）统计决断：

首先确定自由度df，本例df=1，查df=1的2表，2（1,0.05）=3.84，故有2<2（1,0.05），因此应在0.05显著性水平上保留虚无假设，拒绝备择假设。

其结论为：

2天训练无显著效果。

二．符号检验

顾名思义，符号检验是以正负号为依据所进行的假设检验方法，它是非参数检验中最简单的一种。

（一）符号检验概述符号检验法是通过两个相关样本的每对数据之差的符号进行检验，从而比较两个样本的显著性。

具体地讲，若两个样本差异不显著，正差值与负差值的个数应大致各占一半。

符号检验与参数检验中相关样本显著性t检验相对应，当资料不满足参数检验条件时，可采用此法来检验两相关样本的差异显著性。

根据符号检验判断差异显著性时也要查表找出相应的临界值。

但特别应注意的是在某一显著性水平下，实得的r值大于表中r的临界值时，表示差异不显著，这一点与参数检验时的统计量和临界值的判断结果不同。

表11—14单侧符号检验统计判断规则

r与临界值的比

较

P值

显著性

r>r0.05

P>0.05

不显著

r0.01

0.01

显著

r≤r0.01

P≤0.01

极显著

（二）符号检验的计算方法

符号检验的具体检验方法因样本大小的不同而不同。

1．小样本（N<25）时的检验方法

例7，研究人员将三岁儿童经配对而成的实验组进行颜色试验教学，对照组不进行此种教学

后期测验得分如表11—15。

问颜色教学是否有显著效果？

表11—15实验组和对照组测验得分比较表

配对

123456789101112

实验组X1

182026142525211214172019

得

分

对照验组

142023122918211016131725

差数符号

﹢0﹢﹢﹣﹢0﹢﹣﹢﹢﹣

解：

检验步骤：

（1）建立假设：

H0：

颜色教学无显著效果

H1：

颜色教学有显著效果

（2）求差数并记符号：

计算X1与X2每对数据的差数，“＋”的个数n=7，“－”的个数n=3，差数为0不予考虑。

于是有：

n=n+n=7+3=10。

将n和n中较小的一个记为r，本例r=3。

（3）统计决断：

根据n=n+n=7+3=10及显著性水平，查符号检验表寻找r的临界

值，r0.05=1，而实际的r=3，有r>r0.05。

由于符号检验表是单侧检验表，进行双侧检验时，其显著性水平应乘以2。

所以本例应在0.10显著性水平上保留虚无假设，拒绝备择假设。

其结论为：

颜色教学无显著效果。

2．大样本（N>25）时的检验方法

对于差值的正负号差异的检验本属于二项分布的问题，当样本容量较大即（N>25）时，二项分布近似于正态分布，因此可用Z比率作为检验统计量。

检验公式为：

（r0.5）

公式11—13）

式中：

r为n或n的数值，N为n与n之和。

±0.5为校正数，当r>时用r－0.5，

当r<时用r＋0.5。

例8，某省幼教培训中心，对

30名幼儿园教师进行手工技能培训，培训前后的测验结果如表11—16，试问培训前后的两次测验结果差异是否显著？

表11—1630名幼儿园教师培训前后的两次测验结果

序号

培训前X

培训后Y

差数符号

－

＋

－

＋

－

＋

序号

培训前X

培训后Y

差数符号

－

＋

－

＋

－

＋

序号

培训前X

培训后Y

差数符号

＋

序号

培训前X

培训后Y

差数符号

－

＋

解：

检验步骤：

1）建立假设：

H0：

手工技能培训无显著效果

H1：

手工技能培训有显著效果

2）求差数并记符号：

计算X1与X2每对数据的差数，“＋”的个数n=9，“－”的个数

n=21，差数为0不予考虑。

于是有：

N=n+n=9+21=30。

将n和n中较小的一个记为r，本例r=9。

由于样本容量比较大，则可使用（公式11—13）计算：

N30（r0.5）（100.5）

Z22

择假设。

其结论为：

手工技能培训无显著效果。

符号检验法的优点是不需要对所要检验的两个总体的分布形态做任何假定，并且计算简便。

其最大的缺点是它只考虑符号，不考察差数的大小，因而失去样本所提供的一部分信息。

对于同一样本数据，采用符号检验的精确度，只相当于t检验的60%，因此除了小样本，一般不使用符号检验。

三．秩和检验

到两样本容量不等（n1n2）的情况，因而又称为曼—惠特尼U检验。

这种方法主要用于比较两个独立样本的差异。

（一）适用范围

如果两个样本来自两个独立的但非正态获形态不清的两总体，要检验两样本之间的差异是否显著，不应运用参数检验中的t检验，而需采用秩和检验。

（二）检验方法

1．两个样本的容量均小于10的检验方法检验的具体步骤：

第一步：

将两个样本数据混合并由小到大进行等级排列（最小的数据秩次编为1，最大的数

据秩次编为n1n2）。

第二步：

把容量较小的样本中各数据的等级相加，即秩和，用T表示。

第三步：

把T值与秩和检验表中某显著性水平下的临界值相比较，如果T1

两样本差异不显著；如果T≤T1或T≥T2，则表明两样本差异显著。

例9，某年级随机抽取6名男生和8名女生的英语考试成绩如表11—17所示。

问该年级男女生的英语成绩是否存在显著差异？

表11—17男、女生英语考试成绩表

男

女

637682

男

5.5

秩次

5.59

秩次

女

解：

检验步骤：

1）建立假设：

H0：

男女生的英语成绩不存在显著差异

H1：

男女生的英语成绩存在显著差异

2）编排秩次，求秩和：

T=13+7+14+12+5.5+11=62.5

（3）统计推断：

根据n1=6，n2=8，=0.05，查秩和检验表，T的上、下限分别为T1=

29，T2=61，有T>T2，结论是：

男女生的英语成绩存在显著差异。

3．两个样本的容量均大于10的检验方法

当两个样本容量都大于10时，秩和T的分布接近于正态分布，因此可以用Z检验，其基

本公式为：

Tn1（n1n21）

公式11—14）

n1n2（n1n21）

式中：

T为较小的样本的秩和。

例10，某校演讲比赛后随即抽出两组学生的比赛成绩如表11—18，问两组成绩是否有显著

差异？

表11—18演讲成绩表

组

746886907578817264767977

8077698676916673657881829293

组

秩

次

组

秩

次

8421.523914.518.56110.51612.5

1712.5521.510.52437214.518.5202526

解：

（1）建立假设：

H0：

两组成绩不存在显著差异

H1：

两组成绩存在显著差异

检验步骤：

2）编排秩次，求秩和：

n1=12，n2=14，T=144.5，代入公式，有：

n1（n1n21）12（12141）T144.5

n1n2（n1n21）1214（12141）

144.5162

0.90

19.44

3）

统计推断：

因为Z<1.96，则应保留虚无假设，拒绝备择假设。

结论是：

两组的演讲

比赛成绩不存在显著差异。

展开阅读全文