基于秩次的非参数检验.docx-资源下载

基于秩次的非参数检验.docx

1、基于秩次的非参数检验第七章基于秩次的非参数检验前言：1. 问题的提出：前面学习了连续型资料两组样本均数差异的假设检验方法：小样本用t检验，条件是变量服从正态分布和方差齐。大样本用Z检验（中心极限定理）。如果是小样本，变量的分布不清、已知不服从正态分布或经数学转换后仍不服从正态分布时，如何检验两个样本或多个样本均数差异的统计学意义呢？需要一种不依赖于分布假定的检验方法，即非参数检验。2. 基本概念：前面介绍的检验方法首先假定变量服从特定的已知分布（如正态分布），然后对分布的参数（如均数）作检验。这类检验方法称为参数检验。今天介绍的检验方法不对变量的分布作严格假定，检验不针对特定的参数，而是模糊

2、地对变量分布的中心位置或分布形态作检验。这类检验称非参数检验，由于其对总体分布不作严格假定，所以又称任意分布检验。(1)非参数检验的优点：a. 不受总体分布的限制，适用范围广。b. 适宜定量模糊的变量和等级变量。c. 方法简便易学。(2)缺点：对于适合用参数检验的资料，如用非参数检验会造成信息的丢失，犯第类错误的概率增大，造成检验功效下降。(3)基于秩次的非参数检验(秩和检验)的基本思想：例：假设有一组观察值为1.1, 1.3, 1.7, 4.3, 11.4 。显然这一变量不服从正态分布，观察值间差异较大，既不对称，标准差也较大。如果将变量作转换，变成秩变量Y=1，2，3，4，5，则分布对称了

3、，观察值间的差异也均匀了，标准差也减小了。对秩和分布的中心位置(平均秩和)作检验，这就是秩和检验。一配对样本的符号秩检验（Wilcoxon signed rank test）：例7.1：研究出生先后的孪生兄弟智力是否存在差异？表7.3 12对孪生兄弟智力测试结果对子号兄的得分弟的得分兄弟得分差秩次1868823271776737776-1-1.546864-4-45919655.5672720-77765-12-1089190-1-1.597065-5-5.510718099118881-7-8128772-15-11差值一般在5左右，但个别较大，如15，可能不服从正态分布。而且样本较小，不能

4、利用中心极限定理作正态假定。因此考虑使用非参数检验-符号秩检验。1符号秩检验的分布理论：假定有四对观察值，如果H0成立时，这四个值有同等的概率取正值或负值，即每个值取正值的概率等于二分之一。四个值共有24=16种组合，每种组合发生的可能性就是：。再考虑秩和，可能的结果数减少到11种，概率分布见表7.1。表7.1 n4时所有可能秩和情况和T*的分布正差数的秩次负差值的秩次正秩和T+负秩和T-概率P1,2,3,4-1000.06252,3,41910.06251,3,42820.06251,2,43730.12503,41,2731,2,34640.12502,41,3641,42,3550.12

5、502,31,4551,32,4460.125041,2,3461,23,4370.125031,2,43721,3,4280.062512,3,4190.0625-1,2,3,40100.0625如果零假设成立，观察的结果应该服从此分布，即出现极端的可能性很小。如果真是出现小概率，那么我们对零假设的真实性产生怀疑，拒绝零假设。2具体计算步骤：（1）检验假设：H0：差值的总体中位数为零。Md=0H1：差值的总体中位数不等于零。Md0=0.05。（2）编秩和计算秩和：求差值，差值的绝对值由小到大编秩，差数为零不参加编秩，相同差值求平均秩。分别求正号和负号的秩和，取绝对值小的为T。（3）确定概率

6、，下结论：查附表10，在n=11时，T0.05=11。现T=24.511，故P0.05，按=0.05的水准，不拒绝H0。（T小，P小）。3正态近似：当研究例数较大时(n50)，秩和T的分布近似正态分布，可以用正态分布理论作假设检验：这时正态分布的均数和标准差分别等于：检验的公式为：二两独立样本的秩和检验(Wilcoxon rank sum test)：表7.5 缺氧条件下猫与兔的生存时间(分)比较猫兔生存时间秩次生存时间秩次生存时间秩次生存时间秩次259.5151216281234151522172813441716323830144618174259.5351646191952711n

7、1=5T1=78.5n2=14 T2=111.5这是生存时间资料，一般不服从正态分布，个别寿命长的为特大值，样本也较小，需考虑用非参数检验-秩和检验。1具体计算步骤：（1）检验假设：H0：两总体生存时间的中位数相等；H1：两总体生存时间的中位数不等； =0.05。（2）编秩和计算秩和：两组由小到大混合编秩，有相同值求平均秩(同组相同值可不求平均秩)，求例数较少组的秩和(T)。（数值为零应编秩。）（3）确定概率，下结论：T值在表中两数值之间时，p值大于相应界值，T位于区间之外，P相应界值。本例T= T1=78.5，查附表11，T =78.578，P0.01，拒绝H0，可认为猫、兔在缺氧的条

8、件下生存时间不等。2正态近似：当样本较大时，秩和的分布近似正态分布，可以用正态分布理论作假设检验。这时正态分布的均数和标准差分别等于：检验公式为：三多个样本分布位置相同的假设检验：完全随机化设计资料分布位置的假设检验（Kruskal-Wallis test）表7.7 不同吸烟习惯母亲的新生儿体重（秩次）（kg）ABCD2.7(3)2.9(4)3.3(7)3.5(11)2.4(2)3.2(5)3.6(12.5)3.6(12.5)2.2(1)3.2(6)3.4(9)3.7(14)3.4(9)3.4(9)4(n)34315（R）1537.537.5计算步骤：1. 检验假设：H0：k个总体中心位置相等H1：k个总体中心位置不全相等=0.052. 计算统计量：各组由小到大混合编秩；如不同组间出现相同值，求平均秩；计算各组的秩和。当H0成立时，该检验统计量近似服从自由度为(k-1)的2分布。校正公式： tp为相同值的个数。3. 确定概率和判断结果：自由度=k-1=4-1=3，查2值表得2 0.05(3) =7.815，p0.05，故拒绝零假设，说明不同吸烟习惯对新生儿体重不同。秩和检验的重点：秩和检验的优缺点。不同设计类型资料秩和检验的编秩方法。 .

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？