第二章非参数统计分析(0303)PPT资料.ppt

上传人:b****2 文档编号:15587130 上传时间:2022-11-06 格式:PPT 页数:88 大小:926KB
下载 相关 举报
第二章非参数统计分析(0303)PPT资料.ppt_第1页
第1页 / 共88页
第二章非参数统计分析(0303)PPT资料.ppt_第2页
第2页 / 共88页
第二章非参数统计分析(0303)PPT资料.ppt_第3页
第3页 / 共88页
第二章非参数统计分析(0303)PPT资料.ppt_第4页
第4页 / 共88页
第二章非参数统计分析(0303)PPT资料.ppt_第5页
第5页 / 共88页
点击查看更多>>
下载资源
资源描述

第二章非参数统计分析(0303)PPT资料.ppt

《第二章非参数统计分析(0303)PPT资料.ppt》由会员分享,可在线阅读,更多相关《第二章非参数统计分析(0303)PPT资料.ppt(88页珍藏版)》请在冰豆网上搜索。

第二章非参数统计分析(0303)PPT资料.ppt

2022/11/64精确的符号检验是指检验的p值是由精确的概率给出的。

我我们们利用正号和负号的数目,来检验某假设,这是一种最简单的非参数方法。

【例4】联合国人员在世界上71个大城市的生活花费指数(上海是44位,数据为63.5)按自小至大的次序排列如下。

一、精确中位数的符号检验一、精确中位数的符号检验2022/11/65有人说64应该是这种大城市花费指数的中位数,有人说64顶多是低位数(下四分位数),进行检验。

数据如下:

122.4,109.4,105,104.6,104.1,100.6,100,99.3,99.1,98.2,97.5,95.2,92.8,91.8,90.8,90.3,89.5,89.4,86.4,86.2,85.7,82.6,81,80.9,79.1,77.9,77.7,76.8,76.6,76.2,74.5,74.3,73.9,71.7,71.2,67.7,66.7,66.2,65.4,65.3,65.3,65.3,64.6,63.5,62.7,60.8,58.2,55.5,55.3,55,54.9,52.7,51.8,49.9,48.2,47.6,46,45.8,45.2,41.9,38.8,37.7,37.5,36.5,36.4,32.7,32.7,32.2,29.1,27.8,27.82022/11/662022/11/67通常在正态总体分布的假设下,关于总体均值的假设检验和区间估计是用与t检验有关的方法进行的。

然而,在本例中,总体分布是未知的。

为此,首先看该数据的直方图从图中很难说这是什么分布。

假定用总体中位数来表示中间位置,这意味着样本点,取大于me的概率应该与取小于me的概率相等。

所研究的问题,可以看作是只有两种可能“成功”或“失败”。

2022/11/68符号检验的思路,记成功:

X-0大于零,即大于中位数M,记为“+”;

失败:

X-0小于零,即小于中位数M,记为“-”。

令S+=得正符号的数目S=得负符号得数目可以知道S+或S均服从二项分布B(65,0.5)。

则可以用来作检验的统计量。

其假设为:

2022/11/69关于非参数检验统计量需要说明的问题关于非参数检验统计量需要说明的问题在非参数检验中,可以得到两个相互等价的统计量,比如在符号检验中,得负号与得正好的个数,就是一对等价的统计量,因为S+S-=N。

那么我们在检验时应该用那个呢?

约定选择统计量2022/11/610假设检验统计量S-=28是得负号的个数得正号的个数43。

P-值检验的结果拒绝零假设结论中位数大于642022/11/611该检验R的代码x-c(122.4,109.4,105,104.6,104.1,100.6,100,99.3,99.1,98.2,97.5,95.2,92.8,91.8,90.8,90.3,89.5,89.4,86.4,86.2,85.7,82.6,81,80.9,79.1,77.9,77.7,76.8,76.6,76.2,74.5,74.3,73.9,71.7,71.2,67.7,66.7,66.2,65.4,65.3,65.3,65.3,64.6,63.5,62.7,60.8,58.2,55.5,55.3,55,54.9,52.7,51.8,49.9,48.2,47.6,46,45.8,45.2,41.9,38.8,37.7,37.5,36.5,36.4,32.7,32.7,32.2,29.1,27.8,27.8)y=sum(sign(x-64)=1)pbinom(71-y,71,0.50)2022/11/612二、大样本的情形当样本容量足够大,我们可以利用二项分布的正态近似来对该问题进行检验。

因为计数统计量在原假设为真时,服从b(n,0.5)。

且其均值为0.5n,方差为0.25n。

则检验的统计量为2022/11/613第二节第二节Cox-StuartCox-Stuart趋势检验趋势检验人们经常要看某项发展的趋势但是从图表上很难看出是递增,递减,还是大致持平【例5】我国自1985年到1996年出口和进口的差额(balance)为(以亿美元为单位)149.0119.737.777.566.087.480.543.5122.254.0167.0122.2从这个数字,我们能否说这个差额总的趋势是增长,还是减,还是都不明显呢?

下图为该数据的点图从图可以看出,总趋势似乎是增长,但1993年有个低谷;

这个低谷能否说明总趋势并不是增长的呢?

我们希望能进行检验2022/11/6142022/11/615三种假设:

怎么进行这些检验呢?

可以把每一个观察值和相隔大约n2的另一个观察值配对比较;

因此大约有n2个对子然后看增长的对子和减少的对子各有多少来判断总的趋势具体做法为取和。

这里2022/11/616在这个例子中n=12,因而c6。

这6个对子为(x1,x7),(x2,x8),(x3,x9),(x4,x10),(x5,xl1),(x6,x12)。

2022/11/617用每一对的两元素差Di=xi-xi+c的符号来衡量增减。

令S+为正Di=xi-xi+c的数目,而令S-为负的Di=xi-xi+c的数。

显然当正号太多时,即S+很大时(或S-很小时),有下降趋势,反之,则有增长趋势在没有趋势的零假设下它们应服从二项分布b(6,0.5),这里n为对子的数目(不包含差为0的对子)。

该检验在某种意义上是符号检验的一个特例。

2022/11/618类似于符号检验,对于上面1,2,3三种检验,分别取检验统计量K=S+,K=S-和K=min(S+,S-)。

在本例中,这6个数据对的符号为5负1正,所以我们不能拒绝原假设。

假设统计量P值K=min(S+,S-)P(Kk)K=min(S+,S-)P(Kk)K=min(S+,S-)2P(Kk)2022/11/619【例6】天津机场从1995年1月到2003年12月的108个月旅客旅客吞吐量数据如下:

543794546155408597126077657635633357129670250768667556166427613305818667799763608620775509830208961475791808357217961520667266062968549733108071967759703528282570541746316893853318626535857863292695357337962859728738726067559766477059058935581616405763051588076366357367708547994966992801406226055942583675667361039749588585967263871839757579988885016860058442689555683567021815478511870145950801061868610388548700906555069223851388979999513981146817297366116820956651098818706875362882688518387909799762768750178100878131788116293120770104958109603讨论是否存在显著的增长趋势。

2022/11/6202022/11/621SPSS无此检验,我们用R完成该检验,代码如下。

x-c(54379,45461,55408,59712,60776,57635,63335,71296,70250,76866,75561,66427,61330,58186,67799,76360,86207,75509,83020,89614,75791,80835,72179,61520,66726,60629,68549,73310,80719,67759,70352,82825,70541,74631,68938,53318,62653,58578,63292,69535,73379,62859,72873,87260,67559,76647,70590,58935,58161,64057,63051,58807,63663,57367,70854,79949,66992,80140,62260,55942,58367,56673,61039,74958,85859,67263,87183,97575,79988,88501,68600,58442,68955,56835,67021,81547,85118,70145,95080,106186,86103,88548,70090,65550,69223,85138,89799,99513,98114,68172,97366,116820,95665,109881,87068,75362,88268,85183,87909,79976,27687,50178,100878,131788,116293,120770,104958,109603)d=x1:

54-x55:

108y=sum(sign(d)=1)pbinom(y,54,0.5)直接得到p值=0.0019190.05,拒绝无趋势的原假设原假设。

2022/11/622补充:

检验的p值在假设检验中,常常通过检验的p值来决策。

p值为拒绝原假设的最小概率。

对于t检验,如果计算出的统计量的值为t0,则左尾检验的p值为概率p(tt0)右尾检验的p值为概率p(tt0)双尾检验的p值为概率p(|t|t0|)。

但是对于非参数检验来说由于有两个等价的统计量,如得正号的个数与得负号的个数之和等于样本容量n;

两个总体的秩和等于N(N+1)/2。

2022/11/623比如是左侧检验,如果总体真实的中位数比假设的小,则检验的统计量w+表现出过小,w-表现出大,检验的p值为p(w+w小),此时用的最小的统计量。

对于右侧检验,如果总体真实的中位数比假设的大,则检验的统计量w+表现出过大,w-表现出小。

检验的p值为p(w+w大)。

实际上p(w+w大)=p(-w+-w大)=pN(N+1)/2-w+N(N+1)/2-w大=pw-w小可见检验的统计量用k=min(w+,w-)是合理的。

另外双侧检验的p值是单侧的两倍。

2022/11/624游程检验是样本的随机性检验,其用途很广。

例如当我们要考察生产中次品出现是随机的,还是成群的,一个时间序列是平稳的还是非平稳的。

第三节游程检验2022/11/625从生产线上抽取产品检验,是否应采用频繁抽取小样本的方法。

在一个刚刚建成的制造厂内,质检员需要设计一种抽样方法,以保证质量检验的可靠性。

生产线上抽取的产品可以分成两类,有瑕疵,无瑕疵。

检验费用与受检产品数量有关。

一般情况下,有毛病的产品如果是成群出现的,则要频繁抽取小样本,进行检验。

如果有毛病的产品是随机产生的,则每天以间隔较长地抽取一个大样本。

现随机抽了28件产品,按生产线抽取的顺序排列:

0000111111111111110001111111检

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高中教育 > 初中教育

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1