ImageVerifierCode 换一换
格式:DOCX , 页数:15 ,大小:294.52KB ,
资源ID:21821409      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/21821409.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(非统计抽样总结Word文件下载.docx)为本站会员(b****6)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

非统计抽样总结Word文件下载.docx

1、(一)抽样的概念 又称取样。从欲研究的全部样品中抽取一部分样品单位。其基本要求是要保证所抽取的样品单位对全部样品具有充分的代表性。抽样的目的是从被抽取样品单位的分析、研究结果来估计和推断全部样品特性,是科学实验、质量检验、社会调查普遍采用的一种经济有效的工作和研究方法。 抽样:检验检疫机构接受报验后,须及时派员赴货物堆存地点进行现场检验、鉴定。其内容包括货物的数量、重量、包装、外观等项目。现场检验一般采取国际贸易中普遍使用的抽样法(个别特殊商品除外)。抽样时 ,要按照规定的方法和一定的比例,在货物的不同部位抽取一定数量的、能代表全批货物质量的样品(标本)供检验之用。 还可以抽血样。 基本概念:

2、所考察对象的某一数值指标的全体构成的集合看作总体,构成总体的每一个元素作为个体,从总体中抽取一部分的个体所组成的集合叫做样本,样本中的个体数目叫做样本数量。(二)抽样类型1.简单随机抽样 一般的,设一个总体个数为N,如果通过逐个抽取的方法抽取一个样本,且每次抽取时,每个个体被抽到的概率相等,这样的抽样方法为简单随机抽样。适用于总体个数较少的。1)特点: 每个样本单位被抽中的概率相等,样本的每个单位完全独立,彼此间无一定的关联性和排斥性。(1)简单随机抽样要求被抽取的样本的总体个数N是有限的。(2)简单随机样本数n小于等于样本总体的个数N。(3)简单随机样本是从总体中逐个抽取的。(4)简单随机抽

3、样是一种不放回的抽样。(5)系统抽样抽样的每个个体入样的可能性均为n/N。2)缺点: 只适用于总体单位数量有限的情况,否则编号工作繁重;对于复杂的总体,样本的代表性难以保证;不能有效的利用总体的已知信息等。在市场调研范围有限,或调查对象情况不明、难以分类,或总体单位之间特性差异程度小的情况下采用此法效果较好。3)抽样方法:简单随机抽样最基本的抽样方法。分为重复抽样和不重复抽样。在重复抽样中,每次抽中的单位仍放回总体,样本中的单位可能不止一次被抽中。不重复抽样中,抽中的单位不再放回总体,样本中的单位只能抽中一次。社会调查采用不重复抽样。简单随机抽样的具体作法有: (1)直接抽选法 直接抽选法,即

4、从总体中直接随机抽选样本。如从货架商品中随机抽取若干商品进行检验;从农贸市场摊位中随意选择若干摊位进行调查或访问等。 (2)抽签法 先将总体中的所有个体编号(号码可以从1到N),并把号码写在形状、大小相同的号签上,号签可以用小球、卡片、纸条等制作,然后将这些号签放在同一个箱子里,进行均匀搅拌。抽签时,每次从中抽出1个号签,连续抽取 次,就得到一个容量为 的样本,对个体编号时,也可以利用已有的编号,例如从全班学生中抽取样本时,可以利用学生的学号、座位号等。抽签法简便易行,当总体的个体数不多时,适宜采用这种方法。 (3)随机数表法 随机数表法,即利用随机数表作为工具进行抽样。随机数表又称乱数表,是

5、将0至9的10个数字随机排列成表,以备查用。其特点是,无论横行、竖行或隔行读均无规律。因此,利用此表进行抽样,可保证随机原则的实现,并简化抽样工作。其步骤是: 确定总体范围,并编排单位号码; 确定样本容量; 抽选样本单位,即从随机数表中任一数码始,按一定的顺序(上下左右均可)或间隔读数,选取编号范围内的数码,超出范围的数码不选,重复的数码不再选,直至达到预定的样本容量为止; 排列中选数码,并列出相应单位名称。 举例说明如何用随机数表来抽取样本。 当随机地选定开始读数的数后,读数的方向可以向右,也可以向左、向上、向下等等。在上面每两位、每两位地读数过程中,得到一串两位数字号码,在去掉其中不合要求

6、和与前面重复的号码后,其中依次出现的号码可以看成是依次从总体中抽取的各个个体的号码。由于随机数表中每个位置上出现哪一个数字是等概率的,每次读到哪一个两位数字号码,即从总体中抽到哪一个个体的号码也是等概率的。因而利用随机数表抽取样本保证了各个个体被抽取的概率相等。4)应用 简单随机抽样(Simple random sampling)是其它抽样方法的基础,因为它在理论上最容易处理,而且当总体单位数N不太大时,实施起来并不困难。但在实际中,若N相当大时,简单随机抽样就不是很容易办到的。首先它要求有一个包含全部N个单位的抽样框;其次用这种抽样得到的样本单位较为分散,调查不容易实施。因此,在实际中直接采

7、用简单随机抽样的并不多。2.系统抽样 当总体的个数比较多的时候,首先把总体分成均衡的几部分,然后按照预先定的规则,从每一个部分中抽取一些个体,得到所需要的样本,这样的抽样方法叫做系统抽样。 等距抽样也称为系统抽样、机械抽样、SYS抽样,它是首先将总体中各单位按一定顺序排列,根据样本容量要求确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位的一种抽样方式。是纯随机抽样的变种。在系统抽样中,先将总体从1N相继编号,并计算抽样距离K=N/n。式中N为总体单位总数,n为样本容量。然后在1K中抽一随机数k1,作为样本的第一个单位,接着取k1+K,k1+2K,直至抽够n个单位为止。1)分类 根据总

8、体单位排列方法,等距抽样的单位排列可分为三类:按有关标志排队、按无关标志排队以及介于按有关标志排队和按无关标志排队之间的按自然状态排列。按照具体实施等距抽样的作法,等距抽样可分为:直线等距抽样、对称等距抽样和循环等距抽样三种。系统抽样分为间隔定时法、间隔定量法、分部比例法。2)特征 等距抽样的特点是:抽出的单位在总体中是均匀分布的,且抽取样本可少于纯随机抽样。3)优缺点 等距抽样方式相对于简单随机抽样方式最主要的优势就是经济性。等距抽样方式比简单随机抽样更为简单,花的时间更少,并且花费也少。使用等距抽样方式最大的缺陷在于总体单位的排列上。一些总体单位数可能包含隐蔽的形态或者是“不合格样本”,调

9、查者可能疏忽,把它们抽选为样本。由此可见,只要抽样者对总体结构有一定了解时,充分利用已有信息对总体单位进行排队后再抽样,则可提高抽样效率。 在定量抽样调查中,等距抽样常常代替简单随机抽样。由于该抽样方法简单实用,所以应用普遍。等距抽样得到的样本几乎与简单随机抽样得到的样本是相同的。 等距抽样的基本做法是,将总体中的各单元先按一定的顺序排列、编号,然后决定一个间隔,并在此间隔基础上选择被调查的单位个体。 样本距离可通过下面公式确定:样本距离=总体单位数样本单位数 例如,你使用本地电话本并确定样本距离为 100 ,那么 100 个中取 1 个组成样本。这个公式保证了整个列表的完整性。 等距抽样方式

10、随意用一个起点,例如,如果你把一本电话本作为抽样框,必须随意取出一个号码决定从该页开始翻阅。假设从第 5 页开始,在该页上再另选一个数决定从该行开始。假定从第 3 行开始,这就决定了开始的位置。5)方法 当总体单位的顺序排列之后,可选用下列方法进行等距抽样。 (1)随机起点等距抽样 即在总体分成K段(K=N/n)的前提下,首先从第一段的1至k号总体单位中随机抽选一个样本单位,然后每隔k个单位抽取一个样本单位,直到抽足n个单位为止。这n个单位就构成了一个随机起点的等距样本。这种方法能够保证各个总体单位具有相同的概率被抽到,但是,如果随机起点单位处于每一段的低端或高端,就会导致往后的单位都会处于相

11、应段的低端或高端,从而使抽样出现偏低或偏高的系统误差。 (2)半距起点等距随机抽样 这种方法又称为中点法抽取样本,它是在总体的第一段,取1,2,k号中的中间项为起点,然后再每隔k个单位抽取一个样本单位,直到抽足n个样本单位为止。当总体是按有关标志的大小顺序排列时,采用中点法抽取样本,可提高整个样本对总体的代表性。 (3)随机起点对称等距抽样 这种方法是在总体第一段随机抽到第i个单位,而在第二段抽取第2k-f+1的单位,在第三段抽取第2k+f的单位,而在第四段抽取第4k-f+1的单位,以此交替对称进行。可概括为:在总体奇数段抽取第jk+i单位(j=0,2,4);在总体偶数段抽取第jk-i+1单位

12、(j=2,4)。这种抽样方法能使处于低端的样本单位与另一段处于高端的样本单位相互搭配,从而抵消或避免抽样中的系统误差。 (4)循环等距抽样 当N为有限总体而且不能被n所整除,亦即k不是一个整数时,可将总体各单位按顺序排成首尾相接的循环圆形,用N/n确定抽样间隔k,k可以取最接近的整数,然后在第一段的1至后号中抽取一个作为随机起点,再每隔后个单位抽取一个样本单位,直至抽满行个为止。6)排序方法 采用等距抽样时,必须首先对总体单位按某种标志进行排序,有下列两种排序方法。 (1)按无关标志排序 即总体单位排列的顺序和所要研究的标志是无关的。如调查职工的收入水平,可按姓氏笔划排列的职工名单进行抽样;工

13、业生产质量检验可按产品生产的时间顺序进行等距抽样等等。一般认为,按无关标志排队的等距抽样是一种抽签法,随机数表法更好的纯随机抽样方式,又称无序系统抽样。 (2)按有关标志排序 即总体单位排列的顺序与所要研究的标志是有直接关系的。例如,农产量抽样调查时,可按照当年估产或前几年的平均实产由低到高或由高到低的顺序进行抽样。这种按有关标志排队的等距抽样又称有序系统抽样,它能使标志值高低不同的单位,均有可能选入样本,从而提高样本的代表性,减小抽样误差。一般认为有序系统抽样比等比例分层抽样能使样本更均匀地分布在总体中,抽样误差也更小。3.分层抽样又称分类抽样或类型抽样。将总体划分为若干个同质层,再在各层内

14、随机抽样或机械抽样,分层抽样的特点是将科学分组法与抽样法结合在一起,分组减小了各抽样层变异性的影响,抽样保证了所抽取的样本具有足够的代表性。 先将总体的单位按某种特征分为若干次级总体(层),然后再从每一层内进行单纯随机抽样,组成一个样本的统计学计算方法 适用于总体由差异明显的几部分组成。1)适用条件 分层抽样尽量利用事先掌握的信息,并充分考虑了保持样本结构和总体结构的一致性,这对提高样本的代表性是很重要的。当总体是由差异明显的几部分组成时,往往选择分层抽样的方法2)使用方法 最简单的情况:尽管每组的大小不同,但是从每组抽取的对象个数相同; 另一种变形:尽管每组的大小不同,但从每一组抽取的对象数

15、量正比于该组的大小。3)实例应用 例如,一个单位的职工有500人,其中不到35岁有125人,35岁至49岁的有280人,50岁以上的有95人.为了了解这个单位职工与身体状况有关的某项指标,要从中抽取一个容量为100的样本,由于职工年龄与这项指标有关,决定采用分层抽样方法进行抽取.因为样本容量与总体的个数的比为1:5,所以在各年龄段抽取的个数依次为125/5,280/5,95/5,即25,56,19。 求解过程: 解: S1:100 / 500 = 0.2 S2: 125*0.2= 25 (不到35岁) 280*0.2= 56 (35岁至49岁) 95*0.2= 19 (50岁以上) S3: 所

16、以:50岁的抽19人4)优点 (1)是在不断增加样本规模的前提下降低抽样的误差,提高抽样的精度。 (2)非常便于了解总体内不同层次的情况,便于对总体不同的层次或类别进行单独研究。5)分层的原则 (1)以调查所要分析和研究的主要变量或相关变量作为分层标准。 (2)以保证各层内部同质性强和各层之间的异质性强、突出总体内在结构的变量作为分层变量。 (3)以那些已有明显层次区分的变量作为分层变量。4.整群抽样 整群抽样又称聚类抽样。是将总体中各单位归并成若干个互不交叉、互不重复的集合,称之为群;然后以群为抽样单位抽取样本的一种抽样方式。应用整群抽样时,要求各群有较好的代表性,即群内各单位的差异要大,群

17、间差异要小。1)优缺点 整群抽样的优点是实施方便、节省经费; 整群抽样的缺点是往往由于不同群之间的差异较大,由此而引起的抽样误差往往大于简单随机抽样。 样本分布面不广、样本对总体的代表性相对较差等缺点。2)实施步骤 先将总体分为i个群,然后从i个群中随机抽取若干个群,对这些群内所有个体或单元均进行调查。抽样过程可分为以下几个步骤: (1)确定分群的标注 (2)总体(N)分成若干个互不重叠的部分,每个部分为一群。 (3)据各样本量,确定应该抽取的群数。 (4)采用简单随机抽样或系统抽样方法,从i群中抽取确定的群数。 例如,调查中学生患近视眼的情况,抽某一个班做统计;进行产品检验;每隔8h抽1h生

18、产的全部产品进行检验等。3)与分层抽样区别 整群抽样与分层抽样在形式上有相似之处,但实际上差别很大。 分层抽样要求各层之间的差异很大,层内个体或单元差异小,而整群抽样要求群与群之间的差异比较小,群内个体或单元差异大; 分层抽样的样本是从每个层内抽取若干单元或个体构成,而整群抽样则是要么整群抽取,要么整群不被抽取。4)适用情况 整群抽样方法的运用,需要与分层抽样方法区别。当某个总体是由若干个有着自然界限和区分的子群(或类别、层次)所组成,同时,不同子群相互之间差很大、而每个子群内部的差异不大时,则适合于分层抽样的方法;反之,当不同子群之间差别不大、而每个子群内部的异质性比较大时,则特别适合于采用

19、整群抽样的方法。15)整群抽样的误差 整群抽样的误差视各群单位方差大小而定,各群单位方差的简单平均数是计算其抽样平均误差的依据。从公式上看,整群抽样平均误差的公式与类型抽样平均误差的公式相似,用R表示全及总体中划分的群(组)数。r表示被抽中的群(组)数。表示抽样总体各群(组)方差的平均数。5.多段抽样 多段随机抽样,就是把从调查总体中抽取样本的过程,分成两个或两个以上阶段进行的抽样方法。6.PPS抽样(概率比例规模抽样) 即“概率与元素的规模大小成比例的抽样”。其原理可以通俗的理解成以通过阶段性的不等概率抽样来换取最终的、总体的等概率抽样的方法。7.户内抽样 从所抽中的每户家庭中抽取一个成年人

20、,以构成访谈对象的过程。8.偶遇抽样 是指研究者根据现实情况,以自己方便的形式抽取偶然遇到的人,或者仅仅选择那些离得最近的、最容易找到的人作为调查对象的方法。9.判断抽样 判断抽样(Judgement sample)又称“立意抽样”,是指根据调查人员的主观经验从总体样本中选择那些被判断为最能代表总体的单位作样本的抽样方法。10.定额抽样定额抽样又称配额抽样,是按市场调查对象总体单位的某种特征,将总体分为若干类,按一定比例在各类中分配样本单位数额,并按各类数额任意或主观抽样。其抽样时并不遵循随机的原则。11.雪球抽样 当无法了解总体情况时,可以从总体中少数成员入手,向他们询问其他符合条件的人,再

21、去找那些人并再询问他们知道的人。如同滚雪球一样。12.图像抽样在图像区域的一些特定位置上取出图像的亮度值(或色度值),以此作为原图像的一种替代,这一过程就称作图像的抽样,而每一个抽样的位置称为抽样点,该点的亮度值(或色度值)就是抽样值。三、统计抽样统计抽样VS非统计抽样非统计抽样 非统计抽样是指按照职业判断进行样本设计和实施抽样的技术。非统计抽样的特点:不能对抽样风险进行控制和量化。统计抽样与非统计抽样比较: 统计抽样是指同时具备下列特征的抽样方法:(1)随机选取样本;(2)运用概率论评价样本结果,包括计量抽样风险。 统计抽样的样本必须具有这两个特征,不同时具备上述两个特征的抽样方法为非统计抽

22、样。一方面,即使严格按照随机原则选取样本,如果没有对样本结果进行统计评估,就不能认为使用了统计抽样。另一方面,基于非随机选样的统计评估也是无效的。 在统计抽样与非统计抽样方法之间进行选择时主要考虑成本效益。统计抽样的优点在于能够客观地计量抽样风险,并通过调整样本规模精确地控制风险,这是与非统计抽样最重要的区别。1 陆迎霞.审计中统计抽样与非统计抽样的比较J.生产力研究,2008,(21)常用术语1.产品单位 质量管理的抽样检验中,单位产品是为了实施抽样检验而划分的单位体或单位量。 对于按件制造的产品来说,一件产品就是一个单位产品,如一批灯泡中的每个灯泡,一批螺钉中的每个螺钉。由于需要不同,钢水

23、可以将一炉作为单位产品,也可以将一勺作为单位产品。2.过程平均质量 过程平均质量指在规定的时段或生产量内平均的过程水平。 GB/T2828.1中指的是过程处于统计状态期间的质量水平。用不合格品百分数或每百单位产品不合格品数表示。1.统计抽样检验的概述 1.1抽样检验特性曲线(OC曲线) 以不合格品率p为横坐标,以接收概率L(p)为纵坐标,做出的接收概率L(p)随不合格品率p变化的曲线,称为抽样检验特性(Operating Characteristic)曲线,简称OC曲线。不难理解,有一个确定的抽样方案,就有一个确定的OC曲线与之相对应,并且影响产品接收概率的只有交验批不合格品率这一个因素。 1

24、.2影响OC曲线的抽样检验方案中的参数抽样检验方案由交验批的批量N、抽样样本量n和合格判定数Ac等三个参数构成,一般记为N,n,Ac。当抽样检验方案中的N,n为确定值时,Ac的变化对OC曲线的影响如图1所示。Ac由大变小时,OC曲线由右向左移动,倾斜度逐渐变大,使得接收概率降低,这就意味着方案变严,同时曲线越向左移,接收概率的变化率增大,也就是灵敏度增加。 当抽样检验方案中的N,Ac为确定值时,n由小到大变化时,OC曲线由右向左移动,和图1所示Ac由大变小对OC曲线的影响相似,即抽样方案随样本量n的增大,逐渐变严。 当抽样检验方案中的n,Ac为确定值时,N的变化对a曲线的影响甚微,如图a所示。

25、这说明批量N对OC曲线即抽样检验的检验特性影响很小,表明对于相同质量水平的交验批,抽样样本量n和合格判定数Ac一旦确定,其接收概率基本上是相同的,即体现了统计抽样检验的科学性和合理性。2.统计抽样检验方案的确定 我国制订的统计抽样检验国家标准已有二十几个,不同的国家标准所确定的抽样方案也不尽相同。下面面介绍适用于连续批交验的GB2828.1计数抽样检验程序按接收质量限(AQL)检索的逐批检验抽样计划中抽样方案的确定过程。 要确定适用的抽样方案,首先依据批量N和检验水平IL从样本字码表中检索出相应的样本量字码,再根据样本量字码和合格质量水平AQL,利用附录的抽检表确定抽样方案,即确定要抽取的样本

26、量n、用来判定批接收与否的接收数Ac,拒收数Re等。所以,使用GB/T2828.1统计抽样检验标准首先要明确检验水平、合格质量水平和抽样方式。 检验水平就是为确定检验判断能力,而规定的交验批量N与样本大小n之间的等级关系,记为IL。在GB/T2828.1中,检验水平有两类,即一般检验水平和特殊检验水平,一般检验水平包括I、II、III三个等级,其判断能力:III 大于 II 大于 I,无特殊要求时均采用一般检验水平II。特殊检验水平的判断能力低于一般检验水平,规定了S-1.S-2.S-3.S-4四个等级,其判断能力:S-4大于S-3大于S-2大于S-1。一般适用于检验费用较高、风险较高的场合。

27、 合格质量水平AQL也称可接收的质量水平,表征连续提交批平均不合格品率的上限值。AQL的数值小于等于10%时,既可以表征“每百件产品中的不合格品数”,也可以表征“每百件产品中的不合格数”。当AQL大于10%时,则只能表征产品中的不合格数。AQL值确定原则为单项严于多项、原材料和另部件严于成品、航天产品严于军工和民用、电气严于机械等。 在GB/T2828.1中,抽样方式有三种,即一次抽样、二次抽样和五次抽样。对于给定的合格质量水平AQL和检验水平IL不同的抽样方式对批质量的判定能力以及对总体质量的保证能力基本上相同。所不同的是抽样方式的抽样次数越少,所需的样本量越大;但多次抽样的检验组织工作难度

28、大,判定复杂。当检验费用不高时优先选用一次抽样。3统计抽样检验的实施 3.1交验批的认定 交验批是提交检验的一批产品。在实施统计抽样检验的操作中,如果对交验批的认识比较混乱,不能清晰地认定,就不能选择适宜的随机抽样方法,这将直接影响到产品的质量保证。为保证抽样检验的可靠性,交验批的产品应由同型号、同等级和同种类(尺寸、特性、成分等),且生产条件和生产时问基本相同的单位产品组成。一般按包装条件及贸易习惯组成的批,不能直接作为检验批。 3.2样本的抽取 样本是检测的对象,质量特性是客观存在于产品之中的,也就是说样本客观上决定了检测结果。抽取样本是质量检验工作的首要环节,这一程序的关键是尽量做到“随

29、机化”,所谓“随机化”是指以统计理论为基础的科学抽样方法,保证批中每个个体被抽取的概率完全相同,即保证所抽取的样本在批中的代表性。在认定交验批之后,按规定的抽样方案,抽取规定数量的产品作为待检样本。 3.3样本的检验和批质量的推断 根据规定的质量标准,对所抽取的样本进行质量检验,并判断样本中每个产品合格与否,记下样本中不合格品数或不合格数d。 d=Ac,批接收;dRe,批拒收。 3.4交验批的处理 判接收的产品交验批即可交付。样本中已发现的不合格品使用方有权拒收,也可以按事先签订的合同决定是直接退货或是换成合格品。 对于判为拒收的交验批,通常应当全部退货,也可以按事先签订的合同有条件的接收。4统计抽样检验的风险 统计抽样检验存在风险,这是因为抽样检验是根据一定的抽样方案从交验批中

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1