第六章抽样调查.pptx

上传人:j*** 文档编号:30846408 上传时间:2024-02-03 格式:PPTX 页数:90 大小:1.11MB
下载 相关 举报
第六章抽样调查.pptx_第1页
第1页 / 共90页
第六章抽样调查.pptx_第2页
第2页 / 共90页
第六章抽样调查.pptx_第3页
第3页 / 共90页
第六章抽样调查.pptx_第4页
第4页 / 共90页
第六章抽样调查.pptx_第5页
第5页 / 共90页
点击查看更多>>
下载资源
资源描述

第六章抽样调查.pptx

《第六章抽样调查.pptx》由会员分享,可在线阅读,更多相关《第六章抽样调查.pptx(90页珍藏版)》请在冰豆网上搜索。

第六章抽样调查.pptx

教学目的与要求:

本章介绍抽样调查的基本原理和基本方法。

通过本章的教学,要求学生正确理解抽样调查的基本概念、特点和作用,掌握简单随机抽样的抽样平均误差、极限误差的计算方法;掌握在一定的概率保证下推断全及总体指标的方法;掌握必要样本单位数目的确定方法。

第六章抽样调查

(1)抽样平均误差、抽样极限误差(概念及其计算)

(2)抽样推断(区间估计法)(3)必要样本单位数目的确定本章重点与难点:

第一节抽样调查概述一、抽样推动的概念及特点(P243)

(一)概念抽样调查是非全面调查,它是按随机原则从调查对象中抽取部分单位进行调查,并用调查所得的指标数值推算总体指标数值的一种调查方法,

(二)特点(P244)1.只抽部分单位调查2.按随机原则抽取调查单位3.用部分单位的指标数值去推算总体指标数值4.可以事先计算和控制抽样误差二、抽样调查的适用范围(P245)1、对于那些带有破坏性的实验或测量,宜采用抽样调查2、对于那些在理论上可以进行全面调查、但没有必要或者实际中办不到的现象调查,宜采用抽样调查3、与全面调查相比,抽样调查能节省人力、费用和时间,且更为灵活4、在有些情况下,抽样调查的结果比全面调查要准确5、利用抽样调查资料可修正和补充全面调查资料6、抽样调查方法可用于工业生产过程中的质量控制7、利用抽样推断的方法可对某种总体进行假设检验,来判断这种假设的真伪,从而为决策提供可靠依据。

三、抽样调查中的基本概念

(一)全及总体和抽样总体(P247)1、全及总体:

指调查对象的全体。

简称总体或母体。

“N”2、抽样总体:

指从全及总体中随机抽取的那部分单位所构成的总体。

简称样本或子样。

用“n”表示。

样本单位:

指样本中的每一个单位。

样本容量:

指样本的单位数目。

即:

“n”。

当n30时为大样本,当n30时为小样本。

总体样本概念全及指标样本指标单位数目Nn平均数成数PP方差2S2标准差S

(二)全及指标和样本指标(P249)Xx根据全及总体各单位的数量标志值或属性计算所得的指标,称为全及指标。

全及指标通常包括:

全及成数的方差全及平均数的方差全及成数的标准差全及平均数的标准差全及成数全及平均数分组资料未分组资料统计指标1、全及指标(参数)NXXFXFXNPN1NXX2XFFXX2XP)P(1PNXX22xFFXX22xP)P(12p成数及成数的标准差(补充)(补充)

(1)全及总体中具有所研究标志的单位数与全及总体单位总数对比的比值,称为成数。

(2)成数的平均数即为成数的平均数,它等于成数本身。

如PNNFXFX1NNP1(3)成数的标准差计算例

(1):

已知某产品的合格率为95%,则其标准差为:

XX2xxFxx22P112NP10212NPNP1NNP1NPffxx12022PP1QPNNP1NNP221202P1PPQQPPQPQQP22%.79.2195.0195.02、样本指标(统计量)根据样本总体各单位的数量标志值或属性计算所得的指标,称为样本指标。

样本指标通常包括:

抽样成数的方差抽样平均数的方差抽样成数的标准差抽样平均数的标准差抽样成数抽样平均数分组资料未分组资料统计指标nxxfxfxnnp1nxx2XSffxx2XSp)p(1SPnxxS22xffxxS22xp)p(1S2p四、抽样方法和样本可能数目(P251)

(一)

(一)抽样方法:

重复抽样和不重复抽样两种。

1、重复抽样又称重置抽样。

它是指从全及总体中随机抽取一个样本单位、在登记该单位有关标志后,把它放回到全及总体中去参加下一轮的抽选的一种方式。

也称放回抽样。

2、不重复抽样又称不重置抽样。

它是指从全及总体中随机抽取一个样本单位、在登记该单位有关标志后,不再放回到全及总体中去参加下一轮的抽选的一种方式。

也称不放回抽样。

3、重复抽样与不重复抽样的区别

(1)抽取的样本数目不同。

(2)抽样误差的计算公式不同(3)抽样调查误差的大小不同

(二)样本可能数目(P252)1、考虑顺序的不重复抽样数目:

2、考虑顺序的重复抽样数目:

3、不考虑顺序的不重复抽样数目:

4、不考虑顺序的重复抽样数目:

五、抽样调查的理论基础(P253)概率论的大数定律和中心极限定理。

!

nNN!

AnNnnNNB!

nNn!

N!

CnNn1nNnNCD六、抽样调查的组织形式(P275302)抽样调查的组织形式:

简单随机抽样、类型抽样、等距抽样、整群抽样和多阶段抽样五种。

(一)简单随机抽样(P275)1、概念简单随机抽样又称纯随机抽样。

是指按随机原则直接从全及总体N个单位中抽取n个样本单位组成样本,总体中每个单位在被抽取时的机会相等的一种方式。

2、方法(P275)

(1)直接抽选法

(2)抽签法(3)随机数码表法3、优、缺点优点:

最符合随机原则缺点:

样本单位的代表性较差,产生的误差较大

(二)类型抽样(P277)1、概念类型抽样又称分类抽样或分层抽样。

是将全及总体按某一标志分组或分类,然后在各组或各类中按随机原则或等距抽样的形式,根据一定的比例抽取样本单位的方式。

例如:

要从某地1700亩耕地中抽取5%的耕地进行调查:

2、特点:

将统计分组和随机原则结合运用3、优点(作用)P278279

(1)提高了样本单位的代表性

(2)抽样的组织工作比较方便(3)能掌握总体中各个子总体的情况(三)机械抽样(P282)1、概念机械抽样又称等距抽样或系统抽样。

它是将全及总体单位按某一标志从小到大的顺序排列,然后依次等距抽选样本单位的方法。

其排队的标志有:

有关标志和无关标志。

2、抽样方法(P283286)

(1)随机起点等距抽样

(2)半距起点等距抽样(3)对称等距抽样例如:

对某灯泡厂的18000个灯泡按5%的比例进行抽样调查,采取机械抽样调查法。

其工作步骤是:

第一步,将18000个灯泡编号并按号码顺序排队第二步,计算样本单位数目n=180005%=900(个)第三步,计算抽样距离d=18000/900=20(个号)第四步,按计算好的抽样距离依次等距离抽取样本单位。

如3号、23号、43号、63号3、优点(作用):

P283

(1)简便易行

(2)能提高样本单位的代表性,降低抽样误差。

(四)整群抽样(P287)1、概念整群抽样是指在全及总体中,一群一群地抽取样本单位,并对抽取的各群中的全部单位无一例外地都进行全面调查的一种方式。

2、特点

(1)它是一群一群地抽取样本单位,每一群为一个样本单位

(2)对每群中的各单位都必需调查,因而它的误差只受群间方差的影响,而不受群内方差的影响。

为此,要尽量做到“增大群內方差,降低群间方差”3、优、缺点优点:

组织方便和节约费用缺点:

样本单位过于集中,因而降低了样本单位的代表性,产生的误差比较大。

(五)多阶段抽样(P290)1、概念多阶段抽样是将整个抽样程序分成若干个阶段,然后逐阶段进行抽样,以完成整个抽样过程的一种方式。

2、特点:

将整群抽样和单个抽样结合运用3、优点(作用)P290291

(1)当总体范围特别大、无法进行直接样本时,宜采用多阶段抽样

(2)可以相对节约人力物力(3)可以利用现成的行政区划、组织系统作为划分各阶段的依据,为组织抽样调查提供方便。

第一节完

(一)误差的种类登记性误差代表性误差系统性误差随机误差

(二)抽样误差的概念及种类第二节抽样平均误差一、抽样误差的概念(P255)抽样实际误差抽样平均误差例如:

在1、2、3、4、5五个数字中随机抽三个数字组成样本,采取不重复抽样、不考虑顺序,则样本配合如下:

345合计245235234145135134125124123样本配合4.00-3.673.333.003.333.002.672.672.332.00样本平均数1.00-0.670.330.000.330.000.330.330.671.00xXx2Xx0.58103.3334nxx抽样平均误差2二、抽样平均误差(256)

(一)抽样平均误差的概念(P256)抽样平均误差,从一般意义来理解是指所有抽样实际误差的平均数。

但确切地说,抽样平均误差是指所有样本指标的标准差。

(二)抽样平均误差的计算(P257)1.重复抽样方式下平均数的抽样平均误差(P258)成数的抽样平均误差(P265)nn2xnp)p(1n2p2.不重复抽样方式下平均数的抽样平均误差成数的抽样平均误差(P265)(P262)注意事项:

不重复抽样方式为什么要乘以修正系数和P的使用及使用条件

(1)2取最大值;

(2)P取接近于0.5的值(3)可以用样本或代替;(4)可以用估计值或实验值代替。

Nn1n2xNn1np1pp2sp19.25004.68755.62502.00003.12502.25001.5625100合计36.571066.5325.565055.544.55144.5电池数(f)电流强度(安培)组中值6.756.255.755.254.754.25552.520.2562.5184.026.2519.004.25xf1.250.750.250.250.751.251.56250.56250.06250.06250.56251.5625解:

计算例题:

在10000只电池中,随机抽检1%的产品进行检查,检查结果如下:

1、2班未讲f)x(x2xxx2)x(x安培5.5100552.5fxfx安培0.438710019.25ffxxs2

(2)95%1005100nnp12.179%1000.9510.95np1pp2.178%1000010011000.9510.95Nn1np1pp安培0.043871000.4387nsx安培0.043851000010011000.4387Nn1n22x三、影响抽样平均误差的因素(P256)1全及总体标志的便变异程度2样本单位数目的多少3抽样组织形式4抽样方法第二节完第三节全及指标的推断一、抽样极限误差(P268)

(一)抽样极限误差的概念抽样极限误差是指样本指标与全及指标之间误差的最大可能范围。

(二)抽样极限误差的意义(三)抽样极限误差的计算平均数的抽样极限误差成数的抽样极限误差(四)抽样极限误差与抽样平均误差的关系xxtppt正态分布图示x95.45%的概率99.73%的概率68.27%的概率2+68.27%+295.45%3+399.73%(四)估计精确度和可靠度(见P333表)概率度(t)允许误差(=t)概率F(t)110.68271.961.960.9500220.9545330.9973计算举例如上例,假设估计时的保证概率为95.45%,即:

t=2,则抽样极限误差为:

=20.04387=0.08774(安培)或=20.04385=0.0877(安培)=22.179%=4.358%或=22.178%=4.356%xxtxxtpptppt二、抽样推断方法

(一)抽样推断的概念用样本指标估计全及总体指标的工作过程称为抽样估计,又称抽样推断。

(二)抽样估计的优良标准1.无偏性。

2.一致性。

3.有效性。

(三)抽样估计方法1点估计法点估计又称定值估计,它是直接用样本指标代替全及指标的一种方法。

或Xxpp2区间估计法区间估计法是指根据样本指标和要求的把握程度对总体指标估计出一个可能的区间。

其计算公式为:

由样本平均数估计总体平均数xxXxxNXNMppPppNNPW例

(1):

如下表资料解:

即学生每周平均看电视时间在4.765.26小时之间。

xf小时0.260.132txxfxfxx2小时52501250fxfx小时2.132501136ffxxs2小时0.132502.13nsx小时5.26-4.760.265xXx例

(2):

已知:

N=1500台,求:

解:

30台,n万小时4.5x小时240s95%tF1.96t?

x?

X小时43.8030240nsx小时85.8443.801.96txx85.84100004.5xXx小时45085.84-44914.16例(3):

如下表资料按身高分组(米,)(米)xx2xxfxx2x米1.123033.6fxfx米0.0216300.648ffxxs22米0.0268300.0216ns2x米0.05260.02681.96txx米1.1726-1.06740.05261.12xXx由样本成数估计总体成数例【1】:

已知,求:

解:

=1.961.35%=2.65%即:

这批产品的废品率在1.35%6.65%之间。

件200n件8n1201Nn95%tF1.96t?

P4%2008nnp11.35%20112000.0410.04Nn1np1pp6.65%1.35%2.65%4%pppppt例【2】某城市想要估计下岗职工中女性所占的比例,随机地抽取了100名下岗职工,其中65人为女性职工。

试以95%的保证概率估计该城市下岗职工中女性比例的置信区间。

解:

已知n=100,p65%,F(t)=95%,t=1.96该城市下岗职工中女性比例的置信区间为55.65%74.35%9.35%4.77%1.96tpP4.77%1000.6510.65np)p(1P74.35%55.65%9.35%65%pPPP例【3】:

某手表厂在某段时间內生产100万个某种零件,用纯随机抽样方式抽取1000个零件进行检验,测得废品数为20件。

如以99.73%的概念保证,试对该厂这种零件的废品率进行区间估计。

3t99.73%,tF20,n1000,n100万,N:

已知1?

P:

求2%100020nnp1

(1):

解0.4427%10000.0210.02np1p

(2)p1.33%0.4427%3t(3)pp3.33%0.67%1.33%2%p(4)Pp

(2)估计总体指标落入某区间范围的可靠程度。

(1):

已知:

N=5000户,求:

解:

(1)

(2)而即:

这一估计的可靠程度为95%。

户400n户87n13.88%p?

P?

tF21.75%40087nnp125.63%17.87%3.88%21.75%pPppptppt1.98%5000400140021.75%121.75%Nn1np1pp1.96%1.98%3.88%tpp95%tF第四节必要样本数量的确定一、确定必要样本数量的意义(P303)二、影响必要样本数量的因素(P303)三、确定抽样单位数的计算公式(P304)

(一)重复抽样方式(P304)

(二)不重复抽样方式(P304)2x22xtn2p2pP1Ptn222x22xtNNtnP1PtNP1PNtn22p2p计算例题例():

已知某企业过去进行的三次产品质量抽查情况,废品率为6%、5.8%、5%,现要求抽样误差不超过0.02,如果以0.9973的概率保证,则最少抽取多少件产品(重复抽样)?

269件概率保证,最少抽取1答:

以0.9973的1269(件)0.00040.50760.026%)6%(13p)p(1t解:

n?

求:

n3,t0.9973,F(t)0.02,6%,已知:

p22p22p例():

求:

解:

89.15%P13%p95%tF1.96t89.50%P290.10%P3?

np棵4130.030.891510.89151.96P1Ptn222p2p例():

(1):

,其它条件不变,求:

(2):

若解:

(1)()本章完瓶100n片101.5x片3x99.73%tF3t?

Xx/x21?

nx片0.31003nsx片0.90.33txx片102.4100.60.9101.5xXx片0.450.92121x/x瓶4000.4533tn2222/x22x第五节假设检验1.假设检验的基本思想和原理2.假设检验的步骤3.正态总体参数的假设检验4.正态总体成数的假设检验一、假设检验的基本思想和原理

(一)假设检验的概念(P307)根据一定随机样本所提供的信息,用它来判断总体未知参数事先所作的假设是否可信的统计分析方法,叫作假设检验。

如某企业将对某种产品的生产工艺进行改革,我们假设改革后产品的成本会大幅度下降,但是改革后能否降低成本事先并不知道,我们可以作出能够降低成本的假设,然后通过抽样调查的样本资料来进行检验这一假设是否成立,这就是假设检验。

又如我们对某批进口的无缝钢管进行假设,假设该批钢管的厚度不超过4毫米,然后通过样本,检验这一假设的可靠性理解:

1.先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程2.有参数检验和非参数检验3.逻辑上运用反证法,统计上依据小概率原理

(二)假设检验的基本思想.因此我们拒绝假设=50.如果这是总体的真实均值样本均值mm=50抽样分布H0这个值不像我们应该得到的样本均值.20总体(三)假设检验的过程抽取随机样本均值x=20我认为人口的平均年龄是50岁提出假设拒绝假设别无选择!

作出决策二、假设检验的步骤(P309)第一步,提出假设。

原假设与备择假设原假设与备择假设原假设:

1.研究者想收集证据予以反对的假设2.又称虚无假设或零假设3.表示为H0H0:

=某一数值指定为符号=,或如上例假设该批钢管的厚度不超过4毫米,记为:

H0:

4mm备择假设:

1.研究者想收集证据予以支持的假设2.又称替代假设或称择一假设,3.表示为H1H1:

某一数值H1:

某一数值,或某一数值如上例,假设该批钢管的厚度不超过4毫米,记为:

H1:

4mm【例】一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。

如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整。

试陈述用来检验生产过程是否正常的原假设和被择假设提出假设(例题分析)解:

研究者想收集证据予以证明的假设应该是“生产过程不正常”。

建立的原假设和备择假设为H0:

10cmH1:

10cm【例】某品牌洗涤剂在它的产品说明书中声称:

平均净含量不少于500克。

从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。

试陈述用于检验的原假设与备择假设提出假设(例题分析)解:

研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述。

建立的原假设和备择假设为H0:

500H1:

临界值,拒绝H0n左侧检验:

统计量临界值,拒绝H0显著性水平和拒绝域(双侧检验)0临界值临界值a/2a/2样本统计量拒绝H0拒绝H0抽样分布置信水平观察到的样本统计量1-显著性水平和拒绝域(左侧检验)0临界值a样本统计量拒绝H0抽样分布置信水平观察到的样本统计量1-显著性水平和拒绝域(右侧检验)0临界值a样本统计量拒绝H0抽样分布置信水平观察到的样本统计量1-三、假设检验的种类双侧检验与单侧检验假设检验可分为双侧检验和单侧检验两种,单侧检验又可以进一步分为左单侧检验和右单侧检验。

所谓双侧检验就是指当我们所要检验的是样本平均数与总体平均数、或样本成数与总体成数是否具有显著性差异,而不问其差异的方向时,所采用的一种统计检验方法。

所谓单侧检验是指当我们所要检验的是样本平均数或样本成数是大于或小于某个特定值时所采用的一种统计检验的方法。

它包括左单侧检验和右单侧检验。

如果我们所要检验的是样本数值是否大于某个特定值时,应采用右单侧检验;若我们所要检验的是样本数值是否小于某个特定值时,应采用左单侧检验。

假设的表达形式四、假设检验的内容(P310)z检验(单尾和双尾)t检验(单尾和双尾)z检验(单尾和双尾)2检验(单尾和双尾)均值一个总体成数方差是否已知小样本样本容量n大样本是否已知否t检验否z检验是z检验是z检验

(一)正态总体均值的检验(P310)nsxt0nsxz0nxz0nxz0大样本总体均值的检验(2已知)(例题分析)【例】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml。

为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为255.8m。

取显著性水平=0.05,检验该天生产的饮料容量是否符合标准要求?

双侧检验绿色绿色健康饮品绿色绿色健康饮品255255解:

(1)提出假设H0:

=255H1:

255

(2)检验统计量:

(5)结论:

接受原假设。

即样本提供的证据表明:

该天生产的饮料符合标准要求。

(3)选择检验的显著性水平=0.05(4)用检验统计量值与临界值比较,并作出决策.z01.96-1.960.025拒绝H0拒绝H00.02511.01405255255.8nxz0大样本总体均值的检验(2未知)(例题分析)【例】一种机床加工的零件尺寸绝对平均误差为1.35mm。

生产厂家现采用一种新的机床进行加工以期进一步降低误差。

为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。

利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低?

(=0.01)左侧检验已知:

,同时根据样本资料计算,可知样本平均数样本方差第一步,提出假设H0:

1.35H1:

5200第二步,检验统计量第三步,选择检验的显著性水平=0.05第四步,用检验统计量值与临界值比较,并作出决策。

第五步,结论:

拒绝原假设。

即样本提供的证据表明:

改良后的新品种产量有显著提高。

z0拒绝H00.051.64515275,x120s5200036n3.753612052005275nsxz01.645Z0.05大样本总体均值检验方法的总结nxz0nsxz0/2zzzzzzP小样本总体均值的检验1.假定条件n总体服从正态分布n小样本(n30)2.检验统计量n2已知:

n2未知:

N(0,1)nxz01)t(nnsxt0小样本总体均值的检验(例题分析)【例】一种汽车配件的平均长度要求为12cm,高于或低于该标准均被认为是不合格的。

汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进。

现对一个配件提供商提供的10个样本进行了检验。

假定该供货商生产的配件长度服从正态分布,在0.05的显著性水平下,检验该供货商提供的配件是否符合要求?

双侧检验

(1)提出假设H0:

=12H1:

12

(2)检验统计量:

(5)结论:

接受原假设。

即样本提供的证据表明:

该供货商提供的零件符合要求(4)用检验统计量值与临界值比较,并作出决策.t(n-1)t02.262.260.025拒绝H0拒绝H00.025(3)选择检验的显著性水平=0.05表317已知:

,同时根据样本资料计算,可知样本平均数样本方差0.7035100.4932/12-11.89nsxt02.269t0.0511.89,x0.4932s12010n总体比率(成数)的检验(检验方法的总结)P/2zz其中P为样本成数n)P(1PPPz000zzzz总体比率(成数)的检验(例题分析)【例】一种以休闲和娱乐为主题的杂志,声称其读者群中有80%为女性。

为验证这一说法是否属实,某研究部门抽取了由200人组成的一个随机样本,发现有146个女性经常阅读该杂志。

分别取显著性水平=0.05和=0.01,检验该杂志读者群中女性的比率是否为80%?

它们的值各是多少?

双侧检验

(1)提出假设H0:

=80H1:

80

(2)检验统计量:

(5)结论:

拒绝原假设。

即样本提供的证据表明:

该杂志的说法并不属实(4)用检验统计量值与临界值比较,并作出决策.(3)选择检验的显著性水平=0.05z01.961.960.025拒绝H0拒绝H00.0251.96Z20.052.4752000.8010.800.800.73n)P(1PPPz00073%200146P200n146n1

(1)提出假设

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工程科技 > 环境科学食品科学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1