统计抽样技术.pptx

上传人:j*** 文档编号:30803614 上传时间:2024-01-28 格式:PPTX 页数:66 大小:1.13MB
下载 相关 举报
统计抽样技术.pptx_第1页
第1页 / 共66页
统计抽样技术.pptx_第2页
第2页 / 共66页
统计抽样技术.pptx_第3页
第3页 / 共66页
统计抽样技术.pptx_第4页
第4页 / 共66页
统计抽样技术.pptx_第5页
第5页 / 共66页
点击查看更多>>
下载资源
资源描述

统计抽样技术.pptx

《统计抽样技术.pptx》由会员分享,可在线阅读,更多相关《统计抽样技术.pptx(66页珍藏版)》请在冰豆网上搜索。

统计抽样技术.pptx

项目九统计抽样技术,项目九统计抽样技术,能力目标,

(1)具有在实际工作中正确运用抽样方法进行样本选取的能力;

(2)能够根据研究目的进行抽样框的设计;(3)具有在实际工作中正确运用参数估计的方法进行抽样推断的能力;(4)具有应用Excel工具进行样本抽样、样本分析的能力。

知识目标,

(1)抽样推断的基本概念;

(2)抽样方法的选择;(3)抽样误差的含义;(4)抽样估计的含义;(5)抽样估计的方法及适用条件。

项目概述,表9-1样本的耐用时间h,项目分析,产品的质量检测不可能对所有产品进行一一检查,只能从总体中抽取部分检验。

通常采用从总体中随机抽取部分样本作为检查对象,通过样本的特征来反映总体特征。

作为这家计算机经销商需要解决如何选择样本,即从2000件产品中如何选择40件样本,并对样本进行分析。

本项目可以通过以下任务来完成:

工作任务一统计抽样的意义工作任务二抽样误差工作任务三抽样估计的方法工作任务四抽样方案的设计,工作任务一统计抽样的意义,一、统计抽样的概念与特点,统计抽样是抽样调查和抽样推断的总称,它是按照随机原则从总体中抽取部分单位进行调查,利用这部分单位的调查资料推算总体数量特征的一种统计分析方法。

工作任务一统计抽样的意义,一、统计抽样的概念与特点,统计抽样具有以下几个特点:

(一)按照随机原则抽取样本单位,

(二)根据部分推断总体,(三)运用了概率估计的方法,(四)抽样误差可以事先计算并加以控制,工作任务一统计抽样的意义,二、统计抽样的作用,能够解决全面调查无法或难以解决的问题,可以补充和订正全面调查的结果,可以在短期内取得时效性强的资料,可以应用于生产过程中产品质量的检查和控制,工作任务一统计抽样的意义,三、统计抽样中的基本概念,

(一)全及总体和样本总体,全及总体简称总体,是指根据研究的目的所确定的研究事物的全体,也就是抽样调查所确定的调查对象,又叫母体,如前例中的30000户职工家庭就是全及总体。

全及总体单位数一般用表示。

样本总体简称样本,它是从全及总体中随机抽取出来的那部分单位组成的集合体,又叫子体。

如前例,抽出的300户职工家庭就构成一个样本总体。

样本总体的单位数一般用表示。

工作任务一统计抽样的意义,三、统计抽样中的基本概念,

(二)全及指标和样本指标,根据全及总体计算的反映总体数量特征的指标称为全及指标,又叫参数。

常用的总体参数有总体平均数和总体标准差(或总体方差)。

公式分别为:

工作任务一统计抽样的意义,三、统计抽样中的基本概念,(三)样本容量和样本个数,样本容量是指一个样本总体所包含的单位数,即。

样本单位数的确定,必须结合调查任务的要求以及总体各单位标志值的差异情况来综合考虑。

通常将样本单位数不少于30个(30)的样本称为大样本,样本单位数不及30个(30)的样本称为小样本。

社会经济统计中的抽样调查多属于大样本调查,因此,后面的有关计算和分析都是建立大样本理论基础之上的。

工作任务一统计抽样的意义,三、统计抽样中的基本概念,(三)样本容量和样本个数,样本个数又称样本可能数目,是指从一个总体中可能抽取的样本总体的个数。

从一个总体中可能抽取多少个样本,和样本容量以及抽样方法等因素有很大关系。

从一个总体抽取多少个样本,则样本指标就有多少个取值,因而就形成了样本指标的分布。

工作任务一统计抽样的意义,三、统计抽样中的基本概念,(四)重复抽样和不重复抽样,重复抽样又称回置抽样,它是从总体中抽出一个单位后,把结果登记下来,再放回总体中参加下一次抽选。

重复抽样每次都是从全部总体单位中抽选,每个单位被抽中的机会在各次中是完全相同的,且有多次被抽中的可能。

工作任务一统计抽样的意义,【例9-1】总体有A、B、C3个单位,要从中随机重复抽取2个单位构成一个样本,先从3个单位中抽取1个,共有3种抽法,结果登记后再放回;然后再从相同的3个中抽1个,也有3种抽法。

前后取两个单位构成一个样本,全部可能抽取的样本个数为33=9,具体的样本是AA、AB、AC、BA、BB、BC、CA、CB、CC。

不重复抽样又叫不回置抽样,它是指从总体中抽出一个单位之后不再放回去参加下一次抽选。

在不重复抽样过程中,总体单位数依次减少,因而每个单位被抽中的可能性越来越大,但被抽中的机会只有一次。

工作任务一统计抽样的意义,【例9-2】从总体A、B、C3个单位中用不重复抽样方法抽取2个单位构成样本。

先从3个单位中抽1个,共有3种抽法;第二次从留下的2个单位中抽1个,共有2种抽法。

前后两个单位构成一个样本。

全部可能抽取的样本个数为32=6个,具体样本是AB、AC、BA、BC、CA、CB。

根据概率论,在相同样本容量的要求下,同一个总体的重复抽样的样本个数总是大于不重复抽样的样本个数。

工作任务二抽样误差,一、抽样误差的意义,误差是客观现象的统计资料与客观现象真值之间的差别。

抽样误差是指在遵循随机原则的前提下,抽取的样本指标与总体真值指标之间的差别或离差。

如抽样平均数与总体平均数之间的离差,抽样成数与总体成数之间的离差等。

工作任务二抽样误差,一、抽样误差的意义,影响抽样误差大小的因素有以下几种。

(一)总体各单位标志值的差异程度,

(二)样本单位数的多少,(三)抽样方法,(四)抽样调查的组织形式,工作任务二抽样误差,二、抽样平均误差,以表示抽样平均数的抽样平均误差,表示抽样成数的抽样平均误差,M表示全部可能的样本个数,则:

工作任务二抽样误差,二、抽样平均误差,

(一)抽样平均数的抽样平均误差,

(1)在重复抽样的条件下,计算公式为:

(2)在不重复抽样的条件下,计算公式为:

工作任务二抽样误差,二、抽样平均误差,

(一)抽样平均数的抽样平均误差,不重复抽样与重复抽样两个抽样平均误差公式相比,前者比后者多了个修正系数。

这个系数总是小于1的,因此,不重复抽样的误差总是小于重复抽样的误差。

当总体单位数N非常大时,N与N-1非常接近,因此,不重复抽样的抽样平均误差公式可以近似的简化为:

工作任务二抽样误差,【例9-3】设有4个工人,其日产量分别为70、90、130、150件。

这一总体的平均日产量和标准差为:

=31.62(件),=,工作任务二抽样误差,现在用不重复抽样的方法从4个工人中抽2个工人求平均日产量,所有可能的样本及有关资料见表9-2。

表9-2样本平均数及其离差计算表,工作任务二抽样误差,应用抽样平均误差的理论性公式计算如下。

样本平均数的平均数:

=(件);抽样平均误差:

(件)。

现在直接用数理统计的应用性公式计算如下。

抽样平均误差:

(件)。

工作任务二抽样误差,二、抽样平均误差,

(二)抽样成数的抽样平均误差,

(1)在重复抽样条件下,计算公式为:

(2)在不重复抽样条件下,计算公式为:

工作任务二抽样误差,二、抽样平均误差,

(二)抽样成数的抽样平均误差,同理,在总体单位数N很大时,公式可以近似地简化为:

工作任务二抽样误差,【例9-4】某电子元件厂生产某型号的电子管,根据过去的情况,产品一级品率为60%,现从10000件电子管中随机抽取100件进行检验,求一级品率的抽样平均误差。

根据已知条件:

P=60%,N=10000,n=100。

在重复抽样条件下,一级品率的抽样平均误差为:

=4.9%,在不重复抽样条件下,一级品率的抽样平均误差为:

=,=4.87%,工作任务二抽样误差,三、抽样极限误差,样本指标与总体指标之间的抽样误差是客观存在的,不可避免的。

因此,以样本指标估计总体指标,要达到完全准确毫无误差,几乎是不可能的。

所以,在用样本指标估计总体指标时,应该根据所研究对象的变动程度和分析任务的要求,确定一个可允许的误差范围,在这个范围内估计的数字都算是有效的。

这种可允许的误差范围称作抽样极限误差,又叫允许误差。

它是抽样指标和总体指标之间抽样误差的最大可能范围,它等于样本指标可允许变动的上限或下限与总体指标之差的绝对值。

设、分别表示抽样平均数极限误差和抽样成数极限误差。

工作任务二抽样误差,三、抽样极限误差,则有:

由于总体指标是未知的,所以,从这个意义上是无法计算抽样极限误差的。

工作任务二抽样误差,三、抽样极限误差,图9-1正态概率分布,工作任务二抽样误差,三、抽样极限误差,表9-3正态概率表(部分),工作任务二抽样误差,【例9-5】设样本粮食平均亩产量=500kg,又知抽样平均误差=12.5kg,求总体粮食平均亩产量在50025kg(即475525)之间kg的估计置信度是多少?

根据公式:

查正态概率表,当=2时,置信度为95.45%。

即总体平均亩产量在475525kg之间的概率保证程度为95.45%,也就是说还有4.55%的可能性不在这个范围内。

工作任务三抽样估计的方法,一、点估计,点估计又称定值估计,是指不考虑抽样误差而直接以样本指标代替总体指标,也就是直接以抽样平均数或抽样成数代替总体平均数或总体成数。

用公式表示为:

工作任务三抽样估计的方法,【例9-6】在对某乡进行的农产量调查中,样本地块的平均亩产为350kg,以此推断该乡的平均亩产也是350kg;对某批产品进行质量检验,抽取的部分产品的合格率为95%,认为这批产品的合格率也是95%。

点估计简便、直观,但这种估计没有表明抽样估计的误差,更没有指出误差在一定范围内的概率保证程度,所以实际工作中常常采用区间估计的方法。

工作任务三抽样估计的方法,二、区间估计,根据前面所讲的抽样极限误差的概念和不等式:

对上面不等式,很容易得到以下两个等价的不等式:

工作任务三抽样估计的方法,【例9-7】某进出口公司出口一种名茶,规定每包重量不低于150g,现在用不重复抽样的方法抽取其中的1%进行检验,结果见表9-4。

表9-4某进出口公司出口一种名茶的抽查资料,工作任务三抽样估计的方法,要求以99.73%的概率估计这批茶叶平均每包的重量范围,以便确定该批茶叶是否达到重量规格的要求。

=(g),S=0.87(g),=0.087(g),工作任务三抽样估计的方法,【例9-8】某城市随机抽取400户居民进行家计调查,得每户年耐用品的消费支出的标准差为200元,试确定该市居民年平均每户耐品用的消费支出在930.4969.6元之间的概率保证程度。

已知:

n=400,=200,=(元)则有:

=10(元)=查正态概率表,得置信度为:

95%。

该市居民年平均每户耐用品的消费支出在930.4969.6元之间的概率保证程度为95%。

工作任务三抽样估计的方法,【例9-9】某企业生产一批食品罐头共60000桶,随机不重复抽查300桶,发现其中有6桶不合格,试以95.45%的可靠性估计这批罐头合格品率的可能范围。

已知:

n=300,=6,=2,则有:

所以这批罐头合格品率的可能范围是:

98%1.6%,即:

96.4%99.6%。

工作任务四抽样方案的设计,一、抽样框的编制,抽样框是指由现象总体的所有单位组成的一个框架,它是实施抽样推断的基础条件之一。

抽样框一般有三种形式,一是名录抽样框,二是区域抽样框,三是时间抽样框,工作任务四抽样方案的设计,二、抽取样本单位的方法,抽签法,1,2,随机数表法,工作任务四抽样方案的设计,二、抽取样本单位的方法,表9-5随机数字表(部分),工作任务四抽样方案的设计,二、抽取样本单位的方法,【例9-10】假设要从30人中采用不重复抽样的方法抽5人进行调查。

第一步,先将30人编号,如00,01,02,28,29。

第二步,确定起始点位置,假定以随机数字表的第2行第4列数组的26916为起点数。

第三步,竖着顺查,选用后两个数字,查的结果后两个数字为16,72,03,85,27,47,51,02,83,48,14,。

最后,确定样本单位,查表中重复出现的号码,只需取前面出现的一个就可以,结果最先出现的29以内的数码分别为16,03,27,02,14,这就是要抽中的5个人。

工作任务四抽样方案的设计,三、抽样的组织形式,工作任务四抽样方案的设计,三、抽样的组织形式,

(一)简单随机抽样,简单随机抽样是指对总体不作任何分类和排队,直接从N个单位的总体中随机抽取n个单位组成样本的抽样组织形式,又称为纯随机抽样。

工作任务四抽样方案的设计,三、抽样的组织形式,

(二)类型抽样,类型抽样通常采用的是等比例类型抽样,即单位数较多的组多抽一些单位,单位数较少的组少抽一些单位,以保证抽样比例在各组都相等。

用公式表示为:

所以各组的样本单位数为:

工作任务四抽样方案的设计,以抽样平均数为例来说明类型抽样组织形式下样本平均数、抽样平均误差和区间估计等有关问题的计算。

第组样本的抽样平均数:

全样本的抽样平均数为:

工作任务四抽样方案的设计,由于类型抽样对各组进行的是全面调查,因此,类型抽样的抽样平均误差和组间方差无关,只取决于各组内方差的平均水平。

第组内方差为:

平均组内方差为:

工作任务四抽样方案的设计,样本平均数的抽样平均误差可按下列公式计算:

在重复抽样条件下:

在不重复抽样条件下:

工作任务四抽样方案的设计,【例9-11】某地区共有农村居民3920户,分为粮食作物专业户、经济作物专业户和养殖专业户三种类型。

用不重复抽样按5%的等比例抽取样本户,调查其平均收入,所计算的有关指标见表9-6。

表9-6某地区农村居民抽样资料,工作任务四抽样方案的设计,求样本平均收入和抽样平均误差,并以95.45%的概率估计该地区所有居民平均收入的区间范围。

全样本平均数:

=,平均组内方差:

=1845.43(元),工作任务四抽样方案的设计,抽样平均误差:

由于=95.45%,查正态概率表得,所以,(元)。

则以95.45%的概率估计该地区所有居民平均收入的区间范围为404.495.98元,即398.51410.47元。

工作任务四抽样方案的设计,三、抽样的组织形式,(三)等距抽样,等距抽样也称机械抽样,它是先按某一标志对总体各单位进行排队,然后根据一定顺序和间隔来抽取样本单位构成样本的抽样组织形式。

工作任务四抽样方案的设计,三、抽样的组织形式,(四)整群抽样,整群抽样,它是将总体各单位划分成若干群,然后从中随机抽取部分群,对中选群的所有单位进行全面调查的抽样组织形式。

以抽样平均数为例来说明整群抽样组织形式下样本平均数、抽样平均误差和区间估计等有关问题的计算。

第i群样本平均数:

全样本平均数:

工作任务四抽样方案的设计,由于整群抽样是对中选群的所有单位进行的全面调查,因此,整群抽样的抽样平均误差仅取决于各群间方差,设为群间方差,则样本平均数的群间方差为:

整群抽样都采用不重复抽样的方法,所以样本平均数的抽样平均误差为:

工作任务四抽样方案的设计,【例9-12】拟调查某县农户家禽饲养情况,从该县100个村中随机抽取10个村,对中选村所有农户的家禽饲养情况进行调查,测得平均每户饲养家禽35只,各村的平均数的方差为16只。

试以95.45%的概率估计全县平均每户家禽的饲养只数。

已知:

R=100,r=10,=35,2=16,t=2抽样平均误差:

极限误差:

=21.2=2.4(只)则以95.45%的概率估计全县平均每户家禽饲养只数为352.4只,即在32.637.4只范围内。

工作任务四抽样方案的设计,三、抽样的组织形式,(五)多阶段抽样,工作任务四抽样方案的设计,四、必要样本单位数的确定,

(一)必要样本容量的计算,

(1)在重复抽样下,平均数的极限误差公式为:

所以,必要的样本单位数:

=,。

工作任务四抽样方案的设计,四、必要样本单位数的确定,

(一)必要样本容量的计算,

(2)在不重复抽样下,样本平均数的极限误差公式为:

所以,必要的样本单位数:

工作任务四抽样方案的设计,四、必要样本单位数的确定,

(一)必要样本容量的计算,同理,成数必要样本单位数分别如下:

(1)重复抽样:

(2)不重复抽样:

工作任务四抽样方案的设计,四、必要样本单位数的确定,

(二)影响必要样本单位数的因素,。

2抽样极限误差的大小,3抽样估计的置信度,1总体各单位标志值的差异程度,4抽样方法和抽样组织形式,工作任务四抽样方案的设计,【例9-13】某城市组织职工家庭生活抽样调查,已知以往职工家庭平均每人每月生活费收入的标准差为11.5元,要求把握程度(置信度)为0.9545,允许误差为1元,问需要抽多少户进行调查?

已知:

,t=2,=1,=11.5元(总体指标是未知的,一般可用以前的经验数据、类似的资料或试点抽样调查的数据来代替)则:

就是说,按规定要求应抽529户。

工作任务四抽样方案的设计,【例9-14】调查一批机械零件的合格品率。

根据过去的资料,合格品率曾有过99%、97%和95%三种情况,现在要求允许误差不超过1%,推断的把握程度为95%,问应抽多少个零件?

已知:

1%,t=1.96,=95%(1-95%)=0.0475(有多个方差的情况下,取最大的方差值,目的是多抽一些单位,以满足抽样要求)则:

n=这就是说至少应抽1825个零件,才能符合上述要求。

工作任务四抽样方案的设计,【例9-15】某市开展职工家计调查,根据历史资料该市职工家庭平均每人每年收入的标准差为250元,而家庭消费的恩格尔系数为65%。

现在用重复抽样的方法,要求在95.45%的概率保证下,平均收入的极限误差不超过20元,恩格尔系数的极限误差不超过4%,求必要的样本单位数。

根据公式,在重复抽样条件下,样本平均数的单位数:

样本成数的单位数为:

任务实施,表9-7抽样框,任务实施,图9-2样本指标的计算,任务实施,图9-3耐用时间区间估计,图9-4合格品率区间估计,謝謝!

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 小学教育 > 数学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1