第八章 抽样推断.pptx
《第八章 抽样推断.pptx》由会员分享,可在线阅读,更多相关《第八章 抽样推断.pptx(96页珍藏版)》请在冰豆网上搜索。
第八章抽样推断,1.1抽样方案的设计1.2简单随机抽样的抽样误差的测定1.3简单随机抽样的抽样估计,1.1抽样方案的设计,一、抽样估计的意义和一般步骤二、抽样方案设计的基本准则三、抽样方案设计的主要内容,一、抽样估计的意义和一般步骤,抽样估计的定义抽样估计的特点抽样估计的运用抽样估计的一般步骤总体参数与样本指标,指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等的被抽中机会,抽样估计,第八章抽样推断,按照随机原则从调查对象中抽取一部分单位进行调查,并以调查结果对总体数量特征作出具有一定可靠程度的估计与推断,从而认识总体的一种统计方法,统计推断,全及总体指标:
参数(未知量),样本总体指标:
统计量(已知量),抽样估计,第八章抽样推断,并非所有的抽样估计都按随机原则抽取样本,也有非随机抽样,总体,随机样本,非随机样本,与总体分布特征相同,与总体分布特征不同,第八章抽样推断,按随机原则抽取样本单位目的是推断总体的数量特征抽样推断的结果具有一定的可靠程度,抽样误差可以事先计算并控制,抽样估计的特点,第八章抽样推断,不可能进行全面调查时不必要进行全面调查时来不及进行全面调查时对全面调查资料进行补充修正时,抽样估计的应用,第八章抽样推断,设计抽样方案,抽取样本单位,收集样本数据,计算样本统计量,推断总体参数,抽样估计的一般步骤,第八章抽样推断,设总体中个总体单位某项标志的标志值分别为,其中具有某种属性的有个单位,不具有某种属性的有个单位,则,总体平均数(又叫总体均值):
第八章抽样推断,总体单位标志值的标准差:
总体单位标志值的方差:
第八章抽样推断,总体成数:
总体是非标志的标准差:
总体是非标志的方差:
第八章抽样推断,设样本中个样本单位某项标志的标志值分别为,其中具有和不具有某种属性的样本单位数目分别为和个,则,样本平均数(又叫样本均值):
第八章抽样推断,样本单位标志值的标准差:
样本单位标志值的方差:
为的无偏估计,为的无偏估计,样本成数:
样本单位是非标志的标准差:
样本单位是非标志的方差:
为的无偏估计,为的无偏估计,第八章抽样推断,1.1抽样方案的设计,一、抽样估计的意义和一般步骤二、抽样方案设计的基本准则三、抽样方案设计的主要内容,随机原则,抽取样本单位时,应确保每个总体单位都有被抽取的可能;在对样本单位的资料进行搜集和整理时,不能随意遗漏或更换样本单位,抽样误差最小,在其他条件相同的情况下,选抽样误差最小的方案,费用最少,在其他条件相同的情况下,选费用最少的方案,设计抽样方案时,通常是在误差达到一定要求的条件下,选择费用最少的方案,抽样方案设计的基本准则,第八章抽样推断,1.1抽样方案的设计,一、抽样估计的意义和一般步骤二、抽样方案设计的基本准则三、抽样方案设计的主要内容,编制抽样框确定抽样方法确定抽样组织方式确定样本容量,三、抽样方案设计的主要内容,编制抽样框,第八章抽样推断,区域抽样框,在商场的大门口,在微波炉柜台前,在市区街道旁边,在某个住宅小区,中山区沙河口区星海街道黑石礁街道尖山一委尖山二委居民一组居民二组,某外国公司在大连进行微波炉市场调查:
第八章抽样推断,时间表抽样框,连续出产的产品总体可以编制抽样框:
均匀的出产时间、可以预见到的产品总量。
连续到加油站加油的汽车总体无法编制抽样框:
时间不定、总量也无法确定。
第八章抽样推断,确定抽样方法,重复抽样,又被称作重置抽样、有放回抽样,抽出个体,登记特征,放回总体,继续抽取,特点,同一总体单位有可能被重复抽中,而且每次抽取都是独立进行,第八章抽样推断,不重复抽样,又被称作不重置抽样、不放回抽样,抽出个体,登记特征,继续抽取,特点,同一总体中每个单位被抽中的机会并不均等,在连续抽取时,每次抽取都不是独立进行,是最为常用的抽样方法,用于无限总体和许多有限总体样本单位的抽样。
确定抽样方法,第八章抽样推断,确定抽样组织方式,是最简单、最基本、最符合随机原则,但同时也是抽样误差最大的抽样组织形式,第八章抽样推断,总体N,样本n,等额抽取,等比例抽取,最优抽取,能使样本结构更接近于总体结构,提高样本的代表性;能同时推断总体指标和各子总体的指标,确定抽样组织方式,第八章抽样推断,随机起点,半距起点,对称起点,(总体单位按某一标志排序),按无关标志排队,其抽样效果相当于简单随机抽样;按有关标志排队,其抽样效果相当于类型抽样。
确定抽样组织方式,第八章抽样推断,例:
总体群数R=16样本群数r=4,样本容量,简单、方便,能节省人力、物力、财力和时间,但其样本代表性可能较差,确定抽样组织方式,第八章抽样推断,例:
在某省100多万农户抽取1000户调查农户生产性投资情况。
确定抽样组织方式,第八章抽样推断,调查对象的性质特点对调查对象的了解程度(抽样框的特点)抽样误差的大小人力、财力和物力等条件的限制,在实际工作中,选择适当的抽样组织方式主要应考虑:
确定抽样组织方式,第八章抽样推断,确定样本容量,n30,为大样本;n30,为小样本,第八章抽样推断,重复抽样的可能样本数目:
不重复抽样的可能样本数目:
共n个,确定样本容量,第八章抽样推断,第八章抽样推断,1.1抽样方案的设计1.2简单随机抽样的抽样误差的测定1.3简单随机抽样的抽样估计,一、抽样分布二、抽样估计量的优良标准三、抽样误差的概念四、抽样平均误差五、抽样极限误差,1.2简单随机抽样的抽样误差的测定,主要样本统计量,平均数比率(成数)方差,第八章抽样推断,平均数的抽样分布,全部可能样本平均数的均值等于总体均值,即:
从非正态总体中抽取的样本平均数当n足够大时其分布接近正态分布。
从正态总体中抽取的样本平均数不论容量大小其分布均为正态分布。
样本均值的标准差为总体标准差的。
第八章抽样推断,比率的抽样分布,全部可能样本比率的均值等于总体比率,即:
从非正态总体中抽取的样本比率,当n足够大时其分布接近正态分布。
从正态总体中抽取的样本比率,不论容量大小其分布均为正态分布。
样本比率的标准差为总体标准差的。
第八章抽样推断,样本抽样分布,原总体分布,第八章抽样推断,一、抽样分布二、抽样估计量的优良标准三、抽样误差的概念四、抽样平均误差五、抽样极限误差,1.2简单随机抽样的抽样误差的测定,抽样估计量的优良标准,设为待估计的总体参数,为样本统计量,则的优良标准为:
若,则称为的无偏估计量,第八章抽样推断,若,则称为比更有效的估计量,若越大越小,则称为的一致估计量,抽样估计量的优良标准,第八章抽样推断,抽样估计量的优良标准,第八章抽样推断,一、抽样分布二、抽样估计量的优良标准三、抽样误差的概念四、抽样平均误差五、抽样极限误差,1.2简单随机抽样的抽样误差的测定,第八章抽样推断,第八章抽样推断,某个样本容量的抽样分布,更大样本容量的抽样分布,第八章抽样推断,一、抽样分布二、抽样估计量的优良标准三、抽样误差的概念四、抽样平均误差五、抽样极限误差,1.2简单随机抽样的抽样误差的测定,抽样平均误差,指每一个可能样本的估计值与总体指标值之间离差的平均数,即样本估计量的标准差,式中:
为样本平均数的抽样平均误差;为可能的样本数目;为第个可能样本的平均数;为总体平均数,注意:
不要混淆抽样标准差与样本标准差!
第八章抽样推断,抽样平均误差的计算公式,样本平均数的抽样平均误差,当N500时,有,重复抽样时:
不重复抽样时:
第八章抽样推断,样本成数的抽样平均误差,重复抽样时:
不重复抽样时:
当N500时,有,抽样平均误差的计算公式,第八章抽样推断,关于总体方差的估计方法,用过去同类问题全面调查或抽样调查的经验数据代替;用样本标准差代替总体标准差,用代替。
抽样平均误差的计算公式,第八章抽样推断,影响抽样误差的因素,总体各单位的差异程度(即标准差的大小):
越大,抽样误差越大;样本单位数的多少:
越大,抽样误差越小;抽样方法:
不重复抽样的抽样误差比重复抽样的抽样误差小;抽样组织方式:
简单随机抽样的误差最大。
第八章抽样推断,一、抽样分布二、抽样估计量的优良标准三、抽样误差的概念四、抽样平均误差五、抽样极限误差,1.2简单随机抽样的抽样误差的测定,68.27%,95.45%,99.73%,抽样极限误差,第八章抽样推断,抽样极限误差,指在一定的概率保证程度下,抽样误差不允许超过的某一给定范围,也称作允许误差、误差范围、误差置信限等,由于提高把握程度,会增大允许误差,使估计精度降低,而缩小允许误差,提高估计的精度,又会降低估计的把握程度,所以在实际中应根据具体情况,先确定一个合理的把握程度再求相应的允许误差或先确定一个允许误差范围再求相应的把握程度。
第八章抽样推断,抽样极限误差的计算公式,(大样本条件下),Z为概率度,是给定概率保证程度下样本均值偏离总体均值的抽样平均误差的倍数。
第八章抽样推断,Z与相应的概率保证程度存在一一对应关系,常用Z值及相应的概率保证程度为:
z值概率保证程度1.000.68271.650.90001.960.95002.000.95452.580.99003.000.9973,抽样极限误差的计算公式,(大样本条件下),第八章抽样推断,标准正态分布函数值表,第八章抽样推断,1.1抽样方案的设计1.2简单随机抽样的抽样误差的测定1.3简单随机抽样的抽样估计,一、点估计二、区间估计三、样本数目的确定,1.3简单随机抽样的抽样估计,第八章抽样推断,一、点估计二、区间估计三、样本数目的确定,1.3简单随机抽样的抽样估计,二、区间估计,区间估计的定义和原理总体平均数的区间估计总体成数的区间估计,区间估计,指根据样本指标和抽样极限误差以一定的可靠程度推断总体指标的可能范围;其中,被推断的总体指标的下限与上限所包括的区间称为置信区间,估计的可靠程度也称为置信度。
(这里只讨论常用的大样本的情况),第八章抽样推断,区间估计原理,0.6827,落在范围内的概率为68.27%,样本抽样分布曲线,原总体分布曲线,第八章抽样推断,区间估计原理,0.9545,落在范围内的概率为95.45%,样本抽样分布曲线,原总体分布曲线,第八章抽样推断,区间估计原理,0.9973,落在范围内的概率为99.73%,样本抽样分布曲线,总体分布曲线,第八章抽样推断,总体平均数的区间估计,表达式,其中,为极限误差,第八章抽样推断,步骤,计算样本平均数;,搜集总体方差的经验数据;或计算样本标准差,即,总体平均数的区间估计,第八章抽样推断,步骤,计算抽样平均误差:
重复抽样时:
不重复抽样时:
总体平均数的区间估计,第八章抽样推断,步骤,计算抽样极限误差:
确定总体平均数的置信区间:
总体平均数的区间估计,第八章抽样推断,【例A】某企业生产某种产品的工人有1000人,某日采用不重复抽样从中随机抽取100人调查他们的当日产量,要求在95的概率保证程度下,估计该厂全部工人的日平均产量和日总产量。
总体平均数的区间估计,第八章抽样推断,100名工人的日产量分组资料,第八章抽样推断,解:
第八章抽样推断,则该企业工人人均产量及日总产量的置信区间为:
即该企业工人人均产量在124.797至127.203件之间,其日总产量在124797至127303件之间,估计的可靠程度为95。
第八章抽样推断,总体成数的区间估计,表达式,其中,为极限误差,第八章抽样推断,步骤,计算样本成数;,搜集总体方差的经验数据;,计算抽样平均误差:
重复抽样条件下,不重复抽样条件下,总体成数的区间估计,第八章抽样推断,步骤,计算抽样极限误差:
确定总体成数的置信区间:
总体成数的区间估计,第八章抽样推断,【例B】若例A中工人日产量在118件以上者为完成生产定额任务,要求在95的概率保证程度下,估计该厂全部工人中完成定额的工人比重及完成定额的工人总数。
总体成数的区间估计,第八章抽样推断,100名工人的日产量分组资料,完成定额的人数,第八章抽样推断,解:
第八章抽样推断,则该企业全部工人中完成定额的工人比重及完成定额的工人总数的置信区间为:
即该企业工人中完成定额的工人比重在0.8432至0.9568之间,完成定额的工人总数在843.2至956.8人之间,估计的可靠程度为95。
第八章抽样推断,一、点估计二、区间估计三、样本数目的确定,1.3简单随机抽样的抽样估计,三、样本容量的确定,确定样本容量的意义推断总体平均数所需的样本容量推断总体成数所需的样本容量必要样本容量的影响因素,样本容量,调查误差,调查费用,小样本容量节省费用但调查误差大,大样本容量调查精度高但费用较大,找出在规定误差范围内的最小样本容量,确定样本容量的意义,找出在限定费用范围内的最大样本容量,第八章抽样推断,确定方法,推断总体平均数所需的样本容量,重复抽样条件下:
通常的做法是先确定置信度,然后限定抽样极限误差。
或S通常未知。
一般按以下方法确定其估计值:
过去的经验数据;试验调查样本的S。
计算结果通常向上进位,第八章抽样推断,不重复抽样条件下:
确定方法,推断总体平均数所需的样本容量,第八章抽样推断,【例A】某食品厂要检验本月生产的10000袋某产品的重量,根据上月资料,这种产品每袋重量的标准差为25克。
要求在95.45的概率保证程度下,平均每袋重量的误差范围不超过5克,应抽查多少袋产品?
第八章抽样推断,解:
第八章抽样推断,确定方法,推断总体成数所需的样本容量,重复抽样条件下:
通常的做法是先确定置信度,然后限定抽样极限误差。
计算结果通常向上进位,通常未知。
一般按以下方法确定其估计值:
过去的经验数据;试验调查样本的;取方差的最大值0.25。
第八章抽样推断,不重复抽样条件下:
确定方法,推断总体成数所需的样本容量,第八章抽样推断,【例B】某企业对一批总数为5000件的产品进行质量检查,过去几次同类调查所得的产品合格率为93、95、96,为了使合格率的允许误差不超过3,在99.73的概率保证程度下,应抽查多少件产品?
【分析】因为共有三个过去的合格率的资料,为保证推断的把握程度,应选其中方差最大者,即P=93。
第八章抽样推断,解:
第八章抽样推断,必要样本容量的影响因素,总体方差的大小;允许误差范围的大小;概率保证程度;抽样方法;抽样的组织方式。
第八章抽样推断,抽样复查的方法,修正系数为,则:
该企业集团所拥有的固定资产原值应为16.8510.9507=16.020(亿元),第八章抽样推断,