z-CH9多阶段抽样-第1、2节.pptx

上传人:j*** 文档编号:30803497 上传时间:2024-01-28 格式:PPTX 页数:47 大小:404.44KB
下载 相关 举报
z-CH9多阶段抽样-第1、2节.pptx_第1页
第1页 / 共47页
z-CH9多阶段抽样-第1、2节.pptx_第2页
第2页 / 共47页
z-CH9多阶段抽样-第1、2节.pptx_第3页
第3页 / 共47页
z-CH9多阶段抽样-第1、2节.pptx_第4页
第4页 / 共47页
z-CH9多阶段抽样-第1、2节.pptx_第5页
第5页 / 共47页
点击查看更多>>
下载资源
资源描述

z-CH9多阶段抽样-第1、2节.pptx

《z-CH9多阶段抽样-第1、2节.pptx》由会员分享,可在线阅读,更多相关《z-CH9多阶段抽样-第1、2节.pptx(47页珍藏版)》请在冰豆网上搜索。

z-CH9多阶段抽样-第1、2节.pptx

CH9多阶段抽样,MS:

Multi-stageSampling(4-5课时),2024/1/28,1,统计学专业必修课3学分,MS,MS在抽选样本单元时不是一次直接从总体中抽取总体基本单元BU,而是分两个或两个以上的阶段来抽样比如,城市住户调查中全国范围内调查市县住户(2S)全国范围内调查市县街道办事处居委会住户(MS),一阶/初级单元Primaryunit,基本单元Baseunit,二阶单元三阶单元等Secondaryunit,2024/1/28,2,统计学专业必修课3学分,MS方法的意义,实践中,大规模的抽样调查项目往往都采用MSMS由CL发展而来(CL是单阶段抽样向多阶段抽样的过渡)MS可以看作对样本群内的单元实施再抽样的一种方法与CL类似:

当某阶单元大小(群规模)相等时,则该阶的抽样采用等概抽样但是,实践中,大多数情况单元大小不等,此时,可以:

等概抽样,加权估计不等概抽样,HH估计构造自加权样本,达到简化估计量及其方差形式的目的,此时估计精度也很不错,2024/1/28,3,统计学专业必修课3学分,MS中自加权样本的构造模式,第1阶,第2阶,第n阶,各阶单元大小相等,等概抽样,各阶单元大小不等,PPS抽样,等概抽样,自加权样本,各阶样本量相等,前几阶采用PPS抽样,最后一阶(针对BU)采用等概率抽样,并且,从第二阶开始,各阶单元的下层样本量都相同,2024/1/28,4,统计学专业必修课3学分,CH9内容体系,9.1抽样方式介绍MS的基本概念、优点及抽样推断原理9.2PU大小相等的2S抽样均值和比例估计量及其性质两个阶段都实施等概抽样srs9.3PU大小不等的2S抽样均值估计量及其性质等概抽样,加权估计不等概抽样,HH估计自加权样本的构造9.4进一步讨论的问题2S条件下样本容量的确定和最优配置三阶段抽样估计,尤其是如何构造自加权样本,2024/1/28,5,统计学专业必修课3学分,9.1抽样方式,MS抽样的基本概念MS抽样的优点MS抽样估计推断原理,2024/1/28,6,统计学专业必修课3学分,一、MS的基本概念,MS在抽选样本单元时并不是一次直接从总体中抽取BU,而是分两个或两个以上的阶段来进行比如,城市住户调查中全国范围内调查市县住户(2S)全国范围内调查市县街道办事处居委会住户(MS),一阶单元Primaryunit,基本单元Baseunit,二阶单元三阶单元等Secondaryunit,阶段的多少视具体情况确定,2024/1/28,7,统计学专业必修课3学分,二、MS的优点,MS来自于对CL的校正,所以MS具备CL的优点,同时也避免了CL的缺点(?

)CL的优点:

样本比较集中,便于组织抽样和调查、节约费用等;对于特殊结构的总体,CL往往效果好CL的缺陷:

由于群内单元的相似性,CL的误差通常较大;另外,若群规模较大,群内实施全面调查难以体现抽样调查的优势MS的优点:

保持了CL样本比较集中,便于调查、节约费用等优点,同时又避免了对小单元过多调查造成的浪费,从而充分发挥抽样调查的优点MS不需要编制所有BU的抽样框,从而可以简化抽样框的编制工作,2024/1/28,8,统计学专业必修课3学分,MS的优点(P189),1、简化抽样框的编制工作,便于组织抽样对范围较大、分布较广、单元数多的目标总体,实施MS,按现有的行政区划(或地理区域)划分各阶段抽样单元,从而简化抽样框的编制工作,便于样本单元的抽取2、可以使抽样方式更加灵活和多样MS中,各阶段可根据具体情况分别设计和采用不同的抽样组织方式(MS经常与st、cl、sy、PPS等相结合),从而充分发挥各种抽样方式的优势同时,各阶段也可以自行采用不同的估计方法,2024/1/28,9,统计学专业必修课3学分,MS的优点(续),3、能够提高估计精度与CL相比,相同的n,MS的样本在总体中的分布更广,因而也更具代表性同时,MS可以通过对方差较大的阶段设定高一点的抽样比,来进一步提高样本的代表性,从而提高抽样估计精度4、可以提高抽样的经济效益与CL相比,MS虽然看起来抽样过程更为复杂,但实际上操作起来非常简便(可操作性强),组织管理和实测调查的工作量也不大,因此MS的费用将更节省,经济效益更高5、可以为各级机构提供相应的信息MS可以满足各阶段(不同层次)的需要,这与st有些类似比如,中国城镇居民住户调查,2024/1/28,10,统计学专业必修课3学分,三、MS抽样推断原理(延展性内容),从理论上分析MS条件下估计量的期望和方差的基本公式本章各种形式的估计量的无偏性的证明和方差形式的推导都是依据的这个原理1、2S(P191-194),其中E2、V2固定PU时对第二阶抽样求均值和方差E1、V1对第一阶抽样求均值和方差,2024/1/28,11,统计学专业必修课3学分,两个阶段抽取的所有可能样本估计量的期望,对某一固定的第一阶段样本中,所有可能抽出的二阶样本的估计量的期望,所有可能抽出的第一阶样本的估计量的期望,2024/1/28,12,统计学专业必修课3学分,举例说明,总体包含3个PU,每个PU包含2个BU现:

第一阶段srs抽取2个PU,第二阶段从每个抽中的PU中srs抽取1个BU比如,总体分3个学习小组,每个学习小组包括2名同学。

现在先srs抽2个学习小组,再从抽中的学习小组中抽1名同学,进行某项成绩测试所有可能的样本共C32C21C21=12个求这12个样本的估计量的数学期望,2024/1/28,13,统计学专业必修课3学分,可能的抽样结果,PUABC,BU(a,b)(c,d)(e,f),2个,1个,PU(A,B)(B,C)(A,C),(a,c)(a,d)(b,c)(b,d),BU,(c,e)(c,f)(d,e)(d,f),(a,e)(a,f)(b,e)(b,f),总体,2024/1/28,14,统计学专业必修课3学分,定性理解:

两个阶段的随机抽样均可能带来抽样误差2S的方差由两部分构成:

一部分是第一阶段的方差V1;另一部分是第二阶段方差的均值,2024/1/28,15,统计学专业必修课3学分,说明,这不仅是2S抽样的估计推断原理,而是所有两步抽样的估计推断原理,比如,二重抽样、再抽样等方法都遵循这一原理,2024/1/28,16,统计学专业必修课3学分,2、MS,以上关于2S的估计推断原理可以推广至MS比如,3S,2024/1/28,17,统计学专业必修课3学分,9.1的重点,掌握:

MS的基本概念MS的优点理解:

2S与st和CL的关系2S的估计推断原理的理解,2024/1/28,18,统计学专业必修课3学分,2S与CL和st的关系(开拓思路),共同特点:

都是首先将总体分为若干的群(或初级单位)区别抽样方式不同抽样误差的来源不同,2024/1/28,19,统计学专业必修课3学分,2S与CL和st的关系(续),2S来源于对CL的校正在CL中,如果抽中群所含的次级单元数很多,此时对群内所有单元一一进行调查难度较大;尤其当群内单元标志值差别不大时,没必要这样做。

这时,从中选群包含的BU中抽部分进行调查,就形成了2SCL是一种特殊的2S,第一阶段抽部分PU,第二阶段是100%抽样,其误差来源于第一阶段:

群间方差st是一种特殊的2S,第一阶段100%抽PU(层),第二阶段抽层内的部分单元,其误差来源于第二阶段:

层内方差MS是st和CL的结合物,两个阶段都是抽取部分单元,都会产生误差,2024/1/28,20,统计学专业必修课3学分,三种抽样方法的比较,9.1结束,2024/1/28,21,统计学专业必修课3学分,9.2PU大小相等的二阶段抽样,一、符号说明二、均值估计量及其性质三、比例估计量及其性质,2024/1/28,22,统计学专业必修课3学分,意义,PU大小相等指的是:

总体中所有的PU中包含的二级单元数(BU数)都相等PU大小严格相等的情况实践中很少见,但是对它的讨论是MS的基础,同时也具有现实意义,主要体现在:

1、有时,PU规模差异不明显,可近似为PU大小相等2、有时,对于PU大小不等的情况,可通过分层,将大小近似的PU分到一层,则层内的2S就可以按PU大小相等的情况讨论所以,本节的讨论很有理论和实践意义,2024/1/28,23,统计学专业必修课3学分,讨论的前提,A个PU,srs,a个PU,M个BU,M个BU,M个BU,srs,m个BU,m个BU,m个BU,每个PU相互独立地抽取等容量的BU数,总体单元数=AM,样本单元数=am,2024/1/28,24,统计学专业必修课3学分,一、符号说明,两个抽样比两个层次的均值两个方差,2024/1/28,25,统计学专业必修课3学分,基本符号(Yij,i=1,2,A;j=1,2,M)(yij,i=1,2,a;j=1,2,m),2024/1/28,26,统计学专业必修课3学分,二、均值估计量及其性质,2024/1/28,27,统计学专业必修课3学分,均值估计量及其性质的基本结论,是无偏估计,第一阶抽样误差,是误差的主要组成部分,am一定时,提高a而减少m会有效提高估计的精度,2024/1/28,28,统计学专业必修课3学分,无偏性的证明,对称性论证法,2024/1/28,29,统计学专业必修课3学分,方差形式的证明(P1929.4-9.10),看作一个变量,2024/1/28,30,统计学专业必修课3学分,方差形式的证明,对称性论证法,各PU独立抽取,2024/1/28,31,统计学专业必修课3学分,方差的无偏估计的证明(P1939.11-9.18),两个关键的结论:

2024/1/28,32,统计学专业必修课3学分,例9.1说明(P194,典型例题),根据题意判断其抽样方法PU大小相等的2S解题的基本思路:

区间估计的三要素总体总值的估计,2024/1/28,33,统计学专业必修课3学分,注意,1、方差估计式中,第一项是主要的,第二项要小很多,这是因为第二项的分母是第一项的m倍,而且分子上还要乘以小于1的f1。

所以,在am一定时,提高a而减少m会有效地提高估计的精度2、如果第一阶的抽样比f1可以忽略,则可以简化方差的估计式,2024/1/28,34,统计学专业必修课3学分,这个结果在实践中可作为参考,因为第二阶抽样采用Sy或其他复杂抽样方法时,很难得到S22的无偏估计,如果f1可以忽略,只需要PU的样本均值就可得到方差的近似估计但从另一方面说,f1可忽略,意味着总体中PU数A很大,而抽选出的a却很小(am一定的情况下相当于m比较大),结果是样本分布相对集中,势必增大抽样误差(类似于CL)这是一对矛盾,应权衡处理,2024/1/28,35,统计学专业必修课3学分,补例,研究目的:

某省有100个县,每县有200个村,现欲通过两阶段抽样估计粮食平均亩产抽样方法及样本结果:

第一阶段抽取4个县(A,B,C,D)。

第二阶段从每县中抽取5个村(1,2,3,4,5),一共是20个样本村,通过调查取得粮食平均亩产资料如下表,2024/1/28,36,统计学专业必修课3学分,表20个村平均粮食亩产资料单位:

斤,要求:

用样本资料推断全省粮食平均亩产及其置信区间(置信度为95%)。

2024/1/28,37,统计学专业必修课3学分,三、总体比例的2S估计量及其性质,掌握的关键:

比例P与均值的对应关系,尤其是字母符号的对应关系,2024/1/28,38,统计学专业必修课3学分,比例估计和均值估计之间字母符号的对应关系,设,Ti总体第i个PU中具有某特征的BU数,ti样本第i个PU中具有某特征的BU数,Pi总体第i个PU的比例,pi样本第i个PU的比例,2024/1/28,39,统计学专业必修课3学分,很重要的一个关系,2024/1/28,40,统计学专业必修课3学分,比例估计量及其无偏性(P1969.21),是无偏估计,也是无偏估计,2024/1/28,41,统计学专业必修课3学分,比例估计量的方差(P1969.22-9.24),2024/1/28,42,统计学专业必修课3学分,方差的无偏估计(P1969.25),Aa,Mm,Pp,Qq,第二项再乘以f1,2024/1/28,43,统计学专业必修课3学分,P196例9.2说明(典型例题),2024/1/28,44,统计学专业必修课3学分,补例,研究目的:

某林场有160块地,每块地有9棵树,现发现了某种病害,欲检查病树所占比例抽样方法及结果:

用2S抽样,先从林场抽取了40块样地,每块样地中又抽3棵树,检查结果发现有22块地的3棵树均没有病,11块地有1棵树有病,4块地有2棵树有病,3块地3棵树全有病要求:

估计病树的比例及其估计方差,2024/1/28,45,统计学专业必修课3学分,9.2总结,假设前提的理解典型例题的掌握:

【9.1】,【9.2】比例估计与均值估计的核心9.2是本章计算的重点之一,2024/1/28,46,统计学专业必修课3学分,作业,思考:

P2039.1、9.2作业:

P2039.3、9.4,9.2结束,2024/1/28,47,统计学专业必修课3学分,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 经管营销 > 经济市场

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1