1、第七章:抽样调查技术,本章教学目的第一节 抽样调查的基本概念第二节 概率抽样设计 第三节 非概率抽样 第四节 样本容量的确定,2024/1/28,1,本章教学目的,通过本章学习,了解抽样调查的各项技术的特点,正确地应用各项技术进行抽样调查;掌握如何选取样本、样本框,减少抽样调查的误差,提高抽样调查的精确度。,2024/1/28,2,第一节 抽样调查的基本概念,一、普查二、全及总体与样本总体三、抽样误差四、抽样框与抽样框误差,2024/1/28,3,一、普查,概念:普查是指为了某一特定调查目的而专门组织的一次性全面调查,即为了了解调查对象的基本情况而一次性地对调查对象中的全部单位逐一进行登记的调
2、查。特点:同其它调查形式相比,涉及面大、调查的内容和项目比较简单,但所收集的资料全面准确、可靠、误差比较小。同时,普查需要占用较多的人力、花费较多的财力和物力才能完成。,2024/1/28,4,二、全及总体与样本总体,(一)全及总体 概念:也称目标总体(target population),是由符合研究目的的所有具有相同性质或特征的个体(individual)所组成的集合。在抽样调查中,全及总体是抽样推断的目标。分类:全及总体可以根据单位数量是否有限,分为无限全及总体(infinite population)和有限全及总体(finite population)。,2024/1/28,5,(二)
3、样本总体,概念:也称抽样总体(sampled population)或者“子样”、“样本”,是指从全及总体中抽取出来的单位集合。大样本与小样本:样本总体通常是有限总体,它所包含的的总体单位数目称为样本容量(通常用英文字母n来表示)。一般来说,样本单位数达到或者超过30个称为大样本,而在30个以下的称为小样本。,2024/1/28,6,三、抽样误差,在市场调查中存在两类误差:抽样误差与非抽样误差。抽样误差是指在调查中因使用的样本而发生的样本指标与总体指标之间的差异。,2024/1/28,7,四、抽样框与抽样框误差,(一)抽样框(sampling frame)1.抽样框的概念 抽样框就是供抽样调查
4、使用的所有调查单位的名单。这份名单为调查者提供了辨别和联系调查总体中个体的有效途径。2.设计抽样框的要点 准确的抽样框包括两个方面:完整性与不重复性。完整性是指不遗漏总体中的任意一个个体;不重复性是指任意一个个体不能重复列入抽样框。,2024/1/28,8,(二)抽样框误差,1.抽样框误差的概念 抽样框误差(sampling frame error)是因不准确或不完整的抽样框而引起的误差。抽样框误差是一种非抽样误差,2024/1/28,9,2.抽样框误差的形成,(1)丢失目标总体单位也被称为“涵盖不足”,是指抽样框没有覆盖全部目标总体单位。(2)包含非目标单位也被称为“过涵盖”,是指抽样框中包
5、含了一些不属于研究对象的非目标总体单位。(3)丢失目标单位和非目标单位共存,是指在抽样框中既有丢失目标单位,也有包含非目标单位。(4)复合连接是指抽样框单元与目标总体单元不完全一一对应,而是存在一对多、多对一或多对多模式的现象。(5)不正确的辅助信息误差也被称为“内容上的偏差”,这种误差会降低估计的精度。(6)抽样框老化又被称为“抽样框过时”或“不准确的抽样框”。,2024/1/28,10,3.减少抽样框误差的方法,(1)在抽选样本之前,要对抽样框加以检查,发现可能存在的问题,进行识别、处理,并采取一定措施加以补救。(2)联接遗漏单位法,就是指把抽样样本遗漏的个体和抽样样本中某个值相联接,其联
6、接规则必须在调查前明确规定。4.抽样估计的总体参数(1)总体和(2)总体中具有某种特定特征的个体总数或它们在总体中所占的比例或百分率:(3)总体两个不同指标的总和或均值的比值,2024/1/28,11,第二节 概率抽样设计,一、简单随机抽样二、等距抽样三、分层抽样四、整群抽样法五、多阶段抽样,2024/1/28,12,一、简单随机抽样,(一)简单随机抽样的具体操作(二)简单随机抽样平均误差(三)简单随机抽样的方法(四)简单随机抽样的优缺点,2024/1/28,13,一、简单随机抽样,(一)具体操作步骤:第一,对总体的每个单位进行编号,总体单位数为10,000的总体可编为00 001到期10,0
7、00号;第二,在随机数码表(一般的数理统计书中都有此表)中从任意一个编号数开始,向上、向下或跳跃选取编号,在00 001和10,000之间选出200个(样本单位数);第三,在有明确总体单位的数字表中选出符合上述数字的总体单位,这些总体单位就是样本。,2024/1/28,14,(二)简单随机抽样平均误差公式,是全及总体标准差;是抽样单位数,2024/1/28,15,(三)简单随机抽样的方法,1.抽签法2.随机掷骰子法3.计算机随机数法4.随机数表法5.使用统计软件直接抽取6.其他方法7.放回抽样与不放回抽样的比较,2024/1/28,16,(四)简单随机抽样的优缺点,方法简单直观,当总体名单完整
8、时,可直接从中随机抽取样本,由于抽取概率相同,计算抽样误差及对总体指标加以推断比较方便。尽管简单随机抽样在理论上是最符合随机原则的,但在实际应用中则有一定的局限性。,2024/1/28,17,二、等距抽样,(一)等距抽样法的具体操作(二)等距抽样的实施办法(三)等距抽样的参数估计(四)等距抽样的优缺点,2024/1/28,18,(一)等距抽样法的具体操作,第一步,将N个总体单位按一定顺序排列,编号为1,2,N,第二步,根据总体单位数N和样本单位数n计算出抽样间隔K(必须是整数),K=N/n;第三步,在1和K之间随机选一个数字r,称为随机起点;第四步,根据r和K从总体中抽取n个样本单位。,202
9、4/1/28,19,(二)等距抽样的实施办法,1.随机起点等距抽样2.循环等距抽样3.中点等距抽样4.对称等距抽样法(1)塞蒂(Sethi)的方法两两对称等距抽样。(2)辛(Singh)等人的修正方法中心对称等距抽样。5.总体有周期性变化时的等距抽样,2024/1/28,20,(三)等距抽样的参数估计,1、估计量,2024/1/28,21,2.估计量的方差,其中,,为等距样本(群)内方差,为总体方差。,2024/1/28,22,(四)等距抽样的优缺点,第一,运用等距抽样的前提是要有总体每个单位的有关材料,特别是按有关标志排队时,往往需要有较为详细、具体的相关资料。第二,等距抽样的效率取决于对总
10、体进行排列时所使用的标志值。在等距抽样中,调研人员假设总体是有序的。,2024/1/28,23,三、分层抽样,(一)分层抽样的具体步骤(二)分层抽样的方法(三)分层指标的选择(四)分层抽样的优缺点(五)分层抽样适用的范围,2024/1/28,24,(一)分层抽样的具体步骤,第一步,辨明突出的(重要的)人口统计特征和分类特征,这些特征与所研究的行为相关。第二步,确定在每个层次上总体的比例。,2024/1/28,25,(二)分层抽样的方法,例如,我们要在一个有1000名职工的企业中抽取100名职工。我们以工作岗位为分层指标,主要分为管理人员、一线工人和后勤工人三类,已知的情况是管理人员占职工总数的
11、10%、一线工人占60%、后勤工人占30%,从而确定了各类人员的样本数为管理人员10名、一线工人60名、后勤工人30名。然后,用简单随机抽样的方法对各类人员进行抽样。,2024/1/28,26,(三)分层指标的选择,例如,我国国内一般大规模的民意调查都是以居住地分层的,至少分为城镇和乡村两层。因为城、乡居民的观念、行为和习惯等是很不相同的。中央人民广播电台1992年的全国抽样调查是多级分层的,第一级的分层是按经济发展水平将全国467个地区分成四层:“经济发达地区”、“经济一般发达地区”、“不发达地区”和“贫困地区”,因为根据以往的研究,人们的广播接触行为是与地区的经济发展水平和个人的经济地位相
12、关的。,2024/1/28,27,(四)分层抽样的优点,分层抽样比简单随机抽样和等距抽样等方法更为精确,能够通过对较少的抽样单位的调查,得到比较准确的推断结果,特别是当总体较大、内部结构复杂时,分层抽样常能取得令人满意的效果。同时,分层抽样在对总体推断的同时,还能获得对每层的推断。,2024/1/28,28,分层抽样的缺点:,首先是层的划分,有时在实际工作中分层并不容易,需要收集必要的资料,从而耗费额外的费用。另外,分层抽样要求各层的大小都是已知的,当它们不能精确得知时,就需要通过别的手段进行估计,这不仅增加了抽样设计的复杂性,而且也会带进新的误差。,2024/1/28,29,(四)分层抽样适
13、用的范围,2024/1/28,30,四、整群抽样法,(一)整群抽样法的具体操作(二)采用整群抽样的原因(三)整群抽样需注意的几个问题,2024/1/28,31,(一)整群抽样法的具体操作,假如我们要进行北京市居民家用电器的拥有状况调查,采用整群抽样方法,那么,我们在北京市3,600个居民委员会中随机抽取20个居委会,这20个居委会中的所有户都成为我们的调查样本。,2024/1/28,32,(二)采用整群抽样的原因,原因一:当缺少基本单位的名单而难以直接从总体中抽取所要调查的基本单位。原因二:即使容易获得个体的抽样框,但从费用上考虑,直接从个体抽样获得的样本可能比较分散。原因三:采用整群抽样是抽
14、样调查本身目的的需要。原因四:如果某些总体的各个子总体之间的差异不大。,2024/1/28,33,(三)整群抽样需注意的几个问题,第一,整群抽样的随机性体现在群与群之间不重叠,总体的任何一个基本单位都必须且只能归于某一群,群的抽选按概率确定。第二,如果把每一个群看成一个单位,那么,整群抽样就是以群为单位的纯随机抽样。第三,整群抽样对于群而言是非全面调查,对于被抽中群内基本单位而言则是全面调查,是“先部分,后全部”的抽样组织形式,与分层抽样正好相反。第四,整群抽样也是多阶段抽样的前提和基础。,2024/1/28,34,五、多阶段抽样,(一)多阶段抽样的特点第一,多阶段抽样对基本调查单位的抽选不是
15、一步到位的,至少要两步。第二,组织调查比较方便,尤其对于那些基本单位数多且分散的总体,由于编制抽样框较为困难或难以直接抽取所需样本,就可以利用地理区域或行政系统进行多阶段抽样。第三,多阶段抽样是多种抽样方法的结合物。(二)二级抽样和分层抽样、整群抽样的比较,2024/1/28,35,(二)二级抽样和分层抽样、整群抽样的比较,2024/1/28,36,第三节 非概率抽样,一、方便抽样法二、判断抽样法三、配额控制抽样四、雪球抽样法五、非概率抽样的优缺点,2024/1/28,37,一、方便抽样法,方便抽样也称任意抽样法,是根据调查者的方便性,以无目标、随意的方式进行的抽样调查活动。例如,某公司的市场
16、营销部选择公司雇员对公司开发的新产品进行初步测试。,2024/1/28,38,二、判断抽样法,判断抽样又称目的抽样,研究人员从总体中选择那些被判断为最能代表总体的单位作样本的抽样方法。,2024/1/28,39,三、配额控制抽样,配额控制抽样是根据一定的标志对总体单位进行分层或分类后,从各层或各类中根据总体的实际情况主观地选取一定比例的调查单位的方法。所谓“配额”,是指对划分出的各种类型的总体单位都分配一定的数量样本,从而组成调查样本。,2024/1/28,40,四、雪球抽样法,以若干个具有所需特征的人为最初的调查对象,然后依靠他们提供认识的合格的调查对象,再由这些人提供第三批调查对象,依次类
17、推,样本如同滚雪球般由小变大的抽样方式叫雪球抽样。,2024/1/28,41,五、非概率抽样的优缺点,优点:(1)非概率抽样比概率抽样的费用低。非概率抽样的这一特点对那些精确性要求不高,只注重方向性的调查有相当大的吸引力,如试探性调查。(2)一般来讲,非概率抽样实施起来要比概率抽样用的时间少。(3)如果合理运用非概率抽样,也能产生极具代表性的抽样结果。缺点:(1)不能估计出抽样误差。(2)调查者不知道抽样指标代表总体指标的程度。(3)非概率抽样的结果不能用来推断总体指标。,2024/1/28,42,第四节 样本容量的确定,一、影响样本容量的因素二、样本量的确定,2024/1/28,43,一、影
18、响样本容量的因素,第一,被调查对象标志的差异程度。第二,允许误差(又称极限误差d)数值的大小。第三,调查结果的可靠程度。第四,抽样的方法。第五,抽样的组织形式。,2024/1/28,44,二、样本量的确定,放回简单随机抽样 不放回简单随机抽样,2024/1/28,45,【案例分析讨论】,中国人民银行城镇户调查抽样方案的设计 案例思考题:1、在样本城市的选择中,中国人民银行为什么分别选择省会城市、中等城市和小城市?而且还数量不等?2、本项目的调查总体是什么?大城市量储户样本量700人,中等城市储户样本量600人,小城市储户样本量400人,如何才能提高这些样本量的质量?3、如何完善1988年以来已有的抽样框?,2024/1/28,46,
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1