ImageVerifierCode 换一换
格式:DOCX , 页数:27 ,大小:145.27KB ,
资源ID:7779914      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/7779914.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(第十十二章调研样本设计.docx)为本站会员(b****5)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

第十十二章调研样本设计.docx

1、第十十二章调研样本设计第十一、十二章 调研样本设计一、样本和抽样的基本概念(一)调查总体与抽样总体 从市场调查的范围来看,将所有调查研究的对象的全体称为调查总体(简称总体),有时也可称为全域。定义总体要明确这样几件事:总体的范围、性质和构成。抽样总体是由抽样调查时被抽取的调查对象所构成的集合(简称样体)。(二)总体单位和样本单位总体单位就是构成总体的每一个单位。样本单位就是抽样调查时被抽中的总体单位,也叫抽样单位。一定数量的样本单位所组成的集合又称为样本。样本单位的多寡又称样本容量的大小,即所谓的大、小样本。(三)总体指标与样本指标根据总体各个单位标志值计算出来的综合指标成为总体指标,用“X”

2、表示。根据样本中各样本单位标志值计算出来的综合指标称为抽样指标,用“x”表示。指标经常使用的主要有两种,一种为平均数,另一种为成数。成数一般用P(总体指标)或p(样本指标)来表示。1总体指标(1)总体平均数。总体平均数是调研总体所研究标志的平均值,有简单式和加权式两种计算方法,其计算公式为:简单式: (公式3-1)式中:为总体单位标志值,为总体单位数目。加权式: (公式3-2)式中:为各组标志值,为各组总体单位数目,为组数。(2)总体成数。总体成数是指一个现象有两种表现时,其中具有某种标志的个体数在总体中所占的的比重。总体成数计算公式为: (公式3-3)式中:为总体单位数目,(或)为成数,、分

3、别为两种表现的总体单位数。并且+=,+=1。(3)总体方差和均方差。总体方差和均方差是用来说明总体指标变异程度的指标,是理解和应用抽样调查时很重要的基础指标。方差与均方差的关系是平方和开平方的关系,可分别计算平均数和成数的方差和标准差。总体平均数方差和均方差的计算公式的简单式为:简单式: (公式3-4)(公式3-5)加权式: (公式3-6) (公式3-7)总体成数方差与均方差的计算公式为:=(-) (公式3-8)= (公式3-9)式中:、分别为方差、均方差,其他符号含义同前。2抽样指标常用的抽样指标有抽样平均数、抽样成数、抽样方差和均方差,其计算方法与调研总体综合指标计算方法相同,只是计算公式

4、中所采用的符号有所不同。市场调研中,一般用抽样平均数、抽样成数、抽样方差和均方差来推断总体平均数、总体成数、总体方差和均方差。(四)抽样框及抽样框的选择抽样框就是所有总体单位的集合,是总体的数据目录或全部总体单位的名单。最理想的抽样框起码具有下面的一些特点:1.包含尽可能多的样本单位,即尽可能地将所有样本单位都包括在这个集合之中。2.所有样本单位出现在这一集合中的概率相等,即在这一抽样框中每个样本单位出现的机会相同,从而保证每个样本单位被抽中的机会相同。(五)调查误差和抽样误差调查误差是指调查的结果和客观实际情况之间的偏离,一般以工作性误差和代表性误差两种形式存在。工作性误差,是在市场调查工作

5、过程中,由于调查方案有缺陷、调查方法不科学、调查人员不诚实或者由于抄写、记录、登记、计算等工作上的失误而导致的误差。这种误差是能够通过采取一定措施来避免的。代表性误差是指用样本代表总体、推断总体时产生的误差。代表性误差只在非全面调查中存在,具体又分为系统性偏差和抽样误差两种。系统性偏差是由于调查者违背抽样的随机原则,人为地选择偏高或偏低单位进行调查而产生的误差,它是调查者通过努力可以力求避免的;抽样误差则是在不违背随机原则的情况下,必然出现的误差,它是抽样调查固有的代表性误差。抽样误差的大小,主要受以下三个因素的影响:1被研究总体各单位标志值的差异程度。2抽取的调查个体数目。3抽样调查的组织形

6、式。二、抽样调查的特点及程序(一)抽样调查的特点抽样调查主要有如下几方面的特点:1费用低、易推广。2质量高,可信度好。3时间短,收效快。(二)抽样调查的适用情况1用于认识那些不能或难以采用全面调查的总体的数量特征。2用于认识不适宜进行全面调查,但又必须了解总体数量特征的事物。3用于认识不必进行全面调查的总体。4用于搜集灵敏度高、时效性强或时间要求紧迫的信息资料。5在核对和补充普查准确性时采用抽样调查。此外,抽样调查和推断还可以用来对总体特征的某种假设进行检验,并判断这种假设的真伪,决定方案的取舍,为行动决策提供依据。(三)抽样调查程序1界定调查总体及样本单位一般来说,调查总体可以从以下几方面进

7、行描述:地域特征、人口统计学的特征、产品或服务使用情况、对产品或服务的认知程度等。样本单位是抽样的基本单位,有时是个人,有时是家庭,有时是公司等,我们明确了同质总体的特征,在市场调查的操作过程中还要选择合格的样本单位。另外,被访者获得商品或服务信息的渠道也是调研人员应该考虑的因素。2选择资料收集方法在进行抽样设计时,要反复比较不同的资料收集之方式、争取做出最好的选择。3选择抽样框在实践中,抽样框可以是由一定的顺序的名单的形式,也可能是以一定的逻辑关系形成的顺序表。调研实践中,有时较易于得到的抽样框包括了部分非总体单位,调研人员仍然可以使用它,但是需要注意对样体按照确定的总体单位特征再进行过滤。

8、4选择抽样方法抽样方法的选择取决于调查研究的目的、调查问题的性质以及调研经费和允许花费的时间等客观条件。抽样方法可以分为两大类:随机抽样和非随机抽样(也称概率抽样和非概率抽样)。随机抽样方法是对总体中每一个总体单位都给予平等的抽取机会的抽样技术。随机抽样方法的优劣表现在: 优点: (1)因其排除了人为的干扰,抽取的样本可以大致上代表总体。 (2)能够计算调查结果的可靠程度。可通过概率推算抽样误差(又称代表性误差),并将误差控制在一定范围内。 缺点: (1)对所有调查样本都给予平等看待,难以体现重点。 (2)抽样范围比较广,所需时间长,参加调查的人员和费用多。 (3)需要具有一定专业技术的专业人

9、员进行抽样和资料分析。一般调查人员难以胜任。非随机抽样方法是指在抽样时,按照一定的主观标准来抽取样本的抽样技术。非随机抽样方法的优劣表现在: 优点: (1)可以充分利用已知资料,选择较为典型的样本,使样本更好地代表总体; (2)可以缩小抽样范围,节约调查时间、调查人员和调查费用。(3)操作方便,易于实施,统计上也远较随机抽样简单。 缺点: (1)无法判断其误差,检查调查结果的准确性。(2) 有目的的非随机抽样可能会导致系统的排除或过分强调研究对象的个性特征,评估非随机抽样的总体质量有很大的困难。在进行实际市场调研时,调研人员要根据不同的调研要求和目的,选择最合适的抽样技术,才能起到良好的效果。

10、在选择抽样方法时,需要考虑的因素可以有以下几个方面:(1)如果调研人员在最后使用各种统计学的方法分析与处理调研数据,确定调研单位的方法必须是随机抽样,以保证调研数据对总体具有足够的代表性。(2)如果市场调研在方案设计中就明确规定最终必须获得具有一定准确性和把握性的调研结果,那么在确定调研单位时,就应该选择随机抽样的方式。(3)如果市场调研存在一个近乎理想的抽样框,就可以选择随机抽样的抽样方法。(4)在调研人员没有掌握随机抽样的程序、原理和原则的情况下,或者由于调研的时效性要求越来越高,调研的频度也越来越大,研究人员也常采用非随机抽样的方法。5确定样本容量样本容量确定的原则是控制在必要的最低限度

11、,但要能够尽可能准确和有效地推断总体特征,获得调研信息。6制定抽取样本的操作程序对于随机抽样,这一程序显得尤为重要,否则,随机抽样的随机性将得不到保障,调查结果将变得不可信。例如,对某城市进行电视收视率调查,其总体单位为住户。如果已有城市的街道名单,并且依照随机数码表确定在某条街道抽取5户进行调查,则可以进一步制定一个具体入户调查抽样操作程序。入户调查抽样操作程序为:到达街道找到门牌号为1号的第一个住户。按照门牌编号顺序抽取样本户。从第一户开始(第一户不作为样本户),每隔20户确定一个样本户。如果一个门牌号为多户,可继续沿“附”号顺序抽样。如果该多户门牌号内未编“附”号,可按如下原则、顺序抽取

12、:进入多户门牌号院内,按右手方向为先的原则数户;如果遇到楼房可按其所编的栋、单元及门牌号数户;如果楼房也未编号,可按右手为先的原则逐栋、逐户数户。对抽取的住户记下门牌号或具体位置(对于多户门牌号内抽取的样本户应画一示意图)。按上述方法抽取样本户直至抽足5户为止。如果上述方法数到街道最后一户时仍不足5户,可将开始时的第一户放入数户抽样顺序编号中继续数户抽样。如果这时正好抽到第一户,则放弃第一户,并将抽样间隔调整为12户或者其他与“20”不重复的频率间隔。对于上述方法抽中的住户应排除一切困难进行调查,如果因该户无电视或长期不居住在此地等其他无法调查的原因需要排除,应报调查项目负责人批准后方可排除并

13、重新按上述方法抽样。在实施适宜操作的抽样计划前,应先对其进行充分的讨论研究。在调查现场,要完全熟悉抽样背景、抽样区域,然后再进行抽样。遇到特殊情况不能拿定主意时要多问,还要把抽取样本的详细情况清楚地记录下来,保证调查能够找到、联系到。三、随机抽样方法及其应用(一)简单随机抽样方法及其应用 简单随机抽样的优点是方法简单,并且保证每个总体单位在抽选时都有相等的被抽中机会。当进行相对较小的总体的调研时,这一抽样技术非常有效。但是简单随机抽样的局限也很明显:该法需以一个完整的总体单位表为依据,但是在现实中编制这样一个完整的总体单位表往往是极其困难的;这一方法要求事先对所有研究对象编码,当研究对象较多时

14、,这一工作非常复杂,也不易做到;这一方法的精度往往较低,标准差较大;该法抽出的样本是否能代表目标总体,值得商权,当样本较小时尤其如此。(二)系统抽样方法及其应用系统抽样也称等距随机抽样,它是先将调研总体的各个体按一定标志排列起来,然后按照一定顺序和一定间隔来抽取样本个体。其应用程序为:1先按一定标志把总体中的个体顺序排列。排列所依的标志有两种:一种是按与调查项目无关的标志排队。另一种是按与调查项目有关的标志排列。2确定一个抽样间隔,并在此间隔基础上选择样本单位。计算公式为:抽样间隔总体单位数(N)/样本单位数(n) 3确定起始抽号数,即抽样起点。4按抽样间隔继续抽取余下的个体,直至抽够为止。系

15、统抽样与简单随机抽样相比更为简便,耗时更少,更为经济。该法可使中选的个体比较均匀地分布在调研总体中。系统抽样也有一定的局限性,主要表现在:运用系统抽样的前提是要具有调研总体每个个体的有关资料,这是一种细致而又繁琐的工作。可能会出现系统误差。(三)分层抽样方法及其应用分层抽样方法将总体各单位先按照与我们关心的对象特征标识相关的标志进行分组(层),然后在各组(层)中采用简单随机抽样或系统抽样方式,确定所要抽取的单位。分层抽样实质上是科学分组和抽样原理的结合。1等比例分层抽样等比例分层抽样是按各层(或各类型)中的个体数量占总体数量的比例分配各层的样本数量。用公式表示为: 或 式中:为样本量;为总体单

16、位数;为各组(层)单位数。例如,某地共有居民N为20000户,按收入高低进行分类,其中,高收入居民N1为4000户,中等收入居民N2为12000户,低收入居民N3为4000户。从中抽选200户进行购买力调查,则各类型应抽取的样本个数为:高收入样本数目为40002000020040(户)中等收入样本数目为1200020000200120(户)低收入样本数目为40002000020040(户)这种方法简单易行,分配合理,计算方便,适应各类型之间差异不大的分类抽样调查。如果各类之间差异过大,则不宜采用,而应采用非等比例分层抽样。2非等比例分层抽样非等比例分层抽样不是按各层中个体数占总体数的比例分配样

17、本个体,而是根据其他因素,如各层平均数或成数均方差的大小,抽取样本的工作量和费用大小等,调整各层的样本个体数。这种分配方法大多适用于各类总体的个体数相差悬殊或均方差相差较大的情形。如果按分层均方差的大小调整各层样本个体数(称分层最佳抽样),其任意一层抽取的样本量的计算公式为:式中:为任意一层的标准差;Ni 为任意一层的单位数。分层抽样的应用程序为:第一,找出突出的(重要的)与所研究的行为相关的人口统计特征和分类特征。第二,按照所选定的特征把总体各单位分成两个或两个以上的相互独立的完全的层(组)。第三,在每个层(组)中进行简单随机抽样。第四,各层(组)中抽出的子样本共同构成调查样本。 分层抽样的

18、优点是:能够通过对较少的抽样单位的调查,得到比较准确的推断结果;分层抽样在对总体进行推断的同时,还能获得对每层的推断。 分层抽样也会存在某些技术问题:有时在实际工作中层的划分并不容易,需要收集必要的资料,从面耗费额外的费用;分层抽样要求各层的大小都是已知的,当它们不能精确得知时,就需要通过别的手段进行估计,这不仅增加了抽样设计的复杂性,而且也会带来新的误差。 分层抽样作为一种精度最高的常用抽样技术,特别适用在以下场合: (1)调查中不仅需要对总体的参数进行估计,也需要对各层的参数进行估计,并且考虑它们的精度。 (2)要保证样本更具代表性。 (3)为使调查的组织及数据的汇总都比较方便。 (四)整

19、群抽样方法及其应用整群抽样技术也叫分群抽样技术,它是在当总体的所在基本单位自然组合为或被划分为若干个群后,从中随机抽取部分群并对抽中群内全部或部分单位进行调查的一种抽样组合方法。在整群抽样中,目标总体被分成相互排斥且无个体遗漏的部分或群,样本是随机地从随机抽取的某个群或几个群中获得的。对每个被选的群而言,要么所有的个体都包括在样本中,要么依概率抽取个体。如果所选群中的个体都包括在样本中,这种抽样称为一步整群抽样。如果个体是从各个选中的群中再依据随机抽样抽取,这种抽样称为二步整群抽样。整群抽样的应用程序为:1将同质总体分为多个相互独立的完整的较小子集;2随机抽选子集构成样本。 整群抽样和其他抽样

20、方式相比,在抽样单位数目相同的条件下抽样误差较大,代表性较低。 在大规模的市场调研中,当群体内各个体间的差异较大,而各群之间差异较小时,最适合采用分群抽样方式。 整群抽样的实际应用比较广泛,除抽样框容易获得之外,还有以下几方面的原因: 1当缺少基本单位的名单而难以直接从总体中抽取所要调查的基本单位,但以由基本单位组成的群体(即组合单位)作为抽样单位却有现成的名单或有明显的空间界限时,整群抽样就显得方便实用,避免了编制抽样框的问题。 2按整群抽样,由于样本相对集中,既方便调查,也节省费用。 3有些抽样调查,只有进行整群抽样才能说明问题。 4在总体的各个子总体之间的差异不大时,采用整群抽样的精度不

21、比直接从总体中抽取样本的精度低。 整群抽样虽然和分层抽样一样都要将总体分为相互独立的、完整的子集,但是他们两者之间有着根本区别:1分层抽样的样本是从每个子集中抽取的,而整群抽样只是对部分子集进行抽取;2分层抽样是按照与调查所关心的总体特征相关的标志对总体进行分层(组),而整群抽样往往是按照总体单位自然形成的分组特征进行分群的;3整群抽样要求由总体基本单位所形成的各个群,尽量有相同或相近的群内结构。这与分层抽样的“层内差异尽量小,层间差异尽量大”的要求形成了鲜明的对比。四、非随机抽样方法及其应用 在实际市场调查中,采用非随机抽样通常是出于以下几种原因:受客观条件限制,无法进行严格的随机抽样;为了

22、快速获得调查结果;调查对象不确定或无法确定;总体各单位间离散程度不大,且调查员具有丰富的调查经验。(一)便利抽样 便利抽样又称方便抽样、偶遇抽样,是根据调查者的方便与否来抽取样本的一种抽样方法。便利抽样优点在于:简便易行;容易获得调研对象的合作,访问成功率较高;访问的进度更容易控制,能及时取得所需的信息资料;省时、省力,访问成本也就相应较低;可以简化调查控制环节。便利抽样的缺点:不能推断总体,而且代表性差,偶然性强。便利抽样一般用于非正式的探索性调查,只有在调查总体各单位之间差异不大时,抽取的样本才有较高的代表性。如果作为一次调查的全部,这种方法不可取。 便利抽样并不意味着对受访对象丝毫不加控

23、制,相反,便利抽样更需要使用身份甄别,即确定某一受访者是否符合调查要求。 (二)判断抽样 判断抽样也称为目的抽样,是一种凭借研究人员的主观意愿、经验和知识,从总体中选择具有典型代表性的样本作为调查对象的抽样方法。应用这种抽样方法的前提是研究者必须对总体的有关特征有相当程度的了解。 判断抽样选取样本单位一般有两种具体做法:1选择最能代表普遍情况的调查对象,常以“平均型”或“多数型”为标准。所谓“平均型”是在调查总体中具有代表性的平均水平的单位,以此作为典型样本,去推断总体;所谓“多数型”是在调查总体中占多数的单位,即以占多数的单位样本,去推断总体。2利用调查总体的全面统计资料,按照一定的标准,主

24、观选取样本。 判断抽样法具有成本较低、方便快捷的优点。但是,由于判断抽样法的主观性较强,其抽样的质量完全取决于调研人员的判断力、专业知识水平及创造力。(三)配额抽样配额抽样是首先将总体中的所有单位按一定的标志分为若干层(组),然后在每个层(组)中按一定比例用便利抽样或判断抽样的方法选取样本单位。所谓配额,就是指对划分出来的各种类型的子总体分配一定数量的样本,从而组成调查样本。采用配额抽样,事先要对总体中所有单位按其属性、特征分为若干类型,这些属性、特征称为“控制特征”。至于如何确定“控制特征”,要靠调研设计人员主观判断。一般来说,配额分配应该使具有这些控制特征的个体在总体中所占的比例趋于一致。

25、配额抽样与分层抽样之间存在重要区别:第一,配额抽样的被访问者不是按照随机原则抽出来的,而分层抽样必须遵守随即原则;第二,在分层抽样中,用于分类的标志应该联系研究目标来选择,而配额抽样没有这样的要求。配额抽样将对受访者的限制由访问员的主观确定转化为调研设计人员的规定,从而有效地保证样本的代表性。 1独立控制配额抽样 独立控制配额抽样是根据调查总体的不同特性,对具有某个特性的调查样本分别规定单独分配数额,而不规定必须同时具有两种或两种以上特性的样本数额。独立控制配额抽样中,调查员有比较大的自由去选择总体中的样本。 现举例说明如下。某市进行空调器消费需求调查,确定样本量200名,选择消费者收入、年龄

26、、性别三个标准分类。独立控制配额抽样,其各个标准样本配额比例及配额数,如表所示。表 独立控制配额抽样分布表月收入人数年龄人数性别人数800元以下8002000元20003500元3500元以上2050706030岁以下3040岁4050岁50岁以上40607030男女100100合计200合计200合计200这种方法的优点是简单易行,调查员选择余地较大。缺点是调查员可能图一时方便,选择样本过于偏向某一组别,从而影响了样本的代表性。 2交叉控制配额抽样 交叉控制配额抽样是对调查对象的各个特性的样本数额交叉分配,上例中如果采用交叉控制配额抽样,就必须对收入、年龄、性别这三项特性同时规定样本分配数,

27、如表所示。表 交叉控制配额抽样分布表800元以下8002000元20003500元3500元以上合计男女男女男女男女30岁以下3040岁4050岁50岁以上2332233252032564571012871673612546113440607030合计1010302037333624200可以看出,交叉控制配额抽样由于各个特性都同时得到了控制,从而克服了独立控制配额抽样的缺点,提高了样本的代表性。 配额抽样的目的是以相对较低的成本来获取有代表性的样本,其优点是成本低,且调研人员可对每一配额较方便地选择个体。其缺点是选择偏见问题严重,也不能对抽样误差进行估计。 (四)滚雪球抽样 滚雪球抽样也称推

28、荐抽样,是一种在稀疏总体中寻找受访者的抽样方法。所谓稀疏总体,是指总体单位数不多并且分布非常分散的总体。 滚雪球抽样的做法是先设法找到一名符合条件的受访者,在对其进行访问后,再请其推荐或介绍其他符合条件的人。访问员根据这种介绍寻找到其他满足条件的受访者,访问后再进一步请其推荐更多的受访者,一直到满足样本量的要求为止。 滚雪球抽样的主要目的是估计在总体中十分稀有的人物特征。滚雪球抽样法的优点是可以大大地增加接触总体中所需群体的可能性,便于有针对性地找到被调查者,大大降低了调查费用,一般抽样变差也相对较低。其局限性是要求样本单位之间必须有一定的联系,并且愿意保持和提供这种关系。五、样本容量的确定

29、样本容量,又称样本规模,就是指样本内所包含的单位数。 (一)几个基本概念 1极限抽样误差 极限抽样误差,就是样本指标与总体指标之间抽样误差的最大可能范围。设以与分别表示平均数和成数的极限抽样误差,则,=和分别表示样本的平均数和成数,和分别表示总体的平均数和成数。也就是说,样本平均数和成数在总体平均数和成数的周围变动,变动的范围为:平均数 -+成数 2概率度 极限抽样误差的实际应用,是对总体平均数和成数落在样本平均数及成数的范围之内的可信程度作出测定,其范围可表示如下:-+-+ 在统计学上,抽样误差范围常常需要用平均数的抽样平均误差或成数的抽样平均误差为单位来加以衡量。所谓概率度,就是极限抽样误差与抽样平均误差的比值,即相对误差,一般用符号来表示。用平均数表示:用成数表示: 3置信区间与置信度 数理统计证明,只要样本规模足够大 (n50),样本平均数和样本成数的分布状况,都接近于以总体平均数或成数为中心的正态分布,如图3-1所示。图3-1 正态分布图 以样本指标对总体指标进行统计推断的公式:总体平均数: = 总体成数: = 上述公式所定义的区间称为置信区间,即在一定的概率保证程度下总体指标的

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1