第五章市场调查数据处理.ppt
《第五章市场调查数据处理.ppt》由会员分享,可在线阅读,更多相关《第五章市场调查数据处理.ppt(110页珍藏版)》请在冰豆网上搜索。
第五章市场调查数据处理第五章市场调查数据处理第一节市场调查数据审核第二节市场调查资料整理教学目标知识目标:
理解市场调查资料审核、整理的意义、内容和方法;掌握市场调查数据的排序、分类汇总、分组分析、集中与离中趋势分析以及用Excel制作统计图的方法和技术。
能力目标:
能够根据基层企事单位管理和决策要求,对市场调查数据进行基本整理和分析。
调查能否出成果和成果质量高低,很大程度取决于这个阶段的工作。
第一节市场调查数据审核一、市场调查资料审核的意义和步骤市场调查资料审核是对调查获取的各种资料(原始资料和次级资料)进行审查和核实。
它对于获取有效信息,提高市场调查质量,具体极其重要的意义。
(一)意义1、有利于克服逻辑、登记和计算等方面的错误,保证信息的一致性、客观性和有效性;2、有利于提高工作效率,避免重复劳动;3、有利于提高信息资料的质量。
(二)步骤1)对原始资料进行审核、订正。
2)编码。
3)数据的录入。
4)数据的清洁。
5)统计预处理。
6)分组与汇总。
补充:
补充:
调查问卷的回收与审核调查问卷的回收与审核
(一)调查问卷的回收
(一)调查问卷的回收1)与资料收集工作相配合,掌握每天完成的问卷数和接收的问卷数。
2)在完成的问卷后面记录下问卷完成的日期和接收的日期,以便有必要时在分析过程中对先接收的资料和后接收的资料作比较。
3)多个项目同时实施时,必须清楚地记录下交付实施的项目数、仍在实施的项目数、已经完成并返回的项目数。
4)每一份返回的问卷都要记录一个唯一的、有顺序的识别号码,作为原始的文件。
5)在进行资料的核对、事后的编码、资料的录入等工作时,必须按识别的号码,准确地记录清楚是谁拿着哪些原始文件(返回的问卷)。
6)要让所有参与资料整理工作的人员都知道,他们不仅负有保证工作质量的责任,还负有保证不丢失任何原始文件的责任。
(二)问卷资料处理的步骤调查问卷审核调查问卷审核调查问卷校订调查问卷校订调查问卷编码调查问卷编码调查问卷录入调查问卷录入加权处理加权处理缺失值的处理缺失值的处理变量交换变量交换数据净化数据净化统计分析统计分析任务描述任务描述某校的一个调研项目小组,在该校的万名在校大学某校的一个调研项目小组,在该校的万名在校大学生群体中,随机发放大学生消费问题调查问卷生群体中,随机发放大学生消费问题调查问卷500份,对大学生的月消费水平、支出类别及金额、份,对大学生的月消费水平、支出类别及金额、生活资金及来源、社会兼职及目的、家庭收入、自生活资金及来源、社会兼职及目的、家庭收入、自我评价等问题,进行问卷访谈。
之后,对问卷进行我评价等问题,进行问卷访谈。
之后,对问卷进行了回收。
对这些回收的问卷,这个项目小组应该怎了回收。
对这些回收的问卷,这个项目小组应该怎样处理?
样处理?
任务要点任务要点第二步第二步第三步第三步第一步第一步确认数据确认数据资料;资料;对数据进对数据进行编码和行编码和录入;录入;对数据进对数据进行初步分行初步分析析。
任务一任务一确认数据资料确认数据资料1调查问卷调查问卷的回收与的回收与登记登记2调查问卷调查问卷的审核的审核3处置有问处置有问题问卷题问卷一般事先需要专门设计登记表格,具体内容有:
一一二二三三四四调查地区调查地区及编号,及编号,调查员姓调查员姓名及编号;名及编号;调查实施调查实施的时间,的时间,问卷交付问卷交付的日期;的日期;问卷编号;问卷编号;实发问卷数、实发问卷数、上交问卷数、上交问卷数、未答或拒答未答或拒答问卷数、丢问卷数、丢失问卷数等。
失问卷数等。
一致性审核一致性审核一致性审核一致性审核及时性审核及时性审核及时性审核及时性审核准确性审核准确性审核准确性审核准确性审核完整性审核完整性审核完整性审核完整性审核二、调查问卷的审核二、调查问卷的审核二、调查数据审核的内容三、市场调查资料审核的方法调查资料审查方法主要有经验判断、逻辑检查和计算核对等方法。
(一)经验判断
(二)逻辑检查(三)计算核对(11)经验判断)经验判断即根据已有经验,判断数据的真实、准确。
例如,如果被调查者的年龄填为141岁,根据经验判断,年龄填写肯定有误。
又如,某小杂货店营业面积500平方米,根据经验,一个小杂货店这样的营业面积肯定与事实不符。
2.审核的主要方法(22)逻辑检查)逻辑检查即根据调查项目之间的内在联系和实际情况,对数据进行逻辑判断,看是否有不合情理或前后矛盾的情况。
例如,某被调查者的年龄填写13岁,而婚姻状况却填“已婚”,其中必有一项是错误的。
又如某消费者前面说“不知道”某调味品,后面却说“每天都在使用”,显然前后矛盾。
(33)计算审核)计算审核它是对数据资料的计算技术和有关指标之间的相互关系进行审查,主要审查各数字在计算方法和计算结果上有无错误。
ll)实地审核)实地审核又称初步审核、现场审核,一般包括调查员审核和督导审核。
22)中心办公室审核)中心办公室审核这一阶段的审核工作应在资料搜集工作全部结束后立即开始。
3.审核的阶段11)收核查问卷(又称一审)收核查问卷(又称一审)
(1)查实此人是否真正接受了调查。
(2)查实受访者是否符合过滤条件。
(3)查实调查是否按规定的方式进行的。
(4)查实问卷回答内容是否完整。
(5)核查其他方面的问题。
4.审核的基本步骤2)编辑检查(又称二审)
(1)访员是否没问某些问题,或者没有记录某些问题的答案。
(2)访员是否遵循了规定的跳问路线。
(3)开放式问题的答案是否真实合理。
市场调查资料审核时应注意的问题
(一)审核要边调查边进行为了防止因调查结束后审核而造成发现问题全部返工的局面,应将资料审核工作贯穿整个调查过程,做到边调查边审核。
(二)审核要以准确性为重点准确性是信息资料的生命线,是调查质量的体现,也是资料审核的重点。
(三)审核要贯穿调查工作始终资料审核必须伴随着调查的每个步骤。
其中,主要是调查项目的登记、各调查单位资料的汇总上报和调查资料的全面汇总。
调查登记人员负责调查项目信息的审核,各调查单位调查负责人负责本单位资料的全面审核,调查工作中心办公室负责全面调查资料的审核。
四、处置有问题问卷、处置有问题问卷返回现场重新调查返回现场重新调查返回现场重新调查返回现场重新调查视为缺失数据视为缺失数据视为缺失数据视为缺失数据放弃不用放弃不用放弃不用放弃不用缺失数据的处理对于缺省数据,常用的处理方法是填充法。
具体有以下几种形式:
1.均值法。
指用样本中对某回答项目的相关数据计算平均值得到的数据填充缺省值。
2.均值加上随机项。
此随机项从残差的分布中获的。
3.从回归模型中得到预测值作为缺省值。
4.从回归模型中得到预测值加上随机项作为缺省值。
此外,对于少量确实无法通过填充法进行缺省数据处理的项目,则可以采用剔除法,即将缺省的数据信息剔除掉。
编码编码编码、录入数据员编码、录入数据员录入数据录入数据任务二任务二编码、录入数据员编码、录入数据员问卷的代码问卷的代码编码设计编码设计变量的定义变量的定义任务二任务二编码、录入数据员编码、录入数据员编码设计的分类编码设计的分类后设计编码后设计编码前设计编码前设计编码数字型数字型开放题开放题结构式问结构式问卷中的封卷中的封闭题闭题任务二任务二编码、录入数据员编码、录入数据员一是阅读所有问卷对一是阅读所有问卷对该问题的回答;该问题的回答;另一种方法是抽取部另一种方法是抽取部分问卷。
分问卷。
技术要点技术要点方法方法后设计编码后设计编码让所有的编码员都在同一地点,让所有的编码员都在同一地点,使用同一编码本进行工作。
使用同一编码本进行工作。
提供编码员一份提供编码员一份空白的空白的“参照问卷参照问卷”。
提供编码指南,说明提供编码指南,说明什么时候以及怎样设立一什么时候以及怎样设立一个新的代码或合并答案。
个新的代码或合并答案。
设立较多、较窄的类别要优于设立较多、较窄的类别要优于设立较少、较宽的类别。
设立较少、较宽的类别。
提供每一个需要事提供每一个需要事后编码的项目一份编码后编码的项目一份编码表或编码名单。
表或编码名单。
对每一个项目做一份编码本,对每一个项目做一份编码本,内含一页或几张单页。
内含一页或几张单页。
技术要点技术要点保持编码册的整洁和清晰。
保持编码册的整洁和清晰。
(二)编码的形式
(二)编码的形式1.1.编码设计的内容编码设计的内容1、编码表1)问卷的代码、变量的定义(名称、类型、所占字节、对应问题等)2)取值的定义(范围、对应含义等)将这些内容列成表格形式,称为编码表编码表2.事前编码11)请问您家有没有电脑?
)请问您家有没有电脑?
有有没有没有22)请问您家的电脑是什么牌子?
)请问您家的电脑是什么牌子?
联想联想康柏康柏IBMIBM同创同创HPHP其他(请注明)其他(请注明)33)请问您家的电脑买多久了?
)请问您家的电脑买多久了?
最近半年最近半年一年一年二年二年三年以上三年以上3.事后编码3、事后编码事后编码事后编码指的是研究者在调查已经实施,、问题已经作答之后,给予每一个变量和可能答案一个数字代码或符号。
通常需要事后编码的有:
通常需要事后编码的有:
1)封闭式问答题的“其他”项2)开放式问答题3)无结构问卷(三)编码的基本方法(三)编码的基本方法1.1.封闭题的编码设计封闭题的编码设计1)对单选题只需规定一个变量,取值为选项号)对单选题只需规定一个变量,取值为选项号例如:
例如:
Q18Q18请问您最近一年内买过请问您最近一年内买过mp3mp3吗?
吗?
()()1.1.买过买过2.2.没买过没买过变量名变量名-V18-V18,属于数字型变量,变量所占字节数,属于数字型变量,变量所占字节数为为1,1,变量取值范围为变量取值范围为1,21,2或或99,其中,其中11表示买过,表示买过,22表示没买过,表示没买过,99表示该题无回答。
表示该题无回答。
2)对多选题需规定多个变量对变量与取值的定义一般有两种做法:
一种方法是将各个可能回答的答案选项都设为一个0-1指示变量,如被调查者选择了该答案,此变量的值为1,否则为0。
Q17Q17请问您随身带的请问您随身带的mp3mp3主要来源是主要来源是什么?
什么?
()()1.1.自己购买自己购买2.2.别人送的别人送的3.3.向朋友同事亲戚借向朋友同事亲戚借4.4.其他其他另一种做法是-将变量定义为所选题号,变量值为选项号,变量排列顺序即为选择答案的顺序。
3)排序题的编码设计第一种方法:
第一种方法:
变量个数即选项个数,按照选项排列顺序,分别定义各变量为对应选项所排次序号,取值即为次序号。
例如:
例如:
Q12Q12请您根据信任程度由大到小请您根据信任程度由大到小对下列广告排序(按重要程度排序对下列广告排序(按重要程度排序)1.1.电视广告电视广告2.2.报纸广告报纸广告3.3.广播广告广播广告4.4.杂志广告杂志广告5.5.路牌广告路牌广告另一种方法:
变量个数即要求排序项数,依照次序号排列顺序,分别定义各变量为各次字号对应的选项项数,取值即为选项号。
Q12Q12请问下列广告中,您最信任哪个广请问下列广告中,您最信任哪个广告?
告?
()()其次呢?
其次呢?
()()再次呢?
再次呢?
()()1.1.电视广告电视广告2.2.报纸广告报纸广告3.3.广播广告广播广告4.4.杂志广告杂志广告5.5.路牌广告路牌广告4)数字型开放题的编码设计对直接回答数字的问题,变量取值即为该数对直接回答数字的问题,变量取值即为该数字。
字。
例如,直接询问被调查者的年龄,设计编码时取变量名为NL,所占字节为2(因为调查对象要求在20-60岁之间),小数点位为0,变量取值即为年龄,单位为“岁”,取值范围为20-60或99(99表示该题缺失)。
问卷编号001-50011被访问对象性别:
被访问对象性别:
男男女女22请问您的年龄是:
请问您的年龄是:
周岁周岁33请问您的最高学历是:
请问您的最高学历是:
小学及小学以下小学及小学以下初中初中高中(含中专)高中(含中专)大学专科大学专科大学本科大学本科