数据整理分析报告.docx
《数据整理分析报告.docx》由会员分享,可在线阅读,更多相关《数据整理分析报告.docx(31页珍藏版)》请在冰豆网上搜索。
数据整理分析报告
第四章
调查资料整理与分析
本章结构图
第四章调查资料整理与分析
本章要点:
本章主要介绍市场调查资料的整理与分析方法和市场调查报告的撰写。
【典案阅读】
某保险公司对影响保险户开车事故率的因素进行调查,并对各种因素进行了分析,从表-1可以看出有61%的保险户在开车过程中从未出现过事故。
驾车者的事故率表-1
百分比(%)
开车时无事故
61
开车时至少经历一次事故
39
样本数量(人)
17800
然后,在性别分析基础上分解这个信息,判断男女之间是否有差别。
这就出现了表-2
男女驾车者的事故率表-2
男(%)
女(%)
开车时无事故
56
66
开车时至少经历一次事故
44
34
样本数量(人)
93200
8480
这个表的结果令男士懊恼,因为他们的事故率高。
但人们会提出疑问而否定上述判断的正确性,即男士的事故多,是否因为他们驾驶的路程较长。
这样就引入第三个因素“驾驶距离”,见表-3
不同驾驶距离下的事故率表-3
男(%)
女(%)
驾驶距离
>1万公里
<1万公里
>1万公里
<1万公里
开车时无事故
51
73
50
73
开车时至少经历一次事故
49
27
50
27
样本数量(人)
7170
2150
2430
60
此表表明,男驾驶者的高事故率是由于他们的驾驶距离比女驾驶者的长,结果证明事故率只跟驾驶的距离成正比而与驾驶者的性别无关。
【教学内容】
第一节市场调查资料的整理
【学习目标】
知识点:
1、调查资料整理的含义、步骤与内容。
2、市场调查资料整理的基本方法。
技能点:
市场调查资料整理的基本方法。
一、资料整理的步骤和内容
资料整理是根据研究目的,运用科学的方法,对调查资料进行审核、分类或分组、汇总,使之系统化和条理化,并以集中、简明的方式反映调查对象总体情况的工作过程。
资料整理对于整个市场调查工作具有非常重要的作用:
1、它是对调查资料的全面检查。
查缺补漏,去假存真,去粗取精。
保证资料的真实。
2、它是进一步分析研究资料的基础。
对资料的分析必须借助完备的系统的资料,因此它是研究阶段的第一步。
3、它是保存资料的客观要求。
只有进行整理之后,才能使原始资料具有长期保存的价值。
(一)资料整理的步骤
1、设计和编制资料整理方案。
这是保证统计资料的整理有计划、有组织地进行的重要一步。
资料的整理往往不是整理一个或两个指标,而是整理多个有联系的指标所组成的指标体系。
2、对原始资料进行审核。
资料的审核是第一步,为了保证质量必须进行严格的审核。
3、综合汇总表的项目,对原始资料进行分组、汇总和计算是关键。
4、对整理好的资料在进行一次审核,然后编制成一个统计表,以表示社会经济现象在数量上的联系。
(二)资料审核的内容
1、资料的审核必须遵守资料整理的一般要求,着重资料的真实性、准确性、完整性。
(1)资料的真实性
调查资料来源的客观性问题,来源必须是客观的。
调查资料本身的真实性问题,要辨别出资料的真伪,把那些违背常理的、前后矛盾的资料舍去。
(2)资料的准确性。
准确的审核要着重检查那些含糊不清的、笼笼统统的以及互相矛盾的资料。
(3)资料的完整性。
第一,调查资料总体的完整性。
第二,每份调查资料的完整性。
2、审核应注意的问题
在审核中,如发现问题可以分不同的情况予以处理:
(1)对于在调查中已发现并经过认真核实后确认的错误,可以由调查者代为更正。
(2)对于资料中可疑之处或有错误与出入的地方,应进行补充调查。
(3)无法进行补充调查的应坚决剔除那些有错误的资料,以保证资料的真实准确。
二、资料整理的方法——统计分组法
(一)分组涵义
统计分组,是指根据社会调查的目的和要求,按照一定标志,将所研究的事物或现象区分为不同的类型或组的一种整理资料的方法。
(二)分组的作用
(1)可以找出总体内部各个部分之间的差异。
如产业结构划分为第一产业、第二产业、第三产业(甚至第四产业)。
不同产业包括的部门是各不相同的。
(2)可以深入了解现象总体的内部结构。
如
我国三次产业分类的从业人员构成情况单位(%)
年份
产业
1993
1994
1995
1996
1997
第一
56.4
51.3
52.2
50.0
49.9
第二
22.4
22.7
23.0
23.5
23.7
第三
21.2
23.00
24.8
26.0
26.4
合计
100.0
100.0
100.0
100.0
100.0
思考:
说明了什么结构特点
(3)可以显示社会现象之间的依存关系。
某地区粮食单位面积产量和施肥量的关系
每公顷花费施用量(千克)
粮食单位面积产量(千克/公顷)
116.25
133.50
145.50
153.75
163.50
2827.5
3124.5
3396.0
3608.3
3484.0
说明:
粮食单位面积产量和施肥量的关系。
(三)分组标志的选择
1、标志含义。
标志指反映事物属性或特征的名称。
2、正确分组必须遵守以下原则:
1)根据调查研究的目的和任务选择分组标志。
2)选择能够反映被研究对象本质的标志。
3)应从多角度选择分组标志,并不是唯一性的。
3、分组类型
1)根据分组标志的数量有:
简单分组和复合分组两类。
2)根据所使用分组标志的性质有:
品质标志分组和数量标志分组。
(四)次数分布
将我系1000名同学按照性别分组,看男性和女性各有多少?
比重多少?
如下表:
性别
人数(人)
比重(%)
男
250
32.1
女
530
67.9
合计
780
100.0
1、含义
次数分布:
是将总体中的所有单位按某个标志分组后,所形成的总体单位数在组之间的分布。
分布在各的总体单位数叫次数或频数。
各组次数与总次数之比叫做比重、比率或频率。
次数分布实质:
是反映统计总体中所有单位在各组的分布状态和分布特征的一个数列,也可以称作次数分配数列,简称分布数列。
2、变量数列的种类及计算
(1)单项变量数列
按日产量分组(件)
工人人数(人)
比重(%)
25
26
27
28
29
30
10
20
30
50
40
30
6
10
17
28
22
17
合计
180
100
(2)组距变量数列
按计划完成程度分组(%)
企业数
比重(%)
100以下
6
21.3
100—110
16
57.4
110以上
6
21.43
合计
28
100.00
请比较:
(1)两表的不同
(2)说明应用方向
(五)汇编、制表和绘图
1、汇编,指根据调查研究的目的,将资料中的各部分散的数据会聚起来,以集中形式反映调查单位的总体状况及内部数量结构的一项工作。
方法有:
手工汇总:
点线法、过录法、折叠法和卡片法。
计算机汇总。
2、制表
(1)表的结构、种类。
结构:
标题、横标目、纵标目、数字。
见表4-1
种类:
简单分组表、复合分组表。
制作方法:
制作应遵循科学、实用、简练、美观原则。
表4-1
1993年沈阳市商业企业销售总额构成
按经济类型分
销售总额
(万元)
比重
(%)
国有经济
集体经济
其它
3260367
571698
247870
79.9
14.0
6.1
合计
40799935
100.0
(2)注意以下问题:
1)标题简单明了。
2)表格形式一般是开口式。
3)如表格栏数多,应对栏数加以编号。
4)数字要填写整齐,对准数位。
5)凡需说明的文字一律写入表注。
3、绘图
(1)统计图的种类:
条形图或称柱行图(见表4-2)、圆形图(见表4-3)、曲线图(见表4-4)、象形图。
表4-2柱行图
表4-3圆形图
表4-4曲线图
(2)统计图的作用:
1)表明事物总体结构。
1)表明统计指标不同条件下的对比关系。
2)反映事物发展变化的过程和趋势。
3)说明总体单位按某一标志的分布情况。
4)显示现象之间的相互依存关系。
第二节市场调查资料的分析
【学习目标】
知识点:
1、动态分析的方法。
2、静态分析的方法。
技能点:
综合性市场调查资料分析的能力。
一、静态分析
(一)定性分析
1、定性分析的概念及原则
定性分析是与定量分析相对而言的,它是对不能量化的现象进行系统化理性认识的分析,其方法依据是科学的哲学观点、逻辑判断及推理,其结论是对事物的本质、趋势及规律的性质方面的认识。
定性分析有如下特点:
分析的对象是调查资料、分析的直接目的是要证实或证伪研究假设,对市场现象得出理论认识、分析强调纵式关系。
进行定性分析遵循以下原则:
1)坚持用正确的理论指导。
2)分析只能以调查资料为基础,并且分析出的结果必须用调查资料来验证。
3)要从调查资料的全部事实出发,不能简单地从个别事实出发。
2、常用的定性分析方法
(1)归纳分析法
归纳分析法是我们用得最广泛的一种方法,分为完全归纳法和不完全归纳法,后者又分为简单枚举法和科学归纳法。
(2)演绎分析法
在运用演绎分析法时要注意如下问题:
1)分类研究的标准要科学;
2)分类研究的角度应该是多角度、多层次的;
3)对分类研究后的资料还要运用多种逻辑方法揭示其本质,形成理性认识;
4)综合要以分类研究为基础;
5)综合要根据研究对象本身的客观性质,从内在的相互关系中把握其本质和整体特征,而不是将各个部分、方面和因素进行简单相加或形式上的堆砌。
(3)比较分析法
比较分析法是把两个或两类事物的调查资料相对比,从而确定它们之间相同点和不同点的逻辑方法。
运用比较分析法时,要注意如下问题:
以在同类对象间进行,也可以在异类对象间进行;要分析可比性;应该是多层次的;
(4)结构分析法
在市场调查的定性分析中,我们通过调查资料,分析某现象的结构及其各组成部分的功能,进而认识这一现象本质的方法,称为结构分析法。
结构分析法要着重分析以下内容:
分析结构、分析内部功能和分析外部功能
(二)定量分析
定量分析是指从事物的数量特征方面入手,运用一定的数据处理技术进行数量分析,从而挖掘出数量中所包含的事物本身的特性及规律性,从而挖掘出数量中所包含的事物本身的特性的分析方法。
定量分析可分为:
·描述性统计分析
描述性统计分析指对被调查总体所有单位的有关数据作搜集、整理和计算综合指标等加工处理,用来描述总体特征的统计分析方法。
市场调查分析中最常用的描述性统计分析,主要包括对调查数据的分组分析、集中趋势分析、离散程度分析和相对程度分析、指数分析。
·解析性统计分析方法
主要方法有:
假设检验、方差分析、相关分析
·确定性分析方法―模糊分析
1、相对程度分析
相对程度分析是统计分析的重要方法,是反映现象之间数量关系的重要手段。
它通过对比的方法反映现象之间的联系程度,表明现象的发展过程,还可以使那些利用总量指标不能直接对比的现象找到可比的基础,因而在市场调查分析中经常使用。
市场调查分析中常用的相对指标,主要有结构相对指标、比较相对指标、比例相对指标和强度相对指标等几种。
结构相对指标是总体各组部分与总体数值对比求得的比重或比率,用来表明总体内部的构成情况。
它从静态上反映总体内部构成,揭示事物的本质特征,其动态变化可以反映事物的结构发展变化趋势和规律性。
比较相对指标是指不同总体同类现象指标数值之比。
它表明同类现象在不同空间的数量对比关系,可以说明同类现象在不同地区、单位之间发展的差异程度,通常用倍数(系数)或百分数表示。
社会经济现象总体内各组成部分之间存在着一定的联系,具有一定的比例关系。
为了掌握各部分之间数量的联系程度,需要把不同部分进行对比。
比例相对指标就是同一总体内不同部分的指标数值对比得到的相对数,它表明总体内各部分的比例关系,如家计调查中的收支比例,国民经济结构中的农、轻、重比例等,通常用百分数表示,也可以用一比几或几比几的形式表示。
在市场调查中,有时要研究不同事物间的联系,如流通费与商品销售额、产值与固定资产等,这就需要通过计算强度相对指标来分析。
强度相对指标是两个性质不同而有联系的总量指标对比得到的相对数,它反映现象的强度、密度普通程度。
2、集中与离散分析
(1)数据的集中趋势分析
对调查数据公布的数量规律性中集中特征进行分析,是对被调查总体的特征进行准确描述的重要前提。
数据集中趋分析的对象,包括数据的均值(各类平均数)、中位数和众数。
均值是数据偶然性和随机性的一个特征值,反映了一些数据必然性的特点。
平均数一般包括算术平均数、调和平均数和几何平均数三种,其中算术平均数是最简单、最基本的形式,它又视资料分组与否而具有简单算术平均和加权算术平均。
利用均值,可以将处在不同地区、不同单位的某现象进行空间对比分析,以反映一般水平的变化趋势或规律;可以分析现象间的依存关系等等,从而拓宽分析的范围。
众数是总体中出现次数最多单位的标志值,也是测定数据集中趋势的一种方法,克服了平均数指标会受数据中极端值影响的缺陷。
从分析的角度看,众数反映了数据中最大多数的数据的代表值,可以使我们在实际工作中抓住事物的主要矛盾,有针对性地解决问题,但若出现了双众数现象,则可能说明调查总体不具有同质性,资料可能来源于两个不同的总体。
这类结果既可以用来检查方案设计中的总体一致性问题,也可以用来帮助验证数的数据的可靠与否。
中位数的确定可以以未分组资料为基础,也可由分组资料得到。
它同样不受到资料中少数极端值大小的影响。
在某些情况下,用中位数反映现象的一般水平比算术平均数更具有代表性,尤其对于两极分化严重的数据,更是如此。
均值,众数和中位数都是反映总体一般水平的平均指标,彼此之间存在着一定的关系,使其各自的涵义不同的调查数据类型,采用不同的指标分析,以期能把被调查总体数据的集中趋势最准确地描述出来。
(2)数据的离散程度分析
对一组数据规律性的研究,集中趋势是数据重要数量特征的一个方面,离散程度则是数据数量特征的另一方面。
集中趋势反映的是数据的一般水平,我们用均值等一个数值来代表全部数据。
但若要较全面地掌握这组数据的数量规律,还需要计算反映数据差异程度的数值,如极差、平均差、方差和标准差离散系数等。
极差(也称全距)是数据中两个极端值,不能反映蹭数据变化的影响,受极端值的影响较大。
一般说,极差越大,平均值的代表性越小。
所以,极差可以一般性地检验平均值的代表性大小。
平均差是总体各单位标志值与其算术平均数离差绝对值的算术平均数。
平均差与平均数代表性的关系,与极差基本一致。
不同的是,平均差的计算由于涉及了总体中的全部数据,因而能更综合地反映总体数据的离散程度。
方差与标准差是幂的关系,前者是后者的平方。
标准差的计算公式,也视资料的分组情况而分为简单平均式和加权平均式。
这两个指标均是反映总体中所有单位标志值对平均数的离差关系,是测定数据离散程度最重要的指标,其数值的大小与平均数代表性的大小呈反方向变化。
离散系数是为两组数据间进行比较而设计的;是一组数据标准差与均值相比较而得的相对值。
在不同情况的两组数据间,直接用标准差进行离散程度的比较是不科学的,甚至还会得出相反的结论。
二、动态分析
(一)动态数列的概念
动态,是指现象在时间上的发展变化。
把反映某现象的同一指标,在不同时间上的指标数值,按时间(如按年.季、月、日等)先后顺序编排所形成的数列,称为动态数列或时间数列的每一行有序数值,就是一个动态数列,上表共五个动态数列。
可见,任何一个动态数列,均由两个基本要素构成:
一个是现象所属的时间,另一个是反映现象所属时间的发展水平即统计指标数值,
要研究和分析现象的发展变化,必须编制动态数列,因为动态数列有很大作用,第一,它可以描述被研究现象的发展过程和结果:
第二,通过它可分析被研究现象的发展速度,趋势,探索其发展变化的规律性,第三,通过动态数列有关统计数据的计算、研究,对所研究的现象作趋势预测;第四,将不同国家或地区的同类现象的动态数列进行对比,观察其发展变化的数量关系,也可将两个以上相关现象,在同一历史时期的动态数列进行对比,分析其发展变化的协调性。
(二)动态数列的种类
根据统计指标表现的形式不同可分为总量指标动态数列,相对指标动态—数列和平均指标动。
态数列三种。
其中,总量指标动态数列是基本数列,后两种是派生数列。
1、总量指标动态数列
将现象某一总量指标在不同时间的数值,序时编排所形成的数列,称总量指标动态数列,它反映被研究现象总水平(或规模)的发展过程和结果。
例如,表6—1中的“年末职工人数”、“工资总额”和“国有经济单位工资总额”这三个动态数列,均为总量指标动态数列。
根据总量指标反映现象的时间状况不同,总量指标动态数列又可分为时期数列和时点数列。
我国近几年来职工人数及工资额的变化
年份
1994
1995
1996
1997
年末职工人数(万人)
14849
14908
14845
14668
职工工资总额(亿元)
6656.4
8100,0
9080.0
9405.3
其中,国有经济单位(亿元)
3090.4
3812.7
5177.4
6O80.4
占工资总额的比重(%)
46.4
47.1
57.O
64.6
职工年平均货币工资(元)
4538
5500
6210
6470
(1)时期数列。
凡排列在总量指标动态数列中的每个指标数值,均反映现象在一段时期内发展过程的总和,该动态数列称时期数列。
例如,表6—1的第二、第三个动态数列是时期数列。
时期数列中的每个指标数值,反映现象所在时间的长短,称时期。
例如,表6—1第二和第三个动态数列的每个指标数值,均是一年的工资总额。
所以,该时期数列的时期是一年。
在动态数列中,两个相邻指标值所在时间的距离,称间隔。
该工资总额时期数列的间隔也是一年。
若将该动态数列中的1995年资料略去,所形成的时期数列,其时期仍为一年,但其间隔就不都是一年了。
2.时点数列。
凡排列在总量指标动态数列中的每个指标数值,都反映现象在某一时点上总量的动态数列称时点数列。
例如,表6—1中第一个动态数列是时点数列。
时点数列没有时期,只有间隔,该时点数列的间隔为一年。
同样,若将1995年的资料略去后所形成的时点数列,其间隔并不都是一年,时期数列和时点数列的区别是由这两种动态数列所反映现象的性质和特点决定的,其区别是:
(1)时期数列中的每个指标数值,都是反映现象在一定时期内发展过程的总量;时点数列中的每个指标数值,则是反映现象在某一时点上的总量。
(2)时期数列各期指标数值可以相加,因为相加的结果有实际的意义,时点数列中的各指标数值除非计算过程需要相加外,一般不能相加,因为相加的结果无实际意义。
(3)时期数列小每个指标数值的大小,与时期的长短有关;时点数列中,每个指标数值的大小,与时间的间隔长
4)时期数列的每个指标数值,是跟随现象发展过程作连续登记得到的;时点数列中的每个指标数值,是对现象做一时调查确定的。
2、相对指标动态数列
将现象某—相对指标在不同时间的数值序时编排所形成的数列,称相对指标动态数列,它反映被研究现象数量对比关系的发展变化过程。
例如,表6一l中的第四个动态数列,就是一个相对指标动态数列,它反映近几年来各年我国国有经济单位职工工资总额比重的变化过程。
相对指标动态数列中的相对数,除上述所举的结构相对数外,也可以是第四章所讲过的其他任何一种相对数,如计划完成相对数、比较相对数,动态相对数和强
度相对数等。
相对指标动态数列中的各时间上的数值,是不能相加总的。
3、平均指标动态数列
将现象某一平均指标在不同时间的数值序时编排所形成的数列,称平均指标动态数列。
它反映现象平均水平的发展趋势。
由于平均指标可分为静态平均数(一般平均数)和动态平均数(序时平均数),因此,平均指标动态数列亦可分为静态平均数动态数列和序时平均数动态数列两种。
1.静态平均数动态数列。
静态平均数是标志总量除以总体总量,它反映总
体各单位某一数量标志值,在一定时间上的一般水平。
2.序时平均数动态数列。
把反映现象自身在不同时期的若干个序时平均数的数值,按时间顺序编排所形成的动态数列,称序时平均数动态数列。
例如,表6—2中的第二个动态数列,它反映该国有商场各月平均售货员人数的变化。
序时平均数动态数列中的各期数值直接相加的结果,也是没有独立存在的意义。
如果为了进一步计算该序时平均数动态数列的序时平均数,作为一个计算步骤,则是可以的。
4、序时平均数的计算方法
动态数列有三种,各种动态数列的序时平均数的计算方法不尽相同,但根据总量指标动态数列计算序时平均数的方法是基本的,现分别说明如下:
1.总量指标动态数列序时平均数的计算。
总量指标动态数列包括时期数列和时点数列,这两种数列序时平均数的计算方法很不一样,亦需分别说明。
(1)时期数列序时平均数的计算。
时期数列序时平均数的计算方法比较简单,只需将数列各期水平直接加总除以数列项数即得。
(2)时点数列序时平均数的计算。
时点数列序时平均数的计算方法,因掌握资料的情况不同而异。
①在掌握间隔相等连续时点(如每日的时点)资料时。
例如,某单位对职工天天都考勤,因而有每日出勤人数,若计算月份的平均
出勤人数,用公式(6—1)计算即得。
②在掌握间隔不等连续时点资料时。
有些时点现象的量,不需要经常登记,只在它发生变动时,作变动记录即可。
例如,某单位人事部门,对本单位在册职工人数有如下记录:
1月1日有职工218人,1月1l日调出18人,1月16日调入6人,1月25日又调入9人,2月5日调出4人。
亦即该单位1月1日至1月10日这10天都是218人,1月11日至1月15日这5天都是200人,1月16日至1月24日这9天都是206人,1月25日至1月31日这7天都是215人。
问1月份该单位职工平均在册人数是多少?
这需要加权平均计算:
③在掌握间隔相等的间断时点资料时。
根据我国现行的统计报表制度,对一些重要现象(如银行存款余额、商品库存量(额)、职工人数等)的时点指标,均可从报表中取得其月末数,于是,可编制的间隔相等的时点数列。
(三)指数分析
1、统计指数的概念
统计界认为,统计指数的概念有广义和狭义两种理解。
广义指数是泛指社会经济现象数量变动的比较指标,即用来表明同类现象在不同空间、不同时间、实际与计划对比变动情况的相对数。
狭义指数仅指反映不能直接相加的复杂社会经济现象在数量上综合变动情况的相对数。
例如,要说明一个国家或一个地区商品价格综合变动情况,由于各种商品的经济用途、规格、型号、计量单位等不同,不能直接将各种商品的价格简单对比,而要解决这种复杂经济总体各要素相加问题,就要编制统计指数综合反映它们变动情况。
2、统计指数的分类
统计指数从不同角度可以作如下分类:
(1)按研究范围不同,统计指数可分为个体指数和总指数
1)个体指数,是表明复杂社会经济总体中个别要素变动情况的相对数。
例如,某种商品销售量指数、个别商品的价格指数、单个产品的成本指数等都是个体指数。
2)总指数,是表明复杂经济现象中多种要素综合变动情况的相对数。
例如,工业生产