统计资料整理.docx
《统计资料整理.docx》由会员分享,可在线阅读,更多相关《统计资料整理.docx(13页珍藏版)》请在冰豆网上搜索。
统计资料整理
第三章统计资料的整理
教学目的与要求:
本章是统计研究活动的第三阶段—统计资料整理阶段,阐述了统计整理的理论与方法,包括分组、汇总和统计表的设计。
重点要求为:
1、明确统计资料整理的概念,了解统计整理的步骤。
2、通过学习统计分组理论,能够对不同的社会经济现象进行统计分组。
3、运用分配数列对原始数据进行系统整理。
4、掌握统计表的具体编配方法。
重点掌握:
1、统计分组方法。
2、分配数列的编制与汇总
技能点:
1.掌握统计数据整理的基本操作方法的能力;
2.通过学习统计分组理论,能够对不同的社会经济现象进行统计分组的能力。
3.运用分配数列对原始数据进行系统整理的能力;
4.培养制作统计表,运用计算机绘制统计图的能力。
教学方式:
用多媒体课件讲练结合。
课时安排:
理论4学时,实训2学时
第一节统计整理的意义和步骤
一、统计整理的意义
1、定义
统计整理,就是根据统计研究的目的,对所搜集到的资料进行科学的加工,使之系统化,条理化的工作过程。
统计整理即包括对统计调查所得到的原始资料进行整理,也包括对加工过的综合资料,即次级资料进行再整理。
2、意义
统计整理在整个统计研究中占有重要的地位。
统计整理的正确与否,将直接影响和决定着能否完成整个统计研究的任务。
如果采用不科学不完整的整理方法,即使搜集到准确、全面的统计资料,也往往使这些资料失去应用价值,掩盖客观现象的本质,难以得出正确的结论。
因此,必须十分重视统计整理工作。
二、统计资料整理的步骤
第一步,设计和制定统计整理方案。
第二步,对原始资料进行审核。
第三步,对经过审核的资料进行分组、并结合汇总,计算出总体总量指标。
第四步,将汇总计算的结果,以统计表或统计图的形式表现出来。
第五步,对统计资料妥善保存,系统积累。
第二节统计分组
一、统计分组的概念
统计分组就是根据统计研究的需要,将统计总体按照一定的标志分为若干个组成部分的一种统计方法。
例如,将某一班级的全体同学按照性别划分为男、女两个组;对某市100家大型零售商店按照零售额、职工人数进行分组等。
统计分组具有两个方面的含义:
对总体而言,是“分”,即将同质总体区分为性质有别的不同组成部分;
对总体单位而言,它是“组”,即将性质相同或相近的不同总体单位组合在一起,构成一个组。
例如,要了解我国人口状况,只知道总人口数量是不够的,而应将人口总体按照年龄、性别、民族、城乡、文化程度……等分组,才能进一步地深入地了解我国人口总体的年龄结构、性别比例、民族构成等。
二、统计分组的作用
(一)区分现象的不同类型
(二)研究总体的内部结构
(三)分析现象间的依存关系
三、统计分组的方法
统计分组的关键问题是正确地选择分组标志与划分各组界限。
前者主要是指品质标志分组,后者主要是指数量标志分组。
(一)分组标志选择的原则
1、要选择能够反映事物本质或主要特征的标志
2、应根据研究的目的与任务选择分组标志
3、根据现象所处的历史条件的变化选择分组标志
(二)统计分组的方法
1、按品质标志分组
按照品质标志分组就是用来反映事物的属性,性质的标志作为分组标志,就可以将总体单位划分为若干性质不同的组成部分。
例如,人口按性别、文化程度、民族、籍贯等标志分组;企业按经济类型、轻重工业、隶属关系,企业规模等标志分组等。
2、按数量标志分组
按数量标志分组就是用反映事物数量差异的标志作为分组标志,将总体各单位划分为若干个组。
例如,地区经济按国内生产总值分组、企业按销售收入分组等。
三、统计分组体系
分组体系有下列形式:
(一)简单分组与平行分组体系
将社会经济总体只选择一个标志分组称为简单分组。
对同一总体选择两个或两个以上的标志分别进行简单分组,排列起来,即成为平行分组体系。
(二)复合分组与复合分组体系
复合分组是用两个或两个以上分组标志重叠起来对总体进行的分组。
例如,将人口先按“性别”分成男、女两组,然后在男性和女性两组中分别按照“文化程度”划分为大学生及大学以上、高中、初中、文盲及半文盲如下五组:
如果多个复合分组组成的体系就形成了复合分组体系。
例如,为了认识我国高等院校在校学生的基本状况,可以同时选择学科、本科或专科、性别三个标志进行复合分组,并得到如下复合分组体系:
第三节分配数列
一、分配数列的概念与种类
定义:
在统计分组的基础上,总体中的所有单位按其所属的组别归类整理,并且按照一定的顺序排列,形成总体单位数在各组分布的一系列数字,称为分配数列,又称次数分配或次数分布。
分配数列中,分布在各个组的总体单位数叫次数,又称频数。
如果将分组标志序列与各组相对应的频率按照一定的顺序排列,就形成频率分布数列。
分配数列有两个组成要求:
一是分组;另一个是次数或比率。
它可根据分组标志的性质不同,可以分为品质数列与变量数列。
(一)品质数列
它是按品质标志分组的数列,用来观察总体单位中不同属性的单位分布情况。
例如,
2000年我国人口性别构成情况
人口性别分组
人口数(万人)
占人口的比重(%)
男
女
65355
61228
51.63
48.37
合计
126583
100
(分组名称)(次数)(频数)
品质数列的编制比较简单,但要注意分组时,应包括分组标志的所有表现,不能有遗漏,各种表现相互独立,不得相融。
(二)变量数列
变量数列是将总体按数量标志分组,将分组后形成的各组变量值与该组中所分配的单位次数或频数,按照一定的顺序相对应排列所形成的分配数列。
某班级统计学成绩分布表
考试分数
人数(人)
频率(%)
60以下
60—70
70—80
80—90
90—100
2
7
11
12
8
20.0
30.0
27.0
17.0
5.0
合计
40
100.0
(各组变量值)(次数)(频数)
在组距式变量数列中,需要明确以下概念
1、组限
组限为组距式变量数列中,每组区间两端的极值称组限。
每一组的两个组限中,较大者叫上限,较小者叫下限,如果各组的组限都齐全,成为闭口组;组限不齐全,即最小组缺下限或最大组缺上限,称为开口组。
2、组距
组距为每组下限与上限之间的距离为组距。
即:
组距=上限-下限
组距式变量数列,有等距数列和不等距(异距)数列之分
3、组中值
组中值=
对于开口组中值的计算方式可以利用如下公式:
二、变量数列的编制
单项式变量数列,可以直接将每一变量值作为一组,
表3—6某工厂生产车间工人按日产量分布
日产量
工人数
比率(%)
20
21
22
23
24
3
7
10
6
4
10.0
23.3
33.3
20.1
13.3
合计
30
100.0
(各组变量值)(次数)(频率)
单项式变量数列的编制比较明确、容易。
但是用连续变量分组来编制分配数列时,或者虽是离散变量,但数值很多,变化范围很大时,单项数列就不能适用,而应考虑采用组距数列的形式。
(二)组距变量数列的编制
以下举例说明:
[例1]对某企业30个工人完成劳动定额的情况进行调查,某原始资料如下(%)
98819584938691102100103
105100104108107108106109112114
109117125115120119118116129113
第一步:
计算全距
将各变量值由小到大排序,确定某最大值,最小值,并计算全距。
变量的最大值是129%最小值是81%
全距=最大值-最小值=129%-81%=48%
第二步:
确定组数和组距
在等距分组时,组距与组数的关系是:
本例中根据一般将成绩分成优、良、中、及格和不及格的五档评分习惯,可以先确定组数为5。
在等距分组时,计算组距如下:
为了符合习惯和计算方便,组距近似地取10%。
第三步:
确定组限
关于组限的确定,应注意如下几点:
第一,最小组的下限(起点值)应低于最小变量值,最大组的上限(终点值)应高于最大变量值。
第二,组限的确定应有利于表现出总体分布的特点,应反映出事物质的变化。
第三,为了方便计算组限应尽可能取整数,最好是5或10的整倍数。
第四,由于变量有连续型变量和离散型变量两种,其组限的确定方法是不同的。
第四步:
编制频数(频率)分布表。
某企业30个工人劳动定额完成情况分布图表
劳动定额完成程度(%)
频数(人)
频数(%)
80—90
90—100
100—110
110—120
120—130
3
4
12
8
3
10.0
13.3
40.0
26.7
10.0
合计
30
100.0
第五步:
计算累计频数和累计频率
为了更详细的认识变量的分布特征,还可以计算累计频数和累计频率,编制累计频数和累计频率数列。
累计频数和累计频率有向上累计频数(频率)和向下累计频数(频率)两种。
以变量值大小为依据,由变量值小的组向变量值大的组累计频数和频率,成为向上累计频数和向上累计频率。
向上累计数的意义是:
小于各组的该组上限的各组的频数或频率之和;相反,由变量值大的组向变量值小的组累计各组的频数或频率,称为向下累计频数或向下累计频数。
向下累计数的意义是:
大于及等于该组下限的各组的频数或频数或频率之和。
根据某企业工人完成劳动定额的资料编制的向上累计频数(频率)和向下累计频数(频率)分布如表3—8。
表3—8某企业工人完成劳动定额累计分布表
劳动定额完成情况
(%)
频数
(人)
频率
(%)
向上累计
向下累计
频数
(人)
频率
(%)
频数
(人)
频率
(%)
80~90
90~100
100~110
110~120
120~130
3
4
12
8
3
10.0
13.3
40.0
26.7
10.0
3
7
19
27
30
10.0
23.3
63.3
90.0
100.0
30
27
23
11
3
100.0
90.0
76.7
36.7
10.0
合计
30
10.0
—
—
—
—
三、次数分布的主要类型
(一)钟形分布
钟形分布的特征是“两头小、中间大”,即靠近中间的变量值分布的次数多,靠近两端的变量值分布的次数少,如果将变量值与其对应的频数在直角坐标系中对应的点连接起来绘制成曲线图,宛如一口钟,所以又称钟形分布。
在自然或社会经济现象中,有许多次数分布是属于钟形分布的。
例如,人体体重、身高,学生的成绩,居民货币收入,单位面积的农产品产量,市场价格等现象都属于钟形分布。
(二)U形分布
U形分布的特征是:
靠近中间的变量值分布的次数少,靠近两端的变量值分布的次数多,形成“两头大,中间小”的分布特征。
将这种分布绘成曲线,像英文字母“U”的形状,故称U形分布
例如,人口死亡率的分布,一般是婴幼儿死亡率和老年人死亡率均较高,而中年人死亡率最低,所以人口年龄分组的死亡率是呈U形分布的。
另外,失业人口按年龄的分布等均呈U形分布。
(三)J形分布
J形分布的特征是“一边小,一边大”,即大部分变量值集中在某一端分布,有两种类型。
1、正J形分布
正J形分布是次数随着变量值的增大而增多。
如投资额按利润率大小分布,一般是正J形分布。
2、反J形分布
反J形分布是次数随着变量值的增大而减小。
如成年人数量按年龄大小分组,表现出年龄越高,人数越少。
第四节统计表和统计图
一、统计表
(一)统计表的概念和结构
1、概念
统计表是表现统计资料的一种形式。
把经过大量调查得来的统计资料,经过汇总整理以后,按照一定的规定和要求填列在相应的表格内,就形成了一定的统计表。
2、作用
统计表对表现统计资料具有重要作用。
统计表是统计整理的重要形式。
它利用表格形式,合理地安排统计资料,清晰、简明地反映出现象总体的特征。
统计表通过科学、合理地表现统计资料,便于对统计资料进行对照比较和分析,有利于计算统计分析指标。
在统计分析报告中使用统计表,能节省文字叙述篇幅,达到简明易懂、紧凑有力的分析效果。
统计表还是汇总和积累统计资料,进行统计分析的重要工具。
3、结构
从外表形式上看,是由四部分构成:
(1)总标题:
它是表的名称,用于概括统计表中要说明的内容。
(2)横行标题:
它是各组的名称,反映总体各组成部分的。
(3)纵栏标题:
它是分组标志或指标的名称,说明纵行所列各项资料的内容。
(4)指标数值:
也称数字资料,它是统计表的具体内容,
从统计表的内容来看,由主词和宾词两个部分组成。
主词是统计表所说明的总体,总体的各组或各组的名称。
宾词是用于说明主词的各种指标。
通常,统计表的主词列在表的左方,宾词列在表的右方。
(二)统计表的种类
统计表按照总体分组情况不同,可分为简单表、分组表和复合表三类。
1、简单表
是主词未经过任何分组,反映出总体各单位的名称或按时间顺序简单排列,或同时反映以上内容的统计表。
2、分组表
分组表是主词按照一定标志分组的统计表,也称简单分组表。
它可以揭示出现象的不同类型的特征,研究现象的内部结构。
3、复合表
复合表是主词按照两个或两个以上的标志层叠分组所形成的统计表。
如表3—13
(三)统计表的编制规则
二、统计图
(一)统计图的概念
统计图是以图形形象地表现统计资料的一种形式。
用统计图表现统计资料,具有鲜明醒目,富于表现,易于理解的特点,因而绘制统计图是统计整理的重要内容之一。
统计图可以揭示现象的内部结构和依存关系,显示现象的发展趋势和分布状况,有利于进行统计分析与研究。
(二)统计图的种类
常用的统计图主要有条形图、面积图、曲线图、象形图等。
1、条形图
条形图是以相同宽度条形的长短或高度来比较统计指标数值大小的图形。
如某企业1995—2001年的销售额情况
图3—4某企业1995—2001年的销售额情况
绘制条形图应注意以下几个问题:
(1)在图形中条形的宽度、条形之间距离要相等;
(2)图形上的尺度必须以x轴或y轴为等线;(3)图形中要注明相应的数字;(4)各条形的排列应有一定的顺序,如比较现象在时间上的变动时,条形应按时间顺序排列。
2、面积图
面积图是以几何图形的面积表示统计指标数值大小的一种图形。
它可以用来比较同类指标的大小,说明总体结构。
常用的有正方形图和圆形图两种。
正方形图是以正方形的面积代表指标数值大小的一种图形。
在绘图时,只需把指标数值开方求得边长,再按放大或缩小比例绘出相应的若干个正方形图进行比较。
图3—5属于正方形面积图,反映的是某企业职工人数增长情况。
圆形是以圆形面积或圆内各扇形面积的大小表示指标数值大小的图形,它用于比较指标和反映总体的内部结构。
图3—6职位需求按学历分布图
3、曲线图
曲线图是用曲线的升降来表示数值大小和发展变化的图形。
其主要构成要素是直角坐标的纵轴和横轴。
多用于表明现象的动态、计划完成情况、现象之间的依存关系和现象的次数分布等。
(1)动态曲线图
(3)次数分配曲线图。
它是用曲线的升降起伏,反映总体单位在总体分组中的分配情况及次数分配变化的规律性。
如上节组距式变量数列的编制中使用的例子,绘制分配曲线图。
4、象形图、
象形图是利用形象画来表明统计资料的图形。
它给人以直观感觉。
其主要作用是用来比较现象在不同时间、不同地区和不同条件下的水平、速度、比例、计划完成情况等数值的大小。