统计基础知识.docx
《统计基础知识.docx》由会员分享,可在线阅读,更多相关《统计基础知识.docx(16页珍藏版)》请在冰豆网上搜索。
统计基础知识
第一部分,统计表
统计表是统计用数字说话的一种最常用的形式。
统计表是我们在工作中常用的,不论是做什么管理工作的,都经常用到各种各样的统计表。
什么是统计表,概括起来说:
把统计调查得来的数字资料,经过汇总整理后,得出一些系统化的统计资料,将统计资料按照一定顺序填列在一定的表格内,这个表格就是统计表。
一、统计表的作用
统计表既是调查整理的工具,又是分析研究的工具。
广义的统计表包括统计工作各个阶段中所用的一切表格,如,调查表、整理表、计算表等,它们都是用来提供统计资料的重要工具。
统计表有以下四个作用:
1、能使大量的统计资料系统化、条理化,因而能更清晰地表述统计资料的内容。
2、利用统计表便于比较各项目(指标)之间的关系,而且也便于计算(如有些计算表比用公式更简易、明了)
3、采用统计表格表述统计资料比用叙述的方法表述统计资料显得紧凑、简明、醒目,使人一目了然。
4、利用统计表易于检查数字的完整性(是否有遗漏)和正确性。
统计表的作用主要就这四条。
二、统计表的结构
统计表的形式多种多样,根据使用者的要求和统计数据本身的特点,可以绘制形式多样的统计表。
如表1就是一种比较常见的统计表。
表1:
集团公司主要指标统计表
指标
计量
单位
2005年
2006年
同比±%
销售收入
万元
工业总产值
万元
员工平均人数
人
…
…
统计表一般由四个主要部分组成,即表头、行标题、列标题和数字资料,必要时可以在统计表的下方加上表外附加。
表头应放在表的上方,它所说明的是表的主要内容。
行标题和列标题通常安排在统计表的第一列和第一行,它所表示的主要是所研究问题的类别名称和指标名称,通常也称为“类”。
如果是时间序列数据,行标题和列标题也可以是时间,当数据较多时,通常将时间放在行标题的位置。
表的其余部分是具体的数字资料。
表外附加通常放在统计表的下方,主要包括资料来源、指标的注释和必要的说明等内容。
从统计表的内容上看,可以分为主词和宾词两部分,如表2所示。
主词是统计表所要说明的总体,它可以是各个总体单位的名称,总体的各个组成部分,总体单位的全部。
宾词是说明总体的统计指标,包括指标名称和指标数值。
表2:
2007年9月园区总产值完成情况表
单位
工业总产值(亿元)
本月完成
同比±%
A1
A2
A3
合计
三、统计表的种类
统计表按照总体分组情况不同,可分为简单表、分组表和复合表三类。
1、简单表
表的主词未经任何分组的统计表称为简单表。
简单表的主词一般按时间顺序排列,或按总体各单位名称排列。
通常是对调查来的原始资料初步整理所采用的形式。
如表3所示,即为按总体各单位排列的简单表。
表3:
2007年园区主机事业部机床产量表
事业部
机床产量(台)
A1
A2
…
合计
2、分组表
分组表是指表的主词按照某一标志进行分组的统计表。
利用分组表可以提示不同类型现象的特征,说明现象内部的结构,分析现象之间的相互关系等,如表4所示。
表4:
员工人均月工资分布表
人均月工资/元
人数
比重(%)
向上累计
向下累计
人数
比重(%)
人数
比重(%)
<500
5
5.00
5
5.00
100
100.00
500-1000
7
7.00
12
12.00
95
95.00
1000-1500
20
20.00
32
32.00
88
88.00
1500-2000
35
35.00
67
67.00
68
68.00
2000-2500
24
24.00
91
91.00
33
33.00
2500-3000
6
6.00
97
97.00
9
9.00
>3000
3
3.00
100
100.00
3
3.00
合计
100
100.00
-
-
-
-
3、复合表
复合表是指表的主词按照两个或两个以上标志进行复合分组的统计表。
复合表能更深刻、更详细地反映客观现象,但使用复合表应恰如其分,并不是分组越细越好。
因为复合表中多进行一次分组,组数将成倍增加,分组太细反而不利于研究现象的特征,如表5所示。
表5:
2007年某企业员工人数
单位:
人
项目
员工人数
比例(%)
按性别分
男
5000
62.5
女
3000
37.5
按岗位分
工人
7000
87.5
干部
1000
12.5
四、宾词指标设计
1、宾词不分组设计
宾词不分组设计是指宾词各指标根据说明问题的主次先后顺序排列,保持各指标之间的一定逻辑关系,如表5所示。
2、宾词简单分组设计
宾词简单分组设计是指统计指标从不同角度分别按某一标志分组,各分组平行排列,如表6所示。
表6:
园区员工人数统计表(2007年9月)
单位名称
员工
人数
按性别分组:
按工龄分组:
男
女
1年以下
1-3年
3-5年
5-10年
10年以上
(甲)
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
A1
A2
A3
…
合计
3、宾词复合分组设计
宾词复合分组设计是指统计指标同时有层次地按两个或两个以上标志分组,各种分组重叠在一起,如表7所示。
表7:
园区员工人数统计表(2007年9月)
单位名称
工人总数
按工龄分组:
1年以下
1-3年
3-5年
5-10年
10年以上
男
女
男
女
男
女
男
女
男
女
男
女
(甲)
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
(10)
(11)
(12)
A1
A2
A3
…
合计
五、统计表的设计要求
统计表的设计应符合科学、实用、简练、美观的要求。
具体来说,设计统计表时应注意以下几点:
1、统计表的各种标题,特别是总标题的表述应十分简明、确切地概括出表的基本内容,总标题应该表明资料所属的时间和地区;纵横各栏的排列要注意表达资料的逻辑关系,反映现象的内在联系。
2、表内各栏应按合乎逻辑的顺序排列并加以编号。
主词栏及计量单位栏用(甲)、(乙)等文字编号;宾词指标各栏则用
(1)、
(2)、(3)等数字编号,如相关栏存在关系可用如(6)=(5)/(3)表示。
3、如果表中的全部数据都是同一计量单位,可放在表的右上角标明,若各指标的计量单位不同,则应放在每个指标后或单列出一列标明。
4、表中的上下两条线一般用粗线,中间的其他线要细线。
通常情况下,统计表的左右两边不封口,列标题之间一般用竖线隔开,而横标题之间通常不必用横线隔开。
表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一。
对于没有数字的表格单元,一般用“-”表示,一张填好的统计表不应出现空白单元格。
5、在使用统计表时,必要时可在表的下方加上注释,特别要注意注明资料的来源,以表示对他人劳动成果的尊重,方便读者阅读使用。
统计报表
统计报表是依照国家(上级)有关法规的规定,自上而下的统一布置,以一定的原始记录为依据,按照统一的表式、统一的指标项目、统一的报送时间和报送程序,自下而上地逐级提供基本统计资料的一种调查方式。
按不同的标志,统计报表可以分为以下几类:
按调查范围的不同分为全面调查和非全面调查的统计报表;
按报送周期的不同分为日、旬、月、季、半年和年报;
按填报单位的不同分为基层和综合报表;
按报送方式的不同分为电信和邮寄报表;
按内容及实施范围的不同分为国家、部门和地方统计报表。
第二部分,几个基本概念
一、统计总体与总体单位
统计总体简称总体,是指符合某一统计研究目的和要求的,客观存在的、在同一性质基础上结合起来的许多个别单位的整体。
总体所包含的单位数是有限的,称为有限总体,如,员工人数、企业数等;总体所包含的单位数是无限的,称为无限总体,如,连续生产的某种产品的生产数量、大海里的鱼资源数等。
对有限总体可以进行全面调查,也可以进行非全面调查,但对无限总体只能抽取一部分单位进行非全面调查,据以推断总体。
总体和总体范围的确定取决于统计研究目的的要求。
形成统计总体的必要条件是同质性、大量性和差异性。
1、同质性。
是指总体中的各个单位按某一统计研究目的的要求必须具有某种共同的属性或标志数值。
也就是说,构成统计总体的单位一定要在某一方面具有相同性质的特征。
例如:
国有企业总体中每个企业共同标志属性是国家所有。
同质性是总体的根本特征,只有个体单位是同质的,统计才能通过对个体特征的观察研究,归纳和揭示出总体的综合特征和规律性。
2、大量性。
是指总体中包括的总体单位有足够多的数量。
总体是由许多个体在某一相同性质基础上结合起来的整体,个别或很少几个单位不能构成总体。
个别单位的数量表现可能是各种各样的,只对少数单位进行观察,其结果难以反映总体的一般特征。
总体的大量性,可使个别单位某些偶然因素的影响(表现在数量上的偏高、偏低的差异)相互推销,从而显示出总体的本质和规律性。
3、差异性。
总体各单位除了有共同的一面,在其他方面还存在着差异。
差异是普遍存在的,是统计存在的前提条件。
总体各单位之间存在差异性的特点,是由于各种因素错综复杂作用的结果,所以必须采取统计方法加以研究,才能表明总体的数量特征。
构成总体的这些个别单位称为总体单位。
原始资料最初是从各总体单位取得的,所以总体单位是各项统计资料最原始的承担者。
总体与总体单位是相对的,随着研究任务的改变而改变。
同一单位可以是总体也可以是总体单位。
例如,要了解全国工业企业职工的工资收入情况,那么全国全部工业企业是总体,各个企业是总体单位。
如果旨在了解某个企业职工的工资收入情况,则该企业就成了总体,每位职工的工资就是总体单位了。
二、统计标志与标志表现
统计标志简称标志,是指统计总体各单位属性或特征的名称。
从不同角度考察,每个总体单位可以有许多特征。
例如,在职工总体中,每个职工有性别、年龄、民族、工种等特征,这些都是职工的标志。
标志表现是指标志特征在各单位的具体表现。
例如,职工的性别“男”,年龄为“25岁”,民族为“汉族”等,这里“男”、“25岁”、“汉族”就是性别、年龄、民族的具体体现,即标志表现,标志具体表现有文字和数字两种形式。
标志的分类
1、标志按变异情况的不同,可分为不变标志和变异标志
在某一研究目的条件下的总体中,当一个标志在各个单位的具体表现都相同时,这个标志称为不变标志;当一个标志在各个单位的具体表现有可能不同时,这个标志称为可变标志或变异标志。
不变标志是构成统计总体的基础,因为必须至少有一个与研究目的相对应的不变标志将各总体单位联系在一起,才能使它具有“同质性”,从而构成一个总体。
变异标志是统计研究的主要内容,因为,如果标志在总体单位之间的表现都相同,那就没有进行统计分析研究的必要了。
2、标志按其性质的不同,可分为品质标志和数量标志
品质标志表示事物的质的特性,是用文字表示的,如,职工的性别、民族、工种等。
数量标志表示事物的量的特性,是用数值表示的,如职工年龄、工资、工龄等。
三、变异与变量
统计中的标志和指标一般都是可变的,如人的性别有男女之分,各时期、各地区、各部门的工业部产值各有不同等,这种差异叫做变异。
变异就是有差别的意思,包括质的差别和量的差别。
变异是统计存在的前提条件。
变量就是可以取不同值的量。
在社会经济统计中,变量包括各种数量标志和全部统计指标,它都是以数值表示的,不包括品质标志。
变量就是数量标志的名称或指标的名称,变量的具体数值表现则称为变量值。
按照变量值的连续性,变量可分为连续型变量和离散型变量。
有连续数值变化的变量,即可以用小数值表示的变量,称为连续型变量。
连续型变量的数值是接连不断的,相邻的两个数值之间可作无限分割,如身高、体重、年龄等。
以整数值变化的变量,称为离散型变量。
离散型变量的各变量值之间是以整数位断开的,如员工人数、机器台数工厂数等,都只能按整数计算。
变量按其性质可分为确定性变量与随机变量两种。
如果某一变量值(因素)能够被另一个或几个变量的值按一定规律唯一确定,则该变量称为确定性变量。
例如,商品销售价格与销售量确定,则销售额就是唯一的。
随机变量的数值变动受许多因素影响,其中有些因素是确定的,有些因素是带有偶然性的,变量值大小存在波动性。
例如,对某企业生产的某种型号零件合格率进行抽查检验,多次抽查检验结果存在变动性。
随机变量具有随机性或偶然性,其数值变动存在一定规律,通过大量观察,应用统计技术方法,是可以提示和描述其数量特征以及变动规律的。
四、统计指标和指标体系
(一)统计指标
统计指标是指反映总体现象数量特征的概念和数值。
例如,职工总体中,职工总人数、职工工资总额等,这些经济概念是对大量现实生活中反复出现的具体现象进行概括提出的,是统计总体某一数量特征质的规定性。
其指标表现称为指标数值,是统计总体数量特征表现的结果。
统计指标包括指标名称和指标数值两个基本构成要素。
统计指标名称及其指标数值的有机结合,是事物质的规定性和量的规定性有机联系的表现。
统计指标一般是由六要素组成的,即:
时间、空间、指标名称、指标数值、计量单位、核算方法等。
一定时间、地点条件下的社会经济现象对应于一定的总体。
指标名称是反映社会经济现象综合数量特征的科学概念,规定着指标的含义、范围和计算方法;指标数值是这一概念在一定时间、地点条件下的具体数量表现,是根据一定的方法对总体各单位的具体标志值进行登记、分类、汇总的结果,该结果在形式上可以是绝对数、相对数或平均数。
比如,我们集团去年完成的工业总产值是80亿元,比2005年增长35%,这里:
(1)时间是2006年;
(2)空间是沈阳机床集团;(3)指标名称是工业总产值;(4)指标数值是80和35%;(5)计量单位是亿元;(6)核算方法。
工业总产值和增长速度是按照国家规定的计算方法计算的。
统计指标的特点
1、数量性
统计指标最基本的特点,即所有的统计指标都是可以用数值来表现的。
统计指标所反映的就是客观现象的数量特征,这种数量特征是统计指标存在的形式,没有数量特征的统计指标是不存在的。
正因为统计指标具有数量性的特点,它才能对客观总体进行量的描述,才使统计研究运用数学方法和现代计算技术成为可能。
2、综合性
这是指统计指标既是同质总体大量个别单位的总计,又是大量个别单位标志差异的综合,是许多个体现象数量综合的结果。
统计指标的形成都必须经过从个体到总体的过程,它是通过个别单位数量差异的抽象化来体现总体综合数量的特点的。
3、具体性
统计指标不是抽象的概念和数字,而是一定的、具体的社会经济现象量的反映,是在质的基础上的量的集合。
这一点使社会经济统计和数理统计、数学相区别。
同时,统计指标说明的是客观存在的,已经发生的事实,它反映了社会经济现象在具体地点、时间和条件下的数量变化。
这一点又和计划指标相区别。
统计指标反映的是过去的事实和根据这些事实综合计算出来的实际数量,而计划指标则说明未来所要达到的具体目标。
(二)统计指标体系
1、统计指标体系的含义
社会经济现象是一个多方面、多角度的复杂总体,依赖个别的统计指标难以全面描述和反映社会经济总体。
统计指标体系是以同一经济现象为研究目的,由一系列相互联系的指标所构成的有机整体。
为了实现统计研究的目的,统计指标体系将各种统计指标相互结合运用,反映事物总体的多方面特征,了解现象的普遍联系,获得实际需要的有关信息。
统计指标体系是社会经济现象间数量联系的一种体现。
2、设计统计指标体系的基本内容与要求
统计指标体系的设计,关系到统计结果的科学性、准确性和可比性,关系到能否正确反映经济总体特征及其相互依存关系。
一般来讲,在统计指标体系设计时应考虑如下基本原则:
(1)根据研究目的,充分考虑指标之间的相互联系。
(2)依据科学原理确定指标的含义和统计口径。
(3)兼顾实际,使指标的计算实用可行。
3、统计指标体系的表达形式
统计指标体系的表达形式有两种:
一种是通过数学形式来表达,如产品销售额=产品销售量*销售单价;另一种不通过数学形式表达,而是表达成相互联系、相互补充的指标系列,如工业企业的生产经营过程,既是一个产品效益的产出过程,也是人力、物力和财力的占用及消耗过程,是一个多方面相互联系的整体运动,完整反映这一整体运动,就需要设计一系列的指标。
如反映各种占用和消耗的指标:
固定资产原值、资金占用额、职工人数、生产成本等;反映劳动成果的指标:
产品产量、总产值、增加值和品种数等;反映经营效益的指标:
利润额、资金利润率、销售利润率等,从而形成了较为完整的工业企业指标体系。
如图:
工业企业生产经营状况指标体系。
第三部分,相对指标及计算方法
1、结构相对指标
结构相对指标是在分组的基础上,以各个分组指标与总体指标对比的相对数。
它是部分数值与总体数值的对比,可以反映现象中各个部分在总体中所占的比重。
计算公式为:
结构相对数=总体部分数值/总体全部数值*100%
结构相对数表现为无名数,可以用系数、成数或百分数表示。
各组比重之和等于1或100%。
结构相对数是统计分析中常用的指标,科学分组是计算结构相对指标的基础。
结构相对指标的作用主要如下:
(1)利用结构相对数可以反映总体内部的构成情况,从而揭示现象的性质和特征。
如员工队伍的各种构成(文化、年龄、性别及各种岗位等)
(2)把不同时期的结构相对数加以比较,可以反映某一现象总体结构的变化,从而揭示现象的发展过程及其规律性。
如今年完成的工业总产值是100亿,其中数控产值55亿,产值数控化率为55%,去年完成工业总产值是80亿,其中数控产值41亿,产值数控化率为51%。
今年产值数控率比去年提高4个百分点。
2、比较相对指标
比较相对指标是指不同地区(部门、单位、事物)的同期、同类指标进行对比的相对数,说明某一种现象在同一时间内各单位发展的不平衡程度。
计算公式为:
比较相对指标=某地区(部门、单位)某现象的指标值/另一地区(部门、单位)同类现象的指标值*100%
在计算比较相对数时,要注意对比的两个指标必须具有可比性,即指标含义、计算口径、计算方法、计量单位、所属时间等一致。
比较相对数可以用倍数表示,也可用百分数表示。
如,国土面积,中国为960万平方公里,美国为936.3万平方公里,中国为美国的1.025倍或102.5%。
比较相对数具有如下特点:
(1)比较的两个指标可以是绝对数、相对数或平均数。
(2)用以对比的两个指标是可比的,即必须是同性质或同类型的。
(3)比较的基数(分母)有两种,一种是一般基数,即不同的国家、地区、单位之间的对比,分子、分母可以互换位置;另一种是典型基数,即以国内外同行业的先进水平或者国家规定的有关标准水平为基数,此时分子分母的位置不能互换。
利用比较相对数不仅可以在国际间对同类现象进行对比分析,而且在不同的地区、不同的部门、不同的企业以及企业内部不同单位都可以对同类现象进行比较分析,揭示同类现象之间数量上的差异,为提高生产和管理水平提供依据。
3、比例相对指标
比例相对指标是同一总体内不同组成部分的指标数值对比的结果,用来表示总体的内部比例关系。
计算公式为:
比例相对指标=总体中某部分数值/总体中另一部分数值*100%
比例相对指标可以用百分数表示,也可以用比例的形式出现。
比例相对指标对于调控各种比例关系具有重要意义。
4、计划完成相对指标
计划完成相对指标是某种社会经济现象在一定时期内的实际完成数值与计划任务数值的对比,用以表明计划的完成程度。
它是实行计划管理、检查监督计划执行情况的重要指标,通常以百分数表示,一般公式为:
计划完成相对指标=实际完成数/计划完成数*100%
5、动态相对指标
动态相对指标是在同一空间内某种社会经济现象在不同时间上的两个数值之比,用以说明某一种现象在不同时间上发展变化的相对程度。
通常将作为对比基础的时期叫做基期,所研究的时期叫做报告期。
计算公式为:
动态相对指标=报告期水平/基期水平*100%
动态相对数在工作中习惯称为发展速度,应用比较广泛。
6、强度相对指标
强度相对指标是两个性质不同但有一定联系的总量指标相互对比,用来表明现象的强度、密度和普遍程度的综合指标,通常用复合单位表示。
计算公式为:
强度相对指标=某一总量指标数值/另一有联系但性质不同的总量指标*100%
“强度”是指现象作用力的大小程度。
它可以表现一个现象在另一现象中的分布密度或普遍化程度,也可以表现为现象间相互影响的程度或关联程度。
强度相对数虽有“平均”的含义,但它还是同质总体的标志总量与总体单位数之比,所以不同于平均数。
第四部分,常用的统计指标
1、营业收入(销售收入);
营业收入(销售收入)是反映企业在一定时期内营业(销售)情况的总量指标。
指企业销售产品和提供劳务等主要经营业务取得的业务收入总额。
产品销售收入,数控产品销售收入,新产品销售收入。
2、工业增加值;
工业增加值是反映企业在一定时期内生产活动最终成果的总量指标。
指企业生产过程中新增加的价值。
是企业全部生产活动的总成果扣除在生产过程中消耗或转移的物质产品和劳务价值后的余额。
工业增加值=工业总产值-中间投入合计+应交增值税
3、利税总额;
利税总额是反映企业在一定时期内最终经营成果的总量指标。
指企业在一定时期内实现的利润和税金总额。
利税总额包括实现利润(税前利润总额)、应交增值税、应交产品销售税金及附加。
4、利润总额;
利润总额是反映企业在一定时期内最终经营成果的总量指标。
指企业的营业(销售)收入减去有关的成本与费用后的差额。
利润总额=营业利润+投资收益+补贴收入+营业外收入-营业外支出+以前年度损益调整。
5、工业总产值;
工业总产值是以货币形式表现的,工业企业在一定时期内生产的工业最终产品或提供工业性劳务活动的总价值量。
包括成品价值,对外加工费收入和自制半成品、在产品期末期初差额价值。
产品产值,机床产值,数控机床产值,新产品产值。
6、金切机床生产量;
金切机床生产量(简称机床产量):
是反映企业在一定时期内实际生产的、并符合产品质量要求的实物总量指标。
指企业生产的计划内和计划外,不论是要销售的商品或本企业自用的全部金切机床生产量。
其中:
数控机床生产量是指企业全部金切机床生产量中的数控机床数量。