第三章 统计整理学生练习9Word格式文档下载.docx
《第三章 统计整理学生练习9Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《第三章 统计整理学生练习9Word格式文档下载.docx(12页珍藏版)》请在冰豆网上搜索。
分组标志的选择是统计分组的关键。
分组标志,即将同质总体区分为不同组的标准或依据。
分组标志一旦选定,就必然突出了总体在该标志下的性质差别。
分组标志选择不当,不但无法显示现象的根本特征,甚至会混淆事物的性质,歪曲社会经济的真实情况。
正确选择分组标志,必须根据统计研究的任务目的,抓住现象本质区别和内在联系的标志作为分组标志。
(三)掌握统计分组的方法
1、品质标志分组方法
品质标志分组一般较简单,分组标志一旦确定,组数、组名、组与组之间的界限也就确定。
有些复杂的品质标志分组可根据统一规定的划分标准和分类目录进行。
2、数量标志分组方法
按数量标志分组的目的并不是单纯确定各组在数量上的差别,而是要通过数量上的变化来区分各组的不同类型和性质。
数量标志分组方法从以下几个方面来说明:
(1)单项式分组和组距式分组
对离散变量,如果变量值的变动幅度小,就可以一个变量值对应一组,称为单项式分组;
如果变量值的变动幅度很大,变量值的个数很多,则把整个变量值依次划分为几个区间,各个变量值按其大小确定所归并的区间,区间的距离称为组距,这样的分组称为组距式分组。
在组距式分组中,相邻组既可以有确定的上下限,也可以将相邻组的组限重叠。
连续变量由于不能一一列举其变量值,只能采用组距式的分组方式,且相邻的组限必须重叠。
组距式分组使资料的真实性受到一定程度的损害。
组距式分组的假定条件是:
变量在各组内的分布都是均匀的(即各组标志值呈线性变化)。
通过组距式分组以后,把各组内部各单位的次要差异抽象去了,而把各组之间的主要差异突出出来,这样各组分配的规律性可以更容易显示出来。
根据这个道理,如果组距太小,分组过细,容易将属于同类的单位划分到不同组,因而显示不出现象类型的特点;
但如果组距太大,组数太少,会把不同性质的单位归并到同一组,失去区分事物的界限,达不到正确反映客观事实的目的。
因此,组距的大小、组数的确定应根据研究对象的经济内容和标志值的分散程度等因素,不可强求一致。
(2)等距分组和不等距分组
等距分组是各组保持相等的组距,也就是说各组标志值的变动都限于相同的范围。
不等距分组即各组组距不相等的分组。
统计分组时采用等距分组还是不等距分组,取决于统计研究对象的性质特点。
在标志值变动比较均匀的情况下宜采用等距分组。
等距分组便于各组单位数和标志值直接比较,也便于计算各项综合指标。
在标志值变动很不均匀的情况下宜采用不等距分组。
不等距分组有时更能说明现象的本质特征。
(3)组限和组中值
组距数列中每一组两端的数值称组限。
其中,每组的起点数值称为下限,每组的终点称为上限。
上限和下限的差称为组距,表示各组标志值变动的范围。
组中值是上下限之间的中点数值,以代表各组标志值的一般水平。
组中值并不是各组标志值的平均数,各组标志数的平均数在统计分组后很难计算出来,就常用组中值近似代替。
组中值仅存在于组距式分组数列中,单项式分组中不存在组中值。
组中值的计算是有假定条件的,即假定各组标志值的变化是不均匀的。
一般情况下,组中值=(上限+下限)÷
2
对于开口组,组中值的计算可参照邻组的组距来决定。
即:
缺下限开口组组中值=上限-1/2邻组组距,缺上限开口组组中值=下限+1/2邻组组距。
(四)掌握次数分布的含义、种类、特征和编制方法
1、次数分布的概念、构成要素
在统计分组的基础上,列出各组对应的单位数,形成总体单位数在各个组的分布,称次数分布或分布数列。
次数分布包括两个要素:
总体某标志所分的组和各组对应的单位数。
2、次数分布的类型
次数分布包括品质分不数列和变量分不数列,分别由品质标志分组和数量标志分组形成。
变量数列又有单项式数列和组距式数列形成,分别由单项式分组和组距式分组形成。
统计分组后各组对应的单位数称频数,也叫次数;
各组单位数占总体单位总数的比重称为频率。
各组的频率大于0,所有组的频率总和等于1。
在变量分布数列中,频数(频率)表明对相应组标志值的作用程度。
频数(频率)数值越大,表明该组标志值对于总体水平所起的这样也越大;
反之,频数(频率)数值越小,表明该组标志值对于总体水平所起的这样也越小。
有时为了更简便地概括总体各单位的分布特征,还需要编制累计频数数列和累计频率数列。
累计有向上累计和向下累计的方法。
向上累计是指将各组频数和频率由变量值低的组向变量值高的组累计,表明在这些数值以下的总体单位所占的比重;
向下累计是指将各组频数和频率由变量值高的组向变量值低的组累计,表明在这些数值以上的总体单位所占的比重。
3、次数分布特征
根据现象总体的性质不同,其次数分布也不同。
归纳起来主要有三种类型:
(1)钟形分布特征是“两头小,中间大”,即靠近中间的变量值分布的次数多,靠近两边的变量分布次数少,形如古钟。
(2)U形分布其特征与钟形分布正相反,靠近中间的变量值分布的次数少,靠近两端的变量值分布次数多,形成“两头大,中间小”的U形分布。
(3)J形分布在社会经济现象中,一些统计总体分布曲线呈J形。
特征是次数随着变量值的增大而增多,或次数随着变量值的增大而减小。
4、变量数列的编制
变量分配数列编制的步骤:
(1)将原始资料按其数值大小重新排列
只有把得到的原始资料按其数值大小重新排列顺序,才能看出变量值分布的集中趋势和特点,为确定全距、组距和组数作准备。
(2)确定全距
全距是变量值中最大值和最小值的差数。
确定全距,主要是确定变量值的变动范围和变动幅度。
如果是变动幅度不大的离散变量,即可编制组距式变量数列。
(3)确定组距和组数
组距数列有等距和不等距之分,应视研究对象的特点和研究目的而定。
组距的大小和组数的多少,是互为条件和互为制约的。
当全距一定时,组距大,组数就少;
组距小,组数就多。
在实际应用中,组距应是整数,最好是5或10的整数倍。
在确定组距时,必须考虑原始资料的分布状况和集中程度,注意组距的同质性,尤其是对带有根本性的质量界限,绝不能混淆,否则就失去分组的意义。
在等距分组条件下,存在以下关系:
组数=全距/组距。
组限要根据变量的性质来确定。
如果变量值相对集中,无特大或特小的极端数值时,则采用闭口式,使最小组和最大组都有下限和上限;
反之,如果变量值相对比较分散,则采用开口式。
如果是离散型变量,可根据具体情况采用不重叠组限或重叠组限的表示方法,而连续型变量则只能用重叠组限来表示。
在采用闭口式时,应做到最小组的下限低于最小变量值,最大组的上限高于最大变量值,但不要过于悬殊。
(4)确定组限
经过统计分组,明确了全距、组距、组数和组限及组限表示方法以后,就可以把变量值归类排列,最后把各组单位数经综合后填入相应的各组次数栏中。
(5)编制变量数列
(五)掌握统计表的构成、种类及编制的原则
1、统计表的定义:
把汇总结果的资料按一定的规则在表格上表现出来,这种表格就叫统计表,广义上说,任何用以反映统计资料的表格都是统计表。
2、统计表的结构:
从它的外表形式看由总标题、横行标题、纵栏标题、数字等四部分构成。
从表的内容看包括主词和宾词两个部分。
主词就是统计表所要说明是总体、总体的各个组或各个单位的名称。
表的宾词是用来说明主词的各种指标。
通常主词列在表的左方,即列于横行;
宾词列在表的上方,即列于纵栏。
3、统计表的种类:
按主词是否分组和分组的程度,统计表可分为简单表,简单分组表和复合分组表。
简单分组表:
主词未经任何分组的统计表。
分组表:
主词按某一标志进行分组的统计表。
复合分组表:
主词按两个或两个以上标志进行复合分组的统计表。
4、统计表的编制规则:
设计统计表必须遵循科学、实用、简明、美观的原则。
应具体注意以下几点:
(1)统计表的各种标题,应简明、确切、概括地反映出表的内容;
(2)表中的主词各行和宾词各栏应先列各个项目,后列总计;
(3)如果统计表的栏数较多,通常要加以编号;
(4)表中数字应填写整齐,对准位数;
(5)统计表中必须注明数字资料的计量单位;
(6)必要时统计表应加注明或注释。
三、思考与练习
(一)填空题
1、是统计工作的第三阶段。
在这一阶段,通过对原始资料进行科学的加工,可以得出反映事物的资料。
2、统计整理在统计分析中起着的作用,它既是统计调查的,又是统计分析的。
3、统计分组实质上是在统计总体内部进行的一种。
4、对原始资料审核的重点是。
5、区分现象是统计分组的根本作用。
6、是统计分组的依据,是划分组别的标准。
7、根据分组标志的特征不同,统计总体可以按分组,也可以按分组。
8、对所研究的总体按两个或两个以上的标志结合进行的分组,称为。
9、次数分布数列根据分组标志特征的不同,可以分为和
两种。
10、变量数列是所形成的次数分布数列。
11、按品质标志分组的结果,形成。
12、组限是组距变量数列中表示的变量值,其中下限是指的变量值,上限是指的变量值。
13、组距变量数列的组距大小与组数的多少成。
与全距的大小成。
14、组距变量数列的可以用次数分布曲线图表示。
15、划分连续变量的组限时,相邻组的组限必须;
划分离散型变量的组限时,相邻组的组限应为。
16、统计资料的整理方法主要有和两种。
17、钟形分布、分布和分布是次数分布的三种主要类型。
18、统计分组体系有和两种。
19、统计表按主词是否分组和分组的程度可分为、
和三种。
20、统计表从内容结构上看,是由和两部分构成。
(二)单项选择题(在每小题备选答案中,选出一个正确答案)
1、统计分组的结果表现为()
A.组内同质性,组间差异性B.组内差异性,组间同质性
C.组内同质性,组间同质性D.组内差异性,组间差异性
2、统计分组的依据是()
A、标志B、指标C、标志值D、变量值
3、下面属于按品质标志分组的有()
A.企业按职工人数分组B.企业按工业总产值分组
C.企业按经济类型分组D.企业按资金占用额分组
4、统计分组的关键在于()
A、正确选择分组标志B、正确划分各组界限
C、正确确定组数和组限D、正确选择分布数列种类
5、下面属于按数量标志分组的有()
A.工人按政治面貌分组B.工人按年龄分组
C.工人按工种分组D.工人按民族分组
6、在全距一定的情况下,组距的大小与组数的多少成()
A、正比B、反比C、无比例关系D、有时成正比有时成反比
7、某地区商业企业按所有制形式分组,然后在各种所有制形式中再按销售额多少分组,这样的分组属于()
A.按数量标志分组B.简单分组
C.复合分组D.平行分组体系
8、次数分配中,靠近中间的变量值分布的次数少,靠近两端的变量值分布的次数多,这种次数分布的类型是()
A.钟形分布B.U形分布C.J形分布D.洛伦茨分布
9、变量数列中的各组频率(以百分比表示)