第三章 统计整理Word下载.docx
《第三章 统计整理Word下载.docx》由会员分享,可在线阅读,更多相关《第三章 统计整理Word下载.docx(19页珍藏版)》请在冰豆网上搜索。
1.定类尺度
定类尺度(Nominalscale,亦称分类尺度、列名尺度等)是这样一种品质标志,按照它可对研究客体进行平行的分类或分组,使同类同质,异类异质。
例如,按照性别将人口分为男、女两类;
按照经济性质将企业分为国有、集体、私营、混合制企业等。
这里的“性别”和“经济性质”就是两种名类尺度。
名类尺度是最粗略、计量层次最低的计量尺度,利用它只可测度事物之间的类别差,而不能了解各类之间的其他差别。
名类尺度计量的结果表现为某种类别,但为了便于统计处理,例如为了计算和识别,也可用不同数字或编码表示不同类别。
比如用1表示男,0表示女;
用1表示国有企业,2表示集体企业,3表示私营企业,等等。
这些数字只是不同类别的代码,决不意味着它区分了大小,更不能进行任何数学运算。
名类尺度能对事物做最基本的测度,是其他计量尺度的基础。
2.定序尺度
定序尺度(Ordinalscale,亦称序数尺度、顺位尺度等)是这样一种品质标志,利用它不仅能将事物分成不同的类别,还可确定这些类别的等级差别或序列差别。
例如“产品等级”就是一种测度产品质量好坏的顺序尺度,它可将产品分为一等品、二等品、三等品、次品等;
“考试成绩”也是一种顺序尺度,它可将成绩分为优、良、中、及格、不及格等;
“对某一事物的态度”作为一种顺序尺度,可将人们的态度分为非常同意、同意、保持中立、不同意、非常不同意,等等。
显然,顺序尺度对事物的计量要比名类尺度精确些,但它至多测度了类别之间的顺序,而未测量出类别之间的准确差值。
因此,顺序尺度的计量结果只能比较大小,不能进行加、减、乘、除等数学运算。
3.定距尺度
定距尺度(Intervalscale,亦称间隔尺度、等距尺度、区间尺度等)是能测度事物类别或次序之间间距的数量标志,更具体些说,区间尺度是可将事物区分为不同类别,对这些类别进行排序,并较准确地度量类别之间数量差距的一种计量尺度。
该尺度通常使用自然或物理单位作为度量单位,如收入用人民币“元”度量,考试成绩用“百分制”度量,温度用摄氏或华氏的“度”来度量,重量用“克”度量,长度用“米”度量等。
区间尺度的计量结果表现为数值。
区间尺度的数值可做加、减法运算,例如,考试成绩80分与90分之间相差10分,一个地区的温度20°
C与另一个地区的25°
C相差5°
C,等等。
但不能做乘、除法运算。
而且,区间尺度没有绝对的零点。
4.定比尺度
定比尺度(Ratioscale,亦称为比率尺度)的计量结果也表示为数值,跟区间尺度属同一层次,有时对两者可不作区分。
定比尺度这种数量标志不仅能测度各类别的大小和多少,还有一个绝对零点(Absolutezero)作为起点。
这个绝对零点是它跟区间尺度的明显差别,就是说,区间尺度中没有绝对零点,即使其计量值为“0”,这个“0”也是有客观内容的数值,即“0”水平,而不表示“没有”或“不存在”。
例如,某个学生统计学的考试成绩为“0”分,这个“0”分是他的统计学的客观成绩,并不表示他没有考试成绩或没有任何统计学知识;
一个地区的温度为0°
C,这表示一种温度的水平,并不是说没有温度。
而比尺度中绝对零点的“0”,表示“没有”或“不存在”。
例如,一个人的身高为“0”米,表示这个人不存在;
一个人的收入为“0”,表示这个人没有收入;
一个产品的产量为“0”,表示没有这种产品;
等等。
现实中,大多数场合人们使用的都是定比尺度。
定比尺度与上述三种计量尺度相比还有一个特性,就是可以计算数值之间的比值。
例如,一个人的月工资收入为600元,另一个人的为300元,可以得出一个人的收入是另一个的两倍。
但区间尺度由于不存在绝对零点,就只能比较数值差,而不能计算比值。
比如,可以说30°
C与15°
C之差为15°
C,而不能说30°
C比15°
C热一倍。
可见,比尺度可以做加、减、乘、除法运算。
上述四种计量尺度对事物的计量层次是由低级到高级、由粗略到精确,逐步递进的。
高层次的计量尺度可以计量低层次计量尺度能够计量的事物,但不能反过来。
显然,可以很容易地将高层次计量尺度的计量结果转化为低层次计量尺度的计量结果;
将考试成绩的百分制转化为五等级分制就是一例。
二、数据的类型
1.按计量尺度分
按照所采用的计量尺度不同,可以将统计数据分为定类数据、定序数据、定距数据和定比数据。
统计数据是采用某些计量尺度对事物进行计量的结果,但采用不同的计量尺度会得到不同类型的统计数据。
就上述四种计量尺度计量的结果来看,我们可以大体上将统计数据分为两种类型:
定性的数据和定量的数据。
定性数据(Qualitativedata,亦称品质数据)是说明事物的品质特征表现的具体类别,不能用数值表示;
因这类数据由名类尺度和顺序尺度计量形成,故又可细分为分类数据和顺序数据。
定量数据(Quantitativedata,亦称数量数据或数值型数据)是说明现象数量特征表现的,能够甚至必须用数值来表现;
因这类数据由区间尺度和比尺度计量形成,故又可细分为区间数据和比数据。
对不同类型的数据,可采用不同的统计方法来处理和分析,比如,对定性数据一般只采用分组法计算,分析各组的频数或频率,而对定量数据则可用更多的统计方法去处理,计算、分析更多的统计指标或统计量。
2.按数据的收集方法分
按数据的收集方法分类,可将统计数据分为观测数据和实验数据。
观测数据是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下而得到的,社会经济现象的统计数据几乎都是观测数据。
实验数据是在实验中控制实验对象而收集到的数据。
如医药研究试验数据、动植物杂交品种试验数据等等。
自然科学领域的大多数据都是试验数据。
3.按数据的时间关系分
按照被描述对象与时间的关系,可以将统计数据分为截面数据和时间数据。
截面数据是指同一时间不同空间上的数据。
时间数据是指同一空间不同时间上的数据。
第二节统计数据的整理与显示
一、统计整理的意义和步骤
(一)统计整理的意义
1.定义
统计整理,就是根据统计研究的目的,对所搜集到的资料进行科学的加工,使之系统化,条理化的工作过程。
统计整理即包括对统计调查所得到的原始资料进行整理,也包括对加工过的综合资料,即次级资料进行再整理。
2.意义
统计整理在整个统计研究中占有重要的地位。
统计整理的正确与否,将直接影响和决定着能否完成整个统计研究的任务。
如果采用不科学不完整的整理方法,即使搜集到准确、全面的统计资料,也往往使这些资料失去应用价值,掩盖客观现象的本质,难以得出正确的结论。
因此,必须十分重视统计整理工作。
(二)统计资料整理的步骤
第一步,设计和制定统计整理方案。
第二步,对原始资料进行审核。
第三步,对经过审核的资料进行分组、并结合汇总,计算出总体总量指标。
第四步,将汇总计算的结果,以统计表或统计图的形式表现出来。
第五步,对统计资料妥善保存,系统积累。
二、统计分组
(一)统计分组的概念
统计分组就是根据统计研究的需要,将统计总体按照一定的标志分为若干个组成部分的一种统计方法。
例如,将某一班级的全体同学按照性别划分为男、女两个组;
对某市100家大型零售商店按照零售额、职工人数进行分组等。
统计分组具有两个方面的含义:
对总体而言,是“分”,即将同质总体区分为性质有别的不同组成部分;
对总体单位而言,它是“组”,即将性质相同或相近的不同总体单位组合在一起,构成一个组。
例如,要了解我国人口状况,只知道总人口数量是不够的,而应将人口总体按照年龄、性别、民族、城乡、文化程度……等分组,才能进一步地深入地了解我国人口总体的年龄结构、性别比例、民族构成等。
(二)统计分组的作用
1.区分现象的不同类型
2.研究总体的内部结构
3.分析现象间的依存关系
(三)统计分组的方法
统计分组的关键问题是正确地选择分组标志与划分各组界限。
前者主要是指品质标志分组,后者主要是指数量标志分组。
1.分组标志选择的原则
(1)要选择能够反映事物本质或主要特征的标志
(2)应根据研究的目的与任务选择分组标志
(3)根据现象所处的历史条件的变化选择分组标志
2.统计分组的方法
(1)按品质标志分组
按照品质标志分组就是用来反映事物的属性,性质的标志作为分组标志,就可以将总体单位划分为若干性质不同的组成部分。
例如,人口按性别、文化程度、民族、籍贯等标志分组;
企业按经济类型、轻重工业、隶属关系,企业规模等标志分组等。
(2)按数量标志分组
按数量标志分组就是用反映事物数量差异的标志作为分组标志,将总体各单位划分为若干个组。
例如,地区经济按国内生产总值分组、企业按销售收入分组等。
例如:
某班学生基本情况调查表
姓名
性别
民族
年龄
身高
政治面貌
张三
男
汉
21
1.52
中共党员
李四
女
1.43
王五
回
23
1.58
团员
贾六
1.51
刘七
22
1.69
杨小
1.75
孙非
20
1.81
王继
满
1.65
赵可
武思
1.76
兰第
1.48
拉达
向乐
项于
1.61
可人
1.71
梁草
保安
1.46
马宝
1.82
姜清
林可
1.73
将上表资料按一定的标志分组后
汉族12人,占60%
1.按民族分组 回族5人,占25%
满族3人,占15%
20岁5人,占25%
21岁5人,占25%
2.按年龄分组 22岁2人,占10%
23岁8人,占40%
中共党员8人,占40%
3.按政治面貌分组
团员12人,占60%
男生12人,占60%
4.按性别分组
女生8人,占40%
(三)统计分组体系
分组体系有下列形式:
1.简单分组与平行分组体系
将社会经济总体只选择一个标志分组称为简单分组。
对同一总体选择两个或两个以上的标志分别进行简单分组,排列起来,即成为平行分组体系。
2.复合分组与复合分组体系
复合分组是用两个或两个以上分组标志重叠起来对总体进行的分组。
例如,将人口先按“性别”分成男、女两组,然后在男性和女性两组中分别按照“文化程度”划分为大学生及大学以上、高中、初中、文盲及半文盲如下五组:
如果多个复合分组组成的体系就形成了复合分组体系。
例如,为了认识我国高等院校在校学生的基