4统计.docx

上传人:b****4 文档编号:4617926 上传时间:2022-12-07 格式:DOCX 页数:54 大小:127.67KB
下载 相关 举报
4统计.docx_第1页
第1页 / 共54页
4统计.docx_第2页
第2页 / 共54页
4统计.docx_第3页
第3页 / 共54页
4统计.docx_第4页
第4页 / 共54页
4统计.docx_第5页
第5页 / 共54页
点击查看更多>>
下载资源
资源描述

4统计.docx

《4统计.docx》由会员分享,可在线阅读,更多相关《4统计.docx(54页珍藏版)》请在冰豆网上搜索。

4统计.docx

4统计

第二十章 统计与统计数据

一、统计的含义

统计一词一般有三种不同的含义:

统计工作(即统计实践活动);统计数据;统计学。

了解其含义。

【例1·多选题】统计一词的含义是()。

A.统计工作      B.统计数据

C.统计调查      D.统计学

E.统计监督

[答案]ABD

二、统计数据的计量尺度

按照计量学的一般分类方法,可将所采用的计量尺度由低级到高级、由粗略到精确分为四个层次:

定类尺度、定序尺度、定距尺度和定比尺度。

(掌握)

(一)定类尺度

定类尺度是最粗略、计量层次最低的计量尺度,它是按照客观现象的某种属性对其进行分类或分组,各类各组之间的关系是并列、平等而且互相排斥的。

例如人口按性别分为男、女。

在统计中,通常赋予每类或每组一个数值作为代码。

作为代码的数值并不反映各类的优劣、量的大小或顺序,也不能区分大小或进行任何数学运算。

对定类尺度的计量结果,可以计算每一类或组中各元素或个体出现的频数。

(二)定序尺度

定序尺度是对客观现象各类之间的等级差或顺序差的一种测度。

利用定序尺度不仅可以将研究对象分为不同的类别,而且可以反映各类的优劣、量的大小或顺序。

定序尺度对事物的计量要比定类尺度精确一些。

该尺度的计量结果只能比较大小,不能进行加、减、乘、除等数学运算。

(三)定距尺度

定距尺度是对现象类别或次序之间间距的测度。

定距尺度不但可以用数字表示现象各类别的不同和顺序大小的差异,而且可以用确切的数值反映现象之间在量方面的差异。

定距尺度使用的计量单位一般是实物单位或者价值单位,如长度用“米”度量,温度用“度”度量等。

反映现象规模水平的数据必须以定距尺度计量。

定距尺度的计量结果可以进行加、减运算。

(四)定比尺度

定比尺度是在定距尺度的基础上,确定相应的比较基数,然后将两种相关的数加以对比而形成的相对数(或平均数),用于反映现象的结构、比重、速度、密度等数量关系。

定比尺度计量的结果可以进行加、减、乘、除等数学运算。

总结四者之间的关系:

计量尺度

特点

定类尺度

作为代码的数值并不反映各类的优劣、量的大小或顺序,也不能区分大小或进行任何数学运算。

定序尺度

计量结果只能比较大小,不能进行加、减、乘、除等数学运算

定距尺度

计量结果可以比较大小,可以进行加、减运算

定比尺度

计量的结果可以比较大小,可以进行加、减、乘、除等数学运算。

【例1·多选题】统计数据的计量尺度包括()。

A.科学尺度           B.定类尺度

C.定序尺度           D.定距尺度

E.定比尺度

[答案]BCDE

【例2·单选题】(2007年)将学生成绩分为优、良、中、及格和不及格五类,所采用的计量尺度是()。

A.定比尺度           B.定类尺度

C.定序尺度           D.定距尺度

[答案]C

【例3·多选题】(2004年)以定距尺度计量的统计数据可以进行()运算。

A.加    B.减    C.乘   D.除   E.比较大小

[答案]ABE

三、统计数据的类型

(一)统计数据的类型

按照所采用的计量尺度,可以将统计数据分为分类数据、顺序数据和数值型数据。

1.分类数据是由定类尺度计量形成的,表现为类别,通常用文字表述,但不区分顺序。

2.顺序数据是由定序尺度计量形成的,表现为类别,通常用文字表述,但有顺序。

分类数据和顺序数据都说明的是事物的品质特征,是不能用数值表示的,通常用文字表述,其结果表现为类别,因而统称为定性数据或品质数据。

3.数值型数据是由定距尺度和定比尺度计量形成的,说明的是现象的数量特征,通常用数值来表现,也可称为定量数据或数量数据。

【例1·多选题】按照所采用的计量尺度,统计数据可以分为()。

A.分类数据      B.实验数据     C.顺序数据

D.第二手数据     E.数值型数据

[答案]ACE

【例2·多选题】分类数据和顺序数据统称()

A.定性数据      B.品质数据

C.定量数据      D.第二手数据    E.数值型数据

[答案]AB

(二)变量及其类型

在统计中,把说明现象某种特征的概念称为变量,变量的具体表现为变量值。

变量可以分为分类变量、顺序变量、数值型变量。

数值型变量根据其取值的不同,可以分为离散变量和连续变量。

离散变量可以取有限个值,而且其取值都以整位数断开,可以一一列举;连续变量可以取无穷多个值,其取值是连续不断的,不能一一列举。

在社会经济问题研究中,当离散变量的取值很多时,也可以将离散变量当作连续变量来处理。

【例1·单选题】在统计中,把说明现象某种特征的概念称为()。

A.指标    B.变量    C.观察值    D.统计数据

[答案]B

【例2·单选题】产品产量属于()。

A.分类变量         B.顺序变量

C.数值型变量        D.时点变量

[答案]C

【例3·多选题】数值型变量根据其取值的不同,可以分为()。

A.离散变量       B.分类变量     C.连续变量

D.顺序变量       E.数值型变量

[答案]AC

【例4·多选题】(2004年、2005年)连续变量具有()的特点。

A.可以取无穷多个值   B.取值连续不断

C.只可以取有限个值   D.其取值都以整位数断开

E.取值不能一一列举

[答案]ABE

四、统计指标及其类型

统计指标按其所反映的内容或其数值表现形式,可分为总量指标、相对指标和平均指标三种。

1.总量指标

总量指标是反映现象总体规模的统计指标,通常以绝对数的形式来表现,因此又称为绝对数。

总量指标按其所反映的时间状况不同又可分为时期指标和时点指标。

(1)时期指标又称时期数,它所反映的是现象在一段时期内的总量。

时期数通常可以累积。

(2)时点指标又称时点数,它所反映的是现象在某一时刻上的总量。

时点数通常不能累积,各时点数累积后没有实际意义。

2.相对指标

相对指标是两个绝对数之比。

相对数的表现形式通常有比例和比率两种。

3.平均指标

平均指标又称平均数或均值,它所反映的是现象在某一空间或时间上的平均数量状况。

【例1·单选题】(2007、2008年)统计指标按其所反映的内容或其数值表现形式,可以分为总量指标、相对指标和()。

A.比例指标         B.比率指标

C.平均指标         D.变异指标

[答案]C

【例2·单选题】总量指标按其所反映的时间状况不同可分为时期指标和()。

A.离散指标         B.时点指标

C.相对指标         D.平均指标

[答案]B

【例3·单选题】(2008年)财政收入这一统计指标属于()。

A.相对指标         B.时期指标

C.时点指标         D.平均指标

[答案]B

【例4·多选题】(2008年)下列总量指标中,累积后没有实际意义的有()。

A.股票价格指数       B.煤炭生产总量

C.财政收入         D.商品零售额

E.年末人口数

[答案]AE

【例5·多选题】(2007年)下列指标中,属于相对指标的有()。

A.经济增长率     B.物价指数     C.股票价格

D.土地面积      E.商品零售额

[答案]AB

【例6·多选题】(2005年)下列统计指标中,属于相对指标的有()。

A.城镇登记失业率       B.人均居民个人卫生支出

C.居民消费价格指数      D.第三产业贡献率

E.人口自然增长率

[答案]ACDE

【例7·单选题】(2005年)经济增长率指标属于()。

A.总量指标          B.相对指标

C.平均指标          D.时点指标

[答案]B

五、统计数据的来源

从使用者的角度看,统计数据主要来源于两种渠道:

(1)来源于直接的调查和和科学试验,对使用者来说,这是统计数据的直接来源,称为第一手或直接的统计数据;

(2)来源于别人调查或试验的数据,对使用者来说,这是统计数据的间接来源,称为第二手或间接的统计数据。

(一)统计数据的直接来源

统计数据的直接来源主要有两个渠道:

(1)专门组织的调查,

(2)科学试验。

专门调查是取得社会经济数据的主要渠道;科学试验是取得自然科学数据的主要渠道。

实际中常用的统计调查方式主要有普查、抽样调查、统计报表等。

1.普查

普查是为某一特定目的而专门组织的一次性全面调查,如人口普查、经济普查等。

普查是适合特定目的、特定对象的一种调查方式,主要用于收集处于某一时点状态上的社会经济现象的基本全貌,为国家制定有关政策提供依据。

熟悉普查的特点:

(1)普查通常是一次性的或周期性的。

普查涉及面广、调查单位多,需要耗费大量的人力、物力和财力,通常需要间隔较长的时间。

(2)普查一般需要规定统一的标准调查时间,以避免调查数据的重复或遗漏,保证普查结果的准确性。

标准时间一般定为调查对象比较集中、相对变动较小的时间;(3)普查的数据一般比较准确,规范化程度也较高;(4)普查的使用范围比较窄,只能调查一些最基本及特定的现象。

2.抽样调查

抽样调查是实际中应用最广泛的一种调查方式和方法,它是从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种非全面调查。

关于抽样调查,需要掌握以下概念。

(1)总体:

所要调查研究的事物或现象的全体;

(2)个体:

组成总体的每个元素(成员);(3)总体容量:

一个总体中所含的个体的数量;(4)抽样:

为了推断总体的某些重要特征,需要从总体中按一定抽样技术抽取若干个体,将这一抽取过程称为抽样;(5)样本:

所抽取的部分个体;(6)样本容量:

样本中所含个体的数量。

掌握抽样调查的特点:

(1)经济性。

这是抽样调查的一个最显著优点。

(2)时效性强。

(3)适应面广。

抽样调查适用于对各个领域、各种问题的调查。

(4)准确性高。

抽样方法主要有两种:

概率抽样和非概率抽样。

概率抽样方法是根据一个已知的概率选取被调查者,无须调查人员在选样中判断或抽选。

概率抽样有以下几种形式:

(1)简单随机抽样。

它是最基本的形式,是完全随机地选择样本。

(2)分层抽样。

分层抽样可以有效降低估计误差。

(3)整群抽样。

是将一组被调查者视作一个抽样单位而不是个体的抽样方法。

(4)等距抽样。

又称系统抽样,是在样本框中每隔一定距离抽选一个被调查者。

非概率抽样不是依据随机原则选取样本。

非概率抽样容易实施,成本较低,但不适于推断总体的项目。

统计报表是我国目前收集统计数据的一种重要方式,统计报表是按照国家有关法规的规定,自上而下地统一布置、自下而上地逐级提供基本统计数据的一种调查方式。

统计报表要以一定的原始数据为基础,按照统一的表式、统一的指标、统一的报送时间和报送程序进行填报。

按调查对象范围的不同可分为全面报表和非全面报表。

按报送周期长短不同可分为日报、月报、季报、年报等,按报表内容和实施范围不同可分为国家的、部门的、地方的统计报表。

除上面介绍的三种主要调查方式外,实际工作中也常用到重点调查和典型调查。

重点调查是从调查对象的全部单位中选择少数重点单位进行调查。

典型调查是从调查对象的全部单位中选择一个或几个有代表性的单位进行全面深入的调查。

典型调查主要是一种定性调查研究。

【例1·多选题】实际中常用的统计调查方式主要有()。

A.普查       B.科学试验     C.抽样调查

D.统计报表     E.文献收集

[答案]ACD

【例2·多选题】普查是()。

A.一次性调查    B.全面调查     C.典型调查

D.非全面调查    E.经常性调查

[答案]AB

【例3·单选题】(2006年)能够根据样本结果推断总体数量特征的调查方式是()。

A.重点调查     B.抽样调查     C.典型调查

D.所有非全面调查

[答案]B

【例4·多选题】(2006年)与普查相比,抽样调查具有()的特点。

A.适应面广     B.经济性    C.耗费大量的人力、物力、财力

D.时效性强     E.周期性

[答案]ABD

【例5·单选题】统计报表按调查对象范围的不同可分为全面报表和()。

A.月报     B.日报    C.非全面报表    D.部门报表

[答案]C

【例6·多选题】(2008年)下列调查方式中,属于非全面调查的有()。

A.重点调查          B.抽样调查

C.典型调查          D.普查

E.全面报表

[答案]ABC

(二)统计数据的间接来源

第二手统计数据的主要来源有公开的出版物、未公开的内部调查等。

对于未公开发表的内部调查数据,应注意保密及合理使用等问题。

利用间接来源的统计数据,必须注意几个问题。

(1)要评估第二手数据的可用价值;

(2)要注意指标的含义、口径、计算方法是否具有可比性,避免误用和滥用;(3)注意弥补缺失数据和进行质量检查;(4)引用统计数据时,一定要注明数据来源。

【例1·单选题】(2005年)从使用者角度看,从()中取得的统计数据是第二手统计数据。

A.经济普查         B.农产量抽样调查

C.《中国人口统计年鉴》   D.固定资产投资月度统计报表

[答案]C

【例2·多选题】(2007年)使用第二手统计数据,必须注意()。

A.引用数据时一定要注明数据来源

B.要评估第二手统计数据的可用价值

C.指标的含义、口径、计算方法是否具有可比性

D.对不完整的历史数据要根据需要和可能设法进行适当的补充

E.不能纠正存在问题的历史数据

[答案]ABCD

六、统计数据的质量

(一)统计数据的误差、误差的来源(掌握)

统计数据的误差通常是指统计数据与客观现实之间的差距,误差有登记性误差和代表性误差两类。

1.登记性误差是调查过程中由于调查者或被调查者的人为因素所造成的误差。

从理论上讲,登记性误差是可以消除的。

2.代表性误差主要是指在用样本数据进行推断时所产生的随机误差。

其产生的原因主要有:

(1)抽取样本时没有遵循随机原则;

(2)样本结构与总体结构存在差异;(3)样本容量不足等。

这类误差通常是无法消除的,但事先可以进行控制或计算。

【例1·单选题】统计误差包括登记性误差和()。

A.代表性误差       B.调查对象遗漏

C.计算机录入错误     D.虚报瞒报

[答案]A

【例2·单选题】(2005年)抽样时,由于样本容量不足造成的误差与因为()造成的误差,都属于代表性误差。

A.被调查者有意虚报    B.数据汇总错误

C.填报错误        D.没有遵循随机原则

[答案]D

【例3·多选题】(2008年)代表性误差形成的原因主要有()。

A.抽样没有遵循随机原则

B.有意虚报、瞒报

C.抄录错误

D.样本容量不足

E.样本结构与总体存在差异

[答案]ADE

【例4·单选题】(2006年)无法消除,但事先可以进行控制或计算的误差是()。

A.登记性误差

B.有意虚报、瞒报造成的误差

C.抄录错误造成的误差

D.代表性误差

[答案]D

(二)统计数据的质量要求及检查

就一般的统计数据而言,可将其质量评价标准概括为六个方面:

(1)精度,即最低的抽样误差或随机误差;

(2)准确性,即最小的非抽样误差或偏差;

(3)关联性,即满足用户决策、管理和研究的需要;

(4)及时性,即在最短的时间里取得并公布数据;

(5)一致性,即保持时间序列的可比性;

(6)最低成本,即在满足以上标准前提下,以最经济的方式取得数据。

第二十一章 统计数据的整理与显示

一、品质数据的整理与显示

对品质数据主要是做分类整理,对数值型数据主要是做分组整理。

(一)分类数据的整理与显示

在整理分类数据时,除了要列出所分的类别外,还要计算出每一类别的频数、频率或比例、百分比,同时选择适当的图形进行显示。

1.分类数据的整理

(1)频数与频数分布

频数:

也称次数,是落在各类别中的数据个数。

频数分布:

也称次数分布,把各个类别及其相应的频数全部列出来就是频数分布或称次数分布。

将频数分布用表格的形式表现出来就是频数分布表。

表4-1 2000年北京市贫困家庭人均消费水平及消费结构

消费支出类型

金额(元)

比例

百分比(%)

食品

衣着

家庭设备用品服务

医疗保健

交通通信

娱乐教育文化

居住

杂项商品及服务

人均消费性支出总计

1759.04

301.93

264.71

158.16

207.55

452.58

267.58

195.53

3607.08

0.4876

0.0837

0.0734

0.0438

0.0575

0.1255

0.0742

0.0542

1

48.76

8.37

7.34

4.38

5.75

12.55

7.42

5.42

100.00

(2)比例

比例是一个总体中各个部分的数量占总体数量的比重,通常用于反映总体的构成或结构。

各部分的比例之和等于l。

(3)百分比

将比例乘以l00就是百分比或百分数,它是将对比的基数抽象化为100而计算出来的,用%表示。

当分子的数值很小而分母的数值很大时,也可以用千分数(‰)来表示比例

(4)比率

比率是各不同类别的数量的比值。

它是一个总体中各不同部分的数量对比。

比率的比值可能大于l。

为方便起见,比率可以不用1作为基数,而用100或其他便于理解的数作为基数。

【例题·单选题】(2004年)根据第五次全国人口普查的结果,我国男性占总人口的51.63%,女性占总人口的48.37%,那么人口的性别比为()。

A.100︰106.74      B.93.67︰100

C.106.74︰100      D.100︰93.67

[答案]C

[解析]51.63%:

48.37%=106.74:

100

在经济和社会问题的研究中,经常使用比率。

2.分类数据的图示

反映分类数据的图示方法,主要是条形图和圆形图。

类型

描述

例图

条形图

用宽度相同的条形的高度或长短来表示数据变动的图形。

可以横置或纵置,纵置时也称为柱形图;有单式、复式等形式

教材194页图4-l

圆形图

也称饼图,是用圆形及圆内扇形的面积来表示数值大小的图形,对于研究结构性问题十分有用

教材194页图4-2

图4-1 2000年北京市贫困家庭消费支出的分布

图4-2 2000年北京市贫困家庭消费支出的构成

【例题1·多选题】在对分类数据进行整理时,落在各类别中的数据个数被称为()。

A.频数   B.指数   C.次数   D.百分比   E.比例

[答案]AC

【例题2·单选题】比例是一个总体中各个部分的数量占总体数量的比重,各部分的比例之和()。

A.大于1   B.小于1   C.等于1   D.等于100

[答案]C

【例题3·单选题】百分比就是将()乘以100而得到的百分数。

A.比率    B.比例    C.极差    D.组中值

[答案]B

【例题4·单选题】(2007年)计算我国国内生产总值中的第一、二、三产业产值之比,是采用了计算()的数据整理方法。

A.比例    B.均值    C.比率   D.百分比

[答案]C

【例题5·单选题】用圆形及圆内扇形的面积来表示数值大小的图形是()。

A.拆线图   B.长形图   C.直方图   D.圆形图

[答案]D

(二)顺序数据的整理与显示

分类数据的整理与显示方法,也都适用于对顺序数据的整理与显示。

但有些方法适用于对顺序数据的整理与显示,却不适用于分类数据。

对于顺序数据,除了可使用上面的整理与显示技术外,还可以计算累积频数和累积百分比。

1.累积频数和累积百分比

(1)累积频数:

就是将各类别的频数逐级累加起来。

其方法有两种:

向上累积和向下累积。

通过累积频数,可以很容易看出某一类别(或数值)以下及某一类别(或数值)以上的频数之和。

(2)累积百分比:

就是将各类别的百分比逐级累加起来,也有向上累积和向下累积两种方法。

表4-2 某国有企业工人工资状况

工资等级

工人数(人)

百分比(%)

向上累积

向下累积

工人数(人)

百分比(%)

工人数(人)

百分比(%)

一级

二级

三级

四级

五级

六级

七级

八级

100

125

105

80

50

35

25

10

18.9

23.6

19.8

15.1

9.4

6.6

4.7

1.9

100

225

330

410

460

495

520

530

18.9

42.5

62.3

77.4

86.8

93.4

98.1

100.0

530

430

305

200

120

70

35

10

100.0

81.1

57.5

37.7

22.6

13.2

6.6

1.9

合计

530

100.0

_

_

_

_

2.顺序数据的图示

根据累积频数或累积频率,可以绘制累积分布图。

【例题·多选题】计算累积频数的两种方法是()。

A.加权    B.简单平均     C.向上累积

D.开方    E.向下累积

[答案]CE

二、数值型数据的整理与显示

(一)数据的分组

数据分组就是根据统计研究的需要,将数据按照某种标准划分成不同的组别。

分组后再计算出各组中出现的次数或频数,形成一张频数分布表。

分组的方法有单变量值分组和组距分组两种:

(1)单变量值分组是把每一个变量值作为一组,这种分组方法通常只适合于离散变量且变量值较少的情况。

在连续变量或变量值较多的情况下,通常采用组距分组。

(2)组距分组是将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。

例如,某高中一年级一班共有55名学生,高一语文中成绩分别为:

59  73  87  65  89  85  77  94  69  97

56  80  68  95  96  50  63  88  91  90

96  92  93  79  74  65  74  89  83  51

74  79  94  67  92  92  93  70  87  86

54  87  86  54  62  76  86  73  86  70

100 110 108  102 112

采用组距分组的步骤:

第一步,确定分组组数

确定分组组数的要求是:

(1)划分的组数,既不应太多也不应太少;

(2)组数的确定,要尽量保证组间资料的差异性与组内资料的同质性;(3)采用的分组办法,要能够充分显示客观现象本身存在的状态。

关于统计分组组数问题,斯特基给出的计算公式为:

(了解即可)

k=1+

第二步,对原始资料进行排序

第三步,求极差

将最大的观察值与最小的观察值相减便得到极差

第四步,确定各组组距

在实行等距分组的情况下,组距的确定办法为:

组距=

最好把组距取成接近于能被5除尽的一个数。

掌握:

组距与组数成反比关系,组数越多,组距越小,组数越少,组距越大。

组距是每组观察值的最大差,即每组的上限值与下限值之间的差。

组距=某组的上限值-该组的下限值

第五步,确定组限

组限是组与组之间的界限,或者说是每组观察值变化的范围。

组限有上限与下限之分;上限与下限的差值称为组距;上限值与下限值的平均数称为组中值。

组中值=

确定组限时应注意:

(1)第一组的下限值应比最小

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 初中教育 > 语文

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1