统计方法.docx

上传人:b****8 文档编号:10665511 上传时间:2023-02-22 格式:DOCX 页数:49 大小:65.42KB
下载 相关 举报
统计方法.docx_第1页
第1页 / 共49页
统计方法.docx_第2页
第2页 / 共49页
统计方法.docx_第3页
第3页 / 共49页
统计方法.docx_第4页
第4页 / 共49页
统计方法.docx_第5页
第5页 / 共49页
点击查看更多>>
下载资源
资源描述

统计方法.docx

《统计方法.docx》由会员分享,可在线阅读,更多相关《统计方法.docx(49页珍藏版)》请在冰豆网上搜索。

统计方法.docx

统计方法

统计方法

第一章      统计和数据

本部分知识结构:

本部分考点:

1.统计学中的几个基本概念(变量、数据、数据类型)

2.了解数据来源的主要渠道

3.掌握常用搜集数据的方法、特点及应用条件。

第一节  统计学的含义

一.什么是统计学

统计学是一门研究数据的科学,按大百科全书的定义:

统计学是用以收集数据,分析数据和由数据得出结论的一组概念、原则和方法。

统计分析数据分两种:

描述统计和推断统计 

[例题·单选题] 研究如何利用样本数据来推断总体特征的统计学方法是(    )。

A.描述统计                                                            B.理论统计

C.推断统计                                                             D.应用统计

答案:

C

描述统计是研究数据搜集、处理和描述的统计学方法。

其内容包括如何取得研究所需要的数据,如何用图表形式对数据进行处理和展示,如何通过对数据的综合、概括与分析,得出所关心的数据特征。

推断统计则是研究如何利用样本数据来推断总体特征的统计学方法,内容包括参数估计和假设检验两大类。

 二.统计的应用

(一)统计的应用领域

[例题·判断题]统计是适用于所有科学领域的通用数据分析方法。

答案:

正确。

统计是适用于所有学科领域的通用数据分析方法,是一种通用的数据分析语言。

无论是在社会科学领域,还是在自然科学领域,进行某个课题的研究时,为使观点与结论具有事实依据和说服力,必须根据调查研究或实验取得的统计数据来说明问题,这需要运用科学地统计方法来进行。

(二)统计的误用与滥用

统计常常被人们有意或无意地滥用。

如,错误的统计定义、错误的图表提示、一个不合理的样本、数据的遗漏或逻辑错误等。

这些误用有些是常识性的,有些是技术性的,有些则是故意的。

作为从数据中寻找事实的统计,却被有人变成了歪曲事实的工具。

第二节 数据类型

一.变量与数据

[例题·判断题]变量是数据的具体体现。

答案:

错误。

变数或变量,是指没有固定的值,可以改变的数。

变量的具体数值称为变量值,即数据。

统计数据就是统计变量的具体表现。

 

二.数据类型

(一)定性变量(数据)与定量变量(数据)

定性变量:

反映“职业”、“教育程度”等现象的属性特点的变量,不能说明具体量的大小和差异。

分类变量:

没有量的特征,只有分类特征。

这种只反映现象分类特征的变量又称分类变量。

分类变量的观测结果就是分类数据。

说明事物类别的一个名称。

如“性别”就是一个分类变量。

顺序变量:

如果类别具有一定的顺序,如,“教育类别”,这样的变量称为顺序变量,相应的观察结果就是顺序数据。

说明事物有序类别的一个名称,这类变量的具体表现就是顺序数据。

数值(定量)变量:

反映“天气温度”、“月收入”等变量可以用数值表示其观察结果,而且这些数值具有明确的数值含义,不仅能分类而且能测量出来具体大小和差异。

这些变量就是定量变量也称数值变量,定量变量的观察结果成为定量数据。

说明事物数字特征的一个名称。

分类变量没有数值特征,所以不能对其数据进行数学运算。

分类数据只能用来区分事物,而不能用来表明实物之间的大小、优劣关系。

顺序变量比分类变量向前进一步,它不仅能用来区分客观现象的不同类别,而且还可以表明现象之间的大小、高低、优劣关系。

显然,顺序数据的功能比分类数据要强一些,对事物的划分也更精细一些。

但顺序数据的数据之间虽然可以比较大小,却无法计算相互之间的大小、高低或优劣的距离。

只是反映事物在性质上的差异,而不能用来反映事物在数量上的差异。

因此,从本质上,顺序数据仍然是定性数据中的一种。

数值型数据作为统计研究的主要资料,其特征在于它们都是以数值的形式出现的,有些数值型数据只可以计算数据之间的绝对差,而有些数值型数据不仅可以计算数据之间的绝对差,还可以计算数据之间的相对差。

其计量精度远远高于定性数据。

在统计学研究中,对数值型数据的研究是定量分析的主要内容。

从上述三种数据的基本特点可以看出,这三类数据对事物的描述是由定性到定量、由低级到高级,从粗略到精细。

在统计研究中,需要明确各种数据所适用的统计方法,正确的选择和应用,这是正确进行统计研究的基本要求。

[例题·单选题]下列选项中属于分类变量的是(    )。

A.服务满意度                                                        B.员工人数

C.籍贯                                                                      D.利润

答案:

C

解析:

分类变量没有量的特征,只有分类特征。

分类变量的观测结果就是分类数据。

[例题·单选题] 若产品质量由高到低划分为三个级别:

1级、2级、3级,则下列说法中正确的是(    )。

   A.1级品的质量是2级品的两倍    B.2级品的质量是1级品的两倍

    C.产品质量级别是顺序数据    D.产品质量级别是定量数据

答案:

C

解析:

产品质量级别是顺序数据,无法计算相互之间的大小,是定性变量。

[例题·单选题]顺序数据(    )。

    A.是一种定量数据

    B.可以进行排序,表明事物之间的大小、优劣关系等

    C.可以反映事物在数量上的差异

    D.其计算功能与数值型数据相同

答案:

B

解析:

顺序数据的数据之间虽然可以比较大小,却无法计算相互之间的大小、高低或优劣的距离。

只是反映事物在性质上的差异,而不能用来反映事物在数量上的差异。

(二)观测数据和实验数据

按获取数据的方法不同,可分为观测数据和实验数据。

观测数据可能是全面数据也可能是样本数据(局部),实验数据一般都是样本数据。

1.       观测数据。

观测数据是对客观现象进行实地观测所取得的数据,在数据取得的过程中一般没有人为的控制和条件约束。

在社会经济问题研究中,观测是取得数据最主要的方法。

2.       实验数据。

实验数据一般是在科学实验环境下取得的数据。

在实验中,实验环境是受到严格控制的,数据的产生一定是某一约束条件下的结果。

在自然科学研究中实验的方法应用非常普遍。

[例题·单选题]根据获取方法不同,数据可分为观测数据和(    )。

2010年

    A.描述数据    B.实验数据

    C.推断数据    D.分析数据

答案:

B

解析:

按获取数据的方法不同,可分为观测数据和实验数据。

[例题·单选题]下列关于变量数据的说法错误的是(    )。

2010年

    A.分类数据只能用来区分事物,不能用来表明事物间的大小、优劣

    B.顺序数据具有数值特征,可以用于反映事物在数量上的差异

    C.数值型数据的计量功能要大于分类数据和顺序数据

    D.在统计学研究中,对数值型数据的研究是定量分析的主要内容

答案:

B

解析:

顺序数据的数据之间虽然可以比较大小,却无法计算相互之间的大小、高低或优劣的距离。

只是反映事物在性质上的差异,而不能用来反映事物在数量上的差异。

 第三节  数据来源与搜集数据的方法

一.数据的来源

从使用者的角度看,统计数据资料的来源主要有两种渠道:

一种是通过直接的调查或实验获得的原始数据,这是统计数据的直接来源,一般称为原始或第一手统计数据;另一种是别人调查的数据,并将这些数据进行加工和汇总后公布的数据,通常称为次级数据或第二手间接的统计数据。

一切间接的统计数据都是从原始的、第一手数据过渡而来的。

(一)  数据的直接来源——原始数据

搜集数据最基本的形式就是进行统计调查或进行实验活动,统计调查或进行实验就是统计数据的直接来源。

1.       统计调查

统计调查是指根据统计研究预定的目的、要求和任务,运用科学的方法,有计划、有组织地向客观实际搜集资料的过程。

通过统计调查得到的数据,一般称为观测数据。

2.       实验法

  实验法是直接获得统计数据的又一重要来源。

通过实验法得到的数据就是实验数据。

实验法不仅是一种搜集数据的方式,也是一种重要的研究方式。

它是通过有意识地改变或控制某些输入变量,观察其他输出变量的变化,从而达到对事物本质或相互联系的认识。

未来观察对输入变量的控制是否导致了输出变量的改变,在实验中,往往需要将研究对象分为两个组,一个是实验组,一个是对照组,对实验组的输入变量加以控制或改变,而对照组则不加控制,根据两组的输出结果,可以看到输入变量对输出变量的影响。

运用实验法要注意的是:

首先,实验组和对照组的产生应当是随机的,研究对象的不同单位应当被随机地分配到实验组或对照组,而不应是经过有意识的挑选的。

其次,实验组和对照组还应当匹配的,也就是研究对象的背景资料应当是大体相同的,至少不要差异太大。

不论是统计调查还是实验,所搜集的数据都是原始数据,这是统计数据最基本的来源。

 

(二)数据的间接来源——次级数据

虽然统计数据的搜集主要是指对原始数据的搜集,后面介绍的统计调查的方法也是围绕搜集原始资料展开的,但数据的收集实际上不仅包括对原始数据的收集也包括对次级数据(第二手收据)的收集,在很多情况下,统计研究都是在掌握次级数据的基础上进行的。

次级数据是指由其他人搜集和整理得到的统计数据。

这种来自他人调查整理基础上的数据我们把它称为数据的间接来源。

数据的间接来源有:

(1)公开出版的统计数据,主要来自官方的统计部门和政府、组织、学校、科研机构。

(2)尚未公开发表的统计数据,如各企业的经营报表数据、专业调查咨询机构为公开发布的调查结果数据。

需注意的是,如果公开引用未公开发表的数据需要征得数据所有者的同意,同时要为自己发布的数据负责。

恰当地运用间接数据在实际中往往能够节约时间和费用,取得较好的成果和效益,因此,成为许多统计研究人员在进行实证分析时的首选数据来源。

但在应用时要注意:

(1)是否了解并正确理解了间接数据中变量的含义、计算口径、计算方法,以防止误用、错用他人的数据。

(2)引用间接数据时要注明数据来源,尊重他人的劳动成果和知识产权。

[例题·多选题] 统计数据的直接来源有(    )。

A.统计调查                                                          B.文献检索

C.实验                                                                    D.调查机构发布的调查结果

E.图书中数据

答案:

AC

解析:

统计调查或进行实验就是统计数据的直接来源。

 

二.搜集数据的方法

统计调查是根据调查的目的与要求,运用科学的调查方法,有计划、有组织第搜集统计数据资料的过程。

常用的统计调查种类有:

(一)  普查

普查:

普查是专门组织一次性的全面调查,用来调查属于一定时点或时期内的社会经济现象的总量。

它适用于搜集某些不能或不适宜于定期的全面统计报表搜集的统计资料,以摸清重大的国情、国力。

如,人口普查、全国第三产业普查等。

普查要遵循以下几点:

a.确定普查的标准时间:

普查的标准时间是指登记调查单位项目所依据的统计时点。

所有的调查资料都必须是反映这一时点上的情况。

例如,我国第四人口普查,1990年7月1日零时为普查登记的标准时点。

凡是在这个时点以前死亡和这个时点以后出生的,都不能计入这次普查的人口数内。

这样才可避免所登记的生重复或遗漏。

b.普查的登记工作应在整个普查范围内同时进行,以保证普查资料的实效性、准确性,避免资料的搜集工作拖的太久

c.同类普查的内容和时间在历次普查中应尽可能保持连贯性。

普查的组织形式有两种:

一种是组织专门的普查机构,派专门的调查人员对被调查单位直接进行登记;另一种是利用一定的组织系统,由被调查单位根据本单位的原始记录和实际情况,填写调查表,然后上报。

 

(二)  抽样调查

抽样调查:

抽样调查是按随机原则,从总体中抽取一部分单位作为样本来进行观察,并根据其观察的结果来推断总体数量特征的一种非全面调查方法。

随机抽样一般是指每个总体单位都有同等被抽中的机会,但是在实际调查中,并不完全是这种情况。

通常采用的抽样组织形式主要有以下几种:

a.简单随机抽样:

又称纯随机抽样,它是指对总体不作任何处理,不进行分类也不进行排除,而是完全按随机的原则,直接从总体中抽取样本单位加以观察。

从理论上说,是最符合抽样调查的随机原则,是抽样调查的最基本形式。

具体方法有:

直接抽选法、抽签法和随机数表法。

b.分层抽样:

又称类型抽样或分类抽样。

是先将总体各单位按主要标志加以分层,而后在各层中按随机的原则抽取若干样本单位,由各层的样本单位组成一个样本。

c.等距抽样:

又称机械抽样或系统抽样。

它是将总体全部单位按某一标志排队,而后按固定的顺序和相等间隔在总体中抽取若干样本单位,构成一个容量为n的样本。

d.整群抽样:

是将总体各单位划分为若干群,然后以群为单元,从总体中随机抽取一部分群,对被抽中的群内所有单位进行全面调查。

整群抽样对总体划分群的基本要求是:

第一,群与群之间不重叠,即总体中的任一单位只能属于某个群;第二,全部总体单位毫无遗漏,即总体中的任一单位必须属于某个群。

e.多阶段抽样:

当总体很大时,可把抽样过程分成几个过渡阶段,到最后才具体抽到样本单位。

 

(三)  统计报表

统计报表制度:

它是按照国家统一规定的调查要求与文件(指标、表格形式、计算方法等)自下而上的提供统计资料的一种报表制度。

在官方统计的经常调查中目前依然发挥着一定的作用。

对于大型、国有企业来说,利用统计报表搜集数据,具有时间快、成本低的优点,但对于大量的小型、非国有经济单位,则难以全面采用统计报表调查。

 

(四)  重点调查

重点调查:

是一种非全面调查,它是在调查对象中选择一部分对全局具有决定性作用的重点单位进行调查。

适用于调查任务只要求掌握调查总体的基本情况,调查标志比较单一,调查标志表现在数量上集中于少数单位,而这些少数单位的标志值之和在总体中又占绝对优势的情况。

重点调查组织方式有两种:

一是专门组织的一次性调查;另一种是利用定期统计报表经常性地对一些重点单位进行调查。

其优点是花费较少人力、物力,在较少时间内及时取得有关的基本情况。

 

(五)  典型调查

典型调查:

根据调查的目的与要求,在对被调查对象进行全面分析的基础上,有意识地选择若干具有典型意义的或有代表性的单位进行调查,主要作用是:

第一,补充全面调查的不足;第二,在一定条件下可以验证全面调查数据的真实性。

其优点是灵活机动、通过少数典型即可取得深入详实的统计资料,缺点是受“有意识地选出若干有代表性”的限制,易受人们主观认识上的影响,必须同其他调查结合起来使用,才能避免出现片面性。

 

表一  各类统计调查方法的特点

 

调查范围

调查时间

收集资料的方法

普查

全面

一次

采访、报告或空间遥感

抽样调查

非全面

经常或一次

直接观察或采访

统计报表

全面或非全面

经常

报告

重点调查

非全面

经常或一次

报告

典型调查

非全面

一次

采访

 

[例题·单选题] 抽样调查的主要目的是()

A.用样本指标来推算总体指标  

B.对调查单位作深入研究

C.计算和控制抽样误差  

D.广泛运用数学方法

答案:

A

[例题·判断题] 重点调查和典型调查属于抽样调查的范畴,是非全面调查。

答案:

×

解析:

重点调查和典型调查、抽样调查都是非全面调查。

 [例题·单选题]某市对占该地交通运输业总产值三分之二的六个运输企业进行调查,这种调查方法叫(     )。

A.普查    B.典型调查     C.抽样调查   D.重点调查

答案:

D

 

本章小结:

1.统计分析数据的方法——描述统计与推断统计

2.数据的类型——定性变量和定量变量

3.数据的类型——观测数据和实验数据

4.数据的来源——原始数据和次级数据

5.统计调查——普查、抽样调查、统计报表、重点调查、典型调查

  第二章   数据描述

本部分知识结构:

 

 

本部分考点:

1.根据数据的类型,选择不同的统计图表对数据进行描述

2.使用不同的统计量反映数据的集中趋势、离散程度

第一节  用图表展示定性数据

本节主要介绍定性数据的图表展示方法。

定性数据包括分类数据和顺序数据,它们的图表展示方法基本相同。

通常可以用频数分布表和图形来描述。

一.生成频数分布表

定性数据本身是对事物的一种分类,因此,只要先把所有的类别都列出来,然后统计出每一类别的频数,就是一张频数分布表。

频数分布表中落在某一特定类别的数据个数称为频数。

频数分布包含了很多有用的信息,通过它可以观察不同类型数据的分别情况。

见课本[例2.1],用Excel生成定性数据频数分布表的途径,用“数据透视表”进行计数和汇总。

[例题·单选题]在某一特定类别中的数据个数称为(    )。

A.均值                                                   B.众数

C.标准差                                               D.频数

答案:

D

解析:

频数分布表中落在某一特定类别的数据个数称为频数。

频数分布包含了很多有用的信息,通过它可以观察不同类型数据的分别情况。

 

二.定性数据的图形表示

定性数据(分类数据和顺序数据)可以描绘出它们各类的比例,常用饼图和条形图表示。

(一)   饼图

饼图又称圆饼图、圆形图等,它是利用圆形及圆内扇形面积来表示数值大小的图形。

饼图主要用于总体中各组成部分所占比重的研究。

(二)   条形图

条形图是用宽度相同的条形的高度或长度来表述数据多少的图形,用于观察不同类别数据的多少或分布情况。

(三)   环形图

饼图只能显示一个变量(如年龄变量)各部分所占的比重。

如果我们想比较不同变量之间的结构差异,就可以通过环形图来实现。

首先,利用产生频数表的方法先做出分性别的年龄分布表

然后,根据上表再绘制出环形图。

[例题·单选题] 条形图是利用宽度相同的条形的(    )来表述数据多少的图形。

    A.面积    B.高度或长度

    C.频数    D.类别

答案:

B

解析:

条形图是用宽度相同的条形的高度或长度来表述数据多少的图形,用于观察不同类别数据的多少或分布情况。

第二节  用图表展示定量数据

定性数据的图示表示方法,也都适用于定量数据。

但定量数据还有一些特定的图示方法,它们并不适用于定性数据。

一.生成频数分布表

生成定量数据的频数分布表时,首先是将数据进行分组,然后再统计出各组别的数据频数即可。

首先,要对数据进行分组

其次,要确定组距。

所谓组距是指每个组变量值中的最大值与最小值之差。

每组最大值称为该组上限,最小值称为该组下限。

则组距等于上限与下限之差,即

组距=上限-下限

在确定组距是,一般应掌握的原则:

一是要考虑各组的划分是否能区分总体内部各个组成部分的性质差别。

如果不能正确反映各部分质的差异,必须重新分组。

二是要能准确地清晰地反映总体单位的分布特征。

在确定组距时,在研究的现象变动比较均匀的情况下,可以采用等距分组;而当研究的现象变动很不均匀时,例如急剧的增长或急剧的下降,波动的幅度很大时,则一般采用不等距分组。

在实际工作中,要结合实际情况确定各组的组距。

最后,统计出各组的频数及频数分布表。

在统计各组频数时,恰好等于某一组的组限时,则采取上限不在内的原则,即将该频数计算在与下限相同的组内。

 

二.定量数据的图形表示

常用来表述定量数据统计图形有:

直方图、折线图和散点图。

此外还有茎叶图、箱线图等,由于EXCEL不能实现这些图,所以这里不作介绍。

(一)   直方图

对于一个定量数据,直方图是一个常见的而且非常重要的图形。

它的横坐标代表变量分组,纵指标代表各变量值出现的频数,这样,各组与相应的频数就形成了一个矩形,即直方图。

(二)   折线图

折线图是利用线段的升降来说明现象变动的一种统计图,它主要用于表示现象的分配情况、现象在时间上的变化和两个现象之间的依存关系等。

(三)   散点图

散点图能反映两个变量的关系,判断其变化的方向是否相同

[例题·单选题]生成定量数据的频数分布表时,首先要对数据(  )

A.分类     B.确定组距    C.分组   D.确定组频数

答案:

C

解析:

生成定量数据的频数分布表时,首先是将数据进行分组,然后再统计出各组别的数据频数即可。

[例题·单选题]下列图形中不能在Excel当中实现的是(    )。

    A.直方图    B.折线图

    C.箱形图    D.散点图

答案:

C

解析:

常用来表述定量数据统计图形有:

直方图、折线图和散点图。

此外还有茎叶图、箱线图等,由于EXCEL不能实现这些图。

第三节  用统计表来表示数据

统计表和统计图是显示统计数据的两种方式。

在现实生活中,统计表和统计图形一样充斥在我们的生活中。

它通过对枯燥数据的整理,利用一些简单的表格,让我们一目了然地了解某些事物的现象。

统计表是一种用密集的形式归纳数据的方法,它主要利用行和列中的数据来表述现象特征。

人们利用统计表的主要目的有:

一是在文章中使用它以支持自己的观点;二是利用它组织数据。

 

把整理汇总得出的统计数据资料,按照一定的结构和顺序,有系统地排列在一定的表格内,就形成一张统计表。

统计表的主要优点是:

能使统计资料条理化、系统化,能清晰的表达统计资料的内容,且简明易懂、节省篇幅,便于对表中资料进行对比,并易于检查数字的完整性和正确性。

统计表的结构

    

1.总标题:

统计表的名称。

简明扼要,一般放在表格上方中间位置

2.横行标题和纵栏标题:

纵栏:

表明标志和指标的名称,一般置于表格上方;横行标题:

表明调查单位和分组的名称,一般置于表格左边。

3.统计数字(指标数值)。

主词栏:

表中资料所说明的对象,位于表的左边;宾词栏:

各种指标,位于表的右侧。

4.注解或资料来源。

[例题·多选题] 下列关于统计表的说法中,正确的有(    )。

A.统计表是组织数据的一种有效形式

B.表头放在统计表的上方

C.行标题放在统计表的第二行

D.统计表的左右两边不能封口

E.统计表可用来支持使用者的观点

答案:

ABDE

解析:

统计表是一种用密集的形式归纳数据的方法,它主要利用行和列中的数据来表述现象特征。

行标题放在统计表的第一列,第一行是列标题。

第四节  用数字来概括数据

针对一组数据的分布特征,我们可以从两个方面来考查它:

一是该组数据的集中趋势,即该组数据的数值向其中心值的靠拢程度。

二是该组数据的离散程度,它反映的是该组数据的各个数值远离其中心的趋势和程度。

一.定性数据的数字特征

由于定性数据主要是计数,比较简单,对定性数据的集中趋势常用的方法就是计算比例、百分比、中位数和众数。

中位数是将总体各单位标志值按大小顺序排列,处于中间位置的那个数(如果样本量为奇数),或者中间两个数目的平均(如果样本量为偶数)。

众数就是数据中出现次数或出现频率最多的数值。

在定性数据中,由于记录的是频数,因此众数用得多些。

[例题·单选题]下列指标中不能反映定性数据的集中趋势的是(    )。

    A.百分比    B.中位数

    C.平均数    D.众数

答案:

C

解析:

定性数据的集中趋势常用的方法就是计算比例、百分比、中位数和众数。

 

二.定量数据的数字特征

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 求职职场 > 简历

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1