统计中级职称考试统计方法复习要点_精品文档Word文件下载.doc
《统计中级职称考试统计方法复习要点_精品文档Word文件下载.doc》由会员分享,可在线阅读,更多相关《统计中级职称考试统计方法复习要点_精品文档Word文件下载.doc(9页珍藏版)》请在冰豆网上搜索。
![统计中级职称考试统计方法复习要点_精品文档Word文件下载.doc](https://file1.bdocx.com/fileroot1/2022-10/6/32155d46-2fdd-4cbc-bf47-7e84430a246c/32155d46-2fdd-4cbc-bf47-7e84430a246c1.gif)
这类数据的最大特点是它只能反映现象的属性特点,而不能说明具体量的大小和差异,只有分类特征,没有量的特征;
这种只能反映现象分类特征的变量又称为分类变量,分类变量的观察结果就是分类数据。
如果类别具有一定的顺序,这样的变量称为顺序变量,相应的观察结果就是顺序数据。
分类变量没有数值特征,所以不能对其数据进行数学运算。
由此可见,定性数据只能用来区分事物,而不能用来表明事物之间的大小、优劣关系。
顺序变量比分类变量向前进了一步,它不仅能用来区分客观现象的不同类别,而且还可以表明现象之间的大小、高低、优劣关系。
显然,顺序数据的功能比分类数据要强一些,对事物的划分也更精细了一些。
(2)具有明确的数值含义,不仅能分类而且能测量出来具体大小和差异的变量就是定量变量,也称为数值变量,定量变量的观察结果成为定量数据。
作为统计研究的主要资料,数值型数据的特征在于它们都是以数值的形式出现的,有些数值型数据只可以计算数据之间的绝对差(绝对距离),而有些数值型数据不仅可以计算数据之间的绝对差,还可以计算数据之间的相对差(相对距离)。
显然,数值型数据的计量功能要远大于前面介绍的两种定性数据,其计量精度也远远高于定性数据。
因此,在统计研究中,数值型数据有着最广泛的用途。
2.观测数据和实验数据
观测数据是对客观现象进行实地观测所取得的数据,在数据取得的过程中一般没有人为的控制和条件约束。
在社会经济问题研究中,观测是取得数据最主要的方法。
实验数据一般是在科学实验环境下取得的数据。
在实验中,实验环境是受到严格控制的,数据的产生一定是某一约束条件下的结果。
自然科学研究中所用的数据多为实验数据。
三、数据的来源
从使用者的角廑看。
统计数据资料的来源主要有两种渠道:
一种是通过直接的调查或实验获得的原始数据,这是统计数据的直接来源,一般称之为原始或第一手统计数据;
另一种是别人调查的数据,并将这些数据进行加工和汇总后公布的数据,通常称之为次级数据或第二手间接的统计数据.一切间接的统计数据都是从原始的、第一手数据过渡而来的。
1.原始数据。
搜集数据最基本的形式就是进行统计调查或进行实验活动,统计调查或进行实验就是统计数据的直接来源。
统计调查是指根据统计研究预定的目的、要求和任务,运用科学的方法,有计划、有组织地向容观实际搜集资料的过程。
通过统计调查得到的数据,一般称为观测数据。
实验法是通过实验法得到的数据就是实验数据。
运用实验法要注意的是,首先,实验组和对照组的产生应当是随机的,研究对象的不同单位应当被随机地分配到实验组或对照组,而不应是经过有意识的挑选的。
其次,实验组和对照组还应当是匹配的,也就是研究对象的背景资料应当是大体相同的,至少不要差异太大。
不论是统计调查还是实验,所搜集的数据都是原始数据,这是统计数据最基本的来源。
2.次级数据。
次级数据(第二手数据)是指由其他人搜集和整理得到的统计数据,这种自他人调查整理基础上的数据我们把它称为数据的间接来源。
数据的间接来源常用的有以下一些:
①公开出版的统计数据,主要来自官方的统计部门和政府、组织、学校、科研机构。
②尚未公开发表的统计数据,如各企业的经营报表数据、专业调查咨询机构未公开发布的调查结果数据。
需要注意的是,如果公开引用未公开发表的数据需要征得数据所有者的同意,同时要为自己发布的数据负责。
在应用时要注意:
①是否了解并正确理解了间接数据中变量的含义、计算口径、计算方法,以防止误用、错用他人的数据。
②引用间接数据时要注明数据来源,尊重他人的劳动成果和知识产权。
四、统计调查
统计调查是根据调查的目的与要求,运用科学的调查方法,有计划、有组织地搜集统计数据资料的过程。
1.普查是专门组织的一次性的全面调查,用来调查属于一定时点上或一定时期内的社会现象总量。
它适于搜集某些不能或不适宜于定期的全面统计报表搜集的统计资料,以摸清重大的国情、国力。
普查的特点为:
它是一种全面调查,具有资料包括范围全面、详尽、系统的优点;
它是一次性的专门调查,因为普查的工作量大,耗资也多,时间周期较长,一般不宜经常举行。
目前,我国通过普查进行的统计调查内容和时间周期已经规范化、制度化,具体包括:
(1)人口普查。
每10年进行一次,逢"
0"
的年份进行;
(2)农业普查,每l0年进行一次,逢"
7"
(3)经济普查,2004年进行了中国第一次经济普查。
2.抽样调查
抽样调查是一种非全面调查,它是按照随机原则从总体中抽取一部分单位作为样本进行观察研究,以抽样样本的指标去推算总体指标的一种调查。
随机原则要求所有调查单位都有一定的概率被抽取。
抽样调查具有的特点:
第一,样本单位按随机原则抽取,排除了主观因素对选取样本单位的影响。
第二,能够根据部分调查的实际资料对调查对象的总体的数量特征进行推断,从而达到对调查总体的认识。
第三,在抽样调查中会存在抽样误差,但是这个误差可以事先计算并加以控制。
抽样调查既能节省人力、物力、财力,又可以提高资料的时效性,而且能取得比较正确的全面统计资料,具有许多优点。
抽样调查是一种非全面的、一次性的或经常性的专门调查,这种调查方法在市场经济条件下,使用非常广泛。
抽样两种主要方法:
概率抽样和非概率抽样。
概率抽样是根据一个已知的概率随机选取被调查者。
常用的概率抽样形式有:
简单随机抽样、分层抽样、整群抽样和系统抽样。
非概率抽样是没有完全按照随机原则选取样本单位。
3.统计报表
统计报表是按照国家统一规定的调查要求与文件(指标、表格形式、计算方法等)自下而上地提供统计资料的一种调查方式。
按照报送范围,统计报表分为全面报表和非全面报表。
全面报表要求调查对象种的每一个单位均要填报,非全面报表则只要求一部分调查单位填报;
按照报送周期,统计报表主要有月报、季报、年报组成,月报内容简单,时效性强,年报则内容比较全面。
统计报表的内容包括表式和填表说明。
4.重点调查:
是在调查对象中选择一部分重点单位进行的一种非全面调查。
这些重点单位虽然数目不多,但它们具有所研究现象的总量在总体总量中占据绝大部分的特点。
5.典型调查:
是一种非全面的专门调查,它是根据调查的目的与要求,在对被调查对象进行全面分析的基础上,有意识地选择若干具有典型意义的或有代表性的单位进行的调查。
第二章数据描述
本章重点介绍如何简单地利用统计图表和少数数据来概括某些事物的基本特征。
一、定性数据的图表展示
定性效据包括分类数据和顺序数据,通常可以用频数分布表和图形来描述。
1.生成频数分布表
定性数据本身就是对事物的一种分类,因此,只要先把所有的类别都列出来,然后统计出每一类别的频数,就得到一张频数分布表。
频数分布表中落在某一特定类别的数据个数称为频数。
通过频数分布可以观察不同类型数据的分布情况。
注意运用Excel生成频数分布表的过程。
2.定性数据的图形表示
(1)饼图:
又称圆饼图、圆形图等,它是利用圆形及圆内扇形面积来表示数值大小的图形。
饼图主要用于总体中各组成部分所占比重的研究。
(2)条形图:
条形图是用宽度相同的条形的高度或长度来表述数据多少的图形,用于观察不同类别数据的多少或分布情况.绘制时,各类别可以放在纵抽,也可以故在横轴。
(3)环形图:
环形图可以用来比较不同变量之间的结构差异。
二、定量数据用图表展示.
生成定量数据的频数分布表时,首先,要对数据进行分组。
以能够适当观察数据的分布特征为准。
一般的分组个数在5-15之间。
其次,要确定组距。
所谓组距是指每个组变量值中的最大值与最小值之差。
若将最大值称为上限,最小值称为下限,则组距等于上限与下限之差,即"
组距=上限一下限"
。
确定组距,一是要考虑各组的划分是否能区分总体肉部各个组成部分的性质差别,二是要能准确地清晰地反映总体单位的分布特征。
在确定组距时,在研究的现象变动比较均匀的情况下,可以采用等距分组;
而当研究的现象变动很不均匀时,一般采用不等距分组。
最后,统计出各组的频数及频数分布表。
在统计各组频数时,恰好等于某一组的组限时,则采取上限不在内的原则,即将该频数计算在与下限相同的组内。
2。
定量数据的图形表示
(1)直方图:
用横坐标代袁变量分组,纵坐标代表各变量值出现的频数,这样,各组与相应的频数就形成了一个矩形,即直方同。
(2)折线图:
折线图是利用线段的升降来说明显向变动的一种统计图,它主要朋于表示现象在现象的分配情况、现象在时间上的变化和两个现象之间的依存关系等。
(3)散点图:
散点图也可以反映两个变量的关系。
应特别注意各种图表的生成方式和运用。
三、用统计表来表示数据
统计表是一种用密集的形式归纳数据的方法。
它主要是利用行和列中的数据来表述现象特征。
人们利用统计表主要出于两种目的:
一是在文章中使用它以支持自己的观点;
二是利用它组织数据。
统计表一般由五个部分组成,即表头、行标题;
列标题、数字资料和表外附加构成。
表头应该放在表的上方,它说明的是表的主要内容;
行标题和列标题一般放在表的第一行和第一列,它表示的是所研究的问题类别的名称和指标名称;
表的其余部分是具体的数字资料:
表外附加通常放在统计表的下方,用来说明资料来源、指标注释和必要的说明等内容。
通常情况下,统计表的左右两边不能封口。
四、用数字来概括数据
针对一组数据的分布特征,可以从两个方面来考查它:
一是该组数据的集中趁势,即该组数据的数值向其中心值的靠拢程度。
二是该组数据的离散程度,它反映的是该组数据的各个数值远离其中心值的趋势和程度。
这两个方面反映了数据分布特征的不同侧面,从不同视角来分析统计数据,以达到分析和运用统计数据的目的。
1.定性数据的数字特征
对定性数据的集中趋势常用的方法就是计算比例、百分比、中位数和众数。
中位数,是数据按照大小排列之后位于中间的那个数(如果样本重为奇数),或者中间两个数目的平均(如果样本重为偶数)。
众数,就是数据中出现次教或出现频率最多的数值,在定性数据中,由于记录的是频数,因此众数用得多些。
2.定量数据的数字特征
常用的反映定量数据特征的统计量有:
反映数据集中趁势的水平度量:
平均数、中位数、众数和分位数等;
反映数据离散程度的差异度量:
极差、四分位差、标准差和方差。
(1)水平的度量
平均数也称为均值,是把某一组数据进行算术平均,用以表述某一事物的平均水平,它在统计中叫做均值。
注意简单平均数和加权平均数的应用。
中位数和众数的应用比较简单,结合前边概念学习即可。
(2)差异