中级经济师经济基础四统计_精品文档.docx

上传人:b****2 文档编号:1170625 上传时间:2022-10-18 格式:DOCX 页数:9 大小:28.94KB
下载 相关 举报
中级经济师经济基础四统计_精品文档.docx_第1页
第1页 / 共9页
中级经济师经济基础四统计_精品文档.docx_第2页
第2页 / 共9页
中级经济师经济基础四统计_精品文档.docx_第3页
第3页 / 共9页
中级经济师经济基础四统计_精品文档.docx_第4页
第4页 / 共9页
中级经济师经济基础四统计_精品文档.docx_第5页
第5页 / 共9页
点击查看更多>>
下载资源
资源描述

中级经济师经济基础四统计_精品文档.docx

《中级经济师经济基础四统计_精品文档.docx》由会员分享,可在线阅读,更多相关《中级经济师经济基础四统计_精品文档.docx(9页珍藏版)》请在冰豆网上搜索。

中级经济师经济基础四统计_精品文档.docx

第二十三章统计与统计数据

1、统计学是关于收集、整理、分析数据和从数据中得出结论的科学。

统计学有两个分支:

描述统计和推断统计。

描述统计是研究数据收集、整理和描述的统计学方法。

内容包括如何取得所需要的数据,如何用图表或数学方法对数据进行整理和展示,如何描述数据的一般性特征。

推断统计是研究如何利用样本数据来推断总体的统计学方法,内容包括参数估计和假设检验两大类。

参数估计是利用样本信息推断总体特征;假设检验是利用样本信息判断对总体的假设是否成立。

统计学是帮助我们认识周围世界的工具,描述统计和推断统计可以一起发挥作用,具体使用哪种方法取决于要解决的问题。

2、变量:

是研究对象的属性或特征,它是相对于常数而言的。

常数只有一个固定取值,而变量可以有两个或更多个可能的取值。

当变量的取值是数量是,该变量被称为定量变量或数量变量。

例如企业销售额、注册员工数量等。

当变量的取值表现为类别时则被称为分类变量,比如企业所属行业。

(定性变量)

当变量的取值表现为类别且具有一定顺序时被称为顺序变量,比如员工受教育水平。

(定性变量)

3、数据是对变量进行测量、观测的结果。

数据根据需要可以是数值、文字或者图像等形式。

分类变量的观测结果称为分类数据,表现为类别,一般用文字来表述,也可以用数值代码表示;数值型数据是对定量变量的观测结果,其取值表现为具体的表示大小或多少数值。

4、统计数据,按其收集方法,可以分为观测数据(通过直接调查或测量而收集到的数据,是在没有对事物施加任何人为控制因素的条件下得到的,几乎所有与社会经济现象有关的统计数据,如GDP、CPI、房价等)和实验数据(通过在实验中控制实验对象以及其所处的实验环境收集到的数据)。

5、统计数据的来源(2种):

①直接的调查和科学实验,称为直接数据或一手数据;一手数据的来源调查或观察、实验,在社会经济领域,统计调查是获得数据的主要方法,也是获得一手数据的重要方式。

②别人的调查或实验的数据,称为间接数据或二手数据。

6、统计调查是按照预定的目的和任务,运用科学的统计调查方法,有计划有组织地搜集数据信息资料的过程。

特征(2个):

调查是一种有计划、有方法、有程序的活动;调查的结果表现为搜集到的数据。

统计调查的分类(2个):

①按调查对象的范围不同,分为全面调查和非全面调查。

全面调查是对构成调查对象的所有单位进行逐一的、无一遗漏的调查,包括全面统计报表和普查。

非全面调查是对调查对象中的一部分单位进行调查,包括非全面统计报表、抽样调查、重点调查和典型调查等。

②按调查登记的时间是否连续,分为连续调查和不连续调查。

连续调查是为了观察总体现象在一定时期内(通常是一年内)的数量变化,它要求随着调查对象的发展变化,连续地进行调查登记。

不连续调查是间隔一个相当长的时间(通常是一年以上)所做的调查,一般是为了对总体现象在一定时点上的状态进行研究。

7、统计调查的方式(5个):

①统计报表:

是我国目前搜集统计数据的一种重要方式。

是按照国家有关法规的规定,自上而下地统一布置、自下而上地逐级提供基本统计数据的一种调查方式。

统计报表要以一定的原始数据为基础,按照统一的表式、统一的指标、统一的报送时间和报送程序进行填报。

种类(2种):

⑴全面统计报表要求调查对象中的每一个单位都填报;⑵非全面统计报表只要求调查对象中的一部分单位填报。

②普查:

是为某一特定目的而专门组织的一次性全面调查,如人口普查、经济普查、农业普查等。

特点(4个):

⑴普查通常是一次性的或周期性的,经济普查每10年2次,在尾数3、8的年份实施;人口普查逢“0”的年份进行;农业普查逢“6”的年份进行。

⑵普查一般需要规定统一的标准调查时间,以避免调查数据的重复或遗漏,保证普查结果的准确性。

第五和第六次人口普查的标准时间为11月1日0时,农业普查的标准时间为1月1日0时。

⑶普查的数据一般比较准确,规范化程度也较高,因此他可以为抽样调查或其他调查提供基本依据;⑷普查的使用范围比较窄,职能调查一些最基本及特定的现象。

③抽样调查:

是从调查对象的总体中抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种非全面调查。

特点(4个):

经济性;时效性强,适应面广;准确性高。

④重点调查:

是一种非全面调查,它是在所要调查的总体中选择一部分重点单位进行的调查。

⑤典型调查:

是一种非全面调查,它是根据调查的目的与要求,在对被调查对象进行全面分析的基础上,有意识地选择若干具有典型意义的或有代表性的单位进行的调查。

作用(2个):

弥补全面调查的不足;在一定条件下可以验证全面调查数据的真实性。

优点:

灵活机动、通过少数典型单位即可深入翔实的统计资料。

缺点:

受主观认识的影响。

第二十四章描述统计

1、对于数据分布特征的测度主要分(3个方面):

①分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;②分布的离散程度,反映各数据之间的差异程度,也能反映中心值对数据的代表程度;③分布的偏态,反映数据分布的不对称性。

对于两个定量变量之间的相关分析,经常采用的描述方法是散点图和相关系数统计数量。

2、集中趋势:

是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。

集中趋势的测度也就是寻找数据水平的代表值或中心值。

①均值:

也叫作平均数,就是数据组中所有数值的总和除以该组数字的个数。

均值是集中趋势最主要的测度值,它是一组数据的重心所在,解释了一组数据的平均水平。

它主要适用于数据型诗句,但不适用分类和顺序数据。

②中位数:

是把一组数据按从小到大或从大到小的顺序进行排列,位置居中的数值,如果为偶数的话,是居中两位数值的平均值。

中位数是一个位置代表值,主要用于顺序数据和数值型数据,但不适用于分类数据。

③众数:

是指一组数据中出现次数(频数)最多的变量值。

众数适用于描述分类数据和顺序数据的集中趋势。

而在定量数据中,可能出现多众数和无众数的情况,因此众数不适于描述定量数据的集中位置。

均值、中位数和众数的比较及适用范围。

①均值适于定量变量。

优点:

能够充分利用数据的全部信息,均值大小受到每个观测值的营销,比较稳定;缺点:

易受极端值的影响,如果观测值种有明显的极端值,则均值的代表性比较差。

②中位数不适于分类变量,适于顺序变量和定量变量,特别是分布不对称的数据。

优点:

不受极端值的影响;缺点:

没有充分利用数据的全部信息,稳定性差于均值,优于众数。

③众数不适用于定量变量,主要适用于分类和顺序变量。

优点:

不受极端值影响,尤其是分布明显呈偏态时,众数的代表性更好。

缺点:

没有充分利用数据的全部信息,确定稳定性,而且可能不唯一。

3、离散程度:

反映的是数据之间的差异程度。

集中趋势的测度值是对数据水平的一个概括性的度量,它对一组数据的代表程度,取决于该组数据的离散水平。

数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差,离散程度越小,其代表性越好。

①方差:

是数据组中各数值与其均值离差平方的平均数,它能较好的反应出数据的离散程度,是实际中应用最广泛的离散程度测度值。

方差越小,说明数据值与均值的平均距离越小,均值的代表性越好。

②标准差,用来测度数据的离散程度,标准差即方差的平方根,对于样本数据。

标准差不仅能度量数值与均值的平均距离,还与原始数据具有相同的计量单位。

标准差与方差计算比较简单,又具有比较好的数学性质,是应用最广泛的统计离散程度的测度方法。

方差与标准差只适用于数值型数据。

③离散系数:

也称为变异系数或标准差系数,即标准差与均值的比值,主要用于不同类别数据离散程度的比较,记为CV。

CV=sX标准差的大小不仅与数据的测度单位有关,也与观测值的均值大小有关,不能直接用标准差比较不同变量的离散程度。

离散系数消除了测度单位和观测值水平不同的影响,因为可以直接用来比较变量的离散程度。

4、偏度:

是指数据分布的偏斜方向和程度,描述的是数据分布对称程度。

偏态系数:

是测度数据分布偏度的统计量。

SK=nn-1(n-2)i=1n(Xi-Xs)3

偏态系数取决于离差三次方的平均数与标准差三次方的比值。

如果偏态系数=0,则说明数据的分布是对称的;如果偏态系数为正值,说明分布为右偏,取值0-0.5之间轻度右偏,取值0.5-1之间中度右偏,>1严重右偏;如果偏态系数为负值,说明分布左偏,(-0.5)-0之间轻度左偏,(-0.5)-(-1)之间中中度左偏,<(-1)严重左偏。

偏态系数的绝对值越大,说明数据分布的偏斜程度越大。

5、标准分数:

在统计上,均值和标准差不同时,不同变量的数值是不能比较的。

标准分数可以给出数值距离均值的相对位置,计算方法是用数值减去均值所得的差除以标准差,计算公式:

Zi=Xi-Xs

标准分数也称为Z分数,是统计上常用的一种标准化方法。

6、变量间的相关关系(3种):

①按相关的程度可分为完全相关、不完全相关和不相关。

⑴完全相关:

当一个变量的取值变化完全由另一个变量的取值变化所确定时;⑵不相关:

当两个变量的取值变化彼此互不影响;⑶不完全相关:

当两个变量之间的关系介于完全相关和不相关之间。

②按相关的方向可分为正相关和负相关。

⑴正相关:

当一个变量的取值由小变大,另一个变量的取值也相应由小变大;⑵负相关:

当一个变量的取值由小变大,而另一个变量的取值相反的由大变小。

③按相关的形式可分为线性相关和非线性相关。

⑴线性相关:

是指两个相关变量之间的关系大致呈现为线性关系;⑵非线性相关:

是指两个相关变量之间,并不表现为直线的关系,而是近似于某种曲线方程的关系。

7、散点图:

两个变量间的关系可以用散点图来展示。

在散点图种,每个点代表一个观测值,横纵坐标值分别代表两个变量相应的观测值。

8、相关系数:

是度量两个变量间相关关系的统计量。

Pearson相关系数(最常用):

度量的是两个变量间的线性相关关系。

Pearson相关系数的取值范围在+1和-1之间,即-1≤r≤1。

若0<r≤1,正线性相关关系;

若-1≤r<0,则负线性相关关系;

若r=1,完全正线性相关;

若r=-1,完全负线性相关;

若r=0,不存在线性相关关系,并不是没有任何关系。

若r=1,变量Y的取值完全依赖于X。

第二十五章抽样调查

1、抽样调查(使用频率最高):

是指按照某种原则和程序,从总体中抽取一部分单位,通过对这一部分单位进行调查得到的信息,以达到对总体情况的了解,或者对总体的有关参数进行估计。

(3个概念):

①总体与样本:

总体即调查对象的主体,样本是总体的一部分,它由从总体中按一定原则或程序抽出的部分个体所组成;

②总体参数与样本统计量:

总体参数是我们所关心变量的数字特征,它是根据总体中所有的单位的数值计算的,也可以说是总体指标值,它是未知的常数,常用的有总体总量、总体均值、总体比例、总体方差等;样本统计量是根据样本中各单位的数值计算的,是对总体参数的估计,因此也称为估计量,是一个随机变量,它取决于样本设计和正好被选入样本的单元特定组合,常用的有样本均值、样本比例、样本方差等。

③抽样框:

是供抽样所用的所有抽样单元的名单,是抽样总体的具体表现,常用的有名录框(企业名录、电话簿、人员名册)、一张地图或其他适当形式。

2、抽样的类别(2种):

①概率抽样:

也称随机抽样,是指依据随机原则,按照某种事先设计的程序,从总体中抽取部分单元的方法。

特点:

⑴按一定的概率以随机原则抽取样本;⑵总体中每个单元被抽中的概率是已知的或者是可以计算出来的;⑶当采用样本对总体参数进行估计时,要考虑到每个样本单元被抽中的概率;

②非概率抽样

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 人文社科 > 文学研究

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1