统计中级经济师.docx
《统计中级经济师.docx》由会员分享,可在线阅读,更多相关《统计中级经济师.docx(27页珍藏版)》请在冰豆网上搜索。
![统计中级经济师.docx](https://file1.bdocx.com/fileroot1/2023-1/31/66c064a3-6fae-4986-811c-3dcd9c0bbfc7/66c064a3-6fae-4986-811c-3dcd9c0bbfc71.gif)
统计中级经济师
第一章统计与统计数据
【多选题】下列统计分析中,需要采用推断统计方法的有(AD)。
A.利用样本信息估计总体特征B.利用图表对数据进行展示
C.描述一组数据的集中趋势D.利用样本信息检验对总体的假设是否成立
E.描述一组数据的离散趋势
【答案】AD
【解析】描述统计:
研究数据收集、整理和描述的统计学方法。
取得所需数据,用图表或数学方法对数据整理和展示,描述数据的一般性特征。
推断统计:
研究如何利用样本数据来推断总体特征的统计学方法。
包括参数估计和假设检验。
参数估计是利用样本信息推断总体特征,假设检验是利用样本判断对总体的假设是否成立。
【多选题】下列统计方法中,属于描述统计的有(BCE)
A.用样本信息判断关于总体的假设是否成立B.利用图形展示数据的变化趋势
C.用数学方法展示数据分布特征D.用样本均值估计总体均值
E.利用表格展示数据的频数分布
【答案】BCE
【解析】描述统计:
研究数据收集、整理和描述的统计学方法。
取得所需数据,用图表或数学方法对数据整理和展示,描述数据的一般性特征。
推断统计:
研究如何利用样本数据来推断总体特征的统计学方法。
包括参数估计和假设检验。
参数估计是利用样本信息推断总体特征,假设检验是利用样本判断对总体的假设是否成立。
【单选题】下列统计变量中,属于顺序变量的是(C)。
A.原油价格B.年末总人口C.员工受教育水平D.学生年龄
【答案】C
【解析】通过本题掌握变量的类型。
原油价格、年末总人口、学生年龄均属于定量变量。
变量:
研究对象的属性或特征,相对常数而言的,可以有两个或更多个可能的值。
当变量取值是数量的时候,称为定量变量或数量变量;
当变量取值是类别的时候,称为分类变量;
当变量取值是类别且有一定的顺序时,称为顺序变量。
分类变量和顺序变量称为定性变量。
【单选题】下列变量中,属于定量变量的是(B)。
A.性别B.年龄C.产品登记D.汽车品牌
【答案】B
【解析】定量变量的取值为数值,本题中年龄属于定量变量;性别、产品登记;汽车品牌均属于定性变量。
【单选题】统计数据按收集方法可以分为观测数据和实验数据,几乎所有与社会经济现象有关的统计数据都是(A)
A观测数据B一手数据C二手数据D实验数据
【答案】A
【解析】几乎所有与社会经济现象有关的统计数据都是观测数据;自然科学领域的数据大多都是实验数据。
观测数据:
通过直接调查或测量而收集到的数据;
实验数据:
通过在实验中控制实验对象以及所处的实验环境收集到的数据。
(大部分自然科学数据都是)
一手数据:
直接的调查和科学实验(两个方法:
一是调查或观察,二是实验);
二手数据:
别人的调查或实验数据。
【多选题】下列调查方式中,属于非全面调查的有(ABC)
A、重点调查B、抽样调查C、典型调查D、普查E、全面报表
【答案】ABC
【解析】按调查对象的范围不同,分为全面调查和非全面调查。
全面调查:
对构成调查对象的所有单位进行逐一的、无一遗漏的调查,包括全面统计报表和普查。
非全面调查:
对调查对象中的一部分单位进行调查,包括非全面统计报表、抽样调查、重点调查、典型调查等。
【多选题】按调查登记的时间是否连续,统计调查分为连续调查和不连续调查,下列现象适合不连续调查的是(AB)
A.生产设备拥有量B.耕地面积C.人口的出生死亡D.原材料的投入E.工厂的产品生产
【答案】AB
【解析】按调查登记的时间是否连续,分为连续调查和不连续调查。
连续调查:
是观察总体现象在一定时期内(通常一年内)的数量变化,它要求随着调查对象的发展变化,连续地进行调查登记。
如工厂的产品生产、人口的出生、死亡。
说明现象的发展过程。
不连续调查:
是间隔一个相当长的时间(通常一年以上)所作的调查,一般是为了对总体现象在一定时点的状态进行研究。
如生产设备拥有数、耕地面积等。
【单选题】根据国家有关法律法规,按照统一表式、统一指标、统一报送时间,自上而下的统一布置、自下而上的逐级提供基本统计数据,这种统计调查方式是(A)
A.统计报表B.抽样调查C.普查D.重点调查
【答案】A
【解析】本题较偏,但可通过题目基本表述判定是“统计报表”。
【单选题】在进行重点调查时,应选择的调查单位是(A)。
A.就调查标志值来说在总体中占绝大比重的单位B.有典型意义的单位
C.主动参与调查的单位D.随机抽取的单位
【答案】A
【解析】统计调查方式:
统计报表、普查、抽样调查、重点调查、典型调查。
统计报表是我国目前收集统计数据的一种重要方式,是按照国家有关法规的规定,自上而下地统一布置、自下而上地逐级提供基本统计数据的一种调查方式。
统计报表要以一定的原始数据为基础,按照统一的表式、统一的指标、统一的报送时间和报送程序进行填报。
统计报表按调查对象范围的不同可分为:
全面报表和非全面报表。
目前大多都是全面报表,按报送周期长短不同可分为日报、月报、季报、年报;按报表内容和实施范围不同可分为国家的、部门的、地方的统计报表。
普查:
为某一特定目的而专门组织的一次性全面调查,如人口普查、经济普查等。
普查是适合特定目的、特定对象的一种调查方式,主要用于收集处于某一时点状态上的社会经济现象的基本全貌,为国家制定有关政策提供依据。
1)普查通常是一次性的或周期性的。
普查涉及面广、调查单位多,需要耗费大量的人力、物力和财力,通常需要间隔较长的时间。
2)普查一般需要规定统一的标准调查时间,以避免调查数据的重复或遗漏,保证普查结果的准确性。
3)普查的数据一般比较准确,规范化程度也较高;
4)普查的使用范围比较小,只能调查一些最基本及特定的现象。
抽样调查:
实际中应用最广泛的一种调查方式和方法,它是从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种非全面调查。
抽样方法主要有:
概率抽样、非概率抽样。
概率抽样是最理想、最科学的抽样方法。
概率抽样形式:
①简单随机抽样;②分层抽样;分层抽样可以有效降低估计误差。
③整群抽样;④等距抽样,又称系统抽样。
非概率抽样容易实施,成本较低,但不适于推断总体的项目。
非概率抽样的形式:
①主要由调查人员自由选择被调查者的非随机选样;
②通过某些条件过滤选择某些被调查者参与调查的判断抽样法;
③大多数种类的研究—产品测试、街坊、座谈会。
1)经济性。
这是抽样调查的一个最显著优点。
2)时效性强。
3)适应面广。
抽样调查适用于对各个领域、各种问题的调查。
4)准确性高。
①总体:
调查研究的事物或现象的全体;
②个体:
组成总体的每个元素或成员;
③总体容量:
一个总体中所含的个体的数量;
④抽样:
从总体中按一定抽样技术抽取若干个体的抽到过程;
⑤样本:
所抽到的部分个体;
⑥样本容量:
样本中含个体的数量。
重点调查:
从调查对象的全部单位中选择一部分重点单位进行调查。
是一种非全面调查。
典型调查:
从调查对象的全部单位中选择一个或几个有代表性的单位,进行全面深入的调查。
典型调查主要是一种定性调查研究,必须同其他调查结合起来使用,才能避免出现片面性。
【单选题】某省统计部门为及时了解该省企业的出口信贷情况,每月定期调查该省出口信贷额排在前500名的企业。
这500家企业虽然只占该省出口企业数量的10%,但是出口信贷总额占该省企业出口信贷总额的75%以上,这种调查方法是(D)
A.随机抽样调查B.典型调查C.系统调查D.重点调查
【答案】D
【解析】重点调查是从调查对象的总体中选择少数重点单位进行调查。
所选择的重点单位就调查的标志值来说在总体中占绝大比重。
【单选题】为了解全国煤炭企业的生产安全状况,找出安全隐患,专家根据经验,选择10个有代表性的企业进行深入细致的调查。
这类调查方法属于(D)。
A.专家调查B.重点调查C.系统调查D.典型调查
【答案】D
【解析】典型调查:
从调查对象的全部单位中选择一个或几个有代表性的单位,进行全面深入的调查。
典型调查主要是一种定性调查研究,必须同其他调查结合起来使用,才能避免出现片面性。
第二章描述统计
【单选题】某连锁超市6个分店的职工人数有小到大排序后为57人、58人、58人、60人、63人、70人其均值、中位数分别为( C )。
A.59、58B.61、58C.61、59D.61、70
【答案】C.
【解析】均值=(57+58+58+60+63+70)/6=61中位数=(58+60)/2=59
均值:
数据组中所有数值的总和除以该组数值的个数。
(1)它是集中趋势中最主要的测度值;
(2)均值主要适用于数值型数据,但不适用于分类数据和顺序数据。
(3)均值易受极端值的影响
(4)能够充分利用数据的全部信息
中位数:
一组数据按从小到大或从大到小的顺序进行排列,位置居中的数值。
(1)适用于顺序数据,也适用于数值型数据,但不适用于分类数据
(2)不受极端值的影响,抗干扰性强。
(3)没有充分利用数据的全部信息,稳定性差于均值,但优于众数。
众数:
一组数据中出现次数最多的变量值。
(1)适于描述分类数据和顺序数据;
(2)不受极端值的影响
(3)没有充分利用数据的全部信息,缺乏稳定性,而且可能不唯一(有些情况下可能出现双众数、多众数或者没有众数,难以描述数据的集中趋势)
【单选题】下列数据特征测度中,适用于反映偏斜分布数值型数据集中趋势的是(C)。
A.离散系数B.方差C.中位数D.标准差
【答案】C
【解析】中位数:
一组数据按从小到大或从大到小的顺序进行排列,位置居中的数值。
(1)适用于顺序数据,也适用于数值型数据,但不适用于分类数据。
(2)不受极端值的影响,抗干扰性强。
(3)没有充分利用数据的全部信息,稳定性差于均值,但优于众数。
【单选题】下列指标中,用于描述数据集中趋势,并且易受极端值影响的是(A)。
A.均值B.中位数C.众数D.极差
【答案】A
【解析】中位数和众数都不受极端值的影响,均值用于描述数据集中趋势,并且易受极端值影响。
均值:
数据组中所有数值的总和除以该组数值的个数。
(1)它是集中趋势中最主要的测度值;
(2)均值主要适用于数值型数据,但不适用于分类数据和顺序数据。
(3)均值易受极端值的影响
(4)能够充分利用数据的全部信息
【多选题】适于测度顺序变量的指标有(BC)。
A.离散系数B.中位数C.众数D.均值E.标准差
【答案】BC
【解析】均值、标准差、离散系数只适用于定量变量。
【单选题】下列统计量中,适用于描述分类数据集中趋势的是(B)。
A.均值B.众数C.中位数D.变异系数
【答案】B
【解析】适用描述分类数据的统计指标是众数。
【单选题】集中趋势的测度值对一组数据的代表程度,取决于该组数据的离散水平。
数据的离散程度越大,集中趋势的测度值对该组数据的代表性(B)。
A.越好B.越差C.始终不变D.在一定区间内反复变化
【答案】B
【单选题】某学校学生的平均年龄为20岁,标准差为3岁;该校教师的平均年龄为38岁,标准差为3岁。
比较该校学生年龄和教师年龄的离散程度,则( D)。
A.学生年龄和教师年龄的离散程度相同
B.教师年龄的离散程度大一些
C.教师年龄的离散程度是学生年龄离散程度的1.9倍
D.学生年龄的离散程度大一些
【答案】D
【解析】平均值不同的情况下,用离散系数比较离散程度。
学生年龄的离散系数=3/20*100%=15%
教师年龄的离散系数=3/38*100%=7.89%
离散系数大的说明数据的离散程度也就大,离散系数小的说明数据的离散程度也就小。
【单选题】下列离散程度的测度值中,能够消除变量值水平和计量单位对测度值影响的是(B)。
A.标准差B.离散系数C.方差D.极差
【答案】B
【解析】离散系数也称为变异系数或标准差系数,即标准差与均值的比值。
标准差/均值:
CV=s/X
离散系数=
(标准差)/
(均值)
离散系数消除了测度单位和观测值水平不同的影响,因而可以直接用来比较变量的离散程度。
【单选题】标准差系数是一组数据的标准差与其相应的(A)之比。
A.算数平均数B.极值C.众数D.几何平均数
【答案】A
【解析】通过本题掌握离散系数的计算。
【多选题】数值型数据离散程度的测度指标有(BDE)。
A.中位数B.离散系数C.均值D.标准差E.方差
【答案】BDE
【解析】依据教材,离散程度的测度指标有方差和标准差、离散系数。
集中程度的测度指标有众数、均值和中位数。
【多选题】下列统计量中,容易受极端值影响的有(ABE)
A.均值B.方差C.众数D.中位数E.标准差
【答案】ABE
【解析】容易受极端值影响的是方差、标准差、均值。
【多选题】分布形态的测度指标包括(DE)。
A.标准差B.离散系数C.中位数D.偏态系数E.标准分数
【答案】DE
【解析】通过本题掌握集中趋势、离散程度、分布形态的测度指标。
集中趋势:
平均数、众数、中位数。
平均数最准确,但有极端数据或数据模糊不清时中位数众数适用,
离散趋势:
方差,平均差。
平均差是方差的算数平方根,方差不受正负号影响,应用广泛。
分布形态:
偏态系数、标准分数
【多选题】下列关于偏态系数的表述错误的是(ACD)。
A.偏态系数取决于离差平方的平均数与标准差平方的比值
B.偏态系数等于0,说明数据的分布是对称的
C.偏态系数大于0,说明数据分布为左偏
D.偏态系数绝对值越大,说明数据分布的偏斜程度越小
E.偏态系数为0.8,说明数据分布为中度右偏
【答案】ACD
【解析】通过本题掌握偏态系数不同取值的含义。
分布形态的测度指标包括:
偏态系数和标准分数。
项目
主要内容
偏度
数据分布的偏斜方向和程度,描述的是数据分布对称程度
偏态系数
测度数据分布偏度的统计量,取决于离差三次方的平均数与标准差三次方的比值。
偏
态
系
数
的
取
值
等于0
数据的分布是对称的。
偏态系数>0:
分布为右偏。
1.取值在0和0.5之间,轻度右偏;
2.取值在0.5和1之间,中度右偏;
3.取值大于1,严重右偏;
偏态系数<0
分布为左偏。
1.取值在0和-0.5之间,轻度左偏;
2.取值在-0.5和-1之间,中度左偏;
3.取值小于-1,严重左偏;
偏态系数的绝对值越大
数据分布的偏斜程度越大;
【多选题】某企业员工年收入数据分布的偏态系数为3.0,则该组数据的分布形态为(AC)
A.右偏B.左偏C.严重倾斜D.轻度倾斜E.中度倾斜
【答案】AC
【解析】偏态系数等于3,说明该组数据是严重右偏。
【标准分数举例】某班2015年中级经济师考试中,已知公共课考试的全班平均分为110分,标准差为10分,张三得了116分;专业课考试的全班平均分为100分,标准差为8分,张三得了107分。
张三哪一门考试成绩比较好?
【分析】1.因为两科考试的标准差不同,因此不能用原始分数直接比较。
需要将原始分数转换成标准分数,然后进行比较。
2.标准分数的计算标准分数Z=(原始分数Xi-平均分数X)÷标准差s
【提示】标准分数的平均数为0,标准差为1
【补充】标准分数表示一个给定的分数距离平均数有多少个标准差,含有标准差的个数越多,说明该分数和平均数的距离越大(标准分数越大越好)
【接上例】张三Z(公共课)=(116-110)/10=0.6
张三Z(专业课)=(107-100)/8=0.875
3.两门课程的比较
张三的公共课成绩在其整体分布中位于平均分之上0.6个标准差的地位,他的专业课成绩在其整体分布中位于平均分之上0.875个标准差的地位。
由此可见,张三的专业课考试成绩优于公共课考试成绩。
【单选题】根据经验法则,服从对称钟形分布的标准分数在【-2,2】范围内的概率是(A)
A.95%B.50%C.68%D.99%
【答案】A
【解析】可根据“168”、“295”、“399”选择。
【多选题】根据变量X和变量Y的散点图,可以看出这两个变量间的相关关系为(AD)。
A.正相关B.不相关C.负相关D.线性相关E.完全相关
【答案】AD
【解析】通过本题熟悉散点图的形状。
【单选题】在相关分析中,如果两个变量间Pearson相关系数r=0,这表示(A)。
A.两个变量间不存在线性相关关系B.两个变量间没有任何相关关系
C.两个变量间存在中度相关关系D.两个变量间存在非线性相关关系
【答案】A
【解析】相关系数是度量两个变量之间相关关系的统计量。
最常用的相关系数是pearson(皮尔逊)相关系数。
相关系数的取值范围在【-1,1】之间,即-1≦r≦+1,pearson相关系数只适用线性相关关系。
r的取值
两变量之间的关系
0正线性相关
-1≦r<0
负线性相关
r=1
完全正线性相关
r=-1
完全负线性相关
r=0
不存在线性相关关系,但并不能说明两变量之间没有任何关系,它们之间可能存在非线性相关关系。
根据实际数据计算出的r,其取值一般为-1|r|的取值
两变量之间的相关程度
|r|≧0.8
高度相关
0.5≦|r|<0.8
中度相关
0.3≦|r|<0.5
低度相关
|r|<0.3
相关程度极弱,可视为无线性相关关系。
【单选题】下列变量间,相关的程度最高的是(B)
A.某城市居民人均收入与私人汽车拥有量之间的相关系数为0.82
B.某产品单位成本与利润之间的相关系数为-0.93
C.某城市景点游客数量与票价的相关系数为-0.58
D.某城市居民收入水平与食品支出之间的相关系数为0.9
【答案】B
【解析】通过本题掌握利用相关系数的取值判断两变量的相关程度。
相关系数的绝对值越大,相关程度越高。
【单选题】根据2014年某城市金融业和制造业各1000人的年薪样本数据来比较这两个行业从业人员年薪的离散程度,应采用的统计量是(C)。
A.标准分数B.相关系数C.变异系数D.偏态系数
【答案】C
【解析】本题通过题干中的“离散程度”判断应选择反应离散程度的指标。
离散系数也称为变异系数,消除了测度单位和观测值水平不同的影响
第三章抽样调查
【单选题】某研究机构从我国金融行业从业人员中随机抽取5000人来了解该行业从业人员的年平均收入。
这项抽样调查中的样本是(C)。
A.我国金融行业的所有从业人员B.我国金融行业的每个从业人员
C.抽中的5000个金融行业从业人员D.我国金融行业从业人员年平均收入
【答案】C
【解析】通过本题掌握抽样调查的有关概念。
做题时需掌握每个选项涉及是抽样调查的哪个基本概念。
【例题2:
2015年单选题】在某市随机抽取2000家企业进行问卷调查,并据此调查有对外合作意向的企业,该抽样调查中的总体是(A)
A.该市所有企业B.该市所有有对外合作意向的企业
C.抽中的2000家企业D.抽中的2000家企业中有对外合作意向的企业
【答案】A
【解析】总体是该城市的所有企业。
【单选题】在街边或居民小区拦住行人进行调查的抽样方法属于(D)。
A.判断抽样B.自愿抽样C.配额抽样D.方便抽样
【答案】D
【解析】非概率抽样方法中的方便抽样就是凭着方便抽取样本。
街头拦截式的调查方式属于方便抽样。
【多选题】相对于非概率抽样而言,概率抽样的特点有(ABE)
A.按一定的概率以随机原则抽取样本
B.总体中每个单元被抽中的概率是已知的或可以计算出来
C.每个单位被抽入样本的概率相等
D.抽取样本时不需要依据随机原则
E.当采用样本对总体参数进行估计时,要考虑到每个样本单元被抽中的概率
【答案】ABE
【解析】通过本题掌握概率抽样和非概率抽样的特点。
【单选题】抽样调查的一般步骤不包括(D)。
A.确定调查问题B.调查方案设计C.数据处理分析D.评价调查结果
【答案】D
【解析】抽样调查步骤:
确定调查问题、调查方案设计、实施调查过程、数据处理分析、撰写调查报告
【多选题】在城乡住户收支调查中,非抽样误差的可能来源有(ABCD)。
A.抽样框遗漏掉部分城乡住户B.部分高收入住户拒绝接受调查
C.调查人员有意作弊D.被调查住户提供虚假数据
E.抽样的随机性
【答案】ABCD
【解析】考核非抽样误差的产生原因。
本题可采用排除法,排除“随机性”即可选择。
抽样的随机性会导致抽样误差,所以E选项不选。
【单选题】由于受访者记忆模糊,导致调查数据与其真值之间不一致,这种误差属于(B)。
A.抽样误差B.计量误差C.抽样框误差D.无回答误差
【答案】B
【解析】由于调查者、受访者、问卷设计导致的误差都属于计量误差。
【多选题】人口普查统计数据可能存在的误差来源有(ACDE)。
A.填报错误B.抽样的随机性C.抄录错误D.汇总错误E.有意瞒报
【答案】ACDE
【解析】普查只存在非抽样误差。
所以本题实质是考核登记性误差产生的原因。
【单选题】下列关于简单随机抽样的表述错误的是(D)。
A.总体的每个单位入样概率相同B.是最基本的随机抽样方法
C.没有利用抽样框更多的辅助信息D.适用个体之间差异较大的调查
【答案】D
【解析】简单随机抽样的优缺点:
1.优点:
简单随机抽样是最基本的随机抽样方法,操作简单,且每个单位的入样概率相同,样本估计量形式也比较简单。
2.缺点:
没有利用抽样框更多的辅助信息,用样本统计量估计总体参数的效率受到影响,样本的分布可能十分分散,增加了调查过程中的费用和时间。
简单随机抽样的适用条件:
1、抽样框中没有更多可以利用的辅助信息
2、调查对象分布的范围不广阔
3、个体之间的差异不是很大
【单选题】某校高中生共有2700人,其中高一年级900人,高二年级1200人,高三年级600人,现采取分层抽样法抽取容量为135的样本,那么高一、高二、高三各年级抽取的人数分别为(D)
A.45,75,15B.45,45,45C.30,90,15D.45,60,30
【答案】D
【解析】样本量占总体容量的比=135/2700=5%
n(高一)/900=5%,所以,n(高一)=5%×900=45人
n(高二)/1200=5%,所以,n(高二)=5%×1200=60人
n(高三)/600=5%,所以,n(高三)=5%×600=30人
【多选题】在某城市的一项在职员工亚健康情况抽样调查中,调查人员先将工作单位按照行业和规模分层,然后在各层内随机抽取初始单位后,等距抽取5家单位,再对被抽中单位内所有员工进行体检和调查。
该调查中采用的抽样方法有(ABDE)
A.分层抽样B.简单随机抽样C.配额抽样D.整群抽样E.系统抽样
【答案】ABDE
【解析】本题运用到的统计方法包括分层抽样、简单随机抽样、等距抽样、整群抽样,整个称为多阶段抽样。
【单选题】抽样统计中,估计量的