中级统计师考试统计方法知识考试重点归纳.docx
《中级统计师考试统计方法知识考试重点归纳.docx》由会员分享,可在线阅读,更多相关《中级统计师考试统计方法知识考试重点归纳.docx(14页珍藏版)》请在冰豆网上搜索。
中级统计师考试统计方法知识考试重点归纳
2021年中级统计师考试统计方法知识考试重点归纳
中级统计师考试-统计方法知识考试关键归纳
统计和数据
●统计是用来处理数据,是相关数据一门学问。
1、统计学:
是用以搜集数据、分析^p数据和由数据得出结论一组概念、标准和方法。
2、统计分析^p数据方法分为:
(1)描述统计
(2)推断统计
3、描述统计:
是研究数据搜集、处理和描述统计学方法。
4、推断统计:
是研究怎样利用样本数据来推断总体特征统计学方法。
5、推断统计包含:
(1)参数估量
(2)假设检验
6、定性变量特点:
只反应现象属性特点,不能说明具体量大小和差异。
●定性变量包含分类变量和次序变量。
●只反应现象分类特征变量称分类变量。
分类变量没有数值特征,所以不能对其数据进行数学运算。
●假如类别含有一定次序,这么变量称为次序变量。
次序变量不仅能用来区分客观现象不一样类别,而且还能够表明现象之间大小、高低、优劣关系。
7、定量变量特点:
能够用数值表示其观察结果,而且这些数值含有明确数值含义,不仅能分类而且能测量出来具体大小和差异。
●数值型数据(定量数据)作为统计研究关键资料,其特征在于它们全部是以数值形式出现,有些数值型数据只能够计算数据之间绝对差,而有些数值型数据不仅能够计算数据之间绝对差,还能够计算数据之间相对差。
其计量精度远远高于定性数据。
在统计学研究中,数值型数据有着最广泛用途。
8、数据按获取方法不一样分为:
(1)观察数据
(2)试验数据
9、观察数据:
是对客观现象进行实地观察所取得数据,在数据取得过程中通常没有些人为控制和条件约束。
10、试验数据:
通常是在科学试验环境下取得数据。
11、统计数据资料起:
(1)经过直接调查或试验取得原始数据,这是统计数据直接起;
(2)她人调查间接数据,并将这些数据进行加工和汇总后公布数据,这是数据间接起。
12、数据直接起:
(1)统计调查
(2)试验法
●经过统计调查得到数据,通常称为观察数据。
●利用试验法时,试验组和对照组产生应该是随机。
13、数据间接起:
(1)公开出版统计数据
(2)还未公开发表统计数据
14、搜集数据方法:
(1)普查
(2)抽样调查(3)统计报表
(4)关键调查(5)经典调查
15、普查:
是专门组织一次性全方面调查,用来调查属于一定时点或时期内社会现象总量。
●普查适适用于搜集一些不能或不宜于定时全方面统计报表搜集统计资料,以摸清重大国情、国力。
16、普查特点:
(1)是一个全方面调查,含有资料包含范围全方面、详尽、系统优点。
(2)是一次性专门调查,因为普查工作量大,耗资也多,时间周期较长,通常不宜常常举行。
17、抽样调查特点:
(1)样本单位按随机标准抽取,排除了主观原因对选择样本单位影响。
(2)能够依据部分调查实际资料对调查对象总体数量特征进行推断,从而达成对调查总体认识。
(3)在抽样调查中会存在抽样误差,不过这个误差能够事先计算并加以控制。
18、在实际调查中抽样方法:
(1)概率抽样
(2)非概率抽样
19、常见概率抽样形式有:
(1)简单随机抽样
(2)分层抽样(3)整群抽样
(4)系统抽样
20、分层抽样:
是先将总体各单位按关键标志加以分层,然后在每一层内进行抽样。
21、系统抽样:
又称等距抽样,是在总体名目框中每隔一定距离抽选一个被调查者。
22、统计报表:
是根据国家统一要求调查要求和文件自下而上提供统计资料一个调查方法。
23、统计报表根据报送范围分为:
(1)全方面报表
(2)非全方面报表
24、统计报表内容包含:
(1)表式
(2)填表说明
25、关键调查:
是在调查对象中选择一部分对全局含有决定性作用关键单位进行一个非全方面调查。
●当调查任务只要求掌握事物基础情况和基础发展趋势,而不要求掌握全方面正确资料,而且在总体中确实存在着关键单位时,进行关键调查是比较适宜。
26、经典调查:
是一个非全方面调查,是依据调查目标和要求,在对被调查对象进行全方面分析^p基础上,有意识地选择若干含有经典意义或有代表性单位进行调查。
27、经典调查作用:
(1)补充全方面调查不足
(2)在一定条件下能够验证全方面调查数据真实性
●经典调查含有灵活机动、经过少数经典即可取得深入详实统计资料优点,不过易受大家主观认识上影响,必需同其它调查结合起来使用,才能避免出现片面性。
第二章数据描述
1、定性数据图形表示有:
(1)饼图
(2)条形图(3)环形图
●饼图是利用圆形及圆内扇形面积来表示数值大小图形。
●条形图是用宽度相同条形高度或长度来表述数据多少图形。
●假如想比较不一样变量之间结构差异,能够经过环形图来实现。
●定性数据图示表示方法,也全部适适用于定量数据。
但定量数据还有部分特定图示方法,它们并不适适用于定性数据。
2、频数:
是指频数分布表中落在某一特定类别数据个数。
3、生成定量数据频数分布表步骤:
(1)对数据进行分组
(2)确定组距
(3)统计出各组频数及频数分布表
●组距是每个组变量值中最大值和最小值之差,也就是上限和下限之差。
4、在确定组距时应掌握标准:
(1)要考虑各组划分是否能区分总体内部各个组成部分性质差异。
(2)要能正确地清楚地反应总体单位分布特征。
●在确定组距时,在研究现象变动比较均匀情况下,能够采取等距分组;而当研究现象变动很不均匀时,通常采取不等距分组。
●在统计各组频数时,恰好等于某一组组限时,则采取上限不在内标准,立即该频数计算在和下限相同组内。
5、定量数据图形表示有:
(1)直方图
(2)折线图(3)散点图
●直方图横坐标代表变量分组,纵坐标代表各变量值出现频数。
6、统计表五个组成部分:
(1)表头
(2)行标题(3)列标题(4)数字资料(5)表外附加
7、数据分布特征:
(1)集中趋势,即一组组数据数值向其中心值靠拢程度
(2)离散程度,即一组数据各个数值远离其中心趋势和程度
8、定性数据集中趋势常见计算方法:
(1)百分比
(2)中位数(3)众数
9、中位数:
是数据根据大小排列以后在中间那个数。
假如样本量为偶数,则是中间两个数平均。
10、众数:
就是数据中出现次数或出现频率最多数值。
11、反应定量数据特征统计量有:
反应数据集中趋势水平度量:
(1)平均数
(2)中位数(3)众数(4)分位数
反应数据离散程度差异度量:
(1)极差
(2)四分位差(3)标准差(4)方差
●平均数易为多数人了解和接收,实际中用也较多,但关键缺点是更轻易受少数极端数值影响。
中位数和众数提供信息不像平均数那样多,但含有统计上稳健性,当数据为偏态分布,尤其是偏斜程度较大时,中位数和众数代表性要比平均数好。
12、极差:
又称全距,是一组数据中最大值和最小值之差。
●极差很轻易受数据中极端值影响。
●方差用表示,总体标准差用表示,样本标准差用表示,离散系数用表示,标准分数用表示。
●标准差是方差平方根,它和方差相比更具量纲性。
●在一个统计样本中,其标准差越大,说明它各个观察值分布越分散,它趋中程度就越差。
反之,其标准差越小,说明它各个观察值分布越集中,它趋中程度就越好。
●标准差大小会受到数据本身数值大小影响。
两个数列标准差相同,不过两数列差异程度却不一样。
为了更正确地反应差异程度,要计算离散系数。
13、离散系数:
是将一组数据标准差除以其均值,用来测度数据离散程度相对数。
14、标准分数:
是变量值和其平均数离差除以标准差后值,用以测定某一个数据在该组数据中相对位置。
第三章参数估量
1、总体分布:
是总体中全部观察值所形成分布。
2、总体参数:
是对总体特征某个概括性度量。
3、总体参数指标有:
(1)总体平均数()
(2)总体方差()(3)总体百分比()等。
●统计量是样本函数。
组成统计量函数中不能包含未知原因。
4、样本统计量指标有:
(1)样本均值()
(2)样本方差()(3)样本百分比()
●统计量概率分布组成了推断总体参数理论基础。
5、相关样本均值抽样分布:
(1)设总体共有个元素,从中随机抽取一个容量为样本,在重置抽样时,共有种抽法;在不反复抽样时,共有个样本。
(2)样本均值抽样分布就是指全部可能抽出来样本分布。
(3)样本均值均值就是总体均值,即。
(4)重置抽样时,样本均值标准差为总体标准差,即;不重置抽样时,样本均值方差为。
(5)当总体服从正态分布时,样本均值一定服从正态分布,即有:
~时,~。
(6)若总体为未知非正态分布时,只要样本容量足够大(通常要求≥30),样本均值仍会靠近正态分布,其分布期望值为总体均值,样本方差为总体方差。
(7)假如总体不是正态分布,当为小样本时(通常<30),样本均值分布则不服从正态分布。
6、相关样本百分比抽样分布:
(1)当样本容量比较大时,样本比率近似服从正态分布,且有数学期望就是总体比率,即。
(2)在重置抽样时,方差为。
(3)在不重置抽样时,方差为。
(4)在重置抽样时,分布为~
(5)在不重置抽样时,分布为~
7、相关统计量标准误差:
(1)统计量标准误差用于衡量样本统计量离散程度。
在参数估量中,用于衡量样本统计量和总体参数之间差距。
(2)样本均值标准误计算公式为:
(3)当总体标准差未知时,可用样本标准差替换计算,这时计算标准误差称为估量标准误差。
(4)样本百分比标准误计算公式为:
(5)当总体百分比方差未知时,可用样本百分比方差替换。
8、参数估量:
就是用样本统计量去估量未知总体参数。
9、用样本统计量估量总体参数两种方法:
(1)点估量
(2)区间估量
10、常见点估量有:
(1)用样本均值估量总体均值
(2)用样本百分比估量总体百分比
(3)用样本方差估量总体方差
11、区间估量:
是包含样本统计量在内一个区间,该区间通常是由样本统计量加减估量标准误差得到。
12、相关区间估量:
(1)标准正态分布(0,1)均值为0,标准差为1。
(2)标准化公式为:
(观察值-均值)÷标准差
(3)以68.27置信水平推断总体参数置信区间为:
(4)以95.45置信水平推断总体参数置信区间为:
(5)以99.73置信水平推断总体参数置信区间为:
13、评价估量量标准有:
(1)无偏性
(2)有效性(3)一致性
●无偏性是指估量量抽样分布期望值等于被估量总体参数。
、、分别是总体均值、总体百分比、总体方差无偏估量量。
●有效性是指估量量方差尽可能小。
对同一个总体参数两个无偏估量量,有更小方差估量量更有效。
●一致性是指一个大样本给出估量量要比一个小样本给出估量量更靠近总体参数。
样本均值是总体均值一个一致估量量。
14、相关总体均值区间估量:
(1)在对总体均值进行区间估量时,需要考虑总体是否为正态分布、总体方差是否已知、用于估量样本是大样本()还是小样本()等情况。
(2)大样本情况下,总体服从正态分布,总体方差已知,总体均值在置信水平下置信区间为
(3)大样本情况下,总体服从正态分布,总体方差未知,总体均值在置信水平下置信区间为
(4)小样本情况下,总体服从正态分布,总体方差已知,总体均值在置信水平下置信区间为
(5)小样本情况下,总体服从正态分布,总体方差未知,总体均值在置信水平下置信区间为
●相关总体百分比区间估量,在大样本条件下,若,,则二项分布可用正态分布近似,在置信水平下置信区间为
。
●样本量和置信水平成正比关系,和总体方差成正比,和许可估量误差平方成反比。
●假如总体百分比值不知道能够用样本百分比替换,或取=0.5,使得达成最大。
第四章假设检验
1、假设检验:
是先对总体参数或分布形式提出某种假设,然后利用样本信息和相关统计量分布特征去检验这个假定,做出是否拒绝原来假设结论。
2、小概率事件:
是指在一次事件中几乎不可能发生事件,通常称为“显著性水平”,用表示。
●显著性水平通常取值为=0.05或=5。
3、假设检验过程:
(1)提出原假设和备择假设
(2)确定检验统计量
(3)确定显著性水平
(4)依据数据计算检验统计量值和和这个统计量值对应概率值值,并进行决议
●原假设也称为零假设,记为;备则假设也称为备选假设,记为。
●在对总体均值进行检验时,大样本应用正态分布检验,计算统计量,小样本通常见分布检验,计算统计量。
●拒绝正确零假设错误称为第一类错误或弃真错误();当备选假设正确时反而说零假设正确错误称为第二类错误或取伪错误()。
4、对假设检验总结:
(1)假设检验依据是小概率原理
(2)小概率标准在抽样前依需要确定
(3)假设检验结果只能是拒绝或不拒绝原来假设,而不能证实原假设成立
(4)统计假设检验结果不是绝对正确
5、相关总体均值假设检验:
(1)在对总体均值进行假设检验时,采取什么检验统计量,取决于所抽检样本是大样本()还是小样本(),还需要考虑总体是否为正态分布、总体方差是否已知等情况。
(2)大样本情况下,当总体方差已知时,总体均值检验统计量为:
(3)大样本情况下,当总体方差未知时,总体均值检验统计量为:
(4)小样本情况下,当总体均值服从正态分布,总体方差已知时,总体均值检验统计量为:
(5)小样本情况下,当总体均值服从正态分布,总体方差未知时,总体均值检验统计量为:
6、总体百分比检验三种基础形式:
(1)双侧检验:
,
(2)左侧检验:
,
(3)右侧检验:
,
●总体百分比假设检验,在大样本时,样本百分比会近似服从正态分布,所以检验统计量仍用统计量,其基础形式为:
第五章相关分析^p和回归分析^p
1、相关关系:
是存在着亲密联络但又不是严格、确定关系。
2、相关关系依据相关形态分为:
(1)线性相关
(2)非线性相关
3、相关关系依据相关方向分为:
(1)正相关
(2)负相关
●正相关是两个变量变动方向总体上相同,负相关是两个变量变动方向总体上相反。
4、相关系数:
是测定变量之间关系亲密程度量,它能够以数字正确地描述变量之间相关程度。
5、相关相关系数:
(1)取值范围为-1≤≤1。
值越靠近1(或-1)就越正(或负)相关,越靠近0就越不相关。
(2)含有对称性。
和之间相关系数和和之间相关系数相等。
(3)=0只表示两个变量之间不存在线性相关,并不表明变量之间没有任何关系。
●回归方程拟合程度分析^p最常见指标是判定系数。
取值范围在[0,1],=1时,拟合是完全,即全部观察值全部在直线上。
越靠近于0,回归直线拟合程度越差。
●估量标准误差也是说明回归直线拟合程度指标,越小,依据回归方程进行估计就越正确。
第六章时间序列分析^p
1、时间序列:
是指反应社会、经济、自然现象数据按时间前后次序统计形成数列。
2、时间序列两个组成要素:
(1)现象所属时间
(2)对应不一样时间统计指标数值
3、反应时间序列增加量指标有:
(1)发展水平
(2)增加量(3)平均增加量
4、增加量:
是指时间序列中两个不一样时期发展水平之差,反应社会经济现象汇报期比基期增加或降低数量。
5、增加量计算公式:
增加量=汇报期水平-基期水平
6、增加量依据采取基期不一样分为:
(1)逐期增加量
(2)累计增加量
7、逐期增加量:
是汇报期水平和前一期水平之差,说明汇报期比前一时期增加绝对数量。
8、累计增加量:
是汇报期水平和某一固定时期水平之差,说明本期比某一固定时期增加绝对数量,也说明在某一较长时期内总增加量。
●逐期增加量之和等于相对时期累计增加量。
9、反应时间序列增加率指标有:
(1)发展速度
(2)增加速度(3)平均发展速度(4)平均增加速度
10、发展速度:
是表明现象发展程度动态相对指标,它是两个不一样时期发展水平对比结果。
11、发展速度计算公式:
发展速度=汇报期水平÷基期水平×100
12、发展速度依据采取基期不一样分为:
(1)环比发展速度
(2)定基发展速度
13、环比发展速度和定基发展速度关系:
(1)环比发展速度连乘积等于对应定基发展速度
(2)相邻时期两个定基发展速度相除商等于对应环比发展速度
14、增加速度:
是表明现象增加程度动态相对指标。
15、增加速度计算公式:
增加速度=增加量÷基期发展水平
=发展速度-1
16、平均发展速度:
是一定时期内各个环比发展速度平均数。
17、平均发展速度和平均增加速度关系:
平均增加速度=平均发展速度-1
18、时间数列四个影响原因:
(1)长久趋势
(2)季节变动(3)循环变动(4)不规则变动
19、长久趋势分析^p方法:
(1)回归方程法
(2)简单移动平均法(3)指数平滑法
20、直线趋势方程通常公式:
式中:
表示时间数列长久趋势;表示时间数列中指标所属时间;、为待定参数。
21、季节变动三个特点:
(1)季节变动每十二个月反复进行
(2)季节变动按一定周期进行
(3)每个周期改变强度大致相同
22、季节指数法两个缺点:
(1)没有考虑长久趋势影响
(2)季节比率高低受各年平均数值大小影响
第七章统计指数
1、指数按其反应对象范围不一样分为:
(1)个体指数
(2)综合指数
2、指数按其表明经济指标性质不一样分为:
(1)数量指数
(2)质量指数
●产量指数、销售量指数、职员人数指数等为数量指数。
价格指数、单位成本指数、劳动生产率指数等为质量指数。
3、计算加权综合指数两种方法:
(1)拉氏指数
(2)派氏指数
4、居民消费价格指数作用:
(1)反应城镇居民购置生活消费品价格和服务项目价格变动趋势和程度
(2)反应通货膨胀情况
(3)反应货币购置力变动
(4)反应对职员实际工资影响
5、通货膨胀率计算公式:
通货膨胀率=(汇报期居民消费价格指数-基期居民消费价格指数)
÷基期居民消费价格指数
6、货币购置力指数计算公式:
货币购置力=1÷居民消费价格指数×100
7、实际工资计算公式:
实际工资=名义工资(现价工资)÷消费价格指数