商务统计考试内容总结精华删掉好多不考的.docx

资源描述

商务统计考试内容总结精华删掉好多不考的.docx

《商务统计考试内容总结精华删掉好多不考的.docx》由会员分享，可在线阅读，更多相关《商务统计考试内容总结精华删掉好多不考的.docx（23页珍藏版）》请在冰豆网上搜索。

商务统计考试内容总结精华删掉好多不考的.docx

商务统计考试内容总结精华删掉好多不考的

统计学的性质

（一）统计活动的内容与阶段

对各种数据资料的搜集、整理、分析和推断的活动过程称为统计活动，一项完整的统计活动过程可分为统计资料的搜集整理和统计资料的分析推断两大阶段。

（二）统计学的定义与分科

统计学就是关于数据资料的搜集、整理、分析和推断的科学。

关于统计资料的搜集整理和分析推断的理论与方法构成了统计学的全部内容。

（1）理论统计学与应用统计学

（2）描述统计学与推断统计学

统计学的基本概念

（一）总体和个体

组成统计活动研究对象的全部事物的全体集合，就称为统计总体，简称总体或母体；而总体中的各个事物则称为个体，总体中个体的数量称为总体容量。

1、自然物体总体与人为划定个体的总体；

2、有限总体与无限总体；

3、具体总体与设想总体（抽象总体）。

统计指标体系及其设计

（一）统计指标体系的定义

反映总体及其所含个体的各个方面特征数量的一系列相互联系、相互补充的统计指标所形成的体系，称为统计指标体系。

（二）构建统计指标体系的意义

（三）指标体系中指标的分类

1、水平指标——

（1）存量指标与流量指标，

（2）实物指标与价值指标。

2、比率指标——

（1）比例相对指标，

（2）比值相对指标，（3）动态相对指标，（4）弹性相对指标，（5）强度相对指标。

（四）指标体系设计的内容

1、确定统计指标体系的框架；

2、确定每一个指标的内涵和外延；

3、确定每个统计指标的计量单位；

4、确定每个统计指标的计算方法。

（五）指标体系设计的原则

1、目的性原则

2、科学性原则

3、可行性原则

4、联系性原则

数据采集的方式与程序

（一）数据采集——根据统计指标体系的要求，对所研究总体中个体的相应指标进行观测记录取得数据的活动过程。

（二）数据采集活动的基本要求——采集到的数据资料要具有代表性和真实性。

所谓代表性，是要求所观测到的样本必须对所研究总体具有代表性；而所谓真实性，则是要求所采集到的数据必须是真实的实际数据。

（三）数据采集方式的分类——现场调查和试验观测

试验观测

（一）试验观测设计的原则

1、均衡分散性原则

2、整齐可比性原则

（二）试验观测的方法

1、完全随机试验观测

2、随机区组试验观测

3、拉丁方试验观测

4、正交试验观测

次数分布的概念

（一）次数分布：

观测变量的各个不同取值及其出现次数的顺序排列，称为变量的次数分布。

（二）总体次数分布和样本次数分布

（三）次数分布的作用——观测变量的次数分布包含了观测变量取值的全部信息。

根据观测变量的次数分布，可以对观测变量的各种分布特征进行描述和分析。

次数分布表及其编制

（一）次数分布表的种类

1、单值分组次数分布表

2、组距分组次数分布表

（二）组距分组次数分布表的编制方法

1、确定组数

等距分组的斯特吉斯公式：

m=1+3.322lgN

2、确定组距

等距分组的参考组距：

3、确定组限

4、计数各组的次数

5、列出次数分布表

一、分布中心测度的意义

分布中心的概念——所谓分布中心，就是指随机变量的一切取值的散布中心。

二、分布中心测度指标

用来测度随机变量次数分布中心的指标可以有多种，其中在统计分析推断中常用的主要有算术平均数、中位数和众数等几种。

（一）算术平均数

1、定义——算术平均数又称算术均值，是随机变量的所有观测值总和与观测值个数的比值。

2、计算方法

（1）简单算术平均数——适用于未分组整理的各个单个观测数值，

其计算公式为：

（2）加权算术平均数——适用于已分组整理的次数分布数据，其计算公式为：

（3）算术平均数的变形——调和平均数。

对于由观测变量的各个分组和各组变量总值顺序排列所形成的分组数据。

算术平均数的公式需变换成调和平均数的形式：

当各组的变量总值mi相等时，就可简化为：

（二）中位数

1、定义

中位数是在按观测变量值的大小顺序排列所形成的变量值数列中点位置上的变量值。

对于观测变量x，假设共取得n个观测值，各个观测值按大小顺序排列为x

（1）、x

（2）、…、x（n），则其中位数可定义为：

2、组距分组次数分布数据的中位数计算

（三）众数

1、定义：

众数是随机变量的观测值中出现次数或密度最大的变量观测值。

2、组距分组次数分布数据计算众数

三、均值、中位数和众数三者之间的关系

一、总体参数及其估计量

总体指标又称为总体参数，根据样本数据来推断总体指标数值就称为参数估计。

集中了样本中有关总体参数信息的样本指标称为统计量，该统计量就可用来估计所求的总体指标的数值。

用来估计总体指标数值的统计量又称为该总体指标的估计量，该估计量的数值就称为该总体指标的估计值。

总体参数值是确定的，但是未知的；样本估计量是随机变量，其估计值是某个给定样本的计算值。

二、构造估计量的方法—矩法估计

（一）矩法估计的概念——所谓矩法估计，概括来说就是用样本矩作为总体同一矩的估计量，用样本矩的函数作为总体相应矩同一函数的估计量。

（二）常用的总体参数及其矩法估计量

三、判断估计量优劣的标准

为了保证用于估计总体指标的估计量准确可靠，就必须要求所使用的估计量具备一些优良的性质，这些性质就构成了判断一个估计量优劣的标准。

常用的标准主要有一致性、无偏性、有效性、充分性和稳健性等。

（一）一致性

对于总体指标的一个估计量，若其取值随着样本容量的增大越来越接近于总体指标的真值，即估计误差越来越小的可能性越来越大直至100%，则该估计量就称为总体指标的一致估计量，或称为相合估计量。

可以证明，由矩估计法所构造出的估计量都是所估计总体指标的一致估计量。

如样本均值是总体均值的一致估计量，样本比例p是总体比例P的一致估计量，样本方差s2也是总体方差σ2的一致估计量。

（二）无偏性

对于总体指标的一个估计量，若其估计值的数学期望等于该总体指标的真值，即其估计误差的数学期望为0，则该估计量就称为是总体指标的无偏估计量。

可以证明，样本均值是总体均值的无偏估计量，而常规样本方差却并不是总体方差σ2的无偏估计量，修正样本方差s2是总体方差σ2的无偏估计量。

修正样本方差即无偏样本方差为：

（三）有效性

对于任一总体指标，若存在两个无偏估计量，其中一个估计量的估计误差平均来说小于另一个估计量的估计误差，则称前一个估计量比后一个估计量有效。

无偏估计量的估计误差大小可用其方差衡量，所以两个无偏估计量比较，方差较小者较为有效。

对于一个总体指标来说，若在其所有无偏估计量中能够找到一个估计量，其方差最小，则该估计量就称为是该总体指标的最佳无偏估计量。

可以证明，样本均值是总体均值的最佳无偏估计量。

对于有偏估计量，衡量其有效性可用均方误差代替方差。

估计量的均方误差为：

（四）充分性

对于一个总体指标，若其估计量提取了样本中包含的有关该总体指标的全部信息，则此估计量就称为该总体指标的充分估计量。

在多数情形下，矩法估计给出的总体指标的估计量均是充分的。

如在正态分布总体之下，样本均值是总体均值的充分估计量，样本方差s2也是总体方差σ2的充分估计量。

（五）稳健性

如果用来估计总体指标的样本估计量对样本数据的污染不敏感，也就是说估计量的数值不受被污染数据的干扰或受其干扰不大，那么该估计量就是总体指标的一个稳健估计量。

实践中常用的一种估计总体均值的稳健估计量是切尾均值，切尾均值的计算公式为：

四、估计量的标准误

（一）标准误的概念

样本估计量的标准差通常称为该估计量的标准误差，简称标准误。

即：

标准误是衡量一个估计量抽样估计误差大小的一个尺度。

（二）标准误的计算

1、样本均值的标准误

2、样本比例的标准误

（三）影响标准误的因素

1、总体中各个体之间的差异程度。

总体中各个体取值之间的差异程度大即σ2也大，各总体指标估计量的标准误的数值也就大，抽样估计误差也就大。

2、样本容量的大小。

样本容量大，总体指标估计量的标准误则小，抽样估计误差也就越小；反之，样本容量越小，抽样估计误差及其标准误也就越大。

3、抽取样本的方式方法。

抽样方式方法不同，总体指标估计量的标准误就会不同，抽样估计误差的大小也就不同。

七、区间估计的概念

八、区间估计的方法

（一）均值的区间估计

1、大样本下均值的区间估计

由中心极限定理可知，对于大样本而言，样本均值的概率分布总可近似地看作是正态分布。

若事先给定置信概率为1-α，则查标准正态分布概率数值表，可得标准正态分布的上侧分位数zα/2，就可得出总体均值μ的置信区间为：

（一）均值的区间估计

（二）比例的区间估计

总体比例是两点分布总体的均值，其估计量样本比例则是来自该总体的随机样本的均值。

因此，在大样本条件下，可根据中心极限定理用类似于大样本情形下总体均值区间估计的方法来对总体比例进行区间估计。

有：

（三）方差的区间估计

由抽样分布理论可知，对于来自正态总体的一个简单随机样本，其修正样本方差s2与总体方差σ2比值的（n-1）倍服从自由度为（n-1）的χ2分布。

若给定置信概率1-α，查自由度为（n-1）的χ2分布表可得两个分位数χ1-α/2和χα/2，则可得正态总体方差σ2的置信区间为：

（四）单侧置信区间

九、样本容量的确定

若在给定1-α的置信概率之下，要求用样本均值估计总体均值的抽样估计误差不超过δ，则由总体均值的抽样估计误差限的计算公式，可计算出必需最小样本容量。

（一）放回抽样

（二）不放回抽样

一、假设检验的原理

（一）统计假设和检验统计量

所谓统计假设，就是关于总体分布特征的某种论断。

关于总体参数假设的检验，是假设检验的核心内容。

记总体参数为θ，若要判断θ是否等于某已知数值θ0，则该参数假设可表示为：

H0:

θ=θ0，H1:

θ≠θ0

其中，假设H0:

θ=θ0就是所要检验的假设，称为原假设或零假设；而假设H1:

θ≠θ0则称为对立假设或备择假设。

要检验某个假设是否正确，需根据样本所提供的信息来进行。

包含总体分布特征的全部样本信息的样本指标，是进行假设检验的依据，称为检验统计量。

（二）显著性水平和拒绝域

进行假设检验，概率论中关于小概率事件在一次试验中是不可能事件的原则是其所遵循的基本原则。

通常取小概率事件的概率临界值为0.05或0.01，用α表示，称为假设检验的显著性水平。

在原假设成立的条件下，由检验统计量的概率分布，对于给定的显著性水平，就可确定出由抽样误差引起的样本估计值对总体参数原假设值的可能的最大偏离值，作为判断原假设正确与否的临界值。

样本估计量偏离总体参数原假设值过大的区域，就是否定原假设的区域，称为否定域或拒绝域，而否定域以外的区域则称为接受域。

1、双侧检验

若要检验的假设为：

H0:

θ=θ0，H1:

θ≠θ0

则否定域应建立在与原假设值的正负偏离超出给定临界值的两边，这种检验方法称为双侧检验。

2、左侧检验

若要检验的假设为：

H0:

θ≥θ0，

H1:

θ＜θ0

则否定域应建立在与原假设值的负偏离超出给定临界值的一边，这种检验方法称为左侧检验。

3、右侧检验

若要检验的假设为：

H0:

θ≤θ0，

H1:

θ＞θ0

则否定域应建立在与原假设值的正偏离超出给定临界值的一边，这种检验方法称为右侧检验。

二、总体指标假设检验

（一）均值的检验

1、单一总体均值的检验

H0:

μ=μ0，H1:

μ≠μ0或μ＜μ0或μ＞μ0

（1）大样本情形——正态分布z检验

（2）小样本情形（正态总体）——t检验

（一）均值的检验

2、两总体均值的比较

H0:

μ1=μ2，H1:

μ1≠μ2或μ1＞μ2或μ1＜μ2

（1）大样本情形——正态分布z检验

（2）小样本情形（正态总体）——t检验

其中s2为用自由度加权的两样本方差的平均数。

单因子数据结构模型

假设所考察的因子为A，有m个不同的水平A1，A2，…，Am。

在各个水平下分别进行了n1,n2,…,nm次独立实验观测，得到变量观测值为yij，i＝1,2,…,m，j＝1,2,…,ni，则有数据结构模型为：

yij=μ+αi+εij；i＝1,2,…,m；j＝1,2,…,ni.

或者写为：

yij=μi+εij；i＝1,2,…,m；j＝1,2,…,ni.

其中μ为平均效应，αi为因子A的第i个水平Ai对观测变量的作用，称为水平Ai的效应，μi=μ+αi为在水平Ai下观测变量的总体平均值，εij仍表示实验观测的随机误差。

三、一元线性回归分析

（一）散点图

设样本观测值分别为（x1y1）、（x2，y2）、…、（xn，yn），在平面直角坐标系内将这n对观测值用n个点表示出来，所形成的图形称为散点图。

通过观察散点图的形状,可辅助判断回归函数的具体形式。

一元线性回归模型的形式为：

y＝β0＋β1x＋u

（二）模型参数的最小二乘估计

1、最小二乘估计的原理

所谓最小二乘估计，就是寻找使样本观测模型的随机误差平方和最小的参数值作为回归模型参数的估计值。

2、求一元线性回归模型系数的正规方程组

3、回归系数的最小二乘估计公式

4、样本回归方程

5、残差与残差平方和的计算

6、回归模型随机误差的方差的估计

（二）长期趋势的测定

1、常用的长期趋势模型

（1）直线趋势模型：

T（t）=a+bt

（2）指数曲线趋势：

T（t）=abt

（3）二次曲线趋势：

T（t）=a+bt+ct2

（4）修正指数曲线：

T（t）=k+abt

（5）逻辑曲线模型：

T（t）=k/（1+abt）

（6）龚珀茨曲线模型:

（7）双指数曲线模型：

T（t）=k+ae-αt+be-βt

2、趋势模型参数的估计方法

（1）最小二乘法

例如，对于直线趋势模型：

T（t）=a+bt

使用最小二乘法可得参数a和b估计值为：

2、趋势模型参数的估计方法

（2）分段总和法

例如，对于修正指数曲线趋势模型：

T（t）=k+abt

将时间序列等分为三段，各段分别求和，则得方程组为：

四、时间序列自回归分析

（一）时间序列自回归模型的构建

3、季度或月份时间序列自回归模型

一、统计决策的要素和程序

（一）决策的概念——针对面临的问题和客观环境，做出某种行动决定的过程，就是决策。

如果决策过程中所使用的分析推断方法主要是统计分析推断方法，那么这种决策就被称为统计决策。

（二）决策的类型划分

1、确定性决策

2、非确定性决策——

（1）概率型决策

（2）非概率型决策

一、统计决策的要素和程序

（三）统计决策三要素——决策者面对的客观环境具有不确定性，需要使用统计分析推断方法对决策的行动结果进行分析，这是统计决策的主要特征。

进行统计决策，必须具有以下三个基本要素。

（1）客观环境的可能状态集——Θ={θi}

（2）决策者的可行行动集——A={aj}

（3）决策行动的收益函数或损失函数

——收益函数Q（θi,aj）或损失函数L（θi,aj）

一、统计决策的要素和程序

（四）常用的损失函数

1、线性损失函数

2、平方误差损失函数

一、统计决策的要素和程序

（五）收益矩阵表和损失矩阵表

当客观环境的状态集和决策者的行动集都只包含有限个元素时，决策行动的收益函数或损失函数也可用收益矩阵表和损失矩阵表来表示。

统计决策的程序

一个完整的统计决策过程包括有下列四个步骤：

（1）确定决策目标

（2）拟定各种可行的行动方案

（3）通过比较分析选出最佳的行动方案

（4）决策的执行

统计决策的这四个步骤，又分别称为统计决策的参谋活动阶段，设计活动阶段，抉择活动阶段和任务执行阶段。

四、后验概率型决策

（一）后验概率型决策的概念

决策者事先对客观环境各种可能状态的概率分布的估计或判断，就是先验概率分布，而通过样本调查观测所取得的有关客观环境的信息，就是样本信息，根据样本信息对原有的先验概率分布加以修正，所得到的修正后的有关客观环境各种可能状态出现的概率分布，称为后验概率分布。

后验概率分布既包含了先验概率分布中有关客观环境可能状态的信息，也综合了样本中这方面的信息。

因此，利用客观环境可能状态的后验概率分布进行决策，必然会使决策的可靠性更高，效果更佳。

利用后验概率分布进行的决策，也称为贝叶斯决策。

（二）后验概率分布的计算

假设客观环境共有Ｎ种可能的状态，第i种可能状态记为Ａi，该状态出现的先验概率记为Ｐ（Ai），在该状态出现的条件之下事件B发生的概率记为P（B/Ai），则由概率论中的贝叶斯法则可知，在观察到事件B发生的条件下，客观状态Ai出现的概率即后验概率为：

展开阅读全文