。
在轻微偏态时,三者的近似数量关系为:
。
13.测定离散程度的变异指标有哪些?
简述其主要作用。
答:
常用的变异指标有:
异众比率、极差、四分位差、平均差、方差和标准差、离散系数等。
它们的主要作用为:
1.说明数据的分散程度,反映变量的稳定性、均衡性;
数据之间差异越大,表明变量的稳定性或均衡性越差。
2.衡量平均数的代表性高低;
离散程度越大,表明平均数的代表性就越低。
3.作为统计推断的重要依据。
①判别统计推断的前提条件是否成立;
②衡量推断效果好坏的重要尺度。
14.简述方差和标准差的概念及其特征。
方差是指各变量值与均值的离差平方的算术平均数,标准差则是方差的正平方根。
两者都是标志变异指标,具有以下的特征:
离散(变异)程度的测度值之一
最常用的测度值
反映了数据的分布特征
反映了各变量值与均值的平均差异
用于数值型数据,不能用于分类数据和顺序数据
可根据总体数据或者样本数据来计算,计算公式略有差异。
15.什么是离散系数?
是变异指标与其相应的均值之比
通常是用标准差与均值来对比
是对数据相对离散程度的测度
消除了数据水平高低和计量单位不同的影响
用于对不同组别数据离散程度的比较
计算公式为:
16.简述概率抽样方式的概念和特点。
是指根据一个已知的概率来抽取样本单位,也称为随机抽样。
它包括四种基本抽样方式:
简单随机抽样、分层抽样、系统抽样和整群抽样等。
其特点是:
•按一定的概率以随机原则抽取样本;
抽取样本时,使每个单位都有一定的机会被抽中。
•每个单位被抽中的概率是已知的,或是可以计算出来的;
•当用样本对总体参数进行估计时,要考虑到每个样本单位被抽中的概率。
17.什么是抽样分布?
(1)是指样本统计量的概率分布,是一种理论分布
在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布
(2)随机变量是样本统计量
例如样本均值,样本比例,样本方差等
(3)结果来自容量相同的所有可能样本
(4)提供了样本统计量长远而稳定的信息,是进行抽样推断的理论基础,也是抽样推断科学性的重要依据。
18.什么是中心极限定理?
设从均值为μ,方差为σ2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布,即
~N(μ,σ2/n)。
19.什么是总体参数?
1)它是描述总体数量特征的概括性数字度量
2)是研究者想要了解的总体的某种数字特征值
3)人们所关心的参数主要有总体均值()、总体标准差()、总体比率(ρ)等
4)它是抽样统计推断的对象
5)总体参数通常用希腊字母表示。
20.什么是样本统计量?
1)它是用来描述样本数量特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数。
2)人们所关心的样本统计量有样本均值(x)、样本标准差(s)、样本比例(p)等。
3)样本统计量通常用小写英文字母表示。
21.怎样正确理解抽样误差?
(1)抽样误差是由于抽样的随机性所带来的误差
(2)所有可能样本的统计结果与总体真实值之间的平均性差异
(3)通常是可以计算和控制的。
影响抽样误差大小的因素主要有:
样本容量的大小
总体的变异程度
抽样方式
抽样方法。
22.简述抽样推断的点估计方法。
点估计就是用样本统计量直接作为总体参数的估计值的抽样推断方法。
例如:
用样本均值直接作为总体均值的估计值
又如:
用两个样本均值之差直接作为总体均值之差的估计值
它没有给出估计值接近总体参数程度的信息。
点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等。
23.简述抽样推断的区间估计方法。
区间估计就是在点估计的基础上,给出总体参数估计的一个区间范围,该区间是由样本统计量加减抽样误差而得到的。
根据样本统计量的抽样分布,能够对样本统计量与总体参数的接近程度给出一个概率度量。
比如,某班级的平均分数估计在75~85之间,置信水平为95%。
24.影响置信区间宽度的因素有哪些?
1)总体数据的离散程度,用σ2来测度
2)样本容量(n)的大小
3)置信水平(1-α),它影响z的大小
4)抽样方式
5)抽样方法
25.必要的样本容量(n)与哪些影响因素有关?
1)总体标准差(σ)或者方差
(2)
2)允许误差(E)
3)可靠性系数(z或者t)
4)抽样方式
5)抽样方法
26.什么是假设检验
假设检验是指先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的统计推断过程。
有参数检验和非参数检验两类方法。
它在逻辑上运用反证法,统计上依据小概率原理。
27.简述假设检验的概念及基本步骤。
答:
所谓假设检验,就是事先对总体的参数或总体分布形式做出一个假设,然后利用抽取的样本信息来判断这个假设(原假设)是否合理,即判断总体的真实情况与原假设是否存在显着的系统性差异。
所以,假设检验又被称为显着性检验。
一个完整的假设检验过程,包括以下基本步骤:
(1)针对具体问题,提出假设:
原假设H0、备择假设H1;
(2)构造适当的检验统计量Z(或者t),并根据样本数据,计算统计量的具体数值;
(3)规定显着性水平α,建立检验规则;
(4)做出判断。
①临界值规则:
如果Z(或者t)值落在拒绝域中,就拒绝H0。
否则,就接受H0。
②P-值规则:
如果P<α,就拒绝H0;否则P>α,就接受H0。
28.解释假设检验中的两类错误
第Ⅰ类错误(弃真错误)
指原假设为真时,拒绝原假设。
其发生的概率记为α,α称为显着性水平。
第Ⅱ类错误(取伪错误)
指原假设为假时,未拒绝(即接受)原假设。
其发生的概率记为β。
29.简述假设检验中的小概率原理
1)小概率是指在一次试验中,一个几乎不可能发生的事件发生的概率。
2)在一次试验中小概率事件一旦发生,我们就有足够的理由拒绝原假设。
3)小概率由研究者事先确定。
30.解释假设检验的决策规则
1.给定显着性水平α,查表得出相应的临界值za或za/2,ta或ta/2
2.将检验统计量的数值与α水平的临界值进行比较
3.作出决策
双侧检验:
|统计量|>临界值,拒绝H0
左侧检验:
统计量<-临界值,拒绝H0
右侧检验:
统计量>临界值,拒绝H0
31.简述假设检验的基本步骤
1.陈述原假设H0和备择假设H1
2.从所研究的总体中抽出一个随机样本
3.确定一个适当的检验统计量,并利用样本数据计算出其具体数值
4.确定一个适当的显着性水平α,并查表得出其临界值,指定拒绝域
5.将统计量的数值与临界值进行比较,作出决策
统计量的数值落在拒绝域中,就拒绝H0。
否则,就接受H0
也可以直接利用P值作出决策。
如果P<α,就拒绝H0;否则P>α,就接受H0
32.简述相关分析与回归分析之间的联系
1)有共同的研究对象:
都是对变量间相关关系的分析。
2)只有当变量间存在相关关系时,用回归分析去寻求相关的具体数学形式才有实际意义。
3)相关分析只表明变量间相关关系的性质和程度,要确定相关的具体数学形式依赖于回归分析。
4)相关分析中相关系数的确定,建立在回归分析的基础上。
33.直线相关系数有哪些特点?
相关系数的取值在-1与1之间。
当r=0时,表明X与Y没有线性相关关系,但可能存在着其它的非线性相关关系。
当0<|r|<1时,表明X与Y存在一定程度的线性相关关系:
若r>0,表明X与Y为正相关;
若r<0,表明X与Y为负相关。
当|r|=1时,表明X与Y完全线性相关:
若r=1,称X与Y完全正相关;
若r=-1,称X与Y完全负相关。
34.为什么只能对未知的总体参数作估计
总体参数是未知的、不可直接观测的、不能精确计算的,能够得到的只是变量的样本观测值。
结论:
只能通过变量的样本观测值,选择适当的统计方法去近似地估计回归系数等总体参数。
前提:
u是随机变量其分布性质不确定,必须作某些假定,其估计才有良好性质,其检验才可进行。
原则:
使参数估计值“尽可能地接近”总体参数的真实值。
35.编制时间数列的基本原则及其具体要求是什么?
答:
可比性原则---保证时间数列中各项数据的可比性,是编制时间序列的基本原则。
其具体要求是:
(1)、时间一致;
(2)、总体范围一致;
(3)、经济内容、计算口径、计算方法、计算价格、计量单位等方面一致。
36.比较时期数列和时点数列之间的4个不同特点。
答:
①时期序列的各个数据为时期指标值(流量),表示时期现象在各段时期内的发展总量。
时点序列的各个数据为时点指标值(存量),反映时点现象在各个时点上所处的数量状态和所达到的水平。
②时期序列中各期数据具有可加性,通过加总即可得到更长一段时间内的发展总量,有实际意义。
时点序列中各时点数据不能相加,具有不可加性,即它们相加的结果没有实际意义。
③时期序列中数值的大小与所属时期长短有直接的关系,一般是时期越长,数值就越大。
时点序列中各时点数的大小与时点间隔长短没有直接的联系。
并不是时点间隔长,时点数就大一些。
④时期序列中各期数据是对每段时间内发生的数量连续登记、累计的结果。
时点序列中各数据通常不可能、也不必要连续登记,一般是对代表时点进行间断计数的结果。
37.时间数列的分解分析有哪些基本假设?
基本假设是:
(一)现象Y只有四个构成要素:
长期趋势T、季节变动S、循环变动C和不规则变动I。
(二)
构成要素存在以下的组合模型:
乘法模型:
Y=T·S·C·I
加法模型:
Y=T+S+C+I
乘
加模型:
Y=T·S+C·I,等等。
38.简述季节变动的概念及其研究意义。
季节变动是指社会经济现象因受自然因素或社会因素影响,而形成的在一年内有规则的周期性变动。
测定季节变动的意义在于:
分析与测定过去的季节变动规律
对未来现象的季节变动作出预测
消除季节变动对时间序列的影响。
39.常用的对比分析方法及其相对数指标有哪些?
答:
根据分析目的和比较基准的不同来划分,对比分析主要有下述几种常用方法。
(1)结构分析,可计算结构相对数(即比重);
(2)比例分析,可计算比例相对数(简称比例);
(3)空间比较分析,也叫横向对比分析,可计算空间比较相对数;
(4)动态对比分析,也称为纵向对比分析,可计算动态相对数;
(5)计划完成程度分析,可计算计划完成程度相对数;
(6)强度、密度和效益分析,可计算强度相对数。
40.简述统计指数的概念及其分类
指数是一种对比分析指标,具有相对数的形式(%)。
其对比方式有:
不同时间、不同空间、实际与计划对比。
指数的分类有:
“数量指标指数”与“质量指标指数”;
“个体指数”、“总指数”与“类指数”;
“动态指数”与“静态指数”;
“综合指数”与“平均指数”;
“简单指数”与“加权指数”等。
41.简述加权综合指数的概念及其编制原理。
答:
采用加权综合方法计算的总指数,称为加权综合指数。
其编制的基本原理是:
⑴.为了解决复杂现象总体的指数化指标不能直接加总的问题,必须引入同度量因素,使其转化成相应的、能够相加的价值总量形式;
同度量因素通常也称为综合指数的权数,因为它具有权衡各个个体重要性的作用。
引入了同度量因素的综合指数,通常被称为加权综合指数。
⑵.为了在综合对比过程中,单纯反映指数化指标的变动或差异程度,又必须将引入的同度量因素的水平固定起来。
要注意同度量因素的两个问题:
指标性质(数量或质量指标)的确定、固定水平所属时期的选择。
42.简述加权平均指数的概念及其编制原理。
答:
采用加权平均方法计算的总指数,称为加权平均指数。
其编制的基本原理是:
先计算出个体指数,再将个体指数加以平均即可求得总指数,这种方法计算的总指数也称之为平均指数。
由于各个个体指数的重要性不同,所以,平均指数通常需要加权。
编制平均指数有两大问题:
采用哪种平均法?
(1).算术平均法计算较为简便,也比较直观,所以其应用较为普遍。
(2).根据所掌握的数据和服从研究目的之需要,调和平均法和几何平均法也有一定的实用价值。
权数如何确定?
(1).既要考虑实际经济意义,又要考虑获取资料的可行性和简便性。
(2).权数主要有:
基期总值(q0p0)、报告期总值(q1p1)和固定权数(wi)等三种。
要注意平均指数的两个问题:
“权数”的选择、“型式”的选择。