统计学名词解释及简答题.docx

上传人:b****6 文档编号:5187532 上传时间:2022-12-13 格式:DOCX 页数:24 大小:53.68KB
下载 相关 举报
统计学名词解释及简答题.docx_第1页
第1页 / 共24页
统计学名词解释及简答题.docx_第2页
第2页 / 共24页
统计学名词解释及简答题.docx_第3页
第3页 / 共24页
统计学名词解释及简答题.docx_第4页
第4页 / 共24页
统计学名词解释及简答题.docx_第5页
第5页 / 共24页
点击查看更多>>
下载资源
资源描述

统计学名词解释及简答题.docx

《统计学名词解释及简答题.docx》由会员分享,可在线阅读,更多相关《统计学名词解释及简答题.docx(24页珍藏版)》请在冰豆网上搜索。

统计学名词解释及简答题.docx

统计学名词解释及简答题

名词解释

一、分类数据(categoricaldata)是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,使用文字来表述的。

二、顺序数据(rankdata)是只能归于某一有序类别的非数字型数据。

三、数值型数据(metricdata)是按数字尺度测量的观察值,其结果表现为具体的数值。

四、系统抽样(systematicsampling)将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机的抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位,这种抽样方法被称为系统抽样。

五、非概率抽样(non-probabilitysampling)是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采取某种方式从总体中抽出部分单位对其实施调查。

六、抽样误差(samplingerror)是由于抽样的随机性引起的样本结果与总体真值之间的误差。

七、四分位数(quartile)也称四分位点,他是一组数据排序后处于25%和75%位置上的值。

四分位数是通过3个点将全部数据等分为4部分,其中每部分包括25%的数据。

八、离散系数也成为变异系数(coefficientofvariation),它是一组数据的标准差与其相应的平均数之比。

其计算公式为:

离散系数是测度数据离散程度的相对统计量,主要是用于比较不同样本数据的离散程度。

离散系数大,说明数据的离散程度也大;离散系数小,说明数据的离散程度也小。

九、泊松分布(Poissondistribution)是用来描述在一指定时间范围内或在指定的面积或体积之内某一事件出现的次数的分布。

十、中心极限定理(centrallimittheorem):

设从均值

(有限)的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值

的抽样分布近似服从均值为

、方差

/n的正态分布。

十一、置信区间(confidenceinterval)在区间估计中,有样本统计量所构造的总体参数的估计区间称为置信区间,其中区间的最小值称为置信上限。

十二、显著性水平(significantlevel)是一个统计专有名词,在假设检验中,它的含义是当原假设正确时却被拒绝的概率或风险,其实这就是前面所说假设检验中犯弃真错误的概率,它是由人们根据检验的要求确定的,通常取

,这表明,当做出接受原假设的决定时,其正确的概率为95%或99%。

十三、方差分析(analysisofvariance,ANOVA)就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。

十四、相关系数(correlationcoefficient)是根据样本数据计算的度量两个变量之间线性关系强度的统计量。

十五、回归模型(regressionmodel)对于具有线性关系的两个变量,可以用一个线性方程来表示他们之间的关系。

描述因变量y如何依赖于自变量x和误差项

的方程称为回归模型。

十六、点估计利用估计的回归方程,对于x的一个特定值

,求出y的一个估计值就是点估计。

点估计可分为两种:

一是平均值的点估计;二是个别值的点估计。

十七、时间序列(timeseries)是同一现象在不同时间上的相继观察值排列而成的序列。

十八、指数平滑法(exponentialsmoothing)是通过对过去的观察值加权平均进行预测的一种方法,该方法使t+1期的预测值等于t期的实际观察值与t期的预测值的加权平均值。

十九、指数,或称统计指数,是分析社会经济现象数量变化的一种重要统计方法。

指数是测定多项内容数量综合变动的相对数。

这个概念中包含两个重点:

第一个要点是指数的实质是测定多项内容;指数概念的第二个要点是其表现形式为动态相对数,既然是动态相对数,就涉及指标的基期对比,不同要素基期的选择就成为指数方法需要讨论的问题。

二十、居民消费价格指数(consumerpriceindex,CPI)是度量居民消费品和服务项目价格水平随时间变动的相对数,反映居民家庭购买的消费品和服务价格水平的变动情况。

简答题

一、概率抽样的定义及特点

概率抽样(probabilitysampling)也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。

它具有以下几个特点:

首先,抽样时是按一定的概率以随机原则抽取样本。

其次,每个单位被抽中的概率是已知的,或是可以计算出来的。

最后,当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率。

二、简述直方图与条形图的不同点

直方图与条形图不同。

首先,条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。

其次,由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。

最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。

三、简述一张好的图形应具有以下基本特征:

(1)显示数据

(2)让读者把注意力集中在图形的内容上,而不是制作图形的程序上。

(3)避免歪曲。

(4)强调数据之间的比较。

(5)服务于一个明确的目的。

(6)有对图形的统计描述和文字说明。

四、简述制作统计表应注意的几个问题

首先,要合理安排统计表的结构,比如行标题、列标题、数字资料的位置应合理安排。

其次,表头一般应包括表号、总标题和表中数据的单位等内容。

再次,表中的上下两条横线一般用粗线,中间的其他线要用细线,这样使人看起来清楚、醒目。

最后,在使用统计表时,必要时可在表的下方加上注释,特别要注明数据来源,以表示对他人劳动成果的尊重,以备读者查阅使用。

五、简述众数、中位数和平均数的关系

从分布的角度看,众数始终是一组数据分布的最高峰值,中位数是处于一组数据中间位置的值,而平均数则是全部数据算术平均。

因此,对于具有单峰分布的大多数数据而言,众数、中位数和平均数之间具有以下关系:

如果数据的分布式对称的,众数(

)、中位数(

)和平均数(

)必定相等,即

=

=

;如果数据是左偏分布,说明数据存在极小值,必然拉动平均数向极小值一方靠,而众数和中位数由于是位置代表值,不受极值的影响,因此三者之间的关系表现为:

<

<

;如果数据是右偏分布,说明数据存在极大值,必然拉动平均数向极大值一方靠,则

<

<

六、简述一组数据的分布特征可以从哪几方面进行测设

数据分布的特征可以从三方面进行测度和描述:

一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布的偏态和峰态。

七、简述古典概型的特征

(1)结果有上限。

(2)各个结果出现的可能行被认为是相同的。

八、简述评价估计量好坏的标准

1无偏性

2有效性

3一致性

九、简述假设检验的流程

首先提出原假设和备择假设。

原假设和备择假设分别为:

(克)

(克)

接下来,需要确定适当的检验统计量,并计算其数值。

最后可以进行统计决策。

十、什么是假设检验中的两类错误?

一类错误是原假设

为真却被我们拒绝了,犯这种错误的概率用

表示,所以也称

错误或弃真错误;另一类错误是原假设为伪我们却没有拒绝,犯这种错误的概率用

表示,所以也称

错误或取伪错误。

十一、说明计算

统计量的步骤

步骤一:

用观察值

减去期望值

步骤二:

之差平方;

步骤三:

的结果除以;

步骤四;将步骤三的结果加总。

十二、方差分析包括哪些类型?

它们有何区别?

根据所分析的分类型自变量的多少,方差分析可分为单因素方差分析和双因素方差分析。

当方差分析中只涉及一个分类型自变量时称为单因素方差分析。

在对实际问题的研究中,有时需要考虑对试验结果的影响。

当方差分析中涉及两个分类型自变量时,称为双因素方差分析。

十三、解释

的含义和作用

怎样度量它们之间的关系强度呢?

可以用组间平方和(SSA)占总平方和(SST)的比例大小来反映,这一比例记为

,即

其平方根R就可以用来测量两个变量之间的关系强度。

的平方根(类似于第11章中介绍的相关系数r)可以用来测量自变量与因变量之间的关系强度。

根据上面的结果可以计算出R=0.591404,这表明行业与投诉次数之间有中等以上的关系。

十四、简述方差分析的基本步骤

1提出假设

2构造检验的统计量

3统计决策

4方差分析表

十五、简述判定系数的含义及作用

判定系数是对估计的回归方程拟合优度的度量。

判定系数

测度了回归直线对观测数据的拟合程度。

若所有观测点都落在直线上,残差平方和SSE=0,

=1,拟合是完全的;如果y的变化与x无关,x完全无助于解释y的变差,此时

的取值范围是[0,1]。

越接近于1,表明回归平方和占总平方和的比例越大,回归直线与各观察点越接近,用x的变化来解释y值变差的部分就越多,回归直线的拟合程度就越好;反之,

越接近于0,回归直线的拟合程度就越差。

十六、在多元线性回归中,选择自变量的方法有哪些?

变量选择的方法主要有:

向前选择、向后剔除、逐步回归、最优子集等。

十七、简述时间序列的构成要求

时间序列的成分可以分为四种,即趋势(T)、季节性或季节变动(S)、周期性或循环波动(C)、随机性或不规则波动(I)。

十八、简述时间序列的预测程序

第一步:

确定时间序列所包含的成分,也就是确定时间序列的类型。

第二步:

找出适合此类时间序列的预测方法。

第三步:

对可能的预测方法进行评估,以确定最佳预测方案。

第四步:

利用最佳预测方案进行预测。

十九、简述构建综合评价指数的步骤

(1)建立综合评价指标体系。

(2)评价指标的无量纲化处理。

(3)确定各项评价指标的权重。

(4)计算综合评价指数。

(5)

(6)

(7)

统计学基础知识名词解释及简答题

一、名词解释

1、统计学

统计学是一门阐明如何去采集、整理、显示、描述、分析数据和由数据得出结论的一系列概念、原理、原则、方法和技术的科学,是一门独立的、实用性很强的通用方法论科学。

2、指标和标志

标志是说明总体单位属性或特征的名称。

指标是说明总体综合数量特征和数量关系的数字资料。

3、总体、样本和单位

统计总体是统计所要研究的对象的全体,它是由客观存在的、具有某种共同性质的许多个体所构成的整体。

简称总体。

构成总体的个体则称为总体单位,简称单位。

样本是从总体中抽取的一部分单位。

4、统计调查

统计调查是根据统计研究的目的和要求、采用科学的方法,有组织有计划的搜集统计资料的工作过程。

它是取得统计数据的重要手段。

5、统计绝对数和统计相对数

反映总体规模的绝对数量值,在社会经济统计中称为总量指标。

统计相对数是两个有联系的指标数值之比,用以反映现象间的联系和对比关系。

6、时期指标和时点指标

时期指标是反映总体在一段时期内累计总量的数字资料,是流量。

时点指标是反映总体在某一时刻上具有的总量的数字资料,是存量。

7、抽样估计和假设检验

抽样估计是指根据所抽取的样本特征来估计总体特征的统计方法。

假设检验是先对总体的某一数据提出假设,然后抽取样本,运用样本数据来检验假设成立与否。

8、变量和变异

标志的具体表现和指标的具体数值会有差别,这种差别就称为变异。

数量标志和指标在统计中称为变量。

9、参数和统计量

参数是反映总体特征的一些变量,包括总体平均数、总体方差、总体标准差等。

统计量是反映样本特征的一些变量,包括样本平均数、样本方差、样本标准差等。

10、抽样平均误差

样本平均数与总体平均数之间的平均离散程度称之为抽样平均误差,简称为抽样误差。

重复抽样的抽样平均误差为总体标准差的1/

11、抽样极限误差

抽样极限误差是指样本统计量和总体参数之间抽样误差的可能范围。

我们用样本统计量变动的上限或下限与总体参数的绝对值表示抽样误差的可能范围,称为极限误差或允许误差。

12、重复抽样和不重复抽样

重复抽样也称为回置抽样,是从总体中随机抽取一个样本时,每次抽取一个样本单位时都放回的抽样方式。

不重复抽样也叫不回置抽样,它是在每次抽取样本单位时都不放回的抽样方式。

13、点估计和区间估计

点估计也叫定值估计,就是直接用抽样平均数代替总体平均数,用抽样成数代替总体成数。

区间估计是在一定概率保证下,用样本统计量和抽样平均误差去推断总体参数的可能范围的估计方法。

14、统计指数

广义上来说,它是表明社会经济现象的数量对比关系的相对指标。

狭义上来说,它是反映不能直接相加对比的复杂总体综合变动的动态相对数。

15、综合法总指数

凡是一个总量指标可以分解为两个或两个以上的因素指标时,将其中一个或一个以上的因素指标固定下来,仅观察另一个因素指标的变动程度,这样的总指数就叫综合法指数。

16、平均法总指数

平均法总指数是通过对个体指数进行加权平均而求得的反映不能直接加总的多个个体所组成的复杂总体综合变动的指数。

分为两种:

加权算术平均法总指数和加权调和平均法总指数。

17、时间数列

时间数列是指同一观察现象的观察值按其发生的时间先后顺序排列而形成的数列。

时间数列也称为时间序列和动态数列。

18、相关分析和回归分析

相关分析是一种分析几个变量之间是否存在关系以及它们的关系如何的统计方法。

回归分析是指对具有显著相关关系的现象,根据其关系形态,选择一合适的数学模式,用来近似地表达变量见的平均变动关系的统计分析的方法。

19、时间序列的最初水平、中间水平和最末水平

时间数列中第一个观察值称为最处水平,最后一个观察值称为最末水平,其余各个观察值称为中间水平。

20、调查对象、调查单位和填报单位

调查对象是所要研究对象的总体。

调查单位是所要研究对象的个体。

填报单位是提交调查资料的单位。

调查单位和填报单位有时相同,有时不同。

21、环比发展速度和定基发展速度

环比发展速度是以报告期水平与其前一期水平对比,所得到的动态相对数。

表明现象逐期的发展变动程度。

定基发展速度是用报告期水平与某一固定基期水平(通常为最初水平)对比,所得到的动态相对数。

它表明所观察现象在一段时期内发展的总速度。

22、经常性调查与一次性调查的区别

两者的区分是以调查单位的登记在时间上是否具有连续性为依据的。

经常性调查的对象本身具有连续不断变化的特点。

商品零售额。

一次性调查的对象是时点现象。

如人口普查。

 

二、简答题

1、指标和标志的区别与联系

两者的区别:

(1)指标是反映总体特征的,而标志是反映总体单位特征的。

(2)标志可以用文字来反映,也可以用数字来表示。

而指标都是用数量来表示的。

两者的联系:

(1)指标是指标的汇总和综合。

(2)根据研究目的的不同,两者有时可以互换。

2、统计总体的特点

(1)同质性。

即总体单位都必须具有某些共同的品质标志属性或数量标志属性。

这是构成总体的前提。

(2)大量性。

即构成总体的总体单位数目要足够多。

这是形成总体的充分条件。

(3)差异性。

即总体单位必须具有一个或若干个可变的品质标志或数量标志。

这是形成总体的必要条件。

3、重点调查、抽样调查、典型调查的区别与联系

联系:

都是非全面调查,调查对象都是总体中的一部分

区别:

 

调查目的

调查单位

重点调查

了解被研究对象的基本情况,不能推算总体相应指标

重点单位是指它们的某一标志在总体标志值总量中占有绝大比重

典型调查

了解被研究对象的特征及发展变化趋势,可近似推算总体数量,无法估计误差

有意识地选取有代表性的典型单位

抽样调查

用样本指标数值推断总体指标数值,可以计算和控制误差

排除主观愿望按随机原则抽取样本单位

 

4、统计绝对数的分类

(1)按其反映总体内容的不同分:

总体单位总量和总体标志总量。

(2)按其反映不同的时间状况不同分:

时期指标和时点指标。

(3)按其采用的计量单位的不同分:

实物指标、价值指标和劳动指标。

5、时期指标和时点指标的区别

时期指标:

(1)连续记数,其值可以相加

(2)具有时间长度,与时间长短有关(3)是流量

时点指标:

(1)间断记数,其值不可以相加,相加无实际意义

(2)不具有时间长度,与时间长短无关(3)是存量

6、抽样技术的特点

(1)在调查单位的抽取上,遵循随机原则。

(2)以样本数据估计总体数据。

(3)以概率估计的方法对总体进行估计。

(4)在推断理论上,以大数定律和中心极限定理为基础。

(5)抽样误差可以计算并加以控制。

7、抽样误差的种类

(1)登记性误差。

又称调查误差或工作性误差,是完全可以避免的。

(2)代表性误差。

它又可以分为系统性误差和随机性误差。

系统性误差是破坏随机原则造成的偏差,也是可以避免的。

随机性误差包括抽样个体误差和抽样平均误差。

抽样个体误差不确定,难以计算。

抽样平均误差无法避免,但可以计算和控制。

8、影响抽样误差的因素

(1)总体总变量值X间的差异大小。

差异越大,误差越大。

(2)样本容量。

样本容量越大,抽样误差越小。

(3)抽样方法。

重复抽样误差一般大于不重复抽样误差。

(4)抽样调查的组织形式。

不同的组织形式,误差不同。

9、统计相对数的种类

(1)计划完成相对数。

是实际完成数与计划数的比值。

(2)结构相对数。

是总体各组成部分数值与总体总数值的比值。

(3)比例相对数。

总体中某一组的指标数值与总体中另一组的指标数值的比值。

(4)动态相对数。

某现象报告期数值与同一现象基期数值的比值。

(5)比较相对数。

某类现象的数值与不同空间同类现象的数值的比值。

(6)强度相对数。

某一现象数值与另一有联系但性质不同的现象数值的比值。

10、强度相对数与平均数的区别

(1)概念含义不同。

平均数=总体标志总量/总体单位总量。

强度相对数是某一现象数值与另一有联系但性质不同的现象数值的比值。

(2)作用不同。

强度相对数是反映某现象在另一现象中的强度、密度或普遍程度,反映现象间依存性的比例关系。

而平均数是反映总体各单位的某一变量的各个变量值一般水平的代表值。

(3)表现形式不同。

强度相对数的单位多是复合单位,由分子、分母的指标单位复合而成。

平均数则是和标志总量单位的一致。

(4)强度相对数分子、分母可以互换,平均数的分子、分母不可以互换,互换无意义。

11、统计指数的种类

(1)按反映对象的范围不同分:

个体指数、类指数和总指数。

(2)按反映统计指标的不同内容分:

质量指标指数和数量指标指数。

(3)按所采用的基期不同分:

定基指数和环比指数。

(4)按表现形式不同分:

综合法总指数和平均法总指数。

12、相关关系的种类

(1)从涉及的因素多少来分,可分为单相关和复相关。

只研究两个因素之间的相关关系叫单相关。

两个以上的为复相关。

(2)从相关关系所呈现形态来分,可分为直线相关和曲线相关。

(3)直线单相关按呈现相关关系的方向划分,又可分为正相关和负相关。

正相关表明两个因素的变动方向是相同的,负相关表明两个因素的变动方向是不同的。

 

三、计算题

1、组距、组限和组中值的计算

例:

某地区工人劳动生产率分布情况见表1

按工人劳动生产率分组(元/人·月)

企业个数(频数)

组距

组中值(元)

频率(%)

3000以下

1

 

 

 

3000~4200

3

 

 

 

4200~5400

4

 

 

 

5400~6600

4

 

 

 

6600~7800

3

 

 

 

7800~9000

2

 

 

 

9000以上

3

 

 

 

合计

20

 

 

 

要求:

根据上述资料计算各组的组距、组中值和频率(填在表中即可)

 

2、平均数、方差、标准差、离散系数的计算

例:

甲乙两人都是某一零件厂的工人,两人一个星期每天日产量资料如表2

时间

甲工人(个)

乙工人(个)

周一

5

6

周二

6

3

周三

4

6

周四

7

4

周五

2

4

(1)比较甲乙两工人平均日产量的高低

(2)计算甲乙工人日产量的标准差和离散系数,说明哪个工人的平均日产量更具有代表性

3、抽样平均误差、抽样极限误差和区间估计

例:

某地区采用简单随机抽样方法,对职工文化程度进行调查,抽查100名职工,每个职工文化程度的分布数列如表3

文化程度(年)

组中值

人数(人)

3~5

4

15

6~8

7

55

9~11

10

24

12~15

6

合计

 

100

求:

(1)抽样平均误差

(2)在概率度t=2的条件下的平均文化程度的变化范围

4、综合法统计指数的编制

例:

商品名称

计量单位

销售量

价格

基期q0

报告期q1

基期p0

报告期p1

200

240

15

18

300

320

26

30

150

130

12

10

合计

 

 

 

 

 

求:

(1)商品销售额总指数、商品销售量总指数和价格总指数

(2)分析由于销售量的变动所引起的商品销售额的变动状况

(3)分析由于商品价格的变动所引起的商品销售额的变动状况

5、平均发展水平、环比速度、定基速度的计算

例:

某县财政收入资料如表:

年份

1997

1998

1999

2000

2001

2002

财政收入(万元)

2000

 

 

 

 

 

逐期增长量(万元)

 

300

300

400

 

 

环比增长速度(%)

 

 

 

 

20

11

求:

(1)计算表中空缺数值

(2)计算1997~2002年平均发展水平、平均增长量、平均增长速度

 

6、相关系数、回归方程

例:

生产费用与产品产量有一定关系,现从某一行业中随机抽取8个企业,所得产量与生产费用的数据如下表:

企业编号

1

2

3

4

5

6

7

8

产量

40

42

50

55

65

78

84

100

生产费用

130

150

155

140

150

154

165

170

求:

(1)计算产量和生产费用的相关系数

(2)求解以产量为自变量,生产费用为因变量的直线回归方程

 

统计学是一门研究具体现象数量方面的科学,其研究对象是各种社会经济现象的数量表现,以及社会经济现象变化的数量关系和数量界限。

第一节  统计学概要

 

   一、 统计学的基本概念

    1、  统计总体与总体单位

    统计总体,简称总体或母体,是指至少有一个主要性质相同的众多个体所组成的集合体。

总体单位是构成总体的个体。

构成总体的所有单位至少有一个主要属性相同,这是组成总体的前提条件。

因此,总体必然为同质性总体,同质性是构成统计总体的基础。

总体和总体单位是相对而言的,随着研究目的的改变,总体和总体单位可以相互转化。

    2、  标志、变量和指标

    

(1)标志

    反映总体单位的属性或特征的统计术语称为标志。

标志是统计认识的起点。

    按标志是否可以用数量表现进行划分,分为品质标志和数量标志。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 艺术

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1