ImageVerifierCode 换一换
格式:DOCX , 页数:24 ,大小:53.68KB ,
资源ID:5187532      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/5187532.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(统计学名词解释及简答题.docx)为本站会员(b****6)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

统计学名词解释及简答题.docx

1、统计学名词解释及简答题名词解释一、分类数据(categorical data)是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,使用文字来表述的。二、顺序数据(ran k data)是只能归于某一有序类别的非数字型数据。三、数值型数据(metric data)是按数字尺度测量的观察值,其结果表现为具体的数值。四、系统抽样(systematic sampling)将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机的抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位,这种抽样方法被称为系统抽样。五、非概率抽样(non-probability s

2、ampling)是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采取某种方式从总体中抽出部分单位对其实施调查。六、抽样误差(sampling error)是由于抽样的随机性引起的样本结果与总体真值之间的误差。七、四分位数(quartile)也称四分位点,他是一组数据排序后处于25%和75%位置上的值。四分位数是通过3个点将全部数据等分为4部分,其中每部分包括25%的数据。八、离散系数也成为变异系数(coefficient of variation),它是一组数据的标准差与其相应的平均数之比。其计算公式为: 离散系数是测度数据离散程度的相对统计量,主要是用于比

3、较不同样本数据的离散程度。离散系数大,说明数据的离散程度也大;离散系数小,说明数据的离散程度也小。九、泊松分布(Poisson distribution)是用来描述在一指定时间范围内或在指定的面积或体积之内某一事件出现的次数的分布。十、中心极限定理(central limit theorem):设从均值、(有限)的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差/n的正态分布。十一、置信区间(confidence interval)在区间估计中,有样本统计量所构造的总体参数的估计区间称为置信区间,其中区间的最小值称为置信上限。十二、显著性水平(signi

4、ficant level)是一个统计专有名词,在假设检验中,它的含义是当原假设正确时却被拒绝的概率或风险,其实这就是前面所说假设检验中犯弃真错误的概率,它是由人们根据检验的要求确定的,通常取或,这表明,当做出接受原假设的决定时,其正确的概率为95%或99%。十三、方差分析(analysis of variance, ANOVA)就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。十四、相关系数(correlation coefficient)是根据样本数据计算的度量两个变量之间线性关系强度的统计量。十五、回归模型(regression model)对于具有线性关系的

5、两个变量,可以用一个线性方程来表示他们之间的关系。描述因变量y如何依赖于自变量x和误差项的方程称为回归模型。十六、点估计 利用估计的回归方程,对于x的一个特定值,求出y的一个估计值就是点估计。点估计可分为两种:一是平均值的点估计;二是个别值的点估计。十七、时间序列(time series)是同一现象在不同时间上的相继观察值排列而成的序列。十八、指数平滑法(exponential smoothing)是通过对过去的观察值加权平均进行预测的一种方法,该方法使t+1期的预测值等于t期的实际观察值与t期的预测值的加权平均值。十九、指数,或称统计指数,是分析社会经济现象数量变化的一种重要统计方法。指数是

6、测定多项内容数量综合变动的相对数。这个概念中包含两个重点:第一个要点是指数的实质是测定多项内容;指数概念的第二个要点是其表现形式为动态相对数,既然是动态相对数,就涉及指标的基期对比,不同要素基期的选择就成为指数方法需要讨论的问题。二十、居民消费价格指数(consumer price index, CPI)是度量居民消费品和服务项目价格水平随时间变动的相对数,反映居民家庭购买的消费品和服务价格水平的变动情况。简答题一、概率抽样的定义及特点概率抽样(probability sampling)也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。它具有以下几个特点:首先,

7、抽样时是按一定的概率以随机原则抽取样本。其次,每个单位被抽中的概率是已知的,或是可以计算出来的。最后,当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率。二、简述直方图与条形图的不同点直方图与条形图不同。首先,条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。其次,由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。三、简述一张好的图形应具有以

8、下基本特征:(1)显示数据(2)让读者把注意力集中在图形的内容上,而不是制作图形的程序上。(3)避免歪曲。(4)强调数据之间的比较。(5)服务于一个明确的目的。(6)有对图形的统计描述和文字说明。四、简述制作统计表应注意的几个问题首先,要合理安排统计表的结构,比如行标题、列标题、数字资料的位置应合理安排。其次,表头一般应包括表号、总标题和表中数据的单位等内容。再次,表中的上下两条横线一般用粗线,中间的其他线要用细线,这样使人看起来清楚、醒目。最后,在使用统计表时,必要时可在表的下方加上注释,特别要注明数据来源,以表示对他人劳动成果的尊重,以备读者查阅使用。五、简述众数、中位数和平均数的关系从分

9、布的角度看,众数始终是一组数据分布的最高峰值,中位数是处于一组数据中间位置的值,而平均数则是全部数据算术平均。因此,对于具有单峰分布的大多数数据而言,众数、中位数和平均数之间具有以下关系:如果数据的分布式对称的,众数()、中位数()和平均数()必定相等,即=;如果数据是左偏分布,说明数据存在极小值,必然拉动平均数向极小值一方靠,而众数和中位数由于是位置代表值,不受极值的影响,因此三者之间的关系表现为:;如果数据是右偏分布,说明数据存在极大值,必然拉动平均数向极大值一方靠,则。六、简述一组数据的分布特征可以从哪几方面进行测设数据分布的特征可以从三方面进行测度和描述:一是分布的集中趋势,反映各数据

10、向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布的偏态和峰态。七、简述古典概型的特征(1)结果有上限。(2)各个结果出现的可能行被认为是相同的。八、简述评价估计量好坏的标准 1 无偏性2 有效性3一致性九、简述假设检验的流程首先提出原假设和备择假设。原假设和备择假设分别为:(克)(克)接下来,需要确定适当的检验统计量,并计算其数值。最后可以进行统计决策。十、什么是假设检验中的两类错误? 一类错误是原假设为真却被我们拒绝了,犯这种错误的概率用表示,所以也称错误或弃真错误;另一类错误是原假设为伪我们却没有拒绝,犯这种错误的概率用表示,所以也

11、称错误或取伪错误。十一、说明计算统计量的步骤步骤一:用观察值减去期望值;步骤二:将之差平方;步骤三:将的结果除以;步骤四;将步骤三的结果加总。十二、方差分析包括哪些类型?它们有何区别?根据所分析的分类型自变量的多少,方差分析可分为单因素方差分析和双因素方差分析。当方差分析中只涉及一个分类型自变量时称为单因素方差分析。在对实际问题的研究中,有时需要考虑对试验结果的影响。当方差分析中涉及两个分类型自变量时,称为双因素方差分析。十三、解释的含义和作用怎样度量它们之间的关系强度呢?可以用组间平方和(SSA)占总平方和(SST)的比例大小来反映,这一比例记为,即其平方根R就可以用来测量两个变量之间的关系

12、强度。的平方根(类似于第11章中介绍的相关系数r)可以用来测量自变量与因变量之间的关系强度。根据上面的结果可以计算出R=0.591404,这表明行业与投诉次数之间有中等以上的关系。十四、简述方差分析的基本步骤1 提出假设2 构造检验的统计量3 统计决策4 方差分析表十五、简述判定系数的含义及作用 判定系数是对估计的回归方程拟合优度的度量。判定系数测度了回归直线对观测数据的拟合程度。若所有观测点都落在直线上,残差平方和SSE=0, =1,拟合是完全的;如果y的变化与x无关,x完全无助于解释y的变差,此时,则的取值范围是0,1。越接近于1,表明回归平方和占总平方和的比例越大,回归直线与各观察点越接

13、近,用x的变化来解释y值变差的部分就越多,回归直线的拟合程度就越好;反之,越接近于0,回归直线的拟合程度就越差。十六、在多元线性回归中,选择自变量的方法有哪些?变量选择的方法主要有:向前选择、向后剔除、逐步回归、最优子集等。十七、简述时间序列的构成要求时间序列的成分可以分为四种,即趋势(T)、季节性或季节变动(S)、周期性或循环波动(C)、随机性或不规则波动(I)。十八、简述时间序列的预测程序 第一步:确定时间序列所包含的成分,也就是确定时间序列的类型。 第二步:找出适合此类时间序列的预测方法。 第三步:对可能的预测方法进行评估,以确定最佳预测方案。 第四步:利用最佳预测方案进行预测。十九、简

14、述构建综合评价指数的步骤(1)建立综合评价指标体系。(2)评价指标的无量纲化处理。(3)确定各项评价指标的权重。(4)计算综合评价指数。(5)(6)(7)统计学基础知识名词解释及简答题一、名词解释1、统计学 统计学是一门阐明如何去采集、整理、显示、描述、分析数据和由数据得出结论的一系列概念、原理、原则、方法和技术的科学,是一门独立的、实用性很强的通用方法论科学。2、指标和标志 标志是说明总体单位属性或特征的名称。指标是说明总体综合数量特征和数量关系的数字资料。3、总体、样本和单位 统计总体是统计所要研究的对象的全体,它是由客观存在的、具有某种共同性质的许多个体所构成的整体。简称总体。构成总体的

15、个体则称为总体单位,简称单位。样本是从总体中抽取的一部分单位。4、统计调查 统计调查是根据统计研究的目的和要求、采用科学的方法,有组织有计划的搜集统计资料的工作过程。它是取得统计数据的重要手段。5、统计绝对数和统计相对数 反映总体规模的绝对数量值,在社会经济统计中称为总量指标。统计相对数是两个有联系的指标数值之比,用以反映现象间的联系和对比关系。6、时期指标和时点指标 时期指标是反映总体在一段时期内累计总量的数字资料,是流量。时点指标是反映总体在某一时刻上具有的总量的数字资料,是存量。7、抽样估计和假设检验 抽样估计是指根据所抽取的样本特征来估计总体特征的统计方法。假设检验是先对总体的某一数据

16、提出假设,然后抽取样本,运用样本数据来检验假设成立与否。8、变量和变异 标志的具体表现和指标的具体数值会有差别,这种差别就称为变异。数量标志和指标在统计中称为变量。9、参数和统计量 参数是反映总体特征的一些变量,包括总体平均数、总体方差、总体标准差等。统计量是反映样本特征的一些变量,包括样本平均数、样本方差、样本标准差等。10、抽样平均误差 样本平均数与总体平均数之间的平均离散程度称之为抽样平均误差,简称为抽样误差。重复抽样的抽样平均误差为总体标准差的1/。11、抽样极限误差 抽样极限误差是指样本统计量和总体参数之间抽样误差的可能范围。我们用样本统计量变动的上限或下限与总体参数的绝对值表示抽样

17、误差的可能范围,称为极限误差或允许误差。12、重复抽样和不重复抽样 重复抽样也称为回置抽样,是从总体中随机抽取一个样本时,每次抽取一个样本单位时都放回的抽样方式。不重复抽样也叫不回置抽样,它是在每次抽取样本单位时都不放回的抽样方式。13、点估计和区间估计 点估计也叫定值估计,就是直接用抽样平均数代替总体平均数,用抽样成数代替总体成数。区间估计是在一定概率保证下,用样本统计量和抽样平均误差去推断总体参数的可能范围的估计方法。14、统计指数 广义上来说,它是表明社会经济现象的数量对比关系的相对指标。狭义上来说,它是反映不能直接相加对比的复杂总体综合变动的动态相对数。15、综合法总指数 凡是一个总量

18、指标可以分解为两个或两个以上的因素指标时,将其中一个或一个以上的因素指标固定下来,仅观察另一个因素指标的变动程度,这样的总指数就叫综合法指数。16、平均法总指数 平均法总指数是通过对个体指数进行加权平均而求得的反映不能直接加总的多个个体所组成的复杂总体综合变动的指数。分为两种:加权算术平均法总指数和加权调和平均法总指数。17、时间数列 时间数列是指同一观察现象的观察值按其发生的时间先后顺序排列而形成的数列。时间数列也称为时间序列和动态数列。18、相关分析和回归分析 相关分析是一种分析几个变量之间是否存在关系以及它们的关系如何的统计方法。回归分析是指对具有显著相关关系的现象,根据其关系形态,选择

19、一合适的数学模式,用来近似地表达变量见的平均变动关系的统计分析的方法。19、时间序列的最初水平、中间水平和最末水平 时间数列中第一个观察值称为最处水平,最后一个观察值称为最末水平,其余各个观察值称为中间水平。20、调查对象、调查单位和填报单位 调查对象是所要研究对象的总体。调查单位是所要研究对象的个体。填报单位是提交调查资料的单位。调查单位和填报单位有时相同,有时不同。21、环比发展速度和定基发展速度 环比发展速度是以报告期水平与其前一期水平对比,所得到的动态相对数。表明现象逐期的发展变动程度。定基发展速度是用报告期水平与某一固定基期水平(通常为最初水平)对比,所得到的动态相对数。它表明所观察

20、现象在一段时期内发展的总速度。22、经常性调查与一次性调查的区别两者的区分是以调查单位的登记在时间上是否具有连续性为依据的。经常性调查的对象本身具有连续不断变化的特点。商品零售额。一次性调查的对象是时点现象。如人口普查。二、简答题1、指标和标志的区别与联系两者的区别:(1)指标是反映总体特征的,而标志是反映总体单位特征的。(2)标志可以用文字来反映,也可以用数字来表示。而指标都是用数量来表示的。两者的联系:(1)指标是指标的汇总和综合。(2)根据研究目的的不同,两者有时可以互换。2、统计总体的特点(1)同质性。即总体单位都必须具有某些共同的品质标志属性或数量标志属性。这是构成总体的前提。(2)

21、大量性。即构成总体的总体单位数目要足够多。这是形成总体的充分条件。(3)差异性。即总体单位必须具有一个或若干个可变的品质标志或数量标志。这是形成总体的必要条件。3、重点调查、抽样调查、典型调查的区别与联系联系:都是非全面调查,调查对象都是总体中的一部分 区别:调查目的调查单位重点调查了解被研究对象的基本情况,不能推算总体相应指标重点单位是指它们的某一标志在总体标志值总量中占有绝大比重典型调查了解被研究对象的特征及发展变化趋势,可近似推算总体数量,无法估计误差有意识地选取有代表性的典型单位抽样调查用样本指标数值推断总体指标数值,可以计算和控制误差排除主观愿望按随机原则抽取样本单位4、统计绝对数的

22、分类(1)按其反映总体内容的不同分:总体单位总量和总体标志总量。(2)按其反映不同的时间状况不同分:时期指标和时点指标。(3)按其采用的计量单位的不同分:实物指标、价值指标和劳动指标。5、时期指标和时点指标的区别时期指标:(1)连续记数,其值可以相加 (2)具有时间长度,与时间长短有关 (3)是流量 时点指标:(1)间断记数,其值不可以相加,相加无实际意义 (2)不具有时间长度,与时间长短无关 (3)是存量6、抽样技术的特点(1)在调查单位的抽取上,遵循随机原则。(2)以样本数据估计总体数据。(3)以概率估计的方法对总体进行估计。(4)在推断理论上,以大数定律和中心极限定理为基础。(5)抽样误

23、差可以计算并加以控制。7、抽样误差的种类(1)登记性误差。又称调查误差或工作性误差,是完全可以避免的。(2)代表性误差。它又可以分为系统性误差和随机性误差。系统性误差是破坏随机原则造成的偏差,也是可以避免的。随机性误差包括抽样个体误差和抽样平均误差。抽样个体误差不确定,难以计算。抽样平均误差无法避免,但可以计算和控制。8、影响抽样误差的因素(1)总体总变量值X间的差异大小。差异越大,误差越大。(2)样本容量。样本容量越大,抽样误差越小。(3)抽样方法。重复抽样误差一般大于不重复抽样误差。(4)抽样调查的组织形式。不同的组织形式,误差不同。9、统计相对数的种类(1)计划完成相对数。是实际完成数与

24、计划数的比值。(2)结构相对数。是总体各组成部分数值与总体总数值的比值。(3)比例相对数。总体中某一组的指标数值与总体中另一组的指标数值的比值。(4)动态相对数。某现象报告期数值与同一现象基期数值的比值。(5)比较相对数。某类现象的数值与不同空间同类现象的数值的比值。(6)强度相对数。某一现象数值与另一有联系但性质不同的现象数值的比值。10、强度相对数与平均数的区别(1)概念含义不同。平均数=总体标志总量/总体单位总量。强度相对数是某一现象数值与另一有联系但性质不同的现象数值的比值。(2)作用不同。强度相对数是反映某现象在另一现象中的强度、密度或普遍程度,反映现象间依存性的比例关系。而平均数是

25、反映总体各单位的某一变量的各个变量值一般水平的代表值。(3)表现形式不同。强度相对数的单位多是复合单位,由分子、分母的指标单位复合而成。平均数则是和标志总量单位的一致。(4)强度相对数分子、分母可以互换,平均数的分子、分母不可以互换,互换无意义。11、统计指数的种类(1)按反映对象的范围不同分:个体指数、类指数和总指数。(2)按反映统计指标的不同内容分:质量指标指数和数量指标指数。(3)按所采用的基期不同分:定基指数和环比指数。(4)按表现形式不同分:综合法总指数和平均法总指数。12、相关关系的种类(1)从涉及的因素多少来分,可分为单相关和复相关。只研究两个因素之间的相关关系叫单相关。两个以上

26、的为复相关。(2)从相关关系所呈现形态来分,可分为直线相关和曲线相关。(3)直线单相关按呈现相关关系的方向划分,又可分为正相关和负相关。正相关表明两个因素的变动方向是相同的,负相关表明两个因素的变动方向是不同的。三、计算题1、组距、组限和组中值的计算例:某地区工人劳动生产率分布情况见表1按工人劳动生产率分组(元/人月)企业个数(频数)组距组中值(元)频率(%)3000以下13000420034200540045400660046600780037800900029000以上3合计20要求:根据上述资料计算各组的组距、组中值和频率(填在表中即可)2、平均数、方差、标准差、离散系数的计算例:甲乙两

27、人都是某一零件厂的工人,两人一个星期每天日产量资料如表2时间甲工人(个)乙工人(个)周一56周二63周三46周四74周五24(1)比较甲乙两工人平均日产量的高低(2)计算甲乙工人日产量的标准差和离散系数,说明哪个工人的平均日产量更具有代表性3、抽样平均误差、抽样极限误差和区间估计例:某地区采用简单随机抽样方法,对职工文化程度进行调查,抽查100名职工,每个职工文化程度的分布数列如表3文化程度(年)组中值人数(人)3541568755911102412156合计100求:(1)抽样平均误差(2)在概率度t=2的条件下的平均文化程度的变化范围4、综合法统计指数的编制例:商品名称计量单位销售量价格基

28、期q0报告期q1基期p0报告期p1甲米2002401518乙件3003202630丙斤1501301210合计求:(1)商品销售额总指数、商品销售量总指数和价格总指数 (2)分析由于销售量的变动所引起的商品销售额的变动状况 (3)分析由于商品价格的变动所引起的商品销售额的变动状况5、平均发展水平、环比速度、定基速度的计算例:某县财政收入资料如表:年份199719981999200020012002财政收入(万元)2000逐期增长量(万元)300300400环比增长速度(%)2011求:(1)计算表中空缺数值(2)计算19972002年平均发展水平、平均增长量、平均增长速度6、相关系数、回归方程

29、例:生产费用与产品产量有一定关系,现从某一行业中随机抽取8个企业,所得产量与生产费用的数据如下表:企业编号12345678产量40425055657884100生产费用130150155140150154165170求:(1)计算产量和生产费用的相关系数(2)求解以产量为自变量,生产费用为因变量的直线回归方程统计学是一门研究具体现象数量方面的科学,其研究对象是各种社会经济现象的数量表现,以及社会经济现象变化的数量关系和数量界限。 第一节统计学概要 一、统计学的基本概念 1、统计总体与总体单位 统计总体,简称总体或母体,是指至少有一个主要性质相同的众多个体所组成的集合体。总体单位是构成总体的个体。构成总体的所有单位至少有一个主要属性相同,这是组成总体的前提条件。因此,总体必然为同质性总体,同质性是构成统计总体的基础。总体和总体单位是相对而言的,随着研究目的的改变,总体和总体单位可以相互转化。 2、标志、变量和指标 (1)标志 反映总体单位的属性或特征的统计术语称为标志。标志是统计认识的起点。 按标志是否可以用数量表现进行划分,分为品质标志和数量标志。

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1