1、整理统计学复习题2013年统计学复习题一、名词解释1.总体:指客观存在的,在某一相同性质基础上结合起来的许多个别事物的整体。2.总体单位:是构成统计总体的个别事物或基本单位。3.标志:说明总体单位特征的名称,分为品质标志和数量标志。4.统计设计:根据统计研究的任务和研究对象的特点,对统计工作的各个方面和各个环节所作的通盘考虑和安排,是统计工作的首要阶段。5.统计调查:按照预定的统计任务,运用科学的调查方法,有组织、有计划的向社会实际搜集资料的过程,统计调查是我们认识的基础,分析的前提、决策的依据。6.经常性调查:随着被调查对象的连续变化,随时将变化的情况进行连续不断的登记。7.普查:专门组织的
2、一次性的全面调查,可以用来搜集某些不能够或不适宜用定期全面统计报表搜集的统计资料。8.是非标志:只表现为“是”与“否”或“有”与“无”两种属性的品质标志,又叫交替标志。9.抽样误差:抽样估计值与被估计的未知的真实总体参数之差。10.抽样平均误差:是所有可能样本指标的标准,反映抽样误差的一种水平。11.必要样本容量:是只既能够满足抽样推断准确性和可靠性的要求,又不会造成浪费的样本单位数目。12.相关关系:指变量间存在的一种不严格的不确定的依存关系。13.时点数列:时间数列上的每个总量指标数值都是现象在某一时刻上所达到的绝对数水平值时,这种数列为时点数列。14.平均发展水平:是对时间数列中不同时间
3、上的指标值加以平均所得的平均数,又称序时平均数。15.统计指数:从狭义上讲,是一种特殊的相对数,它是综合反映复杂社会经济现象总体数量变动方向和程度的相对数。16.个体指数:反映某一单项事物数量变动的相对数。17.同度量因素:在编制综合指数时,把不能直接对比的现象转化为可以相加或相比的媒介因素。18.综合指数:通过两个有联系的综合总量指标的对比计算的总指数。19、指数体系:从狭义上说是指由不仅在意义上具有联系,而且在数量上具有一定对等关系的三个或三个以上的指数所构成的一个整体。20、统计学:是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进
4、行推断和预测,为相关决策提供依据和参考。21、统计:从数量方面认识事物的特征及规律的科学方法,有3层含义,及统计工作、统计资料、统计学。22、 统计报表:按照国家统一规定的表格形式,统一规定的指标内容,统一规定的报送程序和报送时间,由填报单位自上而下逐级提供统计资料的一种统计调查方式。23、统计整理:根据统计研究目的和统计分析的要求,使统计调查所获得的原始资料进行科学的分类和汇 总,或对简单加工过的资料进行再加工,使之系统化、条理化,从而得出能够反映事物总体特征资料的工作过程。24、统计分组:根据研究任务的需要和事物内在的特点,将统计总体按照一定的标志划分为若干组成部分的一种统计方法。25、分
5、类数列:将各组别与次数按一定的次序排列所形成的数列。26、统计表:以表格来表现统计数据资料的一种形式。27、总量指标:反映社会经济现象发展的总规模、总水平的综合指标。28、相对指标:两个相互联系的现象数量的比率,用以反应现象的发展程度、结构、强度、普遍程度或比例关系。29、平均指标:平均指标又称平均或均值,反映的是现象在某一空间或时间上的平均数量状况。30、变异指标:综合反映总体各单位标志值变异程度的指标。31、时期指标:指反映某种社会经济现象在一段时间发展变化结果的总量指标。32、时点指标:反映社会经济现象在某一时间状况上的总量指标。33、时间序列:指社会经济现象在不同时间生的一系列同类指标
6、值按时间先后顺序加以排列后形成的数列34、发展水平:动态数列中的每一项具体指标数值。35、增长量:用来说明社会经济现象在一定时期内所增长的绝对数量的指标。36、发展速度:以相对数形式表现的动态分析指标,是两个不同时期发展水平指标对比的结果。37、增长速度:反映现象数量增长方向和程度的动态相对指标。38、总指数:综合说明不能同度量的许多个别事物构成的复杂现象总体综合变动的相对数。39、因素分析法:利用指数体系以数量上分析复杂现象总动态中各个因素变动的影响程度和影响绝对效果。二、简答题1、“统计”一词有哪几种含义?答:统计有三种理解:统计工作,统计资料,统计学,三者关系:统计工作与统计资料是统计过
7、程与活动成果的关系,统计工作与统计学是统计实践与统计理论的关系,统计工作先于统计学。统计学研究的对象是统计研究所要认识的客体。2、什么是变量?举例说明离离散变量和连续变量?答:变异标志可以是品质标志,也可以是数量标志。变异标志又被称为变量,即变量泛指一切可变标志,既包括可变的数量标志,也包括可变的品质标志。在统计中的变量是用于说明现象某种特征的概念。如“商品销售额”、“受教育程度”、“产品的质量等级”等都是变量。变量的具体数值表现称为变量值。比如商品销售额可以是20万元、30万元、50万元等等,这些数字就是变量值。统计数据就是统计变量的具体表现。举例离散变量:对家庭总体按家庭成员数分为以下几组
8、:一个人的,两个人,三个人的,四个人的,五个人的,六个人的组,这里“两个”“三个”等,就是单项式分组的组名称,具有离散型数量特征举例连续变量由于不能一一列举变量值,帮不能作单项式分组,只能进行组距式分组。如,工人按工资分组,可作如下组距式分组:13001400元,14001500元,15001600元等。3、请分别说明普查与抽样调查的特点答:普查是专门组织的、一般用来调查属于一定时点上社会经济现象数量的全面调查。普查的特点:(1)普查是一种不连续调查。因为普查的对象是时点现象,时点现象的数量在短期内往往变动不大,不需做连续登记。(2)普查是全面调查。它比任何其它调查方法都更能掌握全面、系统的,
9、反映国情国力方面的基本统计资料。(3)普查能解决全面统计报表不能解决的问题。因为普查所包括的单位、分组目录、指标内容比定期统计报表更广范、更详细,所以能取得更详尽的全面资料。(4)普查要耗费较大的人力、物力和时间,因而不能经常进行。 抽样调查的特点:(1)抽样调查是一种非全面调查,但其目的是要通过对部分单位的调查结果来推断总体的数量特征。(2)抽样调查是按照随机原则从全部总体单位中来抽选调查单位。所谓随机原则就是总体中调查单位的确定完全由随机因素来决定,单位中选与不中选不受主观因素的影响,保证总体中每一单位都有同等的中选可能性。4、变量分配数列编制的步骤 将原始资料按其数值大小重新排列 只有把
10、得到的原始资料按其数值大小重新排列顺序,才能看出变量分布的集中趋势和特点,为确定全距,组距和组数作准备. 确定全距 全距是变量值中最大值和最小值的差数.确定全距,主要是确定变量值的变动范围和变动幅度.如果是变动幅度不大的离散变量,即可编制单项式变量数列,如果是变量幅度较大的离散变量或者是连续变量,就要编制组距式变量数列. 确定组距和组数 前面已经介绍过组距数列有等距和不等距之分,应视研究对象的特点和研究目的而定. 组距的大小和组数的多少,是互为条件和互相制约的.当全距一定时,组距大,组数就少;组距小,组数就多.在实际应用中,组距应是整数,最好是5或10的整倍数.在确定组距时,必须考虑原始资料的
11、分布状况和集中程度,注意组距的同质性,尤其是对带有根本性的质量界限,绝不能混淆,否则就失去分组的意义. 在等距分组条件下,存在以下关系: 组数=全距/组距 确定组限 组限要根据变量的性质来确定.如果变量值相对集中,无特大或特小的极端数值时,则采用闭口式,使最小组和最大组也都有下限和上限;反之,如果变量值相对比较分散,则采用开口式,使最小组只有上限(用XX以下表示),最大组只有下限(用XX以上表示).如果是离散型变量,可根据具体情况采用不重叠组限或重叠组限的表示方法,而连续型变量则只能用重叠组限来表示. 在采用闭口式时,应做到最小组的下限低于最小变量值,最大组的上限高于最大变量值,但不要过于悬殊
12、. 编制变量数列 经过统计分组,明确了全距,组距,组数和组限及组限表示方法以后,就可以把变量值归类排列,最后把各组单位数经综合后填入相应的各组次数栏中.5、统计表由哪几个部分组成?答:统计表由标题、横行和纵栏。数字资料等部分构成的。标题分为三种:总标题是表的名称,放在表的上端:横行标题或称横标目,写在表的左方;纵栏标题或称纵标目写的表在上方。统计表的内容包括主词和宾词两个部分。6、什么是相对指标? 结构相对指标、比例相对指标和比较相对指标有什么不同的特点?请举例说明。 答:结构相对指标是以总体总量为比较标准,计算各组总量占总体总量的比重,来反映总体内部组成情况的综合指标。比例相对指标是总体不同
13、部分数量对比的相对数,用以分析总体范围内各个局部之间比例关系和协调平衡状况。比较相对指标是不同单位的同类指标对比而确定的相对数,借以说明同类现象在同一时期内各单位发展的不平衡程度。 7、什么是平均指标?在统计分析中的作用是什么?答:平均指标又称统计平均数,主要用于反映社会经济现象总体各单位某一数量标志在一定时间、地点条件下所达到的一般水平。在社会经济统计中,平均指标是最常用的一种综全指标。作用:第一、反映总体各单位变量分面的集中趋势。第二、比较同类现象在不同单位的发展水平,用于说明生水平、经济效益或工作质量的差距。第三、分析现象之间的依存关系。此外,平均指标经常被作为评价事物和问题决策的数量标
14、准或参考。8、什么是变异系数?变异系数的应用条件是什么?请写出标准差异系数的计算公式 .答:变异系数是相对数形式表示的变异指标。它是通过变异指标中的全距、平均差或标准差与平均数对比得到的。常用的是标准差系数。 变异系数的应用条件是:当所对比的两个数列的水平高低不同时,就不能采用全距、平均差或标准差百行对比分析,因为它们都是绝对指标,其数值的大小不仅受各单位标志值差异程度的影响;为了对比分析不同水平的变量数列之间标志值的变异程度,就必须消除水平高低的影响,这时就要计算变异系数。变异系数的计算公式为:变异系数 CV =( 标准差 平均数) 100%9、请分别写出简单算术平均数、加权算术平均数、加权
15、调和平均数的计算公式并分别说明其应用条件。答:简单算术平均数它适用于未分组的统计资料;如果已知各单位标志值和总体单位数,可用简单算术平均数计算。加权算术平均数,它适用于分组的统计资料,如果已知各组的变量值和变量值出现的次数,则可用加权算术平均数。调和平均数,在实际工作中,有时由于缺乏总体单位数资料,而不能直接计算平均数,这时就可以采用调和平均数。10、举例说明总体、样本、参数、统计量、变量这几个概念?答:如果研究的对象是100人,这100人就是总体。从中抽取10人做研究,那就是样本。参数是反映总体统计特征的数字,如这100人的平均身高,方差等等。变量就是反应总体的某些特性的量,如身高。11、什
16、么是抽样平均误差和抽样极限误差?二者有何关系?写出二者的计算机公式答:抽样平均误差是反映抽样误差一般水平的指标;而抽样极限误差是反映抽样误差的最大范围的指标,二者既有联系又有区别。二者的联系是:极限误差是在抽样平均误差的基础上计算得到的,即 ;二者的区别是:(1)二者涵义不同;(2)影响误差大小的因素不同;(3)计算方法不同。抽样平均误差标准差样本单位数的平方根;抽样极限误差样本平均数减去总体平均数的绝对值;抽样极限误差是T倍的抽样平均误差。 12、解释相关关系的含义,说明相关关系的特点。答:我们在理解相关关系时,需要区别相关关系与函数关系。函数关系是一一对应的确定关系,例如当银行年利率确定时
17、,年利息额y与存款额x之间就是函数关系,它表现为yxr。而相关关系就没有这样确定的关系了,我们把变量之间存在的不确定的数量关系称为相关关系(correlation)。比如家庭的储蓄额和家庭收入之间的关系。如果发现家庭储蓄额随家庭收入的增长而增长,但它们并不是按照一个固定不变的比率变化的,由于可能还会有其他很多较小的因素影响着家庭储蓄这个变量,因此这其中可能会有高低的偏差,这种关系就是相关关系而不是函数关系。相关关系的特点是,一个变量的取值不能由另一个变量惟一确定,当变量x取某一个值时,变量y的取值可能有几个。对这种关系不确定的变量显然不能用函数关系进行描述,但也不是无任何规律可循。通过对大量数
18、据的观察与研究,我们就会发现许多变量之间确实存在一定的客观规律。13、请写出计算相关系数的简要公式,说明相关关系的取值范围及其判断标准?答:相关系数的简要公式:1)相关系数的数值范围是在 1 和 +1 之间,即时 ,时为正相关,时为负相关。2)当 时, x与y完全相关;两变量 是函数关系; 微弱相关 低度相关当 时,x与y不完全相关 (存在一定线性相关) 显著相关 高度相关 当 时,x与y不相关14、拟合回归程yc=a+bx有什么前提条件? 在回归方程yc=a+bx,参数a,b 的经济含义是什么?答:1)拟合回归方程 的要求有:1)两变量之间确存在线性相关关系;2)两变量相关的密切程度必须是显
19、著相关以上;3)找到全适的参数a,b使所确定的回归方程达到使实际的y值与对应的理论估计值的离差平方和为最小。2)a的经济含义是代表直线的起点值,在数学上称为直线的纵轴截距,它表示x=0时y常项。 参数b 称为回归系数,表示自变量增加一个单位时因变量y的平均增加值,回归系数b 正负号可以判断相关方向,当b0时,表示正相关,当b0表示负相关。15、 写出数量指标指数和质量指标指数的公式,并说明同度量因素固定时期的一般方法是什么? 答:数量指标指数,质量指标指数确定同度量因素固定时期的一般方法是:编制数量指标指数时,应以质量指标为同度量因素,时期固定在基期;编制质量指标指数时,应以数量指标为同度量因
20、素,时期固定在报告期。16、综合指数与平均指数有何区别与联系?试列式证明二者之间的关系。 答:平均数指数必须在特定权数的条件下才能成为综合指数的变形。 加权算术平均数指数要成为综合指数的变形,必须在基期总值()为权数的特定条件下;加权调和平均数指数要成为综合指数的变形,必须在报告期总值()为权数的特定条件下。列式证明如下: ,17、什么是时期数列和时点数列?二者相比较有什么特点? 写出时期数列和间断时点数列平均发展水平的计算公式。答:时期数列是指由反映现象在一段时期内发展过程总量的时期指标构成的动态数列。时点数列是指由反映在某一瞬间总量的时点指标构成的动态数列。二者相比较有以下特点:(1)时期
21、数列的各指标值具有连续统计的特点,而时点数列各指标值不具有连续统计的特点;(2)时期数列各指标值具有可加性的特点,而时点数列各指标值不能直接相加;(3)时期数列各指标值的大小与所包括的时间长短有直接关系,而时点数列各指标值的大小与时间间隔长短无直接关系。时期数列平均发展水平的计算公式:间断时点数列平均发展水平计算公式:(间隔不等)(间隔相等)18、写出定基发展速度与环比发展速度、累积增长量与逐期增长量的计算公式,并说明它们之间的关系。 答:计算公式:定基发展速度: ,环比发展速度 : ,累积增长量 : ,逐期增长量 :,关系:各期环比发展速度的连乘积等于定基发展速度:相邻两个时期的定基发展速度
22、之商等于相应的环比发展速度: 逐期增长量之和等于累积增长量: 相邻两个时期的累积增长量之差 = 相应的逐期增长量19、影响抽样误差的因素有哪些?(1)所谓抽样误差是由于抽样的非全面性和随机性所引起的偶然性误差,即因抽样估计值随样本不同所造成的误差。抽样误差的表现形式一般有三种:抽样实际误差,抽样标准误差,抽样极限误差。(2)影响抽样标准误差的因素,就是影响抽样分布的因素:总量分布;样本容量;抽样方法;抽样组织形式;估计量构造。20、什么是相关关系?简述相关关系的种类。(1)相关关系也称统计相关,指现象之间存在的非确定性的数量依存关系。(2)相关关系的种类:按照相关关系涉及的因素(变量)多少,可
23、分为单相关和复相关;按照相关关系的表现形式不同,可分为线性相关与非线性相关。对于一元相关,即为直线相关和曲线相关;对于单相关,按照现象数量变化的方向不同。可分为正相关和负相关;按照相关程度不同,可以分为完全相关,不完全相关和无相关。21、相关分析与回归分析有何区别与联系?(1)相关分析:广义上讲,对两个或两个以上现象之间数量上的不确定性依存关系进行的统计分析。(2)回归分析:对具有相关关系的的两个或两个以上变量之间数量变化的一般关系进行测定,确定因变量和自变量之间数量变动关系的数学表达式,以便对因变量进行估计或预测的统计分析方法。(3)区别:回归分析必须根据研究目的的确定其中一个为因变量,其余
24、为自变量;相关关系可以不区分。在相关分析中,两个变量要求都是随机的;而在回归分析中,要求因变量是随机的,而自变量的值则是给定的。若变量之间互为因果,或是没有明显因果关系,则可以求出两个回归方程;对于相关分析来说,两个变量之间只能求出一个相关系数。回归方程有较强的应用性。(4)联系:相关分析的主要任务是研究变量间相关关系的表现形式和密切程度,而回归分析师在相关分析的基础上,进一步研究现象之间的数量变化规律。22、序时平均数(动态平均数)与静态平均数(一般平均数)有何异同?共性:都反映现象的一般水平或者代表性水平,都是平均数。差别:一般平均数把同质总体某一数量标志在某一时间上的水平抽象化,从静态反
25、映现象的一般水平或代表性水平,而序时平均数则把同一现象在不同时间上的差异抽象化,从动态上反映现象的一般水平或代表性水平;静态平均数是根据变量数列计算的,而序时平均数则根据时间数列来计算【回忆:动态指标和静态指标】静态指标是反映现象总体在某一时点或相对静止时间上数列特征的指标,包括一般的总量指标、静态相对指标和一般水平指标动态指标是反映现象总体在不同时期或者时点上发展变化情况的指标,包括增长量指标、动态相对指标和序时平均指标等。23、简述时期数列与时点数列的概念和区别。(1)时期数列是指同类的时期指标按时间先后顺序形成的数列,数列中的各期指标值反映社会经济现象在一堆时期内累计达到的总量。(2)时
26、点数列是指时点指标按时间时间先后顺序排列而行成的统计数列,其指标反映经济现象在某一时点或某一瞬间所达到的水平。(3)区别:时期数列中不同时间的指标数值可以累计;时点数列中不同时点上数值不可以累计(或相加没有意义)。时期数列指标值的大小和时期长短有直接关系。一般来说,时期越长,数值越大;时点数列指标数值的大小和时间长短无直接关系。时期数列指标值一般是通过连续登记获取的;时点数列时点指标的数值一般是通过不连续登记取得的。【时期指标与时点指标有哪些区别?】时期指标是反映现象在意的时期内累计达到的总量,其数值大小与时间长短有直接短信,不同时间上的数值可以累加,数值需要通过连续登记取得(企业产量、地区G
27、DP)。时点指标是反映现象在某一时点(时刻、瞬间)所达到的总量,其数值大小时间长短无直接关系,不同时间上的数值不可以累加,数值通常不需要通过连续登记取得(企业人数、地区居民存款余额)。24、什么是数量指标指数和质量指标指数?试举例说明。(1)数量指标指数就是指数化指标为某一数量指标的指数,也即反映总体某种数量指标变动的指数,如产品产量指数、商品销售量指数、能源消耗量指数等。(2)质量指标指数就是指数化指标为某一质量指标的指数,也即反映总体某种数量指标变动的指数,如商品零售价格指数、产品单位成本指数、股票价格指数、劳动生产率指数等。25、什么是同度量因素?它与指数化因素有什么关系?该如何选择同度
28、量因素?同度量因素:计算综合指数的分子和分母都是由两个或两个以上因素所决定的总量指标,其中一个因素就是指数化因素或指数化指标,其他因素则是把不能直接相关的指数化因素转化为能直接相加的量的因素。关系:他们互为同度量因素;在编制综合指数时,同度量因素的时间或空间必须固定,才能反映指数化因素的变化情况;同度量因素起到同度量的同时,也起到一定的加权作用26、什么是统计指数体系?它有哪些构建的基本原则?有什么作用?(1)所谓统计指数体系就是由三个或三个以上具有内在本质联系的统计指数所组成的有机整体。(2)基本原则:统计指数体系中的各个指数之间必须保持等式关系,以便从相对数和绝对数两方面进行因素分析。一般
29、地,相对数之间是乘除的关系,绝对数之间是加减的关系。在利用统计指数体系进行多因素分析时,必须分清各个因素(指标)性质,即科学区分数量指标和质量指标,以便选择合适的方法来编制各相关的指数。为了保持与统计指数一般编制原则的一致性,在一个统计指数体系中,质量指标指数采用派氏形式,数量指标指数采用拉氏形式。(3)作用:利用统计指数体系对复杂现象总体的数量变化,从相对数和绝对数两方面进行因素分析,说明现象总变动中各个影响因素的变动方向和影响程度;利用指数体系中各个指数之间的数量关系,由已知的统计指数去推算为之的指数。27、算术平均数、中位数和众数三者的数量关系说明什么样的变量分布特征?中位数、算术平均数
30、、众数三者完全相等时,变量分布完全对称(正态分布)中位数、算术平均数、众数三者存在差异时,变量分布不对称在轻微偏态时,众数与算术平均数的距离约等于中位数与算术平均数距离的3倍28、在统计数据收集过程中,可能存在哪些误差?(1)观测性误差也叫登记性误差或调查性误差。它是在调查观测的各个环节因工作粗心或被观测者不愿很好配合而造成的所收集数据与实际情况不符合的误差。(2)代表性误差是指在抽样调查中,因样本不能完全代表总体而产生的估计结果与总体真实数量特征不符的误差。系统性代表性误差,是由于抽样框不完善、抽样时违反随机原则、被调查者无回答等因素引起的误差。观测性误差与系统性代表性误差合在一起称为非抽样
31、误差。偶然性代表性误差,是由于抽样的随机性引起的样本结构与总体结构不完全相符而产生的估计结果与总体真值不一致的误差,这种误差在随机抽样中不可避免,但可以计算和控制。29、什么是变量分布的集中趋势、离中趋势和分布形状?集中趋势:反映变量分布中各个变量值向中心值靠拢或聚集的程度;离中趋势:反映变量分布中各个变量值远离中心值的程度;变量分布的形状:反映变量分布的偏斜程度和尖陡程度。30、什么是平均指标?有什么作用?常用的平均数有哪些?(1)平均指标是将变量的各个变量值差异抽象化、以反映变量值一般水平或平均水平的指标,也就是反映变量分布中心值或代表值的指标。(数值平均数、位置平均数)(2)平指标的作用:通过反映变量分布的一般水平,帮助人们对研究现象的一般数量特征有一个客观的认识;利用平均指标可以对不同空间的发展水平进行比较,消除因总体规模不同而不能直接比较的因素,以反映他们之间总体水平上存在的差距,进而分析产生差距的原因;利用平均指标可以对某一现象总体在不同时间上的发展水平进行比较,以说明这种现象发展变化的趋势或规律性;利用平均指标可以分析现象之间的依存关系或进
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1