统计学原理自学指导书Word文档格式.docx
《统计学原理自学指导书Word文档格式.docx》由会员分享,可在线阅读,更多相关《统计学原理自学指导书Word文档格式.docx(21页珍藏版)》请在冰豆网上搜索。
要重在理解,能提出问题,积极思考,不要死记;
通过习题可以巩固和加深对所学理论的理解,并培养分析能力和运算能力,所以应按要求完成布置的作业题。
解题前,要对所学内容基本掌握;
解题时,要看懂题意,注意分析,熟练应用各种理论和公式。
除学习规定教材外,应参阅相关的参考书。
如有条件,可通过实验验证和巩固所学理论,训练实验技能,培养严谨的科学作风。
通过各个学习环节,培养分析和解决问题的能力和创新精神。
解决问题不是仅仅照着书本上的例题作练习题,而是要求使用已有的知识对提出的要求和论据能理解和领悟,并能提出自己的思路和解决问题的方案,这是一个创新过程。
六、自学内容与指导
第一章总论
(一)自学内容
统计的产生与发展;
统计学的研究对象及其特点;
统计的研究方法;
统计中的几个基本范畴。
(二)本课重点、难点
统计的研究方法、统计总体、总体单位、统计指标、标志、变量的概念、统计总体和总体单位的区别、统计指标和标志的区别。
(三)学习指导
1.“统计”一词有三方面的涵义:
统计工作、统计资料、统计科学。
它们之间是具有密切联系的。
统计资料是统计工作的成果,统计学是统计实践活动的经验总结和理论概括,统计工作是在统计理论的指导下进行和完成的。
2.统计的研究方法:
大量观察法、综合分析法、统计分组法、归纳推断法。
3.指标与标志的区别:
(1)指标是说明总体特征的,而标志则是说明总体单位特征的。
(2)标志有不能用数值表示的品质标志与能用数值表示的数量标志,而指标都是用数值表示的,没有不能用数值表示的统计指标。
4.指标与标志的联系:
(1)有许多统计指标的数值是从总体单位的数量标志值汇总而来的,如一个煤炭工业局(公司)的煤炭总产量,是从所属各煤炭工业企业的产量汇总出来的。
(2)指标与标志(数量标志)之间存在着变换关系。
由于研究的目的不同,原来的统计总体如果变成总体单位,则相对应的统计指标也就变成数量标志,反之亦然。
第二章统计调查
统计调查的意义和种类;
统计调查的方案;
统计调查方法。
统计调查的方案的内容;
统计调查方法、统计调查方法。
1.统计调查的种类
按调查对象包括的范围划分为全面调查和非全面调查①全面调查:
构成总体的所有单位的调查。
如:
普查。
②非全面调查:
构成总体的一部分单位的调查。
如典型调查、重点调查、抽样调查。
按统计调查的组织形式划分为统计报表和专门调查:
①统计报表:
按照一定的表式和要求,自上而下的统一布置,自下而上的提供统计资料的一种定期的调查方式。
②专门调查:
为研究某些专门问题而由调查单位组织的多属一次性调查。
如普查,抽样调查,典型调查。
按调查登记的时间是否连续划分为经常性调查和一次性调查。
①经常性调查:
随着现象的不断变化而连续不断地进行登记。
如:
产品产量,原材料消耗量等。
②一次性调查:
间隔一定时间(一般为一年以上)对现象进行调查登记。
按搜集资料的方式划分为直接观察法,采访法,报告法,问卷调查法
①直接观察法:
调查人员亲自到现场对调查对象进行观察计量取得资料。
一般资料准确,但人力多、时间长。
②采访法:
调查人员对被调查者提问,据被调查者的答复取得资料,又分为个别询问法和开调查会法。
资料准确全面,但需人多。
③报告法:
调查单位按隶属关系,逐级向国家报告经济社会活动成果的搜集资料的方法。
取得资料快,节省人力、物力。
④问卷调查法:
问卷调查法是为特定目的,以问卷形式提问,发给被调查者,由被调查者自愿自由回答的一种采集资料的方法。
2.统计调查方案
统计调查是一项复杂的、严格的科学工作,必须有目的、有计划、有组织地进行,因此,在每项调查进行之前都应该制订一个周密的调查方案。
具体包括:
统计调查的目的和内容、调查对象和调查单位、调查项目和调查表、确定调查的时间和方法、制定调查工作的组织实施计划。
第三章统计整理
统计整理的概念及内容;
统计分组的概念和作用;
分配数列的编制原则和方法;
统计汇总的形式及方法;
统计表的构成。
分配数列的编制原则和方法、分配数列的编制原则和方法。
统计整理的主要内容可以简单归纳为分组、汇总和编表三个方面。
统计分组是指按照某种标志,把总体划分为若干部分的过程。
统计分组不仅是统计整理的专门方法,也是统计研究的基本方法之一。
统计分组可以反映社会经济现象的类型;
说明社会经济现象的结构极其变化;
揭示社会经济现象的依存关系。
统计分组的关键是选择分组标志和划分组限。
次数分配的特征有三种类型:
正态分布、U形分布、J形分布。
统计汇总的形式有逐级汇总和集中汇总。
汇总的方法有手工汇总和计算机汇总。
第四章总量指标和相对指标
统计的总量指标、相对指标意义、种类及其计算和运用。
总量指标、相对指标的计算和应用条件、计划完成相对指标的计算及其应用。
总量指标是指统计汇总后得到的具有计算单位的总和指标,反映被研究对象在一定时期或时点的规模、水平或性质相同总体规模的数量差异。
一般用绝对数表示,又称绝对数指标。
按指标反映的具体内容划分为总体单位总量指标和总体标志总量指标;
按指标反映的时间状况划分为时期指标和时点指标;
时期指标是反映社会经济现象在一定时期内发展变化过程总量的指标。
时点指标是反映社会经济现象在一定时点上状况的数量的指标,
1.时期指标和时点指标的特点(区别):
a.性质相同的时期指标的数值可以相加,时点指标相加则无意义。
b.同类时期指标数值的大小与时期长短有直接关系,时点指标则没有这种关系。
c.时期指标数值是经常登记取得,时点指标不是。
相对指标是两个有联系的指标数值之比,反映现象之间所固有的数量对比关系,表现形式一般为倍数或系数(以1作为对比基础),成数(以10作为对比基础),百分数(以100作为对比基础),千分数(以1000作为对比基础),复名数等。
相对指标的特点:
①将对比的基础抽象化。
②抽象化掩盖了绝对数的规模百分数或千分数(以100或1000作为对比基础)。
相对指标的作用:
反映现象间数量对比关系;
反映现象发展变化程度、速度、强度、质量、效益等;
弥补总量指标的不足,便于比较。
2.相对指标的种类及其计算方法
(1)结构相对指标
是将两个有从属关系的总量指标对比而得,说明总体内部组成情况,一般用%表示。
结构相对数=(总体内某一部分指标数值)/总体总量×
100%
结构相对指标的特点:
①各部分计算结果<1
②各部分比重之和=1
③分子分母不能互换
(2)比例相对指标
比例相对指标是同一总体内不同组成部分的指标数值对比的结果,它可以表明总体内部的比例关系。
比例相对指标=总体中某部分指标数值/总体中另一部分指标数值
特点:
①分子、分母可互换
②同一总体内
③各部分之间比例之和不等于100%
(3)比较相对指标
比较相对指标是同一时间不同国家、不同地区、不同单位的某项指标对比的结果。
比较相对指标=某一空间的某项指标数值/另一空间的同项指标数值
①对比的分子分母必须是同质现象;
②分子、分母可互换
(4)强度相对指标
强度相对指标是两个性质不同而有联系的总量指标对比的结果。
强度相对指标=某一总量指标数值/另一性质不同而有联系的总量指标数值
强度相对指标是以复名数表示的,有些强度相对指标是采用无名数。
强度相对指标的特殊使用是按平均每个人摊得到的份额表示。
由于强度相对指标的分子和分母可以互换,因此可以形成正指标和逆指标两种计算方法。
强度相对指标的特点:
①不同总体对比
②具有平均含义
③分子分母可互换
(5)动态相对指标
动态相对指标也称作发展速度,它是某一指标不同时间上的数值对比的结果。
动态相对指标一般用百分数表示。
动态相对指标=报告期指标数值/基期指标数值
(6)计划完成程度相对指标
计划完成程度相对指标是某一时期实际完成的指标数值与计划指标数量对比的结果。
一般用百分数表示。
计划完成程度相对指标=实际完成的指标数值/计划指标数值x100%
①计划完成相对指标的一般应用
②还可计算计划时期某一段累计完成数占全计划的百分比,即进行进度分析。
计划完成相对数=累计至报告期止完成数/全部计划数×
第五章平均指标
平均指标、标志变异指标的概念、作用及其计算。
平均指标、标志变异指标的计算、平均指标、标志变异指标的计算极其应用条件;
平均指标和标志变异指标联系。
平均指标是同质总体各单位某一数量标志值在具体时间、地点、条件下达到的一般水平。
平均指标可以反映现象总体的综合特征;
平均指标可以反映分配数列中各变量值分布的集中趋势;
便于比较;
通过平均指标进行数量上的推断。
平均指标按计算和确定的方法不同,分为算术平均数,调和平均数,几何平均数,众数和中位数。
前三种平均指标是根据总体各单位的标志值计算的,称为数值平均数。
众数和中位数是根据标志值在分配数列中位置确定的,称为位置平均数。
1.算术平均数的计算
算术平均数是一种应用最为广泛的平均数。
算术平均数就是对总体各单位的某一数量标志进行的平均即总体各单位某一标志值的算术和除以总体单位数。
算术平均数=标志总量/总体总量
算术平均数的特点:
①计量单位的名数应当和标志总量的计量单位一致。
②分子分母为同一总体,分母是分子的承担者。
③数量标志的平均,品质标志不能平均。
2.调和平均数的计算
调和平均数是总体各单位标志值倒数的算术平均数的倒数,也称倒数平均数。
调和平均数分为简单调和平均数和加权调和平均数。
简单调和平均法是先计算总体单位标志值倒数的简单算术平均数,然后求其倒数。
加权调和平均法是先计算总体单位标志值倒数的加权算术平均数,然后求其到数。
3.几何平均数的计算
几何平均数是n个比率乘积的n次方根。
社会经济统计中,几何平均法适用于计算平均比率和平均速度。
简单几何平均数的计算公式为:
加权几何平均数的计算公式为
4.众数
众数是总体中出现次数最多的标志值。
用字母M表示。
根据变量数列的不同种类,确定众数可采用不同的方法。
下限公式:
上限公式:
5.标志变异指标
标志变异指标说明总体单位标志值的差异大小和程度的指标。
在统计工作中,常用的标志变异指标主要有全距、平均差、标准差和变异系数。
第六章时间数列
时间数列的意义和种类;
时间数列的水平指标;
时间数列速度指标;
时间数列的趋势分
析。
时间数列水平、速度指标的计算和时间数列的趋势分析的方法、时间数列的趋势分析的方法。
1.时间数列按其指标性质不同,可以分为绝对数时间数列、相对数时间数列和平均数时间数列三大类。
其中绝对数时间数列又称之为总量指标时间数列,是基本数列,其余两种是派生数列。
总量指标时间数列按指标所反映的时间状况不同又可分为时期数列和时点数列。
时期数列有以下几个特点:
(1)数列中各个时期的指标数值可以相加。
(2)数列中每一个指标数值的大小与其所包括的时期和长短有直接关系。
(3)时期数列具有连续统计的特点。
时点数列有如下几个特点:
(1)数列中每个指标数值是不能相加的。
(2)数列中每个指标数值的大小与其时间隔长短没有直接联系。
(3)时点数列指标值不具有连续统计的特点。
2.时间数列的编制原则
时间长短统一;
总体范围统一;
计算方法、价格和计量单位的统一;
指标的经济含义统一。
3.时间数列分析指标
常见的动态分析指标有:
水平分析指标:
发展水平、平均发展水平、增长量、平均增长量。
速度分析指标:
发展速度、平均发展速度、增长速度、每增长1%的绝对值、平均增长速度。
发展水平是时间数列中具体时间条件下的指标数值,又称时间数列水平。
平均发展水平又称之为序时平均数,它是将整个时间数列作为一个整体,反映这个整体的一般水平。
增长量是报告期水平与基期水平之差,用公式表示为:
增长量=报告期水平-基期水平=a1-a0
由于基期的确定方法不同,增长量可分为逐期增长量与累计增长量。
逐期增长量是报告期水平减去基期水平说明现象逐期增长的数量;
累计增长量或累积增长量则是报告期水平与某一固定期水平(通常为a0)的差额,说明事物某一时期内的总增长量:
逐期增长量=a1-a0,a2-a1,……,an-an-i
累计增长量=a1-a0,a2-a0,……,an-a0
发展速度是以相对数形式表示的动态指标,是两个不同时期发展水平指标对比的结果。
主要用来说明报告期的水平是基期水平的百分之几或若干倍。
公式为:
发展速度=报告其水平/基期水平
发展速度由于采用的基期不同,可分为定基发展速度和环比发展速度。
定基发展速度是报告期水平与某一固定时期水平之比,说明社会经济现象在一个较长时期内的变动程度;
环比发展速度是各期水平与前一期水平的对比,表明报告期的水平对比前一期水平的逐期发展变化的情况,用算式表示为:
环比发展速度:
定基发展速度:
长期趋势是指现象在较长时期内持续发展变化的方向和状态。
长期趋势是现象在一段较长的时间内,由于普遍的、持续的、决定性的基本因素的作用,使发展水平沿着一个方向,逐渐向上或向下变动的趋势。
常用的测定长期趋势的方法有:
时距扩大法、移动平均法和数学模型法。
第七章统计指数
统计指数的意义和种类;
综合指数的计算;
平均指数的计算;
统计指数体系和因素分析。
各种指数(指数体系)编制的基础、编制的原则、编制的方法和应用的条件。
综合指数的计算、统计指数体系和因素分析、综合指数的计算、统计指数体系和因素分析。
广义上说,指数是指用来反映研究所研究社会经济现象总体数量变动状况的相对数。
狭义上说,指数是指用来综合反映所研究社会经济现象复杂总体数量变动状况的相对数。
统计指数按所反映的对象范围不同分为个体指数和总指数。
按所表明现象的数量特征不同统计指数分为数量指标指数和质量指标指数。
总指数按其所采用的指标形式不同,可以分为综合指
数与平均指数。
指数综合地反映复杂经济现象总体的变动方向和幅度。
1.数量指标综合指数的编制
(1)用基期价格为同度量因素(加权),公式为:
编制数量指标综合指数的一般原则是采用基期的质量指标作同度量因素。
这一原则有两层含义:
一是编制数量指标指数应以质量指标作同度量因素,二是将同度量因素固定在基期。
2.质量指标综合指数的编制
用报告期价格为同度量因素(加权),价格指数公式为:
3.指数体系及因素分析
由三个或三个以上具有内在联系的指数构成的有一定数量对等关系的整体,叫指数体系。
第八章抽样推断
抽样推断的意义和内容;
抽样误差;
抽样估计的方法;
抽样组织设计。
抽样估计的方法、抽样误差的计算和区间估计的方法及抽样的组织形式。
1.抽样调查是按随机原则从全部研究单位中抽取一部分单位进行观察,根据样本资料计算样本的特征值,然后以样本的特征值,对总体的特征值做出具有一定可靠性的估计和判断,以反映总体的数量特征和数量表现的一种统计方法。
抽样调查的基本特点:
(1)调查单位的确定是按随机原则从全部总体单位中抽取的。
(2)用部分单位的指标数值去推断和估计总体指标数值。
(3)抽样调查中的抽样误差是不可避免的,但在事先是可以计算并加以控制的。
2.抽样误差的一般概念
抽样误差是指样本指标与被它估计未知的总体参数(总体特征值)之差。
统计调查误差按产生的原因可以分为登记性误差和代表性误差。
3.影响抽样误差的因素
(1)总体被研究标志的变异程度。
(2)样本容量的大小,即样本单位数的多少。
(3抽样的组织形式。
(4)抽样的方法。
4.抽样平均误差的计算
我们用希腊字母μ表示抽样平均误差;
用μx表示抽样平均指标的抽样平均误差;
用μp表示抽样成数的抽样平均误差。
(1)均值的抽样平均误差
在重复抽样条件下
在不重复抽样条件下
(2)抽样成数的抽样平均误差
在重复抽样的条件下
其中,P为总体成数,n为样本单位数
在不重复抽样的统计下
5.抽样估计的优良标准
无偏性。
即以抽样指标估计全及指标要求抽样指标值的平均数等于被估计的全及指标本身。
一致性。
即当样本容量n充分大的时,若样本指标充分地靠近被估计的全及指标,则该样本指标是被估计的全及指标的一致估计量。
有效性。
即如果一个样本估计量的方差比其他估计量的方差小,则称该样本估计量是被估计的全及指标的有效估计量。
6.区间估计
区间估计所表明的是一个可能范围,不是一个绝对可靠的范围。
是用样本指标和它的抽样极限误差构成的区间来估计总体指标,并以一定的概率保证总体指标将在所估计的区间内。
7.抽样的组织方式
类型抽样,又称为分层抽样。
它首先把全及总体各单位按某一标志分成若干个类型组,使各组组内标志值比较接近,然后分别在各组组内按随机原则抽取样本单位。
可见类型抽样的特点在于,它把分组法和贯彻随机原则结合起来。
等距抽样又称为机械抽样或系统抽样,它是事先将总体各单位按某一标志排列,然后依固定顺序和间隔抽选调查单位的一种抽样组织形式。
如对职工按姓氏笔划顺序排队,然后按此顺序等间隔地抽取样本单位进行调查。
整群抽样是先将全及总体各单位划分成若干群(组),然后以群(组)为单位从总体中随机抽取一些群(组),对中选群(组)的所有单位进行全面调查的抽样组织形式。
8.影响抽样单位数目多少的因素
(1)总体中各单位的标志变异程度的大小
(2)抽样推断的可靠性程度大小
(3)允许误差的大小
(4)抽样方法和抽样组织形式
第九章相关分析和回归分析
相关分析的意义和种类、相关系数、回归分析。
相关分析和相关分析、相关系数的计算和回归方程的建立。
世界是普通联系的,孤立的现象或事物是不存在的。
事物或现象之间的相互联系、相互制约,构成错综复杂的客观世界,构成世界的运动和发展。
所有各种现象之间的相互联系都通过数量关系反映出来。
如果进一步加以考察,可以发现,现象之间相互联系可区分为两种不同的类型:
(1)函数关系。
它反映着现象之间存在着严密的依存关系,在这种关系中,对于某一变量的一个数值,都有另一变量的确定的值与之对立,如:
S=πR2圆的面积S与半径R是函数关系,R值发生变化,则有确定的S值与之对应。
在客观世界广泛存在着函数关系。
(2)相关关系。
它是指现象之间确实存在的,但关系值不固定的相互依存关系。
即对于某一变量的每一个数值,另一变量有若干个数值与之相适应。
相关关系和函数关系有区别。
函数关系是指两个变量之间存在着相互依存关系,但是它们的关系值是固定的,而具有相关关系的变量之间关系值是不固定的。
相关关系与函数关系也是有联系的,由于有观察或测量误差等原因,函数关系在实质中往往通过相关关系表现出来。
相关关系是变量之间关系值不确定的相互依存关系,但在一定条件下,变量之间又可能存在着某种确定的函数关系,要找出这种关系要应用统计中的回归分析与相关分析的方法。
按影响因素的多少分为单相关与复相关。
按相关关系的表现形态分为直线相关和曲线相关。
按变量之间相关关系的方向分为正相关与负相关。
按相关的程度分为完全相关、不完全相关和不相关。
1.对相关与回归分析的主要内容如下:
(1)确定现象之间有无关系及相关关系的表现形式。
根据对客观现象的定性认识用列相关表、画相关图或数学解释进行判断。
(2)确定相关关系的密切程度。
(3)关系不密切,就不必重视它,不必花费大量的精力研究它;
(4)对具有比较密切相关的变量进行回归分析,以测定变量之间数量变化上的一般关系。
(5)确定因变量估计值的误差程度,计算估计标准差。
2.相关关系的测定
相关表和相关图、相关系数。
其计算公式为:
据此推倒得到以下公式:
-1≤γ≤1。
为判断时有个标准,相关关系密切程度的等级采用四级划分法:
|γ|<0.3弱相关
0.3≤|γ|<0.5低度相关
0.5≤|γ|<0.8显著相关
0.8≤|γ|<1高度相关
3.回归分析的特点
(1)两变量中,一个是自变量,一个是因变量。
(2)回归方程不是抽象的数学模型,而是用自变量数值推算因变量数值的根据,必须反映变量之间关系的一般变动情况。
(3)对于没有明显因果关系的两个变量,可以确定两个不能互相替代的回归方程,一是以x为自变量,以y为因变量的回归直线方程;
另一是以x为因变量,以y为自变量的回归直线方程,这两条回归直线方程斜率不同,意义不同。
需要注意的是,一个回归方程只能作出一种推算,即只能根据自变量的取值推算因变量的可能值,不能反过来由因变量推算自变量,尽管在数学形式上这样计算是可能的,但在实际意义上却是不允许的。
(4)直线回归方程系数即斜率有正有负,正回归系数表明两变量之间是正相关,负回归系数表明两变量之间是负相关,至于回归系数数值的大小,视原数列使用的计算单位而定,这不能表明两个变量之间的变动程度。
(5)计算回归方程的资料要求是,因变量为随机的,而自变量是给定的数值,求出回归方程后,也是给定自变量值,代入方程中,推算出因变量的一般值或平均数值。
区别主要表现在:
(1)相关关系是用来度量变量与