中大网校初级师统计业务知识统计方法讲义课件.docx
《中大网校初级师统计业务知识统计方法讲义课件.docx》由会员分享,可在线阅读,更多相关《中大网校初级师统计业务知识统计方法讲义课件.docx(25页珍藏版)》请在冰豆网上搜索。
中大网校初级师统计业务知识统计方法讲义课件
中大网校
第一章统计和数据
第一章
统计和数据第一节、统计的含义一、什么是统计?
1、统计的含义:
统计工作、统计资料、统计学2、统计学的含义:
大百科全书解释,见245页3、统计分析数据的方法:
描述统计、推断统计
第二节、数据类型
第二节、数据类型:
在统计中,把客观现象在某一方面特征的客观表现称作变量,例如:
某人的性别、年龄、文化程度、职业、工资收入等;某单位的经济类型、职工人数、规模、年营业额等。
变量是变异的具体表现,变量被记录下来就成为统计的数据,数据是统计的语言。
也就是说,客观现象的大部分特征都可以用数据表现。
由于客观现象的复杂性,数据有多种类型:
数据名称数据表现(结果)举例
变量数据
定性变量分类变量定性数据分类数据性别、经济类型
顺序变量顺序数据文化程度、企业规模、产品等级
定量变量(数值变量)定量数据(数值型数据)年龄、职工人数、企业收入
由定性描述到定量描述、由低级到高级、由粗略到精细
中大网校
第三节、数据来源与搜集方法
第三节、数据来源与搜集方法:
(一)数据来源:
1、原始数据——直接来源:
通过统计调查(观测数据)、实验活动(实验数据)获取的数据。
2、次级资料——间接资料:
见251页
(二)搜集数据的方法:
调查方法
特点
适用
普查
一次性的、专门进行、全面调查;时间长、成本高
属于时点或时期现象的总量,以了解国情国力基本情况。
人口普查(0)、农业普查(7)、经济单位普查(4)
抽样调查
经常性或一次性的非全面调查。
1、随机原则抽样;
2、用样本数据推断总体数据;
3、抽样误差可以计算并加以控制。
1、无限总体;
2、不可能进行的全面调查;
3、破坏性的调查。
概率抽样、非概率抽样。
直接观察或采访
重点调查
抽选重点单位进行的非全面调查。
调查了解现象基本状况与基本发展趋势,不需要掌握全面准确的数据。
报告法
典型调查
抽选典型单位进行的非全面调查。
深入、详实的搜集统计资料。
采访法
统计报表
统一规定调查要求与文件,同一程序的全面或非全面调查。
大型、国有企业,成本低、时间短。
报告法
第二章数据描述
一、频数分布(变量数列)表:
组成:
变量、变量值在各组的次数。
例如:
某校学生性别分组表
性别
人数(人)
男
女
189
111
合计
300
某地区学龄儿童年龄分布表
年龄
人数(人)
6岁以下
7~10岁
10~13岁
13岁以上
30
136
84
50
合计
300
(二)定性数据的表示方法:
1、饼图:
见257页
2、条形图:
见258页
3、环形图:
见258页
(三)定量数据的表示方法:
1、直方图:
见262页
2、折线图:
见263页
3、散点图:
见264页
第三节用统计表来表示数据
第三节用统计表来表示数据P265
1、内容:
主词、宾词
2、形式:
五部分
第四节用数字来概括数据:
数据分布特征:
集中趋势、离中趋势
1、定性数据的数字特征:
比例(性别比)、百分比(女生百分比)、中位数、众数
二、定量数据的数字特征
2、定量数据的数字特征:
(1)集中趋势:
均值、中位数、众数
均值:
算术平均数,见267页例如:
表2-10
又例:
某企业车间有180名工人,每人某天生产某种零件数的变量数列如下表所示,求工人的平均日产零件数。
某企业某班组工人日产零件数情况表
按每人日产零件数分组(件)
工人数(人)f
生产零件数(件)xf
15
16
17
18
19
20
10
20
30
50
40
30
150
320
510
900
760
600
合计
180
3240
(2)离中趋势:
全距、方差、标准差、离散系数、标准分数
例:
第三章参数估计
一、统计推断:
统计推断是指根据带随机性的观测数据(样本)以及问题的条件和假定(模型),而对未知事物作出的、以概率形式表述的推断。
统计推断的一个基本特点是:
其所依据的条件中包含有带随机性的观测数据。
以随机现象为研究对象的概率论,是统计推断的理论基础。
统计推断包括参数估计、假设检验。
二、抽样分布:
(一)总体分布与总体参数:
1、含义:
见272页
2、总体的参数:
就是对总体特征的度量值,包括总体平均数、总体方差、总体比例等。
3、总体参数是唯一真值。
(二)统计量与抽样分布
(二)统计量与抽样分布:
1、统计量的含义:
见273页
2、抽样分布:
对应于不同的样本总体,可以有不同的样本统计量,也就是说,样本统计量也是一个随机变量。
若干个抽样样本所形成的观察结果,使样本统计量表现出一定的概率分布,这就称为抽样分布。
例如:
对学生总体抽取500人进行的月平均支出的调查;对全年产品进行的废品比例的抽样检验等。
3、样本参数:
就某一个样本而言,统计量的样本均值、样本方差、样本比例成为样本参数,它们反映样本总体的某方面数量特征。
对应于很多的样本总体,样本参数也可以有很多个,它们都是用来推断总体真值的。
中心极值定理:
当总体服从非正态分布时,只要n足够大,样本均值仍会接近正态分布。
反之,n为小样本时,样本均值的分布不服从正态分布。
1、估计标准
统计量具有有效性质,可以保证选取的是一个样本取值更靠近总体参数的统计量,即选取的是具有最小方差的统计量。
统计学家已经证明,在估计总体均值时,样本均值的方差要小于其他统计量的方差。
所以,可以认为样本均值在估计总体均值时更有效。
3、一个总体的比例区间估计
三、样本量的确定:
(一)估计总体均值时样本量的确定:
见公式3.7
(二)估计总体比例时样本量的确定:
见公式3.8
第四章假设检验(初级考生不要求)
假设检验是统计推断的另一项重要内容,它与参数估计类似,只是角度不同。
参数估计是用样本统计量估计总体参数的方法。
而假设检验是先对总体参数或分布形式提出某种假设,然后利用样本信息和相关统计量的分布特征检验这个假设是否成立。
如果假设成立,我们就接受这个假设,如果不成立,就放弃原来的假设。
所以,本章是讲如何利用样本信息,对假设成立与否作出判断的一套程序。
第一节 假设检验的基本原理
一、假设检验的概念与原理:
为了对假设检验有个直观的认识,我们看一个例子:
【例】某种大量生产的袋装食品,按规定每袋重量不得少于250克。
今从一批该种食品中任意抽取50袋,发现有6袋低于250克。
若规定不符合标准的比例超过5%就不得出厂,问该批食品能否出厂?
【解析】对于该批食品的不合格率我们事先不知道,需要根据样本的不合格率估计该批食品的不合格率,然后与我们规定的合格率(小于5%)进行比较,作出该批食品能否出厂的决策。
我们可以先假设食品的不合格率小于5%,然后用样本的合格率来检验这个假设是否正确。
这便是假设检验问题。
二假设检验的步骤
二、假设检验的步骤:
【以教材表4-1为例】
1、提出原假设和替换假设(备择假设)。
在统计学中,把需要通过样本去推断其正确与否的命题称为原假设(零假设),用表示。
例如,例中:
2、确定适当的检验统计量。
用于检验假设问题的统计量成为检验统计量。
如同在参数估计中一样,需要借助于样本统计量进行统计推断。
在大样本中,检验统计量服从正态分布:
在小样本中,检验统计量服从t分布。
这和参数估计的考虑情况是一样的。
第四章第一节3、规定显著性水平
三、假设检验中的小概率原理
三、假设检验中的小概率原理:
假设检验的基本思想是应用小概率的原理。
小概率原理是指发生概率很小的随机事件在一次试验中是几乎不可能发生的。
根据这个原理,我们可以做出是否接受原假设的决定。
例如,有一个厂商声称,他的产品合格率很高,可以达到99%,那么从一批产品中随机抽取1件,这一件恰好是次品的概率就非常小,只有1%。
如果厂商宣称是真的,这一件恰好是次品的情况几乎是不可能发生的。
但如果抽到的确是一件次品,我们就有理由怀疑原来的假设,即“产品合格率很高,次品的概率非常小”的假设是否成立,这时可以推翻原假设,作出原假设是假的推论。
我们依据的就是小概率原理。
第二节 总体均值的假设检验
对于总体均值的假设检验,要看这个总体的抽样分布。
分下列几种情况:
一、大样本检验:
二、小样本检验:
【例如】学习指导183页
第2题
第3题
第三节总体比例的假设检验
第三节 总体比例的假设检验
原理同第二节
【例如】学习指导184页
第9题
第五章 相关分析与回归分析(初级考生不要求)
相关分析是研究两个或两个以上变量之间相关关系的方法论,而回归分析是研究变量之间相关关系类型,进而掌握其发展变化规律,预测未来的方法论。
第一节 相关分析
一、相关关系:
在自然界与经济生活中有许多现象之间有着某种联系,一种现象变化会引起另一种现象发生变化。
例如:
天气炎热与降雨、半径与圆的面积、粮食产量与施肥量、人均储蓄与人均收入等。
有些关系之间联系紧密,而有些关系之间联系若有若无,根据现象之间的联系紧密程度划分为:
函数关系和相关关系。
本章所要研究的是相关关系。
所谓相关关系是指现象之间既存在密切的联系但又不是严格的、确定的关系。
例如:
在经济生活中,经常会有这样的关系。
粮食产量与施肥量、人均储蓄与人均收入等。
二、相关关系的描述——散点图:
散点图是相关关系的一种描述方法,它直观、形象,通过散点图可以观察到现象的关系类型以及相关方向、程度。
三、相关程度的测定
三、相关程度的测定:
(要求会判别)
在直线相关的类型中,人们使用相关系数测定变量之间的相关关系。
(一)相关系数的计算与判别:
(要求会计算)
参见教材304页 公式5.1
(二)相关系数的检验:
(参考掌握)
检验相关系数是因为两个变量均为随机变量,计算相关系数时使用的是它们的随机抽样值,因此不能断定总体变量值也存在着这样的相关关系,需要经过显著性检验加以确定。
相关系数的检验过程:
2、 计算统计量t值:
相关系数的检验通常使用t分布检验,既可检验大样本,也可检验小样本。
3、 计算其对应的概率值并与显著性水平进行比较,如果在显著性水平范围之内,则属于原假设的小概率事件,则接受备择假设,变量之间线性相关。
否则,可以认为两变量之间不存在线性相关。
【例如】某工厂生产的某种产品产量与单位成本数据如下:
计算相关系数。
第二节一元线性回归分析
三、回归方程的评价与检验:
三、回归方程的评价与检验:
由于估计的回归方程存在有假设性,那么这种假设性是否存在?
另外,估计的回归方程是否真正描述了变量之间的统计规律性,y的变化能否通过模型中的变量来解释,这些都需要进行检验。
一般进行检验的内容有:
1、经济意义的检验:
属于逻辑性检验。
如果检验的变量之间存在有明显的逻辑错误或不合逻辑的情况,不能解释模型中的经济关系,则模型不能用。
2、回归方程的统计检验:
包括有回归方程的显著性检验、回归系数的显著性检验。
3、回归方程的评价——拟合程度分析:
拟合程度是指估计的回归方程是否很接近因变量,即估计的精确度。
最常用的指标就是——判定系数。
第六章时间序列分析
时间序列是指经济现象按时间顺序排列形成的数列。
时间序列分析就是根据这样的数列分析经济现象的发展规律,进而预测其未来水平。
第一节时间序列的分析指标
我国2004~2008年国内生产总值统计表
一、增长量分析:
(一)发展水平:
基期发展水平、报告期发展水平
(二)增长量:
逐期增长量、累计增长量
(三)平均增长量:
二、增长率分析:
(一)发展速度:
环比发展速度、定基发展速度、年距发展速度
(二)增长速度:
环比发展速度、定基发展速度、年距增长速度
增长速度=发展速度-1
(三)平均发展速度与平均增长速度的关系:
平均增长速度=平均发展速度-1
【上例】2004~2008年平均发展速度:
第二节长期趋势分析
第二节长期趋势分析
一、时间数列影响因素分解:
影响经济现象变化的因素有很多,归纳起来有:
1、 长期趋势;
2、 季节变动趋势;
3、 循环变动趋势;
4、 不规则变动趋势。
二、长期趋势分析方法:
利用一定的方法把现象的长期趋势描述出来。
(一) 回归方程法:
利用回归分析的方法,将时间变量作为解释变量,建立现象随时间变化的趋势方程。
(二) 简单移动平均法:
采用移动平均的方法,将短期内现象的变化修匀,进而预测长期趋势的方法。
(三) 指数平滑法:
是对移动平均法做的一次改进
第三节季节变动分析
第三节季节变动分析
一、不考虑长期趋势的季节指数法:
【例如】教材331页
二、考虑长期趋势的回归方程法:
【例如】教材332页
第七章统计指数
第一节统计指数概述
一、统计指数的含义:
1、 广义的含义:
凡是表明社会经济现象总体变化的相对数。
2、 狭义的含义:
表明复杂现象总体综合变动的相对数。
二、统计指数的种类:
1、个体指数和总指数:
2、数量指标指数和质量指标指数:
第二节综合指数
第二节综合指数
综合指数是总指数的一种编制方法。
编制原理:
利用总量指标的综合性,将两个比较时期的总量指标加以对比,综合计量复杂现象综合的变动程度与方向。
【例如】教材336页
第三节指数体系
第三节指数体系
指数体系是指有三个或三个以上的指数组成的具一定联系的指数组。
【例如】总产值指数=产量指数单位出厂价格指数
总成本指数=产量指数单位成本指数
销售额指数=销售量指数销售价格指数
第四节几种常用的价格指数
一、居民消费价格指数:
英文缩写为CPI,是反映与居民生活有关的产品及劳务价格统计出来的物价变动指标,通常作为观察通货膨胀水平的重要指标。
消费者物价指数到底是什么?
它测量的是随着时间的变化,包括200多种各式各样的商品和服务零售价格的平均变化值。
这200多种商品和服务被分为8个主要的类别。
在计算消费者物价指数时,每一个类别都有一个能显示其重要性的权数。
这些权数是通过向成千上万的家庭和个人调查他们购买的产品和服务而确定的。
权数每两年修正一次,以使它们与人们改变了的偏好相符。
中国CPI包括食品、烟酒、衣着、家庭设备、医疗卫生保健、文化教育娱乐、交通通讯、居住等八大类。
第一类是食品,食品当中又包括粮食、淀粉、干豆类和豆制品、油脂、肉禽及其制品,蛋、水产品,菜、调味品、糖、茶和饮料等,非常多,我们也计划适当的时候把这个公布出来。
第二大类是烟酒及其用品;
第三大类是衣着;
第四大类是家庭设备用品和维修服务;
第五大类医疗保健和个人用品;
第六大类是交通和通讯;
第七大类是娱乐、教育、文化用品和服务;
第八大类是居住。
二、股票价格指数: