1、 二、统计学的产生和发展从统计学的发展过程看,经历了古典统计学、近代统计学和现代统计学三个阶段,主要的学派有政治算术学派,国势学派(记述学派),数理统计学派,社会经济统计学派等。 三、统计学的学科性质 统计学是一门以现象的数量方面作为研究对象的独立的方法论科学。四、统计学的作用第二节 统计数据类型与研究方法一、统计数据类型可以分为定性数据与定量数据;绝对数、相对数和平均数;观测数据与实验数据;原始数据与次级数据;时序数据与截面数据。二、统计数据研究过程包括以下四个基本环节:统计设计,数据搜集,数据整理和数据分析与解释。三、统计数据研究方法基本方法有大量观察法、统计分组法、综合指标法、统计推断法
2、和统计模型法。第三节统计学的基本概念一、总体与样本(一)总体总体是有许多具有某种共同性质的个别事物所组成的有机整体,具有大量性、同质性和差异性三个特征。构成总体的个别事物称为个体,也叫总体单位。总体的种类分为有限总体与无限总体;具体总体和抽象总体;可相加总体和不可相加总体;个体可自然确定的总体与个体是人为划定的总体。总体和个体的关系表现在三个方面。(二)样本样本是从总体中抽取的一部分个体所组成的集合,也称子样。样本容量是指样本所包含的个体数。样本与总体的关系表现在三个方面。二、标志和变量 (一)标志标志是说明总体单位(个体)特征的名称。(二)变量狭义的变量是指可变的数量标志。广义讲,变量不仅指
3、可变的数量标志,也包括可变的品质标志。变量有确定性变量和随机性变量;连续变量和离散变量之分。第四节 统计指标与指标体系 一、统计指标(一)、统计指标的概念,指标是说明总体数量特征的概念或范畴。统计指标具有数量性、综合性、具体性的特点。(二)指标与标志的关系(三)统计指标的种类1、分为总量指标(总体标志总量和总体单位总量;时期指标和时点指标),相对指标(结构相对指标、比例相对指标、比较相对指标、强度相对指标、计划完成相对指标和动态相对指标),平均指标(第四章介绍);2、分为数量指标和质量指标;3、分为静态指标和动态指标;(四)统计指标的设计确定指标的名称和涵义;计算范围和计算方法,计量单位;确定
4、指标的资料搜集方法和统计量化尺度等。 二、统计指标体系(一)统计指标体系的概念及表现形式,反映同总体或样本多个方面数量特征的一系列相互联系的统计指标所形成的体系称统计指标体系。表现形式有:数学等式关系;相互补充关系;原因、条件与结果关系等。(二)统计指标体系的设计原则目的性原则、科学性原则、可行性原则、灵活性原则、层次性原则、联系性原则、协调性原则等。第二章统计数据的收集、整理与显示 本章阐述统计数据收集、整理与显示的理论与方法,具体要求:理解统计数据收集的含义与要求,掌握统计数据收集方案设计;熟悉统计数据收集的各种方式、方法并能加以应用;基本掌握调查问卷设计技能;理解统计数据整理的含义、要求
5、与步骤;理解统计分组的意义,正确掌握统计分组方法;掌握分布数列、尤其是变量数列的编制方法;了解统计表的结构、种类和编制方法;了解统计图的意义,掌握常用统计图的绘制方法。第一节 统计数据的收集一、统计数据收集的含义和要求统计数据收集也称为统计调查阶段。基本要求是准确性、及时性和完整性。二、统计数据收集方案设计确定数据收集目的、数据及其类型、数据收集对象和观测单位、观测标志和调查表、数据收集方式与方法、数据所属时间和数据收集期限、数据收集地点、数据收集的组织。三、统计数据收集方式有两种:统计调查方式和实验方式。(一)统计调查方式统计调查就是按照预定的统计任务,运用科学的统计调查方法,有计划有组织地
6、向客观对象搜集资料的过程。1、普查 普查的概念和特点;普查的组织方式;普查的组织原则。2、抽样调查抽样调查可分为概率抽样和非概率抽样两类。(1)概率抽样概率抽样按照随机原则抽取样本,即总体中的每个个体都有已知的、非零的概率被抽取到样本中来,它有五个特点。概率抽样从抽样方法上看,可以分为重复抽样和不重复抽样两种。概率抽样从抽样组织形式上看,可分为简单随机抽样、分层抽样、等距抽样、整群抽样和多阶段抽样五种。(2)非概率抽样是非随机抽样调查,有任意抽样、典型抽样、定额抽样和流动总体抽样等几种。3、重点调查重点调查的含义和特点。 重点调查目的是掌握总体基本情况,关键是选好重点单位。4、统计推算统计推算
7、的概念和特点;统计推算方法。 (二)实验方式 含义和原则;常用的实验设计。(三)数据收集误差存在两种误差:观测性误差和代表性误差。观测性误差也叫登记性误差或调查性误差,在全面调查和非全面调查中都会产生,是一种非一致性误差;代表性误差是指在抽样调查中,因样本不能完全代表总体而产生,又分为系统性代表性误差和偶然性代表性误差两种。四、统计数据收集方法统计数据收集方法,是指获取被调查对象数据的渠道或途径,常用的方法有直接观察法、通讯法、采访法、登记法等几种。五、问卷设计问卷一般由引言、被调查者基本情况、问题和答案、结语四个部分组成。设计时应考虑三个方面问题:问题的编排顺序;提问方式和措辞要点;问卷调查
8、说明等。第二节 统计数据的整理 一、统计整理的含义与要求二、统计整理的内容和步骤分组、汇总、编表(图),其中汇总是中心内容。三、统计分组(一)含义和性质统计分组是根据事物内在的特点和统计研究的任务,按一定的标志,将统计总体划分为若干个不同的类型或部分(组)的一种统计方法。分组之后应保持组内资料的同质性和组间资料的差异性。(二)统计分组的种类:简单分组和复合分组;品质分组和数量分组四、分布数列 (一)分布数列的概念与种类当总体按一个或几个标志分成若干个不同的组之后,形成了按一定顺序排列的总体单位数在各组间的分布,即为次数分配或分配数列。分配数列的基本要素:组别、次数(频数)或比重(频率)分布数列
9、的种类有品质分布数列和数量分布数列(又称变量数列)。变量数列有单项式数列和组距式数列两种,组距式数列还有等距数列和异距数列之分。(二)分布数列的编制1、单项数列的编制2、组距数列的编制在编制组距数列时,应考虑以下问题:(1)组距和组数。各组上限与下限之差,称为组距。所划分的区间数,则称为组数。组距与组数呈反比关系。单项式与组距式的定义与适用条件。(2)组限与组中值(三)频率分布1、频率分布的性质:一是各组频率都是一个介于0与1之间的分数,即大于0而小于1;二是各组频率之和等于1。2、累计频率分布各组累计频数与总频数之比,就形成累计频率分布。累计分布有向上累计分布与向下累计分布两种。第三节 统计
10、图表 一、统计表(一)统计表的概念和作用经过统计整理、汇总所得的统计资料,按一定的次序和格式列在一定的表格上,就形成了统计表。(二)统计表的结构统计表从形式上看,包括总标题、横行标题,纵栏标题及数字资料。统计表从内容上看,包括主词和宾词两部分。(三)统计表的种类按主词是否分组及分组的程度,分为简单表、分组表、复合表。(四)宾词指标的设计(五)编制统计表应注意的问题。二、统计图了解直方图、折线图、曲线图、累计曲线图(介绍洛仑兹曲线和基尼系数)、茎叶图和箱形图。第三章总量指标与相对指标(此章重点参考PPT和讲稿)通过本章学习,要理解总量指标与相对指标的概念、作用和特征;了解单位总量和标志总量、时期
11、指标与时点指标;熟练掌握六种常用的相对指标计算方法。第一节 总量指标一、总量指标的概念二、总量指标的种类三、总量指标的计量单位第二节 相对指标 一、相对指标的意义二、相对指标的表现形式三、相对指标种类以及计算第四章 数据分布特征的描述 本章介绍如何对变量分布的特征进行描述,具体要求:理解变量分布三大特征的含义;理解平均指标、离散指标和形状指标的意义与作用;熟练掌握各种平均数的计算方法并加以正确的应用,科学理解加权平均数中权数的意义,正确认识算术平均数与调和平均数之间的应用关系,以及算术平均数、中位数和众数三者之间的数量关系;熟练掌握各种离散指标的计算方法并加以正确的应用,尤其是要深刻理解方差、
12、标准差和离散系数的内涵;熟练掌握偏度系数和峰度系数的计算方法并加以正确的应用。第一节 集中趋势的描述一、集中趋势与平均指标集中趋势亦称为趋中性,是指变量分布以某一数值为中心的倾向。平均指标是将变量的各变量值差异抽象化、以反映变量值一般水平或平均水平的指标,其数值表现平均数。平均指标是度量统计总体分布集中趋势或中心位置的指标。平均指标的作用表现在五个方面。平均数因计算方法不同可分为数值平均数和位置平均数两类。数值平均数有算术平均数、调和平均数和几何平均数,位置平均数有中位数、众数和分位数。二、数值平均数(一)算术平均数()算术平均数的基本公式:总体标志总量/总体单位总数。 1、简单算术平均数:=
13、x/n2、加权算术平均数:=xf/f=x(f/f)3、算术平均数的数学性质(二)调和平均数(H)它是变量值倒数的算术平均数的倒数。又称倒数平均数。它是算术平均数的变形。 1、简单调和平均数:H=n/(1/x)2、加权调和平均数:H=m/(m/x)(三)由相对数或平均数计算平均数当掌握了一个相对数(或平均数)的分母资料而不知道分子资料时,应采用加权算术平均法计算其平均数;反之,当掌握了一个相对数(或平均数)的分子资料而不知道其分母资料时,应采用加权调和平均法计算其平均数。(四)几何平均数(G)几何平均数是若干项变量值的连乘积开项数次方根的结果,它是计算平均比率和平均速度最常用的一种方法。1、单几
14、何平均数的计算:G=2、加权几何平均数的计算:3、几何平均数与算术平均数、调和平均数的数学关系HG三、位置平均数 (一)中位数(Me)将总体单位的某一数量标志的各个数值按大小顺序排列,居中间位置的那个数值即为中位数。中位数的计算。分位数:将变量的数值按大小顺序排列并等分为若干部分后,处于等分点位置的数值。二、众数(Mo)众数是指总体中出现次数最多的那个标志值。众数的计算。三、众数、中位数和算术平均数的关系在对称分布(即正态)时,=Me=Mo在右偏时, MeMo在左偏时, MeMo并且,适度偏态时, (-Mo)=3(-Me)第二节 离中趋势的描述一、离中趋势和离散指标所谓离中趋势,就是变量分布中
15、各变量值背离中心值的倾向。用离散指标来反映。常用的离散指标主要有:全距(亦称极差)、四分位差、异众比率、平均差、标准差、离散系数等。二、离散指标的测度 (一)全距全距是总体各单位标志值中最大值与最小值之间的差距。全距计算公式。特点。(二)四分位差四分位差是四分位数中第一个四分位数与第三个四分位数之差,也称为内距或四分间距。计算公式及作用。(三)异众比率异众比率是分布数列中非众数组的频数与总频数之比。(四)平均差(AD)平均差就是总体各单位标志值对其算术平均数的离差的绝对值的算术平均数。 A.D.= (简单式) A.D. (加权式)(五)方差和标准差 方差是变量的各变量值与其均值的离差平方的算术
16、平均数,标准差是方差的平方根。标准差的计算方法: (根据未分组数据) (根据变量数列)根据组距式数列计算的方差和标准差只是一个近似值;二是在根据样本数据(甚至是有限总体数据)计算方差和标准差时,分母应该是。方差和标准差的性质。(六)离散系数相对离散指标也叫离散系数变异系数或标准差系数,是变量的标准差与均值之比,通常用来表示,即:三、是非标志的平均数和标准差是非标志,又称交替标志,它是用“是” “否”或“有”“无”来表示的。“是”或“非”的单位数在全体单位数中所占比例,称为“成数”,分别记为p和q。 q=1-p 是非标志的均值为p(对于“是”而言)是非标志的方差为p(1-p)=pq。第三节 分布
17、形状的描述一、分布形状和形状指标变量分布的形状要用形状指标来反映。形状指标就是反映变量分布具体形状,即左右是否对称、偏斜程度与陡峭程度如何的指标。二、偏度系数偏度指变量分布偏斜的方向及其程度。偏度系数来实现的,通常用来表示。偏度系数的计算主要有三种方法。三、峰度系数1、概念峰度通常是指钟型分布的顶峰与标准正态分布相比偏扁平或偏尖陡的程度。分为三种情况:标准正态峰度、尖顶峰度和平顶峰度。峰度系数通常用2、峰度系数的计算第五章 抽样估计 本章介绍抽样估计的基本理论和方法,具体要求:理解抽样分布的含义及总体分布、样本分布和抽样分布三者的关系,掌握常用的抽样分布定理;通过对抽样中误差构成的了解,正确理
18、解抽样误差的含义及三种表现形式之间的关系,深刻领会抽样极限误差、抽样概率度与抽样标准误三者之间的关系;了解优良估计量的评价标准,熟练掌握区间估计的基本原理;掌握简单随机抽样形式下总体均值、总体成数的区间估计,了解其他抽样组织形式的含义和特点;掌握确定样本容量的一般方法。第一节 抽样分布一、抽样分布的基本问题(一)总体分布及其特征总体分布的含义。常用的总体参数:总体均值和总体方差(标准差)(二)样本分布及其特征样本分布的含义。常见的样本统计量:样本均值和样本方差(标准差)。(三)抽样分布及其特征1、抽样分布的概念及影响因素抽样分布就是样本统计量的概率分布,它由样本统计量的所有可能取值和与之对应的
19、概率所组成。取决于五个因素:总体分布、样本容量、抽样方法、抽样组织形式、估计量构造。2、抽样分布形式样本均值的抽样分布和样本成数的抽样分布。3、抽样分布特征样本统计量的数学期望与方差二、常用的抽样分布定理第二节 抽样误差一、抽样中的误差构成抽样中的总误差可以分为两类:抽样误差和非抽样误差。二、抽样误差的表现形式(一)抽样实际误差抽样实际误差是指样本估计值与总体参数值之间的离差,表示为(二)抽样标准误抽样标准误即抽样分布的标准差或样本统计量的标准差,表示为=抽样标准误能衡量抽样误差大小的一般水平。(三)抽样极限误差抽样极限误差是指以样本估计总体所允许的最大误差范围,它取决于两个因素:抽样标准误和
20、抽样估计概率保证程度(置信水平):抽样极限误差、抽样标准误和抽样概率保证程度三者关系: 。其中,称为抽样概率度。第三节 参数估计方法一、估计量的评价标准无偏性、有效性、一致性和充分性。二、参数估计的方法(一)点估计用样本指标的实际值直接作为相应总体参数的估计值。即 , (二)区间估计指用一个具有一定可靠程度的区间范围来估计总体参数。区间估计的特点和要求。第四节 各种抽样组织形式的参数估计 一、简单随机抽样1、总体均值的估计重复和不重复抽样方法下抽样标准误差的计算。抽样极限误差和估计区间的计算。2、总体成数的估计 3、样本容量的确定重复和不重复抽样方法下样本的计算。二、分层抽样定义及特点三、等距
21、抽样定义及特点、种类四、整群抽样定义及特点。五、多阶段抽样 定义及特点。第六章 相关与回归分析 本章对相关关系的概念、种类及相关分析、回归分析的原理进行了介绍,具体要求:了解相关关系的概念及种类;掌握相关分析的原理、几种常用相关系数的测定方法及相关系数取值含义;掌握回归分析的原理、方法及应用,重点掌握简单线性回归方程的拟合及应用,明确直线回归方程中待定参数的含义。第一节 相关分析的基本问题 一、相关关系与函数关系 (一)函数关系 是指现象之间存在的确定性的数量依存关系。(二)相关关系是指现象之间存在的非确定性的数量依存关系。(三)相关关系与函数关系的区别与联系 二、相关关系的种类完全相关、不完
22、全相关、不相关;正相关、负相关;线性相关、非线性相关;单相关、多元相关。三、相关分析的主要内容第二节 相关关系的测度 一、相关关系的判断 (一)根据定性认识的判断(二)利用相关表进行判断(三)相关图 二、相关系数的测定 (一)直线相关系数的计算直线相关系数就是在线性相关的条件下说明两个变量之间相关关系密切程度的统计分析指标。直线相关系数的各种计算公式。直线相关系数r的取值和意义。(二)等级相关系数的测定方法1、斯皮尔曼(Spearman)相关系数2、肯德尔(Kendall)等级相关系数(自学)第三节 回归分析的基本问题 一、回归分析的含义 在研究变量间相关关系的基础上,测定变量之间相关的具体形
23、式和数量关系的统计方法,称为回归分析法。二、回归分析的主要内容三、回归分析的特点四、回归分析的种类 简单回归和多元回归;线性回归和非线性回归。 第四节 回归分析的模型一、简单线性回归分析(一)简单线性回归模型1、估计模型: 2、模型的经济含义(二)参数估计方法:最小平方法或公式求解: a= 最小平方法的要求 (三)回归估计标准误具体衡量回归估计值精确度高低或回归方程代表性大小的统计分析指标,称为回归估计标准误,记为Sy.x。(四)回归方程判定系数总变差=回归变差+剩余变差(五)回归方程的统计检验(六)因变量的置信区间估计置信区间的公式为: 二、多元线性回归分析三、非线性回归分析第七章 时间数列
24、 本章重点讨论动态变化的统计数据分析方法问题,要求通过本章的学习,了解时间数列的含义、构成要素与编制原则,注意不同类型时间数列的区别与联系;掌握水平指标的计算,特别是序时平均数的计算;掌握各类速度指标的计算,特别是平均速度指标的计算;了解时间数列变动要素的分解,掌握长期趋势的测定方法,重点是基于最小平方法的趋势方程拟合;了解季节变动的含义及测定方法。第一节 时间数列的基本问题 一、时间数列的含义将某一统计指标在不同时间上的不同数值,按其时间先后顺序排列起来,即为时间数列。又称动态序列。时间数列的基本要素:现象所属时间及指标数值。时间数列分析的意义 二、时间数列的种类(一)绝对指标时间数列1、时
25、期数列含义及特点2、时点数列(二)相对指标时间数列(三)平均指标时间数列 三、时间数列的影响因素长期趋势(T)、循环变动(C)、季节变动(S)和不规则变动(I)。时间数列的分解模式:加法模型和乘法模型四、时间数列的编制原则总的原则是一致性。具体表现在时间规定方面、总体范围和经济内容方面、计算方法及计量单位方面等的一致性。第二节 时间数列的水平分析一、发展水平(又称发展量或时间数列水平,它实际就是时间数列中每一项指标数值。有最初水平、最末水平和中间水平之分。 二、平均发展水平( 是将时间数列中不同时期的发展水平加以平均而得的平均数,又称序时平均数或动态平均数。 (一)绝对指标时间数列的序时平均数 1、时期数列的序时平均数(简单算术平均)2、时点数列的序时平均数间隔相等连续时
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1