统计学笔记(精修版)Word文档下载推荐.docx
《统计学笔记(精修版)Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《统计学笔记(精修版)Word文档下载推荐.docx(47页珍藏版)》请在冰豆网上搜索。
⑤根据所收集数据的特征、结合定性、定量知识作出总体特征的合理推断;
⑥根据推断给出更好决策的建议;
不解决问题时,重复第②-⑥步。
第二节统计学的基本概念
v一、总体、单位和样本
1.总体
统计总体是根据一定目的确定的,由客观存在的、具有某种同质性的许多个别事物构成的整体。
⑴同质性是确定统计总体的基本标准,它是根据统计的研究目的而定的。
研究目的不同,所确定的总体也不同,其同质性的意义也随之变化。
⑵统计总体还应具备大量性,即统计总体应应该由足够数量的同质性单位构成。
2.总体单位(简称单位)是组成总体的各个个体。
如典型案例1中英军的每架战机;
事例4中的每个居民。
3.由总体的部分单位组成的集合称为样本(又称子样)。
构成样本的单位称为样品,样本中样品的数目称为样本容量。
4.统计学解决问题的目的是认识总体的数据特征。
但是,当调查是破坏性的,或者出于成本、时间等因素考虑时,不必要或不可能对构成总体的所有单位都进行调查。
v二、标志、指标(参数)和统计量
1.标志:
(1)总体单位普遍具有的属性或特征称为标志。
(2)标志按其表现分为品质标志和数量标志两种。
v①品质标志表明单位属性方面的特征,品质标志的表现只能用非数值来描述.
(如:
典型案例1中英军战机的类型,事例4中每个居民的性别。
)
v②数量标志表明单位数量方面的特征,其表现用数值来描述
(如:
典型案例1中英军战机的弹孔位置,事例4中每个居民的收入。
2.参数(标志)
⑴统计总体具有的数量特征的概念和数值称为统计指标,也称为参数。
⑵统计指标由两项基本要素构成,即指标的概念和指标的取值。
(指标的概念是对所研究现象本质的抽象概括,也是对总体数量特征的质的规定性。
(例如事例4中居民人口数100万人,总收入31.4亿元。
⑶统计指标按表示形式可以分为数量指标和质量指标.
①凡是反映现象总规模、总水平的统计指标称为数量指标,用绝对数来表示。
例如事例4中居民总数100万人、总收入31.4亿元等,
②凡是反映现象相对水平和工作质量的统计指标称为质量指标,用相对数或平均数来表示.例如企业职工平均工资5000元、工人出勤率93%等。
质量指标是总量指标的派生指标,以反映现象之间的内在联系和对比关系。
⑷单个指标不能反映总体的全貌,这便需要设立指标体系。
统计指标体系是由一系列相互联系的统计指标组成的有机整体,用以反映所研究现象各方面相互依存相互制约的关系。
3.统计量
⑴统计量是样本观测量的一个已知函数,用来说明样本的特征。
是样本观测量的一个已知函数,用来说明样本的特征。
⑵抽取的样本不同,统计量的观测值也就不同。
如样本平均数、样本方差、样本比例是统计量,抽取样本后,人们通常用与总体参数对应的统计量观测值,作为总体参数的估计.
(如某汽车制造企业从生产的一批轿车中抽取了16辆轿车,用这些轿车的平均行驶里程值、合格率值分别作为该批轿车平均行驶里程、合格率的估计。
三、数据
v
(一)变量与变量值
1.即说明现象的某一事实或数量的特征称为变量,将上述标志、指标和统计量的名称进行归纳就是变量。
2.变量的具体表现是变量值,数据就是变量及其表现,也可称为反映客观事物的事实或数量依据。
如:
收入是一个变量,收入的表现是变量值。
3.将在特定研究过程中收集的所有数据集合在一起,称为数据集。
4.根据变量值的确定与否,变量分为确定性变量(受确定性因素影响,因素是明确的,可解释,可控制的)与随机变量(受许多不确定因素影响,如员工的起床时间)。
(二)数据的计量尺度
收集数据时需要用到以下四种由低到高的计量尺度:
定类尺度、定序尺度、定距尺度和定比尺度,计量尺度的不同决定了不同的数据分析与处理方法。
1.定类尺度是说明客观现象无序类别的计量。
定类尺度的主要数学特征是“=”或“≠”.如居民的性别是男、女计量,战机的类型是战斗机、轰炸机、侦察机等计量,这一场合的所使用的数值只作为无序分类的代码。
2.定序尺度是说明客观现象有序类别的非数值计量。
定序尺度的主要数学特征是“<
”或“>
”.例如,对居民的满意度计量可以分为非常满意、满意、一般、不满意、非常不满意五类。
这一场合的所使用的数值只作为有序分类的代码。
3.定距尺度是说明客观现象数值间距有意义的计量。
其用确切的数值反映现象之间在量方面的差异,定距尺度的主要数学特征是“+”“–”。
如总量指标是定距尺度计量的。
(0不代表不存在)
4.定比尺度是说明客观现象两个数值比有意义的计量。
定比尺度的主要数学特征是“x”“/”
如质量指标中的相对数、平均数是定比尺度计量的(0代表不存在)
5数据分类
⑴定类尺度,定序尺度的数据统称为定性数据。
定性变量是指带有定性数据的变量。
⑵定距尺度,定比尺度的数据统称为为定量数据。
定量变量是指带有定量数据的变量。
根据定量变量值连续出现与否,定量变量分为连续性变量与离散型变量。
①连续型变量是指变量在某一区域内的取值是连续不断的,无法一一列举。
军机的弹孔位置,产品的寿命等。
②离散型变量是指变量的取值是间断的,可以一一列举。
例如,产品数等。
(三)数据的类型
根据对客观现象观察的角度不同,统计数据可分为:
横截面数据、时间序列数据和面板数据。
1.横截面数据又称为静态数据,它是指在同一时间对同一总体内不同单位进行观察而获得的数据。
例如,2014年全国各省、市、自治区的居民收入总值就属于横截面数据。
2.时间序列数据又称为动态数据,它是指在某一段时期内按时间顺序对同一总体进行观察而获得的数据。
例如,“十二五”期间我国按年份顺序的居民收入总值就属于时间序列数据
3.面板数据则是同时在时间和截面空间上取得的二维数据。
例如2005-2014年30个企业的总产值数据。
面板数据则由30个企业10年的数据组成,共有300个观测值。
从某一年份看,它是由30个企业总产值数
第二章收集数据
第一节统计调查方案设计
调查方案设计是指导整个调查过程的纲领性文件,其主要内容主要包括以下几个方面:
一、确定调查目的
1.调查要达到的具体目标
2.回答“为什么调查?
”
3.调查之前必须明确
二、确定调查对象和调查单位
1.调查对象:
调查研究的总体或调查范围
2.调查单位:
需要对之进行调查的单位。
可以是调查对象的全部单位(全面调查),也可以是调查对象中的一部分单位(非全面调查)
3.回答“向谁调查?
三、选择合适的调查方式、调查方法
1.调查方式是指调查的组织方式,主要有:
普查、抽样调查、典型调查、重点调查和统计报表制度
2.调查方法是指收集统计资料的方法,主要有:
问卷法、访谈法、观察法和实验法
四、设计调查项目和调查表
1. 调查项目:
调查的具体内容
2. 调查表:
表现调查项目的表格或问卷。
有单一表和一览表两种形式。
3.回答“调查什么?
五、确定调查时间
统计调查时间包括两种涵义:
调查时间和调查期限
1.调查时间:
调查资料的所属时间(时期或时点)。
2.调查期限:
进行调查工作的时间,包括搜集资料和报送资料的整个工作所需要的时间
六、调查报告的撰写
调查报告的撰写包括:
调查过程的描述、依据调查数据所做的决策、对调查结果的评价
【在调查方案中,应给出:
提交调查报告的具体时间,并对调查的精度、费用等提出具体要求】
七、制订调查工作的组织实施计划
第二节数据收集来源
一、数据收集的来源
1.原始数据:
必须要求调研者亲自收集
2.二手数据:
调研者需要识别和评估二手数据的有效性
二、二手数据的收集
1.二手数据的来源
⑴内部二手数据
⑵外部二手数据
2.二手数据收集的特点
优点:
快捷、成本低、易获取
缺点:
相关性差、时效性差、可靠性低
四、二手数据收集的注意事项
二手数据的评估主要包括:
1.研究目的的评估——调研的目的是什么
2.二手数据来源评估——谁收集了这些资料
3.研究内容评估——收集了一些什么样的资料
4.调查方式、方法评估——这些资料如何获得的
5.二手数据相关性评估——这些资料与其他资料的一致程度如何
6.二手数据时效性评估——这些资料是何时收集的
第三节原始数据的收集
一、数据收集的分类
1.按数据收集的组织方式不同,分为统计报表和专门调查
统计报表:
按照国家有关法规的规定,自上而下地统一布置、自下而上地逐级填报的一种调查组织方式。
专门调查:
为了某一特定目的或专门问题而专门组织的调查
2.按数据收集对象包括范围的大小不同,分为全面调查和非全面调查
全面调查:
对构成调查对象中的所有党委进行一一不漏的调查
非全面调查:
是在统计调查过程中,仅对调查中的一部分单位进行调查。
包括:
抽样调查、重点调查、典型调查和非全面统计报表
3.按数据收集的登记时间是否连续,分为经常性调查和一次性调查
经常性调查:
又称连续性调查,它是为了观察社会经济现象在一定时期内的数量变化所进行的调查登记或数据收集
一次性调查:
又称不连续性调查,它是对所研究的社会经济现象间隔一段时间所进行的调查登记或数据收集
4.按数据收集实施主体的不同,分为政府统计调查和民间统计调查
v二、数据收集的调查方式
数据收集的调查方式,按照组织方式主要有:
1.普查:
专门组织的一次性全面调查
普查的特点:
⑴通常是一次性调查,周期性强
⑵全面性调查,收集的资料全面、系统、准确
⑶普查的点多面广,工作量大,投入多
普查应遵循以下原则:
⑴时间统一性原则
⑵登记工作的规范性原则
⑶普查项目统一规定原则
⑷同类普查同周期性原则
2.抽样调查:
从总体中随机抽取一部分单位作为样本进行调查,并根据样本数据推断总体数量特征的一种非全面调查。
⑴概率抽样:
根据随机原则从总体中抽选样本,并根据样本信息对总体的某些特征做出估计推断,对推断可能出现的误差可以从概率意义上加以控制
非概率抽样:
调查组根据自己的方便或主观判断抽取样本的方法
⑵抽样调查优势:
经济性、时效性、准确性
⑶几种具体的抽样方式:
① 简单随机抽样——是指从总体N个单位中随机抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。
② 分层抽样——主要特征分层按比例抽样,主要使用于总体中的个体有明显差异。
共同点:
每个个体被抽到的概率都相等N/M。
③ 整群抽样——是将总体中各单位归并成若干个互不交叉、互不重复的集合,称之为群;
然后以群为抽样单位抽取样本的一种抽样方式。
【应用整群抽样时,要求各群有较好的代表性,即群内各单位的差异要大,群间差异要小】
④ 等距抽样——首先将总体各单位按一定顺序排列,更具