统计学.docx

上传人:b****5 文档编号:4219042 上传时间:2022-11-28 格式:DOCX 页数:26 大小:30.92KB
下载 相关 举报
统计学.docx_第1页
第1页 / 共26页
统计学.docx_第2页
第2页 / 共26页
统计学.docx_第3页
第3页 / 共26页
统计学.docx_第4页
第4页 / 共26页
统计学.docx_第5页
第5页 / 共26页
点击查看更多>>
下载资源
资源描述

统计学.docx

《统计学.docx》由会员分享,可在线阅读,更多相关《统计学.docx(26页珍藏版)》请在冰豆网上搜索。

统计学.docx

统计学

第1章导论

1.1统计及其应用领域

1.1.1什么是统计学

1.含义:

统计学是收集、处理、分析、解释数据并从数据中得出结论的科学

1.收集数据:

取得数据

2.处理数据:

整理与图表展示

3.分析数据:

利用统计方法分析数据

4.数据解释:

结果的说明

5.得到结论:

从数据分析中得出客观结论

统计方法:

描述统计和推断统计(参数估计、假设检验)

1、描述统计:

研究数据收集、处理、汇总、图表描述、概括与分析等统计方法

内容:

搜集数据整理数据展示数据描述性分析

目的:

描述数据特征找出数据的基本规律

2、推断统计:

研究如何利用样本数据来推断总体特征的统计方法

内容:

参数估计假设检验

目的:

对总体特征作出推断

1.1.2统计的应用领域(参照课本P4表格)

1.2统计数据的类型(课本P7框图)

1.2.1分类数据、顺序数据、数值型数据

1.2.2观测数据和实验数据

1.2.3截面数据和时间序列数据

统计数据的分类(按计量尺度分)

A.分类数据:

只能归于某一类别的非数值型数据

对事物进行分类的结果,数据表现为类别,用文字来表述

例如,人口按性别分为男、女两类

B.顺序数据:

只能归于某一有序类别的非数值型数据

对事物类别顺序的测度,数据表现为类别,用文字来表述

例如,产品分为一等品、二等品、三等品、次品等

C.数值型数据:

按数字尺度测量的观察值

结果表现为具体的数值,对事物的精确测度

例如:

身高为175cm、168cm、183cm

统计数据的分类(按收集方法分)

A.观测的数据:

通过调查或观测而收集到的数据

在没有对事物人为控制的条件下而得到的

有关社会经济现象的统计数据几乎都是观测数据

B.实验的数据:

在实验中控制实验对象而收集到的数据

比如,对一种新药疗效的实验,对一种新的农作物品种的实验等自然科学领域的数据大多数都为实验数据

统计数据的分类(按时间状况分)

截面数据

在相同或近似相同的时间点上收集的数据

描述现象在某一时刻的变化情况

比如,2005年我国各地区的国内生产总值数据

时间序列数据

在不同时间上收集到的数据

描述现象随时间变化的情况

比如,2000年至2005年国内生产总值数据

1.3统计中的几个基本概念

总体和样本(课本P10图1-2)

总体

1.所研究的全部个体(数据)的集合,其中的每一个个体也称为元素

2.分为有限总体和无限总体

3.有限总体的范围能够明确确定,且元素的数目是有限的

4.无限总体所包括的元素是无限的,不可数的

样本

1.从总体中抽取的一部分元素的集合

2.构成样本的元素的数目称为样本容量或样本量

参数和统计量

参数

1.描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值

2.所关心的参数主要有总体均值、标准差、总体比例等

总体参数通常用希腊字母表示

统计量

1.用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数

2.所关心的样本统计量有样本均值、样本标准差、样本比例等

3.样本统计量通常用小写英文字母来表示

变量

1、说明现象某种特征的概念

如商品销售额、受教育程度、产品的质量等级等

变量的具体表现称为变量值,即数据

2、变量可以分为

分类变量:

说明事物类别的名称

顺序变量:

说明事物有序类别的名称

数值型变量:

说明事物数字特征的名称

离散变量:

取有限个值

连续变量:

可以取无穷多个值

变量(其他分类)

1、随机变量和非随机变量

2、经验变量和理论变量

经验变量所描述的是我们周围可以观察到的事物

理论变量则是由统计学家用数学方法所构造出来的一些变量,比如,z统计量、t统计量等

第2章数据搜集

1、调查方案的结构:

调查目的、对象和单位、调查项目、其他

调查目的:

1.调查要达到的具体目标

2.回答“为什么调查?

3.调查之前必须明确

调查对象和调查单位:

1.调查对象:

调查研究的总体或调查范围

2.调查单位:

需要对之进行调查的单位。

可以是调查对象的全部单位(全面调查),也可以是调查对象中的一部分单位(非全面调查)

3.回答“向谁调查?

调查项目:

1.调查的具体内容

2.通常表现为表格或问卷

3.回答“调查什么?

方案设计中的其他问题:

1.明确调查所采用的方法

2.确定调查资料的所属时间和调查工作的期限

3.调查的组织与实施细则

调查问卷设计

什么是问卷?

1,用来收集调查数据的一种工具

2.调查者根据调查目的和要求所设计的,由一系列问题、备选答案、说明以及码表组成的一种调查形式

3.不同的调查问卷在具体结构、题型、措词、版式等设计上会有所不同,但在结构上一般都由开头部分、甄别部分、主体部分和背景部分组成

问卷的基本结构:

包括4个部分:

开头部分(包括:

问候语、填写说明、问卷编号)、甄别部分、主体部分、背景部分

开头部分(问卷的编号)

1.用于识别问卷、调查者、被调查者姓名和地址等

2.便于校对检查、更正错误

甄别部分

1.甄别也称为过滤,它是先对被调查者进行过滤,筛选掉不需要的部分,然后针对特定的被调查者进行调查

2.通过甄别,可以筛选掉与调查事项有直接关系的人,以达到避嫌的目的

3.可以确定哪些人是合格的被调查者,哪些人不是

4.甄别的目的是确保被调查者合格,能够作为该市场调查项目的代表,从而符合调查研究的需要

主体部分

1.是调查问卷的核心内容

2.包括所要调查的全部问题,主要由问题和答案组成

背景部分

1.通常放在问卷的最后,主要是有关被调查者的一些背景资料

2.该部分所包含的各项问题,可使研究者根据背景资料对被调查者进行分类比较分析

提问项目的设计

1.提问的内容尽可能短

2.用词要确切、通俗

可按6W准则加以推敲。

6W即Who(谁),Where(何处),When(何时),Why(为什么),What(什么事),How(如何)

3.一项提问只包含一项内容

4.避免诱导性提问

5.避免否定形式的提问

6.避免敏感性问题

回答项目(答案)的设计

开放性问题

1.对问题的回答未提供任何具体的答案,由被调查者根据自己的想法自由作出回答

2.属于自由回答型

3.优点:

比较灵活,适合于收集更深层次的信息,特别适合于那些尚未弄清各种可能答案或潜在答案类型较多的问题。

而且可以使被调查者充分表达自己的意见和想法,有利于被调查者发挥自己的创造力

4.缺点:

由于会出现各种各样的答案,给调查后的资料整理带来一定困难

封闭性问题

1.对问题事先设计出了各种可能的答案,由被调查者从中选择

2.问题的答案是标准化的,有利于被调查者对问题的理解和回答,也有利于调查后的资料整理

3.对答案的要求较高,对一些比较复杂的问题,有时很难把答案设计周全

4.问题的答案是选择回答型,所以设计出的答案一定要穷尽和互斥

5.回答方法有:

两项选择法、多项选择法、顺序选择法、评定尺度法、双向列联法五种

封闭性问题(两项选择法)

1.答案只有两项,要求被调查者选择其中之一来回答

2.优点:

被调查者只需在二者之中选择一项,回答比较容易;调查后的数据处理也很方便

3.缺点:

得到的信息量较少;当被调查者对两项答案均不满意时,很难作出回答

例如:

您有手机吗?

1.有2.没有

封闭性问题(多项选择法)

1.在设计问卷时,对一个问题给出三个或三个以上的答案,让被调查者从中选择进行回答

2.根据要求选择的答案多少不同,有以下类型

单项选择型:

要求被调查者对所给出的问题答案选择其中的一项

多项选择型:

要求被调查者对所给出的问题答案中,选出自己认为合适的答案,数量不受限制

限制选择型:

要求被调查者在所给出的问题答案中,选出自己认为合适的答案,但数量要受一定限制

您觉得哪种类型的广告宣传效果最好?

(选一项)

1.电视广告2.广播广告3.杂志广告

4.报纸广告5.路牌广告

封闭性问题(多项选择法实例)

请问您在购买小轿车时,主要考虑哪些因素?

(选出您认为合适的答案)

1价格2款式3品牌4耗油量5售后服务6维修费用7乘坐舒适8行使平稳9加速性能10制动性能

封闭性问题(顺序选择法)

1.问题答案有多个,要求被调查者在回答时,对所选的答案按要求的顺序或重要程度加以排列。

其中,对所选的的答案数量可以进行一定的限制,也可以不进行限制

2.问题答案不仅可以反映所要调查的内容,而且可以反映出被调查者对问题的看法,从而增加了信息量

您在购买这种牌子的电视机时,主要是考虑哪些因素?

1.产品的品牌2.价格合理3.售后服务

4.外形美观5.维修方便(按重要程度进行排序)

封闭性问题(评定尺度法)

问题答案,由表示不同等级的形容词组成,并按照一定的程度排序,由被调查者依次选择。

您对这种新款轿车是否感到满意?

1非常满意2比较满意;3一般4不太满意;5不满意

封闭性问题(双向列联法)

1.将两类不同问题综合到一起,通常用表格来表现

2.表的横向是一类问题,纵向是另一类问题

3.这种问题结构可以反映两方面因素的综合作用,提供单一类型问题无法提供的信息

4.可以节省问卷的篇幅

问题顺序的设计

1.问题的安排应具有逻辑性

2问题的顺序应先易后难

3能引起被调查者兴趣的问题放在前面

4开放性问题放在后面

5版面格式的设计

问卷的结构安排要合理,问卷的主体部分要突出、醒目

不要编排过密,各问题之间要留出一定的空间

外表及内容的印刷要美观

第2章数据的搜集

2.1数据的来源

1、数据的间接来源

系统外部的数据

1.统计部门和政府部门公布的有关资料,如各类统计年鉴

2各类经济信息中心、信息咨询机构、专业调查机构等提供的数据

3各类专业期刊、报纸、书籍所提供的资料

4各种会议,如博览会、展销会、交易会及专业性、学术性研讨会上交流的有关资料

5从互联网或图书馆查阅到的相关资料

系统内部的数据

1业务资料,如与业务经营活动有关的各种单据,记录

2经营活动过程中的各种统计报表

3各种财务,会计核算和分析资料等

二手数据的特点

1搜集容易,采集成本低

2作用广泛

分析所要研究的问题

提供研究问题的背景

帮助研究者更好地定义问题

检验和回答某些疑问和假设

寻找研究问题的思路和途径

3搜集二手资料在研究中应优先考虑

二手数据的评估

1数据是谁搜集的?

可信度评估

2为什么目的而搜集的?

3数据是怎样搜集的?

4什么时候搜集的?

数据的直接来源

数据的直接来源(原始数据)

1、调查数据

通过调查方法获得的数据

通常是对社会现象而言

通常取自有限总体

2、实验数据

通过实验方法得到的数据

通常是对自然现象而言

也被广泛运用到社会科学中

如心理学、教育学、社会学、经济学、管理学等

2.2调查数据

2.2.1概率抽样与非概率抽样

2.2.2搜集数据的基本方法

概率抽样,也称随机抽样

特点:

1.按一定的概率以随机原则抽取样本

抽取样本时使每个单位都有一定的机会被抽中

2.每个单位被抽中的概率是已知的,或是可以计算出来的

3.当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率

简单随机抽样

1、从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本的概率是相等的

2、最基本的抽样方法,是其它抽样方法的基础

3、特点

简单、直观,在抽样框完整时,可直接从中抽取样本

用样本统计量对目标量进行估计比较方便

4、局限性

当N很大时,不易构造抽样框

抽出的单位很分散,给实施调查增加了困难

没有利用其它辅助信息以提高估计的效率

分层抽样

1、将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本

2.、优点

保证样本的结构与总体的结构比较相近,从而提高估计的精度;组织实施调查方便;既可以对总体参数进行估计,也可以对各层的目标量进行估计;

整群抽样

1、将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查

2、特点

抽样时只需群的抽样框,可简化工作量

调查的地点相对集中,节省调查费用,方便调查的实施

缺点是估计的精度较差

系统抽样

1、将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其它样本单位

先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k…等单位

2、优点:

操作简便,可提高估计的精度

3、缺点:

对估计量方差的估计比较困难

多阶段抽样

1、先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查

二阶抽样中群是初级抽样单位,第二阶段抽取的是最终抽样单位。

将该方法推广,使抽样的阶段数增多,就称为多阶段抽样

2、具有整群抽样的优点,保证样本相对集中,节约调查费用

3、需要包含所有低阶段抽样单位的抽样框;同时由于实行了再抽样,使调查单位在更广泛的范围内展开

4、在大规模的抽样调查中,是经常被采用的方法

非概率抽样

1、相对于概率抽样而言

2、抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查

3、有方便抽样、判断抽样、自愿样本、滚雪球抽样、配额抽样等方式

方便抽样

1、调查过程中由调查员依据方便的原则,自行确定入抽样本的单位

调查员在街头、公园、商店等公共场所进行拦截调查

厂家在出售产品柜台前对路过顾客进行的调查

2、优点:

容易实施,调查的成本低

3、缺点:

样本单位的确定带有随意性,样本无法代表有明确定义的总体,调查结果不宜推断总体

判断抽样

1、研究人员根据经验、判断和对研究对象的了解,有目的选择一些单位作为样本

有重点抽样,典型抽样,代表抽样等方式

2、判断抽样是主观的,样本选择的好坏取决于调研者的判断、经验、专业程度和创造性

3、抽样成本比较低,容易操作

4、样本是人为确定的,没有依据随机的原则,调查结果不能用于推断总体

自愿样本

1、被调查者自愿参加,成为样本中的一分子,向调查人员提供有关信息

例如,参与报刊上和互联网上刊登的调查问卷活动,向某类节目拨打热线电话等,都属于自愿样本

2、自愿样本与抽样的随机性无关

样本是有偏的

不能依据样本的信息推断总体

滚雪球抽样

1、先选择一组调查单位,对其实施调查之后,再请他们提供另外一些属于研究总体的调查对象,调查人员根据所提供的线索,进行此后的调查。

这个过程持续下去,就会形成滚雪球效应

2、适合于对稀少群体和特定群体研究

3、优点:

容易找到那些属于特定群体的被调查者,调查的成本也比较低

配额抽样

1、先将总体中的所有单位按一定的标志(变量)分为若干类,然后在每个类中采用方便抽样或判断抽样的方式选取样本单位

2、操作简单,可以保证总体中不同类别的单位都能包括在所抽的样本之中,使得样本的结构和总体的结构类似

3、抽取具体样本单位时,不是依据随机原则,属于非概率抽样

概率抽样与非概率抽样的比较

概率抽样

依据随机原则抽选样本

样本统计量的理论分布存在

可根据调查的结果推断总体

非概率抽样

不是依据随机原则抽选样本

样本统计量的分布是不确定的

无法使用样本的结果推断总体

搜集数据的基本方法

自填式问卷调查

1、没有调查员协助的情况下由被调查者自己完成调查问卷

问卷递送方法有:

调查员分发、邮寄、网络、媒体

2、要求调查问卷结构严谨,有清楚的说明

3、弱点

问卷的返回率比较低

不适合结构复杂的问卷

调查周期比较长

数据搜集过程中出现的问题难于及时采取调改措施

面访式问卷调查

1、调查员与被调查者面对面提问、被调查者回答的一种调查方式

3、优点

可提高调查的回答率

可提高调查数据的质量

能调节数据搜集所花费的时间

3、弱点

调查的成本较高

调查过程的质量控制有一定难度

电话式问卷调查

1、通过电话向被调查者实施调查

2、特点

速度快,能在短时间内完成调查

适合于样本单位十分分散的情况

3、局限

如果被调查者没有电话,调查将无法实施

访问的时间不能太长

使用的问卷需要简单

被访者不愿意接受调查时,难以说服

 

观察式调查

1.就调查对象的行动和意识,调查人员边观察边记录以收集所需信息

2.调查人员不是强行介入

3.能够在被调查者不察觉的情况下获得资料。

如交通流量的调查

各调查方法的比较

2.3实验数据

2.3.1实验组和对照组

2.3.2实验中的若干问题

2.3.3实验中的统计

2.3.4实验法案例

实验组和对照组

1.将研究对象分为两组:

实验组和对照组

2.实验组和随机组的产生应遵循随机原则,而且应该匹配

匹配指对实验单位的背景材料进行分析比较,将情况类似的每对单位分别随机地分配到实验组和对照组

实验中的若干问题

1.人的意愿

研究的对象是人的时候,在划分实验组和对照组时的随机原则将面临挑战

2.心理问题

人们对被研究非常敏感,这使得他们更加注意自我,从而走到事物的另一个极端

3.道德问题

当某种实验涉及道德问题时,人们会处于进退两难的尴尬境地

实验中的统计

1.实验设计本身就是一个统计问题

2.确定进行实验所需要的单位的个数,以保证实验可以达到统计显著的结果

3.将统计的思想融入到实验设计中,使实验设计符合统计分析的标准

4.对实验数据进行分析时,统计可以提供最恰当的分析方法

2.4数据的误差

2.4.1抽样误差

2.4.2非抽样误差

2.4.3误差的控制

抽样误差

1.由于抽样的随机性所带来的误差

2.所有样本可能的结果与总体真值之间的平均性差异

3.影响抽样误差的大小的因素:

样本量的大小、总体的变异性

非抽样误差

1.相对抽样误差而言

2.除抽样误差之外的,由于其他原因造成的样本观察结果与总体真值之间的差异

3.存在于所有的调查之中

概率抽样,非概率抽样,全面性调查

4.有抽样框误差、回答误差、无回答误差、调查员误差、测量误差

误差的控制

1、抽样误差可计算和控制

2.、非抽样误差的控制

1.调查员的挑选

2.调查员的培训

3.督导员的调查专业水平

4.调查过程控制

调查结果进行检验、评估

现场调查人员进行奖惩的制度

 

第3章数据的图表展示

3.1数据的预处理

1.数据审核

检查数据中的错误

2.数据筛选

找出符合条件的数据

3.数据排序

升序和降序

寻找数据的基本特征

4.数据透视

按需要汇总

数据审核—原始数据

1、完整性审核

应调查的单位或个体是否有遗漏

所有的调查项目或变量是否填写齐全

2、准确性审核

数据是否真实反映实际情况,内容是否符合实际

数据是否有错误,计算是否正确等

 

数据的审核—二手数据

1、适用性审核

弄清楚数据的来源、数据的口径以及有关的背景材料

确定数据是否符合自己分析研究的需要

2、时效性审核

尽可能使用最新的数据

3、确认是否有必要做进一步的加工整理

数据筛选

1、当数据中的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,需要对数据进行筛选

2.、数据筛选的内容

将某些不符合要求的数据或有明显错误的数据予以剔除

将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔除

数据排序

1、按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索

2.、排序有助于对数据检查纠错,以及为重新归类或分组等提供依据

3、在某些场合,排序本身就是分析的目的之一

4、排序可借助于计算机完成

数据排序(方法)

1、分类数据的排序

字母型数据,排序有升序降序之分,但习惯上用升序

汉字型数据,可按汉字的首位拼音字母排列,也可按笔画排序,其中也有笔画多少的升序降序之分

2、数值型数据的排序

递增排序:

设一组数据为x1,x2,…,xn,递增排序后可表示为:

x

(1)

(2)<…

递减排序:

可表示为:

x

(1)>x

(2)>…>x(n)

数据透视表

1、可以从复杂的数据中提取有用的信息

2、可以对数据表的重要信息按使用者的习惯或分析要求进行汇总和作图

3、形成一个符合需要的交叉表(列联表)

4、在利用数据透视表时,数据源表中的首行必须有列标题

数据的整理与显示(基本问题)

1、要弄清所面对的数据类型

不同类型的数据,采取不同的处理方式和方法

2、对分类数据和顺序数据主要是作分类整理

3、对数值型数据则主要是作分组整理

4、适合于低层次数据的整理和显示方法也适合于高层次的数据;但适合于高层次数据的整理和显示方法并不适合于低层次的数据

分类数据的整理(基本过程)

1.列出各类别

2.计算各类别的频数

3.制作频数分布表

4.用图形显示数据

分类数据的整理(可计算的统计量)

1.频数:

落在各类别中的数据个数

2.比例:

某一类别数据个数占全部数据个数的比值

3.百分比:

将对比的基数作为100而计算的比值

4.比率:

不同类别数值个数的比值

分类数据的图示—条形图

1、用宽度相同的条形的高度或长短来表示各类别数据的图形

2、有单式条形图、复式条形图等形式

3、主要用于反映分类数据的频数分布

4、绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图

分类数据的图示—对比条形图

1、分类变量在不同时间或不同空间上有多个取值

2、对比分类变量的取值在不同时间或不同空间上的差异或变化趋势

分类数据的图示—帕累托图

1、按各类别数据出现的频数多少排序后绘制的柱形图

2、主要用于展示分类数据的分布

分类数据的图示—饼图

1、也称圆形图,是用圆形及圆内扇形的角度来表示数值大小的图形

2、主要用于表示样本或总体中各组成部分所占的比例,用于研究结构性问题

3、绘制圆形图时,样本或总体中各部分所占的百分比用圆内的各个扇形角度表示,这些扇形的中心角度,按各部分数据百分比乘以360度确定

顺序数据的整理与图示

顺序数据的整理(可计算的统计量)

1.累积频数:

各类别频数的逐级累加

2.累积频率:

各类别频率(百分比)的逐级累加

环形图

1、环形图中间有一个“空洞”,样本或总体中的每一部分数据用环中的一段表示

2、与饼图类似,但又有区别

饼图只能显示一个总体各部分所占的比例

环形图则可以同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为一个环

3、用于结构比较研究

4、用于展示分类和顺序数据

3.3数值型数据的整理与展示

3.3.1数据分组

3.3.2数值型数据的图示

组距分组(要点)

1.将变量值的一个区间作为一组

2.适合于连续变量

3.适合于变量值较多的情况

4.需要遵循“不重不漏”的原则

5.可采用等距分组,也可采用不等距分组

组距分组(步骤)

1、确定组数:

组数的确定应以能够显示数据的分布特征和规律为目的。

在实际分组时,组数一般为5K15

2、确定组距:

组距(ClassWidth)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 小学教育 > 数学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1