工程统计学课程PPT--第二章.ppt
《工程统计学课程PPT--第二章.ppt》由会员分享,可在线阅读,更多相关《工程统计学课程PPT--第二章.ppt(58页珍藏版)》请在冰豆网上搜索。
11/8/20221教学目标:
教学目标:
l统计数据的收集、调查;l掌握利用统计图表整理和表示统计数据的基本方法;l掌握利用Office软件绘制各种统计图表、计算各种统计综合指标。
第二章第二章统计数据的收集与整理统计数据的收集与整理
(1)11/8/20222统计学的分类统计学的分类统计学大致有以下两种主要的分类方法。
1.1.描述统计学和推断统计学描述统计学和推断统计学这一分类方法既反映了统计学发展的两个主要阶段,同时也反映了各自不同的侧重。
l描述统计学描述统计学是研究如何对客观现象进行数量的计量、加工、概括和表示的方法。
在二十世纪之前统计学基本上处于描述阶段。
描述统计学是统计学的基础。
l推断统计学推断统计学是研究如何根据样本数据去推断总体的情况,概率论是其理论基础。
推断统计学是近代统计学的核心,也是统计学中的主要内容。
11/8/20223描述统计与推断统计的关系描述统计与推断统计的关系反映客观现反映客观现反映客观现反映客观现象的数据象的数据象的数据象的数据总体内在的总体内在的总体内在的总体内在的数量规律性数量规律性数量规律性数量规律性推断统计推断统计推断统计推断统计(利用样本信息和概率(利用样本信息和概率(利用样本信息和概率(利用样本信息和概率论对总体的数量特征进论对总体的数量特征进论对总体的数量特征进论对总体的数量特征进行估计和检验等)行估计和检验等)行估计和检验等)行估计和检验等)概率论概率论概率论概率论(包括分布理论、大数定律(包括分布理论、大数定律(包括分布理论、大数定律(包括分布理论、大数定律和中心极限定理等)和中心极限定理等)和中心极限定理等)和中心极限定理等)描述统计描述统计描述统计描述统计(统计数据的搜集、整(统计数据的搜集、整(统计数据的搜集、整(统计数据的搜集、整理、显示和分析等)理、显示和分析等)理、显示和分析等)理、显示和分析等)总体数据总体数据样本数据样本数据统计学探索现象数量规律性的过程统计学探索现象数量规律性的过程统计学探索现象数量规律性的过程统计学探索现象数量规律性的过程11/8/20224统计基本术语统计基本术语变量:
变量:
事物的特征,是运用统计方法所分析的对象。
例如,在商业模型中,销售额、每年的开支和每年的净利润都是企业想要分析的变量。
数据数据:
是与变量相关的值。
变量可能随时间变动,如某一公司的期望销售额、开支和净利润每年都有所不同。
这些不同的值就是与变量相关的数据,或者简单地说,就是统计所要分析的“数据”。
注意注意:
变量需赋予可操作定义,否则会产生歧义。
如:
对销售额的操作性定义可能会发生这样错误的理解:
一个人认为年销售额是指全部连锁店的年销售额,而另一个人则认为是每家店的年销售额。
11/8/20225统计基本术语统计基本术语总体总体:
所研究对象的全体。
个体个体:
指总体中的每个元素或单元。
总体依其所包含的个体总数分为有限总体和无限总体。
样本样本:
从总体中挑选出来用于分析的一部分。
这种挑选通常是相对独立的。
样本是进行推断统计的依据。
参数参数:
参数是描述总体特征的数值。
统计量:
统计量:
是描述样本特征的数值11/8/202262.12.1数据的计量与类型数据的计量与类型统计学中将变量分为分类变量或数值变量。
分类变量分类变量(也称为定性变量)的值只能按类别分开。
数值变量数值变量(也称为定量变量)的值表示数量。
数值变量可进一步分为离散变量和连续变量。
11/8/20227四种计量尺度2.12.1数据的计量与类型数据的计量与类型11/8/20228定类尺度定类尺度(概念要点概念要点)1.计量层次最低2.对事物进行平行的分类3.各类别可以指定数字代码表示4.使用时必须符合类别穷尽和互斥的要求5.数据表现为“类别”6.具有=或的数学特性11/8/20229定序尺度定序尺度(概念要点概念要点)1.对事物分类的同时给出各类别的顺序2.比定类尺度精确3.未测量出类别之间的准确差值4.数据表现为“类别”,但有序5.具有或的数学特性11/8/202210定距尺度定距尺度(概念要点概念要点)1.对事物的准确测度2.比定序尺度精确3.数据表现为“数值”4.没有绝对零点5.具有+或-的数学特性11/8/202211定比尺度定比尺度(概念要点概念要点)1.对事物的准确测度2.与定距尺度处于同一层次3.数据表现为“数值”4.有绝对零点5.具有或的数学特性11/8/202212数据类型与统计方法数据类型与统计方法数据类型与统计方法数据类型与统计方法定类数据定类数据定序数据定序数据品质数据品质数据数量数据数量数据数量数据数量数据定距数据定距数据定距数据定距数据定比数据定比数据定比数据定比数据11/8/202213数据是统计分析的基础,社会经济统计中所需要的数据与资料主要来源于统计调查。
一一.数据采集的基本要求数据采集的基本要求1.1.准确性准确性2.2.及时性及时性3.3.完整性完整性4.4.系统性系统性指统计调查的数据资料应配套,要能从不同侧面反映所研究总体的特征,才能为科学的判断和决策提供依据。
2.2统计数据的统计数据的收集收集11/8/202214二二.普遍调查普遍调查普遍调查简称普查,是专门组织的一次性的全面调查。
如全国的人口普查、能源普查、工业普查等。
组织方式有两种:
1.建立专门的普查机构2.利用调查单位的原始记录和核算资料,发放调查表,由登记单位填报。
普查时注意的原则:
(1)规定统一的标准时点
(2)规定统一的普查期限(3)规定普查的项目和指标。
11/8/202215普遍调查实例普遍调查实例【例1.1】2002年在国务院统一部署下,开展全国“基本单位普查”。
关于这次普查的部分重要要求与规定如下:
调查目的:
统计分析全国和各省市地区的单位总数、性质、隶属关系、分布情况等。
标准时间:
2001年12月31日。
调查对象:
各类法人单位,各类法人单位所属的产业活动单位。
调查项目:
单位总数;性质分类(企业法人、事业法人、社团法人、机关法人、其他法人);基本情况性质划分、隶属关系(中央、省市、区县、街道等);主要构成(产业结构、行业分布、地区分布、经济成分、规模结构);分布情况。
11/8/202216三三.重点调查重点调查在总体中选择部分重点单位进行调查,以了解总体基本情况总体基本情况的一种非全面调查。
重点调查的特点:
重点调查的特点:
(1)重点调查适用于调查对象的标志值比较集中于某些单位的场合,这些单位的管理比较健全,统计力量比较充实,能够及时取得准确资料。
(2)重点调查的目的在于了解总体现象某些方面的基本情况,而不要求全面准确地推算总体数字。
(3)重点调查比实际调查的单位数目少,在满足调查目的所要求的前提下,可以比全面调查节省人力、物力和时间。
11/8/202217四四.典型调查典型调查也是专门组织的一种非全面调查,在总体中选择有代表性的典型单位进行深入细致深入细致的调查。
典型调查的作用和目的典型调查的作用和目的
(1)研究新事物或某种倾向性的社会问题研究新事物或某种倾向性的社会问题通过对典型单位深入细致的调查,可以发现新情况、新问题,探测事物发展变化的趋势,形成科学的预见。
(2)分析事物的不同类型分析事物的不同类型通过研究造成它们间差别的原因,总结经验教训,研究对策,促进事物的转化和发展。
11/8/202218五五.典型调查(续)典型调查(续)(33)典型调查可用来研究事务的变化规律。
)典型调查可用来研究事务的变化规律。
(44)典型调查的资料可用来补充和验证全面统)典型调查的资料可用来补充和验证全面统计的数字,推论和测算有关现象的总体。
计的数字,推论和测算有关现象的总体。
11/8/202219六六.抽样调查抽样调查是指按随机原则从总体中抽取部分单位组成样本。
目的是利用样本数据推断(估计)总体的数量分布特征。
抽样调查是现代推断统计的核心,也是最重要的统计调查方法。
11/8/202220抽样调查中四种误差抽样调查中四种误差1.1.涵盖误差涵盖误差:
当某一组代表性的样本被排除在抽样调查之外时所引起的选择偏差。
2.2.无回应误差无回应误差:
抽样时,对样本个体数据收集失败会导致无回应偏差。
3.3.抽抽样样误误差差:
选择抽样调查是因为这种方法简单、低成本和有效。
但同时也意味着有的个体被抽中,有的个体没有被抽中。
4.4.测测量量误误差差:
测量误差是指由于样本数据测量程序的设计和应用不当所引起的误差。
5.5.课堂讨论:
课堂讨论:
举例说明这几种误差。
11/8/202221七七.网上调查网上调查截至2009年6月底,中国网民规模达到3.38亿人,较2008年底增长13.4%,上网普及率达到25.5%。
网民规模持续扩大,互联网普及率平稳上升。
其中宽带网民数达到3.2亿,占比高达94.3%,较2008年底上升了3.7个百分点。
另外,截至2009年6月底,作为国家域名,CN域名总计达到1,296万个。
作为我国互联网的重要基础资源,CN域名已经广泛地应用在金融、汽车等各个行业中。
截止2009年6月我国互联网用户发展情况如图1.2所示。
11/8/202222图1-22008-2009年我国互联网用户发展情况(资料来源:
第23次中国互联网络发展状况统计报告)11/8/202223网上调查优势网上调查优势1)及时性和共享性2)便捷性和低成本3)可靠性和客观性4)更好的接触性5)穿越时空性11/8/202224问卷是一种特殊形式的调查表。
其特点是表中用一系列按照严密逻辑结构组成的问题,向被调查者调查具体事实和个人对某问题的反映、看法,它不要求被调查者填写姓名。
问卷设计一般要遵循以下原则。
1.合理性合理性指的是问卷必须紧密与调查主题相关。
2.一般性一般性即问题的设置是否具有普遍意义。
3.逻逻辑辑性性问卷的设计要有整体感,这种整体感即是问题与问题之间要具有逻辑性,独立的问题本身也不能出现逻辑上的谬误。
4.明确性所谓明确性,事实上是问题设置的规范性。
5.非诱导性非诱导性指的是问题要设置在中性位置、不参与提示或主观臆断,完全将被访问者的独立性与客观性摆在问卷操作的限制条件的位置上。
2.3问卷设计问卷设计11/8/202225在获得原始数据资料之后,需要使用一定的方法对数据进行整理和综合,目的是从大量的原始数据资料中提炼所需要的信息,使之可以提供概要信息并能反映对象总体的基本数量特征,便于人们的理解和使用。
表格和图形是整理和反映统计资料的主要工具。
2.4统计表和统计图统计表和统计图11/8/202226一、分类数据的图表一、分类数据的图表11、频数分布表、频数分布表频数分布表列出了一系列分类数据的频率、总数或百分比,可以看出不同类别数据间的区别。
表2-11000美元用途的频数分布表用钱做什么百分比/%购买奢侈品、旅游或礼物20向慈善机构捐款2还贷24储蓄31购买必需品16其他711/8/202227一、分类数据的图表一、分类数据的图表22、条形图、条形图11/8/202228一、分类数据的图表一、分类数据的图表33、圆饼图、圆饼图11/8/202229一、分类数据的图表一、分类数据的图表4、帕累托图在帕累托图中,不同类别的数据是按其频率降序排列的,并在同一张图中画出累积百分比图。
帕累托图可以体现帕累托原则:
数据的绝大部分存在于很少类别中,极少剩下剩余的数据分散在大部分类别中。
这两组经常被称为“至关重要的极少数”和“微不足道的大多数”11/8/202230二、二、数值数据的图表数值数据的图表例:
例:
某公司汽车销售量(单位:
辆)11/8/2022311、频数分布表、频数分布表分组统计整理后,将杂乱无章的60个原始数据压缩到8组,清晰地反映了更多的有用信息。
11/8/202232制作频数分布表的注意事项制作频数分布表的注意事项1)分组的数量实际应用中分组的数量和组距应根据对象的特点和分析的需要决定。
如果分组是为了揭示数据的分布规律,则分组不能过多和过少。
通常应在515之间。
在绘制直方图时可以参照下表:
样本容量n参考分组数2050565110078101200