质量特性数据的统计规律.docx

上传人:b****6 文档编号:6183496 上传时间:2023-01-04 格式:DOCX 页数:8 大小:72.95KB
下载 相关 举报
质量特性数据的统计规律.docx_第1页
第1页 / 共8页
质量特性数据的统计规律.docx_第2页
第2页 / 共8页
质量特性数据的统计规律.docx_第3页
第3页 / 共8页
质量特性数据的统计规律.docx_第4页
第4页 / 共8页
质量特性数据的统计规律.docx_第5页
第5页 / 共8页
点击查看更多>>
下载资源
资源描述

质量特性数据的统计规律.docx

《质量特性数据的统计规律.docx》由会员分享,可在线阅读,更多相关《质量特性数据的统计规律.docx(8页珍藏版)》请在冰豆网上搜索。

质量特性数据的统计规律.docx

质量特性数据的统计规律

质量特性数据的统计规律

 

  一、总体、个体与样本

  产品的质量可以用一个或多个质量特性来表示。

这里的特性可以是定量的,也可以是定性的。

例如灯泡的寿命,钢的成分等都是定量特性;而按规范判定产品为“合格”或“不合格”,则是一种定性特征。

  在质量管理中,通常研究一个过程中生产的全体产品。

在统计中,将研究、考察对象的全体称为总体。

例如某个工厂在一个月内按照一定材料及一定工艺生产的一批灯泡。

总体是由个体组成的。

在上例中,这批灯泡中的每个特定的灯泡都是一个个体。

如果总体中包含的个体数不大,而对产品质量特性的观测(例如测量)手段不是破坏性的,工作量也不大,那么有可能对总体中的每个个体都进行观测,以得到每个个体的质量特性值。

但是如果总体中的个体数N很大,甚至是无限的,或者观测是破坏性的或观测的费用很大,那么不可能对总体中的每个个体都进行观测。

通常的做法是从总体中抽取一个或多个个体来进行观测。

抽出来的这一部分个体组成一个样本,样本中所包含的个体数目称为样本量。

通过对样本的观测来对总体特性进行研究,是统计的核心。

  上述总体、个体和样本的概念是统计的基本概念,从上面的叙述中,这些概念都可以是具体的产品。

但有时为了表达的方便,当研究产品某个特定的质量特性X时,也常把全体产品的特性看做为总体,而把一个具体产品的特性值x视为个体,把从总体中抽出的由n个产品的特性值x1,x2,…,xn看做为一个样本。

  [例1.1-1]从一个工厂一个月内生产的一批灯泡中抽取n=8个灯泡,进行寿命试验,得到这8个灯泡的使用寿命为(单位为小时):

  325,84,1244,870,645,1423,1071,992  这8个灯泡或相应的使用寿命即为一个样本,样本量n=8。

  从总体中抽取样本的方法称为抽样。

为使抽取的样本对总体有代表性,样本不能是有选择的,最好应是随机抽取的,关于这一点,以后我们还要详细解释。

  二、频数(频率)直方图及累积频数(频率)直方图

  为研究一批产品的质量情况,需要研究它的某个质量特性(这里为了叙述简单起见,仅讨论一个质量特性,有必要时也可以同时讨论多个

质量特性)X的变化规律。

为此,从这批产品(总体)中抽取一个样本(设样本量为n),对每个样本产品进行该特性的测量(观测)后得到一组样本观测值,记为x1,x2,…,xn,这便是我们通常说的数据。

  为了研究数据的变化规律,需要对数据进行一定的加工整理。

直方图是为研究数据变化规律而对数据进行加工整理的一种基本方法。

下面用一个例子来说明直方图的概念及其作法。

  〔例1.1-2]食品厂用自动装罐机生产罐头食品,从一批罐头中随机抽取100个进行称量,获得罐头的净重数据如下:

  

  为了解这组数据的分布规律,对数据作如下整理:

  

(1)找出这组数据中的最大值xmax及最小值xmin,计算它们的差R=xmax-xmin,R称为极值,也就是这组数据的取值范围。

在本例中xmax=356,xmin=332,从而R=356-332=24。

  

(2)根据数据个数,即样本量n,决定分组数k及组距h。

  一批数据究竟分多少组,通常根据n的多少而定,不过这也不是绝对的,表1.1-1是可以参考的分组数。

  

  选择k的原则是要能显示出数据中所隐藏的规律,组数不能过多,但也不能太少。

  每一组的区间长度,称为组距。

组距可以相等,也可以不相等。

组距相等的情况用得比较多,不过也有不少情形在对应于数据最大及最小的一个或两个组,使用与其他组不相等的组距。

对于完全相等的组距,通常取组距h为接近R/k的某个整数值。

  在本例中,=100,取k=9,R/k=24/9=2.7,故取组距h=3。

  (3)确定组限,即每个区间的端点及组中值。

为了避免一个数据可能同时属于两个组,因此通常将各组的区间确定为左开右闭的:

  (a0,a1],(a1,a2],…,(ak-1,ak]通常要求a0xmax。

在等距分组时,a1=a0+h,a2=a1+h,…,ak=ak-1+h,而每一组的组中值

  

  在本例中取a0=331.5,则每组的组限及组中值见表1.1-2。

  (4)计算落在每组的数据的频数及频率

  确定分组后,统计每组的频数,即落在组中的数据个数ni以及频率fi=ni/n,列出每组的频数、频率表,见表1.1-2。

  

东莞德信诚精品培训课程(部分)

(点击课程名称打开课程详细介绍)

内审员系列培训课程  查看详情

A01ISO9001:

2008内审员培训班(ISO9001内审员)

A02ISO14001:

2004内审员培训班

A03ISO/TS16949:

2009内审员培训

A04OHSAS18001:

2007标准理解及内审员培训

A05IECQ-HSPMQC080000内审员培训

A06ISO13485:

2003医疗器械质量体系内审员培训

A07SA8000社会责任内审员培训(SA8000内审员)

A08ICTI玩具商业行为守则内审员培训班

A09ISO14064:

2006内审员培训班

A10GB/T23331-2009能源管理体系内审员培训

A15量规仪器校验与管理实务课程(仪校员培训内校员培训)

A16ISO管理代表及体系推行专员训练营

A17ISO文控员培训/文管员培训实务课程

A18优秀管理者代表训练营(MR管理代表训练)

JIT精益生产现场管理系列课程  查看详情

P01JIT精益生产与现场改善培训班

P02生产合理化改善-IE工业工程实务训练营

P03PMC生产计划管理实务培训班(生管员培训)

P04高效仓储管理与盘点技巧培训班(仓管员培训)

P05目视管理与5S运动推行实务培训班

P06采购与供应链管理实务(采购员培训)

中基层管理干部TWI系列训练  查看详情

M01优秀班组长管理实务公开课(班组长公培训)

M02优秀班组长现场管理实务培训班

M03优秀班组长品质管理实务培训班

M04优秀班组长生产安全管理实务培训班

M06提升团队执行力训练课程(执行力培训)

M07如何做一名优秀的现场主管培训班

M08中基层现场干部TWI管理技能提升(TWI培训)

M09有效沟通技巧培训班(团队沟通企业内外部沟通)

M10企业内部讲师培训班(东莞TTT培训)

M11MTP中阶主管管理才能提升培训班(东莞MTP培训)

M12高效能时间管理培训班

TS16949五大工具与QC/QA/QE品质管理类  查看详情

Q05TS16949五大工具实战训练(五大工具培训)

Q06APQP&CP先期质量策划及控制计划培训

Q07DFMEA设计潜在失效模式分析培训(DFMEA培训)

Q08PFMEA过程潜在失效模式及效应分析训练营

Q09MSA测量系统分析与仪器校验实务

Q10SPC统计过程控制培训课程(SPC训练)

Q11CPK制程能力分析与SPC统计制程管制应用训练

Q12QC七大手法与SPC实战训练班(QC7&SPC培训)

Q03品质工程师(QE质量工程师)实务培训班

Q02品质主管训练营(品质经理人训练)

Q01杰出品质检验员QC培训班

Q13品管常用工具QC七大手法培训(旧QC7培训)

Q14新QC七大手法实战培训(新QC7培训)

Q04QCC品管圈活动训练课程(QCC培训)

节能环保安全EHS公开课程  查看详情

E01节约能源管理培训(节能降耗培训)

E03GBT23331-2009能源管理体系知识培训(GBT23331标准理解)

A18ISO50001能源管理体系内审员培训(ISO50001内审员)

A12ISO9000/ISO14000一体化内审员培训班

A13ISO14001/OHSAS18001体系二合一内审员培训班

A14ISO9000/ISO14000/OHSAS18001一体化内审员培训班

东莞精品企业内训课程  查看详情

M05优秀班组长管理技能提升内训班(1-3天)

P07年终盘点与库存管理实务内训班(1-2天课程)

M13高绩效团队及执行力提升训练营(团队执行力1-2天)

Q15FMEA失效模式分析实战训练内训(FMEA内训1-3天)

Q16新旧QC七大手法实战内训(QC7内训1-2天)

A11ISO内审员审核技巧提高班(ISO内审员提高班)

A07SA8000社会责任内审员培训(SA8000内审员)

A08ISO9001:

2008内审员培训班(ISO9001内审员)

A09ISO14001:

2004内审员培训班

A10ISO/TS16949:

2009内审员培训

A19ISO10015培训管理体系标准理解与实施培训

东莞德信诚公开课培训计划>>>培训报名表下载>>>

  (5)作频数频率直方图

  在横轴上标上每个组的组限,以每一组的区间为底,以频数(频率)为高画一个矩形,所得的图形称为频数(频率)直方图,如图1.1-1。

到在本例中频数直方图及频率直方图的形状是完全一致的。

这是因为分组是等距的。

  在分组不完全等距的情形,在作频率直方图时,应当用每个组的频率与组距的比值fi/hi为高作矩形。

此时以每个矩形的面积表示频率。

  (6)累积频数和累积频率直方图

  还有另一种直方图使用的是累积频数和累积频率。

以累积频率直方图为例,首先要计算累积频率Fi,Fi是将这一组的频率与前面所有组的频率累加,也即第1组的F1=f1,第2组的F2=f1+f2,一般的,Fi=fj。

本例中的各组Fi值也见表1.1-2。

  如果以每组的累积频率Fi为高作矩形,所得的直方图称为累积频率直方图,本例中的累积频率直方图如图1.1-2所示。

  可以从直方图获得数据的分布规律,其中包含数据取值的范围,以及它们的集中位置和分散程度等信息。

  

  

  应当引起注意的是,如果我们观测的数据量(即样本量)n很大,而分组又很细,那么从频率直方图及累积频率直方图可以分别得到一根光滑曲线,关于这一点我们将在本章第三节详细讨论。

  三、数据集中位置的度量

  对一组样本数据,可以用一些量表示它们的集中位置。

这些量中,常用的有样本均值、样本中位数和样本众数。

  

(一)样本均值

  样本均值也称样本平均数,记为,它是样本数据x1,x2,…,xn的算术平均数:

  

  [例1.1-3]轴直径的一个n=5的样本观测值(单位:

cm)为:

15.09,15.29,15.15,15.07,15.21,则样本均值为:

  =15.09+15.29+15.15+15.07+15.21)=15.162对于n较大的分组数据,可利用将每组的组中组x'i用频率fi加权计算近似的样本均值:

  

〔例1.1-4]在例11.2中,100个罐头的净量的均值按分组计算为:

  

=333×0.01十336×0.04十339×0.11+…+357×0.01=34508/100=345.08

  样本均值是使用最为广泛的反映数据集中位置的度量。

它的计算比较简单,但缺点是它受极端值的影响比较大。

  

(二)样本中位数

  样本中位数是表示数据集中位置的另一种重要的度量,用符号Me或表示。

在确定样本中位数时,需要将所有样本数据按其数值大小从小到大重新排列成以下的有序样本:

  x

(1),x

(2),…,x(n)其中x

(1)=xmin,x(n)=xmax分别是数据的最小值与最大值。

  样本中位数定义为有序样本中位置居于中间的数值,具体地说:

  

  〔例1.1-5]对例1.1-3中的5个轴直径数据进行按从小到大的重新排序,得到如下有序样本:

  15.07,15.09,15.15,15.21,15.29这里n=5为奇数,(n+1)/2=3,因而样本中位数Me=x(3)=15.15。

  注意,在此例中,中位数15.15与均值15.162很接近。

  与均值相比,中位数不受极端值的影响。

因此在某些场合,中位数比均值更能代表一组数据的中心位置。

  (三)样本众数

  样本众数是样本数据中出现频率最高的值,常记为Mod。

例如对例1.1-2中的罐头净量,100个数据中,344出现的次数最多,为12次,因此Mod=344。

样本众数的主要缺点是受数据的随机性影响比较大,而且对大的n,也很难确定,有时也不惟一,此时较多地采用分组数据。

在本例中第5组(343.5,346.5]的频率为0.30,是所有组中最高的,因而该组的组中值345可以作为众数的估计。

注意到该数与前面定的344相差不大。

  四、数据分散程度的度量

  一组数据总是有差别的,对一组质量特性数据,大小的差异反映质量的波动。

也有一些用来表示数据内部差异或分散程度的量,其中常用的有样本极差、样本方差、样本标准差和样本变异系数。

  

(一)样本极差

  样本极差即是样本数据中最大值与最小值之差,用R表示。

对于有序样本,极差R为:

  R=x(n)-x

(1)(1.1-4)

  例如在例1.1-3,5个轴直径数据的极差R=15.21-15.09=0.12。

  样本极差只利用了数据中两个极端值,因此它对数据信息的利用不够充分,极差常用于n不大的情况。

  

(二)样本方差与标准差

  数据的分散程度可以用每个数据xi离其均值的差xi-来表示,xi-称为xi的离差。

对离差不能直接取平均,因为离差有正有负,取平均会正负相抵,无法反映分散的真实情况。

当然可以先将其取绝对值,再进行平均,这就是平均绝对差:

  

  但是由于对绝对值的微分性质较差,理论研究较为困难,因此平均绝对差使用并不广泛。

使用最为广泛的是用离差平方来代替离差的绝对值,因而数据的总波动用离差平方和

  

来表示,样本方差定义为离差平方和除以n-1,用s2表示:

  

  因为n个离差的总和为0,所以对于n个独立数据,独立的离差个数只有n-1个,称n-1为离差(或离差平方和)的自由度,因此样本方差是用n-1而不是用n除离差平方和。

  样本方差正的算术平方根称为样本标准差,即:

  

  注意标准差的量纲与数据的量纲一致。

  在具体计算时,离差平方和也可用以下两个简便的公式:

  

  因此样本方差计算可用以下公式:

  

  对例1.1-3的轴直径数据,离差平方和、样本方差及样本标准差的计算可列表进行。

  

  

  为计算方便,可以将数据减去一个适当的常数,这样不影响样本方差及标准差的计算结果。

例如,在本例中,将每个数据减去15,即可大大减少计算量。

在实际使用中还可以利用计算器来计算,特别是许多科学计算用的计算器,都具有平均数、方差与标准差的计算功能。

(三)样本变异系数

  样本标准差与样本均值之比称为样本变异系数,有时也称之为相对标准差,记为cv:

  

例如对例1.1-2的轴直径数据,样本变异系数cv=0.0901/15.162=0.0059。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 表格模板 > 合同协议

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1