统计技术Word下载.docx

资源描述

统计技术Word下载.docx

《统计技术Word下载.docx》由会员分享，可在线阅读，更多相关《统计技术Word下载.docx（45页珍藏版）》请在冰豆网上搜索。

统计技术Word下载.docx

通过对零件一个一个地充分地检测或用户的意见，集中对已产生的产品问题进行分析，这是一种“死后验尸”的方法。

●第二种保证质量的方法是预防方法。

这种方法通过对设计，过程能力的分析及加工的控制，在加工同时或加工之前接找出问题所在并着手解决之。

A.两种方法的比较

●检验把关方法：

混淆了责任。

检验经常混淆产品质量的真实情况。

它有这样一种认识，如果产品不符合要求，也许是由于我们检测得不充分。

当不合格确实由于设计或加工控制不足而引起时，那么事后检验错误地与质量不合格关联在一起。

用户不满意。

由于检验方法过分依赖于用户的意见，以致不能确定质量问题。

当用户感到不方便、不舒服、发生损失及不可避难的毛病后，他们反映的是质量问题，用户可以善意地做毫无必要的让步，然而制造商的名誉就会一落千丈。

费用的增长。

返工、返修及废品的费用提高了成品的价格，因为这些费用要计入最后的价格。

重复的问题。

检验往往只是容忍问题，而不是解决它们。

忽视了改进。

只是对产品的好坏进行评价，而忽视了质量改进。

●预防方法：

可改善设计和过程能力。

有效的预防将注意力集中在出现废品之前，并注重确立适应设计目标的产品设计和加工过程。

改善加工质量。

加工负责使产品质量一次即达到合格，并通过进行过程控制的方法校核结果。

改善组织的作用。

质量控制组织要执行分析和检测任务，而不是“监督执行”任务。

要将“监督执行”的思想转移到以发现问题的原因并予以消除为目标的这样一种解决问题的观念上来，而且并不是仅仅作样子。

完善寻找原因的方法。

“预防方法”确立一个训练有素的系统来寻找质量问题的主要原因，其中包括有计划的鉴别、评价、修正和控制质量问题，以及对确定的职责分工和专用的调整整个组织计划目标时间表的实施。

能进一步提高。

通过预防的方法，使质量不断改进，不但保证今天的产品质量，而且进一步保证明天的产品质量。

B.SPC——统计方法的过程控制简介及其效用

统计方法的过程控制是属于预防方法中的一种方法，它是借助统计学的手段对生产过程进行分析评价，根据反馈信息采取措施来达到控制质量的目标。

下面我们强调一下它可以产生的效用。

首先，它对设计和过程能力提供可靠的估计，这是使用此统计工具的基本原因之一。

评价具体设计和工艺是否达到设计目标和质量要求。

第二，统计方法帮助识别那些来自系统的“固有的‘波动的特殊原因。

通过确定波动的量值，确定过程中最明显的不正常波动的“统计控制”界限，半段过程是否失控。

第三，统计方法可以为过程提供一个“早期报警”系统——也就是可以跟踪过程的情况以防止废品的产生。

第四，统计方法还可以减少在质量控制中对常规检验的依赖性，定时的观察以及系统的测量方法足以承担检测和验证的任务。

最后，统计方法可以对已经过永久性修正或需要进行进一步完善和优化的项目进行校验。

最后要提的是，系统地使用统计方法的过程控制是一条简洁的改进质量和生产率的途径，这可以直接地带来更大的销售量、更低的单位成本、最终达到更强大、更稳定的工作能力。

第二章数理统计的基本概念和方法

数理统计是研究大量随机现象的“统计”规律。

它的中心任务是“从局部观测资料的统计特征来推断事物总体的统计特征”，因此，它在各行各业中的运用非常广泛。

本教材主要介绍起在工业质量控制中的运用。

一、概率论的基本知识

数理统计是建立在概率论的基础上的，所以先简单介绍一下有关概率的知识。

A．概率

概率是以一个数来表达的，即从1.0（表示某一事件必然会出现）到0.0（表示这个事件不可能出现）之间的一个数。

它的一个比较方便的定义是：

如果在总共n个同样可能的情况下，事件A在m个情况里出现，那么该事件的概率便是：

P（A）=m/n

B．正态分布

从上面举的例中，可以看到出现1点、2点等这些随机变量都是离散的。

若有些变量是连续的呢？

下面就来讨论这个问题。

对于连续变量总可以用于数学表达式f（X）来描述。

f（X）称为概率密度函数，下面在介绍正态分布的同时，介绍一些连续型随机变量的重要性质。

正态分布的表达式为：

-（X-μ）

--------------------

2σ

f（X）=----------------------------e

/-------

√2π*σ

其中：

X∈（-∞，+∞），σ>

0，μ∈（-∞，+∞），，X是随机变量。

从该表达式可以看到连续型随机变量的一些重要性质。

1.f（X）≥0

+∞

2.∫f（X）dX=p=1（-∞≤X≤+∞）

-∞

它的含义就是从-∞到+∞曲线与X轴所包围的面积为1的区域。

从概率上理解，就是：

X取（-∞，+∞）内任一数值，这一事件是必然的。

3.∫f（X）dX=p（a<

X≤b）

它的含义就是：

从a到b曲线与X抽所包围的面积，它的值必小于1。

从概率上理解就是：

X取[a，b]内的值的概率，因为总面积正好为1。

4.对于一个具体的X来说，它的概率不存在，即P{X}=不存在。

正态分布本身还有其它一些性质：

1.曲线关于X=μ轴对称

2.当X→+∞时，f（X）=0当X→-∞时，f（X）=0

f（X）

0μ-σμ+σX

图1

μ0μˊX

图2

3.线以X轴为渐近线。

4.μ不变，σ变，则曲线的胖、瘦、高、矮发生变化。

如图2示。

5.σ不变化，μ变化，则曲线的位置发生变化。

从图1中可以看到，正态分布曲线又叫钟形曲线。

它最大的特点，“中间高，两头低”。

下面我们给出一非常有用的结论，本教材的重点就是利用了这一结论。

P{μ-3σ≤X≤μ+3σ}==99.73%如图所示

含义：

X为（μ-3σ，μ+3σ）内的值的概率为99.73%

这一结论被广泛地运用于质量控制中。

另外：

{μ-4σ≤X≤μ+4σ}=99.9936%

二、数理统计的基本知识

A．统计的一般模式

如下图所示：

抽样

总体样本据某一要求检验

根据要求对总

体作出评价

算出特征值记录原始数据

这就是数理统计的一般流程；

它的意思是非常明确的。

●总体：

所有研究对象的集合称为总体。

而组成总体的每个基本单元称为个体。

总体分为两种：

有限制的总体（如批量验收）和无限制的总体（如一个生产过程）从质量控制的及时性、在线性出发，我们还可以把总体视为一工序。

因为工序是生产过程中的一个环节，当然也是无限制的。

●样本：

从总体中抽取的n个试验观察个体就叫做样本。

抽取的个体数n叫做该样本的容量。

并且把该样本称为容量为n的样本。

如：

为了解1000辆Santana轿车轮胎螺栓的扭矩情况，从中挑选20辆车子就是容量为20的样本。

样本的获取方法是非常重要。

第一，抽样原则：

总体中每个个体被抽取为样本的概率是相等。

第二，分类抽样；

如总体是非均质的，则首先必须对总体进行分类，然后在各类中随机抽样，否则的话就不能对总体作出正确的评价。

●数据整理：

在质量控制中，我们都是依据事实来进行评价和行动的。

事实是通过具体的数据来反映的，而仅就数据量来作出正确的评价是不够的，重要的是必须知道数据的来源和有目的地搜集那些适用的数据，孤立的数据或错误的数据不仅没有价值，甚至是有害的。

（1）数据类型

数据处理依据数据类型进行，因此有必要区分不同类型的数据。

本教材主要介绍两种：

（a）计量值：

比如高度、长度、时间、湿度和重量等。

它们都是直接通过测量仪器测得的。

（b）计数值：

如报废数量，合格率等。

它们不是直接通过测量仪器得到的。

（2）收集数据的准备工作

（a）明确目的。

（b）对数据准确地按照它们的来源进行分类，以便找出问题的原因所在。

（c）必须说明清楚数据的起源。

数据起源表示，数据在何时、何地、由何人通过何种方式收集得到。

应该确定地点、时间长短、收集数据者的姓名、样本数、测量工具、测量单位、批量大小等。

（d）制定用于收集数据的专门表格。

（e）收集的数据必须可靠：

这就要求能正确使用量具（包括量具基本精度的要求）和正确记录数据。

（3）数据分级

为了能从获取的数据中得出正确的结论，有必要将数据分类整理到生产过程的最小单位，一个独立的尺寸或一台独立的机器就是最小单位。

如两台机器生产的产品放在一起，如果检查结果有50%不合格的产品，我们就不能确切地知道，50%不合格的产品是由哪台机器引起的?

是不是两合机器工作都不正常?

数据分级可按以下原则进行：

（a）缺陷种类。

（b）缺陷根源。

（c）产品产生缺陷的地点和场合。

（d）产品材料。

（e）生产日期。

（f）生产线、单台机器、单个操作工。

（g）生产厂。

（h）批量号数。

（i）批量。

其实数据整理的过程也就是抽样过程，因为抽样的最终结果是由数据来体现的，有关样本的大小，抽样频率等问题在“工序能力”一章内将介绍，下面我们回过来谈谈总体、样本。

●举例：

对1000根轴的长度和直径进行检验。

从中挑出20根。

这里就有两个检验要求：

长度和直径。

若20根轴的长度都是合格的，我们只能推断1000根轴的长度是合格的，而不能推断1000根轴的直径是合格的，因为检验要求有两个，所以我们在讲总体和样本的时候，总是针对某一检验要求而言的。

●检验：

检验总是依据一定的要求去检验的。

根据不同的数据类型，检验分为计量检验（如轴的长度和直径）和计数检验（如不合格数、汽车的油漆缺陷数）。

对于这两种检验，又可分为全部检验和抽样检验。

本教材主要讲抽样检验，抽样检验较全数检验而言，有以下优点：

（1）由于只抽检部分产品，较为经济。

（2）适用于破坏性测试。

（3）拒收供应者的整个批量，而不是仅仅退回不合格品，从而更有力地促进产品的质量提高。

但抽样检验也不可避免地存在以下缺点：

存在接受“劣质”批量和拒收“优质”批量的风险。

对于这个问题，本教材不作更多的讨论，只讲一点，接受“劣质”批量将由用户承担风险，拒收“优质”批量将由生产者承担风险。

●统计特征值：

总体的质量分布可跟据样本数据的统计性质来分析和推断，表征样本统计性质的度量值称为统计特征值，常用的统计特征值有以下两种：

表示集中趋势的量：

它反映了分布的集中趋势。

通常有平均值X和中位数X

（1）平均值X。

设样本容量为n，每个个体的数据为X1、X2、…Xn，则样本的平均值X按下式计算：

＿X1+X2+X+…+Xn

X=------------------------------

＿1n

上式简写为X=------ΣXi

nI=1

式中Σ——表示累加运算符号

i——表示序号

Σ——表示X1+X2+…+Xn，即样本中所有数据的总和。

i=1

（2）中位数X

它是将一批观测数据按大小顺序排列后，居于中间位置的一个数据，采用中位数可简化计算，甚至不用计算。

如5个数据为3，5，6，7，8，X=6，若个数为偶数时，则X等于两个中间值的平均值。

如有1，2，3，5，6，8等六个数据，则X=（3+5）/2=4表示离散程度的量。

只用表示集中趋势的量来分析，了解总体分布是不够的，因为样本分布，不仅有集中情况，还有离散情况，反映了分布的离散的统计特征有极差R和标准差S。

●极差R

极差是度量样本数据范围的量，设Xmax和Xmin分别为样本数据的极大值和极小值，它的计算如下式：

R=Xmax-Xmin

从上式可看出，极差没有充分反映全部数据所提供的信息，因此反映实际情况的准确性较差。

●标准差S

设样本的个体数据为X1，X2，…，Xn，则X1-X，X2-X，…Xn-X反映了多个值Xi与样本平均值X的差异这个差异（Xi-X）称为离差，若用离差的和的均值来反映样本的离散程度，即1/nΣ（Xi-X），那么将可能发生其值为0的情况，这样就无法表示离散程度，因而常用离差平方和的平均值——方差，来表示样本的离散程度，方差用符号S来表示计算如下：

2n＿2

S=1/（n-1）Σ（Xi-X）

方差S2的平方根S称为标准差，计算如下：

n＿2

当n<

50时，S=1/（n-1）Σ（Xi-X）

√i=1

当n≥50时，S=1/nΣ（Xi-X）

特别地，当样本容量很小（n≤10）时，标准差也可按下式计算：

S=--------

式中d2是与样本大小有关的常数，可查：

表格：

1.128

1.693

2.050

2.326

2.534

2.704

2.847

2.970

3.078

三、产品质量的波动和描述

在生产过程中，产品的加工尺寸的波动是不可避免的。

它是由人、机器、材料、方法和环境等基本因素波动影响所致。

因此消除波动不是质量控制的目的，同时也是不可能的。

人们只能衡量、预测和控制波动。

波动分为两种：

正常波动和异常波动

●正常波动是偶然性原因（不可避免因素）造成的。

它对产品质量影响较小，在技术上难以清除.在经济上也不值得清除。

●异常波动是由系统原因（异常因素）造成的。

它对产品质量影响很大，但能够采取措施避免和清除。

工序控制就是消除、避免异常波动，使工序处于正常波动。

在工序控制中，产品质量的波动是正常还是异常，最终是相对零件的尺寸要求（公差范围）而言的。

产品质量的波动是服从正态分布的。

关于正态分布的知识前面己经介绍过了，现在的关键就是要知道μ和σ。

数理统计知识告诉我们：

若某一时刻测得的n个零件尺寸为X1、X2、……Xn，则μ和σ根据下面公式推算：

＿

μ≈Xσ≈S

关于X、S的算法前面已介绍过了。

＿

现在我们知道了μ和σ或者说X和S，但是还不能用于实际。

因为随机变量X的取值范围为（-∞，+∞）。

据前面介绍知：

＿＿

P1=P{X∈（X-3S，X+3S）}=99.73%=0.9973≈1

＿＿

P2=P{X∈（-∞，X-3S）U（X+3S，+∞）}=1-P1=0.0027≈0

因此我们暂时约定，从该时刻起的某一时间内，零件尺寸的计量值只能在（X-3S，X+3S）区间上，其它可能性是不存在的。

＿＿＿＿

总体的分布情况为何采用区域（X-3S，X+3S）而不是（X-4S，X+4S）呢？

由前面的叙述我们己经知道：

用区域（X-4S，X+4S）的正态分布来描述总体的分布情况比用区域（X-3S，X+3S）的正态分布来得更可靠、准确。

因为：

P{X∈（X-4S，X+4S）}=0.999936大于

P{X∈（X-3S，X+3S）}=0.9973

既然如此，为何还是采用区域为（X-3S，X+3S）正态分布来描述总体的分布情况呢？

这主要是出于经济方面的考虑。

我们已经知道S是由机器本身的内在质量决定的。

S大的机器和S小的机器的价格差是很大的，因为它们直接影响了产品的质量和质量的稳定性。

相对而言，用（X-3S，X+3S）区域来描述总体的分布情况是有些不足；

但还是较准确、可靠的。

这些不足一般我们是通过以下措施来补救的：

（1）提高抽样频率，也就是两次抽样的间隔时间缩短。

（2）机器的调整（包括刀具、夹具等）频率增加。

其实，以上两种措施归很结底都是由机器的本身质量决定的，因此我们首先要了解它的性能。

这样，这种有区域的正态分布就可运用于工业生产中的质量控制或者工序控制中。

如图表2-1示，在工序控制中我们所关心的就是6*S（分散度，又叫重复性）和X（位置度，又称精确性）。

6*S一般由机器本身的内在质量决定的，X是由机器的刀具等调整决定的。

图2-1

为什么既要关心重复性又要关心精确性呢？

如图2-2示，To是上公差。

a、b、c、d四图表示了4个时刻的产品质量的波动情况。

图2-2

很显然a图的波动情况很好，b图是尽管重复性好，但精确性不好，阴影部分表示了废品情况。

c图尽管精确性很好，但是重复性不好。

因为这样工序就没有变动的余地了。

d图同c图一样，尽管精确性很好，但是重复性不好，已出现了废品。

四、测量系列（结果）的记录形式

抽样试验的测量结果可以用各种不同的形式表达。

1.记录原始数据

优点：

测量值被精确地记下，并且以正确的次序记录

缺点：

花费时间，不直观

2.数据束

直观，比较易于粗略大致估计

测量顺序不能完全表示出来，在数据处理时必须读出测量值

3.划线记录表（分组测量）

直观，对一些特征数据能粗略地进行粗略的估计评价，在数据处理时只输入频次，而不是原始数据。

不能精确地分析评价，不能根据输入的顺序来分析判定。

4.划线记录表（计数测量）

直观；

可用统计法分析评价，可对一些特征数据评价

不能对油漆缺陷最多的部位作出判别

5.缺陷种类划线记录表

能抓住重点，可进行柏拉图分析

难以计算统计特征值。

第三章机器能力系数的测试

一、影响加工质量的各种因素

众所周知，机械加工始终受到各种不断变化的因素的影响。

比如：

短时间的电流过大、环境温度太高或过低、毛坯材料有缺陷等等。

这些因素都直接影响到加工和加工的质量。

为此，我们将各种影响因素加以分类，以便识别和区分，并采取相应的措施，避免这些因素对机器能力系数的测试产生不利的影响，从而保证测试的真实性，准确性。

对此，我们有两种分类方法，在本章节内我们将一一做介绍。

A.第一种分类方法

在这种分类方法中，我们把影响因素分为偶然的影响因素和系统的影响因素。

所谓的偶然影响因素是指事先无法预见，事后在短时间内难以采取一定的措施去排除的影响因素。

而系统影响因素则是指事先可以预见，并可以采取一定的措施去避免其影响的一种影响因素。

●下面我们举一个实例加以说明：

例：

车削一根轴

偶然影响因素系统影响因素

——轴承间隙——轴承间隙

——操作者当天的身心状态——材料种类（如：

塑料、铝、钢）

——突然的穿堂风——温差（冬天或夏天）

——材料的波动（如：

强度）——操作者的素质

——机器的结构形式（如：

刚度、精度）

在此例中，轴承间隙既作为偶然影响又作为系统影响。

这一点可以从左边的图中清楚地看出：

7点至8点之间机器刚开始不久，机器还不热，故间隙始终较小。

9点至10点机器已经发热，故间隙变得较大。

8点至9点之间处于不稳定状态，其原因不明。

在7点至8点和9点至10点之间，轴承间隙的大小是可以预料的，可以采取一定的调整措施。

而8点至9点之间轴承间隙的变化原因不明，无法采取相应的措施。

在这例子中可以看出，7点至8点和9点至10点之间轴承间隙的变化为系统影响，而8点至9点之间轴承间隙的变化为偶然影响。

B.第二种分类方法

第二种分类方法认为，一个确定的工序受五大因素影响，它们直接影响加工工序的结果——一个产品、一个部件、一个零件等等。

这五个因素如下：

人的影响因素（Mensch）例如：

没有及时更换刀具

材料的影响因素（Material）例如：

不同的批量，钢材、铸件等

机器的影响因素（Maschine）例如：

轴承间隙太大

环境的影响因素（Mitwelt）例如：

噪声很大

方法的影响因素（Methode）例如：

不合理的加工方法

在机器能力测试中，我们应该把握住以上M中的四个M，只对其中M即机器产生影响的情况下进行机器能力的测试。

在本章中我们只考虑机器本身的影响因素，而其他因素对机器的影响受到应有的控制。

二、机器能力系数的测试

A.机器能力系数测试的前提条件：

在什么情况下要对机器能力进行测试?

回答是，在很多情况下部要进行机器能力系数测试，但是，最重要的情况有两种：

（1）在最终认可以前，证明新设备是合格的；

或者

（2）确定工序中新发现的造成工序异常波动的原因。

前提条件：

（1）在机器能力测试中使用的零件毛坯应从同一供货厂商处购买，并要求其材料相同，由同一浇铸模铸成或由同一套模具配套件制成。

（2）前一道工序（前一台机床）所加工出的零件应符合设计和加工要求，其尺寸须符合公差要求。

（3）对于所选取的零件数目有如下规定：

连续地测量每个产品规格中的50个零件以某种特定的方式记录下来。

（如连续的序数）

（4）如果一台机床可以加工两种以上的零件，或者是零件编号不同的同种零件，则对其加工的每一种规格的零件都要求做机器能力的测试。

（5）在机器能力测试前，如果刀具是未曾使用过的刀具，则要求先用去刀具总寿命的5——10%（因为新的刀具的磨损剧烈，故而加工出的产品尺寸极不稳定，当用去刀具总寿命的5——10%以后；

刀具磨损程度平缓，零件的加工尺寸稳定）。

（6）在机器能力测试中所使用的刀具必须是按照公司标准制造的刀具，而不用供货商提供的刀具。

（7）在机器能力测试开始之前，必须把可调整的刀具调整到公差中值。

（8）在机器能力测试中不允许调整或更换刀具。

（9）在机器能力测试中如果出现机械故障，如测试中刀具损坏、停电，则必须重新开始测试。

（10）机器能力测试只允许在已经预热0.5——1小时的机器上进行，对不同的机器来说预热的情况是不同的。

（11）在机器能力测试中，对零件的测量必须按照规定在某个确定的位置上测量。

（12）在统计卡上用连续的对应于加工顺

展开阅读全文