MINITAB技术.docx

资源描述

MINITAB技术.docx

《MINITAB技术.docx》由会员分享，可在线阅读，更多相关《MINITAB技术.docx（20页珍藏版）》请在冰豆网上搜索。

MINITAB技术.docx

MINITAB技术

MINITAB-16技术汇总

一、箱线图

箱线图可从一个阶段（前半年）到下一个阶段（后半年）的状态提升，显示直观的效果图，例如缺陷数的箱线图，图1为源数据，图2为选择项，图3为结果图，下文不特殊说明，每种技术3张图均为以上设置。

图1

图2

图3

鼠标悬停在箱体内，可以显示中位数、四分卫数和均值箱体框，这里以不同阶段的缺陷数为例，从上图可以清晰看见缺陷数的改进提升效果。

二、控制图

2.1标准控制图

控制图的使用方法非常简单，均值、上限（均值+3倍标准差），下限（均值-3倍标准差），下限因为是单纯的减法，所以可能导致某些数据为负（此种情况通常出现在标准差较大），可以通过控制图中的设置将下限设置为0，即下限不会出现负数的情况。

这里以需求阶段生产率为例，见下图：

图1

图2

图3

控制图的判异原则一般有，1）点子出界、2）6点都呈现往上或下、3）9点都在同一侧，4）14点交替上升下降。

2.2分阶段控制图

本章具体介绍控制图和分阶段的控制图，以下为分阶段的控制图介绍：

分阶段的控制图，具体好处是直观的显示稳定的生产率之前和之后的比较，数据的律动情况和上下限都能一目了然。

图1

图2

图3

从以上图形，可以明显看出之前和之后的标准差、均值对比，对两阶段的不同图形也能直观反映在同一张控制图上，对于过程改进的之前和之后效果图，尤为直观。

三、正态分布图

正态分布，作为检验一组数据是否呈正态分布，一般是SPC（统计过程控制）的先导步骤。

图1

源数据省略

图2

图3

从上图可见，P值=0.172>0.05，所以总生产率是呈正态分布的。

四、单因子方差分析

单因子方差分析，通常是为了找出Y值到底是受哪种因子影响，这些因子是否可以分组，如果他们是纠缠在一起的一组数据（比如各因子没有呈现单独的关系），那么可能需要继续往下探究各个因子的子因子是否能够分组，如果到了最低层的因子依然没有呈现显著的不同，那么这组数据就需要舍弃掉，因为他们是同一类的数据。

MINITAB中X值通常以数字代表进行分析，比如下例中我们需要洞察生产率是否受行业、模型和编程语言的分组影响，那么我们就将客户行业设置为1，模型设置为2，编程语言设置为3。

图1

Y值=生产率

X值分别=客户行业、生命周期模型、不同的编程语言

图2

图3

总生产率与客户行业

来源自由度SSMSFP

客户行业26863430.270.763

误差54680641260

合计5668750

S=35.50R-Sq=1.00%R-Sq（调整）=0.00%

均值（基于合并标准差）的单组95%置信区间

水平N均值标准差---+---------+---------+---------+------

119190.6728.35（----------------*---------------）

222182.4739.12（--------------*---------------）

316185.9837.82（-----------------*-----------------）

---+---------+---------+---------+------

170180190200

合并标准差=35.50

通过上图可知：

P值=0.763>0.05，所以总生产率和客户行业无关。

五、图形化汇总

图形化汇总，可以从图中清楚的观察到，均值、标准差和百分比的可能性值，对于单值的分析非常适用。

图1

图2

图3

从图形化汇总可见：

最小值和最大值，均值，标准差，正态性检验P值。

六、帕累托分析

帕累托分析，即20/80原则，一般适用于从所有影响因素中找出最关键的几项，通常是百分之二十的因素导致了百分之八十的问题。

图1

源数据省略，一般为单列统计出现的问题次数

图2

图3

七、双样本T检验

双样本T检验，适用于两个过程之间的显著变化统计，用值的形式显示于计算图表中。

图1

源数据省略，一般是不同的两组数据，在过程之前和之后的统计

图2

图3

双样本T检验和置信区间:

2014年前三月验收缺陷率,部署后验收缺陷率

2014年前三月验收缺陷率与部署后验收缺陷率的双样本T

N均值标准差均值标准误

2014年前三月验收缺陷率120.81750.03570.010

部署后验收缺陷率200.56040.04130.0092

差值=mu（2014年前三月验收缺陷率）-mu（部署后验收缺陷率）

差值估计值:

0.2500

差值的95%置信区间:

（0.2216,0.2784）

差值=0（与≠）的T检验:

T值=18.07P值=0.000自由度=26

从上述结果可见P值=0<0.05，所以验收缺陷率在部署前后有显著的变化。

八、卡方检验

卡方检验，当需要比较的两组数据都为离散数时，通常采用卡方检验判断数据组之间是否存在强弱的关系。

图1

源数据省略，当两组数据都为离散型数据时

图2

图3

将Y值和X值分别赋值，例如：

Y=复用率

X=注释问题、代码规范性问题、提交版本问题。

列表统计量:

复用率,提交版本问题

行:

复用率列:

提交版本问题

提交不提交

正确正确全部

低224

高224

中033

全部4711

单元格内容:

计数

Pearson卡方=1.238,DF=2,P值=0.308

似然比卡方=2.310,DF=2,P值=0.189

从以上卡方分析可见，P值=0.308>0.05，所以提交版本问题和复用率没有关系。

列表统计量:

复用率,代码规范性问题

行:

复用率列:

代码规范性问题

不规范规范全部

低224

高224

中033

全部4711

单元格内容:

计数

Pearson卡方=1.362,DF=2,P值=0.035

似然比卡方=2.260,DF=2,P值=0.089

从以上卡方分析可见，P值=0.035<0.05，所以代码规范性问题和复用率有关系。

列表统计量:

复用率,代码注释问题

行:

复用率列:

代码注释问题

注释注释不

正确正确全部

低224

高224

中033

全部4711

单元格内容:

计数

Pearson卡方=1.857,DF=2,P值=0.162

似然比卡方=1.312,DF=2,P值=0.145

从以上卡方分析可见，P值=0.162>0.05，所以代码注释问题和复用率没有关系。

九、过程能力指数CPK

过程能力指数CPK，一般为判断实际的过程能力是否达到了组织的目标，或者客户声音的一种判断图形。

图1

源数据省略，将实际的过程绩效带入工具，将客户或组织的目标要求设定为CPK的上下限。

图2

图3

通过对项目编码阶段生产率和公司编码能力范围进行CPK分析，可见该项目编码阶段生产率的能力指数CPK=1.27。

说明该项目的编码生产率过程能力指数为强。

CPK判断准则为下图：

这里再对CPK和PPK进行一个差别说明：

关于Cpk与Ppk的关系，这里引用QS9000中PPAP手册中的一句话：

“当可能得到历史的数据或有足够的初始数据来绘制控制图时（至少100个个体样本），可以在过程稳定时计算Cpk。

对于输出满足规格要求且呈可预测图形的长期不稳定过程，应该使用Ppk。

”

所谓PPK，是进入大批量生产前，对小批生产的能力评价，一般要求≥1.67；而CPK，是进入大批量生产后，为保证批量生产下的产品的品质状况不至于下降，且为保证与小批生产具有同样的控制能力，所进行的生产能力的评价，一般要求≥1.33；一般来说，CPK需要借助PPK的控制界限来作控制。

十、拟合回归

拟合回归，一般为制作PPM模型计算不同变量联系的一种技术，该技术提供了变量之间的计算公式。

图1

源数据省略，这里以需求阶段的缺陷数和项目总规模（代码行数）进行拟合回归分析。

图2

响应Y：

项目总规模，预测变量X：

需求阶段缺陷数。

图3

使用Minitab回归拟合分析后，从上图可见，需求阶段质量的回归方程式为：

38.56+0.000475*项目总规模。

标准差预判为：

（75-66）/6=1.5。

十一、相关性分析（Pearson检验）

相关性分析，主要目的是查看两组因子之间是否有联系，通常以Pearson指数来判定他们之间联系的强弱关系，从这点来看，Pearson指数和CPK指数有异曲同工之妙，只是前者是查看相关性强弱的指数，后者是查看过程能力的指数。

图一

图二

图三