JMP实验设计.docx
《JMP实验设计.docx》由会员分享,可在线阅读,更多相关《JMP实验设计.docx(33页珍藏版)》请在冰豆网上搜索。
JMP实验设计
JMP实验设计
实验设计方式及其在国内的应用
随着改革开放的深切,以市场经济为代表的西方先进文明及其方式论愈来愈多被国内企业界所接纳。
在质量治理、产品(医药,化工产品,食物,高科技产品,国防等)研发、流程改良等领域,统计方式愈来愈多成为企业运营的标准配置。
实验设计作为质量治理领域相对复杂、高级的统计方式应用,也开始在国内被慢慢同意,推行。
其实实验设计关于我国学术界来讲并非陌生。
比如均匀设计,均匀设计是中国统计学家方开泰教授(以下图左)和中科院院士王元初创,是处置多因素多水平实验设计的卓有成效的实验技术,可用较少的实验次数,完成复杂的科研课题开发和研究。
国内一些大学的数学系和统计系最近几年来已经慢慢开始开设专门的实验设计课程,比如清华大学,电子科技大学、复旦大学等高校。
国内一些行业领先的企业,比如中石化,华为科技,中石油,宝钢等企业,也开始在质量治理和产品研发、工艺改良等领域采纳DOE方式。
尽管DOE愈来愈多的被国内产、学、研领域所同意,可是咱们仍是看到,国内关于DOE的研究和推行仍旧停留在比较浅的层次。
以上述企业为例,中石化下属的石化科学研究院和上海石化研究院应该是我国石油化工研究领域的王牌单位了,只是不管是北京的石科院,仍是上海石化研究院,在油品研发、工艺改良、质量治理等领域,关于DOE的利用还仅仅停留在部份因子和正交设计层面。
笔者在网络上查询到电子科技大学的DOE课程目录如下:
教材目录:
第一章正交实验大体方式
第二章正交实验结果的统计分析——方差分析法
第三章多指标问题及正交表在实验设计中的灵活运用
第四章Ltu(tq)型正交表的构造
第五章2k和3k因子设计
第六章优选法基础
第七章回归分析法
第八章正交多项式回归设计
第九章均匀设计法
第十章单纯形优化法
第十一章鲍威尔优化法及应用
第十二章三次设计
第十三章稳固性设计
目前业界常常利用的高端实验设计方式比如定制设计,挑选设计,空间填充设计等高级实验设计方式(AdvancedDOE),不管在国内的统计教学、科研仍是在产业界的应用,都还比较少见,但已有慢慢扩大趋势。
西方企业关于DOE的应用早已大规模开始,比如美国航天、航空设计的顶尖单位,乔治亚宇航设计中心,在开发导弹、战斗机等美国绝密武器系统的时候,无一例外的利用了定制设计(CustomerDesign)。
在民用领域,比如INTEL,惠普,苹果等公司在产品研发和质量提升时期,都利用了高级实验设计方式。
依如实验设计(DOE)方式进展的历程和应用的前后,咱们简单介绍一下什么是高级实验设计方式,和和其相对应的传统实验设计方式。
如以下图所示,传统DOE包括部份因子设计、完全因子设计、响应面设计、扩充设计,混料设计和田口设计。
与此对应,高级DOE那么要紧包括空间填充,非线性和定制设计等。
目前能够实现DOE(实验设计)的专业软件工具不多,其中最权威的当属来自全世界最大的统计软件供给商SAS集团旗下的桌面统计分析软件JMP。
第一,JMP的DOE内容最为完整,除包括部份因子、完全因子、响应面设计、扩充设计,混料设计和田口设计等传统DOE外,还包括空间填充,非线性和定制设计等高级DOE。
第二,JMP的DOE功能最为壮大,除整合传统的统计建模,图形展现等分析方式外,还融入了模拟,I最正确与D最正确比较,简单数据挖掘等独特方式强化分析成效。
再次,JMP的DOE实现最为方便,因子的数量,水平的数量,实验的次数等等都能够自概念,用户能够按如实际问题的要求构建实验,而无需任何修饰。
更进一步,JMP的实验设计中还整合了模拟器(Simulator)功能,用户能够直接对实验所得的新方案进行仿真模拟,以最大限度地减少失败风险。
介绍传统DOE的资料比较多,在此不再赘述,笔者还是将笔墨集中在更高效的高级DOE上。
首先介绍一下空间填充设计(SpaceFilling
Design),它适合于不存在随机误差,但强调操纵系统误差的实验场合。
众所周知,随机化(Randomization)、区组化(Blocking)和仿行(Replication)这三大理念是咱们在做常规实验设计时反复强调的大体原那么,可是当对随机误差的关注远远小于对模型本身的关注时,强调以上三条原那么将不能最充分地利用可用资源。
这时咱们应当关注系统误差,即近似模型与真实数学函数之不同。
空间填充设计的目标确实是限制系统误差。
系统误差的大小与实验点的代表性紧密相关,通过球填充设计、均匀设计和最低潜能等方式,空间填充设计的实验方案能取得最正确的覆盖面,从而为取得信息量最丰硕的实验结果数据以提供决策支持奠定基础。
其次,再来说一说非线性设计,它适用于需要高精度地构建参数为非线性的模型。
在某些工程技术和社会科学的试验设计领域中,常常会遇到非线性模型的研究问题,由于非线分析的复杂性和特殊性,很多人会采用多项式模型近似描述,简化问题。
但是当我们对模型应用的要求较高时,上述的处理方法就显得力不从心了。
其实,关于非线性设计与建模的理论已经逐渐成熟,通过牛顿迭代法等技术允许用户生成非线性最优设计和最优扩充数据,从而拟合参数为非线性的模型。
与标准的多项式模型相比,用此类模型描述相应流程时,能够产生更为精确的流程行为预测,也即模型与实际问题的符合性更好。
最值得一提的还是定制设计,它灵活便捷的设计风格和通用一致的分析模式使众多对传统DOE领域屡战屡败的人眼前一亮,信心大增。
对一般的非统计专业人士来说,单单听到响应面、混料、拉丁超立方等一大堆专业名词就已经如坠云雾了,后面的分析报表就更如天书一般,这样的情形不由得让人对试验设计望而却步,实验设计用最通俗易懂的语言还原实验设计的本质,只要概念了你所研究产品或进程的输入因素和输出响应、目前的实验预算有多少,分析的重点和目的在哪里,定制设计生成器就会设计出最符合你要求的实验打算。
再加上实际的实验数据,具体的分析结果,如模型公式、最正确水平组合等,就生动形象地展此刻你的眼前了。
它冲破了传统DOE“规那么呆板,专业性强”的限制,被许多欧美企业的工程师亲切地称为“能够量文体衣的DOE”。
咱们举一个简单的例子来体会一下定制设计的独特魅力。
例如,在一次市场研究的实验设计中,您想了解目标客户的心理偏好。
其中的功能因子水平包括最差
(1)、中等
(2)和最正确(3),而价钱因子水平包括高
(1)、中
(2)
和低(3)。
依照排列组合的方式共可能有9次水平组合,但事实上在那个例子中公司可能并非情愿在市场上以最低的价钱出售最正确性能的产品,因此您需要在制订实验打算时,就排除功能中的最正确(3)和价钱中的低(3)这一组合。
这时,传统的DOE(不管是全因子设计,仍是部份因子设计等)都无法实现自概念的因子水平约束,由此生成的实验打算缺少现实意义,由此产成的分析结果缺少可信度,而定制设计能够提供拒绝特定因子水平组合的灵活性,巧妙地解决了这种长期困扰DOE用户的难题。
以上方式都能够通过专业软件JMP实现,从而进一步提高利用DOE的工作效率,有爱好的读者不妨一试。
实验设计(DOE)就在你身旁实验设计(DOE)就在你身旁
DOE,即实验设计(DesignOfExperiment),是研究和处置多因子与响应变量关系的一种科学方式。
它通过合理地挑选实验条件,安排实验,并通过对实验数据的分析,从而找出整体最优的改良方案。
从上个世纪20年代费雪(RonaldFisher)在农业实验中第一次提出DOE的概念,到六西格玛治理活着界范围内的蓬勃进展,DOE已经历了80连年的进展历程,在学术界和企业界均取得了高贵的声誉。
可是,由于专业统计分析的复杂性和各个行业的不同性,DOE在很多人眼中慢慢演变成可望而不可及的空中楼阁。
其实,DOE绝不是少数统计学家的专属工具,它很容易成为各类工程技术人员的好朋友、好帮手。
本文将以一个日常生活中的小案例为线索,结合操作便利的专业统计分析软件JMP,帮忙大伙儿揭开DOE的神秘面纱,了解DOE的执行进程,自由地成立属于自我的DOE空间。
案例场景:
相信大伙儿都吃过爆米花,可是大伙儿是不是都了解爆米花的制作进程?
在品尝爆米花的时候,不明白您是不是注意到有很多爆米花没有爆开,也有很多被爆焦。
这两种情形都是生产进程中的质量缺点。
那个地址,咱们基于六西格玛软件JMP来实现咱们的目标:
寻觅利用微波炉加工一包爆玉米花的更佳程序。
凭借体会,咱们很容易就能够够确信重要因子的合理范围:
加工爆玉米花的时刻(介于3至5分钟之间)微波炉利用的火力(介于5至10档之间)利用的玉米品牌(A或B)在爆玉米花时,咱们希望所有(或几乎所有)的玉米粒都爆开了,没有(或很少)玉米粒未爆开。
因此玉米的“爆开个数”是最终关注的重点。
第1步:
概念响应和因子
第2步:
概念因子约束
依照体会,你明白:
不能在实验中长时刻高火力加工爆玉米花,因为如此会烧焦某些玉米粒。
不能在实验中短时刻低火力加工爆玉米花,因为如此只有少数玉米粒爆开。
因此要限制实验,以使加工时刻加上微波炉火力小于等于13,但大于等于10。
第3步:
添加交互作用项
咱们能够推测:
与爆开玉米比例相关的任意因子效应可能取决于某些其它因子的值。
例如,品牌A时刻转变的效应可能大于或小于利用品牌B相同时刻转变的效应。
这种因子表现出的协同效应统称为二因子交互作用。
咱们决定在爆玉米花加工进程的先验模型中纳入所有可能的二因子交互作用。
第4步:
确信实验次数
依照在模型中添加的效应,执行实验需要必然的实验次数。
咱们能够利用最小值、建议值,也能够指定实验次数,只要其值大于最小值。
本例中,咱们将利用默许的实验次数16。
第5步:
制定定输出表格
生成的数据表保留了随机化的特性,显示了咱们应该运行实验的顺序,第一在7级火力下将第一包B牌的玉米加工3分钟,然后在5级火力下将B牌玉米加工5分钟,依次进行。
第6步:
搜集和输入数据
依照设计方案加工爆玉米花。
然后,计算每包中爆开的玉米粒的数量。
最后,保留结果至数据表。
第7步:
分析结果
能够构建数据模型了,一样利用最多见的分析方式——最小二乘法,可是假设是响应数据明显不呈正态散布时,选择广义线形模型法会显得更为适合。
简腹地查看输出报告中的“参数估量”表,觉察所有的p值都小于,说明所有的模型效应,包括一次主因子作用、二次主因子作用和双因子交互作用,均是显著的。
咱们已确认时刻、火力和品牌与爆开玉米粒个数之间存在着紧密关系,要进行进一步研究,能够打开“预测刻画器”,分析因子组合的转变如何阻碍爆开玉米粒的个数。
预测刻画器显示了每一个因子对响应的预测轨迹,移动红色虚线,便能查看更改因子值对响应产生的阻碍。
例如,单击“时刻”图中的红线并左右拖动,当“时刻”值从3转移至5时,“爆开个数”也在发生相应得转变。
同时,随着时刻的增加和减少,时刻和火力预测轨迹的斜率也随之改变,说明确实存在时刻和火力的交互效应。
最后,还能够通过“预测刻画器”寻觅出最优设置,即最合意的设置。
咱们按如实验分析结果而推荐的方式是:
利用A品牌,加工5分钟,并将火力调为级。
实验预测在此种设置下加工,产出的玉米粒445个以上都爆开了。
类似这种爆玉米花的案例在咱们的生活和工作中还有很多很多,有爱好的读者完全能够将平常碰着的问题抽象成一个DOE模型,然后借助JMP如此的专业统计分析软件,轻轻松松地取得问题的解决方案。
初识实验设计(DOE)
其实,DOE对中国人来讲,也不是一个完全崭新的内容。
早在新中国成立初期,华罗庚教授就在我国农业、工业领域大力提倡与普及DOE,只是那时他运用的是另一个名词——优选法。
七十年代末,方开泰教授和王元院士又提出了闻名的“均匀设计”法,这一方式在我国航空航天事业中的导弹设计中取得了庞大成效。
与此同时,“均匀设计”法也在全世界研究DOE理论的学术界取得了高度赞誉。
可是,在将DOE的先进理念和科技方式向各行各业转移,向一样技术人员转移,并转换为高效生产力的道路上,咱们的进展还很有限。
通过“DOE系列之一”咱们已经明白:
DOE与人们的生活及工作紧密相关,在专业六西格玛统计分析软件JMP的帮忙下,把握DOE也再也不是一件难事。
从本质上讲,DOE是如此一门科学:
研究如何以最有效的方式安排实验,通过对实验结果的分析以获取最大信息。
因此,DOE有两大技术支柱:
实验打算和分析方式。
其中,实验打算又能够分为均分设计、因子设计、响应面设计等,分析方式又能够分为极差分析、方差分析、多元回归分析等。
尽管DOE的理论体系中涉及统计分析的专业辞汇很多,但为便于读者明白得,本文包括后续的系列文章将尽可能幸免过量地涉及统计分析的大体概念,而是将以“解决问题的思路”为导向,由浅入深地向读者介绍DOE的理论体系和应用进程。
另外,感激今世高速进展的运算机技术,咱们能够借助六西格玛统计分析软件JMP来实现上述所有的实验设计方案,顺便提一下,JMP是目前唯一能实现上述所有实验设计方案的六西格玛统计分析软件,而且已经面向大中华地域推出中英文双语版软件。
一样的实际问题都是纷繁复杂、千变万化的,可是透过现象看本质,所有实际问题的一路点也能够通过统一的模型来抽象归纳。
图一确实是一个高度简化的进程模型,其中
,
,…
是咱们关切的输出变量,例如质量指标、生产能力和本钱等,通常被称为“响应变量”(Response);
,
,…,
是咱们在工作中能够加以操纵的输入变量,例如人员、设备、原材料、操作方式和环境等,通常被称为“可控因子”(Factor),它们能够是持续型数据,也能够是离散型数据;中间的“黑匣子”是“进程”(Process),在前二者之间起着衔接转换的作用,它与不同行业、不同产品、不同技术紧密相关,但整体都能够用
的数学模型来表示。
那个数学模型的具体表达式越精准,说明咱们对那个进程的明白得越深刻,DOE确实是协助咱们揭露或验证数学模型表达式的利器!
图一进程模型
在某些要求不高的工作环境中,往往不需要用一个复杂的数学表达式来描述进程的全貌,但至少要了解哪个或哪几个因子(X)对响应(Y)的阻碍显著,哪些因子之间存在着彼此阻碍的关系等。
这时,“主因子作用”(MainEffect)和“交互作用”(Interaction)能够帮忙咱们回答这些问题。
在此,不强调具体的计算进程,要紧以视觉成效论述要紧概念。
主因子作用是指一个因子在不同水平下的转变致使响应的平均转变量。
正如图二所示,X在-1和+1两个水平下Y值的落差反映的确实是主因子作用。
交互作用是指当其他因子的水平改变时,一个因子的主因子作用的平均转变量。
正如图三所示,左半部份的因子A对Y的阻碍没有受因子B的转变而转变,两组A与Y的回归直线完全平行,说明因子A与B之间没有任何交互作用;反之,右半部份的因子A对Y的阻碍受因子B的转变而转变,两组A与Y的回归直线明显相交,说明因子A与B之间存在显著的交互作用。
图二主因子作用示用意
图三交互作用示用意
秉承“理论联系实际”的原那么,接下来咱们用一个真实的案例来讲明上述原理的实际意义。
案例场景
一名工程师希望通过减小厚度来改善涡轮叶片质量,第一他想定量地研究在相关的生产进程中,三个最有可能会阻碍厚度的变量:
铸造温度(MoldTemp)、浇注时刻(MoldTime)和放置时刻(SetTime)。
依照DOE理论中最简单的“完全因子设计”,工程师决定开展一个“三因子,两水平,共八次”的现场实验。
实验方案和最终结果如表一所示,试通过主因子作用和交互作用进行分析。
表一涡轮叶片厚度实验记录
铸造温度(C)
浇铸时间(S)
放置时间(M)
厚度(mm)
300
1
1
350
1
1
300
3
1
350
3
1
300
1
2
350
1
2
300
3
3
350
3
3
相关的统计计算能够借助专业六西格玛统计分析软件MP轻松实现,在此不一一详述,重点用形象直观的图形说明分析结果。
图四各因子的主因子作用
图五各因子间的交互作用
由图四可知,铸造温度和浇铸时刻对涡轮叶片的厚度有比较显著的阻碍,而放置时刻那么几乎没有任何阻碍。
由图五可知,铸造温度与浇铸时刻之间、放置时刻与浇铸时刻之间的交互作用比较明显,而铸造温度与放置时刻之间的交互作用那么几乎为零。
通过上述可视化的分析进程,咱们清楚地明白得了该进程中铸造温度和浇铸时刻的正确设置对最终产品质量的重要性。
固然以上只是有关DOE的一个最基础的应用,笔者会在下期文章中进一步与大伙儿交流更深层次的内容。
多因子实验设计(DOE)的魅力
多因子实验设计(DOE)的魅力
通过前面的介绍,咱们已经初步熟悉到了DOE的壮大分析功能。
可是有的读者可能会不以为然:
在此之前的两个案例中因子的数量太少(只有3个),而实际需要解决的问题会复杂得多,涉及的因子数量也可能会很多(至少有6个)。
因此,他就可能会得出一个结论:
DOE只适合于少数因子的问题分析,至于处置多因子问题,那么显得无能为力了。
那个结论显然有失偏颇,其实DOE的一大特点确实是能够处置包括多达50个(并非限于50个)因子的复杂问题,本期的要紧内容确实是向读者介绍多因子DOE的方式。
从理论上讲,上一期的DOE案例实质上采纳的是完全因子设计(FullFactorialDesign),这种方式在因子数量较少的时候实施起来比较方便。
可是正如表一所示,当实验中的因子数量慢慢增加时,实验次数却呈指数增加,庞大的实验规模意味着巨额的实验费用,意味实在施DOE的可行性愈来愈小。
表一完全因子DOE的局限
因子数量
试验次数
2
4
3
8
4
16
5
32
6
64
7
128
8
256
9
512
10
1024
……
……
为了解决那个矛盾,咱们能够用一种更具魅力的方式——部份因子设计(FractionalFactorialDesign)来替代一样的完全因子设计。
顾名思义,部份因子设计源于完全因子设计,是与其对应的完全因子设计中的一部份。
但究竟是哪一部份,是不是能够随机选取?
举一个简单的例子来讲明。
表二显示的是一个完全因子设计的打算表,A、B和C表示三个主因子,+1和-1表示因子的两个不同水平,AB、AC和BC表示二阶交互作用,ABC表示三阶交互作用,总共需要做8次不同的水平组合来完成1次完全因子设计的打算。
表二3因子的完全因子设计打算表
Run
A
B
C
AB
AC
BC
ABC
1
-1
-1
-1
1
1
1
-1
2
1
-1
-1
-1
-1
1
1
3
-1
1
-1
-1
1
-1
1
4
1
1
-1
1
-1
-1
-1
5
-1
-1
1
1
-1
-1
1
6
1
-1
1
-1
1
-1
-1
7
-1
1
1
-1
-1
1
-1
8
1
1
1
1
1
1
1
以上那个实验打算适用于3个或以下因子,可支持8次实验运行的DOE。
假设是增加了第四个因子D,但仍然只能支持8次实验运行时,咱们应该如何办呢?
原先表二中的打算表有8行7列,任意两列间是彼此正交的。
咱们希望增加一列来安排因子D,而且希望此列仍然能与前面各列维持正交性。
数学上能够证明,“找出一个与前7列不同的列而与前3列维持正交”是不可能的。
换句话说,D列必需与第4、五、六、7列中的某列完全相同。
完全相同意味着这两列的效应会被“混杂”(Confounded),即取得计算所得的分析结果后,分不清两种效应各是多少。
衡量之下,咱们以为取D=ABC是最好的安排,因为通常主因子作用与三阶交互作用混杂的可能性最小。
依照上述决定,将D列取值设定与ABC列相同,并将其前移至第4列,能够取得表三所列的打算表
表三4因子的部份因子设计打算表
Run
A
B
C
D
AB
AC
BC
ABC(=D)
1
-1
-1
-1
-1
1
1
1
-1
2
1
-1
-1
1
-1
-1
1
1
3
-1
1
-1
1
-1
1
-1
1
4
1
1
-1
-1
1
-1
-1
-1
5
-1
-1
1
1
1
-1
-1
1
6
1
-1
1
-1
-1
1
-1
-1
7
-1
1
1
-1
-1
-1
1
-1
8
1
1
1
1
1
1
1
1
伶俐的读者必然会猜到还能够利用图二的打算表继续构建出第五、第6乃至第7个因子,但实验的规模仍然保留在8次。
固然,当一样规模的实验中所涉及的因子数量越多时,产生“混杂”的概率会越大,后期分析结果的精准程度也会有所降低。
这确实是实验本钱与分析精度这对矛盾的平稳,也是“部份因子设计”产生的大体原理。
值得一提的是,在制定部份因子设计的具体方案时,没必要如此繁琐地一一推算,成熟的六西格玛统计分析软件JMP早已能够自动地实现了这一功能。
下面咱们想通过一个发生在国外的DOE案例来体会部份因子设计的实际意义。
案例场景:
ACB公司是一家网络公司,要紧为个人用户提供效劳。
近时期以来公司网站的点击数整体偏低,排名在同行业中持续下滑,高层治理层决定通过一个DOE项目找到少数几个关键因素,提高公司网站的每周访问量。
通过初步分析,项目团队觉察关键词的个数、关键词的类型、URL题目、每周的更新频率、关键词在题目中的位置和免费礼物是最具可能性的关键因子。
可是假设是按传统的完全因子设计的思路,至少要做26=64次实验,项目的时刻跨度超过一年,分析结果的价值性大大降低,有什么好方法来克服那个困难呢?
实施:
显然,那个案例用部份因子设计的DOE来实现是再适合只是了。
针对已知的6个关键因子,各取两个最具代表性的水平值,鉴于该项目的要紧目的是寻觅关键因子,选择挑选效率最高的设计方案26-3(=8),不同水平组合时别离运行1周,八周后统计相应的点击数量,结果如表四所示。
表四DOE实施记录
URL
标题
关键词
的个数
关键词
的类型
每周的
更新频率
关键词在标题中的位置
免费
礼物
点击
数
短
5
旧
4
第70个
字符
有
5083
长
5
旧
1
第40个
字符
有
2272
短
10
旧
1
第70个
字符
无
2012
长
10
旧
4
第40个
字符
无
4328
短
5
新
4
第40个
字符
无
6359
长
5
新
1
第70个
字符
无
3676
短
10
新
1
第40个
字符
有
4779
长
10
新
4
第70个
字符
有
6549
接着,专业六西格玛统计分析软件JMP能够帮忙咱们做出具体的定性和定量的分析,不仅如此,它还等借助丰硕生动的图形乃至动画将分析结果展现给咱们。
在此笔者不想强调过量的统计概念,只想用形象直观的图形说明分析结果。
图一主因子作用的Pareto图
图二主因子作用的正态性图
不管是从图一的Pareto图,仍是从图二的正态性图,咱们都能清楚地觉察每周的更新频率和关键词的类型是阻碍点击数的关键因子。
由此可见,在部份因子设计的思想指引