【7.7.1.】DoE
一、什么是DoE?为什么选择DoE?
DOE(Design of Experiments) 是指通过系统性的一系列实验,其中有针对性地对输入因子进行更改,以便可以确定输出响应中发生重大更改的原因。
我们在工程学和科学学科中有关产品和过程的许多知识都来自实验。实验是系统地进行的一系列测试,目的是增进对现有过程的了解或探索新产品或过程。因此,实验设计(DOE)是开发实验策略的工具,该策略可以使用最少的资源来最大程度地提高学习效果。DOE被广泛应用于许多领域,并在所有自然科学和社会科学中得到广泛应用。它被参与改进制造工艺的工程师和科学家广泛使用,以最大程度地提高产量并减少可变性。
在实验设计中往往同时需要测试多个变量对结果的影响,帮助工程师在目标结果设定的范围内决定用什么条件变量获得所需要的结果。
随着现代技术的进步,产品和工艺变得异常复杂。随着实验成本的快速上涨,对于已经受到资源和时间限制的分析师而言,使用试错法研究影响这些复杂过程的众多因素变得越来越困难。取而代之的是,需要一种技术,以最有效的方式识别“很少的”因素,然后将过程引导至最佳设置,以满足不断增长的对提高质量和提高生产率的需求。DOE技术提供了强大而有效的方法来实现这些目标。
二、DOE和OFAT的比较
在应用上,DoE是相对于OFAT(One Factor At a Time)这个概念的实验设计的名称。在自变量A与自变量B同时影响因变量C,且A和B之间互不影响的时候,OFAT是可行的,虽然比较慢,但是如果A与B有叠加效果导致结果C并不会线性变化,那OFAT就会预测错误的结果。DoE比OFAT的实验要高效得多,后者一次只更改一个因素以研究该因素对产品或过程的影响。虽然OFAT很容易理解,但其不能同时考虑多个因素对结果的影响,也就是说它不能考虑因素间的相互作用。通常,交互作用比单个因素的影响更为重要。这是因为产品或过程的应用环境包括许多因素的共同存在,而不是不同因素在不同时间的单独出现。以一个化学过程中两个因素之间相互作用的为例,其中仅增加温度会稍微增加产量,而单独增加压力则没有效果。然而,在较高温度和较高压力的情况下,产率迅速增加。在这种情况下,我们说影响化学反应的两个因素之间存在相互作用。DOE方法论确保系统地研究所有因素及其相互作用。因此,从DOE分析获得的信息比OFAT实验的结果可靠和完整得多。
基于OFAT的传统实验设计:
-
每次实验只考虑一个参数的影响,其它参数都是固定不变的
-
只适用于简单工艺过程,因为它不考虑因素间的相互影响
-
效率低下
-
不能找到真正的最优值(区间)
基于DoE的现代实验设计:
- 一次可以考虑多个参数影响(并行分析)
- 考虑不同因素间的相互影响
- 通过最少的实验次数获得尽可能多的信息
- 能更好的找到系统的最优区间
三、如何用好DOE
目前市面上已经有很多DoE实验设计自动生成和分析的软件,比较常用的有JMP、Minitab和Design Expert等。这些软件都能完成基本的DoE功能,但各软件都有各自的侧重点。比如老牌的JMP非常优秀,但学习曲线非常陡峭,对于非统计学家来说,除非已经学习了很长时间,否则很难上手;Minitab功能很丰富,能做很多不同的事情,但在DoE的深度上和其它两软件比起来稍显欠缺。Design Expert专注于DoE设计,对用户界面友好,设计选项也具有很好的深度和广度,结果显示直观明了,能够为实验人员节省大量的时间,特别是在混合物的配方设计方面能力非常突出。下面我们基于Design Expert介绍DoE的不同阶段和主要类型。
DoE的阶段
01 规划
在着手测试和数据收集之前,请仔细计划实验过程,这一点很重要。在此阶段要牢记一些目标,其中有一个彻底而精确的目标,即确定进行调查的必要性,评估实现该目标所需的时间和资源以及将先验知识整合到实验程序中。应使用由来自与产品或过程相关的不同学科的人员组成的团队来确定可能的因素,以进行调查并确定最合适的应对措施。团队合作可促进协同作用,从而为研究提供更多的因素,从而使实验更加完整。精心计划的实验总是可以增进对产品或过程的了解。
02 筛选
筛选实验用于从大量潜在因素中识别出影响正在研究的系统的重要因素。这些实验是结合系统的先验知识进行的,以消除不重要的因素,并将注意力集中在需要进一步详细分析的关键因素上。筛选实验通常是高效的设计,需要执行几次,而执行的重点不是交互,而是识别关键的几个因素。
03 表征
在选定的研究参数基础上再次设计实验,主要考察参数的影响以及相互作用。
04 优化
如在表征阶段发现响应具有很大的曲率,需要将注意力放到影响过程的这些重要因素上,下一步便是确定这些因素的最佳设置以实现所需的目标。根据所研究的产品或过程,此目标可能是最大化,最小化或实现响应的目标值。
05 确认
最后阶段涉及通过进行一些后续实验来验证因素的最佳设置,以确认系统是否按预期运行并且满足所有目标。
四、 DOE的类型
1. 因子设计
了解筛选或表征研究的主要作用和相互作用。每个因素有两个级别,可最大程度地减少工作量并最大化信息。
2.响应面设计
建立二次(或更高阶)多项式,以对非线性因子-响应关系进行建模。因子的三个以上级别需要更多运行,但需要提供更多信息。
3. 混合设计
响应取决于混合物成分比例的模型配方。需要正确地建模组件之间的依赖关系。
五、软件
Design Expert的特点
参考资料
- https://zhuanlan.zhihu.com/p/364512906?ivk_sa=1024320u
- https://medium.com/m/global-identity-2?redirectUrl=https%3A%2F%2Ftowardsdatascience.com%2Fdesign-your-engineering-experiment-plan-with-a-simple-python-command-35a6ba52fa35
- https://medium.com/m/global-identity-2?redirectUrl=https%3A%2F%2Ftowardsdatascience.com%2F5-python-tricks-that-distinguish-senior-developers-from-juniors-826d57ab3940
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn