先让我们来描绘一幅画面,假设你是一家汽车制造商,你意识到对燃油效率的日益增长的需求正在推动整个行业朝着能够降低燃油消耗且符合更严格的政府排放法规的新型发动机设计方向发展。为了适应这一趋势,你必须遵循行业标准,同时依赖实验原型设计和数值模拟这些开发工具。随着你对数值模拟的深入了解,你发现有两种方法可供选择,于是你开始深入探索这两种方法。
实验设计(DoE)技术通过大量模拟来探索设计空间,并创建响应面以优化结果。这种方法允许你同时运行大量算例,从而实现快速的设计周期。然而,传统的基于线性回归的响应面方法(RSM)无法捕捉发动机燃烧中的复杂非线性特性。第二种选择是应用遗传算法(GAs),它通过在多代计算中进行多次模拟来优化设计。研究表明,遗传算法方法在探索最优设计策略方面非常有效,但通常需要经过许多代才能收敛,从而导致设计周期延长,甚至可能长达数月。
因此你面临着一个艰难的抉择。你面前有两种方案:一种可以在合理的时间内解决问题,但可能会错过最优解;另一种虽然稳健,但计算成本高昂。
数据的力量
于是、机器学习(ML:Machine Learning)优化应运而生。它拥有快速的项目周期、成本效益以及对整个设计空间的全面探索等多种优势,是该领域的一种革命性技术。基于DoE数据训练后机器学习模型可以获取传统顺序优化方法无法获得的大量信息。借助足够复杂的机器学习模型,你可以在保持优化周期较短的同时,捕捉到仅靠DoE无法实现的非线性特性。
在CONVERGE可完成整个流程
在CONVERGE早期版本中,优化计算可以通过遗传优化(CONGO)工具实现,用户可以运行遗传算法优化或DoE探究研究。遗传算法采用“适者生存”的方式来优化设计,随机生成输入参数以创建具有最大用户定义价值函数的样本群体。
2024年下半年,我们在CONVERGE Studio中发布了一个用于快速优化的机器学习工具。首先,用户需要确定在优化研究中希望变化的参数(例如喷射压力、EGR率),并定义用于评估模拟结果价值的性能指标(例如油耗最小化、氮氧化物排放最小化)。然后,该工具将通过系统地生成一组覆盖设计空间的输入变量来初始化DoE,用于CONVERGE模拟。用户可以采用拉丁超立方采样方法来最大化DoE样本点之间的最小距离,从而生成一种准随机样本。与随机样本相比,它能更好地捕捉底层数据分布。在为DoE生成输入文件后,CONVERGE用户可以在HPC平台上运行这些算例。
然后,DoE的结果可以作为机器学习模型的训练数据。由于无法预先确定最适合特定数据集的机器学习算法,该工具将通过综合学习结合几种不同的算法,包括:ridge regression, random forest, gradient boosting, support vector machine, and neural network。这种机器学习元模型将识别出最适合模拟CFD结果的五种算法的组合。然后,你可以使用训练好的机器学习元模型来预测最优方案,并根据你预定义的性能指标进行评估。最后,你可以在CONVERGE中运行预测的最优方案以确认结果的可靠性。
机器学习工具提供了一个快速且准确的简易优化流程。正在方法的目标并不是用机器学习取代CFD,而是将机器学习与CFD结合使用,以实现快速的基于优化的设计。该流程的简化示意图如图1所示。
图1. CONVERGE机器学习工具的示意图。
机器学习优化的实践应用
CONVEGE的机器学习工具可以在用户自定义函数(UDF)中调用,并用于多种目的,如降阶分析。但其主要目标是进行设计优化。它的灵活性和易用性使其能够处理大量数据,揭示细微的模型特性,并最终获得具有可行性的方案。
Polaris公司排气道优化
为了提高内燃机的效率,我们在2021年与Polaris和Oracle云合作,将机器学习(ML)、计算流体动力学(CFD)和高性能计算(HPC)相结合,开展了一项排气道优化研究。
在确定了五个需要变化的排气道参数并对几何形状进行参数化后,团队使用拉丁超立方采样方法设置了包含256个案例的DoE。这些案例在不到一天的时间内就在CONVERGE Horizon上完成了计算。我们将DoE生成的大量数据分为两部分:90%用于训练机器学习模型,10%用于验证。这种两步法确保了机器学习模型能够真正实现预测功能,而不仅仅是重复DoE的数据。在确认了机器学习模型的有效性之后,团队利用训练好的模型预测出能够最小化排气道泵气功的最优案例。这项优化研究实现了排气道效率的有效提升。如果采用传统方法——通过实验优化,成本会高得多,且耗时也会显著增加。然而,得益于机器学习和高性能计算的应用,这项研究仅用了数天时间就完成了,而不是几个月。
图2. 排气道优化几何和流场
风电场布局优化
风能是全球可持续发展议程的基石,因为它提供了一种对环境影响极小的可再生能源。风力发电技术的进步使得大规模风机阵列发电场的建立成为可能,其发电量比单个风机显著增加。
风电场的布局会影响整体电量产出、运行效率和项目总成本。在一个布局不佳的风电场中,上游风机产生的尾流效应可能会降低下游风机的性能。在这种情况下,机器学习(ML)可以通过准确预测涡轮机之间的相互作用来优化风电场风机布局,从而确保每台风机都能获得最佳的风流。
在风速恒定的条件下,对一个包含25台NREL 5MW风机的风电场,CONVERGE的机器学习工具优化了中间位置五台风机的布局,以实现发电量最大化。通过设计实验(DoE)研究生成的数据训练综合机器学习模型,该模型用于预测最优布局。在1分钟内完成训练的机器学习模型返回了四种最优布局方案,这些方案最后在CONVERGE进行计算以确认产生最多电力的配置。图3展示了优化后的风电场布局。可以看到,中间这一排的风机呈交错排列。
图3. 风电场最优布局方案:中间一排风机交错排列。
总结
从以上案例中我们可以看到,CONVERGE内置的机器学习工具不仅有潜力彻底改变发动机仿真行业,还能在风电场布局和降阶分析等应用中提供重要的价值。通过使用设计实验(DoE)数据训练模型,用户可以全面了解整个设计空间,并发现以前难以触及的隐藏模式。凭借CONVERGE机器学习工具的速度和灵活性,用户不再需要在快速获得结果和准确性之间做出权衡——而是可以两者兼得。
参考文献:
[1] Pei, Y., Pal, P., Zhang, Y., Traver, M., Cleary, D., Futterer, C., Brenner, M., Probst, D., and Som, S., “CFD-Guided Combustion System Optimization of a Gasoline Range Fuel in a Heavy-Duty Compression Ignition Engine Using Automatic Piston Geometry Generation and a Supercomputer,” SAE Technical Paper 2019-01-0001, 2019, doi:10.4271/2019-01-0001.
[2] Moiz, A.A., Pal, P., Probst, D., Pei, Y., Zhang, Y., Som, S., and Kodavasal, J., “A Machine Learning-Genetic Algorithm (ML-GA) Approach for Rapid Optimization Using High-Performance Computing,” SAE Technical Paper 2018-01-0190, 2018, doi:10.4271/2018-01-0190