在物理学和工程学等领域,偏微分方程(PDEs)被用来模拟复杂的物理过程,以便深入了解世界上一些最复杂的物理和自然系统的运行方式。
为了解决这些困难的方程,研究人员使用高保真度的数值求解器,但这些求解器的运行非常耗时和计算资源消耗大。目前的简化替代方法是使用数据驱动的代理模型,计算PDEs解的目标属性而不是整个解。这些模型是在由高保真度求解器生成的一组数据上进行训练的,以预测新输入的PDEs的输出。这种方法需要大量的数据和高昂的成本,因为复杂的物理系统需要大量的模拟来生成足够的数据。
在一篇名为《物理增强的深度代理模型用于偏微分方程》的新论文中,提出了一种新的方法,用于开发复杂物理系统(如力学、光学、热传导、流体动力学、物理化学和气候模型)中的数据驱动代理模型。
该论文由麻省理工学院应用数学教授Steven G. Johnson与麻省理工学院-IBM Watson AI实验室和IBM研究院的Payel Das和Youssef Mroueh,以及Julia Lab的Chris Rackauckas和前麻省理工学院博士后、现任乔治亚理工学院的Raphaël Pestourie共同撰写。作者们将他们的方法称为“物理增强的深度代理”(PEDS),它将低保真度的可解释物理模拟器与神经网络生成器相结合。神经网络生成器经过端到端的训练,以匹配高保真度数值求解器的输出。
Pestourie表示:“我的愿望是用系统化的、计算机辅助的模拟和优化方法取代低效的试错过程。像ChatGPT这样的人工智能最新突破依赖于数百亿个参数,并需要大量的资源进行训练和评估。相比之下,PEDS对所有人来说都是可负担的,因为它在计算资源上非常高效,并且在基础设施方面的门槛非常低。”
在文章中,他们展示了PEDS代理模型可以比有限数据(约1000个训练点)的前馈神经网络集合更准确,同时将训练数据需求减少至少100倍,以达到5%的目标误差。这种科学机器学习方法使用麻省理工学院设计的Julia编程语言开发,因此在计算和数据方面都非常高效。
作者还报告说,PEDS提供了一种通用的、数据驱动的策略,用于弥合简化物理模型与模拟复杂系统的蛮力数值求解器之间的差距。这种技术提供了准确性、速度、数据效率和对过程的物理洞察力。
Pestourie表示:“自2000年以来,随着计算能力的提高,科学模型的趋势是增加参数以更好地拟合数据,有时以较低的预测准确性为代价。PEDS则通过聪明地选择参数来做相反的事情。它利用自动微分技术训练神经网络,使得具有少量参数的模型更加准确。”
Pestourie说:“阻碍代理模型在工程领域更广泛应用的主要挑战是维度灾难——所需的训练数据随着模型变量的数量呈指数增长。PEDS通过将数据和领域知识以低保真度模型求解器的形式结合起来,减少了这种灾难。”
研究人员表示,PEDS有潜力恢复2000年前的一整套专门用于最小模型的文献,而PEDS可以使这些直观模型更加准确,并且对代理模型应用具有预测能力。
Das表示:“PEDS框架的应用超出了我们在这项研究中展示的范围。受偏微分方程控制的复杂物理系统无处不在,从气候模拟到地震模拟等等。我们基于物理启发的快速和可解释的代理模型将在这些应用中发挥重要作用,并与其他新兴技术(如基础模型)相辅相成。”
该研究得到了麻省理工学院-IBM Watson AI实验室和美国陆军研究办公室通过士兵纳米技术研究所的支持。