科学家们使用生成式人工智能来回答物理学中的复杂问题。

当水冷冻时,它从液态相转变为固态相,导致密度和体积等性质发生剧变。水的相变是如此常见,以至于我们大多数人可能都没有意识到,但是对于新材料或复杂物理系统中的相变来说,这是一个重要的研究领域。

为了充分理解这些系统,科学家必须能够识别相位并检测相变。但是,如何量化未知系统中的相变通常不清楚,特别是当数据稀缺时。

来自麻省理工学院和瑞士巴塞尔大学的研究人员应用生成式人工智能模型解决了这个问题,开发出一种新的机器学习框架,可以自动绘制新型物理系统的相图。

他们的物理学知识驱动的机器学习方法比依赖理论专业知识的费力、手动技术更高效。重要的是,由于他们的方法利用了生成模型,因此不需要其他机器学习技术中使用的大规模标记训练数据集。

这样的框架可以帮助科学家研究新材料的热力学性质或检测量子系统中的纠缠。最终,这种技术可能使科学家能够自主地发现未知的物质相。

“如果你有一个完全未知属性的新系统,你会选择研究哪个可观测量呢?至少对于数据驱动的工具来说,希望是你可以自动地扫描大型新系统,并指导你找到系统中的重要变化。这可能是自动科学发现新奇相属性的流程中的一个工具,”该方法的合著者、计算机科学与人工智能实验室(CSAIL)Julia实验室的博士后研究员Frank Schäfer说。

与Schäfer共同撰写这篇论文的是巴塞尔大学的研究生Julian Arnold,麻省理工学院数学系应用数学教授、Julia实验室负责人Alan Edelman,以及巴塞尔大学物理系教授Christoph Bruder。这项研究发表在《物理评论快报》上。

使用人工智能检测相变

虽然水转变为冰可能是相变最明显的例子之一,但对于科学家来说,更奇特的相变,比如材料从正常导体转变为超导体,也是非常感兴趣的。

通过识别“序参量”,可以检测到这些相变,序参量是一个重要且预计会发生变化的量。例如,当水的温度降到摄氏零度以下时,它会冻结并转变为固态(冰)。在这种情况下,一个合适的序参量可以定义为晶格中的水分子与处于无序状态的水分子的比例。

过去,研究人员依靠物理学专业知识手动构建相图,依靠理论理解来确定哪些序参量是重要的。这不仅对于复杂系统来说很繁琐,对于具有新行为的未知系统来说可能是不可能的,而且还会引入人为偏见。

最近,研究人员开始使用机器学习构建判别分类器,通过学习将测量统计量分类为物理系统的特定相位,就像这些模型将图像分类为猫或狗一样。

麻省理工学院的研究人员演示了生成模型如何更高效地解决这个分类任务,并且以符合物理学的方式进行。

麻省理工学院的计算机科学与人工智能实验室(CSAIL)Julia实验室的博士后研究员Frank Schäfer补充说,麻省理工学院的线性代数入门课程中使用的流行科学计算语言Julia提供了许多工具,使其在构建这种生成模型方面非常有价值。

生成模型,如ChatGPT和Dall-E所基于的模型,通常通过估计一些数据的概率分布来工作,然后使用该分布生成符合分布的新数据点(例如类似于现有猫图像的新猫图像)。

然而,当使用经过验证的科学技术对物理系统进行模拟时,研究人员可以免费获得其概率分布的模型。这个分布描述了物理系统的测量统计量。

更具知识性的模型

麻省理工学院团队的洞察是,这个概率分布也定义了一个生成模型,可以构建一个分类器。他们将生成模型插入标准统计公式中,直接构建分类器,而不是像判别方法那样从样本中学习。

“这是一种非常好的方式,将你对物理系统的了解深入到你的机器学习方案中。它远远超出了对数据样本进行特征工程或简单归纳偏见的范畴,”Schäfer说。

这个生成分类器可以根据温度或压力等参数确定系统处于哪个相位。由于研究人员直接近似物理系统测量的概率分布,分类器具有系统知识。

这使得他们的方法比其他机器学习技术更好地发挥作用。由于它可以自动工作,无需进行大量训练,因此他们的方法显著提高了识别相变的计算效率。

最终,类似于向ChatGPT提问解决数学问题的方式,研究人员可以向生成分类器提问,比如“这个样本属于I相还是II相?”或“这个样本是在高温还是低温下生成的?”

科学家还可以使用这种方法解决物理系统中的不同二元分类任务,可能用于检测量子系统中的纠缠(状态是否纠缠?)或确定理论A或B是否最适合解决特定问题。他们还可以使用这种方法通过确定如何调整某些参数来改进ChatGPT等大型语言模型的理解和性能,以便聊天机器人提供最佳输出。

未来,研究人员还希望研究关于有效检测相变所需的测量数量以及所需计算量的理论保证。

这项工作部分得到了瑞士国家科学基金会、麻省理工学院瑞士洛克希德·马丁种子基金和麻省理工学院国际科学与技术计划的资助。