制定一个独特且有前景的研究假设是任何科学家的基本技能。这也可能是一个耗时的过程:新的博士生可能会花费他们课程的第一年来决定究竟要在实验中探索什么。如果人工智能能够提供帮助呢?
麻省理工学院的研究人员创造了一种通过人机协作自主生成和评估各领域有前景的研究假设的方法。在一篇新论文中,他们描述了如何利用这一框架创建与生物启发材料领域未满足的研究需求相一致的证据驱动假设。
该研究于周三在Advanced Materials上发表,由阿里雷扎·加法罗拉希(Alireza Ghafarollahi)和马克斯·比勒(Markus Buehler)共同撰写,前者是原子与分子力学实验室(LAMM)的博士后,后者是麻省理工学院土木与环境工程及机械工程系的杰瑞·麦卡菲工程教授,同时也是LAMM的主任。
研究人员称这一框架为SciAgents,由多个AI代理组成,每个代理具有特定的能力和数据访问权限,利用“图推理”方法,其中AI模型利用知识图谱来组织和定义不同科学概念之间的关系。这种多代理方法模仿了生物系统作为基本构件群体自我组织的方式。比勒指出,这种“分而治之”的原则在生物学的许多层面上都是一个显著的范式,从材料到昆虫群体再到文明——所有这些都是总智能远大于个体能力之和的例子。
比勒说:“通过使用多个AI代理,我们试图模拟科学家社区发现的过程。在麻省理工学院,我们通过让一群不同背景的人一起工作,在咖啡馆或麻省理工学院的无限走廊相遇来实现这一点。但这非常偶然且缓慢。我们的目标是通过探索AI系统是否能够创造性地进行发现来模拟发现的过程。”
自动化好想法
正如最近的发展所示,大型语言模型(LLMs)在回答问题、总结信息和执行简单任务方面表现出令人印象深刻的能力。但在从零开始生成新想法方面,它们的能力相当有限。麻省理工学院的研究人员希望设计一个系统,使AI模型能够执行更复杂的多步骤过程,超越回忆训练期间学到的信息,以推断和创造新知识。
他们方法的基础是本体知识图谱,它组织并连接不同的科学概念。为了制作这些图谱,研究人员将一组科学论文输入生成AI模型。在之前的工作中,比勒使用了一种称为范畴理论的数学领域来帮助AI模型将科学概念发展为图形抽象,根植于定义组件之间的关系,以便通过称为图推理的过程进行其他模型的分析。这使得AI模型能够以更有原则的方式理解概念;它还使它们能够在不同领域之间更好地进行概括。
比勒表示:“这对我们创建以科学为中心的AI模型非常重要,因为科学理论通常根植于可概括的原则,而不仅仅是知识回忆。通过让AI模型以这种方式‘思考’,我们可以超越传统方法,探索AI的更具创造性的用途。”
在最近的论文中,研究人员使用了大约1000项关于生物材料的科学研究,但比勒表示,知识图谱可以使用来自任何领域的更多或更少的研究论文生成。
建立图谱后,研究人员开发了一个用于科学发现的AI系统,多个模型专门在系统中扮演特定角色。大多数组件基于OpenAI的ChatGPT-4系列模型,并利用了一种称为上下文学习的技术,其中提示提供有关模型在系统中角色的上下文信息,同时允许其从提供的数据中学习。
框架中的各个代理相互作用,共同解决一个复杂的问题,而单独的代理无法完成。它们的第一个任务是生成研究假设。在从知识图谱定义子图后,LLM的交互开始,这可以随机发生或通过手动输入论文中讨论的一对关键词来实现。
在框架中,研究人员命名为“本体论者”的语言模型负责定义论文中的科学术语并检查它们之间的联系,充实知识图谱。然后,一个名为“科学家1”的模型根据其发现意外特性和新颖性的能力等因素制定研究提案。该提案包括对潜在发现的讨论、研究的影响以及对潜在作用机制的猜测。一个“科学家2”模型扩展了这个想法,建议具体的实验和模拟方法,并提出其他改进。最后,一个“评论者”模型强调其优缺点并建议进一步改进。
比勒说:“这就是建立一个专家团队的过程,他们并不都是以相同的方式思考。他们必须以不同的方式思考,并具备不同的能力。评论者代理被故意编程为批评其他代理,因此你不会让每个人都同意并说这是个好主意。你会有一个代理说,‘这里有一个弱点,你能更好地解释吗?’这使得输出与单一模型的结果大相径庭。”
系统中的其他代理能够搜索现有文献,这为系统提供了一种不仅评估可行性,还创建和评估每个想法的新颖性的方法。
增强系统的能力
为了验证他们的方法,比勒和加法罗拉希基于“丝绸”和“能源密集型”这两个词构建了一个知识图谱。利用该框架,“科学家1”模型提出将丝绸与蒲公英基颜料结合,以创建具有增强光学和机械性能的生物材料。该模型预测该材料将比传统丝绸材料强度显著更高,并且加工所需的能量更少。
科学家2随后提出建议,例如使用特定的分子动力学模拟工具来探索所提议材料的相互作用,并补充说,该材料的一个良好应用是生物启发的粘合剂。评论者模型随后强调了所提材料的几个优点和改进领域,例如其可扩展性、长期稳定性以及溶剂使用的环境影响。为了解决这些问题,评论者建议进行工艺验证的试点研究,并对材料耐久性进行严格分析。
研究人员还进行了其他实验,使用随机选择的关键词,产生了关于更高效的仿生微流控芯片、增强胶原蛋白基支架的机械性能以及石墨烯与淀粉样纤维相互作用以创建生物电子设备的各种原创假设。
加法罗拉希说:“该系统能够基于知识图谱的路径提出这些新的、严谨的想法。在新颖性和适用性方面,这些材料似乎是稳健且新颖的。在未来的工作中,我们将生成数千或数万个新的研究想法,然后我们可以对它们进行分类,尝试更好地理解这些材料是如何生成的,以及如何进一步改进。”
展望未来,研究人员希望将新的信息检索和模拟工具纳入他们的框架中。他们还可以轻松地将框架中的基础模型替换为更先进的模型,使系统能够随着AI最新创新的适应而变化。
比勒说:“由于这些代理的相互作用,一个模型的改进,即使是微小的,也会对系统的整体行为和输出产生巨大影响。”
自从发布了包含其方法的开源细节的预印本以来,研究人员已收到数百人联系,表示有兴趣在不同科学领域甚至金融和网络安全等领域使用这些框架。
比勒说:“有很多事情可以在不去实验室的情况下完成。你基本上希望在过程的最后阶段才去实验室。实验室是昂贵的,耗时,因此你希望有一个系统能够深入挖掘最佳想法,制定最佳假设并准确预测新兴行为。我们的愿景是使这一过程易于使用,这样你就可以使用应用程序引入其他想法或拖入数据集,以真正挑战模型进行新的发现。”