以严谨而灵活的方式创建和验证稳定的AI控制系统

神经网络对于工程师设计机器人控制器产生了巨大的影响,促进了更具适应性和高效性的机器。然而,这些类似大脑的机器学习系统是一把双刃剑:它们的复杂性使它们强大,但也使得很难保证由神经网络驱动的机器人能够安全地完成任务。

验证安全性和稳定性的传统方法是通过称为Lyapunov函数的技术。如果你能找到一个Lyapunov函数,其值始终减少,那么你就可以知道与较高值相关的不安全或不稳定的情况永远不会发生。然而,对于由神经网络控制的机器人来说,以前用于验证Lyapunov条件的方法在复杂机器上的扩展性不佳。

麻省理工学院(MIT)计算机科学与人工智能实验室(CSAIL)和其他地方的研究人员现在开发出了一种在更复杂系统中严格证明Lyapunov计算的技术。他们的算法高效地搜索并验证Lyapunov函数,为系统提供稳定性保证。这种方法有可能实现更复杂的神经网络控制器在现实世界中的安全部署,包括飞机和航天器。

为了超越以前的算法,研究人员找到了训练和验证过程的一种节省成本的捷径。他们生成了更便宜的反例,例如可能使控制器失效的传感器产生的对抗性数据,然后优化机器人系统以适应这些反例。理解这些边界情况帮助机器学习如何处理具有挑战性的情况,使它们能够在比以前更广泛的条件下安全运行。然后,他们开发了一种新颖的验证公式,使得可以使用可扩展的神经网络验证器α,β-CROWN,提供超越反例的严格最坏情况保证。

“我们已经看到了一些由AI控制的机器,如人形机器人和机器狗,在实际应用中取得了令人印象深刻的实证表现,但这些AI控制器缺乏对于安全关键系统至关重要的形式化保证,”麻省理工学院电气工程和计算机科学(EECS)博士生、CSAIL成员、该项目的共同主要作者之一杨璐洁说道,与丰田研究所研究员戴宏凯合作撰写了一篇新论文。“我们的工作弥合了神经网络控制器的性能水平与在现实世界中部署更复杂的神经网络控制器所需的安全保证之间的差距。”杨璐洁指出。

为了进行数字演示,团队模拟了一个带有激光雷达传感器的四旋翼无人机在二维环境中的稳定。他们的算法成功地将无人机引导到稳定的悬停位置,仅使用激光雷达传感器提供的有限环境信息。在另外两个实验中,他们的方法使得两个模拟机器人系统在更广泛的条件下稳定运行:倒立摆和路径跟踪车辆。这些实验相对较复杂,比神经网络验证社区以前能够做到的要复杂,特别是因为它们包括传感器模型。

“与常见的机器学习问题不同,将神经网络作为Lyapunov函数的严格使用需要解决困难的全局优化问题,因此可扩展性是关键瓶颈,”加利福尼亚大学圣地亚哥分校计算机科学与工程副教授高思存说道,他没有参与这项工作。“当前的工作通过开发更适合于神经网络作为控制问题中Lyapunov函数的特定使用的算法方法,做出了重要贡献。它在可扩展性和解决方案质量方面取得了令人印象深刻的改进。这项工作为神经网络Lyapunov方法的优化算法和深度学习在控制和机器人领域的严格使用开辟了令人兴奋的方向。”

杨璐洁和她的同事的稳定性方法在需要保证安全性至关重要的领域具有广泛的应用潜力。它可以帮助确保自动驾驶车辆(如飞机和航天器)的平稳行驶。同样,无人机投递物品或绘制不同地形图时也可以从这种安全保证中受益。

这里开发的技术非常通用,不仅仅适用于机器人技术;将来这些技术还有可能在生物医学和工业加工等其他应用中发挥作用。

虽然这种技术在可扩展性方面比以前的工作有所提升,但研究人员正在探索如何在更高维度的系统中发挥更好的性能。他们还希望考虑除了激光雷达读数之外的数据,如图像和点云。

作为未来的研究方向,团队希望为处于不确定环境并受到干扰的系统提供相同的稳定性保证。例如,如果无人机面临强风阵,杨璐洁和她的同事希望确保它仍然能够稳定飞行并完成所需任务。

此外,他们打算将他们的方法应用于优化问题,目标是在保持稳定的同时最小化机器人完成任务所需的时间和距离。他们计划将他们的技术扩展到人形机器人和其他现实世界的机器,这些机器需要在与周围环境接触时保持稳定。

麻省理工学院(MIT)EECS、航空航天学和机械工程的丰田教授、丰田研究所机器人研究副总裁、CSAIL成员Russ Tedrake是这项研究的高级作者。该论文还感谢加利福尼亚大学洛杉矶分校博士生施周星和副教授谢卓君,以及伊利诺伊大学厄巴纳-香槟分校助理教授张欢。他们的工作得到了亚马逊、美国国家科学基金会、海军研究办公室和Schmidt Sciences的部分支持。研究人员的论文将在2024年国际机器学习会议上进行展示。