‘创建共同语言’

自从何恺明成为博士生的15年间,发生了很多变化。

他表示:“在博士阶段,不同学科和领域之间有一堵高墙,计算机科学内部也存在着高墙。坐在我旁边的人可能在做我完全无法理解的事情。”

自从他加入麻省理工学院施瓦茨计算机学院,担任电气工程与计算机科学系的道格拉斯·罗斯(1954)软件技术职业发展教授以来的七个月里,何恺明表示,他正在经历一种在他看来“在人类科学历史上非常罕见”的现象——跨越不同科学学科的墙壁正在降低。

他说:“我永远无法理解高能物理、化学或生物研究的前沿,但现在我们看到了一些可以帮助我们打破这些墙壁的东西,那就是在人工智能中找到的共同语言。”

构建人工智能桥梁

何恺明表示,这一转变始于2012年,正值“深度学习革命”之后,那时人们意识到这一基于神经网络的机器学习方法集是如此强大,可以被更广泛地应用。

他说:“在这一点上,计算机视觉——帮助计算机像人类一样看和感知世界——开始迅速增长,因为事实证明,你可以将这种方法应用于许多不同的问题和领域。”他说:“因此,计算机视觉社区迅速壮大,因为这些不同的子主题现在能够使用共同的语言并共享一套共同的工具。”

从那时起,何恺明表示,这一趋势开始扩展到计算机科学的其他领域,包括自然语言处理、语音识别和机器人技术,为ChatGPT和其他朝向人工通用智能(AGI)的进展奠定了基础。

他说:“所有这一切都发生在过去十年中,带领我们走向一个我非常期待的新兴趋势,那就是观察人工智能方法传播到其他科学学科。”

他提到的一个最著名的例子是AlphaFold,这是由谷歌DeepMind开发的人工智能程序,用于预测蛋白质结构。

他说:“这是一个非常不同的科学学科,一个非常不同的问题,但人们也在使用相同的人工智能工具、相同的方法来解决这些问题,我认为这只是个开始。”

人工智能在科学中的未来

自2024年2月来到麻省理工学院以来,何恺明表示,他与几乎每个系的教授进行了交谈。有些日子,他发现自己与来自非常不同背景的两位或多位教授交谈。

他说:“我当然不完全理解他们的研究领域,但他们会介绍一些背景,然后我们可以开始讨论深度学习、机器学习和他们问题中的神经网络模型。”他说:“在这个意义上,这些人工智能工具就像这些科学领域之间的共同语言:机器学习工具将他们的术语和概念‘翻译’成我可以理解的术语,然后我可以了解他们的问题,分享我的经验,有时提出解决方案或探索的机会。”

扩展到不同科学学科具有重要潜力,从使用视频分析预测天气和气候趋势,到加快研究周期并降低新药发现的相关成本。

虽然人工智能工具为何恺明的科学家同事的工作提供了明显的好处,但何恺明也指出,它们对人工智能的创造和进步可以产生的相互影响。

他说:“科学家提供新的问题和挑战,帮助我们继续发展这些工具。但同样重要的是要记住,许多今天的人工智能工具源于早期的科学领域——例如,人工神经网络受到生物观察的启发;图像生成的扩散模型则源于物理学术语。”

他说:“科学和人工智能不是孤立的学科。我们一直从不同的角度接近同一个目标,现在我们正在走到一起。”

而且,麻省理工学院无疑是它们汇聚的最佳场所。

他说:“麻省理工学院能够比许多其他地方更早看到这种变化并不令人惊讶。[麻省理工学院施瓦茨计算机学院]创造了一个连接不同人群的环境,让他们坐在一起、交谈、合作、交流思想,同时讲着同一种语言——我看到这一点开始发生。”

至于墙壁何时会完全降低,何恺明指出,这是一个长期投资,不会一蹴而就。

他说:“几十年前,计算机被视为高科技,你需要特定的知识才能理解它们,但现在每个人都在使用计算机。我预计在10年或更长时间内,每个人都将在某种程度上使用某种人工智能进行研究——这只是他们的基本工具、基本语言,他们可以使用人工智能来解决他们的问题。”