“新的开源工具帮助理清大脑”

在2023年末,第一种有潜力减缓阿尔茨海默病进展的药物获得了美国食品药品监督管理局的批准。阿尔茨海默病是众多削弱神经系统的疾病之一,这些疾病共同影响着全球八分之一的人口。尽管这款新药是朝着正确方向迈出的一步,但在完全理解它和其他类似疾病方面,仍然任重道远。

“重建人脑在细胞层面上如何运作的复杂性是神经科学面临的最大挑战之一,”麻省理工学院林肯实验室的人类健康与性能系统组的技术人员和算法开发者拉尔斯·耶斯特比(Lars Gjesteby)表示。“高分辨率的网络脑图可以通过精确定位健康大脑和病变大脑之间的差异,帮助我们更好地理解这些疾病。然而,进展受到缺乏足够工具以可视化和处理非常大的脑成像数据集的限制。”

网络脑图本质上是大脑的详细地图,可以帮助将结构信息与神经功能联系起来。为了构建这样的脑图,需要对脑成像数据进行处理和注释。例如,每个轴突或连接神经元的细纤维都需要被追踪、测量并标记信息。目前处理脑成像数据的方法,如基于桌面的软件或手动工具,尚未设计用于处理人脑规模的数据集。因此,研究人员通常需要花费大量时间在海量的原始数据中苦苦挣扎。

耶斯特比正在领导一个项目,构建神经元追踪与主动学习环境(Neuron Tracing and Active Learning Environment,NeuroTrALE),这是一个将机器学习、超级计算以及易用性和可访问性结合起来的脑图绘制挑战的软件管道。NeuroTrALE自动化了大部分数据处理,并在一个交互式界面中显示输出,允许研究人员编辑和操作数据,以标记、过滤和搜索特定模式。

解开一团毛线

NeuroTrALE的一个显著特点是它采用的机器学习技术,称为主动学习。NeuroTrALE的算法经过训练,可以根据现有的脑成像数据自动标记输入数据,但不熟悉的数据可能会导致错误。主动学习允许用户手动纠正错误,从而教会算法在下次遇到类似数据时进行改进。这种自动化与手动标记的结合确保了准确的数据处理,同时减轻了用户的负担。

“想象一下拍摄一团毛线的X光。你会看到所有这些交错、重叠的线,”来自实验室国土决策支持系统组的迈克尔·斯奈德(Michael Snyder)说。“当两条线交叉时,是不是意味着其中一根毛线弯成了90度,还是一根直上而另一根直横?通过NeuroTrALE的主动学习,用户可以追踪这些毛线一两次,并训练算法在未来正确跟踪它们。如果没有NeuroTrALE,用户每次都必须追踪这团毛线,或者在这种情况下,追踪人脑的轴突。”斯奈德是NeuroTrALE团队的一个软件开发者,团队成员还有大卫·查韦斯(David Chavez)。

由于NeuroTrALE将大部分标记工作从用户身上卸下,它使研究人员能够更快地处理更多数据。此外,轴突追踪算法利用并行计算将计算分配到多个GPU上,从而实现更快、可扩展的处理。使用NeuroTrALE,团队展示了在处理32GB数据时,相较于传统AI方法,计算时间减少了90%。

团队还展示了数据量的显著增加并不意味着处理时间的等比例增加。例如,在一项最近的研究中,他们证明数据集大小增加10000%仅导致总数据处理时间增加9%和22%,使用两种不同类型的中央处理单元。

“考虑到人脑中估计有860亿个神经元,形成100万亿个连接,手动标记单个大脑中的所有轴突将需要一生的时间,”项目的算法开发者本杰明·鲁普(Benjamin Roop)补充道。“这个工具有潜力自动化创建连接组,不仅仅是为一个个体,而是为许多人。这为在群体层面研究脑疾病打开了大门。”

开放源代码的发现之路

NeuroTrALE项目是林肯实验室与Kwanghun Chung教授实验室之间的内部资助合作。林肯实验室团队需要为Chung实验室的研究人员构建一种方法,以分析和提取从MIT超级云流入的大量脑成像数据中的有用信息——这是由林肯实验室运行的超级计算机,旨在支持MIT的研究。林肯实验室在高性能计算、图像处理和人工智能方面的专业知识使其特别适合应对这一挑战。

在2020年,团队将NeuroTrALE上传到超级云,到2022年,Chung实验室开始产生结果。在一项发表在《科学》杂志上的研究中,他们使用NeuroTrALE量化了与阿尔茨海默病相关的前额叶皮层细胞密度,发现受该病影响的大脑在某些区域的细胞密度低于未受影响的大脑。该团队还定位了在阿尔茨海默病影响的大脑组织中有害神经纤维容易缠结的位置。

NeuroTrALE的工作在林肯实验室的资助和国家卫生研究院(NIH)的资助下继续进行,以增强NeuroTrALE的能力。目前,其用户界面工具正在与谷歌的Neuroglancer程序集成——这是一个用于神经科学数据的开源、基于网络的查看应用程序。NeuroTrALE增加了用户动态可视化和编辑其注释数据的能力,并允许多个用户同时处理相同的数据。用户还可以创建和编辑多种形状,如多边形、点和线,以便于注释任务,并为每个注释自定义颜色显示,以区分密集区域中的神经元。

“NeuroTrALE提供了一个平台无关的端到端解决方案,可以通过容器轻松快速地在独立、虚拟、云和高性能计算环境中部署。”实验室的人工智能技术组的高性能计算工程师亚当·米哈利亚斯(Adam Michaleas)表示。“此外,它通过提供实时协作的能力,显著改善了最终用户的体验,使神经科学社区能够通过数据可视化和同时内容审查进行合作。”

为了与NIH的使命相一致,团队的目标是使NeuroTrALE成为一个完全开源的工具,供任何人使用。耶斯特比表示,这种类型的工具是实现全面绘制人脑以进行研究,最终进行药物开发的最终目标所需的。“这是一个由社区发起的草根努力,数据和算法旨在被所有人共享和访问。”

NeuroTrALE的轴突追踪数据管理交互式用户界面的代码库通过开源许可证公开可用。有关使用NeuroTrALE的更多信息,请联系Lars Gjesteby