新的人工智能方法捕捉医学图像中的不确定性

在生物医学中,分割涉及对医学图像中的重要结构(如器官或细胞)的像素进行注释。人工智能模型可以通过突出显示可能显示某种疾病或异常迹象的像素来帮助临床医生。

然而,这些模型通常只提供一个答案,而医学图像分割的问题往往远非黑白分明。五位专家人工标注者可能会提供五种不同的分割结果,可能在肺部CT图像中的结节的边界的存在或范围上存在分歧。

麻省理工学院计算机科学博士候选人Marianne Rakic表示:“拥有多个选项可以帮助决策。即使只是看到医学图像中存在不确定性,也可能影响某人的决策,因此重要的是要考虑这种不确定性。”

Rakic是麻省理工学院、麻省理工学院和哈佛大学Broad研究所以及马萨诸塞州综合医院的一篇论文的主要作者,该论文介绍了一种可以捕捉医学图像中不确定性的新型人工智能工具。

这个名为Tyche(以希腊机遇女神命名)的系统提供了多个可能的分割结果,每个结果都突出显示医学图像的略有不同的区域。用户可以指定Tyche输出多少个选项,并选择最适合其目的的选项。

重要的是,Tyche可以处理新的分割任务,而无需重新训练。训练是一个数据密集型的过程,涉及向模型展示许多示例,并需要广泛的机器学习经验。

Tyche可能比其他一些方法更容易供临床医生和生物医学研究人员使用,因为它不需要重新训练。它可以“开箱即用”地应用于各种任务,从识别肺部X射线中的病变到定位脑部MRI中的异常。

最终,该系统可以通过引起其他人工智能工具可能忽略的潜在关键信息来改善诊断或帮助生物医学研究。

哈佛医学院和MGH助理教授、麻省理工学院计算机科学与人工智能实验室(CSAIL)的研究科学家Adrian Dalca补充说:“模糊性研究不足。如果您的模型完全错过了三位专家说存在但两位专家说不存在的结节,那可能是您应该关注的问题。”

他们的合著者包括电气工程和计算机科学研究生Hallee Wong、Jose Javier Gonzalez Ortiz博士、Broad研究所生物图像分析副主任Beth Cimini以及计算机科学和电气工程学院Dugald C. Jackson教授John Guttag。Rakic将在IEEE计算机视觉和模式识别会议上展示Tyche,Tyche已被选为亮点。

解决模糊性

用于医学图像分割的人工智能系统通常使用神经网络。神经网络是一种基于人脑的机器学习模型,由许多相互连接的节点或神经元组成,用于处理数据。

在与Broad研究所和MGH的合作者交谈后,研究人员意识到两个主要问题限制了这些系统的效果。这些模型无法捕捉不确定性,并且即使是稍微不同的分割任务也必须重新训练。

Rakic表示,一些方法试图克服一个问题,但用单一解决方案解决这两个问题尤其棘手。

她说:“如果要考虑模糊性,通常必须使用一个非常复杂的模型。我们提出的方法的目标是使其易于使用,并使用相对较小的模型,以便可以快速进行预测。”

研究人员通过修改简单的神经网络架构构建了Tyche。

用户首先向Tyche提供几个示例,显示分割任务。例如,示例可以包括几个心脏MRI中的病变图像,这些图像已由不同的人工专家进行了分割,以便模型可以学习任务并看到存在模糊性。

研究人员发现,只需16个示例图像(称为“上下文集”)就足以使模型做出良好的预测,但可以使用的示例数量没有限制。上下文集使Tyche能够在不重新训练的情况下解决新任务。

为了捕捉不确定性,研究人员修改了神经网络,使其根据一个医学图像输入和上下文集输出多个预测。他们调整了网络的层次结构,以便在数据从一层到另一层移动时,每个步骤产生的候选分割结果可以“交流”彼此和上下文集中的示例。

通过这种方式,模型可以确保候选分割结果都有些不同,但仍然可以解决任务。

她说:“就像掷骰子一样。如果您的模型可以掷出2、3或4,但不知道您已经有了2和4,那么可能会再次出现其中一个。”

他们还修改了训练过程,使其通过最大化其最佳预测的质量来获得奖励。

如果用户要求五个预测结果,最后他们可以看到Tyche生成的所有五个医学图像分割结果,即使其中一个可能比其他结果更好。

研究人员还开发了Tyche的一个版本,可以与现有的预训练医学图像分割模型一起使用。在这种情况下,Tyche通过对图像进行轻微变换使模型输出多个候选结果。

更好、更快的预测

当研究人员使用带注释的医学图像数据集测试Tyche时,他们发现其预测结果捕捉到了人工标注者的多样性,并且其最佳预测结果优于基线模型的任何预测结果。Tyche的性能也比大多数模型更快。

Rakic表示:“输出多个候选结果并确保它们彼此不同确实给您带来了优势。”

研究人员还发现,Tyche可以胜过使用大型专门数据集进行训练的更复杂模型。

对于未来的工作,他们计划尝试使用更灵活的上下文集,可能包括文本或多种类型的图像。此外,他们希望探索能够改进Tyche最差预测结果并增强系统以推荐最佳分割候选结果的方法。

该研究部分资助来自美国国立卫生研究院、麻省理工学院和哈佛大学Broad研究所的Eric和Wendy Schmidt中心以及Quanta Computer。