‘AI模型识别出某些乳腺肿瘤阶段可能进展为侵袭性癌症’

导管原位癌(DCIS)是一种前侵袭性肿瘤,有时会进展为一种高度致命的乳腺癌。它约占所有乳腺癌诊断的25%。

由于临床医生很难确定DCIS的类型和阶段,DCIS患者往往会受到过度治疗。为了解决这个问题,麻省理工学院(MIT)和苏黎世联邦理工学院(ETH Zurich)的一组跨学科研究人员开发了一种AI模型,可以从便宜且易于获取的乳腺组织图像中识别DCIS的不同阶段。他们的模型表明,组织样本中细胞的状态和排列对于确定DCIS的阶段都很重要。

由于这种组织图像非常容易获取,研究人员能够建立一个同类中最大的数据库之一,并用它来训练和测试他们的模型。当他们将模型的预测与病理学家的结论进行比较时,发现许多情况下有明显的一致性。

未来,该模型可以作为工具,帮助临床医生简化简单病例的诊断,而无需进行劳动密集型的测试,从而为他们提供更多时间来评估那些不太明确是否会变为侵袭性的DCIS病例。

“我们迈出了第一步,认识到在诊断DCIS时应该关注细胞的空间组织,现在我们已经开发了一种可扩展的技术。从这里开始,我们确实需要进行前瞻性研究。与医院合作并将这一切推进到临床将是一个重要的进展,”麻省理工学院电气工程与计算机科学系(EECS)和数据、系统与社会研究所(IDSS)的教授卡罗琳·乌勒(Caroline Uhler)说,她还是麻省理工学院和哈佛大学布罗德研究所埃里克和温迪·施密特中心的主任,以及麻省理工学院信息与决策系统实验室(LIDS)的研究员。

乌勒是这项研究论文的共同通讯作者,主要作者是EECS和埃里克与温迪·施密特中心的研究生张欣怡(Xinyi Zhang);共同通讯作者是ETH Zurich与保罗·谢尔研究所联合的机械基因组学教授GV·希瓦香卡(GV Shivashankar);以及来自麻省理工学院、ETH Zurich和意大利巴勒莫大学的其他研究人员。这项开放获取的研究于7月20日发表在《自然通讯》(Nature Communications)上。

将成像与AI结合

30%到50%的DCIS患者会发展为高度侵袭性的癌症阶段,但研究人员尚不清楚哪些生物标志物可以告诉临床医生哪些肿瘤会进展。

研究人员可以使用多重染色或单细胞RNA测序等技术来确定组织样本中DCIS的阶段。然而,希瓦香卡解释说,这些测试的成本太高,无法广泛进行。

在之前的研究中,这些研究人员表明,一种称为染色质染色的便宜成像技术可以提供与成本更高的单细胞RNA测序相同的信息。

在这项研究中,他们假设将这种单一染色与精心设计的机器学习模型结合起来,可以提供与更昂贵技术相同的癌症阶段信息。

首先,他们创建了一个包含来自122名患者的560个组织样本图像的数据集,这些患者处于三个不同的疾病阶段。他们使用这个数据集训练一个AI模型,该模型学习组织样本图像中每个细胞状态的表示,并用它来推断患者癌症的阶段。

然而,并非每个细胞都能指示癌症,因此研究人员必须以有意义的方式对它们进行聚合。

他们设计模型以创建处于相似状态的细胞簇,识别出八种重要的DCIS标记状态。有些细胞状态比其他状态更能指示侵袭性癌症。该模型确定组织样本中每种状态细胞的比例。

组织结构很重要

“但在癌症中,细胞的组织结构也会发生变化。我们发现,仅仅拥有每种状态细胞的比例是不够的。你还需要理解细胞是如何组织的,”希瓦香卡说。

凭借这一见解,他们设计模型以考虑细胞状态的比例和排列,这显著提高了其准确性。

“对我们来说有趣的是看到空间组织的重要性。之前的研究表明,靠近乳腺导管的细胞很重要。但考虑哪些细胞靠近哪些其他细胞也同样重要,”张说。

当他们将模型的结果与病理学家评估的样本进行比较时,许多情况下有明显的一致性。在那些不那么明确的案例中,该模型可以提供关于组织样本中细胞组织等特征的信息,病理学家可以利用这些信息进行决策。

这个多功能模型也可以适应用于其他类型的癌症,甚至是神经退行性疾病,这是研究人员目前也在探索的一个领域。

“我们已经表明,使用正确的AI技术,这种简单的染色可以非常强大。还有很多研究要做,但我们需要在更多的研究中考虑细胞的组织结构,”乌勒说。

这项研究部分得到了布罗德研究所的埃里克和温迪·施密特中心、ETH Zurich、保罗·谢尔研究所、瑞士国家科学基金会、美国国立卫生研究院、美国海军研究办公室、麻省理工学院贾米尔机器学习与健康诊所、麻省理工学院-IBM沃森AI实验室以及西蒙斯研究员奖的资助。