“改善健康,一次一个机器学习系统”

作为一个孩子,Marzyeh Ghassemi 被视频游戏和谜题所吸引,同时她在早期也对健康产生了浓厚的兴趣。幸运的是,她找到了一个可以将这两种兴趣结合起来的道路。

“虽然我曾考虑过从事医疗保健行业,但计算机科学和工程的吸引力更强,”Ghassemi 说,她是麻省理工学院电气工程与计算机科学系和医学工程与科学研究所(IMES)的副教授,同时也是信息与决策系统实验室(LIDS)的首席研究员。“当我发现计算机科学,尤其是人工智能/机器学习可以应用于医疗保健时,这正是我兴趣的交汇点。”

如今,Ghassemi 和她在 LIDS 的健康机器学习研究小组致力于深入研究如何使机器学习(ML)变得更加稳健,并随后应用于改善健康领域的安全性和公平性。

在德克萨斯州和新墨西哥州的一个以工程为导向的伊朗裔美国家庭中长大,Ghassemi 有榜样可以追随进入 STEM 职业。虽然她喜欢基于谜题的视频游戏——“解决谜题以解锁其他关卡或进一步进展是一个非常吸引人的挑战”——但她的母亲也在早期就让她接触更高级的数学,吸引她将数学视为不仅仅是算术。

“加法或乘法是基本技能,强调这些是有充分理由的,但这种关注可能会掩盖更高层次的数学和科学更多是关于逻辑和谜题的想法,”Ghassemi 说。“由于我母亲的鼓励,我知道前面有有趣的事情。”

Ghassemi 说,除了她的母亲,许多人也支持了她的智力发展。在新墨西哥州立大学获得本科学位时,荣誉学院的院长和前马歇尔学者——Jason Ackelson(现为美国国土安全部的高级顾问)帮助她申请了马歇尔奖学金,这使她得以前往牛津大学,在那里她于2011年获得硕士学位,并首次对快速发展的机器学习领域产生了兴趣。在麻省理工学院攻读博士学位期间,Ghassemi 说她得到了“来自教授和同龄人的支持”,并补充道:“那种开放和接纳的环境是我努力为我的学生复制的。”

在攻读博士学位期间,Ghassemi 还首次发现健康数据中的偏见可能隐藏在机器学习模型中。

她曾训练模型使用健康数据预测结果,“当时的思维方式是使用所有可用数据。在图像的神经网络中,我们看到正确的特征会被学习以获得良好的性能,从而消除了手动设计特定特征的需要。”

在与麻省理工学院计算生理学实验室和 IMES 的首席研究科学家 Leo Celi 及 Ghassemi 的论文委员会成员的会议上,Celi 问 Ghassemi 是否检查过模型在不同性别、保险类型和自我报告种族的患者中的表现。

Ghassemi 确实进行了检查,结果发现存在差距。“我们现在有近十年的工作表明,这些模型差距很难解决——它们源于健康数据中的现有偏见和默认的技术实践。除非你仔细考虑这些问题,否则模型将天真地重现和扩展偏见,”她说。

自那时起,Ghassemi 一直在探索这些问题。

她在所做工作的一个突破是由几个部分组成的。首先,她和她的研究小组展示了学习模型可以从医学图像(如胸部 X 光片)中识别患者的种族,而放射科医生无法做到。该小组随后发现,优化以“平均”表现良好的模型在女性和少数族裔中的表现并不理想。去年夏天,她的团队结合这些发现,表明模型越是学习从医学图像中预测患者的种族或性别,其在这些人口统计子群体中的表现差距就越大。Ghassemi 和她的团队发现,如果模型被训练以考虑人口统计差异,而不是专注于整体平均表现,这个问题可以得到缓解——但这个过程必须在每个部署模型的地点进行。

“我们强调,在一个医院环境中训练以优化性能(平衡整体性能与最低公平差距)的模型在其他环境中并不理想。这对模型的开发和人类使用有重要影响,”Ghassemi 说。“一个医院可能有资源来训练一个模型,并能够证明它表现良好,甚至可能具有特定的公平性约束。然而,我们的研究表明,这些性能保证在新环境中并不成立。在一个地点表现良好的模型在不同环境中可能无法有效运作。这影响了模型在实践中的效用,我们必须努力解决这个问题,以便为那些开发和部署模型的人提供帮助。”

Ghassemi 的工作受到她身份的影响。

“我是一位显而易见的穆斯林女性和母亲——这两者都帮助塑造了我看待世界的方式,这也影响了我的研究兴趣,”她说。“我研究机器学习模型的稳健性,以及缺乏稳健性如何与现有偏见结合。这种兴趣并非偶然。”

谈到她的思维过程,Ghassemi 说灵感常常在她户外活动时出现——在新墨西哥州骑自行车作为本科生,在牛津划船,作为麻省理工学院的博士生跑步,以及如今在剑桥滨水大道散步。她还表示,在处理复杂问题时,考虑更大问题的各个部分并尝试理解自己对每个部分的假设可能是错误的,这对她很有帮助。

“根据我的经验,新解决方案的最限制因素是你认为你知道的东西,”她说。“有时,直到你深入挖掘一个模型、系统等,意识到你没有正确或完全理解某个子部分,才很难超越你自己(部分)知识。”

尽管 Ghassemi 对她的工作充满热情,但她有意保持对生活更大图景的关注。

“当你热爱你的研究时,很难不让它成为你的身份——我认为很多学者都需要意识到这一点,”她说。“我努力确保自己在技术专长之外还有其他兴趣(和知识)。

“帮助优先考虑平衡的最佳方式之一就是与优秀的人在一起。如果你有家人、朋友或同事鼓励你成为一个完整的人,珍惜他们!”

Ghassemi 因其涵盖计算机科学和健康这两种早期热情的工作而获得了许多奖项和认可,她对生活的看法是将其视为一段旅程。

“波斯诗人鲁米有一句话被翻译为‘你就是你所寻找的东西’,”她说。“在你生命的每个阶段,你都必须重新投资于寻找自己,并将其推向你想成为的样子。”