当Tamara Broderick还是一名高中生时,她第一次踏上麻省理工学院的校园,参加了首届女性科技项目。这个为期一个月的暑期学术体验活动为年轻女性提供了工程和计算机科学的实践介绍。
她会在多年后以教职员工的身份回到麻省理工学院吗?
这是一个Broderick可能可以用贝叶斯推断来定量回答的问题,贝叶斯推断是一种统计方法,试图通过不断更新假设来量化不确定性,以获得新数据。
在她在麻省理工学院的实验室里,这位电气工程与计算机科学系(EECS)的新任终身副教授使用贝叶斯推断来量化不确定性,并衡量数据分析技术的稳健性。
“我一直对了解我们从数据分析中得到了什么以及我们对它了解有多少很感兴趣,”Broderick说道,她还是信息与决策系统实验室和数据、系统与社会研究所的成员。“事实是我们生活在一个嘈杂的世界中,我们并不总是能够得到我们想要的数据。我们如何从数据中学习,同时认识到存在限制并适当地处理它们?”
广义上说,她的重点是帮助人们了解可用的统计工具的限制,并有时与他们合作为特定情况制定更好的工具。
例如,她的团队最近与海洋学家合作开发了一个机器学习模型,可以对海洋洋流进行更准确的预测。在另一个项目中,她和其他人与退化性疾病专家合作,开发了一个工具,帮助严重运动障碍的人利用计算机的图形用户界面通过操作单个开关进行输入。
她的工作中一个共同的主题是强调合作。
“在数据分析中工作,你可以在每个人的后院里闲逛,可以说。你真的不会感到无聊,因为你总是可以学习其他领域的知识,并思考如何将机器学习应用到那里,”她说。
在许多学术“后院”中闲逛对Broderick来说尤其有吸引力,因为她从小就很难将自己的兴趣范围缩小。
数学思维
在俄亥俄州克利夫兰郊区长大,Broderick对数学的兴趣可以追溯到她记事以来。她回忆起对将一个数字不断加上自身会发生什么的想法的着迷。
“我大概5岁,所以我不知道什么是‘二的幂’之类的东西。我只是对数学非常感兴趣,”她说。
她的父亲意识到她对这门学科的兴趣,并将她注册到约翰霍普金斯大学的一个名为天才青年中心的项目中,这使得Broderick有机会参加为期三周的暑期课程,涵盖了从天文学到数论到计算机科学的一系列主题。
后来,在高中时,她与凯斯西储大学的一位博士后一起进行天体物理研究。在2002年的夏天,她作为首届女性科技项目的成员,在麻省理工学院度过了四个星期。
她特别喜欢该项目提供的自由度,以及它专注于使用直觉和独创性来实现高层次目标的特点。例如,该项目要求学员使用乐高积木构建一个设备,用于活检悬浮在果冻中的葡萄。
该项目向她展示了工程和计算机科学中涉及的创造力,并引发了她追求学术事业的兴趣。
“但是当我进入普林斯顿大学时,我无法决定——数学、物理、计算机科学——它们都看起来超级酷。我想做所有的事情,”她说。
她决定攻读本科数学学位,但尽可能多地安排了物理和计算机科学课程。
深入数据分析
在获得马歇尔奖学金后,Broderick在英国剑桥大学度过了两年时间,获得了数学高级研究硕士和物理哲学硕士学位。
在英国,她修了许多统计学和数据分析课程,包括她在机器学习领域的第一门贝叶斯数据分析课程。
她回忆说,这是一次改变命运的经历。
“在英国期间,我意识到我真的喜欢解决对人们有意义的现实问题,而贝叶斯推断被用于一些最重要的问题中,”她说。
回到美国后,Broderick前往加州大学伯克利分校,加入了迈克尔·I·乔丹教授的实验室,成为一名研究生。她获得了统计学博士学位,专注于贝叶斯数据分析。
她决定从事学术事业,并被麻省理工学院的EECS系的合作性质和她即将成为同事们的热情和友好所吸引。
她的第一印象得到了验证,Broderick说她在麻省理工学院找到了一个帮助她发挥创造力、探索具有广泛应用的艰难而有影响力的问题的社区。
“我很幸运能与实验室里一群非常出色的学生和博士后一起工作——他们聪明、勤奋,心怀正义,”她说。
她团队最近的一个项目涉及与一位研究微信使用的经济学家的合作。
微信项目的目标是帮助人们摆脱贫困。经济学家对一个地区的村庄进行随机对照试验,其中一些村庄接受微信,而另一些村庄则不接受。他们希望推广研究结果,预测如果将微信应用于他们研究之外的其他村庄,预期的结果会是什么。
但是Broderick和她的合作者发现,一些微信研究的结果可能非常脆弱。从数据集中删除一个或几个数据点可能会完全改变结果。一个问题是研究人员经常使用经验平均值,其中一些非常高或低的数据点可能会扭曲结果。
她和她的合作者使用机器学习开发了一种方法,可以确定必须删除多少数据点才能改变研究的实质性结论。借助他们的工具,科学家可以看到结果的脆弱程度。
“有时候删除很小一部分数据就可以改变数据分析的主要结果,然后我们可能会担心这些结论在新情况下的推广程度。我们能为人们标记出来吗?这就是我们通过这项工作要解决的问题,”她解释道。
与此同时,她继续与各个领域的研究人员合作,例如遗传学,以了解不同机器学习技术和其他数据分析工具的优缺点。
快乐的旅程
探索是Broderick作为研究人员的驱动力,也是她实验室之外的一个激情所在。她和丈夫喜欢收集他们通过徒步旅行获得的徽章。
“我认为我的爱好真的结合了我喜欢户外活动和电子表格的兴趣,”她说。“通过这些徒步旅行徽章,你必须探索一切,然后你会看到你通常不会看到的地方。在某种程度上,这是一种冒险。”
他们发现了一些令人惊叹的徒步旅行,他们以前可能不会知道,但也进行了一些“彻底失败的徒步旅行”,她说。但是每一次徒步旅行,无论是隐藏的宝石还是杂草丛生的混乱,都有其自己的回报。
就像在她的研究中一样,好奇心、开放心态和对解决问题的热情从未让她迷失方向。