2000多年前,希腊数学家欧几里得(Euclid)改变了我们对形状的思考方式,被许多人称为几何学之父。
基于这些古老的基础和数学进展的千年,Justin Solomon正在使用现代几何技术来解决那些看起来与形状无关的棘手问题。
例如,也许统计学家想要比较两个数据集,看看使用一个数据集进行训练,另一个数据集进行测试,对机器学习模型的性能会有什么影响。
根据数据在高维空间中的排列方式,这些数据集的内容可能会共享一些几何结构,Solomon解释道。使用几何工具进行比较可以带来洞察力,例如,同一个模型是否适用于两个数据集。
“我们在谈论数据时使用的语言通常涉及距离、相似性、曲率和形状,这正是我们在几何学中一直在讨论的那些东西。因此,几何学家在数据科学中有很多贡献,”他说。
使用几何技术可以解决的问题的广泛性是Solomon给他的几何数据处理小组起了一个“故意模糊”的名字的原因。
他的团队中大约一半的人致力于处理二维和三维几何数据的问题,例如在医学成像中对齐3D器官扫描,或者使自动驾驶车辆能够通过LiDAR传感器收集的空间数据识别行人。
其余的团队成员使用几何工具进行高维统计研究,例如构建更好的生成式人工智能模型。例如,这些模型通过从充满示例图像的数据集的某些部分进行采样来学习创建新图像。将图像空间映射到几何问题。
“我们开发的针对计算机动画应用的算法几乎与当今流行的生成式人工智能和概率任务直接相关,”Solomon补充道。
进入图形学
对计算机图形学的早期兴趣使Solomon开始了成为麻省理工学院教授的旅程。
作为一个在弗吉尼亚北部长大的数学爱好者的高中生,他有机会在华盛顿外的一个研究实验室实习,帮助开发3D人脸识别算法。
这次经历激发了他在斯坦福大学学习数学和计算机科学的双学位,并且他急于投入更多的研究项目。他记得作为一年级学生冲进校园招聘会,并成功地争取到了在皮克斯动画工作室暑期实习的机会。
“他们最终同意给我一个面试的机会,”他回忆道。
他在大学期间每个暑假都在皮克斯工作,一直到研究生学校。在那里,他专注于模拟布料和流体以改善动画电影的逼真度,以及渲染技术来改变动画内容的“外观”。
“图形学非常有趣。它以视觉内容为驱动,但除此之外,它还提出了与计算机科学其他领域不同的独特数学挑战,”Solomon说。
决定开始学术生涯后,Solomon留在斯坦福大学获得计算机科学博士学位。作为研究生,他最终专注于一种被称为最优输运的问题,其中一个人试图以尽可能高效的方式将某种物品的分布移动到另一个分布。
例如,也许有人想要找到从一系列制造商到城市中分布的一系列面包店运送面粉的最便宜方式。运送面粉的距离越远,成本就越高;最优输运寻求运输的最低成本。
“我的焦点最初只局限于最优输运在计算机图形学中的应用,但研究在其他方向和应用中取得了突破,这对我来说是一个意外。但是,从某种意义上说,这个巧合导致了我在麻省理工学院的研究小组的结构,”他说。
Solomon说,他之所以选择麻省理工学院,是因为有机会与聪明的学生、博士后和同事一起解决复杂但实际的问题,这些问题可能对许多学科产生影响。
回报社会
作为一名教职员工,他热衷于利用自己在麻省理工学院的地位,使几何研究领域对那些通常不接触到它的人士,尤其是经常没有机会在高中或大学进行研究的弱势学生,变得更加可接近。
为此,Solomon发起了“夏季几何计划”,这是一个为本科生提供六周有偿研究项目的计划,其中大部分学生来自弱势背景。该计划为几何研究提供了实践性的介绍,已经在2023年完成了第三个夏季。
“没有多少机构有在我的领域工作的人,这可能导致不平衡。这意味着典型的博士申请人来自一组有限的学校。我正在努力改变这一点,并确保那些绝对聪明但没有出生在合适地方的人仍然有机会在我们的领域工作,”他说。
该计划取得了实际成果。自推出以来,Solomon看到博士生入学班级的组成发生了变化,不仅在麻省理工学院,还在其他机构。
除了计算机图形学之外,使用几何技术可以解决的机器学习和统计学问题越来越多,这凸显了需要一个更多样化的研究领域,带来新的想法和观点,他说。
至于Solomon自己,他期待着将几何工具应用于改进无监督机器学习模型。在无监督机器学习中,模型必须学会在没有标记的训练数据的情况下识别模式。
绝大多数3D数据都没有标记,而且支付人工费用来手动标记3D场景中的对象通常是昂贵的。但是,结合几何洞察力和从数据中推断的复杂模型可以帮助计算机更有效地理解复杂的、未标记的3D场景,从而使模型能够从中学习。
当Solomon不思考这个和其他棘手的研究难题时,他经常会在钢琴或大提琴上演奏古典音乐。他是作曲家德米特里·肖斯塔科维奇的粉丝。
作为一个狂热的音乐家,他养成了在他搬到的任何城市加入交响乐团的习惯,目前在马萨诸塞州牛顿市的新爱乐乐团演奏大提琴。
从某种意义上说,这是他兴趣的和谐结合。
“音乐的本质是分析性的,而我有幸处于一个与艺术实践密切相关的研究领域——计算机图形学。因此,这两者是互相有益的,”他说。