将AI置于需要解决问题的人们手中

作为2010年媒体实验室的学生,Karthik Dinakar SM ’12,PhD ’17和Birago Jones SM ’12合作进行了一个课程项目,建立了一个工具,可以帮助Twitter(现在是X)和YouTube等公司的内容审核团队。该项目引起了巨大的兴趣,研究人员受邀在白宫的网络欺凌峰会上进行演示-他们只需要让这个工具正常运行。

在白宫活动的前一天,Dinakar花了几个小时试图组装一个可以识别Twitter上令人担忧的帖子的演示版本。大约晚上11点,他打电话给Jones说他要放弃了。

然后Jones决定查看数据。结果发现Dinakar的模型标记了正确类型的帖子,但发布者使用了青少年俚语和其他间接语言,Dinakar没有注意到。问题不在于模型,而在于Dinakar和他试图帮助的青少年之间的脱节。

“我们当时意识到,在我们到达白宫之前,构建这些模型的人不应该只是机器学习工程师,”Dinakar说。“他们应该是最了解他们的数据的人。”

这一发现促使研究人员开发了点按式工具,允许非专家构建机器学习模型。这些工具成为Pienso的基础,如今帮助人们构建用于检测错误信息、人口贩卖、武器销售等的大型语言模型,而无需编写任何代码。

“这些应用对我们来说很重要,因为我们的根源在于网络欺凌和理解如何利用人工智能来真正帮助人类,”Jones说。

至于在白宫展示的早期系统版本,创始人最终与马萨诸塞州剑桥市附近的学校的学生合作,让他们训练模型。

“那些孩子训练的模型比我能想出的任何东西都要好得多,更加细致入微,”Dinakar说。“Birago和我有了这个重大的‘啊哈’时刻,我们意识到赋予领域专家权力-这与民主化人工智能不同-是未来的最佳路径。”

有目标的项目

Jones和Dinakar是麻省理工学院媒体实验室软件代理研究小组的研究生学生。他们对Pienso的工作始于6.864课程(自然语言处理),并持续到2012年获得硕士学位。

事实证明,2010年并不是创始人最后一次受邀到白宫展示他们的项目。这项工作引起了很多热情,但创始人们在2016年之前只是兼职从事Pienso的工作,当时Dinakar在麻省理工学院完成了博士学位,深度学习开始迅速流行。

“我们仍然与校园周围的许多人保持联系,”Dinakar说。“我们在麻省理工学院的曝光度,人与计算机界面的融合,扩大了我们的理解。我们在Pienso的理念在没有麻省理工学院校园的活力的情况下是不可能的。”

创始人还归功于麻省理工学院的工业联络计划(ILP)和创业加速器(STEX),因为这些计划将他们与早期合作伙伴联系在一起。

其中一个早期合作伙伴是SkyUK。该公司的客户成功团队使用Pienso构建模型来了解客户最常见的问题。如今,这些模型每天帮助处理50万个客户电话,并且创始人表示,到目前为止,他们已经为公司节省了超过700万英镑,缩短了公司呼叫中心的通话时间。

民主化人工智能和赋予人们人工智能的区别在于谁最了解数据-你还是医生、记者或每天与客户一起工作的人?”Jones说。“那些应该创建模型的人。这是如何从数据中获得洞察力的方法。”

2020年,就在美国爆发Covid-19疫情之际,政府官员联系创始人使用他们的工具更好地了解这种新兴疾病。Pienso帮助病毒学和传染病专家建立机器学习模型,挖掘有关冠状病毒的数千篇研究文章。Dinakar说,他们后来得知这项工作帮助政府确定并加强了药物等关键供应链,包括热门的抗病毒药物瑞德西韦。

“那些化合物是由一个不懂深度学习但能够使用我们平台的团队发现的,”Dinakar说。

构建更好的人工智能未来

由于Pienso可以在内部服务器和云基础设施上运行,创始人表示,它为被迫通过使用其他人工智能公司提供的服务来捐赠数据的企业提供了一种选择。

“Pienso界面是一系列通过网络连接在一起的Web应用程序,”Dinakar解释道。“你可以将其视为用于大型语言模型的Adobe Photoshop,但在Web上。你可以指向并导入数据,而无需编写任何代码。你可以对数据进行细化,为深度学习准备数据,分析数据,如果数据没有标记或注释,可以给数据赋予结构,然后在短短25分钟内获得经过调整的大型语言模型。”

今年早些时候,Pienso宣布与GraphCore合作,后者为机器学习提供了更快、更高效的计算平台。创始人表示,这种合作将通过大大降低延迟进一步降低利用人工智能的门槛。

“如果你正在构建一个交互式人工智能平台,用户不会在每次点击按钮时都喝一杯咖啡,”Dinakar说。“它需要快速响应。”

创始人们相信他们的解决方案正在实现一个更有效的未来,即由最熟悉他们试图解决的问题的人为特定用例开发更好的人工智能模型。

“没有一个模型可以做到一切,”Dinakar说。“每个人的应用程序都不同,他们的需求不同,他们的数据不同。一个模型很可能不会为您做所有事情。它是关于将一系列模型汇集在一起,并允许它们相互协作,并以有意义的方式进行编排-进行编排的人应该是最了解数据的人。”