‘Yiannis Antoniou, Lab49: OpenAI 操作员开启浏览器 AI 代理时代’

OpenAI推出了Operator,这是一种与网络浏览器无缝集成的工具,可以自主执行任务。从填写表单到订购杂货,Operator承诺通过直接与网站进行点击、输入和滚动来简化重复的在线活动。

Operator围绕一种名为计算机使用代理(CUA)的新模型设计,结合了GPT-4o的视觉识别和高级推理能力,使其能够作为虚拟的“浏览器中的人类”运作。然而,尽管其创新性,行业专家认为仍有改进的空间。

Lab49的人工智能、数据和分析负责人Yiannis Antoniou分享了他对Operator在竞争激烈的代理人工智能系统中的重要性和定位的见解。

通过熟悉的界面实现代理人工智能

Antoniou表示:“OpenAI宣布Operator,这是其在代理人工智能领域的最新尝试,既令人着迷又不完整。”他在金融服务公司设计人工智能系统方面拥有超过20年的经验。

Lab49的人工智能、数据和分析负责人Yiannis Antoniou的头像,关于OpenAI操作员如何开启浏览器AI代理时代的文章。

他指出:“显然受到Anthropic Claude的计算机使用系统的影响,该系统在十月推出,Operator通过消除复杂基础设施的需求并专注于熟悉的界面——浏览器,简化了体验。”

通过设计Operator在用户已经理解的环境中运行,即网络浏览器,OpenAI避免了定制API或集成的需求。

他补充道:“通过利用全球最受欢迎的界面,OpenAI提升了用户体验,并吸引了公众的即时关注。这种以浏览器为中心的方法为广泛采用创造了显著的潜力,而尽管Anthropic拥有早期的先发优势,但在这一点上却难以实现。”

与一些可能在应用上显得技术性或小众的竞争系统不同,Operator的浏览器聚焦框架降低了进入门槛,是OpenAI努力实现人工智能民主化的一步。

对可用性和安全性的独特看法

Operator的一个显著特点是其对适应性和安全性的重视,通过人机协作协议来实现。Antoniou承认这些周到的可用性特征,但指出仍需更多工作。

他说:“在架构上,Operator的浏览器集成与Claude的系统非常相似。两者都涉及截取用户浏览器的屏幕截图并发送进行分析,以及通过虚拟按键和鼠标移动控制屏幕。然而,Operator引入了周到的可用性设计。

“为特定网站提供自定义指令等功能增加了一层个性化,而强调人机协作则防止了未经授权的操作——例如购买、发送电子邮件或申请工作——这表明OpenAI意识到恶意网站可能带来的潜在安全风险,但显然还需要更多工作,以确保该系统在各种场景下的广泛安全。”

OpenAI为Operator实施了多层次的安全框架,包括安全输入的接管模式、重大操作前的用户确认以及监控系统以检测对抗性行为。此外,用户可以直接在工具中删除浏览数据和管理隐私设置。

然而,Antoniou强调,这些措施仍在不断发展,特别是在Operator遇到复杂或敏感任务时。

OpenAI Operator进一步实现人工智能的民主化

Antoniou还将Operator的发布视为消费者人工智能领域的一个关键时刻,尽管这一时刻仍处于早期阶段。

他说:“总体而言,这是一个出色的首次尝试,旨在为日常用户构建一个代理系统,围绕他们与技术的自然互动进行设计。随着系统的发展——增加更多功能和更强大的安全控制——这一有限的推出,定价为每月200美元,将作为一个测试平台。

“一旦成熟并扩展到更低的订阅层和免费版本,Operator有潜力开启面向消费者的代理时代,进一步实现人工智能的民主化,并将其嵌入日常生活。”

最初为专业用户设计并定价较高,Operator为OpenAI提供了向早期采用者学习和完善其能力的机会。

Antoniou指出,尽管每月200美元可能尚未为大多数用户证明系统的价值,但对提升Operator的功能和可及性的投资可能在长期内为OpenAI带来显著的竞争优势。

他说:“每月200美元值得吗?也许还不值得。但随着系统的发展,OpenAI的护城河将会扩大,使竞争对手更难追赶。现在,挑战又回到了Anthropic和Google身上——这两家公司在小众或工程专注的产品中展示了类似的能力——需要回应并保持竞争力。”

随着OpenAI继续微调Operator,革命性地改变人们与技术互动的潜力变得显而易见。从与Instacart、DoorDash和Uber等公司的合作到公共部门的应用案例,Operator旨在在创新与信任和安全之间取得平衡。

尽管早期的局限性和定价可能会暂时阻碍广泛采用,但这些障碍可能只是暂时的,因为OpenAI承诺随着时间的推移增强可用性和可及性。

另见:OpenAI在印度法院反对ChatGPT数据删除

想了解更多来自行业领袖的人工智能和大数据信息吗? 请查看AI & Big Data Expo,该活动将在阿姆斯特丹、加利福尼亚和伦敦举行。该综合活动与其他领先活动共同举办,包括智能自动化会议区块链博览会数字化转型周网络安全与云博览会

探索由TechForge提供的其他即将举行的企业技术活动和网络研讨会这里

标签: , , , , , , ,