人工智能平台提供商Clarifai推出了一项新的计算编排功能,承诺帮助企业优化其在任何计算环境中的AI工作负载,降低成本并避免供应商锁定。
该功能于2024年12月3日宣布,公开预览版允许组织通过统一的控制平面编排AI工作负载,无论这些工作负载是在云端、本地还是在隔离的基础设施中运行。该平台可以与任何AI模型和硬件加速器(包括GPU、CPU和TPU)一起使用。
“Clarifai一直走在前沿,拥有超过十年的经验,支持大型企业和关键政府需求,提供完整的AI工具栈以创建自定义AI工作负载,”创始人兼首席执行官Matt Zeiler表示。“现在,我们正在开放我们内部构建的能力,以优化我们的计算成本,因为我们正在扩展以同时服务数百万个模型。”
该公司声称其平台可以通过模型打包优化将计算使用量减少3.7倍,同时支持每秒超过160万次推理请求,可靠性达到99.9997%。根据Clarifai的说法,这些优化可能根据配置将成本降低60-90%。
计算编排平台的功能包括:
- 通过自动资源管理实现成本优化,包括模型打包、依赖简化和可自定义的自动扩展选项,可以将模型副本和计算节点的扩展缩减至零,
- 在任何硬件供应商上实现部署灵活性,包括云、本地、隔离和Clarifai SaaS基础设施,
- 与Clarifai的AI平台集成,用于数据标注、训练、评估、工作流和反馈,
- 安全功能,允许在客户的VPC或本地Kubernetes集群中部署,而无需开放入站端口、VPC对等或自定义IAM角色。
该平台的出现源于Clarifai客户在AI性能和成本方面的问题。“如果我们能够全面考虑,并比较我们的本地成本与云成本,然后能够在具有成本基础的环境之间进行编排,那将是非常有价值的,”一位客户在Clarifai的公告中提到。
计算编排能力建立在Clarifai现有的AI平台之上,该公司表示,该平台已处理超过20亿次计算机视觉、语言和音频AI操作。该公司报告称,关键应用程序的正常运行时间超过99.99%并提供24/7可用性。
计算编排功能目前处于公开预览阶段。有兴趣测试该平台的组织应联系Clarifai以获取访问权限。