商汤科技SenseNova 5.5:中国首个实时多模态人工智能模型

SenseTime发布了SenseNova 5.5,这是其LLM的增强版本,包括被称为中国首个实时多模态模型的SenseNova 5o。

SenseNova 5o代表了AI交互的一大进步,提供了与GPT-4o的流式交互功能相媲美的能力。这一进展使用户能够以与真实人类对话类似的方式与模型进行互动,特别适用于实时对话和语音识别应用。

据SenseTime称,其最新模型在多个基准测试中超过了竞争对手:

在上海举行的世界人工智能大会(WAIC)上,SenseTime发布了SenseNova 5.5。该公司声称该模型在8个关键指标中有5个超过了GPT-4o。

徐立博士,SenseTime董事长兼首席执行官,评论道:“对于大型模型来说,今年是关键的一年,它们从单模态发展到多模态。根据用户的需求,SenseTime还专注于提高互动性。

“随着应用推动模型及其能力的发展,再加上多模态流式交互技术的技术进步,我们将见证人工智能与人类互动领域的前所未有的变革。”

升级后的SenseNova 5.5在整体性能方面比其前身SenseNova 5.0提高了30%,而SenseNova 5.0仅在两个月前发布。值得注意的改进包括数学推理、英语熟练度和指令遵循能力的提高。

为了使更多人能够获得先进的AI能力,SenseTime推出了一种成本效益高的边缘端大型模型。这一发展将每个设备的成本降低到每年人民币9.90元(约合1.36美元),有望加速各种物联网设备的广泛采用。

该公司还推出了“Project $0 Go”,这是一个免费的入门套餐,供企业用户从OpenAI平台迁移。该计划包括5000万个令牌套餐和API迁移咨询服务,旨在降低企业利用SenseNova能力的门槛。

SenseTime对边缘端AI的承诺体现在SenseChat Lite-5.5的发布中,与其前身相比,推理时间减少了40%,仅为0.19秒。推理速度也提高了15%,达到每秒90.2个单词。

SenseTime扩展了其AI应用套件,推出了可控的AI头像视频生成器Vimi。这个工具可以根据一张照片精确控制面部表情和上半身动作,为娱乐和互动应用开辟了新的可能性。

该公司还升级了SenseTime Raccoon系列,这是一套AI原生的生产力工具。Code Raccoon的响应速度提高了五倍,编码精度提高了10%,而Office Raccoon则扩展到包括面向消费者的网页和微信小程序版本。

SenseTime的大型模型技术已经在各个行业引起了轰动。在金融领域,它提高了合规、营销和投资研究的效率。在农业领域,它帮助减少材料使用量20%,同时增加作物产量15%。文化旅游业在旅行规划和预订效率方面也得到了显著提升。

已经有超过3000个政府和企业客户在技术、医疗、金融和编程领域使用SenseNova,SenseTime正在巩固其作为关键AI参与者的地位。

(图片来源:SenseTime

想要从行业领导者那里了解更多关于人工智能和大数据的知识吗?请参加在阿姆斯特丹、加利福尼亚和伦敦举办的AI & Big Data Expo。这个综合性的活动与其他领先的活动同时举办,包括Intelligent Automation Conference、BlockX、Digital Transformation Week和Cyber Security & Cloud Expo。

请在此处浏览其他即将举行的企业技术活动和网络研讨会(由TechForge提供)。