商汤科技SenseNova 5.5：中国首个实时多模态人工智能模型

SenseTime发布了SenseNova 5.5，这是其LLM的增强版本，包括被称为中国首个实时多模态模型的SenseNova 5o。

SenseNova 5o代表了AI交互的一大进步，提供了与GPT-4o的流式交互功能相媲美的能力。这一进步使用户能够以与真实人类对话类似的方式与模型进行互动，特别适用于实时对话和语音识别应用。

据SenseTime称，其最新模型在多个基准测试中超过了竞争对手：

在上海举行的世界人工智能大会（WAIC）上，SenseTime发布了SenseNova 5.5。该公司声称该模型在8个关键指标中有5个超过了GPT-4o。

徐立博士，SenseTime董事长兼首席执行官，评论道：“对于大型模型来说，今年是关键的一年，它们从单模态发展到多模态。根据用户的需求，SenseTime还专注于提高互动性。

“随着应用推动模型和其能力的发展，再加上多模态流式交互技术的技术进步，我们将见证人工智能与人类互动方面的前所未有的变革。”

升级后的SenseNova 5.5在整体性能方面比其前身SenseNova 5.0提高了30%，而SenseNova 5.0仅在两个月前发布。值得注意的改进包括数学推理、英语熟练度和指令遵循能力的提高。

为了使更多人能够获得先进的AI能力，SenseTime推出了一种成本效益高的边缘大型模型。这一发展将每个设备的成本降低到每年人民币9.90元（约合1.36美元），可能加速各种物联网设备的广泛采用。

该公司还推出了“Project $0 Go”，这是一个免费的入门套餐，供从OpenAI平台迁移的企业用户使用。该计划包括5000万个令牌套餐和API迁移咨询服务，旨在降低企业利用SenseNova能力的门槛。

SenseTime对边缘AI的承诺在SenseChat Lite-5.5的发布中得到体现，与其前身相比，推理时间减少了40%，仅为0.19秒。推理速度也提高了15%，达到每秒90.2个单词。

扩展其AI应用套件，SenseTime推出了Vimi，一个可控的AI头像视频生成器。这个工具可以根据单张照片精确控制面部表情和上半身动作，为娱乐和互动应用开辟了新的可能性。

该公司还升级了SenseTime Raccoon系列，这是一套AI原生的生产力工具。Code Raccoon现在的响应速度提高了五倍，编码精度提高了10%，而Office Raccoon则扩展到包括面向消费者的网页和微信小程序版本。

SenseTime的大型模型技术已经在各个行业引起了轰动。在金融领域，它提高了合规、营销和投资研究的效率。在农业领域，它帮助减少材料使用量20%，同时增加作物产量15%。文化旅游业在旅行规划和预订效率方面得到了显著提升。

已经有超过3000个政府和企业客户在技术、医疗、金融和编程领域使用SenseNova，SenseTime正在巩固其作为关键AI参与者的地位。

（图片来源：SenseTime）

想要从行业领导者那里了解更多关于人工智能和大数据的知识吗？请参加在阿姆斯特丹、加利福尼亚和伦敦举办的AI & Big Data Expo。这个综合性的活动与其他领先的活动同时举办，包括Intelligent Automation Conference、BlockX、Digital Transformation Week和Cyber Security & Cloud Expo。

探索由TechForge提供的其他即将举行的企业技术活动和网络研讨会here。

标签：ai、人工智能、基准、中国、模型、多模态、sensenova、sensetime

相关文章