SenseTime发布了SenseNova 5.5,这是其LLM的增强版本,包括被称为中国首个实时多模态模型的SenseNova 5o。
SenseNova 5o代表了AI交互的一大进步,提供了与GPT-4o的流式交互功能相媲美的能力。这一进步使用户能够以与真实人类对话类似的方式与模型进行互动,特别适用于实时对话和语音识别应用。
据SenseTime称,其最新模型在多个基准测试中超过了竞争对手:
在上海举行的世界人工智能大会(WAIC)上,SenseTime发布了SenseNova 5.5。该公司声称该模型在8个关键指标中有5个超过了GPT-4o。
徐立博士,SenseTime董事长兼首席执行官,评论道:“对于大型模型来说,今年是关键的一年,它们从单模态发展到多模态。根据用户的需求,SenseTime还专注于提高互动性。
“随着应用推动模型和其能力的发展,再加上多模态流式交互技术的技术进步,我们将见证人工智能与人类互动方面的前所未有的变革。”
升级后的SenseNova 5.5在整体性能方面比其前身SenseNova 5.0提高了30%,而SenseNova 5.0仅在两个月前发布。值得注意的改进包括数学推理、英语熟练度和指令遵循能力的提高。
为了使更多人能够获得先进的AI能力,SenseTime推出了一种成本效益高的边缘大型模型。这一发展将每个设备的成本降低到每年人民币9.90元(约合1.36美元),可能加速各种物联网设备的广泛采用。
该公司还推出了“Project $0 Go”,这是一个免费的入门套餐,供从OpenAI平台迁移的企业用户使用。该计划包括5000万个令牌套餐和API迁移咨询服务,旨在降低企业利用SenseNova能力的门槛。
SenseTime对边缘AI的承诺在SenseChat Lite-5.5的发布中得到体现,与其前身相比,推理时间减少了40%,仅为0.19秒。推理速度也提高了15%,达到每秒90.2个单词。
扩展其AI应用套件,SenseTime推出了Vimi,一个可控的AI头像视频生成器。这个工具可以根据单张照片精确控制面部表情和上半身动作,为娱乐和互动应用开辟了新的可能性。
该公司还升级了SenseTime Raccoon系列,这是一套AI原生的生产力工具。Code Raccoon现在的响应速度提高了五倍,编码精度提高了10%,而Office Raccoon则扩展到包括面向消费者的网页和微信小程序版本。
SenseTime的大型模型技术已经在各个行业引起了轰动。在金融领域,它提高了合规、营销和投资研究的效率。在农业领域,它帮助减少材料使用量20%,同时增加作物产量15%。文化旅游业在旅行规划和预订效率方面得到了显著提升。
已经有超过3000个政府和企业客户在技术、医疗、金融和编程领域使用SenseNova,SenseTime正在巩固其作为关键AI参与者的地位。
(图片来源:SenseTime)
想要从行业领导者那里了解更多关于人工智能和大数据的知识吗?请参加在阿姆斯特丹、加利福尼亚和伦敦举办的AI & Big Data Expo。这个综合性的活动与其他领先的活动同时举办,包括Intelligent Automation Conference、BlockX、Digital Transformation Week和Cyber Security & Cloud Expo。
探索由TechForge提供的其他即将举行的企业技术活动和网络研讨会here。
标签:ai、人工智能、基准、中国、模型、多模态、sensenova、sensetime