‘xAI推出Grok-2以挑战人工智能层级’

xAI 已经宣布发布 Grok-2,这是一个重大升级,具有改进的聊天、编码和推理能力。

与 Grok-2 一起,xAI 还推出了 Grok-2 mini,这是主模型的一个较小但功能强大的版本。两者目前在 X 上处于测试阶段,并将在本月晚些时候通过 xAI 的企业 API 提供。

Grok-2 的早期版本在LMSYS 排行榜上以“sus-column-r”的化名进行了测试。

在宣布时,xAI 声称其性能超过了 Anthropic 的Claude 3.5 Sonnet 和 OpenAI 的 GPT-4-Turbo。然而,值得注意的是,GPT-4o 目前在整体能力方面仍然位居最佳 AI 助手,其次是谷歌的Gemini 1.5

xAI 的内部评估过程使用 AI 导师来评估模型在各种现实任务中的表现。该公司表示:“Grok-2 在检索内容的推理和工具使用能力方面显示出显著改善,例如正确识别缺失信息、推理事件序列和丢弃无关帖子。”

xAI 分享的基准结果表明,Grok-2 和 Grok-2 mini 在多个方面相较于 Grok-1.5 显示出显著改善。这些模型在研究生级科学知识、一般知识和数学竞赛问题等领域表现出竞争力。值得注意的是,Grok-2 在基于视觉的任务中表现出色,在视觉数学推理和基于文档的问题回答中提供了最先进的性能。

新的 Grok 体验在X上具有重新设计的界面和新功能。高级和高级+订阅者将可以访问 Grok-2 和 Grok-2 mini。xAI 将 Grok-2 描述为“在广泛任务中更直观、可操控和多功能,无论您是在寻找答案、协作写作还是解决编码任务。”

xAI 还与Black Forest Labs 合作,实验他们的 FLUX.1 模型,以扩展 Grok 在 X 上的能力。

对于开发者,xAI 将在本月晚些时候推出企业 API 平台。该公司承诺提供增强的安全功能、丰富的流量统计和高级计费分析。还将提供管理 API,以便将团队、用户和计费管理集成到现有工具和服务中。

展望未来,xAI 计划将多模态理解作为 Grok 体验的核心部分在 X 和 API 上推出。自 2023 年 11 月宣布 Grok-1 以来,该公司的快速进展归功于“一个人才密度最高的小团队”。

xAI 的重点仍然是通过其新的计算集群推进核心推理能力,旨在保持其在 AI 开发前沿的地位。然而,该公司最近同意停止使用某些欧盟数据来训练其模型。

虽然 Grok-2 的发布标志着 xAI 的一个重要里程碑,但显然 AI 领域仍然竞争激烈。随着 ChatGPT-4o 和谷歌的 Gemini 1.5 领先,其他主要参与者如 Anthropic 也在不断取得进展,AI 霸主的竞争远未结束。

另见:SingularityNET 寄希望于超级计算机网络实现 AGI

想了解更多来自行业领袖的 AI 和大数据信息吗? 请查看 AI & 大数据博览会,该活动将在阿姆斯特丹、加利福尼亚和伦敦举行。该综合活动与其他领先活动共同举办,包括智能自动化会议BlockX数字转型周网络安全与云博览会

在这里探索其他即将举行的企业技术活动和网络研讨会,均由 TechForge 提供支持

标签: , , , , , , , , , , ,