‘Anthropic推出新的Claude AI模型和“计算机控制”’

Anthropic 宣布对其人工智能产品组合进行了升级，包括增强版的 Claude 3.5 Sonnet 模型和新推出的 Claude 3.5 Haiku，以及一个处于公开测试阶段的“计算机控制”功能。

升级后的 Claude 3.5 Sonnet 在所有指标上表现出显著的改进，尤其是在编码能力方面取得了显著进展。该模型在 SWE-bench Verified 基准测试中取得了令人印象深刻的 49.0%，超越了所有公开可用的模型，包括 OpenAI 的产品和专业编码系统。

在一项开创性的发展中，Anthropic 引入了计算机使用功能，使 Claude 能够像人类一样与计算机互动：查看屏幕、控制光标、点击和输入。这一功能目前处于公开测试阶段，使 Claude 3.5 Sonnet 成为首个提供此类功能的前沿人工智能模型。

几家主要科技公司已经开始实施这些新功能。

“升级后的 Claude 3.5 Sonnet 代表了人工智能编码的重大飞跃，”GitLab 报告称，指出在使用案例中推理能力提高了多达 10%，且没有额外的延迟。

新推出的 Claude 3.5 Haiku 模型预计将在本月晚些时候发布，其性能与之前的 Claude 3 Opus 相当，同时保持了成本效益和速度。它在 SWE-bench Verified 中取得了 40.6%，超越了许多竞争模型，包括原始的 Claude 3.5 Sonnet 和 GPT-4o。