Inflection-2在常见基准测试中击败了Google的PaLM 2。

Inflection，一家旨在为每个人创建“个人AI”的人工智能初创公司，宣布推出了一款名为Inflection-2的新型大型语言模型，该模型超越了谷歌的PaLM 2。

Inflection-2经过5000多个NVIDIA GPU的训练，达到了1.025千万亿次浮点运算（FLOPs），与PaLM 2 Large处于同一水平。然而，早期的基准测试显示，Inflection-2在推理能力、事实知识和文体能力等方面表现优于谷歌的模型。

在一系列常见的学术AI基准测试中，Inflection-2在大多数测试中的得分都高于PaLM 2。这包括在多任务中学校语言理解（MMLU）测试、TriviaQA、HellaSwag和Grade School Math（GSM8k）基准测试中超过了这家搜索巨头的旗舰产品。

这家初创公司的新模型将很快为其个人助手应用程序Pi提供动力，以实现更自然的对话和有用的功能。

Inflection表示，尽管Inflection-2比其前身要大得多，但其从NVIDIA A100过渡到H100 GPU进行推理的速度将提高，并且通过优化工作将降低成本。

Inflection的一位发言人表示，这款最新模型使他们“更接近实现为所有人提供AI助手”的使命。他们补充说，团队已经“期待着”在他们的22,000个GPU超级计算机上训练更大的模型。

据称，安全是研究人员的首要任务之一，Inflection是白宫2023年7月“自愿AI承诺”的首批签署者之一。该公司表示，其安全团队继续努力确保模型经过严格评估，并依赖最佳实践进行对齐。

凭借令人印象深刻的基准测试和进一步扩大规模的计划，Inflection的最新努力对谷歌和微软等科技巨头构成了严峻的挑战，这些公司迄今在大型语言模型领域占据主导地位。下一代人工智能的竞赛已经开始。

（照片由Johann Walter Bantz在Unsplash上拍摄）

更多关于AI和大数据的行业领导者的信息，请访问在阿姆斯特丹、加利福尼亚和伦敦举办的AI＆Big Data Expo。这个全面的活动与Digital Transformation Week同期举办。

探索由TechForge提供支持的其他即将举行的企业技术活动和网络研讨会，请点击这里。

标签：ai，人工智能，基准测试，h100，inflection，inflection ai，inflection-2，大型语言模型，llm，nvidia，nvidia h100，palm 2

相关文章