Inflection-2在常见基准测试中击败了Google的PaLM 2。

Inflection,一家旨在为每个人创建“个人AI”的人工智能初创公司,宣布推出了一款名为Inflection-2的新型大型语言模型,该模型超越了谷歌的PaLM 2。

Inflection-2经过5000多个NVIDIA GPU的训练,达到了1.025千万亿次浮点运算(FLOPs),与PaLM 2 Large处于同一水平。然而,早期的基准测试显示,Inflection-2在推理能力、事实知识和文体能力等方面表现优于谷歌的模型。

在一系列常见的学术AI基准测试中,Inflection-2在大多数测试中的得分都高于PaLM 2。这包括在多任务中学校语言理解(MMLU)测试、TriviaQA、HellaSwag和Grade School Math(GSM8k)基准测试中超过了这家搜索巨头的旗舰产品。

这家初创公司的新模型将很快为其个人助手应用程序Pi提供动力,以实现更自然的对话和有用的功能。

Inflection表示,尽管Inflection-2比其前身要大得多,但其从NVIDIA A100过渡到H100 GPU进行推理的速度将提高,并且通过优化工作将降低成本。

Inflection的一位发言人表示,这款最新模型使他们“更接近实现为所有人提供AI助手”的使命。他们补充说,团队已经“期待着”在他们的22,000个GPU超级计算机上训练更大的模型。

据称,安全是研究人员的首要任务之一,Inflection是白宫2023年7月“自愿AI承诺”的首批签署者之一。该公司表示,其安全团队继续努力确保模型经过严格评估,并依赖最佳实践进行对齐。

凭借令人印象深刻的基准测试和进一步扩大规模的计划,Inflection的最新努力对谷歌和微软等科技巨头构成了严峻的挑战,这些公司迄今在大型语言模型领域占据主导地位。下一代人工智能的竞赛已经开始。

(照片由Johann Walter Bantz在Unsplash上拍摄)

更多关于AI和大数据的行业领导者的信息,请访问在阿姆斯特丹、加利福尼亚和伦敦举办的AI&Big Data Expo。这个全面的活动与Digital Transformation Week同期举办。

探索由TechForge提供支持的其他即将举行的企业技术活动和网络研讨会,请点击这里。

标签:ai,人工智能,基准测试,h100,inflection,inflection ai,inflection-2,大型语言模型,llm,nvidia,nvidia h100,palm 2