Elon Musk的初创公司xAI刚刚宣布,将依靠Dell和Super Micro提供服务器机架来支持其庞大的超级计算机项目。
Musk在他的社交媒体平台X上宣布了这一合作,这标志着xAI实现他多次称之为“世界上最大的超级计算机”的目标的重要发展。
服务器机架是高性能计算基础设施的重要组成部分,提供存储和组织超级计算机运行所需的各种计算组件的骨架。这些设计精良的机房旨在通过利用有限的地板空间来促进最佳效率和空气流动,这在超级计算领域非常重要。
服务器机架,例如xAI的Grok用于大规模AI模型训练的机架,是支持这些工作负载所需的服务器基础设施的关键组件。这些项目需要数十万个耗电量巨大的AI芯片才能实现所需的规模,而半导体晶圆厂的生产周期不足。
xAI的项目非常庞大,因此在其规模上特别具有挑战性的是热管理。当前的技术速度还不够快,而超级计算机(可以进行数千倍的计算)会变得非常热,导致其中的芯片随着时间的推移性能下降。这个问题在需要数千个耗电量巨大的AI芯片来训练更先进的AI模型(如xAI的Grok)时变得更加严重。
合作细节:Dell和Super Micro的角色
据Musk称,Dell Technologies将负责组装xAI超级计算机一半的机架。Super Micro Computer,Musk称之为“SMC”,将提供剩下的一半。Super Micro以与Nvidia等芯片公司的紧密联系和在液冷技术方面的专业知识而闻名,已向路透社确认了这一合作。
总部位于旧金山的Super Micro以其创新的服务器设计方法而闻名,尤其是其液冷技术。这项技术对于管理高性能计算系统产生的极端热量至关重要,可以实现更高效的运行,并可能延长组件的使用寿命。
在相关发展中,Dell首席执行官Michael Dell在X上宣布,该公司正在与Nvidia合作建立一个“AI工厂”,为xAI的聊天机器人Grok的下一个版本提供动力。这一合作突显了先进AI模型训练所需的大量计算资源。
Musk此前表示,训练Grok 2模型需要大约20,000个Nvidia H100图形处理单元(GPU),未来版本可能需要多达100,000个这些芯片。据《信息》报道,该计划的超级计算机预计将于2025年秋季投入运行。
Dell Technologies和Super Micro Computer在这个项目中带来了丰富的经验和专业知识。多年来,Dell一直是服务器和数据中心基础设施的可靠供应商,为许多全球最大的云计算平台和超级计算设施(如德克萨斯先进计算中心的Frontera超级计算机)提供动力。
Super Micro在提供高性能、高能效服务器解决方案方面树立了行业领先地位。他们在液冷和刀片服务器架构方面的创新被云提供商、企业和研究机构广泛应用于AI和高性能计算等要求严格的工作负载。
对AI和超级计算技术的影响
xAI、Dell Technologies和Super Micro Computer之间的合作代表了AI和超级计算技术发展的重要里程碑。随着项目的推进,它很可能推动高性能计算的界限,并为人工智能能力的快速发展做出贡献。
这种合作还凸显了AI行业中专用硬件的日益重要性。随着AI模型变得越来越复杂和数据密集,对高性能计算解决方案的需求预计将继续增长,可能在未来几年重塑技术行业的格局。
想要从行业领导者那里了解更多关于AI和大数据的知识吗?请参加在阿姆斯特丹、加利福尼亚和伦敦举办的AI&Big Data Expo。这个综合性的活动与其他领先的活动同时举办,包括智能自动化会议、BlockX、数字化转型周和网络安全与云计算博览会。
探索由TechForge提供支持的其他即将举行的企业技术活动和网络研讨会。