‘xAI凭借“Colossus”AI训练系统打破记录’

埃隆·马斯克的 xAI 揭示了其创纪录的人工智能训练系统,名为“Colossus”。

马斯克透露,xAI团队在经过122天的过程后,成功将Colossus 100k H100训练集群上线。马斯克表示,团队对现有能力并不满足,“在接下来的几个月里,它的规模将翻倍,达到200k(50k H200s)。”

Colossus的规模前所未有,超越了迄今为止的所有其他集群。作为对比,谷歌使用90,000个GPU,而OpenAI使用80,000个GPU——这两者都在xAI的创作之前被超越,甚至在Colossus在未来几个月内翻倍之前。

Colossus与Nvidia合作开发,利用市场上最先进的GPU技术。该系统最初使用Nvidia的 H100 芯片,并计划在扩展中纳入更新的 H200 型号。这一庞大的处理能力使Colossus成为目前最强大的人工智能训练系统。

尽管H200最近被Nvidia在2024年3月 发布 的Blackwell芯片所取代,但它仍然是人工智能行业中备受追捧的组件。它具有令人印象深刻的规格,包括141 GB的HBM3E内存和4.8 TB/sec的带宽。然而,Blackwell芯片进一步提高了标准,其顶级容量比H200高出36.2%,总带宽增加66.7%。

Nvidia对Colossus发布的反应充满热情和支持。该公司祝贺马斯克和xAI团队的成就,强调Colossus不仅将是同类中最强大的系统,还将提供“卓越的”能源效率提升。

Colossus的处理能力可能会加速各种人工智能应用的突破,从自然语言处理到复杂问题解决算法。然而,Colossus的发布也重新点燃了关于人工智能权力集中在少数科技巨头和资金充足的初创公司之间的讨论。

随着像xAI这样的公司推动人工智能训练的可能性边界,对于较小组织和研究人员获取这些先进技术的可及性问题可能会浮出水面。

随着人工智能军备竞赛的持续升温,所有目光都将集中在xAI及其竞争对手身上,看看他们如何利用这些日益强大的系统。通过Colossus,马斯克和他的团队向竞争对手发出了挑战,要求他们匹配或超越他们的努力。

另见:亚马逊与Anthropic合作提升Alexa

想了解更多行业领袖关于人工智能和大数据的见解吗? 请查看人工智能与大数据博览会,该活动将在阿姆斯特丹、加利福尼亚和伦敦举行。该综合活动与其他领先活动共同举办,包括智能自动化会议区块链博览会数字转型周网络安全与云博览会

探索由TechForge提供的其他即将举行的企业技术活动和网络研讨会这里

标签: , , , , , , , , ,