像微软、Alphabet和Meta这样的科技巨头正在利用AI驱动的云服务获得丰厚的收入,但同时也在为推动AI的边界而面临巨大的成本。最近的财务报告描绘了一幅双刃剑的图景:一方面是令人印象深刻的收益;另一方面是惊人的开支。
这种二元对立使得彭博社恰当地称AI开发为“巨大的金钱坑”,突显了当今AI革命背后的复杂经济现实。在这个财务问题的核心,是对更大、更复杂的AI模型的不断追求。对人工通用智能(AGI)的追求使得公司开发出越来越复杂的系统,以大型语言模型如GPT-4为例。这些模型需要巨大的计算能力,推动硬件成本达到前所未有的水平。
更糟糕的是,对专用AI芯片,主要是图形处理单元(GPU)的需求激增。Nvidia,该领域的领先制造商,在科技公司争相获取这些关键组件时,其市场价值飙升。其H100图形芯片,作为训练AI模型的黄金标准,售价估计为30,000美元——一些转售商甚至以多倍的价格出售。
全球芯片短缺只加剧了这一问题,一些公司需要等待数月才能获得所需的硬件。Meta首席执行官扎克伯格曾表示,他的公司计划在今年年底前购买350,000个H100芯片,以支持其AI研究工作。即使他获得了批量购买折扣,这也很快就会增加到数十亿美元。
另一方面,对更先进 AI的推动也引发了芯片设计的军备竞赛。像谷歌和亚马逊这样的公司在开发其专用AI处理器上投入巨资,旨在获得竞争优势并减少对第三方供应商的依赖。这种定制硅的趋势为AI开发过程增加了另一层复杂性和成本。
但硬件挑战不仅仅是采购芯片。现代AI模型的规模需要巨大的数据中心,这些数据中心面临着技术障碍。这些设施必须设计成能够处理极端的计算负载,同时有效管理热量散发和能耗。随着模型的增大,电力需求也随之增加,显著提高了运营成本和环境影响。
在四月初的一次播客采访中,OpenAI竞争对手Anthropic的首席执行官达里奥·阿莫代伊表示,目前市场上的AI模型训练成本约为1亿美元。“现在正在训练的模型以及将在今年晚些时候或明年初推出的模型,其成本更接近10亿美元,”他说。“我认为在2025年和2026年,我们将接近50亿或100亿美元。”
此外,数据是AI系统的命脉,带来了自身的技术挑战。对大量高质量数据集的需求使得公司在数据收集、清理和注释技术上投入巨资。一些公司正在开发复杂的合成数据生成工具,以补充真实世界数据,进一步推高了研发成本。
AI创新的快速步伐也意味着基础设施和工具迅速过时。公司必须不断升级其系统并重新训练其模型以保持竞争力,形成了一个持续的投资和过时的循环。
“在4月25日,微软表示在最近一个季度的资本支出达到了140亿美元,并预计这些成本将“显著增加”,部分原因是AI基础设施投资。这比去年同期增长了79%。Alphabet表示在该季度支出了120亿美元,比去年同期增长了91%,并预计今年剩余时间将“保持在或高于”这一水平,因为它专注于AI机会,”彭博社的文章写道。
彭博社还指出,Meta同时提高了对今年投资的预期,现在认为资本支出将达到350亿到400亿美元,这将在高端范围内增长42%。它提到在AI研究和产品开发方面的积极投资,”彭博社写道。
有趣的是,彭博社的文章还指出,尽管这些巨额成本,科技巨头们正在证明AI可以成为真正的收入驱动因素。微软和Alphabet报告了其云业务的显著增长,主要归因于对AI服务的需求增加。这表明,尽管对AI技术的初始投资令人震惊,但潜在的回报足以证明这些开支。
然而,AI开发的高成本引发了对市场集中度的担忧。正如文章所指出的,前沿AI研究相关的费用可能会将创新限制在少数资金充足的公司中,可能会抑制该领域的竞争和多样性。展望未来,行业正专注于开发更高效的AI技术,以应对这些成本挑战。
对少量学习、迁移学习和更节能的模型架构等技术的研究旨在减少AI开发和部署所需的计算资源。此外,向边缘AI的推动——在本地设备上运行AI模型而不是在云中——可能有助于分散计算负载,减少对集中数据中心的压力。
然而,这一转变需要在芯片设计和软件优化方面进行一系列技术创新。总体而言,显然AI的未来不仅将由算法和模型设计的突破所塑造,还将由我们克服与扩展AI系统相关的巨大技术和财务障碍的能力所决定。能够有效应对这些挑战的公司,可能会在AI革命的下一个阶段中脱颖而出。
(图片由Igor Omilaev提供)
想了解更多来自行业领袖的AI和大数据信息吗? 请查看AI & 大数据博览会,该活动将在阿姆斯特丹、加利福尼亚和伦敦举行。该综合活动与其他领先活动共同举办,包括智能自动化会议、区块链博览会、数字化转型周和网络安全与云博览会。
探索由TechForge提供的其他即将举行的企业技术活动和网络研讨会这里。