Press "Enter" to skip to content

量化生成型人工智能的电力消耗

2027年能否与西班牙消费相匹敌(曾是哈萨克斯坦)?

量化生成型人工智能的电力消耗 四海 第1张

更新日期:2023年12月11日 — 附录中的分析已经修订,以反映出由AMD估计的销售翻倍。

生成式人工智能需要大量的图形处理单元(GPU)。机器学习中涉及的计算需要处理有数十亿参数的大模型,并且处理这些负载的最佳方式就是使用仅GPU可以提供的数千个并行处理器。

上一次对GPU计算能力需求激增是在加密货币领域——比特币最初使用GPU进行挖掘,后来采用了专门设计的芯片(ASICs),而以太坊一直使用庞大的GPU仓库,直到最后放弃挖矿过程,转而采用一种称为股权证明(PoS)的方法。

虽然人们意识到比特币挖矿消耗了大量的电力,但直到爱尔兰梅纽斯大学的研究团队¹将能源消耗量量化为易于理解的方式后,问题的严重性才变得明显。实际上,在当时的研究中,比特币挖掘消耗的电力大约相当于爱尔兰一年的电力消耗量。此后,能源消耗量已经增加到与波兰相当的水平。

在加密货币领域,能够量化功耗是因为货币生成速度被称为‘难度’级别,而在最新的生成式人工智能浪潮中,由于没有这样的措施,估算功耗更加困难。

生成式人工智能基础设施正在迅速增长

有大量的实证证据表明,购买人工智能基础设施的增长速度很快,包括马斯克的X.AI公司购买1万个英伟达GPU以及Inflection AI建造了一座由22,000个(英伟达)H100构成的集群的报道。

也有学术分析,比如Alex de Vries的论文²使用自底向上的方法,通过拼凑新闻报道和公司发布的信息来考虑可能的能源消耗。

毫无疑问,GPU硬件的主要供应商是英伟达,其竞争对手是AMD。这两家公司都是上市公司,每个季度都必须提交详细报告,向股东和公众介绍其当前销售情况,并对未来进行预测。

并非以GPU为主导产品的公司的活动并不那么显著。谷歌自己制造自己的AI芯片,微软已经宣布打算这样做。ARM也已经宣布了在这个方向上的行动,还有一大批初创公司希望在这个领域竞争。我们只能猜测他们的活动规模,并将其排除在此分析之外。

跟进销售预测

作为芯片的主要生产商,英伟达或许最有能力预测未来的需求,他们的销售预测值得关注。

在2023年5月发布的英伟达第一季度业绩展示中,该公司报告了总收入为719.2亿美元,其中数据中心类别的销售额达到428.4亿美元。这表明这是一个非常成功的季度,该公司主要归功于生成式人工智能和OpenAI最新发布的ChatGPT。他们惊艳了股市,预计2023年全年数据中心类别的收入将达到150亿美元。

这些惊人的结果在第二季度进一步强化,当时同一类别的销售额达到103亿美元,在第三季度上升到145亿美元。同一时间段,AMD的业绩相对低调,3个季度的销售额仅略超10亿美元,但他们预计在第四季度推出MI300后情况将发生改变。

下表总结了这些结果,并稍微猜测第四季度的情况,显示预计在2023年全年将销售价值约500亿美元的GPU——这是ChatGPT发布后的第一年。

量化生成型人工智能的电力消耗 四海 第2张

展望未来,Nvidia的第一季度报告(第42张幻灯片)估计,AI企业软件的未来总市场规模为每年1500亿美元(是2023年估计的10倍)。这个估计也在竞争对手AMD的第二季度盈利电话会议中得到了印证,他们表示希望“到2027年,AI加速器市场将超过1500亿美元”。

我们在上表中增加了行,显示从2023年的500亿美元的线性增长到2027年的预计1500亿美元。如果我们假设在2023年底购买的硬件在2027年仍然运行,这意味着到那时,这两家领先供应商的基于生成AI的GPU总支出将达到5000亿美元。

这对能源消耗意味着什么

在这五年中,销售的GPU将是不同一代硬件的混合体。Nvidia在2023年初推出H100系列卡。他们在2023年5月开始推出更新的Grace Hopper(GH200)芯片,预计2024年推出B100系列。同样,AMD将在同一时间线上提供各种Instinct处理器(MI100、MI200、MI300)。

对于我们的能源估计,我们将假设在这五年期间,所有的GPU支出都用于与Nvidia H100类似特性的显卡。这种假设过于简单化,但可以预期随着每花费一美元的处理能力和每消耗一千瓦时的能源增加,总的支出和能源消耗类似。

H100系列卡的价格为33,000美元,尽管可能会因为折扣或供应短缺而略高或略低。

H100的峰值耗电量为700瓦。这些设备的小型集群操作者可能在负载在训练和推理之间转移时会有高峰和低谷。然而,大多数销售量将流向超大规模运营商和大型设施的运营商,研究⁶显示,通过良好的调度,这些设施通常以超过80%的容量(因此达到最大耗电量)一直运行。

现在我们进行以下简单的计算:

以成本价格33,000美元购买H100的10亿美元 = > 30,300个单位

30,300个单位 * 0.7千瓦 * (365*24)小时 => 每年0.185太瓦时

我们可以得出结论,10亿美元购买了30,300个消耗0.185太瓦时的GPU。

以下表格将这些能源消耗数据与之前提到的销售估计结合起来。

生成AI能源消耗估计 2023-2027

我们可以看到,在2023年年底,由Nvidia和AMD销售的那些GPU每年消耗9太瓦时,这相当于肯尼亚在最新(2021年)的美国能源信息署数据中的年度能源消耗量。到2027年,这个数字增长了10倍,几乎与哈萨克斯坦(一个拥有2000万人口的国家)的能源消耗量相当。

与比特币挖矿的比较

作为比较,剑桥比特币指数网站⁴显示,比特币在2021年初达到了(93太瓦时)的能源消耗量。在撰写本文时(2023年12月),比特币的能源消耗量已提高到156太瓦时,略低于该数字的两倍。由于比特币矿工有非常强烈的动力使用廉价电力,他们经常选择能源生产“滞留”的地区进行挖矿,因此其支持者认为,这往往意味着电力生产对环境的影响较小。而对于生成AI使用的能源情况并非如此。

许多人争论比特币挖矿使用如此大量的电力有些毫无意义,并且这种活动对人类的效益非常有限。相反,一些研究表明,生成式人工智能可以将工人的表现提升多达40%。如果事实确实如此,那么许多人可能会认为这种能源消耗非常值得。

结论

我们对生成式人工智能现在和未来的功耗进行了相当简单的分析。我们发现,在2023年,用于生成式人工智能的GPU芯片销售可能占用9 TWh的电力,相当于肯尼亚的用电量。如果行业领军企业Nvidia和AMD的最佳销售预测是正确的,到2027年这个数字将增长到93 TWh,相当于哈萨克斯坦的用电量。这仅仅是比特币挖矿今天消耗的电力的60%。尽管生成式人工智能的益处很可能能够证明这种消耗是合理的,但我们有必要密切关注这种大规模能源消耗的进展,以确保事实确实如此。

附录 — 包含2023年12月6日AMD最新预测的修订版

人工智能的发展进展迅速。2023年12月6日,AMD举办了一个名为“Advancing AI⁷”的活动,在活动上他们推出了他们的MI300产品。他们的首席执行官Lisa Su博士上台发言,表示他们之前对于人工智能加速器的总可寻址市场(TAM)的预测过于保守。他们决定这个市场的增长率应该每年超过70%,到2027年销售额将达到4000亿美元。这是他们先前估计的两倍以上。我们使用这些新数据进行了相同的分析,结果如下所示

到2027年的累积GPU销售额 — 考虑新的AMD预测

GPU和其他人工智能加速器的累积销售额预计将在5年内超过1万亿美元。

到2027年的GPU功耗 — 考虑新的AMD预测

将其转化为耗电量,我们可以看到预计每年电力消耗量将达到208 TWh。这接近西班牙这样一个主要国家的电力消耗量,西班牙是世界前20大经济体之一。

AMD以其功率效率自豪,他们推出的产品宣称功率类似于Nvidia的H100,但功率效率是后者的两倍。这可能会有所帮助,但很可能部署到总可寻址市场的芯片仍将来自Nvidia、AMD、Google、Microsoft、Amazon、Intel和最初的估计基础依然成立。

参考资料

  1. O’Dwyer, Karl J.和David Malone。“Bitcoin mining and its energy footprint.” in 25th IET Irish Signals & Systems Conference 2014 and 2014 China-Ireland International Conference on Information and Communications Technologies (ISSC 2014/CIICT 2014), 2014 p. 280–285
  2. de Vries, A. (2023). “The growing energy footprint of artificial intelligence.” Joule, 7(10), 2191–2194.
  3. EIA美国能源信息管理局国际能源仪表盘2017–2021, https://www.eia.gov/international/data/world/electricity/electricity-consumption?pd=2&p=0000002&u=0&f=A&v=mapbubble&a=-&i=none&vo=value&t=C&g=00000000000000000000000000000000000000000000000001&l=249-ruvvvvvfvtvnvv1vrvvvvfvvvvvvfvvvou20evvvvvvvvvvnvvvs0008&s=1609459200000&e=1609459200000&
  4. 剑桥大学剑桥商学院剑桥比特币电力消耗指数, https://ccaf.io/cbnsi/cbeci
  5. Somers, M,“How generative AI can boost highly skilled workers’ productivity.” MIT Sloan School of Management, https://mitsloan.mit.edu/ideas-made-to-matter/how-generative-ai-can-boost-highly-skilled-workers-productivity
  6. Hu, Q., Sun, P., Yan, S., Wen, Y.和Zhang, T., 2021, November.“Characterization and prediction of deep learning workloads in large-scale gpu datacenters.” In Proceedings of the International Conference for High Performance Computing, Networking, Storage and Analysis (pp. 1–15).
  7. Tom’s Hardware, AMD Advancing AI Event Live Blog: Instinct MI300 Launch, Ryzen 8000 “Hawk Point” Expected, December 6th, 2023, https://www.tomshardware.com/live/news/amd-advancing-ai
Leave a Reply

Your email address will not be published. Required fields are marked *