作者:赵广立 赵宇彤 来源: 中国科学报 发布时间:2024-11-4
选择字号:
预警!生成式AI将制造巨量电子垃圾

 

■本报记者 赵广立 见习记者 赵宇彤

即便做了充足的心理准备,汪鹏仍感到形势严峻——如果不采取循环经济策略,生成式人工智能(AI)到2030年预计累计产生500万吨电子废弃物,“或将给人类可持续发展带来重大挑战”。

随着AI的飞速发展,有关生态环境的隐忧浮出水面:能耗增高、碳排放激增……种种讨论里,唯独缺少对算力设施及硬件报废产生的电子废弃物的关注。

瞄准这一空白,中国科学院城市环境研究所研究员汪鹏及其团队实习生张凌宇,联合该所研究员陈伟强和以色列瑞赫曼大学教授阿萨夫·察科尔,率先开展生成式AI带来的电子废弃物挑战的量化分析。他们发现,如果不采取循环经济策略,2023年至2030年生成式AI带来的电子废弃物将累计达120万吨至500万吨。相关研究成果近日在线发表于《自然-计算科学》。

审稿人认为“这项研究率先尝试量化AI对电子废弃物的影响,重要而且迫切”。

看纪录片诞生的想法

“‘挖矿’需要耗费大量电力,并带来大量二氧化碳排放,以及电子垃圾生成。”正在观看纪录片《永远吹冲锋号》的汪鹏听到这句话时愣了一下,一个念头一闪而过:正在飞速发展的生成式AI会不会也产生了许多电子垃圾?

基于这个想法,他展开了一系列的文献阅读及调研,发现围绕AI与可持续发展的讨论主要集中在能源、碳排放等方面,几乎没人系统研究其潜在的电子废弃物问题。

“这个研究方向有搞头!”汪鹏心想。不久后,美国AI企业英伟达召开的一场发布会让他坚定了这个念头。2024年3月,英伟达推出的Blackwell计算平台重量达1.36吨(约3000磅),相当于一辆碳纤维法拉利。

“生成式AI的底层是一个材料密集型行业。”汪鹏感慨道,数据中心和服务器群中包括多种高性能计算硬件,比如图形处理器(GPU)、中央处理器(CPU)、内存模块、存储设备等,且服务器寿命普遍在3年左右。当其寿命结束后,就会成为电子废弃物。

综合考虑后,汪鹏团队决定着手开展生成式AI电子废弃物的研究。但很快,一个难题摆在了他们面前——怎样关联、量化生成式AI硬件需求以及产生的电子废弃物数量?

就生成式AI而言,一方面,其迅猛发展带来了大规模计算需求,对计算硬件和基础设施的需求持续增长;另一方面,芯片制程工艺的进步带来芯片性能的快速提升,单个芯片性能越高,同样算力需求下所需的芯片数量越少。

未来生成式AI的发展和应用如何?会产生多少算力需求?具体到硬件层,需要多少芯片和服务器?受地缘政治影响,如何考量不同地区的硬件差异?这一连串问题让汪鹏团队犯了难。

不容忽视的全球性挑战

汪鹏团队决定以大语言模型为研究重点,“兵分两路”。

一方面,在预测未来大语言模型的算力需求时,该团队参考了产业界多方预测及行业研究报告,预设了3种不同的发展情景,分别是广泛应用的“激进发展情景”、有限应用的“中等发展情景”,以及少数特定应用的“保守发展情景”。

同时,汪鹏团队通过评估大语言模型参数规模、训练数据量、全球大语言模型数量、每日活跃用户数等因素,推导出不同发展情景对算力需求的年复合增长率分别为136%、115%和85%。

另一方面,芯片性能考量尤为关键。基于摩尔定律,汪鹏团队根据2020年至2022年服务器的增长数量,推算2023年至2030年服务器的算力水平变化。出于地缘政治的考虑,他们相应调整了中国、美国、欧洲等国家和地区的芯片性能及发展水平。

此外,目前只有少数企业具备生产先进GPU芯片的能力。该研究基于这些企业过往两年的产能及出货量情况,设置了未来GPU产能扩展率的限制条件,构建了产能约束的发展情景。

基于上述思考,汪鹏团队创新性地开发了“算力物质流(CP-MFA)”模型,对AI“需求-算法-算力-芯片”进行分层解构及参数化建模。“该方法有效串联了AI终端服务需求与底层物理世界,为今后围绕AI硬件设施的相关研究提供了重要基础工具。”汪鹏进一步解释道。

模型推演结果显示,如果不采取任何循环经济措施,2030年,生成式AI产生的电子废弃物将高达250万吨。2023年到2030年,在激进、中等和保守情景中,产生的电子废弃物总量分别是500万吨、300万吨和180万吨。

做个“吹哨人”

提及生成式AI的爆发式增长,总是绕不开著名的阿玛拉定律:“人们总是高估一项科技所带来的短期效益,却又低估它的长期影响。”

“生成式AI的发展带来了革命性的变革和机遇,这是非常好的事情。但我们必须清晰界定,从长远来看,这项技术会带来哪些挑战和负面影响,提前预警、重点防范。”汪鹏告诉记者,“考虑到生成式AI发展速度很快,为了更及时预测、预警电子废弃物问题,不同于以往按年度划分,我们选择以季度为单位展开研究。”

应对这一挑战,汪鹏团队基于“需求-算法-算力-芯片”框架,提出了全链条循环经济策略。

从算法层面,探索设计更加高效的算法,减少算力消耗;从芯片层面,通过高效芯片开发,减少不必要的计算和存储,提高数据处理的性能和效率,可以较预期减少约50%的电子废弃物;在运营层面,将寿命结束的服务器降级循环利用,额外使用一年,就能够避免约62%的电子废弃物的产生;拆卸、翻新和重新制造已过时服务器的关键模块则能减少42%等。

但这些措施要想真正落地,还有很长的路要走。汪鹏团队调研发现,全球只有零星几家企业针对该问题提出了应对策略。

“相关企业应该加快行动,积极应对这一挑战。”汪鹏说。当前,生成式AI的发展仍在“跑马圈地”,快速增长的背后潜藏着很多问题,距离真正“负责任”的AI还任重道远。

“由于生成式AI催生了更高的算力要求,数据中心重复建设的问题越发突出。”汪鹏举例说,“比如一些厂商想要独立开发算法,就难免会重复训练,这可能导致比模型估算结果更多的电子废弃物产生。”

面对现实挑战,汪鹏坦言,该研究只能发挥类似“吹哨人”的作用。“未来,我们这项研究还将进一步深入,实现更加精准、全面的AI电子废弃物的监测,同时关注AI引发的更多资源环境问题及相关技术挑战。”汪鹏期待,通过这一研究推动更多国家及企业出台相关举措,让AI更“负责任、可持续”。

相关论文信息:

https://doi.org/10.1038/s43588-024-00712-6

《中国科学报》 (2024-11-04 第1版 要闻)
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
生物多样性保护只看物种丰富度,可行吗? 秦岭发现大型真菌新物种
迄今最大猪笼草之一现身婆罗洲 地球多了个临时的迷你月球
>>更多
 
一周新闻排行
 
编辑部推荐博文