|
|
张云泉委员:好提案是“跑出来的”,不是“一锤子买卖” |
|
“前两年,我的提案关注‘东数西算’宏观布局,今年更聚焦于‘超智融合’趋势下的发展问题。”3月4日,全国政协委员、中国科学院计算技术研究所研究员张云泉在接受《中国科学报》采访时说,这几年他都围绕算力基础设施建设的相关议题“跑”提案。
用张云泉的话来说,一份好的提案不是写出来的,而是跑出来的。在过去一年的时间里他走访了国内大大小小的多家算力中心及相关企业,对于当下算力产业发展状况有了细致了解。
张云泉委员。本人供图
?
作为计算领域的专家,张云泉今年准备再次围绕算力设施建设与智算产业发展,提出以超智融合突破“算力围城”的新提案,呼吁加快高端算力设施建设,提升算力使用效率,以应对人工智能大模型快速发展所带来的“算力围城”困局。
“政协委员提案不是‘一锤子买卖’,不光要四处调研发现问题、写成提案指出问题,还要持续跟进解决问题。”张云泉说。
“随着DeepSeek等AI开源大模型涌现,大模型在各个行业的应用不断变多,这对算力基础设施建设提出了新需求。”张云泉对国内的算力产业发展洞若观火:当前算力市场存在供需性矛盾——算力结构单一、高端算力紧缺,同时,算力基础设施与国际领先水平存在代际差异,制约了大模型迭代创新速度。
“我认为这种供需失衡,首先反映在规模上。”他介绍,目前国内公开的主要智算中心单体规模仅在100~1000Pflops(1Pflops即每秒千万亿次浮点运算)之间;而高端智算中心要求具备万卡级分布式训练能力,性能需达到10Eflops@BF16以上(1Eflops即每秒百亿亿次浮点运算,BF16是一种16 位的浮点数数据格式,此处指“BF16精度的性能不低于10E”)。另外,部分智算中心只考虑低精度训练算力需求,未结合行业场景考虑混合精度融合算力需求,导致通用性不强;而国产高性能可扩展并行训推编程框架和优化工具链的缺失还导致国产大规模智算机群计算效率普遍偏低,可扩展性不高。
对于算力设施建设与智算产业发展的诸多痛点,张云泉呼吁,一方面要从算力供给侧引导高端算力发展走“超智融合”技术路线,建设大算力、全精度、高互联的高端智算中心,并发展先进存力,促进产业界均衡配置算力与存力资源;另一方面要从算力应用侧,重点支持头部基础大模型企业,打造世界领先开源开放主权级基础通用大模型,鼓励开放更多应用场景。
他介绍,“超智融合”是计算领域近年来的热点话题,其核心思想是将超算与智算的能力相结合,以满足在人工智能高速发展背景下的各行业多元算力需求。对此我国已有相关布局,如国家超算互联网等算力平台,正成为国内“超智融合”技术演变的重要依托。
张云泉多年对算力设施的建言,也逐渐发挥着作用:2023年他提出《关于合理规划算力网建设,确保东数西算健康发展》提案,建议建设国家级算力调度和交易平台,目前已得到相关部门的正式答复和办理。
谈及他对算力建设的坚持,张云泉笑称:“提案就像种树,不能只播种不养护。既然担任了政协委员,就得为数字中国栽种好算力这棵大树。”
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。