|
|
|
|
|
智博会上“点亮”,它为科学智能时代带来“算力Ready” |
|
|
5月28日,2026世界智能产业博览会(以下简称2026智博会)在天津开幕。在“人工智能核心技术”所在的N26展馆内入口不远处最显眼的位置,一台2米多高、占地约100平米、液冷机柜内“吐着泡泡”的庞然大物旁围满了观众。
2026智博会曙光展台上,处于点亮工作状态的万卡集群。赵广立 摄
它就是中科曙光展出的scaleX万卡超集群真机。“你觉得它大?我觉得一点也不大。要知道它可是一台10240张加速卡的超级计算机。这对于一套万卡集群来说,占地面积非常非常小了。”在前来参展的专业观众、中国科学院计算所博士生李征(应要求为化名)看来,这台敢于在展台上处于开机状态、甚至正在跑着应用的真机,就是本届智博会上最震撼的存在,堪称“镇馆之宝”。
在中科曙光董事长历军眼中,scaleX万卡超集群是一个答案——大模型参数规模指数级增长、科学智能(AI4S)时代脚步加快,全精度覆盖的大算力需求已从“可选项”变为“必选项”。在主论坛主题演讲中,历军进一步阐释:大算力不仅是AI基座大模型发展的前置条件,更是科学智能时代的“入场券”。
从数学模型到“数学模型+数据模型”的耦合
在当天的主论坛上,历军的演讲主题为《智算筑基点亮未来——AI for Science时代的“大科学”新基建》。谈及“智算筑基”如何“点亮未来”,他开宗明义:领先的人工智能超级计算机的计算性能“每9个月翻一番,每年增长2.5倍之多”。
“这是我们从事计算机研发的企业和机构需要共同面对的新挑战。”历军说,回顾中国计算产业三十年发展历程,先后经历过整机禁售、高端芯片被“断供”等被“卡脖子”的阶段,到今天,中国计算人已经实现突破。在下一个阶段,算力应用是“为数不多、主要的瓶颈”。
他提出,当下最大的变局在于AI正在重塑计算体系,传统超级计算机由数学模型驱动,无论是天气预报还是地理信息模拟,都是基于数学模型去模拟物理现象。但数学模型存在一个根本问题——对计算能力的需求几乎是无限的,比如要模拟地球,算力永远和尺度强相关;而人工智能数据模型的出现,与数学模型形成了互补效应。
“2024年诺贝尔物理学奖和化学奖的获奖者,无一不是采用了AI for Science的方法,大幅提高了模拟世界、认知世界的能力。”历军表示,这对算力的发展提出了全新启发:“下一个阶段的超算,一定是高精度计算能力和低精度计算能力紧耦合的方式。”
这正是曙光正在攻关的方向。历军透露,中国最高水平的高性能计算机即将诞生,它由10万个高性能GPU芯片组成,计算精度跨越双精度64位到整型8位,是一个“全精度计算系统”。目前,已在万卡级集群上完成了科大讯飞、智谱等企业的大模型训练,数十个应用跑出了“前所未有的性能”。
从“算力盒子”到“超算互联网”
在算力应用产业中,算力只是第一步,尤其是当下对算力最大的需求,是由AI搅起的一池“春水”——在算力快速发展的过程中,行业也逐渐形成一种共识:推动AI的进步,大规模的超节点必不可少;但推动AI真正赋能千行百业,更需要普惠、易用、可快速落地的算力底座。
在智博会的展区上,中科曙光解决方案与创新业务总经理张磊介绍说,中科曙光对算力底座的理解,为算力普惠提供了技术上和管理上的两个解决方案。
在技术上,“scaleX可以是万卡集群,也可以是几十张、几百张卡,”张磊对记者表示,你可以把scaleX超集群看做一个“算力盒子”,它不仅可以囊括你所需要的计算精度,还可以根据需要灵活适配所需的算力规模——比如给某个材料计算的团队一个40卡的集群。
在管理上,中科曙光全力支撑国家超算互联网平台的建设。据介绍,在科技部统一部署下,国家超算互联网平台目前已连接全国30多个超算中心和智算中心,提供300万个计算核心和20万个加速卡,拥有130万注册用户,日均作业量25万次。
“超算互联网的三大方向是:连算力、搭平台、建商城。”历军对超算互联网平台的未来愿景非常看好:“希望未来大家使用算力像淘宝一样简单,一个账号、一个支付宝,500块钱、100万都可以通过支付宝支付。”他提出,希望这个平台能够汇聚全国的算力企业,共同来打造中国计算生态。
从“单点爆破”到“开放生态协同”
据介绍,目前,中科曙光AI4S计算集群已升级至6万卡规模,迄今已完成70余项万卡规模测试。其中,3万卡算力已应用于蛋白质折叠模拟,4.5万卡算力实现414.7亿原子DFT精度模拟,十亿级网格仿真效率由周级提升至小时级。
从产业视角来看,scaleX超集群这样的成绩单,可以称得上“单点爆破”级表现了。但计算产业具有长链条特点,只有算力上的突破还不够。
就此,历军也指出,科学智能时代的挑战,并不只是“缺不缺算力”,更在于如何建立“数算模用”协同体系,让数据、算力、模型与应用真正联动起来,同时推动先进封装、硅光互联、先进散热、“算电耦合”等底层技术能力持续突破。
因此,生态体系建设至关重要。长期以来,中科曙光持续推进国产软件与模型开放生态建设,目前已深度适配400余个全球主流大模型,在流体、生物、量子力学、工业仿真等领域实现专业软件国产化适配与迁移优化,进一步推动AI基础设施从“建得成”走向“用得好”。同时,中科曙光还通过推出开放计算架构、汇聚“光合组织”生态等方式,推动行业内的系统集成和开放协同。
“我们希望通过超算互联网平台等一系列的创新机制,把算力企业和应用研究机构汇聚在一起,形成一个全国性的芯片系统应用产业链和创新链。”历军说,“算力Ready”是科学智能时代的必答题,希望通过开放协同,大家一起建设好“大科学”时代的新基建。
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。