作者:赵广立 来源:中国科学报 发布时间:2024/10/13 10:13:56
选择字号:
未来计算,“超智”能否不分“你我”

 

今年5月,最新一期全球超算TOP500排行榜(即第63届HPC TOP500榜单)上,有两台集群系统让人眼前一亮:分别是排名第3位的微软Eagle系统和排名第10位的英伟达 Eos系统。

这两台集群之所以如此引人注目,并非是因为其排名,而是缘于它们都不是传统意义上的“超算”,而是当下炙手可热的“智算”。或者说,人们认为它们是“人工智能超级计算机”。

“这说明什么?说明大规模计算走向超智融合是大势所趋。”在9月底刚刚结束的第二十届中国高性能计算学术年会(HPC China 2024)上,国家高性能计算机工程技术研究中心副主任曹振南在接受《中国科学报》专访时表示:“超算和智算之间的界限正变得模糊,可以说它们本质上就是一类东西。”

超算与AI,双向奔赴

就在HPC China 2024开幕的前一天,中国智能计算产业联盟、国家高性能计算机工程技术研究中心等联合在武汉发布国内首部超智融合研究报告——《2024 中国算力发展研究报告之超智融合技术路线与趋势》(以下简称“研究报告”)。

超智融合研究报告发布仪式现场。国家高性能计算机工程技术研究中心 供图

  ?

该报告就“人工智能发展催生海量算力需求背景下,超算与智算技术如何融合发展?”“多元算力如何协同发力?”等前沿问题,作出了系统性的思考与探讨。

“超智融合成为热门话题,并不是因为它有‘话题度’,而是确确实实发生的事。”在发布现场,国家高性能计算机工程技术研究中心常务副主任何铁宁分享说,在当前的数智时代,“超智”的融合体现在数据层面、算法层面、业务层面和系统架构层面,可以说是无所不在。

他介绍说,例如在数据层面,现实世界许多场景缺数据,人工智能大模型即便想要构建该场景下的模型应用,也会“巧妇难为无米之炊”;数据何来?领域专业人士通过利用高性能计算进行建模、计算、仿真等,就能产生大量高精度、高质量的数据,这些数据都会成为训练大模型的“养料”。反过来,大模型训成后,也会成为人们用以发掘最新规律、科学发现的得力工具。

而在算法层面,科学家们也在积极地将超智两端的算法技术实现“互用”。例如,数值计算中的求解回归方程可以融入一定深度的神经网络,而在神经网络中也可以通过加入一些物理机制(如第一性原理等)来加速,提高算法效率。

业务层面的融合更加明显,创新药物研发、气象、智慧城市、工业制造等传统超算的“地盘”,都开始有了智能的影子。

上海超算中心主任李根国在现场分享说,上海气象局已经开始在利用传统高性能计算机做气象数值模拟的基础上,发展出了结合人工智能、大数据等技术的天气预报新范式;中国科学院上海药物研究所原本是典型的“超算用户”,但现在他们已经开始将药物研发与大模型结合起来,实现了创新药物研发效率提升数倍的效果。

数据、算法和业务上呈现的这些业态,都离不开底层架构上的超智融合。“一个全新的算力中心,要想数据有效地共享流通、发挥协同作用,必须依靠超智融合的、多元算力设施。”何铁宁说。

对此,中国工程院院士、鹏程实验室主任高文认为,智能超算和传统数值超算不同之处主要体现在是处理的对象是标量还是张量,以及数据的输入是一次还是自始至终。虽然二者相互关系的讨论还远没有定论,但必然逐步走向融合。

超智融合,一个有历史温度的话题

如果了解一点计算机技术发展史,大概可以知道,从第一台电子计算机开始,计算的发展脉络就与代表智能的“模拟神经网络”分道扬镳。直到20世纪90年代初,人们才在日本所谓“第五代计算机计划”的带动下,开始讨论“智能计算机”。

但是,“五代机计划”最终以失败(注:指未能实现既定目标为判据)而告终,此后的二三十年里,高性能计算机和智能计算机的各自发展像是两条平行线,超算和智能一个要求“算得快”、一个追求“算得巧”,最终走成了“两股道上的车”。

非常有意思的一件事是,就在日本科学家热火朝天地研制“第五代计算机”、意图实现人工智能计算的那些年里,中国的科学家通过“863计划”,依托国家智能计算机研究开发中心,开发出了中国第一代超级计算机。

用中国工程院院士李国杰的话来说,就是“我国其实是以智能计算机的名义发展了高性能计算机”。

近年来,随着深度神经网络的成功和大数据的兴起,使得超级计算和计算智能(以深度学习技术、大模型技术为代表)逐步走到一起,李国杰称之为“历史性的汇合”。具体体现为,高性能计算机大量用于人工智能的训练和推理,智能算法也在帮助加速传统的高性能计算。

如今,大模型训练等智能应用对算力更是高度依赖,传统超算跟智能计算更是形影不离、彼此难分。在最新一期HPC TOP 500榜单上,除了文章开头提到的两台典型的“智能超算”,其余大多数超级计算机都兼有专门的智算架构,是典型的超智融合下的“异构多元算力”。

从 for AI 到 being AI

何铁宁告诉《中国科学报》,前述围绕超智融合技术路线的研究报告,首次提出人工智能与计算是一种“双向赋能”。

研究报告认为,虽然超算在设计之初并不是专为人工智能算法而生,超算与智算的发展和应用也各有侧重,但随着彼此发展过程中互相借鉴、互相赋能,高性能计算与AI走向融合顺应潮流大势。

谈及超智融合,中国科学院院士、北京航空航天大学计算机学院教授钱德沛提出,超智融合在技术路径上需要从硬件、软件两方面综合考量,并且要在符合国情的前提下,做好软件和硬件的协同,以最佳匹配组合支持特定应用。

这也是他一直所希望看到的:我们可能在单点技术上暂时不能跟先进水平相匹敌,但可以通过系统性的创新协同发力——特别是在硬件层面和软硬结合层面,实现计算技术进步和支撑复杂场景应用“两开花”。

在钱德沛的构想中,超智融合的进程将会沿着“超算支撑AI应用”(for AI)、“用AI技术改进超算”(by AI)、“超智实现内生融合”(being AI)三个阶段演进。

“到了being AI阶段,计算机系统将内生智算属性,或者说智能是计算机的核心属性和基本组成,它的智能化水平可能远超今天的超算或智算。”钱德沛说。

在超智融合沿着For AI、By AI、Being AI的路径演进的过程中,硬件能力是先进计算平台是汇聚超智互动生态的有效承托。换言之,如果用户可以一站式获得通用、全精度的高算力硬件设施,包括“混合精度计算”在内的各类不同精度的算力需求(包括通用计算和智能计算)就能快速得到满足。

前述研究报告提到,国内涌现出来的一些先进计算平台如国家超算互联网,是超算、智算基础设施融合演变的重要依托,这些平台通过链接全国的超算、智算基础设施,汇聚全国各个算力中心的异构算力资源,不仅让用户便捷地获得所需计算服务,还可让多个超算中心、智算中心之间能够更加紧密地耦合,从而可以更高效地共同应对大型复杂计算难题。

据曹振南介绍,自从2024年4月11日国家超算互联网平台正式上线以来,平台依托一体化的算力调度、数据传输、生态协作体系,紧密连接供需方,通过市场化的运营和服务体系,实现了算力资源统筹调度。

“截止8月底,超算互联网平台已链接超280家服务商,提供超6300个计算商品,可为上百个行业以及1000多个应用场景提供算力服务。”曹振南说,国家超算互联网正成为先进算力底座。


 
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
珠穆朗玛峰因何成为世界最高 极目卫星团队在伽马暴研究中取得重要进展
实践十九号卫星成功发射 他们的15年“铸剑”之路
>>更多
 
一周新闻排行
 
编辑部推荐博文