|
北京超算首席技术官甄亚楠: |
“智算”是超算的独特场景,线上算力服务已成熟 |
|
近日,由中国计算机学会主办的第21届全国高性能计算学术大会在内蒙古鄂尔多斯召开。大会期间,北京超级云计算中心(以下简称“北京超算”)首席技术官甄亚楠接受了《中国科学报》专访,就“超算”“智算”的算力服务现状提供了一线视角,并对行业对多元化人才的需求发表了看法。
甄亚楠接受《中国科学报》专访。CCF HPC China 2025组委会供图
?
大规模“智算”本质上仍是“超算”
关于传统超算(一般指高性能计算)和智算之间的联系和区别,甄亚楠从人们对北京超级云计算中心的称呼上给出了独特的解读。
“业内为了方便称呼,叫我们‘北京超算’,这也确实与我们主要业务有关,因为北京超级云计算中心就主要做超算服务,从最初的单一集群的运维、运营、管理到现在可以跨省市、跨地域对多个超算中心的运营管理。”甄亚楠说。
不过,近年来以GPU算力集群为代表的“智能算力”崛起,“北京超算”旗下的业务有一半都变成了“智算”,有人开玩笑称“北京超算”快要变成“北京智算”了。
“智算确实已经成为中心非常重要的业务方向。但就名称而言,我们内部有一个非常重要的共识,那就是以加速卡为主的计算应用其实也是超算中一个独特的场景。”甄亚楠说,放眼国际,即便英伟达公司自建的一些大型算力集群,他们的叫法也是“Super Computer”(超级计算),所以大规模的智能算力,“本质上来讲仍然是超级计算”。
不过他告诉记者,超算算力和智算算力在资源形态上确有不同。“过去大家的应用软件和程序都是围着CPU来运转的,但现在有非常多的如材料或生命科学类的软件开始在用诸如GPU等加速卡来实现计算的加速。”甄亚楠说,随着AlphaFold 等AI for Science应用走上历史舞台,现在许多用户开始尝试用AI技术手段来解决以往超算所不能解决的问题。
那么,在一线算力服务供应商的视角,传统超算、智能计算的边界是什么?
“我们其实并不太在意智算、超算的边界在哪里,我们关注的是如何解决用户提出的计算需求,帮助用户更快的解决这些计算问题;用户更关心用什么软件、需要多长时间能完成计算任务。”甄亚楠表示,不同计算任务对软件、算力要求不尽相同,在实现计算任务过程中,“超智融合”应用的情况也不在少数。
北京超算(中卫)算力基地效果图。北京超算 供图
?
线上算力服务的业务链已走通
如今的北京超级云计算中心,平台注册用户超过16万。纵观其算力资源池,除北京之外,该中心还在宁夏中卫、内蒙古和林格尔新区等“东数西算”国家节点中部署了算力资源。
“把算力资源部署在西部等地区,给我们带来至少两大优势。一是成本优势,中卫、和林格尔新区等地温度环境适宜,综合运营成本更低;二是当地风、光、煤等电力资源丰富,有非常好的电力保障。”甄亚楠告诉记者。
而从提供计算服务的角度,甄亚楠表示,现在用户通过线上服务获取算力资源的业务链条已经很成熟了,他们在平台访问、计算任务调度等方面也不断优化。
“我们最大的单一集群大概在3000个计算节点左右,而国内可以调度的计算集群大概有20个,其实已经能很好地满足某一单位或某一批用户的计算任务需求。”甄亚楠说,北京超级云计算中心的用户——尤其是超算用户,大都可归类为“中小用户”,使用的算力总量在千核范围内者居多,用户几乎都能在第一时间获得对应的算力资源和服务。
不过,他们也会不断遇到需要算力资源跨区域调度的问题。
“比如我们在服务制造业用户的过程中,在业务高峰时期,研发人员提交上来一批计算任务,经常会遇到计算量激增的情况,对于传统超算中心来讲,仅能够在单一集群峰值规模范围内完成。”甄亚楠说,在这种情况下,他们的“应用云”就派上了用场。
“用户把计算任务提交到应用云平台,我们就能对齐进行自动化调度,分配给现有资源池中的算力资源。”甄亚楠说,待不同区域的计算集群完成计算任务后,数据文件会自动回传给用户本地的数据资源池。他表示,这种模式在制造业或企业级生产场景中比较多见,有时候会应用户需求架设数据传输的网络专线,来加速数据的回传。
他告诉《中国科学报》,目前,北京超级云计算中心的用户来自300多家科研院所、400多家高校以及600多家各类企业,服务领域涉猎新能源汽车、商业航天、医疗医药、高端制造、AI服务等各行各业,“也代表着超算现在已经在服务千家万户了”。
算力服务有望成为下一个IT行业
在采访中,甄亚楠透露,目前北京超级云计算中心的技术团队成员平均年龄在30岁左右,“比较年轻,但许多员工已经入职5年甚至10年以上”。
他表示,欢迎越来越多的人才投身于算力服务行业中来。他认为,就像当年的IT行业那样,计算服务也正逐渐成为“高精尖人才聚集地”的代名词。
“人们对算力的追求是无止境的,因此算力这个行业也有无限的可能性。”甄亚楠说,随着计算技术和应用的快速发展,算力服务人才队伍也越来越多元化,不仅需要计算机、网络、硬件、人工智能等专业人才,还需要大气物理、新材料、生物医药等各方面的新兴行业人才,共同推动算力资源更高效的应用服务。
“我们对各类高科技人才的需求也比较大。”甄亚楠表示,算力服务是朝阳行业,北京超级云计算中心近年来也在推动提高专业技术人才的福利待遇,进一步彰显行业价值。
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。