在11月8日在京举行的第七届中国超级算力大会(ChinaSC 2025)上,由中国科学院计算技术研究所研究员张云泉、清华大学教授陈文光、美国阿贡国家实验室Pavan Balaji研究员和瑞士苏黎世实验室Torsten Hoefler教授共同发起的世界人工智能算力性能排行榜——AIPerf500发布。
榜单发布人、清华大学计算机系长聘教授翟季冬介绍说,AIPerf是面向智能算力评估的国际性排行榜,其于2020年首次在中国超级算力大会上发布榜单。相比传统超算性能排行榜,AIPerf榜单是对智能算力评测领域的有效补充。
翟季冬发布AIPerf榜单。图源:ChinaSC 2025,下同
“中国的智算、超算等算力发展非常迅速,许多省市都建设了智算中心。”翟季冬说,对于公众而言,人们需要一个简单明晰的指标来了解“哪个智算中心的算力更强”“智算中心的算力到底如何”等问题,AIPerf就是在此背景下诞生的。
今年的AIPerf延续了2024年的做法,包含三部分:采用经典卷积模型评价智能算力训练性能的AIPerf、以大语言模型训练效果评价智能算力性能的AIPerf-LLM、以大模型推理效能评价智能算力性能的AIPerf-Inference。
据介绍,AIPerf测试程序具有“提供一个分数”“可变计算规模”“计算有人工智能意义”“多机通信可以少但不能没有”等特点,其得分结果对于可测评系统的训练性能有直观反映。
在今年的排行榜上,北京超级云计算中心提交的两台新机器榜上有名,分别位列该榜单第一、第三位。作为,位于榜首的“新面孔”,北京超级云计算中心以NVIDIA RTX5090打造的系统,共有1194个节点,总卡数近万张;此前的榜首、由鹏城实验室与华为公司联合打造的AI计算系统——“鹏城云脑II”屈居次席。
基于AIPerf-LLM,翟季冬发布了以“大模型训练能力”作为区分的算力排行榜。在可测的若干智能计算系统中,北京超级云计算中心、阿里云部署在复旦大学的智算集群等位列前茅。
AIPerf-Inference有两个榜单,分别为“吞吐榜”和“延迟榜”,以适应不同推理任务的不同特征需要。其中,在“吞吐榜”上,北京超级云计算中心2台智算系统、新疆数算电科技技术有限责任公司和北京清程极智科技有限公司共同开发的系统位列榜单 Top3。
张云泉和翟季冬为上榜单位(部分)颁发证书。
“随着AI的发展,我们计划增加一个以大模型Tokens调用性能为评测基准的榜单AIPing (aiping.cn),评测不同MaaS平台的服务性能。现在还在筹划阶段,希望征求一下同行领域专家的建议。”翟季冬说,目前团队已经在这方面做了一些准备和测试工作,“今年只是抛一个砖,未来希望有更多的MaaS(模型作为服务)平台开展性能测试”。
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。