评估“智算”性能的排行榜迎来“年度刷新”—新闻

作者：赵广立来源：中国科学报发布时间：2024/11/17 15:57:45

选择字号：小中大

2024人工智能算力性能500排行榜出炉

评估“智算”性能的排行榜迎来“年度刷新”

在11月15日举行的第六届中国超级算力大会（ChinaSC 2024）上，由中国科学院计算技术研究所研究员张云泉、清华大学教授陈文光、美国阿贡国家实验室Pavan Balaji研究员和瑞士苏黎世实验室Torsten Hoefler教授共同发起的世界人工智能算力性能排行榜——AIPerf500发布。

AIPerf是面向智能算力评估的国际性排行榜，其于2020年首次在中国超级算力大会上发布榜单。相比传统超算性能排行榜，AIPerf榜单是对大规模计算系统人工智能算力评测领域的有效补充。

“不少地方都投入了大量资源和财力建设智能计算平台，公众需要一个简单明晰的指标来了解‘哪套智算中心的人工智能算力更强’‘整个算力领域的发展状况如何’等问题，AIPerf就是在此背景下诞生的。”榜单发布人、清华大学计算机系长聘教授翟季冬介绍说：“好的指标可以引领领域的健康发展。”

榜单发布人翟季冬。本文图片均由ChinaSC 2024提供。

记者注意到，与往年相比，今年的AIPerf扩充至三个榜单，除了“采用经典卷积模型评价智能算力训练性能”的AIPerf、“采用大语言模型评价智能算力训练性能”的AIPerf-LLM之外，本次AIPerf新增了评价智能算力推理性能的AIPerf-Inference。

为何要新增一个评价智能算力推理性能的榜单？翟季冬解释道：“随着基座大模型趋于稳定，未来AI推理的需求将与日俱增。从公开数据可以看到，目前推理的算力需求增长远高于训练，因此有必要推出一个新的排行榜以比较智算中心的推理性能。”

据介绍，AIPerf测试程序具有“提供一个分数”“可变计算规模”“计算有人工智能意义”“多机通信可以少但不能没有”等特点，其得分结果对于可测评系统的训练性能有直观反映。在今年的排行榜上，鹏城实验室与华为公司联合打造的AI大科学装置——“鹏城云脑II”继续蝉联榜首，该系统以“华为昇腾910+鲲鹏920”的CPU+AI加速芯片组合为AI训练提供澎湃算力；近期新建（含共建）了多个智能计算中心的“北龙超云”，占据了榜单TOP5之外的4席。

基于AIPerf-LLM，翟季冬发布了以“大模型训练能力”作为区分的算力排行榜。在可测的若干智能计算系统中，北京超级云计算中心、复旦大学人工智能创新与产业研究院、算力智能（宿州）科技有限公司提交的智能计算系统位列AIPerf-LLM Top3。

AIPerf-Inference有两个榜单，分别为“吞吐榜”和“延迟榜”，以适应不同推理任务的不同特征需要。在“吞吐榜”上，由新疆数算电科技技术有限责任公司和北京清程极智科技有限公司共同提交的系统排名第一，北京超级云计算中心、中国人民大学、清华大学、新疆数算电科技技术有限责任公司提交的智算系统位列2~5位；“延迟榜”上，北京超级云计算中心、联泰集群(北京)科技有限责任公司、中国人民大学、上海交通大学、天津提尔科技有限责任公司提交的系统位列TOP5。

AIPerf三大榜单（部分排名）。

现场对前述榜单中表现优异者颁发了纪念奖项。翟季冬介绍说，AIPerf排行榜的推广工作仍在进行中，其官方网站也会根据新增系统得分动态更新排行榜单。

“我相信肯定还会有更大、更优的集群或智算中心（加入测试），欢迎大家参与‘打榜’。”他表示，下一步，AIPerf 还会在支持更多国产芯片、支持在线推理场景、支持AI算子评测、进一步国际化推广等方面扎实推进。

张云泉和翟季冬为上榜单位颁发证书。

编辑部推荐博文
基金申请季，这里有2份攻略请查收！科学网2026年1月十佳博文榜单公布！环境与地球科学领域：1月学科资讯植物顽强，植物智慧妥善使用AI，不要被愚弄运动重塑大脑——提升身体耐力更多>>