|
|
|
|
|
阿里云要把云产品,都变成“Agent能用的东西” |
|
云的用户正在从人变成Agent |
作为国内市场份额第一、也是亚洲最大的云服务商,阿里云最近正聚焦于这件事:把过去十几年为人设计的云产品,全部改造成智能体(Agent)能直接使用的东西。
5月20日,阿里云在峰会上宣布完成“芯片-云-模型-推理”全栈Agent化升级,并推出全新AI产品官网“千问云”、自研AI芯片真武M890和搭载该芯片的超节点服务器,以及旗舰模型Qwen3.7-Max。
这是国内云厂商首次围绕Agent进行全栈发布。阿里云资深副总裁刘伟光在峰会上说,Agent突破临界点后可以24小时不间断工作,对AI和云的需求将“无穷无尽”。因此,阿里云决定把云产品变成Agent能够理解、调用和执行的基础设施,进而建设“中国最大的AI工厂”。
从芯片布局,给Agent搭好“硬件地基”
Agent的任务特点是毫秒级连续调用、海量并发、长短任务混杂,这对算力、网络、存储的协同提出了极高要求。在峰会上,阿里云亮出了目前国内云厂商中唯一一张覆盖算力、网络、存储的全自研数据中心芯片矩阵。
峰会上,阿里云重磅发布了磐久AL128超节点服务器。它基于新一代AI芯片真武M890搭建,并搭载自研互联芯片ICN Switch 1.0。这台服务器能把128张AI芯片变成一台“超级计算机”,芯片之间的点对点(P2P)通信时延低于150纳秒。它的设计目标很明确:同时扛住Agent场景下的大规模并发推理和大模型训练。目前该服务器已上线阿里云百炼平台,支持Qwen、DeepSeek、Kimi等主流模型。
除了AI芯片,阿里云还拥有自研的“倚天”系列CPU、“磐脉”智能网卡、“镇岳”存储主控芯片,以及ICN Switch互联芯片。平头哥半导体副总裁高慧解释说:“Agent在毫秒间可能连续发起数十次模型调用,需要CPU、GPU、网络、存储紧密协同。全栈芯片矩阵的目的,就是让算力、网力、存力不再各管各的,而是像一个团队那样配合。”
平头哥还首次公布了真武系列芯片的路线图:未来两年将陆续推出算力更强的真武V900、真武J900。截至目前,真武系列AI芯片累计出货56万片,服务了中国电信、中国一汽、浦发银行等20多个行业的400多家客户。
把云产品“翻译”成Agent能读懂的指令
芯片提供了底层能力,但更棘手的问题在上层。传统云产品的设计语言是给人类用的:控制台上的菜单、按钮、配置项等等,Agent根本看不懂。
阿里云的做法是,对云产品进行“三化”改造:Skill化、MCP化、CLI化。用大白话来讲,就是把每一个云产品的功能,打包成一个Agent可以像调用函数一样直接使用的标准化模块。
对此,阿里云首席技术官李飞飞表示:“传统云产品的交互逻辑是为人类设计的——用户看着控制台点击按钮,或者通过API编写代码调用。但Agent的工作负载完全不同:无规律弹性、短生命周期、瞬时起量即走。它没法‘看’界面,它需要的是结构化指令和可预期的反馈。”
为此,阿里云为Agent搭建了一套完整的运行环境支撑:提供轻量高效的沙箱执行环境(让Agent安全地执行代码)、多Agent协同能力、跨任务记忆能力、数据流转通路,以及全域智能运维。这套环境的目标就是瞄准Agent运行——让Agent“来了就能干活,不用人盯着”。
不断迭代模型,让Agent长出“真本事”
有了硬件和云产品改造,还差一样东西:足够聪明的“大脑”。阿里云现阶段给出的答案是Qwen3.7-Max。
据了解,近3个月内,千问旗舰模型连续迭代了3.5、3.6、3.7三个版本,更新节奏明显加快,目的就是为了匹配Agent时代对模型能力快速增长的需求。在三方机构Arena的全球大模型盲测总榜中,Qwen3.7-Max与GPT、Claude、Gemini的最强模型接近。
“大模型正在经历一次范式转移——从对齐人类偏好,到对齐任务目标。”阿里巴巴通义大模型事业部负责人周靖人谈道,Qwen3.7-Max的设计初衷,就是让模型真正成为Agent的智能内核,具备自主规划、持续迭代、跨工具协作的能力。
“过去我们追求模型‘说得好’,现在要求模型‘做得到’。” 周靖人表示。
周靖人在峰会现场分享了一个Qwen3.7-Max自主工作的真实案例:在一块它从未“见过”(训练时没接触过)的真武M890芯片上,Qwen3.7-Max仅凭一份任务说明,从零开始自主工作35小时,独立完成了一个生产级AI计算内核的编程和调优。结果性能比官方版本还高出10倍。整个过程中,没有任何人类干预或中间指导。
周靖人认为,这个案例的价值在于:模型不再只是“回答问题”,而是能“自主完成复杂工程任务”——这正是Agent最需要的核心能力。
给Agent一个“生产车间”
“地基”(硬件)和引擎(模型)有了,云产品也做了改造,但Agent还需要一个地方“跑起来”——这是推理平台和产品入口的角色。
阿里云的百炼推理平台,给Agent提供了这样一个“生产车间”。据阿里云百炼技术负责人于文渊介绍,百炼技术平台构建了大规模的GPU资源集群,它通过“并池调度—上下文缓存—吞吐弹性调度—强化学习机制”这一套完整的技术栈,来应对Agent场景的特殊挑战。
百炼还内置了安全治理能力。于文渊提出,这一点在Agent自主运行的语境下尤为重要——一个24小时不间断干活的Agent,如果没有边界约束,后果不可控。百炼的安全机制确保Agent始终在预设的权限范围内行动。
在生态上,百炼保持开放。除了阿里自研的千问模型矩阵,平台还将接入智谱GLM-5.1、MiniMax M2.7、月之暗面Kimi K2.6、可灵、Vidu Q3等第三方模型。
阿里云给这个“生产车间”准备一个入口,它就是“千问云”。
刘伟光说,千问云是阿里云成立17年来,首次在阿里云官网之外推出的独立产品官网。打开这个网站,你会发现它没有任何传统意义上的导航、菜单或控制台。首页只有一行字:npx skills add QianWen-AI/qianwen-ai
这是一条Agent可读的指令。刘伟光表示,阿里云把所有模型服务的核心能力封装成了标准化的Skills和CLI工具。Agent读取这条指令后,就能“学会”整个网站的能力,并根据需求自主调用。
换句话说,用户只需要说一句自然语言指令,Agent就能完成从识别资源、选择模型到部署应用的全部流程。过去“人登录控制台—选产品—配参数—调API”的链条,被压缩成了“人给意图—Agent干活”。
从自研芯片到云产品改造,从模型快速迭代到“千问云”这样专为Agent设计的入口,阿里云正在做一件动静很大、但逻辑清晰的事:把过去为人类设计的云,重新做一遍,让Agent成为云的“一等公民”。
至于这条路能否走通,阿里云认为,市场很快会给出答案。据最新的阿里云财报数据显示,AI模型及应用服务的ARR(年度经常性收入)已超过80亿元,预计年底突破300亿元。
“Agent驱动的MaaS收入,将取代ECS成为阿里云最大的产品线。”刘伟光展望道,未来,以Token为计量单位的AI收入,也将成为阿里云新的增长引擎。
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。