
阿里云在 520 峰会上,交出了第一张 Agentic 答卷。
作者|郑玄
5 月 19 日的 Google I/O 上,谷歌最重磅的发布是一款叫 Gemini Spark 的个人 Agent ——跑在 Google Cloud 的专属虚拟机上,由 Gemini 3.5 和 Antigravity 框架驱动,深度接管用户的 Gmail 和 Workspace,24 小时在云端替人执行长任务。Sundar Pichai 在 keynote 上把它定义为「你的个人 AI Agent」。
几个小时以后,北京时间 5 月 20 日的杭州,阿里云在自己的年度峰会上交出了另一份答卷。和 Spark 不同,阿里云这次不是发一款 Agent,而是把整朵云按 Agent 的需求重做了一遍——它要解决的,是当 Spark 这样的 Agent 大规模跑起来时,云本身需要变成什么样。
如果只看发布清单,这是又一场密集的发布会:Qwen3.7-Max 登顶国产开源、Qwen3.6 系列下放、平头哥真武 AI 芯片披露 56 万片出货、百炼平台 SLA 4 个 9、新官网「千问云」上线、Agentic Cloud 体系亮相⋯⋯每一项单独拎出来都能写一篇报道。但把这些产品放在一起,会发现它们都围绕着同一件事:
阿里云正在把自己的整条技术栈,按照 Agent 的需求重新拆解、重新装配。
阿里云的这些动作不只是「AI 升级」,它更像一次「基础设施换底座」。阿里云将这套新架构称为 Agentic Cloud ——目标只有一个:让 Agent 成为云的一等公民,产品、API、计费、文档、官网全部围绕 Agent 重新设计。
01
重读这套四层架构
阿里云在台上画的那张技术栈图,支撑 Agent 的底座从下到上有四层:底层是平头哥芯片,倒数第二层是「为 Agent 而生」的云能力,中间是千问大模型,最后是模型推理平台百炼。

阿里云在 Agentic 时代重构技术栈|来自:阿里云 520 峰会
听起来还是熟悉的「芯片 - 平台 - 模型 - 应用」四件套。但仔细看每一层,每一层的定义都被改写了一次。
最容易被低估的,是中间的 Agentic Cloud。阿里云把它分成了两件事:一是给 Agent 跑起来提供基础设施(Agent Infra),二是把云产品自己变成 Agent 可以调用的能力(Agentic Products)。
第一件事的逻辑是:Agent 负载和传统在线服务,本质上是两种东西。传统云负载是稳态的 QPS ——一个网站每秒固定承载多少请求,资源按容量买。Agent 负载则是任务流——一个任务可能跑几秒、几分钟甚至几小时,结束就销毁,下一秒又突发起十万个新任务,每个任务有自己的依赖、自己的临时存储、自己的工具调用权限。
传统云做「资源调度」,Agentic Cloud 必须做「任务调度」。阿里云为此堆出了一整套围绕「短生命周期 + 突发 + 高并发 + 需要工具调用」这组新特征设计的组件——从任务级运行环境隔离,到多 Agent 编排、任务级身份鉴权,再到多模态记忆存储,每一项新特征,都不是为了人类用户。
第二件事更有意思——阿里云宣布了 12 条产品线、56 款产品的全面「Skill 化」。这是什么意思?过去你要用 OSS、用瑶池数据库、用 DataWorks,得读文档、写代码、调 API。现在阿里云把这些产品的核心能力封装成 Skill,Agent 可以像调函数一样直接调用,OSS Agent、StarOps、Dataworks Agent 已经先后落地。这件事的本质不是云产品变成了 Agent 的「下属」,而是让开发者用云产品的体验被 Agent 化——从读文档、调 API,变成任务级、交互式的对话,像给下属布置任务一样。这是云厂商真正要做的工作量最大的事:把所有存量产品的接口重新做一遍。
百炼这层则是 Agent 经济跑通的关键卡点。阿里云把它叫做「Agentic 时代的模型推理平台」,对外讲的是三个数字——冷启动降低 90% 以上、每分钟拉起 10000 个 Pod、SLA 4 个 9,背后解决的是 Agent 工作负载最棘手的「弹性 / 成本 / 效果」三难。
Agent 一旦投入生产,Token 消耗会暴增几个数量级,单纯按量调度的成本结构会迅速崩掉。百炼给出的答案是分四种计费形态——按 Token、PTU、MU、Batch API。把不同特征的 Agent 工作负载塞进最合适的计费模式里,再叠加 Prompt Caching 把重复上下文的成本砍掉九成。一个细节是,在 Claude Code 这类高频复用 prompt 的编程 Agent 场景下,百炼上报的重复上下文计算可降低 98% ——这个数字直接决定了一个企业能不能负担得起用 Agent 写代码。
模型层则是这套体系里最被验证、也最被低估的「非云」资产。在峰会上发布的旗舰模型 Qwen3.7-Max,在 Arena 全球大模型盲测总榜里超过了 Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,与 GPT、Claude、Gemini 同处第一梯队,国产模型登顶。开源侧的数字更醒目:千问衍生模型数量在 Hugging Face 上突破 20 万个,下载量过 10 亿次,全球开源模型采用率 53%,已经把 Meta-Llama 和 Google-Gemma 远远甩在后面。
Qwen 在开源生态里跑赢了,意味着大量第三方 Agent 框架默认会接入 Qwen —— Cursor、Claude Code、Qwen Code、OpenCode、Cline,几乎所有主流的编程 Agent 都已经支持把后端切到 Qwen。当一个开发者用 Qwen Coder 写完代码,下一步顺理成章地就是把推理放到百炼上跑——百炼现在是 OpenAI SDK 兼容、Bailian CLI 直接对接 Cursor 和 Claude Code 的状态。
而 Qwen 在 Agentic Coding 和 Tool Use 上的强项,恰好是 Agent 真正干活时最需要的两类能力。代码是 Agent 当下最被验证的生产力场景—— GitHub Copilot 数据显示,AI 生成代码占比已达 46%,Agent 编程会话时长从 4 分钟拉长到 23 分钟,78% 的会话涉及多文件操作。这些数字背后是一个简单的事实:编程 Agent 已经从演示走进生产线,而能做好编程的模型,就能吃到这个市场最先长出来的真金白银。
最底层的是平头哥,阿里自研芯片一直比较低调,但重要性一点不低。会上,阿里云宣布真武 AI 芯片累计出货 56 万片,覆盖 20 多个行业、400 多个客户,超过 30 家车企的智驾研发已经在阿里云上跑、累计使用真武芯片超 13 万卡。
加上倚天 Arm 服务器 CPU、镇岳存储主控、磐脉 400G 智能网卡构成的「四件套」,让阿里能把模型训练、Agent 任务编排、上下文长记忆读写、万卡集群互联做成一个系统级的整体优化。刘伟光在媒体沟通里反复强调一个词——「芯云模一体化」,意思是只有自己同时控制芯片、推理平台和模型,才有可能在 Token 成本上跑出系统级的性价比。
02
新官网背后意味着什么
把四层架构讲清楚,只是这次峰会的「明线」。
更值得分析的「暗线」,藏在阿里云这次同时公布的另一件事里:一个看起来不太起眼的新官网——千问云。

千问云官网|来自:千问云
它和阿里云自己原来的官网完全是两种东西。阿里云官网是一个典型的传统云厂商门户——产品线长、目录深、面向 IT 采购者;千问云则像一个 AI 时代的 Stripe 或 Linear,UI 极简,主体只剩下三件事:选模型、对比模型、用模型。它把 200 多款主流模型(Qwen、GLM、Kimi、DeepSeek、Wan 等)的 API 摆在最显眼的位置,模型的核心服务被打包成 Skills 和 CLI ——意味着 Agent 可以直接调用,连人类开发者都被当成次要用户。
刘伟光对外的原话是:「过去模型服务平台为人服务,未来用模型的主力将是 Agent,千问云正在全面重构模型服务平台,为开发者和 Agent 提供更友好的体验。」
这是新官网背后的含义:阿里云在公开承认,云的用户已经不再只是人了。
这件事的战略含义比看上去大。一旦云厂商接受「Agent 是新的客户」,意味着官网、计费、控制台、文档、SDK,整个云产品的用户界面都要重写一遍。Skill/CLI 化不只是一个 UI 改造,而是云产品要从「人能看懂的页面」变成「机器能直接调用的接口」。
千问云加上 56 款产品的 Skill 化,是阿里云对「Agent 是新客户」这个判断的第一次 GTM 尝试。即将到来的 Agentic AI 时代,谁先把「为 Agent 而生」的入口跑通,谁就先抢到下一阶段的开发者心智。
03
从「卖 Token」到「卖结果」
技术栈重构的下一步,是商业模型重构。这件事更难,也更能看出阿里云这次到底转了多少。
在和媒体的闭门交流里,刘伟光花了相当长的时间讲解阿里云销售端过去一段时间的变化——这部分内容比产品发布更值得细读。
第一,考核指标变了。阿里云销售从看 GPU 卖了多少、多少客户迁移上云,转向关注「为付费 Token 的企业客户数」、「Agent 自主完成闭环工作的比例」。这两个指标里没有一个是传统云销售熟悉的语言——付费 Token 客户数意味着客户真的在生产环境用 Agent 而不是 PoC;Agent 自主完成闭环更激进,相当于把「结果」作为衡量销售成败的标准。
第二,组织结构变了。阿里云成立了专注做在 MaaS 产品上的销售团队,和原有云销售团队「在局部打配合、在部分市场各自作战」。这是一个非常典型的「业务重构」动作——当新业务的 PMF、销售路径、客户决策链都和老业务不一样的时候,强行让老团队转型,效率远低于专门拉一支新军加入战斗。
第三,话语权变了。今天销售要卖 MaaS,要见的人变成了企业的董事长、CEO 或者业务负责人,而不是 IT 负责人。因为决定一个企业要不要全公司用 Agent,本质上不是一个采购决策,而是一个组织和业务决策。
第四,定价方向在迁移。刘伟光承认,按 Token 收费是目前市场上最普遍的方式,但「已经出现客户愿意为结果付费的苗头」。他给的判断是:终极目标是结果付费,但需要模型足够强大、Agent 足够稳定。这是一个非常诚实的现状描述——结果付费是方向,但要走过去,需要技术先成熟到一定程度。
把这四件事放在一起看,阿里云正在做的事情,远不只是「再卖一种产品」。它是在把云的价值衡量单位,从计算资源(GPU、弹性计算、网络,存储,大数据,数据库等)变成 Token,再从 Token 变成 Agent 跑通的具体业务结果。
这个过程里,阿里云面对的不只是技术栈重构,还有产品组合、销售考核、组织架构、客户对话方式的连环重构——每一环都很难,但都是通往下个时代的云必须走过的道路。
04
一次组织级的转身
阿里云接下来要打的,是一场比技术栈重构更复杂的硬仗——要在一个还没有定型的市场里,同时支撑多种 Agent 产品形态、多种销售路径、多种客户类型,并且自己内部还要从「卖云」的组织重塑成「卖 Agent 解决方案」的组织。
阿里云财报数字给出的反馈是积极的—— FY26 Q4 云外部收入增速加速到 40%,AI 相关收入占比首破 30%,AI 相关产品收入已经连续 11 个季度三位数同比增长,年化 AI 收入达到 358 亿。阿里全栈 AI 已经进入吴泳铭口中的「正向商业化回报周期」。
但财报反映的是过去一年的回报,而 5 月 20 日这场峰会真正押注的是未来三到五年的市场:当所有云厂商都在围绕 Agent 重构技术栈、重构销售、重构组织结构的时候,阿里云能不能比对手转得更快、更彻底。
从这次峰会能看到的信号是——它至少已经开始转了,而且转的不只是产品层。
这是一件值得继续观察的事。因为对一家像阿里云这样体量的云公司来说,最难的从来不是发布一个新产品,而是同时让产品形态、销售考核、组织结构、客户对话方式跟着新业务一起改变。
Agentic Cloud 的终局会怎样还说不清。但 5 月 20 日这一天,阿里云至少让外界看到了一件事:它愿意为这件事,把自己重新拆开装一遍。
* 头图来源:阿里云
本文为极客公园原创文章,转载请联系极客君微信 geekparkGO
极客一问
你如何看待 Agentic Cloud ?


登录后才可以发布评论哦
打开小程序可以发布评论哦