阿里云的「Agentic 时刻」

阿里云在 520 峰会上，交出了第一张 Agentic 答卷。

作者｜郑玄

5 月 19 日的 Google I/O 上，谷歌最重磅的发布是一款叫 Gemini Spark 的个人 Agent ——跑在 Google Cloud 的专属虚拟机上，由 Gemini 3.5 和 Antigravity 框架驱动，深度接管用户的 Gmail 和 Workspace，24 小时在云端替人执行长任务。Sundar Pichai 在 keynote 上把它定义为「你的个人 AI Agent」。

几个小时以后，北京时间 5 月 20 日的杭州，阿里云在自己的年度峰会上交出了另一份答卷。和 Spark 不同，阿里云这次不是发一款 Agent，而是把整朵云按 Agent 的需求重做了一遍——它要解决的，是当 Spark 这样的 Agent 大规模跑起来时，云本身需要变成什么样。

如果只看发布清单，这是又一场密集的发布会：Qwen3.7-Max 登顶国产开源、Qwen3.6 系列下放、平头哥真武 AI 芯片披露 56 万片出货、百炼平台 SLA 4 个 9、新官网「千问云」上线、Agentic Cloud 体系亮相⋯⋯每一项单独拎出来都能写一篇报道。但把这些产品放在一起，会发现它们都围绕着同一件事：

阿里云正在把自己的整条技术栈，按照 Agent 的需求重新拆解、重新装配。

阿里云的这些动作不只是「AI 升级」，它更像一次「基础设施换底座」。阿里云将这套新架构称为 Agentic Cloud ——目标只有一个：让 Agent 成为云的一等公民，产品、API、计费、文档、官网全部围绕 Agent 重新设计。

重读这套四层架构

阿里云在台上画的那张技术栈图，支撑 Agent 的底座从下到上有四层：底层是平头哥芯片，倒数第二层是「为 Agent 而生」的云能力，中间是千问大模型，最后是模型推理平台百炼。

阿里云在 Agentic 时代重构技术栈｜来自：阿里云 520 峰会

听起来还是熟悉的「芯片 - 平台 - 模型 - 应用」四件套。但仔细看每一层，每一层的定义都被改写了一次。

最容易被低估的，是中间的 Agentic Cloud。阿里云把它分成了两件事：一是给 Agent 跑起来提供基础设施（Agent Infra），二是把云产品自己变成 Agent 可以调用的能力（Agentic Products）。

第一件事的逻辑是：Agent 负载和传统在线服务，本质上是两种东西。传统云负载是稳态的 QPS ——一个网站每秒固定承载多少请求，资源按容量买。Agent 负载则是任务流——一个任务可能跑几秒、几分钟甚至几小时，结束就销毁，下一秒又突发起十万个新任务，每个任务有自己的依赖、自己的临时存储、自己的工具调用权限。

传统云做「资源调度」，Agentic Cloud 必须做「任务调度」。阿里云为此堆出了一整套围绕「短生命周期 + 突发 + 高并发 + 需要工具调用」这组新特征设计的组件——从任务级运行环境隔离，到多 Agent 编排、任务级身份鉴权，再到多模态记忆存储，每一项新特征，都不是为了人类用户。

第二件事更有意思——阿里云宣布了 12 条产品线、56 款产品的全面「Skill 化」。这是什么意思？过去你要用 OSS、用瑶池数据库、用 DataWorks，得读文档、写代码、调 API。现在阿里云把这些产品的核心能力封装成 Skill，Agent 可以像调函数一样直接调用，OSS Agent、StarOps、Dataworks Agent 已经先后落地。这件事的本质不是云产品变成了 Agent 的「下属」，而是让开发者用云产品的体验被 Agent 化——从读文档、调 API，变成任务级、交互式的对话，像给下属布置任务一样。这是云厂商真正要做的工作量最大的事：把所有存量产品的接口重新做一遍。

百炼这层则是 Agent 经济跑通的关键卡点。阿里云把它叫做「Agentic 时代的模型推理平台」，对外讲的是三个数字——冷启动降低 90% 以上、每分钟拉起 10000 个 Pod、SLA 4 个 9，背后解决的是 Agent 工作负载最棘手的「弹性 / 成本 / 效果」三难。

Agent 一旦投入生产，Token 消耗会暴增几个数量级，单纯按量调度的成本结构会迅速崩掉。百炼给出的答案是分四种计费形态——按 Token、PTU、MU、Batch API。把不同特征的 Agent 工作负载塞进最合适的计费模式里，再叠加 Prompt Caching 把重复上下文的成本砍掉九成。一个细节是，在 Claude Code 这类高频复用 prompt 的编程 Agent 场景下，百炼上报的重复上下文计算可降低 98% ——这个数字直接决定了一个企业能不能负担得起用 Agent 写代码。

模型层则是这套体系里最被验证、也最被低估的「非云」资产。在峰会上发布的旗舰模型 Qwen3.7-Max，在 Arena 全球大模型盲测总榜里超过了 Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1，与 GPT、Claude、Gemini 同处第一梯队，国产模型登顶。开源侧的数字更醒目：千问衍生模型数量在 Hugging Face 上突破 20 万个，下载量过 10 亿次，全球开源模型采用率 53%，已经把 Meta-Llama 和 Google-Gemma 远远甩在后面。

Qwen 在开源生态里跑赢了，意味着大量第三方 Agent 框架默认会接入 Qwen —— Cursor、Claude Code、Qwen Code、OpenCode、Cline，几乎所有主流的编程 Agent 都已经支持把后端切到 Qwen。当一个开发者用 Qwen Coder 写完代码，下一步顺理成章地就是把推理放到百炼上跑——百炼现在是 OpenAI SDK 兼容、Bailian CLI 直接对接 Cursor 和 Claude Code 的状态。

而 Qwen 在 Agentic Coding 和 Tool Use 上的强项，恰好是 Agent 真正干活时最需要的两类能力。代码是 Agent 当下最被验证的生产力场景—— GitHub Copilot 数据显示，AI 生成代码占比已达 46%，Agent 编程会话时长从 4 分钟拉长到 23 分钟，78% 的会话涉及多文件操作。这些数字背后是一个简单的事实：编程 Agent 已经从演示走进生产线，而能做好编程的模型，就能吃到这个市场最先长出来的真金白银。

最底层的是平头哥，阿里自研芯片一直比较低调，但重要性一点不低。会上，阿里云宣布真武 AI 芯片累计出货 56 万片，覆盖 20 多个行业、400 多个客户，超过 30 家车企的智驾研发已经在阿里云上跑、累计使用真武芯片超 13 万卡。

加上倚天 Arm 服务器 CPU、镇岳存储主控、磐脉 400G 智能网卡构成的「四件套」，让阿里能把模型训练、Agent 任务编排、上下文长记忆读写、万卡集群互联做成一个系统级的整体优化。刘伟光在媒体沟通里反复强调一个词——「芯云模一体化」，意思是只有自己同时控制芯片、推理平台和模型，才有可能在 Token 成本上跑出系统级的性价比。

新官网背后意味着什么

把四层架构讲清楚，只是这次峰会的「明线」。

更值得分析的「暗线」，藏在阿里云这次同时公布的另一件事里：一个看起来不太起眼的新官网——千问云。

千问云官网｜来自：千问云

它和阿里云自己原来的官网完全是两种东西。阿里云官网是一个典型的传统云厂商门户——产品线长、目录深、面向 IT 采购者；千问云则像一个 AI 时代的 Stripe 或 Linear，UI 极简，主体只剩下三件事：选模型、对比模型、用模型。它把 200 多款主流模型（Qwen、GLM、Kimi、DeepSeek、Wan 等）的 API 摆在最显眼的位置，模型的核心服务被打包成 Skills 和 CLI ——意味着 Agent 可以直接调用，连人类开发者都被当成次要用户。

刘伟光对外的原话是：「过去模型服务平台为人服务，未来用模型的主力将是 Agent，千问云正在全面重构模型服务平台，为开发者和 Agent 提供更友好的体验。」

这是新官网背后的含义：阿里云在公开承认，云的用户已经不再只是人了。

这件事的战略含义比看上去大。一旦云厂商接受「Agent 是新的客户」，意味着官网、计费、控制台、文档、SDK，整个云产品的用户界面都要重写一遍。Skill/CLI 化不只是一个 UI 改造，而是云产品要从「人能看懂的页面」变成「机器能直接调用的接口」。

千问云加上 56 款产品的 Skill 化，是阿里云对「Agent 是新客户」这个判断的第一次 GTM 尝试。即将到来的 Agentic AI 时代，谁先把「为 Agent 而生」的入口跑通，谁就先抢到下一阶段的开发者心智。

从「卖 Token」到「卖结果」

技术栈重构的下一步，是商业模型重构。这件事更难，也更能看出阿里云这次到底转了多少。

在和媒体的闭门交流里，刘伟光花了相当长的时间讲解阿里云销售端过去一段时间的变化——这部分内容比产品发布更值得细读。

第一，考核指标变了。阿里云销售从看 GPU 卖了多少、多少客户迁移上云，转向关注「为付费 Token 的企业客户数」、「Agent 自主完成闭环工作的比例」。这两个指标里没有一个是传统云销售熟悉的语言——付费 Token 客户数意味着客户真的在生产环境用 Agent 而不是 PoC；Agent 自主完成闭环更激进，相当于把「结果」作为衡量销售成败的标准。

第二，组织结构变了。阿里云成立了专注做在 MaaS 产品上的销售团队，和原有云销售团队「在局部打配合、在部分市场各自作战」。这是一个非常典型的「业务重构」动作——当新业务的 PMF、销售路径、客户决策链都和老业务不一样的时候，强行让老团队转型，效率远低于专门拉一支新军加入战斗。

第三，话语权变了。今天销售要卖 MaaS，要见的人变成了企业的董事长、CEO 或者业务负责人，而不是 IT 负责人。因为决定一个企业要不要全公司用 Agent，本质上不是一个采购决策，而是一个组织和业务决策。

第四，定价方向在迁移。刘伟光承认，按 Token 收费是目前市场上最普遍的方式，但「已经出现客户愿意为结果付费的苗头」。他给的判断是：终极目标是结果付费，但需要模型足够强大、Agent 足够稳定。这是一个非常诚实的现状描述——结果付费是方向，但要走过去，需要技术先成熟到一定程度。

把这四件事放在一起看，阿里云正在做的事情，远不只是「再卖一种产品」。它是在把云的价值衡量单位，从计算资源（GPU、弹性计算、网络，存储，大数据，数据库等）变成 Token，再从 Token 变成 Agent 跑通的具体业务结果。

这个过程里，阿里云面对的不只是技术栈重构，还有产品组合、销售考核、组织架构、客户对话方式的连环重构——每一环都很难，但都是通往下个时代的云必须走过的道路。

一次组织级的转身

阿里云接下来要打的，是一场比技术栈重构更复杂的硬仗——要在一个还没有定型的市场里，同时支撑多种 Agent 产品形态、多种销售路径、多种客户类型，并且自己内部还要从「卖云」的组织重塑成「卖 Agent 解决方案」的组织。

阿里云财报数字给出的反馈是积极的—— FY26 Q4 云外部收入增速加速到 40%，AI 相关收入占比首破 30%，AI 相关产品收入已经连续 11 个季度三位数同比增长，年化 AI 收入达到 358 亿。阿里全栈 AI 已经进入吴泳铭口中的「正向商业化回报周期」。

但财报反映的是过去一年的回报，而 5 月 20 日这场峰会真正押注的是未来三到五年的市场：当所有云厂商都在围绕 Agent 重构技术栈、重构销售、重构组织结构的时候，阿里云能不能比对手转得更快、更彻底。

从这次峰会能看到的信号是——它至少已经开始转了，而且转的不只是产品层。

这是一件值得继续观察的事。因为对一家像阿里云这样体量的云公司来说，最难的从来不是发布一个新产品，而是同时让产品形态、销售考核、组织结构、客户对话方式跟着新业务一起改变。

Agentic Cloud 的终局会怎样还说不清。但 5 月 20 日这一天，阿里云至少让外界看到了一件事：它愿意为这件事，把自己重新拆开装一遍。

* 头图来源：阿里云

本文为极客公园原创文章，转载请联系极客君微信 geekparkGO

极客一问

你如何看待 Agentic Cloud ？

宙世代

一起剪

相关标签