阿里千问、DeepSeek齐出手国产大模型“升级”Agent能力

近期国产大模型动作频频。4 月 2 日，阿里发布千问新一代大语言模型 Qwen3.6-Plus。4 月 8 日，DeepSeek（深度求索）上线专家模式，这是 DeepSeek 走红以来首次在产品端引入模式分层设计。此前 3 月份，DeepSeek 释放了和 Agent（智能体）相关的多个岗位招聘需求。

《每日经济新闻》记者注意到，无论是阿里千问还是 DeepSeek 大模型，都在强化基础大模型 Agent 的能力。2026 年初，以 OpenClaw（一款开源人工智能体框架，俗称 " 龙虾 "）为代表的 " 龙虾热 " 火爆国内外。如果说 2025 年还是 " 千模混战 "，2026 年 AI（人工智能）主战场已全面转向智能体，Agent 对 Token（词元）的消耗正以百倍、千倍速度加快。

IDC（国际数据公司）中国研究总监卢言霞向《每日经济新闻》记者表示，强化 Agent 能力是基础大模型 2026 年的重要发展方向，可能包括深度研究、智能办公、AI 代码助手等通用场景。

中国科学院计算所客座博士生导师、中国计算机学会数字金融分会常务执委白硕在接受《每日经济新闻》记者采访时表示，随着 AI 应用爆发，对基础大模型 Agent 能力，未来将更重视在 Harness Engineering（直译为驾驭工程）领域的提升。据了解，Harness Engineering 是一个不强调模型性能，更强调工程环境，通过让 " 驾驭模型的系统环境 " 更专业而提升使用效果的范式。

下一代 OpenClaw 将支持视频生成

OpenClaw 创始人近日在社交平台宣称，下一代 OpenClaw 智能体产品将迎来两大核心升级——全新融入 AI 视频生成能力，并成为全球首个官方适配阿里千问大模型的智能体框架。

4 月 2 日，阿里发布千问新一代大语言模型 Qwen3.6-Plus，其中最引人注目的是，新模型显著增强了智能体编程能力。在代码智能体领域以及通用智能体与工具使用方面，新模型表现突出。

4 月 4 日，OpenRouter（一个 AI 模型聚合平台）官方数据显示，Qwen3.6-Plus 的日调用量突破 1.4 万亿 Tokens。

Agent 对 Token 的消耗正以前所未有的速度激增。国家数据局局长刘烈宏披露了一组数据，到今年 3 月，我国日均词元调用量已超过 140 万亿，相比 2024 年初的 1000 亿增长 1000 多倍，相比 2025 年底的 100 万亿，3 个月时间又增长 40% 多。

在英伟达 GTC 开发者大会上，黄仁勋给出了一个极具冲击力的定义：Token 是 AI 时代的新大宗商品，是新 " 货币 "，也是衡量企业竞争力的核心标尺。

而 OpenClaw 这类 Agent 产品彻底改变了 AI 交互形态，使其能落地完成复杂任务，也让 Token 需求迎来爆发式增长。

不只是阿里千问基础大模型强化了 Agent 能力，DeepSeek 通用大模型自 2025 年以来也强化了 Agent 能力。

《每日经济新闻》记者注意到，在 DeepSeek 官网上，3 月 24 日发布的一系列招聘岗位中，有不少和 Agent 相关的岗位。譬如 Agent 全栈开发工程师、Agent 深度学习算法研究员、Agent 数据策略工程师等。

2025 年 12 月，DeepSeek 更新 V3.2 正式版，就强调其新模型强化 Agent 能力，融入思考推理。在这个版本的模型中，DeepSeek 提出了一种大规模 Agent 训练数据合成方法，构造了大量 " 难解答，易验证 " 的强化学习任务，大幅提高了模型的泛化能力。

DeepSeek 专家模式具备领域深度增强等特点

当前，AI Agent（人工智能体）能力很大程度上依赖于基础大模型能力的提升，基础大模型提供核心能力，而 Agent 通过系统化设计将这些能力转化为实际应用价值，国产基础大模型正在强化 Agent 能力。

横向对比来看，无论是千问大模型还是 DeepSeek，均支持高达 100 万个词元上下文长度，大模型在长文档、多轮对话信息提取上更精准。

卢言霞认为，当前基础大模型竞争的关键是编程能力、智能体能力等。

在 AI 应用端，浙江华通云数据科技有限公司副总裁林建龙在接受《每日经济新闻》记者采访时坦言，当前 AI Agent 仍面临一些问题。譬如大多数 AI 系统仍然停留在工具、技能层面，无法真正成为企业的 " 数字化员工 "。传统工作流编排和简单对话系统虽然能够完成一些预定义的任务，但缺乏深度理解业务场景、独立思考和持续学习的能力，难以满足企业复杂多变的业务需求。

林建龙表示，未来的 AI Agent 不是简单的工具，而是一个基于大模型之上的各个行业领域专家。这种专家 Agent 具备以下核心特征：第一，具备深厚的行业专业知识，能够理解并处理复杂的业务问题；第二，能够深度融入企业业务流程，与现有系统无缝对接；第三，具备持续学习和自我优化能力，能够在实践中不断提升；第四，能够独立完成特定任务，而不仅仅是提供建议或答案。

4 月 8 日，DeepSeek 上线的专家模式就提到，专家模式具备领域深度增强、多步推理可视化、引用溯源强化、自定义专家组合、长上下文压缩优化等特点。专家模式沿用了 R1 的长思维链推理能力，但针对专业领域做了定向蒸馏和微调，使 " 快思考 " 与 " 慢思考 " 在领域内更平衡。

林建龙也强调了未来 " 专家 Agent" 理念的实现，需要系统化和工程化的方法。他表示，当前华通云正围绕底座模型、数据管理、提示词工程、长期记忆等核心技术要素，构建了一套完整的 AI Agent 开发框架。

其中底座模型提供基础的认知和推理能力，数据管理完成对企业数据的链接和交互，提示词工程负责将业务需求转化为模型可理解的任务指令，MCP Tools（用于与外部系统进行交互的工具集或协议）提供与外部系统交互的能力，Skills（技能）封装了特定领域的专业技能，长期记忆机制则使 Agent 能够在多轮交互中积累经验、实现智能的个性化服务。

每日经济新闻

宙世代

一起剪

相关标签