每日经济新闻 16小时前
阿里千问、DeepSeek齐出手 国产大模型“升级”Agent能力
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

近期国产大模型动作频频。4 月 2 日,阿里发布千问新一代大语言模型 Qwen3.6-Plus。4 月 8 日,DeepSeek(深度求索)上线专家模式,这是 DeepSeek 走红以来首次在产品端引入模式分层设计。此前 3 月份,DeepSeek 释放了和 Agent(智能体)相关的多个岗位招聘需求。

《每日经济新闻》记者注意到,无论是阿里千问还是 DeepSeek 大模型,都在强化基础大模型 Agent 的能力。2026 年初,以 OpenClaw(一款开源人工智能体框架,俗称 " 龙虾 ")为代表的 " 龙虾热 " 火爆国内外。如果说 2025 年还是 " 千模混战 ",2026 年 AI(人工智能)主战场已全面转向智能体,Agent 对 Token(词元)的消耗正以百倍、千倍速度加快。

IDC(国际数据公司)中国研究总监卢言霞向《每日经济新闻》记者表示,强化 Agent 能力是基础大模型 2026 年的重要发展方向,可能包括深度研究、智能办公、AI 代码助手等通用场景。

中国科学院计算所客座博士生导师、中国计算机学会数字金融分会常务执委白硕在接受《每日经济新闻》记者采访时表示,随着 AI 应用爆发,对基础大模型 Agent 能力,未来将更重视在 Harness Engineering(直译为驾驭工程)领域的提升。据了解,Harness Engineering 是一个不强调模型性能,更强调工程环境,通过让 " 驾驭模型的系统环境 " 更专业而提升使用效果的范式。

下一代 OpenClaw 将支持视频生成

OpenClaw 创始人近日在社交平台宣称,下一代 OpenClaw 智能体产品将迎来两大核心升级——全新融入 AI 视频生成能力,并成为全球首个官方适配阿里千问大模型的智能体框架。

4 月 2 日,阿里发布千问新一代大语言模型 Qwen3.6-Plus,其中最引人注目的是,新模型显著增强了智能体编程能力。在代码智能体领域以及通用智能体与工具使用方面,新模型表现突出。

4 月 4 日,OpenRouter(一个 AI 模型聚合平台)官方数据显示,Qwen3.6-Plus 的日调用量突破 1.4 万亿 Tokens。

Agent 对 Token 的消耗正以前所未有的速度激增。国家数据局局长刘烈宏披露了一组数据,到今年 3 月,我国日均词元调用量已超过 140 万亿,相比 2024 年初的 1000 亿增长 1000 多倍,相比 2025 年底的 100 万亿,3 个月时间又增长 40% 多。

在英伟达 GTC 开发者大会上,黄仁勋给出了一个极具冲击力的定义:Token 是 AI 时代的新大宗商品,是新 " 货币 ",也是衡量企业竞争力的核心标尺。

而 OpenClaw 这类 Agent 产品彻底改变了 AI 交互形态,使其能落地完成复杂任务,也让 Token 需求迎来爆发式增长。

不只是阿里千问基础大模型强化了 Agent 能力,DeepSeek 通用大模型自 2025 年以来也强化了 Agent 能力。

《每日经济新闻》记者注意到,在 DeepSeek 官网上,3 月 24 日发布的一系列招聘岗位中,有不少和 Agent 相关的岗位。譬如 Agent 全栈开发工程师、Agent 深度学习算法研究员、Agent 数据策略工程师等。

2025 年 12 月,DeepSeek 更新 V3.2 正式版,就强调其新模型强化 Agent 能力,融入思考推理。在这个版本的模型中,DeepSeek 提出了一种大规模 Agent 训练数据合成方法,构造了大量 " 难解答,易验证 " 的强化学习任务,大幅提高了模型的泛化能力。

DeepSeek 专家模式具备领域深度增强等特点

当前,AI Agent(人工智能体)能力很大程度上依赖于基础大模型能力的提升,基础大模型提供核心能力,而 Agent 通过系统化设计将这些能力转化为实际应用价值,国产基础大模型正在强化 Agent 能力。

横向对比来看,无论是千问大模型还是 DeepSeek,均支持高达 100 万个词元上下文长度,大模型在长文档、多轮对话信息提取上更精准。

卢言霞认为,当前基础大模型竞争的关键是编程能力、智能体能力等。

在 AI 应用端,浙江华通云数据科技有限公司副总裁林建龙在接受《每日经济新闻》记者采访时坦言,当前 AI Agent 仍面临一些问题。譬如大多数 AI 系统仍然停留在工具、技能层面,无法真正成为企业的 " 数字化员工 "。传统工作流编排和简单对话系统虽然能够完成一些预定义的任务,但缺乏深度理解业务场景、独立思考和持续学习的能力,难以满足企业复杂多变的业务需求。

林建龙表示,未来的 AI Agent 不是简单的工具,而是一个基于大模型之上的各个行业领域专家。这种专家 Agent 具备以下核心特征:第一,具备深厚的行业专业知识,能够理解并处理复杂的业务问题;第二,能够深度融入企业业务流程,与现有系统无缝对接;第三,具备持续学习和自我优化能力,能够在实践中不断提升;第四,能够独立完成特定任务,而不仅仅是提供建议或答案。

4 月 8 日,DeepSeek 上线的专家模式就提到,专家模式具备领域深度增强、多步推理可视化、引用溯源强化、自定义专家组合、长上下文压缩优化等特点。专家模式沿用了 R1 的长思维链推理能力,但针对专业领域做了定向蒸馏和微调,使 " 快思考 " 与 " 慢思考 " 在领域内更平衡。

林建龙也强调了未来 " 专家 Agent" 理念的实现,需要系统化和工程化的方法。他表示,当前华通云正围绕底座模型、数据管理、提示词工程、长期记忆等核心技术要素,构建了一套完整的 AI Agent 开发框架。

其中底座模型提供基础的认知和推理能力,数据管理完成对企业数据的链接和交互,提示词工程负责将业务需求转化为模型可理解的任务指令,MCP Tools(用于与外部系统进行交互的工具集或协议)提供与外部系统交互的能力,Skills(技能)封装了特定领域的专业技能,长期记忆机制则使 Agent 能够在多轮交互中积累经验、实现智能的个性化服务。

每日经济新闻

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

阿里 ai 人工智能 英伟达 龙虾
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论