量子位 前天
腾讯调整大模型组织架构:姚顺雨加盟,向总裁刘炽平汇报
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

官宣了。

就在刚刚,量子位获悉,腾讯内部宣布了大模型组织架构调整,而姚顺雨也首次被明确了加盟。

姚顺雨是谁?

前 OpenAI 研究员、清华姚班学霸、普林斯顿博士、NOI 奥赛银牌、安徽省高考探花,是近几年大模型 Agent 方向最受关注的青年研究者之一。

只有 28 岁。

他是 Tree of Thoughts(思维树)、ReAct 等工作的作者,也是 SWE-bench、SWE-agent 等一系列知名研究的核心贡献者。

去年一篇《AI 下半场》的博文,让他在学界与产业界迅速出圈;而今年 9 月从 OpenAI 离职后,他的去向也随之成为各大 AI 公司关注的焦点,一度引发诸多猜测。

如今,一切尘埃落定——

姚顺雨确定加盟腾讯,双重身份:

第一,"CEO/ 总裁办公室 " 首席 AI 科学家,向腾讯总裁刘炽平汇报;

同时兼任 AI Infra 部、大语言模型部负责人,向技术工程事业群总裁卢山汇报。

腾讯内部官宣说了啥

姚顺雨内部官宣加盟的消息,是随着腾讯 AI 组织架构一起披露的。

量子位获悉,腾讯今日内部官宣了大模型研发组织架构调整——

新成立 AI Infra 部、AI Data 部、数据计算平台部,全面强化其大模型的研发体系与核心能力。

其中Vincesyao 出任 "CEO/ 总裁办公室 " 首席 AI 科学家,向腾讯总裁刘炽平汇报;同时兼任 AI Infra 部、大语言模型部负责人,向技术工程事业群总裁卢山汇报。

而 Vincesyao,正是姚顺雨。

据称,作为腾讯大模型体系的重要一环,AI Infra 部将负责大模型训练和推理平台技术能力建设,聚焦大模型分布式训练、高性能推理服务等核心技术能力,构建大模型 AI Infra 核心竞争力,为大模型算法研发和业务场景落地提供稳定高效的技术支持和服务。

而架构升级后的AI Data 部、数据计算平台部,将分别负责大模型数据及评测体系建设、大数据和机器学习的数据智能融合平台建设工作。

王迪继续担任大语言模型部副总经理,向姚顺雨汇报。刘煜宏担任 AI Data 部负责人、陈鹏担任数据计算平台部负责人,均向公司副总裁蒋杰汇报。

腾讯内部信中还强调,AI 大模型研究与工程技术紧密相关。在过往混元大模型训练以及海量业务场景的深度实践中,腾讯已经积累了系统化的工程能力;此次大模型研发架构升级,在进一步强化腾讯工程化优势同时,旨在提升 AI 大模型研究能力,聚焦公司 AI 战略布局,提升 AI 大模型的研发效率。

过去一年,混元大模型发布超过 30 个新模型。12 月 5 日发布的混元 2.0,显著改进了预训练数据和强化学习策略,在复杂推理与文本生成场景表现国内领先。混元 3D 模型甚至保持着全球领先的水准,开源社区下载量超过 300 万。

而 AI 产品和服务,腾讯也正在展现一贯的竞争力。

在产品和服务层面,腾讯元宝持续优化用户体验,上线初期甚至保持了每天一个版本的迭代频率,快速赢得了用户的认可,用户规模稳居国内 AI 应用前三,成为最受新中产欢迎的 AI 原生应用。目前腾讯也将元宝的 AI 能力融入微信、QQ、音乐、会议等国民级产品中,让用户在不改变习惯的前提下自然触碰 AI,为用户提供最自然、门槛最低的服务体验。

与此同时,据称腾讯公司内部正在推进一场全面 AI 化的效率变革。据腾讯财报会信息,截止目前,腾讯混元大模型已在腾讯会议、微信、广告、游戏等内部超过 900 款应用和场景中落地。在腾讯公司内部,有超 90% 的腾讯工程师在使用腾讯云代码助手 CodeBuddy,50% 新增代码由 AI 辅助生成,代码评审环 AI 参与度达 94%。

而作为高密度人才引进的姚顺雨,也是腾讯开启 AI 攻坚的证明。

可以确定的是,这个时间点上的腾讯,已经明显开启了 AI 进程上的提速。

不论是组织变阵、人才推进,还是产品代表元宝、开源代表混元 3D,都能明显感觉得到企鹅汹涌。

当然,之所以腾讯一举一动备受关注,核心还是其所拥有的完备 AI 要素:丰富场景、海量数据、生态资源,以及谋定后动的战略风格…

AI 船票是什么可能还在被讨论,但拥有上述 AI 要素的腾讯,被认为坐在预留席位的那一桌。

这或许也是姚顺雨这样的 TOP 人才,难以拒绝 offer 的原因。

姚顺雨其人其论

姚顺雨,合肥一中毕业,NOI 奥赛银牌,高考 704 分以安徽探花进入清华姚班,后在普林斯顿大学获得计算机博士学位。

博士期间,他师从 GPT-1 第二作者Karthik Narasimhan,从事智能体方向研究。博士毕业后,随即加入 OpenAI。

在科研层面,姚顺雨的工作几乎贯穿了 Agent 研究的关键节点。他先后提出 CALM(让语言模型以 Agent 形式参与语言游戏)、WebShop(用可控的电商环境系统性评估 Agent 能力)等工作。

随后,他又陆续推出了一系列在学界和工业界都产生深远影响的成果:

ReAct:让大语言模型同步完成推理与行动,是其被引次数最高的工作。 

Tree of Thoughts:通过搜索式思维结构显著提升模型推理能力。 

SWE-bench:面向真实软件工程任务的大模型评估基准。

SWE-agent:将 LLM 系统性用于代码修复与开发的开源 Agent)。

如果说这些工作回答的是 "Agent 能不能工作、该怎么工作 ",那么在观点层面,姚顺雨更关心的,是 AI 接下来该往哪里走。

在 2024 年 8 月加入 OpenAI 后,姚顺雨发表博文《The Second Half》,提出了一个被反复引用的判断:

AI 正处在 " 中场休息 " 阶段:上半场是训练 > 评估,下半场将是评估 > 训练。

在他的划分中,AI 发展可以清晰地分为两个阶段:上半场:以模型和方法为中心,核心任务是 " 把模型训出来 "。下半场:随着模型能力趋于成熟,重心转向任务定义、系统构建与评估体系。

也就是说,AI 的关键问题正在从

" 我们能否训练一个模型解决 XX?" 转向 " 什么问题值得被解决?我们如何判断 AI 是否真的进步了?"

在这个阶段,评估不再是附属环节,而是决定方向的前置条件。

真正重要的,不是继续堆模型规模,而是让模型在真实任务、真实系统中经得起检验。

除了 "AI 下半场 " 的判断之外,姚顺雨今年 9 月与张小珺的对谈同样出圈,也进一步强化了他一贯的技术立场。

在那次对谈中,他对 Agent、应用与模型边界的多项判断被反复引用,比如:

Agent 的本质不是 " 会用工具 ",而是 " 能推理并泛化 "

Code 是 Agent 的 " 手 ",是真正的第一性环境

真正困难的不是 " 难任务 ",而是 " 简单任务的可靠性 "

创业公司的最大机会,不在模型,而在交互方式

这些观点并非停留在判断层面,而是与他过往在 ReAct、SWE-agent 等工作中一以贯之的研究路径高度一致。

如今,这位有产出、有观点、也有清晰技术方法论的明星研究员选择加入腾讯,所带来的,显然不只是单点能力补强,而是一整套关于 Agent、系统与真实任务的 " 下半场 " 解法。

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—    —

专属 AI 产品从业者的实名社群,只聊 AI 产品最落地的真问题   扫码添加小助手,发送「姓名 + 公司 + 职位」申请入群~

进群后,你将直接获得:

  最新最专业的 AI 产品信息及分析  

   不定期发放的热门产品内测码

   内部专属内容与专业讨论

点亮星标

科技前沿进展每日见

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

腾讯 ai 刘炽平 量子位 清华
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论