字母榜 02-27
DeepSeek小心,帝国反击战到来了
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

文 | 字母榜,作者 | 王靖,编辑 | 赵晋杰

DeepSeek R1 引发的一场推理模型大作战还在继续,且参战名单正随着时间推移逐步拉长。

仅仅昨天一天时间之内,这场战局就又吸引来了 4 家明星大模型公司:先是阿里发布推理模型 QwQ-Max-Preview 预览版,接着 Anthropic 宣布推出全球首个 " 混合推理 " 模型 Claude 3.7 Sonnet,之后字节也被曝出豆包正在小范围测试自研的深度思考型推理模型。

作为被各路对标的 DeepSeek,也有了新动作。昨晚,路透 . 社爆料称,DeepSeek 正在加速推出 R2 模型,该模型原计划在 5 月初发布,但现在官方希望能尽早发布。

香港科技大学校董会主席、美国国家工程院外籍院士沈向洋在近期分享中指出," 对于大模型,之前的研究焦点是 GPT 模式,现在的焦点是 Reasoner 模式,这是一种新的学习范式。"

DeepSeek R1,无疑成了这场范式变革的重点参考对象。在此之前,腾讯也上线了自研的深度思考模型 " 混元 T1",百度文小言上线深度搜索功能,马斯克的 xAI 也发布了带有深度思考能力的 Grok 3 新模型。

就连 OpenAI,都在 DeepSeek 压力下,进一步开放了自家推理模型 o1 和 o3-mini 的思维链。

DeepSeek R1 这块投向推理侧的大模型技术迭代新石子,其涟漪效应正逐渐扩散至全行业。这一幕颇像 2023 年行业对 ChatGPT 的追赶。彼时,科技大厂如百度、阿里,争先发布自家大模型;王慧文携 5000 万美元振臂一呼,正式开启了一场席卷全行业的大模型创业热潮,杨植麟、王小川、李开复等先后创办起月之暗面、百川智能、零一万物等明星大模型公司,争分夺秒抢夺市场融资并对外发布产品。

不过,在 ChatGPT 时刻到来后就落后一步的字节,如今在追赶 DeepSeek 时刻上又有了慢人一步的迹象。在国内其他科技大厂已经相继完成深度思考能力的亮相后,字节的自研推理大模型才刚刚进入灰度测试阶段。

DeepSeek R2 新模型可能提早发布的消息,无疑又给字节上了上竞争强度。但好消息是,那些抢在字节前面发布推理模型的同行们,还没来得及松一口气就同样又遭遇心头一紧。

01

如同马斯克着急推出半成品 Grok 3 一样,阿里新推理模型 QwQ-Max-Preview,也只是一个预览版,而非正式版模型。

在 LiveCodeBench 编程测试中,QwQ-Max-Preview 也只是小幅超越 OpenAI o1 中档推理模型,以及 DeepSeek R1 Preview 预览版(注意,不是 DeepSeek R1 正式版)。阿里官方介绍,QwQ-Max 正式版将在后续推出。

如同 DeepSeek R1 是在 V3 基础模型上训练出来的一样,QwQ-Max 同样基于阿里的旗舰版模型 Qwen2.5-Max 而来,后者是于 1 月 29 日发布的一款 MoE 稠密模型,在公开的基准测试中,官方称其性能超越 DeepSeek V3。

不同于阿里 QwQ-Max-Preview,同一天发布的 Anthropic 新模型 Claude 3.7 Sonnet,则是个彻彻底底的完整体,官方直接放出了多项评测指标对比。

在传统基准测试项目中,Claude 3.7 Sonnet 在指令遵循、通用推理、多模态能力以及智能体编码方面的表现,都赶超了 OpenAI o1 和 DeepSeek R1。

无论是马斯克,还是阿里,在模型尚未完备之际就如此着急推出,秀技术肌肉之外,抢在 DeepSeek 前面,趁着对方多模态尚不完善之际,打出产品的差异化竞争优势,或许才是更重要的因素。

1 月 20 日发布的 DeepSeek R1,尽管支持深度思考的推理模式,但其并非一款多模态推理大模型,不支持图片生成,也不支持语音模式。如在图片识别上,DeepSeek R1 所做到的识图,更多是通过 OCR 扫描技术,简单将图片上的文字一一复制下来,无法理解文字之间的逻辑对应关系。

接入 DeepSeek R1 的腾讯,就利用 DeepSeek R1 的这一短板,在近期的元宝内上线了图生文功能,借助其自研模型的多模态能力加持,让 DeepSeek 也可以理解图片内容。

马斯克同样预告了 Grok 3 的语音模式,提前测试过这一功能的希冯 · 齐利斯(Shivon Zilis)—— Neuralink 高管,同时也是和马斯克育有一对双胞胎的孩子妈,大赞和 Grok 3 进行的语音对话,称 " 是我一生中最出乎意料、最值得的时光之一。"

02

坚持推出自家推理模型的背后,更是各家大模型厂商对用户的一场全新争夺战。

DeepSeek 的异军突起,再次激发大厂对 AI to C 的重视。

在阿里发布推理模型 QwQ-Max-Preview 的公告中,一并透露的还有将发布 Qwen Chat APP 的消息,并称其可能独立于通义 APP。阿里解释称,该专用 APP 将优先考虑实时响应能力与流行生产力工具的集成,使全球受众能够使用先进的人工智能。

一旦成真,阿里也将成为全球大模型玩家中,首个内部同时上线两款 AI 助手应用的科技大厂。通义 APP 未能在用户规模上打开局面的客观现实,或许是促成阿里这一决策的重要背景。

在阿里打算重起炉灶之外,如腾讯、百度则选择了接入 DeepSeek 来争夺 C 端用户。但这一举措的潜在风险,依然不小。

目前,各家还都能依赖 DeepSeek 外溢的流量,吸引到用户。一旦 DeepSeek 解决服务卡顿问题,这些用户难免不会再次流失。

且这样的危险信号已经发出。据凤凰网科技,目前 DeepSeek 官方通过技术优化,已经让用户在体验侧少了触发服务繁忙的频次。

归根到底,通过自研大模型,在技术上带来体验突破,才是彻底留住用户的最有效手段。这一策略,不仅适用于 C 端,同时更适用于对 B 端开发者群体的争夺。

尽管如腾讯般,开始选择彻底拥抱 DeepSeek,并将开源的 DeepSeek 接入自家一系列产品,但面对这场涉及 AIGC 安卓梦想的争夺,没有大厂想要放弃。

过去两年中,大模型给传统应用带来的体验升级,让越来越多人开始认同一种观点,即所有应用都值得用大模型重做一遍。

基于上述共识,在自研大模型之余,科技大厂都相继发布了自家的大模型服务平台,既做淘金者,又争当卖铲子的人,都向着成为 AIGC 时代的安卓梦想发起冲锋。

截至目前,包括腾讯、阿里、百度、字节在内,一众科技大厂都表达了仍会坚持大模型自研到底的决心。

为了继续向 AIGC 时代的安卓梦想迈进,各家大厂为了聚拢开发者生态,都加快了在开源上的进度:阿里在 QwQ-Max-Preview 亮相后,同步宣布未来将以 Apache2.0 许可协议开源自家推理模型;国内一直坚持闭源的百度,也开始重新拥抱开源路线。腾讯、字节也都在推动旗下垂类模型陆续开源。

另一边的 DeepSeek,同样也没闲着。在新一代模型尚未发布的间隙,面对竞争对手纷纷开源抢夺注意力的策略,DeepSeek 选择了加码,相继开源了 FlashMLA 代码库、DeepEP 通信库,以及 FP8 计算库 DeepGEMM 把自己低成本高性能的训练秘密公之于众,让有实力的开发者可以在 H800 等英伟达低效芯片基础上,也能提高模型的运行效率。

同时,关闭 20 天的官方 API 充值服务也于 2 月 25 日恢复正常。据字母榜获悉,当天 DeepSeek 官方还发布了一则特别提示,称 " 当前白天时段服务器资源依旧紧张,凌晨 0:30 到上午 8:30 相对空闲,若业务允许,建议开发者调整至该时段以获得更为流畅的 API 调用体验。"

被路透 . 社同天曝光的 R2 新模型提速发布消息,则成了 DeepSeek 应对这轮推理模型竞赛而抛出的新武器。

03

眼下,唯一没有对外大范围提供推理模型服务的科技大厂,只剩下了字节。

对大模型技术演进路线的判断失误,或许是字节没能及时跟进推出新模型的原因之一。

据晚点 LatePost 报道, 在近期的 All Hands 会上,字节 CEO 梁汝波反思道,DeepSeek R1 创新点之一的长链思考模式不是业界首创,去年 9 月 OpenAI o1 发布长链思考模型、成为行业热点后,字节就意识到了技术的重大变化,但 " 没有觉得要马上复现出来 ......现在回头看,如果一开始重大问题就争先,我们有机会更早实现。"

这不是字节在大模型领域第一次错判形势。

ChatGPT 爆火后,在去年初的 All Hands 会上,梁汝波就曾反思," 公司层面的半年度技术回顾,直到 2023 年才开始考虑 GPT,而业内做得比较好的大模型创业公司,都是在 2018 年至 2021 年创立的。"

当时,字节在大模型研发方面除了进度缓慢之外,内部还一度将 AI 重心移向了细分垂直赛道的 AI for Science。这直接导致字节在大模型推出时间上落后了百度、阿里一大截。

2022 年 11 月 ChatGPT 发布之后,百度、阿里等国内大厂相继在 2023 年三四月份推出自研大模型文心和通义,但直到去年 8 月份,字节才对外亮相了云雀大模型(豆包大模型前身)。

在服务 B 端开发者群体上,字节也因此慢了一步。从 2023 年 4 月起,百度、阿里、腾讯相继通过旗下云服务对外提供大模型接入服务。直到一年后的 2024 年 5 月,字节自主研发的豆包大模型才开始通过火山引擎正式对外提供服务。

好在,借助 2024 年大模型技术迭代趋缓的利好因素,字节在过去一年大力补课,不仅使得豆包一度成为国内月活用户最多的 AI 应用,而且从大模型性能到多模态布局,也都相继追赶上了国内头部厂商。

进入 2025 年,DeepSeek R1 引发的推理模型热潮,则又一次将追赶压力推到了字节面前。

稍显不同的是,这次迎来压力拷问的不只是字节一家。尤其随着 DeepSeek R2 模型提早到来的动作,一众科技大厂,都难逃再被 DeepSeek 对比的紧张气氛。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

阿里 百度 马斯克 明星 美国
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论