全天候科技 17小时前
雷军向AI大模型发起猛攻
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

作者 | 周智宇

小米在大模型上正发起一轮迅猛的攻势。

华尔街见闻了解到,大模型上非常低调的小米,在过去几个月里持续提升算力储备,也有了更高的算力资源投入规划,为自家大模型研发提供更充分的算力供给。

在算力资源上进一步提升资本开支,是小米创始人雷军向 AI 大模型发起一轮猛攻的侧写。此前,小米在内部组织能力建设、外部人才引入上,已有了诸多动作。

今年 11 月中旬,小米基础技术平台部成立 AI 平台部,曾被雷军公开称赞是 " 小米的大神 " 的张铎,担任 AI 平台部负责人。

随后,DeepSeek-V2 的关键开发者之一罗福莉也传将入职小米,或入职小米 AI 实验室。罗福莉在自然语言处理(NLP)领域享有盛名,尤其是其参与的 DeepSeek-V2,因大模型使用成本远低于行业均值,引发行业关注。罗福莉的加入也将助力小米在大模型领域研发加速。

从种种迹象看,在雷军的领导下,小米正在加速推进大模型的研发进展。不过小米在大模型上,过去一段时间里颇为低调。

去年年度演讲中,雷军就表示小米会全面拥抱 AI 大模型。小米 AI 实验室也在 2023 年 4 月设立了专门的大模型团队。

接近小米的人士表示,小米对需要大规模烧钱的预训练态度谨慎,而轻量级模型在某些特定任务上,比千亿级大模型也具备一定优势。这也使得小米在大模型上的侧重点在于 " 轻量化 " 和 " 本地部署 "。

小米的大模型参数规模在百亿,作为对比,vivo 在 11 月初推出的蓝心大模型已经有了千亿级参数量级的模型。

小米相关人士认为,小米与其他公司不一样的点,在于注重产品落地。这使得大模型会跟着产品出来。

小米集团总裁卢伟冰也曾表示,目前发布的号称 AI 手机的都是 AI Feature (特征)手机,也就是用 AI 的技术做了一些 AI 功能,而真正的 AI 手机是搭载基于 AI 大模型重构的操作系统。

这种思路使得外界对小米的大模型认知度并不高。

在今年底多家手机厂商的发布会中,大模型对自家产品智能化的赋能,都成为发布会宣传的重点。小米则在今年旗舰手机小米 15 的发布会中,将小米澎湃 OS 2.0 作为突出重点,但对于大模型没有更详细的介绍。

不过小米自研大模型进展不小。今年 5 月,小米的大语言模型 MiLM 已成功通过大模型备案。

今年 11 月,小米第二代模型 MiLM2 系列发布,拥有 0.3B 到 30B 多个参数规模,以适配云边端各侧场景的需求。

从模型规模上看,MiLM2 系列也延续的是轻量化思路,参数规模依旧在百亿。MiLM2-30B 模型专为云端场景设计,在指令遵循、常识推理和阅读理解等方面,超越了主流竞品大模型。

此外,截至 11 月中旬,小米智驾总算力达到了 8.1E FLOPS,在目前整车厂中处于第一梯队。且累计数据积累达到了 300 万 Clips,与同期理想处于一个梯队。按照小米方面预期,其年底会完成 1000 万 Clips 数据积累。

当然,这距离特斯拉 100E FLOPS 的算力还有不小差距。在新能源汽车智能化下半场里,小米要继续 " 守正出奇 ",也需要在智能化上加速。由此,小米在算力资源上进一步增加投入,并不意外。

相比其他科技大厂,小米拥有广袤的终端生态,涵盖手机、汽车和 IoT 等。这在 AI 大模型经历百模大战,进入寻找 AI 应用落地的阶段里,会是个优势。但这也需要小米在 AI 大模型领域有更加突出的表现。

随着小米加码 AI 大模型领域,这场 AI 应用之争也渐入高潮。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

逗玩.AI

逗玩.AI

ZAKER旗下AI智能创作平台

相关标签

ai 小米 雷军 轻量化 张铎
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论