每日经济新闻 前天
小参数、高速度!罗福莉首秀解说AI新成果 从“不做大模型”到一年开源多款,小米为何改了主意?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

一向喜欢 " 突然开大 " 的小米又放了个 " 大招 "!

12 月 17 日,2025 小米 " 人车家全生态 " 合作伙伴大会在北京国家会议中心举办。大会上,Xiaomi MiMo 大模型负责人罗福莉 " 首秀 " 上台,正式发布了开源 Xiaomi MiMo-V2-Flash 大模型。

据罗福莉介绍,该模型在大部分评测基准上超过了 DeepSeek V3.2 和 K2-Thinking,在全球大致相同水位的顶尖模型速度和成本象限里实现了低成本和高速度,且已初步具备模拟世界的能力。

从 2023 年 5 月公开发声 " 不会做 OpenAI 类的大模型 ",到悄悄组建大模型团队、试探性开源首个小参数模型;再到高薪从 DeepSeek" 挖人 ",交出可与顶级模型媲美的产品,小米这一系列变化背后,反映出大模型从初期一片热闹的 " 卷参数 ",到如今逐渐沉淀 " 卷落地 " 的现实情况。

在业内看来,小米要坐稳头部厂商的位置,除了守好手机和汽车业务的 " 护城河 ",AGI(通用人工智能)这条河也要蹚过,而自研大模型就成为不可省略的一步。

2025 小米 " 人车家全生态 " 合作伙伴大会现场 每经记者 杨卉摄

罗福莉:小米开源大模型已到 TOP2 级别

12 月 17 日上午,《每日经济新闻》记者(以下简称 " 每经记者 ")在 2025 小米 " 人车家全生态 " 合作伙伴大会现场注意到,此次活动热度极高,现场人头攒动,主论坛开场前一度满员,不再放人进入。不过,小米创始人兼 CEO 雷军此次并未在现场出现。

活动一开场,小米集团合伙人、集团总裁卢伟冰率先登台,一上台就提到了小米刚刚开源的大模型,但他也卖了关子,表示稍后将有专人讲解细节。

卢伟冰在大会上进行讲解 每经记者 杨卉 摄

据卢伟冰介绍,未来五年,小米集团研发投入预计将超过 2000 亿元,其中 2026 年研发投入预计在 400 亿元左右。卢伟冰还详细拆解了小米的 " 人车家生态 ":产品包括个人设备、出行设备、家庭设备;核心技术包括芯片、OS(操作系统)、AI(人工智能);智能制造包括手机、汽车、大家电工厂。

卢伟冰提到的 " 专人 ",就是原 DeepSeek 核心成员,被业内称为 " 天才少女 " 的罗福莉。今年 11 月 12 日,罗福莉在朋友圈正式官宣加入小米 Xiaomi MiMo 团队。此次也是她作为小米 MiMo 大模型负责人的首次登台演讲。

演讲过程中,罗福莉全程围绕技术展开。据她介绍,Xiaomi MiMo-V2-Flash 是小米专为极致推理效率自研的模型,通过引入 Hybrid(混合架构)注意力架构创新及多层 MTP(一种模型架构)实现推理加速。API(应用程序编程接口)定价为:输入 0.7 元 / 百万 tokens(大模型处理文本的最小单位);输出 2.1 元 / 百万 tokens。

罗福莉称,研发之初团队主要围绕三个问题展开:智能体必须有一个高效的沟通语言,即代码能力和工具调用能力;目前智能体之间的沟通带宽非常低,该如何加速带宽;如何激发后训练的潜能。

在小米看来,超强的代码和工具调用能力是 Agent(智能体)沟通的高效 " 语言 ",围绕极致推理效率设计的模型结构是 " 高带宽 "Agent 协作的关键,全新后训练范式则能够保证高效稳定的扩展强化学习训练。

模型参数方面,罗福莉直言,Xiaomi MiMo-V2-Flash 是一个非常小的模型,总参数只有 309B,激活参数只有 15B。" 我都不愿意称它是一个非常大的模型。"

而在代码能力方面,罗福莉称 Xiaomi MiMo-V2-Flash 的代码能力和 Agent 测评基准测试已经达到全球开源模型 TOP2,在大部分评测基准上超过了 DeepSeek V3.2 和 K2-Thinking,同时对比参数量减少了 1/2 至 2/3。在全球大致相同水位的顶尖模型速度和成本象限里实现了低成本和高速度,且已初步具备模拟世界的能力,如通过 HTML(超文本标记语言)写操作系统、模拟太阳系、画一幅圣诞树等。

罗福莉作为小米 MiMo 大模型负责人首次登台演讲 每经记者 杨卉 摄

谈到 AGI(通用人工智能)的未来方向,罗福莉称希望能补全缺失的演化拼图。

在她看来,算力和数据并非最终的护城河,真正的护城河是科学的研究文化与方法,将未知问题结合模型优化转化为可用产品的能力。

罗福莉进一步表示,下一代智能体系统不是一个 " 语言模拟器 ",而是一个真正理解人类世界,并与之共存的 " 智能体 "。在 Agent 执行能力方面,应实现从 " 回答问题 " 到 " 完成任务 " 的转变,具备记忆、推理、自主规划、决策、执行等能力。从 Omni(全能)感知角度看,应实现统一多模态感知,为理解物理世界打下基础,从而更好地嵌入眼镜等智能终端,融入用户的日常工作流。

罗福莉作讲解 每经记者 杨卉 摄

演讲的结尾,罗福莉还回忆了自己 2020 年刚刚进入大模型领域时的经历。" 那时国内的开源模型距离世界顶尖闭源模型的代差,我认为至少有 3 年。但如今大家都能看到,中国像 DeepSeek、MiMo 等的开源模型,距离世界顶尖闭源模型的差距可能只有数月了。"

谈到开源的价值,罗福莉称,它不仅是分享了模型和代码,而是实现 AGI 的普惠化,是确保所有人类智慧共同进化的唯一路径。

三年时间,小米对大模型态度发生大转变

其实,对于自研大模型,小米最初的热情并不高。

2023 年 5 月底,小米集团披露了当年第一季度业绩。彼时,卢伟冰在电话财报会上称,虽然大厂都进行 " 大模型竞赛 ",但小米集团不会做 OpenAI 类的大模型。

虽然作出了这样的表态,但实际上在同年 4 月,小米已悄然组建了 AI 实验室大模型团队,开始做 " 自产自销 " 的端侧模型。

那时,国内厂商还在 " 百模大战 " 中挣扎,竞争集中在参数大小、文本长度、中文理解能力等方面,变现落地还很遥远。需要注意的是,此时距离小米交出首车的时间已经不到一年,集团从上到下的注意力都被造车 " 绷紧 "。

2024 年 3 月,小米发布首款车型 SU7。同年下半年,就在小米新车热度居高不下的大致相同时间里,国产大模型 DeepSeek 已开始展现变现能力,各类搭载 DeepSeek 的终端产品,如一体机、App(应用程序)、智能眼镜等开始出现。

那段时间,被各类 " 造车 " 消息堆叠的小米已经鲜少公开谈论大模型。直到 2024 年年底,业内传出消息,称小米正着手搭建自己的 GPU(图形处理器)万卡集群,将大力投入 AI 大模型研发。

进入 2025 年,产业格局又发生了变化,国内大模型从 " 卷 " 参数、" 卷 " 模型进入到 " 卷 " 落地应用的 " 下半程 "。与此同时,观望多时的小米,最终还是踏入了 AGI 的河流。

今年 4 月 30 日,小米突然宣布开源其首个推理大模型 Xiaomi MiMo,同时公开了一个此前未曾公开露面的团队:小米大模型 Core 团队。

按照小米自己的说法,2025 年虽看似是大模型逐梦的后半程,但公司坚信 AGI 征途依然漫长。为了向这条长路进发,彼时的小米还上线了大量与大模型相关的招聘信息,如 " 大模型算法专家 "" 大模型推理工程师 "" 大模型数据策略工程师 " 等,其中年薪最高可达 128 万元,落地场景有智能门锁、智能音箱、AI 面试、AI 会议助理等。再往后的时间线就是今年 11 月,雷军 " 挖人 " 成功,罗福莉发朋友圈官宣加入小米。

截至目前,小米在年内已开源多款大模型。

从财报数据来看,小米集团今年前三季度业绩可谓十分亮眼,小米汽车还首次实现了单季度经营盈利(毛利减去经营开支)。然而拆开细看,小米当前面临的压力并不小。

手机业务方面,存储价格持续上涨,终端厂商压力大增,小米也直言明年大盘的压力会大于今年,预计友商的相关产品零售价会有较大幅度上涨。汽车方面,受购置税补贴及产业竞争的影响,预计明年小米汽车的毛利率或出现同比下滑的情况。

在业内看来,一方面,小米确实需要更多的增长动能;另一方面,当前各类厂商都在跨界 AI,喊出 "All in" 口号的也有不少,要坐稳头部厂商位置,自研大模型一定是小米不可省略的一步。

每日经济新闻

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

小米 开源 卢伟冰 人工智能 小米集团
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论