智东西 前天
金句媲美雷军!罗福莉首次站台小米演讲,揭秘MiMo大模型和背后团队
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

智东西

作者 | 云鹏

编辑 | 李水青

罗福莉加入小米后的首次公开演讲,来了!

智东西 12 月 17 日北京现场报道,刚刚,小米举办了年度 " 人车家全生态 " 合作伙伴大会,现场人头攒动座无虚席,展区不少展台都已被围观人群挤满,讨论热度颇高。

小米创始人兼 CEO 雷军此次并未来到现场,小米集团合伙人、集团总裁卢伟冰率先登台演讲,今天第三位演讲的是当前备受关注的原DeepSeek 核心成员、被业内称为 " 天才少女 " 的罗福莉,她现在的职位是小米 MiMo 大模型负责人。

罗福莉在演讲过程中虽然稍显紧张,但她抛出的海量金句却句句令人印象深刻:

· AI 正以非线性的方式重演人类大脑 6 亿年的进化史;

· 语言是人类思维和物理世界在符号空间的 " 投影 ";

· 下一代智能体系统不是一个 " 语言模拟器 ",而是一个真正理解我们世界、并与之共存的 " 智能体 ";

· 相比生物演化的稳固根基,AI 的发展是 " 空中楼阁 ";

· AI 进化的下个起点,一定是有一个能跟物理世界交互的模型;

· 算力和数据也并非最终的护城河,真正的护城河,是科学的研究文化与方法,是将未知问题结合模型优化转化为可用产品的能力;

· 开源的价值本质上是一种分布式的技术加速主义;

· 开源是实现 AGI 的普惠化,是确保所有人类的智慧共同进化的唯一路径;

在演讲中,罗福莉首次明确解读了小米打造 Agent 语言基座模型的三个核心方向,解读了新模型背后的多项关键技术突破。对小米如何通向 AGI,罗福莉也明确了小米的路径。

除了 AI 大礼包,今天会上,卢伟冰也分享了小米整体业务的诸多亮点。

卢伟冰说,2025 年是小米 " 大发展 " 的一年,今年前三季度,小米收入同比增长 32.5%,超过了 3400 亿元,经调整利润同比增长 73.5%,其中手机销量中国市场 1-10 月排名第二。

未来五年,小米集团研发投入预计将超过 2000 亿元,2026 年预计研发投入在 400 亿左右。

小米人车家生态究竟包括什么?卢伟冰这次给出详细拆解:

产品包括个人设备、出行设备、家庭设备;

核心技术包括芯片、OS、AI;

智能制造包括手机、汽车、大家电工厂;

什么是小米当前聚焦的核心,一目了然。

在大家最关心的 AI 方面,小米自研 MiMo 系列大模型家族赫然呈现:推理大模型、视觉推理大模型、原生端到端音频生成模型、端侧视觉语言大模型、具身大模型。

一个月前的 11 月 12 日,罗福莉在朋友圈正式官宣加入小米 Xiaomi MiMo 团队。就在昨晚,小米刚刚发布了最新的 MiMo 大模型 MiMo-V2-Flash,性能媲美 DeepSeek-V3.2,这也是罗福莉加入后 MiMo 团队亮出的首个新成果。

一、罗福莉首次解读小米大模型三个重点方向,算力和数据并非最终护城河

罗福莉一上台就回到了 "6 亿年前 ",她说,AI 正以非线性的方式重演人类大脑 6 亿年的进化史。

为什么大模型 " 智能 " 起源于语言?在罗福莉看来,语言是人类思维和物理世界在符号空间的 " 投影 ",而大模型成功解码了人类思维在文本空间的投影。

小米从 " 语言 " 出发,构建了面向 Agent 时代的语言基座模型 MiMo-V2-Flash。

在小米看来,超强的代码和工具调用能力是 Agent 沟通的高效 " 语言 ",围绕极致推理效率设计的模型结构是 " 高带宽 " 的 Agent 协作的关键,全新后训练范式则能够保证高效稳定的扩展强化学习训练。

这三个方面是小米聚焦的重点。

罗福莉特别提到,MiMo-V2-Flash 模型并不大,但在代码和 Agent 测评基准测试中已经达到全球开源模型 TOP2。

MiMo-V2-Flash 的推理效率是其突出优势,在全球大致相同水位的顶尖模型速度和成本象限里,MiMo-V2-Flash 实现了低成本和高速度优势。

具体来看,小米围绕极致推理效率来设计模型结构,采用了 Hybrid SWA 架构,固定 KV Cache,增强长文推理,此外,团队采用 3 层 MTP 推理加速并行 Token 验证,实现推理速度 2-2.6 倍的提升。

在全新后训练范式方面,团队采用了 Dense&Token-Level 的强化学习。

当前 MiMo-V2-Flash 已经初步具备了模拟世界的能力,比如通过 HTML 写操作系统、模拟太阳系、画一颗圣诞树。

今天发布会现场,罗福莉宣布 MiMo-V2-Flash 发布即开源,模型权重、技术报告都开源,API 限时免费。

对于未来的 Agent 发展,罗福莉提到,下一代智能体系统,不是一个 " 语言模拟器 ",而是一个真正理解我们世界、并与之共存的 " 智能体 "。

Agent 执行从 " 回答问题 " 到 " 完成任务 ",具有记忆、推理、自主规划、决策、执行的能力。

Omni 感知统一多模态感知,为 AI 理解物理世界打下基础,嵌入眼镜等智能终端、融入日常工作流。

在通往 AGI 的路上,罗福莉团队希望补全缺失的演化拼图,单纯 Scaling UP 参数量不够,他们要让 LLM 回到 " 演化课堂 ",补上它跳过的关键学习步骤。

简单来说,他们非常看重 AI 与真实世界的交互,强调多模态。

罗福莉特别提到,相比生物演化的稳固根基,AI 的发展有些像 " 空中楼阁 "。在她看来,AI 进化的下个起点,一定是有一个能跟物理世界交互的模型。

AI 不仅要看懂画面,还要理解背后的物理规律;AI 不仅要推理文本,而是理解世界的运作逻辑。

罗福莉说,这一观点并非共识,行业中也有不少人认为语言就可以实现最终的 AGI,比如 Ilya。

在她看来,算力和数据也并非最终的护城河,真正的护城河,是科学的研究文化与方法,是将未知问题结合模型优化转化为可用产品的能力。

罗福莉现场也开启了 " 招聘会 ",她提到,小米大模型 Core 团队是研究、产品与工程深度耦合的年轻团队," 小而美 " 却充满创业精神,他们极度好奇、追求真理。

罗福莉提到,在她刚刚开始研究时,开源模型与顶尖模型的代差有三年,而今天这一差距已经缩短到了 " 数月 "。

他们相信开源的价值,开源的价值本质上是一种分布式的技术的加速的主义。在罗福莉看来,开源是实现 AGI 的普惠化,是确保所有人类的智慧共同进化的唯一路径。

未来,从数据的极致压缩,到算法的范式创新,再到与物理空间的深度链接,小米与全球 AI 共同定义未来。

95 后罗福莉本科就读于北京师范大学计算机专业,硕士毕业于北京大学计算语言学研究所计算语言学专业。她曾在阿里巴巴达摩院主导开发了多语言预训练模型 VECO,并推动了 AliceMind 的开源工作,2022 年入职 DeepSeek,参与了 MoE 大模型 DeepSeek-V2 的研发。

集诸多光环于一身,来到小米的罗福莉,其动向一直是业内关注的焦点。

结语:猛攻 Agent 基座模型,小米人车家生态全力冲刺 AI

AI,显然是整场小米生态大会围绕的核心关键词。

面向 AI 未来,小米的机会点显然不止于 AI 手机,手机、PC、穿戴、IoT、汽车,小米人车家全生态均能与 AI 深度融合,小米在大模型方面的 AI 基础能力提升则进一步加速了这一进程。

卢伟冰近日曾提到,小米 AI 大模型业务过去投入持续增长,"AI 与现实世界深度融合 " 已被列为小米未来十年核心战略。显然,面对 AI 这场硬仗,小米已经做好准备 All in," 兵马和粮草 " 都在加码筹备。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

小米 ai 卢伟冰 雷军 物理
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论