金句媲美雷军！罗福莉首次站台小米演讲，揭秘MiMo大模型和背后团队

智东西

作者 | 云鹏

编辑 | 李水青

罗福莉加入小米后的首次公开演讲，来了！

智东西 12 月 17 日北京现场报道，刚刚，小米举办了年度 " 人车家全生态 " 合作伙伴大会，现场人头攒动座无虚席，展区不少展台都已被围观人群挤满，讨论热度颇高。

小米创始人兼 CEO 雷军此次并未来到现场，小米集团合伙人、集团总裁卢伟冰率先登台演讲，今天第三位演讲的是当前备受关注的原DeepSeek 核心成员、被业内称为 " 天才少女 " 的罗福莉，她现在的职位是小米 MiMo 大模型负责人。

罗福莉在演讲过程中虽然稍显紧张，但她抛出的海量金句却句句令人印象深刻：

· AI 正以非线性的方式重演人类大脑 6 亿年的进化史；

· 语言是人类思维和物理世界在符号空间的 " 投影 "；

· 下一代智能体系统不是一个 " 语言模拟器 "，而是一个真正理解我们世界、并与之共存的 " 智能体 "；

· 相比生物演化的稳固根基，AI 的发展是 " 空中楼阁 "；

· AI 进化的下个起点，一定是有一个能跟物理世界交互的模型；

· 算力和数据也并非最终的护城河，真正的护城河，是科学的研究文化与方法，是将未知问题结合模型优化转化为可用产品的能力；

· 开源的价值本质上是一种分布式的技术加速主义；

· 开源是实现 AGI 的普惠化，是确保所有人类的智慧共同进化的唯一路径；

在演讲中，罗福莉首次明确解读了小米打造 Agent 语言基座模型的三个核心方向，解读了新模型背后的多项关键技术突破。对小米如何通向 AGI，罗福莉也明确了小米的路径。

除了 AI 大礼包，今天会上，卢伟冰也分享了小米整体业务的诸多亮点。

卢伟冰说，2025 年是小米 " 大发展 " 的一年，今年前三季度，小米收入同比增长 32.5%，超过了 3400 亿元，经调整利润同比增长 73.5%，其中手机销量中国市场 1-10 月排名第二。

未来五年，小米集团研发投入预计将超过 2000 亿元，2026 年预计研发投入在 400 亿左右。

小米人车家生态究竟包括什么？卢伟冰这次给出详细拆解：

产品包括个人设备、出行设备、家庭设备；

核心技术包括芯片、OS、AI；

智能制造包括手机、汽车、大家电工厂；

什么是小米当前聚焦的核心，一目了然。

在大家最关心的 AI 方面，小米自研 MiMo 系列大模型家族赫然呈现：推理大模型、视觉推理大模型、原生端到端音频生成模型、端侧视觉语言大模型、具身大模型。

一个月前的 11 月 12 日，罗福莉在朋友圈正式官宣加入小米 Xiaomi MiMo 团队。就在昨晚，小米刚刚发布了最新的 MiMo 大模型 MiMo-V2-Flash，性能媲美 DeepSeek-V3.2，这也是罗福莉加入后 MiMo 团队亮出的首个新成果。

一、罗福莉首次解读小米大模型三个重点方向，算力和数据并非最终护城河

罗福莉一上台就回到了 "6 亿年前 "，她说，AI 正以非线性的方式重演人类大脑 6 亿年的进化史。

为什么大模型 " 智能 " 起源于语言？在罗福莉看来，语言是人类思维和物理世界在符号空间的 " 投影 "，而大模型成功解码了人类思维在文本空间的投影。

小米从 " 语言 " 出发，构建了面向 Agent 时代的语言基座模型 MiMo-V2-Flash。

在小米看来，超强的代码和工具调用能力是 Agent 沟通的高效 " 语言 "，围绕极致推理效率设计的模型结构是 " 高带宽 " 的 Agent 协作的关键，全新后训练范式则能够保证高效稳定的扩展强化学习训练。

这三个方面是小米聚焦的重点。

罗福莉特别提到，MiMo-V2-Flash 模型并不大，但在代码和 Agent 测评基准测试中已经达到全球开源模型 TOP2。

MiMo-V2-Flash 的推理效率是其突出优势，在全球大致相同水位的顶尖模型速度和成本象限里，MiMo-V2-Flash 实现了低成本和高速度优势。

具体来看，小米围绕极致推理效率来设计模型结构，采用了 Hybrid SWA 架构，固定 KV Cache，增强长文推理，此外，团队采用 3 层 MTP 推理加速并行 Token 验证，实现推理速度 2-2.6 倍的提升。

在全新后训练范式方面，团队采用了 Dense&Token-Level 的强化学习。

当前 MiMo-V2-Flash 已经初步具备了模拟世界的能力，比如通过 HTML 写操作系统、模拟太阳系、画一颗圣诞树。

今天发布会现场，罗福莉宣布 MiMo-V2-Flash 发布即开源，模型权重、技术报告都开源，API 限时免费。

对于未来的 Agent 发展，罗福莉提到，下一代智能体系统，不是一个 " 语言模拟器 "，而是一个真正理解我们世界、并与之共存的 " 智能体 "。

Agent 执行从 " 回答问题 " 到 " 完成任务 "，具有记忆、推理、自主规划、决策、执行的能力。

Omni 感知统一多模态感知，为 AI 理解物理世界打下基础，嵌入眼镜等智能终端、融入日常工作流。

在通往 AGI 的路上，罗福莉团队希望补全缺失的演化拼图，单纯 Scaling UP 参数量不够，他们要让 LLM 回到 " 演化课堂 "，补上它跳过的关键学习步骤。

简单来说，他们非常看重 AI 与真实世界的交互，强调多模态。

罗福莉特别提到，相比生物演化的稳固根基，AI 的发展有些像 " 空中楼阁 "。在她看来，AI 进化的下个起点，一定是有一个能跟物理世界交互的模型。

AI 不仅要看懂画面，还要理解背后的物理规律；AI 不仅要推理文本，而是理解世界的运作逻辑。

罗福莉说，这一观点并非共识，行业中也有不少人认为语言就可以实现最终的 AGI，比如 Ilya。

在她看来，算力和数据也并非最终的护城河，真正的护城河，是科学的研究文化与方法，是将未知问题结合模型优化转化为可用产品的能力。

罗福莉现场也开启了 " 招聘会 "，她提到，小米大模型 Core 团队是研究、产品与工程深度耦合的年轻团队，" 小而美 " 却充满创业精神，他们极度好奇、追求真理。

罗福莉提到，在她刚刚开始研究时，开源模型与顶尖模型的代差有三年，而今天这一差距已经缩短到了 " 数月 "。

他们相信开源的价值，开源的价值本质上是一种分布式的技术的加速的主义。在罗福莉看来，开源是实现 AGI 的普惠化，是确保所有人类的智慧共同进化的唯一路径。

未来，从数据的极致压缩，到算法的范式创新，再到与物理空间的深度链接，小米与全球 AI 共同定义未来。

95 后罗福莉本科就读于北京师范大学计算机专业，硕士毕业于北京大学计算语言学研究所计算语言学专业。她曾在阿里巴巴达摩院主导开发了多语言预训练模型 VECO，并推动了 AliceMind 的开源工作，2022 年入职 DeepSeek，参与了 MoE 大模型 DeepSeek-V2 的研发。

集诸多光环于一身，来到小米的罗福莉，其动向一直是业内关注的焦点。

结语：猛攻 Agent 基座模型，小米人车家生态全力冲刺 AI

AI，显然是整场小米生态大会围绕的核心关键词。

面向 AI 未来，小米的机会点显然不止于 AI 手机，手机、PC、穿戴、IoT、汽车，小米人车家全生态均能与 AI 深度融合，小米在大模型方面的 AI 基础能力提升则进一步加速了这一进程。

卢伟冰近日曾提到，小米 AI 大模型业务过去投入持续增长，"AI 与现实世界深度融合 " 已被列为小米未来十年核心战略。显然，面对 AI 这场硬仗，小米已经做好准备 All in，" 兵马和粮草 " 都在加码筹备。

宙世代

一起剪

相关标签