量子位 03-19
小米神操作!认领榜一神秘模型Hunter Alpha,龙虾之父都忍不住打听
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

占领 OpenRouter 调用量榜单第一的神秘模型 Hunter Alpha,终于揭开神秘面纱——

既不是 GPT,也不是 DeepSeek,而是来自小米的万亿旗舰模型 MiMo-V2-Pro。

就在今天凌晨,小米团队官宣了 MiMo-V2 家族三款新模型,分别是 Pro、Omni 和 TTS。

其中对于 Pro,小米在官方介绍中明确提到,就是此前的 Hunter Alpha。

在这之前,网友们对这两款模型的身份可谓是猜什么的都有,有的说是 GPT,也有人觉得是 DeepSeek。

当知道它的真实身份是小米的时候,很多人都为之惊讶。

MiMo-V2-Pro 参数规模万亿,支持百万级长文本,非常擅长应对真实场景中的任务。

它不仅在 Artificial Analysis 全球智能指数里拿了全球第八和国内第二的好成绩,写代码的本事也超过了 Claude 4.6 Sonnet。

无论是调用工具还是规划复杂任务,它的表现也都相当扎实,能直接用 Three.js 写出一个带有动态背景和升级路线的 3D 塔防游戏代码。

当然,一同亮相的 Omni 和语音合成模型 TTS,也同样实力强悍。

小米三款模型一同亮相

作为整个家族的旗舰大模型,MiMo-V2-Pro 核心设计围绕真实世界的智能体工作流展开。

它的模型总参数量突破了 1T 大关,激活参数达到 42B,上下文窗口 1M,整体规模大约是 MiMo-V2-Flash 的三倍。

在底层架构设计上,它继承了混合注意力机制,并且将混合比例从 5:1 大幅提升到了 7:1,兼顾了超大规模与极高的推理效率。

搭配轻量级的 MTP 多 Token 预测层,模型在处理高达 1M Token 超长上下文时依然能够保持极快的生成速度。

为了支撑如此庞大的模型训练与运行,小米 AI 团队与北京大学联合研发了统一资源管理系统 ARL-Tangram。

这套系统采用了统一的动作级公式和弹性调度算法,完美解决了异构资源约束的难题,将平均动作完成时间提升了高达 4.3 分。

在真实世界的智能体强化学习任务中,该系统让训练步骤的持续时间至多缩短了 1.5 倍,直接将算力成本与外部资源消耗大幅降低了 71.2%。

在具体的性能表现上,MiMo-V2-Pro 交出了一份相当亮眼的成绩单。

根据 Artificial Analysis 的最新评测,它成功拿下了国产第二、全球第八和的优异排名。

在评估通用智能体能力的权威基准中,它在 PinchBench 上获得了 84.0 的高分,在 ClawEval 中也拿到了 61.5 分,整体表现全面超越了 Gemini 3 Pro,并逼近 Claude Opus 4.6。

而在代码能力方面,它在 SWE-bench Verified 测试中取得了 86.7 分,直接超越了 Claude 4.6 Sonnet,展现出极强的系统设计与复杂任务规划水准。

此前在 OpenRouter 平台上以 Hunter Alpha 代号进行盲测时,它的总调用量迅速登顶。

其中,OpenClaw 贡献了 675B Token 的使用量,Kilo Code 和 Roo Code 也分别达到了 50.1B 和 38.6B Token,这些硬核的代码开发工具充分验证了它在生产环境中的极致可靠性。

为了检验实战水平,小米团队把它接入了 OpenClaw 框架进行前端开发测试。

只需要一段提示词它就能生成带有 1990 年代复古杂志风格的网页,无论是排版还是噪点滤镜都处理得非常到位。

MiMo-V2-Omni 作为全模态模型,最大的亮点在于它把图像、视频和音频编码器融合进了一个主干网络里。

它能像人类一样同时看、听和读,并且可以直接把感知转化为行动。

在实际测试中,它能充当自动驾驶的视觉大脑提前预测潜在危险,还能作为智能体基模,完全自主地在浏览器里完成跨平台比价和购物,将各种工具调用和界面交互处理得游刃有余。

MiMo-V2-TTS 则是一个专门给智能体赋予感情的语音模型。

只要直接用自然语言输入提示词,就能精确控制它的音色和情绪走向。

它不仅能根据上下文自动判断该用什么语气说话,还能特别自然地加入咳嗽、叹气或者笑声这些细节。

身份让龙虾之父也好奇

在谜底正式揭晓之前,Hunter Alpha 和 Healer Alpha 的身份曾经引起了全球网友的广泛好奇。

它们亮相于 3 月 11 日,随后在 OpenRouter 上的调用量连续多日霸榜,总使用量迅速突破了 1T Token。

就连龙虾之父 Peter Steinberger 也在 X 上发帖询问,有没有人知道这两款模型的具体细节。

有人猜是 OpenAI,毕竟拿神秘模型在 OpenRouter 上试水已经是 OpenAI 的惯例了,而且命名习惯也很符合 OpenAI 的调性。

但考虑到 Peter 已经被 OpenAI 收编,不知道自家模型显得不是那么合理,当然也不排除 OpenAI 对内保密,或者 Peter 也在演戏的可能。

不过也有人从测试中发现,这个模型自称主要使用中文训练,因此可能来自中国,被猜测是 DeepSeek-V4。

当然,也有在模型亮相早期就猜到这两款模型来自小米的,在 3 月 14 日就有网友在小红书上提及过这一传闻。

今晚,小米就要召开新的发布会了,在这个时间点公开模型身份,或许是在给新产品做铺垫。

如果你对小米的这三款新模型感兴趣,可以亲手试一下。

模型介绍:

https://mimo.xiaomi.com/mimo-v2-pro

https://mimo.xiaomi.com/mimo-v2-omni

https://mimo.xiaomi.com/mimo-v2-tts

—  欢迎 AI 产品从业者共建  

「AI 产品知识库」是量子位智库基于长期产品库追踪和用户行为数据推出的飞书知识库,旨在成为 AI 行业从业者、投资者、研究者的核心信息枢纽与决策支持平台。

一键关注 点亮星标

科技前沿进展每日见

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

小米
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论