三易生活 2025-11-07
月之暗面开源全新思考模型,号称迄今能力最强
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_font3.html

 

日前,月之暗面方面开源全新思考模型 Kimi K2 Thinking,并表示这是 "Kimi 迄今能力最强的开源思考模型 "。

据了解,Kimi K2 Thinking 基于月之暗面的模型即 Agent 理念训练,号称原生掌握 " 边思考,边使用工具 " 的能力,可在无人类干预的情况下自主实现 300 轮工具调用和持续稳定的多轮思考能力。对此月之暗面方面表示," 这是我们在 Test-Time Scaling(测试时扩展)领域的最新进展,通过同时扩展思考 Token 和工具调用的轮次,实现更强的 Agent 和推理性能 "。

据悉,Kimi K2 Thinking 在 Agentic 搜索、Agentic 编程、写作和综合推理能力等方面取得全面提升。在人类最后的考试(Humanity's Last Exam)、自主网络浏览能力(BrowseComp)、复杂信息收集推理(SEAL-0)等多项基准测试中,该模型表现均达到 SOTA 水平。

值得一提的是,针对思考模型会产生极长的解码长度,所以常规量化手段往往会导致模型性能大幅下降这一挑战,月之暗面方面在后训练(post-training)阶段采用了量化感知训练(QAT),并对 MoE 组件应用了 INT4 纯权重(weight-only)量化。据悉,这就使得 Kimi K2 Thinking 能够在复杂推理和 Agentic 任务中支持原生的 INT4 推理,并将生成速度提升约 2 倍,而且 INT4 对推理硬件的兼容性更强,对国产计算芯片也更加友好。

据了解,目前 Kimi K2 Thinking 已上线 Kimi 官网和最新版 Kimi App 的常规对话模式,Kimi Agent 模式的底层模型后续也将升级为 Kimi K2 Thinking,带来完整的多轮思考和工具调用能力。

同时 Kimi K2 Thinking API 也已上架 Kimi 开放平台,支持 256K 上下文,价格与 Kimi K2-0905 相同,每百万 Token 输入 4 元、输出 16 元,命中缓存的输入为 1 元。此外,用户还可通过 Hugging Face、ModelScope 等平台下载该模型,自行部署。

【本文图片来自网络】

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

kimi 开源 考试 芯片 编程
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论