日前,月之暗面方面开源全新思考模型 Kimi K2 Thinking,并表示这是 "Kimi 迄今能力最强的开源思考模型 "。
据了解,Kimi K2 Thinking 基于月之暗面的模型即 Agent 理念训练,号称原生掌握 " 边思考,边使用工具 " 的能力,可在无人类干预的情况下自主实现 300 轮工具调用和持续稳定的多轮思考能力。对此月之暗面方面表示," 这是我们在 Test-Time Scaling(测试时扩展)领域的最新进展,通过同时扩展思考 Token 和工具调用的轮次,实现更强的 Agent 和推理性能 "。
据悉,Kimi K2 Thinking 在 Agentic 搜索、Agentic 编程、写作和综合推理能力等方面取得全面提升。在人类最后的考试(Humanity's Last Exam)、自主网络浏览能力(BrowseComp)、复杂信息收集推理(SEAL-0)等多项基准测试中,该模型表现均达到 SOTA 水平。
值得一提的是,针对思考模型会产生极长的解码长度,所以常规量化手段往往会导致模型性能大幅下降这一挑战,月之暗面方面在后训练(post-training)阶段采用了量化感知训练(QAT),并对 MoE 组件应用了 INT4 纯权重(weight-only)量化。据悉,这就使得 Kimi K2 Thinking 能够在复杂推理和 Agentic 任务中支持原生的 INT4 推理,并将生成速度提升约 2 倍,而且 INT4 对推理硬件的兼容性更强,对国产计算芯片也更加友好。
据了解,目前 Kimi K2 Thinking 已上线 Kimi 官网和最新版 Kimi App 的常规对话模式,Kimi Agent 模式的底层模型后续也将升级为 Kimi K2 Thinking,带来完整的多轮思考和工具调用能力。
同时 Kimi K2 Thinking API 也已上架 Kimi 开放平台,支持 256K 上下文,价格与 Kimi K2-0905 相同,每百万 Token 输入 4 元、输出 16 元,命中缓存的输入为 1 元。此外,用户还可通过 Hugging Face、ModelScope 等平台下载该模型,自行部署。
【本文图片来自网络】


登录后才可以发布评论哦
打开小程序可以发布评论哦