IT之家 15小时前
为Agent而生,阶跃星辰发布开源基座模型Step 3.5 Flash
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

IT 之家 2 月 2 日消息,阶跃星辰发布了旗下最新、最强开源基座模型 Step 3.5 Flash,官方称其具备强大的推理能力与 Agent 智能,为 Agent 而生。

性能 vs 模型尺寸

IT 之家附官方介绍如下:

核心亮点如下:

更快:推理速度最高 350 TPS(单请求代码类任务)

更强:在 Agent 场景和数学任务上媲美闭源模型

更稳:胜任复杂、长链条任务

阴影柱状图为 Step 3.5 Flash 开启 Parallel Thinking 后的增强性能。左侧开源模型按总参数量排序,右侧为闭源模型。XBench-DeepSearch 数据源自官方发布。

我们不仅需要 " 更聪明 " 的模型,更需要 " 值得信任 "、" 响应迅速 "、" 成本可控 " 的模型。Step 3.5 Flash 正是为此而来,我们采用:

稀疏 MoE 架构:每个 token 仅激活约 110 亿个参数(总计 1960 亿参数)

MTP-3:模型一次预测 3 个 Token,效率翻倍

3:1 滑动窗口与全局注意力混合架构(SWA + Full Attention):长文本中只看 " 重点 ",显著降低计算开销,高效处理 256K 上下文

Step 3.5 Flash 现已全量上线,官方还称已启动 Step 4 模型的训练,并邀请大家深度参与共创。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

开源 it之家 数学
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论