钛媒体 App 2 月 2 日消息,阶跃星辰发布新一代开源 Agent 基座模型 Step 3.5 Flash。该模型面向实时 Agent 工作流场景,最高推理速度可达每秒 350 个 token。据悉,Step 3.5 Flash 采用稀疏 MoE 架构,每个 token 仅激活约 110 亿个参数(总计 1960 亿参数)。包括华为昇腾、沐曦股份、壁仞科技、燧原科技、天数智芯、阿里平头哥在内的多家芯片厂商,已完成适配。

钛媒体 App 2 月 2 日消息,阶跃星辰发布新一代开源 Agent 基座模型 Step 3.5 Flash。该模型面向实时 Agent 工作流场景,最高推理速度可达每秒 350 个 token。据悉,Step 3.5 Flash 采用稀疏 MoE 架构,每个 token 仅激活约 110 亿个参数(总计 1960 亿参数)。包括华为昇腾、沐曦股份、壁仞科技、燧原科技、天数智芯、阿里平头哥在内的多家芯片厂商,已完成适配。
登录后才可以发布评论哦
打开小程序可以发布评论哦