钛媒体 App 12 月 12 日消息,蚂蚁技术研究院今日宣布推出 LLaDA2.0 系列离散扩散大语言模型(dLLM),并同步公开了背后的技术报告。LLaDA2.0 包含 MoE 架构的 16B ( mini ) 和 100B ( flash ) 两个版本,将 Diffusion 模型的参数规模首次扩展到了 100B 量级。(广角观察)

钛媒体 App 12 月 12 日消息,蚂蚁技术研究院今日宣布推出 LLaDA2.0 系列离散扩散大语言模型(dLLM),并同步公开了背后的技术报告。LLaDA2.0 包含 MoE 架构的 16B ( mini ) 和 100B ( flash ) 两个版本,将 Diffusion 模型的参数规模首次扩展到了 100B 量级。(广角观察)
登录后才可以发布评论哦
打开小程序可以发布评论哦