字节跳动豆包大模型团队正式开源首个多语言类SWE数据集

钛媒体快报 04-10

钛媒体 App 4 月 10 日消息，字节跳动豆包大模型团队正式开源首个多语言类 SWE 数据集—— Multi-SWE-bench，可用于评估和提升大模型 " 自动修 Bug" 能力。在 SWE-bench 基础上，Multi-SWE-bench 首次覆盖 Python 之外的 7 种主流编程语言，是真正面向 " 全栈工程 " 的评测基准。其数据均来自 GitHub issue，历时近一年构建，以尽可能准确测评和提高大模型高阶编程智能水平。

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

ZAKER旗下免费视频剪辑工具

宙世代

一起剪

相关标签