手机中国 前天
阿里通义千问3.7发布 跻身全球前十五 国产模型排名第一
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

【CNMO 科技消息】5 月 20 日,阿里云峰会正式开幕,阿里巴巴集团副总裁、阿里云智能 CTO、阿里巴巴合伙人周靖人在会上宣布,通义千问 Qwen3.7 系列大模型正式发布。旗舰版 Qwen3.7-Max 以 " 全能智能体基座 " 为定位,在编程、推理、工具调用等能力上实现了跨越式升级,并在多项全球权威评测中刷新了国产模型的排名纪录。

千问

从综合排名来看,Qwen3.7-Max 在 Arena AI 全球大模型文本总榜中位列第 13 位,超越了 Gemini 3 Flash 和 GPT-5.5 等国际模型,成为榜单前 15 名中唯一的国产模型。细分领域同样表现亮眼:数学能力全球第 7,编程能力全球第 10,专家级应用与软件及 IT 领域均位列第 9。视觉方面,Qwen3.7-Plus 预览版在视觉总榜排名第 16,推动阿里实验室视觉能力跃升至全球第 5。在知识和逻辑推理等主流评测中,Qwen3.7 全面领先 Kimi K2.6、智谱 GLM5.1、DeepSeek V4 Pro、opus4.6-Max 等国内及国际最新模型,稳居国内第一。

工具调用和编程能力是本次升级的重头戏。Qwen3.7 的编程智能体支持复杂工程开发,在 TerminalBench 2.0 测试中得分 69.7,超越 DS-V4-ProMax 的 67.9 分;在 SWE-Pro 得分 60.6、SciCode 得分 53.5 等编程基准中同样领先。更值得关注的是,在一项持续 35 小时、超过 1000 次工具调用的长周期实验中,Qwen3.7 保持了稳定的推理能力,实现了端到端任务闭环。办公自动化方面,SpreadsheetBench-V1 得分 87.0,处于行业顶尖水平。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

阿里 阿里云 阿里巴巴 编程 通义千问
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论