驱动之家 2025-12-06
腾讯混元2.0正式发布:推理能力/效率业界领先
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

快科技 12 月 6 日消息,腾讯自研大模型混元 2.0(Tencent HY 2.0)正式发布,同时 DeepSeek V3.2 也在腾讯生态内逐步接入。

目前,这两大模型已率先在元宝、ima 等腾讯 AI 原生应用中上线,腾讯云也已开放相关模型的 API 及平台服务。

全新发布的 Tencent HY 2.0,采用了混合专家(MoE)架构,具备高达 406B 总参数量(激活参数 32B),模型支持 256K 超长上下文窗口,推理能力和效率处于业界领先地位。

相比上一版本(Hunyuan-T1-20250822)模型,HY 2.0 Think 显著改进了预训练数据和强化学习策略,在数学、科学、代码、指令遵循等复杂推理场景的综合表现稳居国内第一梯队,泛化性大幅提升。

数学科学知识推理:使用高质量数据进行 Large Rollout 强化学习,使得 HY 2.0 Think 推理能力大幅增强,在国际数学奥林匹克竞赛(IMO-AnswerBench)和哈佛 MIT 数学竞赛(HMMT2025)等权威测试中取得一流成绩。结合预训练数据的进步,模型在极度考验知识水平的 Humanity ’ s Last Exam(HLE)和泛化性的 ARC AGI 等任务上也大幅进步。

指令遵循与长文多轮能力:通过重要性采样修正缓解了训练和推理不一致问题,实现了长窗口 RL 的高效稳定训练。同时通过多样化可验证的任务沙盒,以及基于打分准则的强化学习,显著提升了 HY 2.0 Think 在 Multi Challenge 等指令遵循和多轮任务的效果。

代码与智能体能力:构建了规模化的可验证环境及高质量合成数据,极大增强了模型在 Agentic Coding 及复杂工具调用场景下的落地能力,在 SWE-bench Verified 及 Tau2-Bench 等面向真实应用场景的智能体任务上实现了跃升。

基于 RLVR+RLHF 双阶段的强化学习策略,HY 2.0 的输出 " 质感 " 显著进步,在文本创作、前端开发、指令遵循等实用场景上展现了差异化优势。

在文学创作上,HY 2.0 有效减少了 "AI 味 ",可以敏锐捕捉指令中的潜在的情感需求,输出观点深刻、逻辑严密的文章。

Tencent HY 2.0 模型具备扎实的代码能力和一定的 " 视觉审美 ",在生成 Web 小游戏时,不仅能跑通复杂的 JS 逻辑,还能输出审美在线的 CSS 布局与动画效果。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

腾讯 数学 ai 效果 数学竞赛
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论