驱动之家 3小时前
腾讯混元2.0正式发布:推理能力/效率业界领先
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

快科技 12 月 6 日消息,腾讯自研大模型混元 2.0(Tencent HY 2.0)正式发布,同时 DeepSeek V3.2 也在腾讯生态内逐步接入。

目前,这两大模型已率先在元宝、ima 等腾讯 AI 原生应用中上线,腾讯云也已开放相关模型的 API 及平台服务。

全新发布的 Tencent HY 2.0,采用了混合专家(MoE)架构,具备高达 406B 总参数量(激活参数 32B),模型支持 256K 超长上下文窗口,推理能力和效率处于业界领先地位。

相比上一版本(Hunyuan-T1-20250822)模型,HY 2.0 Think 显著改进了预训练数据和强化学习策略,在数学、科学、代码、指令遵循等复杂推理场景的综合表现稳居国内第一梯队,泛化性大幅提升。

数学科学知识推理:使用高质量数据进行 Large Rollout 强化学习,使得 HY 2.0 Think 推理能力大幅增强,在国际数学奥林匹克竞赛(IMO-AnswerBench)和哈佛 MIT 数学竞赛(HMMT2025)等权威测试中取得一流成绩。结合预训练数据的进步,模型在极度考验知识水平的 Humanity ’ s Last Exam(HLE)和泛化性的 ARC AGI 等任务上也大幅进步。

指令遵循与长文多轮能力:通过重要性采样修正缓解了训练和推理不一致问题,实现了长窗口 RL 的高效稳定训练。同时通过多样化可验证的任务沙盒,以及基于打分准则的强化学习,显著提升了 HY 2.0 Think 在 Multi Challenge 等指令遵循和多轮任务的效果。

代码与智能体能力:构建了规模化的可验证环境及高质量合成数据,极大增强了模型在 Agentic Coding 及复杂工具调用场景下的落地能力,在 SWE-bench Verified 及 Tau2-Bench 等面向真实应用场景的智能体任务上实现了跃升。

基于 RLVR+RLHF 双阶段的强化学习策略,HY 2.0 的输出 " 质感 " 显著进步,在文本创作、前端开发、指令遵循等实用场景上展现了差异化优势。

在文学创作上,HY 2.0 有效减少了 "AI 味 ",可以敏锐捕捉指令中的潜在的情感需求,输出观点深刻、逻辑严密的文章。

Tencent HY 2.0 模型具备扎实的代码能力和一定的 " 视觉审美 ",在生成 Web 小游戏时,不仅能跑通复杂的 JS 逻辑,还能输出审美在线的 CSS 布局与动画效果。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

腾讯 数学 ai 效果
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论