腾讯自研 AI 大模型混元 2.0 发布：总参数 406B，复杂推理场景综合表现“稳居国内第一梯队”

腾讯近日发布了其自研的 AI 大模型混元 2.0，该模型在多个核心评测上取得了显著提升，特别是在推理能力、代码与智能体（Agent）以及指令遵循方面表现突出。混元 2.0 拥有总参数 406B，激活参数 32B，并具备 256K 超长上下文窗口。在 IMO-AnswerBench 测试中，混元 2.0 得分达到 73.4 分，较之前提升了近 20%，数学与科学逻辑能力跻身行业第一梯队。在代码与智能体方面，SWE-bench Verified 得分从 6.0 飙升至 53.0，Tau2-Bench 从 17.1 提升至 72.4，显示出代码理解和自动化问题修复能力的巨大进步。此外，在复杂约束场景下的稳定性与执行准确率也全面增强，生成内容更自然、更少模板化与流水线感。混元 2.0 提供两大优化版本：HY 2.0 Think 和 HY 2.0 Instruct，分别面向深度推理、代码生成、复杂指令遵循等高难度场景和日常对话、创意写作以及高上下文多轮对话等通用场景。腾讯表示，混元 2.0 仍在持续进化中，接下来会在代码、智能体、个性化风格、长程记忆等方向迭代，全面提升模型在实际应用场景中的表现，并计划通过开源形式向社区开放相关技术和模型。目前，混元 2.0 已经在元宝和 ima 等腾讯原生 AI 应用中接入，并在腾讯云上线 API，用户可直接体验或接入部署。

腾讯自研 AI 大模型混元 2.0 发布：总参数 406B，复杂推理场景综合表现“稳居国内第一梯队”

评论已关闭