腾讯自研 AI 大模型混元 2.0 发布:总参数 406B,复杂推理场景综合表现“稳居国内第一梯队”
腾讯近日发布了其自研的 AI 大模型混元 2.0,该模型在多个核心评测上取得了显著提升,特别是在推理能力、代码与智能体(Agent)以及指令遵循方面表现突出。混元 2.0 拥有总参数 406B,激活参数 32B,并具备 256K 超长上下文窗口。在 IMO-AnswerBench 测试中,混元 2.0 得分达到 73.4 分,较之前提升了近 20%,数学与科学逻辑能力跻身行业第一梯队。在代码与智能体方面,SWE-bench Verified 得分从 6.0 飙升至 53.0,Tau2-Bench 从 17.1 提升至 72.4,显示出代码理解和自动化问题修复能力的巨大进步。此外,在复杂约束场景下的稳定性与执行准确率也全面增强,生成内容更自然、更少模板化与流水线感。混元 2.0 提供两大优化版本:HY 2.0 Think 和 HY 2.0 Instruct,分别面向深度推理、代码生成、复杂指令遵循等高难度场景和日常对话、创意写作以及高上下文多轮对话等通用场景。腾讯表示,混元 2.0 仍在持续进化中,接下来会在代码、智能体、个性化风格、长程记忆等方向迭代,全面提升模型在实际应用场景中的表现,并计划通过开源形式向社区开放相关技术和模型。目前,混元 2.0 已经在元宝和 ima 等腾讯原生 AI 应用中接入,并在腾讯云上线 API,用户可直接体验或接入部署。
评论已关闭