DeepSeek 发布两款新模型 V3.2 与 V3.2-Speciale
DeepSeek 刚刚发布了两款新模型:DeepSeek V3.2 和 DeepSeek V3.2-Speciale。这两个模型都是基于强化 Agent 能力和融入思考推理技术开发的。DeepSeek V3.2 旨在平衡推理能力与输出长度,适合日常使用,例如问答场景和通用 Agent 任务场景。在公开的推理类 Benchmark 测试中,DeepSeek V3.2 达到了 GPT-5 的水平,仅略低于 Gemini-3.0-Pro。相比之下,DeepSeek V3.2-Speciale 的目标是探索模型能力的边界,它结合了 DeepSeek-Math-V2 的定理证明能力,具备出色的指令跟随、严谨的数学证明与逻辑验证能力,在主流推理基准测试上的性能表现媲美 Gemini-3.0-Pro。此外,DeepSeek-V3.2 是首个将思考融入工具使用的模型,同时支持思考模式与非思考模式的工具调用,大幅提高了模型的泛化能力。新模型的技术报告已发布,可以通过提供的链接查看。
评论已关闭