DeepSeek 发布两款新模型 V3.2 与 V3.2-Speciale

DeepSeek 刚刚发布了两款新模型：DeepSeek V3.2 和 DeepSeek V3.2-Speciale。这两个模型都是基于强化 Agent 能力和融入思考推理技术开发的。DeepSeek V3.2 旨在平衡推理能力与输出长度，适合日常使用，例如问答场景和通用 Agent 任务场景。在公开的推理类 Benchmark 测试中，DeepSeek V3.2 达到了 GPT-5 的水平，仅略低于 Gemini-3.0-Pro。相比之下，DeepSeek V3.2-Speciale 的目标是探索模型能力的边界，它结合了 DeepSeek-Math-V2 的定理证明能力，具备出色的指令跟随、严谨的数学证明与逻辑验证能力，在主流推理基准测试上的性能表现媲美 Gemini-3.0-Pro。此外，DeepSeek-V3.2 是首个将思考融入工具使用的模型，同时支持思考模式与非思考模式的工具调用，大幅提高了模型的泛化能力。新模型的技术报告已发布，可以通过提供的链接查看。

DeepSeek 发布两款新模型 V3.2 与 V3.2-Speciale

评论已关闭

最新文章

最近回复

分类

归档

其它