Deepseek 3.1 模型更新详解

作者: nurl

时间: 2025-08-21

Deepseek 3.1 是一个融合模型，它能够进行推理但不是R2版本。这个模型在官网上的回复已经从v3.1变成了r1，官网上的r1版本已经不再提供。关于R2版本，有传言说由于华为升腾计算卡的问题，训练不顺利，因此不会马上上市，但这个说法尚未得到验证。Deepseek 3.1于2024年8月20日上线，其训练数据更新至2024年7月。模型的上下文长度从64k增加到了128k，但最大输出是否增加尚不确定。价格保持不变，基本参数与Deepseek 3 0324相同。官方模型卡尚未上线。LMArena和LiveBench的评分尚未上线，而Aider编程评分也尚未上线，只有Deepseek的宣传图。FictionBench长上下文评分也尚未上线。官网已经上线了Chat和API渠道，但OpenRouter尚未上线。如果你有足够的机器资源，可以下载模型。相关测试视频可以在YouTube上找到。

标签: none

Deepseek 3.1 模型更新详解

评论已关闭

最新文章

最近回复

分类

归档

其它