文章 5 0

    Deepseek 3.1 模型更新详解

    Deepseek 3.1 是一个融合模型,它能够进行推理但不是R2版本。这个模型在官网上的回复已经从v3.1变成了r1,官网上的r1版本已经不再提供。关于R2版本,有传言说由于华为升腾计算卡的问题,训练不顺利,因此不会马上上市,但这个说法尚未得到验证。Deepseek 3.1于2024年8月20日上线,其训练数据更新至2024年7月。模型的上下文长度从64k增加到了128k,但最大输出是否增加尚不确定。价格保持不变,基本参数与Deepseek 3 0324相同。官方模型卡尚未上线。LMArena和LiveBench的评分尚未上线,而Aider编程评分也尚未上线,只有Deepseek的宣传图。FictionBench长上下文评分也尚未上线。官网已经上线了Chat和API渠道,但OpenRouter尚未上线。如果你有足够的机器资源,可以下载模型。相关测试视频可以在YouTube上找到。