DeepSeek-V3.2-Exp版本发布,带来了训练和推理效率的提升,同时API价格也进行了下调,实现了降本增效的目标。DeepSeek-V3.2-Exp采用了稀疏注意力机制(DSA),这一创新技术实现了细粒度的稀疏注意力处理,使得在保持几乎相同模型输出质量的同时,显著提高了长上下文训练和推理的效率。对于用户而言,这一版本的发布意味着输入成本降低了50%,输出成本降低了75%。这一改进不仅提升了用户体验,也为用户节省了成本。DeepSeek-V3.2-Exp的更多信息和资源可以在魔搭社区、Huggingface、Github以及微信公众号上找到。这一版本的发布是DeepSeek团队在人工智能领域持续创新和优化的体现,为用户提供了更高效、更经济的服务。

标签: none

评论已关闭