DeepSeek即将发布V4模型，代码生成能力大幅提升

DeepSeek公司即将在2月发布其最新旗舰级AI模型V4，该模型专注于提升代码生成能力。据两位知情人士透露，V4模型是继2024年12月发布的V3模型之后的升级版本，初步测试显示，V4在代码生成方面表现优于Anthropic、Claude以及OpenAI的GPT系列模型。DeepSeek计划在2月中旬，即农历新年前后推出V4，但具体时间可能有所调整。

V3模型的推出已使DeepSeek在全球人工智能领域获得关注，而开源的R1模型更是引起了硅谷与华尔街的震动。R1模型的设计逻辑是在给出答案前进行深度思考，以解决复杂问题，其性能优异且训练成本相对较低。

在国内市场，DeepSeek推出了一款结合R1与V3能力的聊天机器人，该产品广受欢迎。2024年12月发布的V3.2版本在部分基准测试中表现优于GPT-5和Gemini3.0Pro。

V4模型在超长代码提示词处理与解析方面取得技术突破，对软件工程师有显著应用价值。此外，V4在训练全流程中优化了数据模式理解能力，且未出现性能衰减。

DeepSeek首席执行官梁文锋联合署名的研究论文提出了一种全新训练架构，支持在不增加芯片投入的情况下构建更大参数规模的人工智能模型。这一进展表明DeepSeek持续进行技术创新。

DeepSeek即将发布V4模型，代码生成能力大幅提升

评论已关闭