DeepSeek即将发布V4模型,代码生成能力大幅提升
DeepSeek公司即将在2月发布其最新旗舰级AI模型V4,该模型专注于提升代码生成能力。据两位知情人士透露,V4模型是继2024年12月发布的V3模型之后的升级版本,初步测试显示,V4在代码生成方面表现优于Anthropic、Claude以及OpenAI的GPT系列模型。DeepSeek计划在2月中旬,即农历新年前后推出V4,但具体时间可能有所调整。
V3模型的推出已使DeepSeek在全球人工智能领域获得关注,而开源的R1模型更是引起了硅谷与华尔街的震动。R1模型的设计逻辑是在给出答案前进行深度思考,以解决复杂问题,其性能优异且训练成本相对较低。
在国内市场,DeepSeek推出了一款结合R1与V3能力的聊天机器人,该产品广受欢迎。2024年12月发布的V3.2版本在部分基准测试中表现优于GPT-5和Gemini3.0Pro。
V4模型在超长代码提示词处理与解析方面取得技术突破,对软件工程师有显著应用价值。此外,V4在训练全流程中优化了数据模式理解能力,且未出现性能衰减。
DeepSeek首席执行官梁文锋联合署名的研究论文提出了一种全新训练架构,支持在不增加芯片投入的情况下构建更大参数规模的人工智能模型。这一进展表明DeepSeek持续进行技术创新。
评论已关闭