CAISI发布评估报告：DeepSeek V4 Pro成中国最强模型，但仍落后美国前沿水平约8个月

人工智能标准与创新中心（CAISI）最近发布了一份关于开源人工智能模型DeepSeek V4 Pro的全面评估报告。报告显示，DeepSeek V4 Pro在多项性能指标上显著优于国内同类模型，成为了中国目前最强的AI模型。然而，尽管如此，DeepSeek V4 Pro与美国最前沿的AI技术相比，仍然存在约8个月的差距。CAISI的IRT（项目反应理论）模型评估表明，DeepSeek V4 Pro的综合Elo得分约为800分，这一水平与大约8个月前美国发布的GPT-5相当。但与当前的GPT-5.5（Elo 1260）和GPT-5.4（Elo 1070）相比，DeepSeek V4 Pro仍有较大差距。尽管DeepSeek V4 Pro表现出了卓越的性能，但AI技术的快速发展使得它仍需不断进步以保持国际竞争力。

CAISI发布评估报告：DeepSeek V4 Pro成中国最强模型，但仍落后美国前沿水平约8个月

评论已关闭