CAISI发布评估报告:DeepSeek V4 Pro成中国最强模型,但仍落后美国前沿水平约8个月
人工智能标准与创新中心(CAISI)最近发布了一份关于开源人工智能模型DeepSeek V4 Pro的全面评估报告。报告显示,DeepSeek V4 Pro在多项性能指标上显著优于国内同类模型,成为了中国目前最强的AI模型。然而,尽管如此,DeepSeek V4 Pro与美国最前沿的AI技术相比,仍然存在约8个月的差距。CAISI的IRT(项目反应理论)模型评估表明,DeepSeek V4 Pro的综合Elo得分约为800分,这一水平与大约8个月前美国发布的GPT-5相当。但与当前的GPT-5.5(Elo 1260)和GPT-5.4(Elo 1070)相比,DeepSeek V4 Pro仍有较大差距。尽管DeepSeek V4 Pro表现出了卓越的性能,但AI技术的快速发展使得它仍需不断进步以保持国际竞争力。
评论已关闭