MRCR v2(大海捞针8轮)更新:1M成绩,GLM 5.2 强于DS V4 Pro,Mimo V2.5 Pro,低于Opus 4.6,Gemini 3.5 Flash。在Context Arena的Leaderboard上,部分模型在1M上下文成绩中,gpt-5.5以50.9%的成绩领先,而claude-opus-4.6紧随其后,达到46.9%。其他模型如claude-sonnet-4.6、gemini-3.5-flash等也表现不俗。在128k上下文成绩中,gpt-5.5依然保持领先,而claude-opus-4.8和gpt-5.4紧随其后。更多详细信息和讨论可以在的完整话题中找到。

标签: none

评论已关闭