Claude Opus 4.7在Unity C#项目中的横向评测分析
在最近的一次评测中,我针对Unity C#项目中的皮肤系统需求案进行了测试,该项目涉及预制体的使用以及模型代码的编写。评测在完全一致的项目和环境条件下进行了三轮,分别是第一轮、第九轮,以及本次评测。使用的模型是Claude Opus 4.7,它被描述为官方Claude Code的中转站。
在速度方面,Claude Opus 4.7处理了大约4.89M的令牌数,并生成了1473行代码,删除了8行代码。然而,完成度方面存在严重问题,审查结论指出存在必然编译失败的情况,且核心入口链路未打通。尽管提供了详细信息链接供进一步了解,但代码质量依旧保持了Claude的经典风格。
最终总结显示,使用中文提问时,Claude Opus 4.7在完成过程中使用的是英文,但总结输出为中文。与上一代相比,速度提升了6分钟(23%),但出现了两个致命的编译错误,表明注意力集中度有待提高。此外,模型在此次评测中重复了之前犯的错误,且表现得过于抽象,即便给了三次机会,结果依然没有改善。目前,T3排行榜由Opus 4.7领衔,后续的T3级别选手可能需要较长时间才能超越。
此外,评测还提到了使用开源VS Code插件Unify Chat Provider在Copilot中使用Claude模型的情况。
以上评测内容来源于社区,作者为SmallMain。
评论已关闭