在本次评测中,我对比了多个模型在Unity C#项目中的表现,特别是针对皮肤系统需求案的代码生成能力。评测的项目包括Step-3.5-Flash、Qwen3-Coder-Next、GPT-5.3-Codex(xhigh)、GPT-5.3-Codex(high)、GPT-5.3-Codex(medium)和Claude-Opus-4.6。评测的依据包括速度、令牌数、代码行数和代码质量等方面。评测结果显示,Step-3.5-Flash在速度上表现优异,但存在编译阻断和核心功能回退的问题;Qwen3-Coder-Next的表现与Step-3.5-Flash相似;GPT-5.3-Codex系列模型在代码质量和完成度上表现较好,但xhigh版本在令牌数上表现更优;Claude-Opus-4.6虽然注释丰富,但在完成度上存在问题。最终,GPT-5.3-Codex(high)和GPT-5.3-Codex(medium)被评定为Tier 1,表现最佳。

标签: none

评论已关闭