Code AI模型测试：Claude Code表现最佳，GPT5.1-codex-max遇到挑战

在当前的AI模型测试中，使用Claude Code、通义千问和智谱编写C++代码，结果显示Claude Code表现最佳。用户在copilot上使用GPT5.1-codex-max进行编码时遇到了问题，感觉这个版本不如GPT5.1-codex。用户指出GPT5.1-codex-max在理解问题时出现了偏差，尽管问题描述清晰，但模型的行为不符合预期。相比之下，Claude和Gemini能够更好地理解相同的问题。用户尝试让GPT5.1-codex-max修改代码错误，但模型坚持自己的代码正确无误，表现出类似复读机的行为。用户对此感到失望，并考虑更换其他模型。这一情况反映了不同AI模型在编码任务中的表现差异，以及用户对模型准确性和响应性的期望。

Code AI模型测试：Claude Code表现最佳，GPT5.1-codex-max遇到挑战

评论已关闭