Code AI模型测试:Claude Code表现最佳,GPT5.1-codex-max遇到挑战
在当前的AI模型测试中,使用Claude Code、通义千问和智谱编写C++代码,结果显示Claude Code表现最佳。用户在copilot上使用GPT5.1-codex-max进行编码时遇到了问题,感觉这个版本不如GPT5.1-codex。用户指出GPT5.1-codex-max在理解问题时出现了偏差,尽管问题描述清晰,但模型的行为不符合预期。相比之下,Claude和Gemini能够更好地理解相同的问题。用户尝试让GPT5.1-codex-max修改代码错误,但模型坚持自己的代码正确无误,表现出类似复读机的行为。用户对此感到失望,并考虑更换其他模型。这一情况反映了不同AI模型在编码任务中的表现差异,以及用户对模型准确性和响应性的期望。
评论已关闭