GLM4.7和Minimax2.1在rust项目中的bug修复表现测试

在现有的rust项目代码中，GLM4.7和Minimax2.1表现出了良好的bug修复能力，特别是在处理简单的代码问题时。测试环境配置为VSCode配合kilo和cc，使用的编程语言为rust。测试中，AI服务提供商包括iflow、mistral和anyrouter，使用的提示词为使用cargo check检查代码，修复 src\server\route\user.rs 中的错误。原始错误是在代码中使用了未定义的结构体，预期结果是AI能够正确使用代码中已定义的结构体。经过5次测试，结果显示这些模型在处理简单问题时表现良好，但在面对复杂问题时，如ML3在某些情况下仅使用部分现有代码，表明其处理复杂问题的能力相对较弱。因此，建议在处理复杂问题时使用更高级的模型如Sonnet 4.5进行修复，然后再使用ML3对代码进行整理。此外，测试也表明，当前使用的提示词可能过于简单，使用更详细的提示词可能会提高其他模型的表现。

GLM4.7和Minimax2.1在rust项目中的bug修复表现测试

评论已关闭