在现有的rust项目代码中,GLM4.7和Minimax2.1表现出了良好的bug修复能力,特别是在处理简单的代码问题时。测试环境配置为VSCode配合kilo和cc,使用的编程语言为rust。测试中,AI服务提供商包括iflow、mistral和anyrouter,使用的提示词为使用cargo check检查代码,修复 src\server\route\user.rs 中的错误。原始错误是在代码中使用了未定义的结构体,预期结果是AI能够正确使用代码中已定义的结构体。经过5次测试,结果显示这些模型在处理简单问题时表现良好,但在面对复杂问题时,如ML3在某些情况下仅使用部分现有代码,表明其处理复杂问题的能力相对较弱。因此,建议在处理复杂问题时使用更高级的模型如Sonnet 4.5进行修复,然后再使用ML3对代码进行整理。此外,测试也表明,当前使用的提示词可能过于简单,使用更详细的提示词可能会提高其他模型的表现。

标签: none

评论已关闭