最近,我在使用Codex的过程中,又深入研究了Droid,感觉已经可以勉强使用了。然而,当我浏览论坛时,发现CC 2.0和Sonnet 4.5都已经发布了。我意识到,如果早知道这些信息,我可能就不必费那么大力气了。我决定使用一个之前收藏的BUG,来测试Sonnet 4.5的性能。这个BUG是一个循环依赖问题,通常会使大模型感到困惑。我尝试了多个模型,只有CodeX能够迅速解决这个BUG,只需删除一行关键代码。而CC在处理这个问题时,总是不得要领,直到最近才有所改善。现在,我对Sonnet 4.5进行了考核,结果是‘秒杀!恭喜,你过关’。此外,DeepSeek 3.2在我的二次提醒后也能解决这个问题,值得期待。这次测试表明,Sonnet 4.5在处理复杂问题方面表现出色,而其他模型可能还需要更多的改进。

标签: none

评论已关闭