在比较 Claude Haiku 4.5、Sonnet 4.5 和 Codex 在处理日常中上难度的重构任务时的表现时,我们可以从以下几个方面来分析它们的优劣。

首先,任务描述了一个前端项目重构的情况,其中涉及到将一个单元测试用例的主要部分重构为辅助函数,并在另一个测试用例中调用这些辅助函数。这个任务的难点在于两个测试用例大部分代码相似,但并不完全相同,且相似和不相似的部分交织在一起。

Claude Haiku 4.5 在处理这个任务时用时40分钟,但完全忽略了重构函数需要在另一个测试用例中复用的要求,因此只生成了一个适用于Test1的辅助函数。尽管如此,它在工具调用方面表现得不错。

Sonnet 4.5 则用时1小时30分钟,完全理解了任务意图,并尝试重构B1→C→D1部分为一个通用函数,但发现不能完全通用,于是又尝试重构为接受不同参数的函数,虽然能工作,但不够直观。

Codex 则用时9分57秒,将B1/B2和D1/D2分别重构为带参数的通用小函数,并将C重构为一个通用函数,基本上不需要修改就可以继续迭代。

从这些结果来看,Haiku 4.5 虽然快速且便宜,但只适用于最简单明了的任务;Sonnet 4.5 在适当调教后也能表现出色;而Codex虽然慢,但在处理复杂任务时表现出强大的功能,是功力最强大的工具。

综上所述,对于日常中上难度的重构任务,Codex + High 是最佳选择,尽管它需要更多的时间,但能够提供最有效的解决方案。

标签: none

评论已关闭