GLM-5.2 在实际应用中的表现引发质疑
GLM-5.2 在实际应用中的表现引发了用户的质疑和讨论。用户表示尽管给了 GLM-5.2 多次机会,无论是在 opencode、pi 还是公司内部进行简单的任务测试,GLM-5.2 都表现不佳,频繁出错。最终,用户尝试将其应用于 cc 环境中,但结果依然不理想,因此用户对 GLM-5.2 的表现感到失望,并对其评价产生怀疑。用户推测,可能是因为目前网上对 GLM-5.2 的高评价主要基于理论测试和代码编写,而缺乏在真实世界项目中的应用。相比之下,用户所在团队已经成功将 agent 集成到实际工作流中。用户认为,目前能够满足实际需求的高性能模型仍然是 claude opus 4.8 和 gpt 5.5,以及已经停止开发的 fable-5。这些模型被认为是当前最优秀的,能够满足实际应用的需求。
评论已关闭