GLM-5.2 在实际应用中的表现引发质疑

GLM-5.2 在实际应用中的表现引发了用户的质疑和讨论。用户表示尽管给了 GLM-5.2 多次机会，无论是在 opencode、pi 还是公司内部进行简单的任务测试，GLM-5.2 都表现不佳，频繁出错。最终，用户尝试将其应用于 cc 环境中，但结果依然不理想，因此用户对 GLM-5.2 的表现感到失望，并对其评价产生怀疑。用户推测，可能是因为目前网上对 GLM-5.2 的高评价主要基于理论测试和代码编写，而缺乏在真实世界项目中的应用。相比之下，用户所在团队已经成功将 agent 集成到实际工作流中。用户认为，目前能够满足实际需求的高性能模型仍然是 claude opus 4.8 和 gpt 5.5，以及已经停止开发的 fable-5。这些模型被认为是当前最优秀的，能够满足实际应用的需求。

GLM-5.2 在实际应用中的表现引发质疑

评论已关闭