GLM-4.6在Claude Code中支持思考及思维链回传
GLM-4.6模型在Claude Code中支持思考及思维链回传的功能,为用户提供了一个更加智能和深入的对话体验。从GLM-4.5版本开始,模型就已经对Claude Code进行了支持,但许多用户反映在Claude Code中无法启用思考功能。经过研究,发现官方文档中提到/chat/completions端点是默认启用思考的,但模型是否需要思考是由模型本身来判断的。由于Claude Code本身的提示词可能会干扰GLM模型的判断机制,导致模型很少进行思考。因此,需要通过提示词注入的方式引导模型进行思考。具体实现方式是通过编写一个Transformer类,在请求中注入特定的提示词,告诉模型它是一个专家推理模型,需要逐步思考并明确写出推理过程。此外,为了更好地处理思维链回传,模型将思考内容放入reasoning_content标签中,而不是think标签。这是因为think标签可能无法有效激活思考,而且如果使用think标签,模型的推理内容可能会被拆分到单独的字段中。思维链回传的必要性在于,如果不进行拆分,思维链的信息原本就会在消息中按照特定的标记进行输出,自然包含在下轮对话中。用户可以通过更新到最新版ccr,并在Providers中添加配置,以及在Router中切换思考模型来使用这一功能。这样,用户就可以享受到GLM-4.6模型在Claude Code中提供的更加智能和深入的对话体验。
评论已关闭