GLM-4.6在Claude Code中支持思考及思维链回传

GLM-4.6模型在Claude Code中支持思考及思维链回传的功能，为用户提供了一个更加智能和深入的对话体验。从GLM-4.5版本开始，模型就已经对Claude Code进行了支持，但许多用户反映在Claude Code中无法启用思考功能。经过研究，发现官方文档中提到/chat/completions端点是默认启用思考的，但模型是否需要思考是由模型本身来判断的。由于Claude Code本身的提示词可能会干扰GLM模型的判断机制，导致模型很少进行思考。因此，需要通过提示词注入的方式引导模型进行思考。具体实现方式是通过编写一个Transformer类，在请求中注入特定的提示词，告诉模型它是一个专家推理模型，需要逐步思考并明确写出推理过程。此外，为了更好地处理思维链回传，模型将思考内容放入reasoning_content标签中，而不是think标签。这是因为think标签可能无法有效激活思考，而且如果使用think标签，模型的推理内容可能会被拆分到单独的字段中。思维链回传的必要性在于，如果不进行拆分，思维链的信息原本就会在消息中按照特定的标记进行输出，自然包含在下轮对话中。用户可以通过更新到最新版ccr，并在Providers中添加配置，以及在Router中切换思考模型来使用这一功能。这样，用户就可以享受到GLM-4.6模型在Claude Code中提供的更加智能和深入的对话体验。

GLM-4.6在Claude Code中支持思考及思维链回传

评论已关闭