OpenCode Go中的GLM-5.2模型缓存问题及成本优化策略
在OpenCode Go中使用GLM-5.2模型时,关于缓存的问题,确实存在一些。根据您的描述,您通过自建的newapi接入GLM-5.2模型,再经由cc-switch连接到Claude Code,期间还遇到了cache_control参数的报错问题,并开启了'DISABLE_PROMPT_CACHING': '1'的配置。这可能导致每次调用GLM-5.2模型时,都没有启用缓存机制,从而按输入输出进行计费。不过,通常来说,模型服务提供商会提供一定的缓存机制来优化成本和响应时间。如果您的使用场景确实没有利用到缓存,那么成本可能会相对较高。建议您检查OpenCode Go的文档或联系他们的技术支持,以获取更详细的缓存策略信息,并确认是否有其他配置可以优化成本。此外,对比其他模型服务,如deepseek v4 pro,确实可以发现成本差异。您可能需要根据实际使用情况调整接入方式或配置,以找到最优的成本效益方案。
评论已关闭