Claude Code 是一种先进的代码生成工具,它通过环境变量来控制其行为。其中一个重要的环境变量是 CLAUDE_AUTOCOMPACT_PCT_OVERRIDE,它能够调整代码自动压缩的阈值。例如,如果将 CLAUDE_AUTOCOMPACT_PCT_OVERRIDE 设置为 80,那么当上下文占用达到 80% 时,Claude Code 将会触发自动压缩,而默认的压缩阈值是 95%。

这个环境变量对于保持长上下文中的“甜品上下文长度”非常有用,尤其是在处理不敏感的任务时,它能够帮助实现准确率、幻觉和上下文长度的最佳平衡。结合 Fiction.LiveBench for Long Context Deep Comprehension 使用,可以更好地理解 Claude Sonnet 4 模型在 120k 上下文长度时的表现,它能够保持 81% 的准确率。为了达到这一准确率,我们可以将上下文长度维持在 120k,这相当于 46.88% 的上下文占用率。

然而,频繁压缩上下文可能会导致 token 的浪费,并可能造成上下文的缺失。因此,建议从一个较高的数值开始,比如 90%,然后根据实际任务和体验逐步调整到最合适的“甜品位置”。此外,使用 /context 命令可以查看当前 Claude Code 的上下文分布情况。

Fiction.LiveBench for Long Context Deep Comprehension 最后更新于 9 月,更新的模型上下文-准确率基准可以在相关站内找到。

最后,感谢哈雷佬提供的解包信息,这对于理解和使用 Claude Code 非常有帮助。如果遇到上下文窗口爆出的问题,可以参考相关论坛的讨论和求助信息。

标签: none

评论已关闭