LongCat-Flash-Thinking-2601 是一个专为深度与通用代理式思维设计的全新进化版本。这个版本具有顶级代理能力,在基准测试中表现优异,特别是在TIR(任务识别)、Agentic Search(代理式搜索)和Agentic Tool Use(代理式工具使用)方面。它拥有优秀的泛化能力,在复杂且随机的任务中表现优于Claude。此外,它还支持多个自动构建的高质量环境,并具有密集的依赖图。在多环境强化学习方面,它扩展了DORA(RL基础设施),支持大规模多环境代理训练。

在真实世界的鲁棒性方面,LongCat-Flash-Thinking-2601在混乱、不确定的场景中表现稳健,能够应对Vita-Noise与Tau^2-Noise。它还进行了噪声分析,系统性地分析了代理场景下的真实世界噪声,并采用课程式强化学习,在训练过程中逐步增加噪声类型与强度。

在深度思考模式方面,它支持并行思考,通过多个独立的推理路径扩大广度,并使用迭代总结,通过摘要模型合成输出以增强深度,支持迭代推理循环。此外,一个通过Zigzag Attention实现的100万token上下文功能即将推出。

LongCat-Flash-Thinking-2601是一个开源项目,可以通过以下链接了解更多信息:

LongCat团队致力于通过开源和开放科学推动人工智能的进步和民主化。

标签: none

评论已关闭