Ollama 0.15版本发布,其中GLM4.7 Flash的优化非常关键,特别是针对64k+的长Context进行了内存占用的降低,对于显存有限的本地环境来说非常友好。此外,新增了ollama launch命令,可以直接运行Claude Code和Codex等代码模型。虽然本地运行全精度GLM 4.7可能存在困难,但用户可以考虑使用云服务选项。这些更新和功能为用户提供了更灵活和高效的本地及云端模型运行体验。

标签: none

评论已关闭