LFM2.5 是一个专为设备端部署设计的新型混合模型系列。它在 LFM2 架构基础上进行了扩展预训练和强化学习。该模型系列以其顶尖性能、快速边缘推理和规模化训练而著称。1.2B 参数的模型可媲美更大规模的模型,在 AMD CPU 上实现 239 tok/s 解码,在移动 NPU 上达到 82 tok/s。内存占用低于 1GB,并首发支持 llama.cpp、MLX 和 vLLM。预训练语料从 10T 扩展至 28T 令牌,并采用大规模多阶段强化学习。模型地址和试用地址分别为:

标签: none

评论已关闭