谷歌近日发布了名为TranslateGemma的开放翻译模型系列,该系列基于Gemma 3架构,包含4B、12B和27B三种参数规模,支持55种核心语言,并具备多模态图像翻译能力。TranslateGemma系列已在Kaggle和Hugging Face上开放下载,其性能测试结果显示,TranslateGemma 12B版本的翻译质量超越了参数量大其两倍的Gemma 3 27B基线模型,这意味着开发者可以用更少的算力资源获得更高保真的翻译结果。此外,体量最小的4B模型性能与12B基线模型相当,为移动端和边缘计算设备提供了强大的翻译能力。TranslateGemma的高密度智能源于独特的“两阶段微调”工艺,包括监督微调和强化学习阶段,以生成更自然的译文。该系列模型完整保留了多模态能力,提升了图像内文字的翻译效果。三种尺寸的模型对应不同的部署场景:4B模型专为手机和边缘设备优化;12B模型适配消费级笔记本电脑;27B模型则面向追求极致质量的场景。

标签: none

评论已关闭