Qwen3-ASR正式开源:语音识别新标杆
Qwen3-ASR系列语音识别模型的正式开源标志着语音识别领域迈入了一个新的里程碑。该系列模型包括三个版本:Qwen3-ASR-1.7B、Qwen3-ASR-0.6B和Qwen3-ForcedAligner-0.6B。这些模型基于自研的AuT语音编码器和Qwen3-Omni多模态基座,实现了端到端的语音理解能力,支持52种语言和方言的自动识别与转写。Qwen3-ASR-1.7B版本覆盖30种语言及22种中文方言和口音,在多项基准测试中达到了开源领域最优水平,特别是在中文方言识别和英文口音测试集上表现优异。Qwen3-ASR-0.6B则在效率与精度之间实现了平衡,特别适合高并发生产环境。这些模型不仅性能卓越,而且开源,为语音识别技术的发展提供了宝贵的资源。
评论已关闭