Qwen3-ASR在粤英客服对话场景下的基准测试结果分析
在粤英客服对话场景下,Qwen3-ASR-1.7B与Whisper-large-v3的基准测试结果对比显示,Qwen3-ASR-1.7B在零样本测试和微调后测试两个维度上均表现优异。零样本测试中,Qwen3-ASR的CER为35.98%,显著低于Whisper的60.75%,表明Qwen3-ASR在未进行任何微调的情况下,对粤语和英文混杂的客服对话场景有更好的识别能力。微调后测试中,Qwen3-ASR的CER进一步下降至16.21%,而Whisper的CER降至42.28%。这表明Qwen3-ASR对领域数据的适应能力强,微调效果更显著。此外,Qwen3-ASR在微调后的表现已达到客服场景语音转文字的实用水平。因此,建议在模型选型时,优先考虑Qwen3-ASR作为粤语语音识别的首选模型,并进一步增加训练数据量、提升标注质量以及尝试更大规模的Qwen3-ASR模型,以优化模型性能。
评论已关闭