Qwen3-ASR在粤英客服对话场景下的基准测试结果分析

在粤英客服对话场景下，Qwen3-ASR-1.7B与Whisper-large-v3的基准测试结果对比显示，Qwen3-ASR-1.7B在零样本测试和微调后测试两个维度上均表现优异。零样本测试中，Qwen3-ASR的CER为35.98%，显著低于Whisper的60.75%，表明Qwen3-ASR在未进行任何微调的情况下，对粤语和英文混杂的客服对话场景有更好的识别能力。微调后测试中，Qwen3-ASR的CER进一步下降至16.21%，而Whisper的CER降至42.28%。这表明Qwen3-ASR对领域数据的适应能力强，微调效果更显著。此外，Qwen3-ASR在微调后的表现已达到客服场景语音转文字的实用水平。因此，建议在模型选型时，优先考虑Qwen3-ASR作为粤语语音识别的首选模型，并进一步增加训练数据量、提升标注质量以及尝试更大规模的Qwen3-ASR模型，以优化模型性能。

Qwen3-ASR在粤英客服对话场景下的基准测试结果分析

评论已关闭