腾讯发布首个Diffusion大语言模型WeDLM-8B：性能大幅提升，支持多种加速技术

腾讯公司近日发布了其首个Diffusion大语言模型WeDLM-8B，这一模型在数学推理任务中表现卓越，与经过vLLM优化的Qwen3-8B相比，其速度提升了3至6倍。此外，在大多数基准测试中，WeDLM-8B的性能超越了原始的Qwen3-8B-Instruct模型。特别值得一提的是，WeDLM-8B原生支持KV Cache，这一功能兼容FlashAttention、PagedAttention以及CUDA Graphs，极大地增强了模型的效率和性能。

WeDLM-8B的发布是腾讯在人工智能领域的重要一步，它不仅展示了腾讯在AI技术上的实力，也体现了公司致力于通过开源和开放科学推动人工智能进步和民主化的决心。用户可以通过以下链接在Hugging Face上获取更多关于WeDLM-8B的信息和资源：WeDLM-8B-Instruct。此外，更多关于WeDLM-8B的讨论和详细信息可以在的论坛中找到： - WeDLM-8B讨论。

这一创新模型的发布，不仅为AI研究者和开发者提供了强大的工具，也为整个AI社区带来了新的机遇和挑战。随着WeDLM-8B的广泛应用，我们有理由相信，它将在推动人工智能技术的发展和应用方面发挥重要作用。

腾讯发布首个Diffusion大语言模型WeDLM-8B：性能大幅提升，支持多种加速技术

评论已关闭