2026年1月8日,阿里Qwen团队发布了Qwen3-VL-Embedding和Qwen3-VL-Reranker,成为首批基于Qwen3-VL基础的开源多模态嵌入和重排序模型。这些模型实现了文本、图片、截图、视频及混合模态输入的统一处理,将它们映射到单一的高维语义空间中,实现无缝跨模态检索。这两个模型专为多模态信息检索(Multimodal RAG)与跨模态理解设计,旨在解决传统文本检索模型无法有效处理图像、视频、图表等视觉信息的问题。Qwen3-VL-Reranker和Qwen3-VL-Embedding模型可以在Hugging Face上找到,并且源代码托管在GitHub上。这些模型的出现为跨模态检索领域带来了新的可能性,使得不同模态的信息能够更加高效地被检索和理解。

标签: none

评论已关闭