阿里开源千问3向量模型，性能大幅提升，挑战谷歌和OpenAI

在人工智能技术快速发展的今天，阿里巴巴于6月6日正式开源了其全新的千问3向量模型系列 ——Qwen3-Embedding。该模型是基于千问3底座，为文本表征、检索和排序等任务进行优化，标志着阿里在 AI 领域的又一重大突破。

相较于前一版本，Qwen3-Embedding 在文本检索、聚类和分类等核心任务上的性能提升了超过40%。这一进步不仅让它在技术上更具竞争力，还使得它在 MTEB 等专业榜单中，超越了谷歌的 Gemini Embedding、OpenAI 的 text-embedding-3-large 以及微软的 multilingual-e5-large-instruct 等顶尖模型，获得了同类模型的最佳性能（SOTA）。

简单来说，向量模型可以看作是 AI 的 “翻译器”，它通过将文本和图片等非结构化信息转换为机器易于理解的向量，从而实现高效的信息分类、检索和排序。基于千问3模型，通义团队采用对比训练、SFT 和模型融合等多种方法，成功打造出这一新型向量模型，涵盖了文本嵌入模型 Qwen3-Embedding 及文本排序模型 Qwen3-Reranker。

值得一提的是，千问3向量模型具有强大的多语言能力，支持超过100种语言，包括多种编程语言，展现出卓越的多语言、跨语言及代码检索能力。这为全球开发者提供了更为广阔的应用空间。

此次开源的千问3向量模型共有9款，涵盖不同尺寸（0.6B、4B、8B 等）及 GGUF 版本，开发者可以根据需求选择合适的模型，并自由组合模块，甚至可以自定义向量或指令，以实现特定任务、语言和场景的深度优化。这一灵活性将极大提升开发者的工作效率。

目前，千问3Embedding 和 Reranker 模型已经在魔搭社区、Hugging Face 和 GitHub 等多个平台上开源，开发者还可以通过阿里云百炼直接使用 API 服务。自4月29日开源以来，千问3大模型在多个国际榜单中取得了开源冠军的好成绩。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

{{userData.name}}已认证

阿里开源千问3向量模型，性能大幅提升，挑战谷歌和OpenAI

优惠活动

域名抢注

星空商城

免责声明

版权声明

帮助文档

建议提交

广告合作

IDC投稿

网址导航