科技

阿里发布Qwen3.7-Plus多模态智能体模型：视觉语言全面升级

📅 2026-06-02 20:33 · 👁 8 次阅读 · 📝 1,224 字 · ⏱ 约 5 分钟读完

阿里巴巴旗下通义千问团队于近日正式发布了备受期待的Qwen3.7-Plus多模态智能体模型，这一重量级产品的亮相标志着国产大模型在视觉语言综合能力方面实现了重大突破。据通义千问技术负责人介绍，Qwen3.7-Plus是目前全球范围内性能最为均衡的多模态智能体模型之一，在多项权威基准测试中的表现不仅大幅超越了前代产品，更在多个关键指标上击败了OpenAI最新发布的GPT-5模型，这一成就引发了整个AI行业的广泛关注。

Qwen3.7-Plus最引人注目的技术革新在于其全新设计的动态分辨率视觉编码器。这一创新架构突破了传统视觉模型固定输入分辨率的限制，能够根据图像内容的复杂程度自动调整处理精度，从而在保证识别准确性的同时大幅提升计算效率。在实际测试中，该视觉编码器对高分辨率图像的处理速度较上一代提升了约三倍，同时在文档理解、图表分析、医学影像识别等专业场景中的准确率均有显著提高。特别值得一提的是，Qwen3.7-Plus在处理包含大量文字和复杂排版的图像时表现出色，能够精准提取并理解其中的语义信息，这对于企业级文档自动化处理应用具有重要价值。

在工具调用能力方面，Qwen3.7-Plus同样展现出了令人印象深刻的实力。根据最新发布的测试数据，该模型在多步骤工具调用场景中的成功率达到了87.3%，这一数字远超当前市面上的同类竞品。通义千问团队通过引入创新的「工具推理链」机制，使模型能够更准确地理解用户意图并自主规划最优的工具调用路径。在实际应用场景中，Qwen3.7-Plus可以流畅地完成包括网页浏览、代码执行、API调用以及数据库查询在内的多种复杂任务，其表现出的自主决策能力和任务执行稳定性已经接近甚至达到了商用标准。

阿里巴巴在此次发布中再次重申了其坚定的开源战略承诺。Qwen3.7-Plus的核心模型权重将通过阿里的ModelScope平台面向全球开发者开放下载，同时提供商用授权许可。这一举措被业界视为阿里在大模型生态竞争中的重要布局，旨在通过降低技术门槛吸引更多开发者和企业用户参与到基于Qwen模型的应用生态建设中来。阿里云智能集团负责人表示，开源不仅是技术共享的体现，更是构建健康可持续AI生态系统的必由之路，阿里将继续在开源大模型领域保持高强度的研发投入和生态建设力度。

从行业竞争格局来看，Qwen3.7-Plus的发布进一步巩固了阿里巴巴在国内多模态大模型领域的领先地位，同时也为全球AI研究社区提供了重要的技术参考。多位业内专家指出，Qwen3.7-Plus在视觉语言融合、工具调用效率以及模型可部署性等方面的综合表现已经达到了世界一流水平，它的出现将有力推动多模态AI技术在医疗、教育、金融、制造业等垂直行业的深入应用。随着该模型的广泛普及和生态体系的不断完善，预计将在未来一到两年内催生出大量创新应用场景，为整个产业的智能化升级注入强劲动力，助力中国在全球AI竞争中占据更加有利的战略位置。

本站文章来源于网络摘取整理发布，如有侵权请联系 hy@uicn.cn 删除

相关文章

微信AI智能体原型曝光：腾讯列为最高战略优先级，14亿用户的AI管家来了

DeepSeek V4.1定档6月发布：原生MCP+全模态，拟融资500亿创纪录

OpenAI现场演示无APP手机：所有界面实时生成，2027量产