研究06/03 24:48

阿里巴巴 Qwen 團隊發布 Qwen3.7-Plus 多模態模型

據媒體報導指出，阿里巴巴的 Qwen 團隊近日正式發布了 Qwen3.7-Plus 多模態大型語言模型。該模型能夠理解圖像和視頻內容，同時支持文本輸入，專注於視覺理解任務，而非生成視覺內容。作為 Qwen3.7 系列的多模態版本，Qwen3.7-Plus 與純文本模型 Qwen3.7-Max 互補，官方將其描述為多模態混合代理技術，旨在執行長時間運行的任務。模型具備五大核心能力：深度推理、自我編程、工具調用、驗證測試以及自主迭代，使其不僅能回答問題，還能主動執行操作。在基準測試方面，Qwen3.7-Plus 的預覽版本在 Vision Arena 排名第16，使阿里巴巴成為視覺領域第五大實驗室，適用於光學字符辨識、圖表讀取和視頻幀分析等應用。此外，模型現已通過阿里雲的百煉平台（國際版稱為 Model Studio）提供 API 服務，該平台整合了代理強化學習機制與安全防護措施，確保模型在自主操作時保持在預設範圍內，強調了其在 AI 代理領域的實用性。

來源

來源：媒體報導

媒體報導Alibaba’s Qwen Team Launches Qwen3.7-Plus, Adding Vision, Deep Reasoning, Tool Invocation, and Autonomous Iteration on the Bailian Platform