返回事件流

阿里巴巴 Qwen 團隊發布 Qwen3.7-Plus 多模態模型

據媒體報導指出,阿里巴巴的 Qwen 團隊近日正式發布了 Qwen3.7-Plus 多模態大型語言模型。該模型能夠理解圖像和視頻內容,同時支持文本輸入,專注於視覺理解任務,而非生成視覺內容。作為 Qwen3.7 系列的多模態版本,Qwen3.7-Plus 與純文本模型 Qwen3.7-Max 互補,官方將其描述為多模態混合代理技術,旨在執行長時間運行的任務。模型具備五大核心能力:深度推理、自我編程、工具調用、驗證測試以及自主迭代,使其不僅能回答問題,還能主動執行操作。在基準測試方面,Qwen3.7-Plus 的預覽版本在 Vision Arena 排名第16,使阿里巴巴成為視覺領域第五大實驗室,適用於光學字符辨識、圖表讀取和視頻幀分析等應用。此外,模型現已通過阿里雲的百煉平台(國際版稱為 Model Studio)提供 API 服務,該平台整合了代理強化學習機制與安全防護措施,確保模型在自主操作時保持在預設範圍內,強調了其在 AI 代理領域的實用性。

來源

來源:媒體報導