當雲端代理遇見裝置代理:混合多代理系統的啟示
研究論文系統性地探討混合多代理系統的設計空間,結合雲端大型語言模型與裝置端小型語言模型。在缺乏通用設計原則的情況下,混合組件通常通過臨時決策引入。本研究適應兩種代表性多代理架構以支持混合推理,並研究設計選擇如何沿著功率、成本和性能的帕累托前沿移動操作點。研究發現,雖然小型語言模型可從大型語言模型的輔助中獲益,但最佳架構高度依賴具體任務,且更多的前沿計算資源並不一致地帶來更好的性能。這為混合多代理系統的設計提供了細緻的見解,顯示出任務依賴性的重要性,並為未來的系統設計提供了系統性分析框架。
來源
來源:Hugging Face / 論文來源